Der Faden für KI-Bilder -Stable Diffusion
Moderatoren: Heaterman, Finger, Sven, TDI, Marsupilami72, duese
- Fritzler
- Beiträge: 12603
- Registriert: So 11. Aug 2013, 19:42
- Wohnort: D:/Berlin/Adlershof/Technologiepark
- Kontaktdaten:
Re: Der Faden für KI-Bilder -Stable Diffusion
Holy Moly!
Die letzten Bilder (exkl. Auto) hätt man so auch auch auf pixiv.net finden können
Von der Quali auch viel besser als 90% der Anfänger da, das tut schon weh.
Die letzten Bilder (exkl. Auto) hätt man so auch auch auf pixiv.net finden können
Von der Quali auch viel besser als 90% der Anfänger da, das tut schon weh.
Re: Der Faden für KI-Bilder -Stable Diffusion
Ich bin auch sehr beeindruckt. Was ich überhaupt nicht verstehe, ist die Fixierung auf diese Manga-Ästhetik. Was soll das?
Die ewig langen Prompts sind natürlich in gewisser Weise auch entmutigend: Wie hätte man denn da draufkommen sollen? Das sieht schon wieder sehr nach Geheimwissenschaft aus, zumal einige der Parameter erklärungsbedürftig sind. Was sollen die Doppelklammern? Oder gar Dreifachklammern? Was ist ein "Negative Prompt"? Und wo gibt man den ein? Warum reicht von den drei Angaben "((masterpiece)), (((best quality))), ((extremely detailed))", die doch alle synonym sind, nicht eine einzelne?
Der BMW ("BWM"?) sieht Klasse aus und ist in seiner Schlichtheit irgendwie schon tröstlich. Wie eine Mischung aus Dreier, Mercedes T und Station Wagon - Fehlen bloß noch die Woody-Türen . Jedenfalls gebe ich Dir Recht Julez: Begehrenswerter als alles, was man derzeit kaufen kann.
Ich experimentiere jetzt mal mit Mangas. Vielleicht führt ja "1 milf" statt "1 girl" schon zum Kulturkreiswechsel. These: Bei "2 milf" hebt's beim DE-CIX das Dach. Uffbasse!
Die ewig langen Prompts sind natürlich in gewisser Weise auch entmutigend: Wie hätte man denn da draufkommen sollen? Das sieht schon wieder sehr nach Geheimwissenschaft aus, zumal einige der Parameter erklärungsbedürftig sind. Was sollen die Doppelklammern? Oder gar Dreifachklammern? Was ist ein "Negative Prompt"? Und wo gibt man den ein? Warum reicht von den drei Angaben "((masterpiece)), (((best quality))), ((extremely detailed))", die doch alle synonym sind, nicht eine einzelne?
Der BMW ("BWM"?) sieht Klasse aus und ist in seiner Schlichtheit irgendwie schon tröstlich. Wie eine Mischung aus Dreier, Mercedes T und Station Wagon - Fehlen bloß noch die Woody-Türen . Jedenfalls gebe ich Dir Recht Julez: Begehrenswerter als alles, was man derzeit kaufen kann.
Ich experimentiere jetzt mal mit Mangas. Vielleicht führt ja "1 milf" statt "1 girl" schon zum Kulturkreiswechsel. These: Bei "2 milf" hebt's beim DE-CIX das Dach. Uffbasse!
Re: Der Faden für KI-Bilder -Stable Diffusion
Und glatte Haut gibt's nur in Japan? Nein, im Ernst: Mir ist völlig unerklärlich, warum der Manga-Style alles andere im Comicbereich nahezu vollständig verdrängt hat. Aber egal, das ist wohl einfach so ein Zeitding, mit man sich abfinden muss. Die Ersetzung von "girl" durch Woman führt übrigens tatsächlich schon zu westlich anmutenden Gesichtern (was einmal mehr darauf deutet, daß Mädchen im global common sense japanisch sind - echt bekloppt). Die Doppelklammern sind aber immer noch rätselhaft.
Re: Der Faden für KI-Bilder -Stable Diffusion
Möglicherweise ist die Klammer eine Gewichtung oder Reihenfolgenvorgabe (wie in der Mathematik).
Meine Frau hat aktuell mit reface viel Spaß. Erschreckend gut.
Meine Frau hat aktuell mit reface viel Spaß. Erschreckend gut.
- Fritzler
- Beiträge: 12603
- Registriert: So 11. Aug 2013, 19:42
- Wohnort: D:/Berlin/Adlershof/Technologiepark
- Kontaktdaten:
Re: Der Faden für KI-Bilder -Stable Diffusion
Das mit den Klammern ist wohl eine Syntax um dem Stichwort eine höhere Gewichtung im Algorithmus zu geben.
Umso mehr Klammern, umso mehr Gewichtung.
So schlimm wie dus jetzt beschreibst isses aber nu auch wieder nich.
Ammi Commics werden auch noch gut verkauft.
Aber für meinen Geschmack sind diese andauernden "Superhelden" Geschichten einfach nur langweilig.
Aus Fernost gibts Storytechnisch eben alles mögliche.
Inländisch gibts ja neben Werner garnichtmal so viel?
Man muss aber sagen, dass diese kleine fernöstliche Insel für ihre Größe doch einen erstaunlich hohen Output an Material hat
Umso mehr Klammern, umso mehr Gewichtung.
So schlimm wie dus jetzt beschreibst isses aber nu auch wieder nich.
Ammi Commics werden auch noch gut verkauft.
Aber für meinen Geschmack sind diese andauernden "Superhelden" Geschichten einfach nur langweilig.
Aus Fernost gibts Storytechnisch eben alles mögliche.
Inländisch gibts ja neben Werner garnichtmal so viel?
Man muss aber sagen, dass diese kleine fernöstliche Insel für ihre Größe doch einen erstaunlich hohen Output an Material hat
Re: Der Faden für KI-Bilder -Stable Diffusion
Das wiederum liegt an der Quelle der Bilder. Das verlinkte Imageboard hat seine Wurzeln im japanischen Kulturraum und richtet sich somit schwerpunktmäßig an Japanophile.
Merkmale aus Bildern, die mit Begriffen des "Negative Prompt" getaggt sind, sollen von der KI nicht ins neu generierte Bild übernommen werden.Was ist ein "Negative Prompt"?
Re: Der Faden für KI-Bilder -Stable Diffusion
Der unermüdliche Julez
Ja, aber das teilen sie der KI ja nicht mit, oder? In den Prompts steht nichts dergleichen, die KI produziert trotzdem Bilder mit Manga-Ästhetik. Das kann also nur in den Bildern aus dem Lernpool begründet sein. Wenn dort Manga übermächtig ist (wie zum Beispiel in Deviant Art), wird sich das auch in den Ergebnissen wiederfinden.
Nun ja, das war mir schon klar. Aber wo gibt man den ein?
Re: Der Faden für KI-Bilder -Stable Diffusion
Ich hab keine Ahnung...
Aber Google meint:
https://twitter.com/supercomposite/stat ... 5100358658
https://github.com/AUTOMATIC1111/stable ... ive-prompt
https://github.com/invoke-ai/InvokeAI/b ... ed-prompts
Dieses ganze Promt-Zeug erinnert mich an dieses Konzept:
https://xkcd.com/1838/
Aber Google meint:
https://twitter.com/supercomposite/stat ... 5100358658
https://github.com/AUTOMATIC1111/stable ... ive-prompt
https://github.com/invoke-ai/InvokeAI/b ... ed-prompts
Dieses ganze Promt-Zeug erinnert mich an dieses Konzept:
https://xkcd.com/1838/
Re: Der Faden für KI-Bilder -Stable Diffusion
Hab mich auch mal wieder versucht, also "kissing" sieht eher nach einer Verschmelzung auf zellulärer Ebene aus
Ich sage ohne Bart, bekomme aber einen mit:
Und unser Lockenkopf hat auch was gemalt:
Und die Gurkentruppe hier ist doch irgendwie knuffig:
Re: Der Faden für KI-Bilder -Stable Diffusion
Was ich generell nicht verstehe: wo ist da der Lernefekt? Es müsste schon ein Feedback geben, damit sie "lernt" besser zu werden
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
interessant finde ich auch die ganzen Möglichkeiten "In the style of"
also Picasso, Rubens, VanGogh (etc)
oder popart, comics...
a landscape with sunrise behind mountains in the style of (...)
also Picasso, Rubens, VanGogh (etc)
oder popart, comics...
a landscape with sunrise behind mountains in the style of (...)
Re: Der Faden für KI-Bilder -Stable Diffusion
Die Bilder könnte man ja so in eine Gallerie hängen und berühmt werden. Bin schon beeindruckt
Re: Der Faden für KI-Bilder -Stable Diffusion
Das mache ich tatsächlich nur noch, sonst bekomme ich Augenkrebs - ABER so richtig fit ist die KI auch nicht mit jedem Künstler, auch einigermaßen bekannte scheint sie nicht drauf zu habenDesinfector hat geschrieben: ↑Di 25. Okt 2022, 09:49 interessant finde ich auch die ganzen Möglichkeiten "In the style of
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
bei Monstern, Dämonen, Werwölfen etc kommen auch immer nette Viecher zustande
- Chaoskreator
- Beiträge: 943
- Registriert: Mo 12. Aug 2013, 20:58
- Wohnort: 92xxx
Re: Der Faden für KI-Bilder -Stable Diffusion
Anbei ein paar Fotos, die ich mit huggingface.co erstellt habe. Schon echt interessant, was da raus kommt.
Das hier ist eine "tube amp power supply pcb": Jetzt müssen wir nur noch rausfinden, welche Bauteile da verbaut sind. Die hintere Reihe könnten Kreuzungen aus Stahlröhren und Germanium-Transistoren sein
Und ein bisschen viel Strom hat sie wohl stellenweise auch schon gesehen, wenn man sich die verbrannte Schraubklemme ansieht.
Diese beiden Verstärker sind jeweils ein "tube amp, hr giger style" Ich finde, beide sehen (erschreckend) gut aus
Der "xenomorph tube amplifier" ist auch nicht schlecht:
Das hier ist eine "tube amp power supply pcb": Jetzt müssen wir nur noch rausfinden, welche Bauteile da verbaut sind. Die hintere Reihe könnten Kreuzungen aus Stahlröhren und Germanium-Transistoren sein
Und ein bisschen viel Strom hat sie wohl stellenweise auch schon gesehen, wenn man sich die verbrannte Schraubklemme ansieht.
Diese beiden Verstärker sind jeweils ein "tube amp, hr giger style" Ich finde, beide sehen (erschreckend) gut aus
Der "xenomorph tube amplifier" ist auch nicht schlecht:
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
Als Herbstdeko vielleicht?
wooden brains, totally senseless
wooden brains, totally senseless
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
Hm. Ich bemerke in letzter Zeit Captchas, deren Bilder zumindest teilweise nicht realen Ursprungs zu sein scheinen:
Mit den Hubschraubern stimmt irgendwas nicht...
Mit den Hubschraubern stimmt irgendwas nicht...
Re: Der Faden für KI-Bilder -Stable Diffusion
Ich vermute seit längerer Zeit, das Captchas dazu benutzt werden, eine KI zu trainieren.(Bilderkennung oder sowas)
Re: Der Faden für KI-Bilder -Stable Diffusion
Ja sicher, das ist schon länger klar.
Die 1. Stufe waren Scanausschnitte von Texten, ich vermute als Hintergrund Google Books.
Die 2. Stufe waren mit Streetview aufgenommene Teile von Straßennamenschildern.
Die 3. Stufe waren verschiedene Klassen von Verkehrsteilnehmern.
Was das aktuell aber jetzt soll, weiß ich nicht.
Die 1. Stufe waren Scanausschnitte von Texten, ich vermute als Hintergrund Google Books.
Die 2. Stufe waren mit Streetview aufgenommene Teile von Straßennamenschildern.
Die 3. Stufe waren verschiedene Klassen von Verkehrsteilnehmern.
Was das aktuell aber jetzt soll, weiß ich nicht.
- Bastelbruder
- Beiträge: 11559
- Registriert: Mi 14. Aug 2013, 18:28
Re: Der Faden für KI-Bilder -Stable Diffusion
Der screenshot ist schon eion paar Tage alt.
Ich befürchte daß das die KI irgendwann auch beherrscht.- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
das hat so den Touch wie:Bastelbruder hat geschrieben: ↑Fr 18. Nov 2022, 16:47 Der screenshot ist schon eion paar Tage alt.
220 Ohm.jpg
Ich befürchte daß das die KI irgendwann auch beherrscht.
Zähle alle "I"
MVMNNNNMVNMMVMNNNNMVNM
MVMNNVMNNMVMNNMVMNNMVMNNMVMNN
MVMNNMVMNNMVMNNNVMNNMVMNN
NVMNNMVMNNNVMNNMVMNN
NVMNNMVMNNNVMNNMVMNNNVMNNMVMNN
NVMNNMVMNNNMMNNMVMNNNVMNNMVMNM
NVMNNMVMNNNVIMNNMVMNNNVMNNMVMNNNVMNNMVMNN
MVMNNNNMVNMMVMNNNNMVNM
MVMNNVMNNMVMNNMVMNNMVMNNMVMNN
MVMNNMVMNNMVMNNNVMNNMVMNN
NVMNNMVMNNNVMNNMVMNNMVNN
NVMNNMVMNNNVMNNMVMNNNVMNNMVMNN
NVMNNMVMNNNMMNNMVMNNNVMNNMVMNM
NVMNNMVMNNNVMNNMVMNNNVMNNMVMNNNVMNNMVMNN
- Fritzler
- Beiträge: 12603
- Registriert: So 11. Aug 2013, 19:42
- Wohnort: D:/Berlin/Adlershof/Technologiepark
- Kontaktdaten:
Re: Der Faden für KI-Bilder -Stable Diffusion
Ihr wolltet Videos?
Hier wird geliefert:
https://www.youtube.com/watch?v=fpUpVznI4Yc
Hier wird geliefert:
https://www.youtube.com/watch?v=fpUpVznI4Yc
Working with Midjourney, director Tristan Holmes created this video over a 30 day period entering prompts, using AI image generation of more than 10,000 frames, and creating frames to link the video together.
Re: Der Faden für KI-Bilder -Stable Diffusion
arnold eastwood f=35mm
Re: Der Faden für KI-Bilder -Stable Diffusion
Diese "Zeichen - KI" hab ich mal gebastelt,
Basic Programm, schon auf Amiga 500
Basic Programm, schon auf Amiga 500
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
die Bilder scheinen grösser zu werden:
768x768
und:
früher mal eingegebene Terms bringen nicht mehr im Entfertesten das zustande was es vorher gab.
768x768
und:
früher mal eingegebene Terms bringen nicht mehr im Entfertesten das zustande was es vorher gab.
Re: Der Faden für KI-Bilder -Stable Diffusion
was ein borg cubus ist, und wie es darin aussieht, hat die KI komplett vergessen ?! Mit sowas kommt nur noch käse raus.
Dream.ai
Hier ein paar Bilder von Dream.ai
Oft taucht ein Stichwort überhaupt nicht im Bild auf, z. B. bei dem Wissenschaftler im weißen Kittel.
Manchmal kommen geteilte Bilder heraus, sogar wenn man mit den selben Stichwörtern und Einstellungen neu generieren läßt.
Beim letzten Bild "Alles" habe ich die KI ein bißchen gefordert, mit den Stichworten "Atomic nuclei, quarks, muons, electrons, neutrinos, quanta, molecules, DNA, rocks, plants, trees, sea, planets, moons, stars, sun, galaxies, magnetars, laniakea, black holes, universe, god."
Oft taucht ein Stichwort überhaupt nicht im Bild auf, z. B. bei dem Wissenschaftler im weißen Kittel.
Manchmal kommen geteilte Bilder heraus, sogar wenn man mit den selben Stichwörtern und Einstellungen neu generieren läßt.
Beim letzten Bild "Alles" habe ich die KI ein bißchen gefordert, mit den Stichworten "Atomic nuclei, quarks, muons, electrons, neutrinos, quanta, molecules, DNA, rocks, plants, trees, sea, planets, moons, stars, sun, galaxies, magnetars, laniakea, black holes, universe, god."
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
Seit v2 muss ich zig mal den "error" wegdrücken, bisses mal wat machtgafu hat geschrieben: ↑Di 6. Dez 2022, 13:59 version 2
https://github.com/Stability-AI/stablediffusion
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
der "Error" hat sich fervlüchtigt
bokeh lights of a city atmosphere
bokeh lights of a city atmosphere
Re: Der Faden für KI-Bilder -Stable Diffusion
Neben Stable diffusion nutze ich inzwischen auch ChatGPT. Ist wirklich erschreckend. Statt selber denken, einfach den Code erzeugen lassen.
Meine Anfrage:
Meine Anfrage:
Chäties Antwort:Create a AHK code to make WIn+Shift+S when pressing the print key on the keyboard
War natürlich ein sehr einfaches Beispiel, aber wenn man die AHK-Kürzel nicht auswendig kennt, ist das selbst für kleinse Anwendungen der schnellste Weg. Erspart einem echt das denken. Erschreckend und faszinierend zugleich.Here is an example of an AutoHotkey script that will trigger the Windows+Shift+S shortcut when the Print Screen key is pressed:
This script uses the Send command to simulate pressing and releasing the Windows, Shift, and S keys in combination. The PrintScreen key is specified on the left side of the double colon (::), and the shortcut keys are specified in curly braces {} on the right side. The down and up keywords specify when the key is pressed and released respectively.Code: Alles auswählen
PrintScreen::Send {LWin down}{Shift down}{S}{LWin up}{Shift up}
Re: Der Faden für KI-Bilder -Stable Diffusion
Faszinierend. Ich glaube tatsächlich, wir erleben gerade den Beginn eines massiven Umbruches. So wie anfänglich völlig unklar war, wohin Internet und Handyfizierung führen würden. KI ist das selbe Level, mindestens. So langsam kommt das im Bewusstsein der Leute an.
Die Frage ist jetzt: Wie können wir das kreativ nutzen? Wie Spaß damit haben, damit spielen, zum Kennenlernen? Und: Sollte man diesen Thread jetzt nicht forken?
Die Frage ist jetzt: Wie können wir das kreativ nutzen? Wie Spaß damit haben, damit spielen, zum Kennenlernen? Und: Sollte man diesen Thread jetzt nicht forken?
- Bastelbruder
- Beiträge: 11559
- Registriert: Mi 14. Aug 2013, 18:28
Re: Der Faden für KI-Bilder -Stable Diffusion
Nach den Druckereien sehe ich jetzt die Felle der Mediengestalter wegschwimmen. Bald werden die Werbeflyer von Aldi, Pollin und Co. nur noch von reinen Kaufleuten erzeugt. Vielleicht steigt damit sogar die Qualität, ich denke dabei an Schuppenförmig vervielfachte Wurstscheiben, Schrauben mit Linksgewinde, Schuhpaare mit gespiegelter Aufschrift ...
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
eine China-Firma hat als Logo in Tigergesicht, das auch aus der "Feder" einer KI stammen dürfte.Bastelbruder hat geschrieben: ↑Di 24. Jan 2023, 13:12 Nach den Druckereien sehe ich jetzt die Felle der Mediengestalter wegschwimmen.
so wie ich neulich diesen Fuchs gepostet hatte:
Re: Der Faden für KI-Bilder -Stable Diffusion
Bei mir hat es mit voller Überzeugung Befehle erfunden, die es garnicht gibt. Sogar erklärt was sie machen sollen…Kuddel hat geschrieben: ↑Di 24. Jan 2023, 09:43 Neben Stable diffusion nutze ich inzwischen auch ChatGPT. Ist wirklich erschreckend. Statt selber denken, einfach den Code erzeugen lassen.
Meine Anfrage:Chäties Antwort:Create a AHK code to make WIn+Shift+S when pressing the print key on the keyboardWar natürlich ein sehr einfaches Beispiel, aber wenn man die AHK-Kürzel nicht auswendig kennt, ist das selbst für kleinse Anwendungen der schnellste Weg. Erspart einem echt das denken. Erschreckend und faszinierend zugleich.Here is an example of an AutoHotkey script that will trigger the Windows+Shift+S shortcut when the Print Screen key is pressed:
This script uses the Send command to simulate pressing and releasing the Windows, Shift, and S keys in combination. The PrintScreen key is specified on the left side of the double colon (::), and the shortcut keys are specified in curly braces {} on the right side. The down and up keywords specify when the key is pressed and released respectively.Code: Alles auswählen
PrintScreen::Send {LWin down}{Shift down}{S}{LWin up}{Shift up}
- Später Gast
- Beiträge: 1704
- Registriert: Di 5. Apr 2016, 22:03
- Wohnort: Karlsruhe
- Kontaktdaten:
Re: Der Faden für KI-Bilder -Stable Diffusion
Bei Logbuch Netzpolitik hat der Pritlove das mal für sich coden lassen, hat wohl teils lustig Programmiersprachen gemischt. Muss wohl der Prompt entsprechend angepasst werden oder man schreibt dann dazu mach da mal die Fehler raus, und dann macht es die Fehler raus. Fragt man sich, wieso es das nicht gleich ohne die Fehler auswirft, aber vllt war fehlerfreier Code einfach nicht in der Suchanfrage...
Re: Der Faden für KI-Bilder -Stable Diffusion
Gerade bei Aldi ist es eine gelebter Tradition, das Werbesendungen nicht von Mediengestalterin gestaltet sind, keine billig billig Aufdrucke haben und mit dem Understatement "Aldi informiert:" beginnen.Bastelbruder hat geschrieben: ↑Di 24. Jan 2023, 13:12 Bald werden die Werbeflyer von Aldi, Pollin und Co. nur noch von reinen Kaufleuten erzeugt.
Total unpassendes Beispiel.
Und bei Pollin. Wo genau soll sich da was ändern?
- Desinfector
- Beiträge: 11026
- Registriert: Mo 12. Aug 2013, 07:50
- Wohnort: ___3,1415(...)___
Re: Der Faden für KI-Bilder -Stable Diffusion
Ähm, das verstehe ich nicht. Wenn Illustratoren im Katalog durch ki-bildergeneratoren arbeitslos werden, wird dann die Polsterung in der Verpackung besser oder schlechter?
Re: Der Faden für KI-Bilder -Stable Diffusion
jetzt werden wir ja rasend schnell mit solchen Bildern geflutet, deren Qualtiät wirklich erschütternd gut ist. Aber selbst da taucht ständig die Merkwürdigkeit auf, daß die Anzahl der Finger nicht stimmt! Verrückt, warum ist das so??
Re: Der Faden für KI-Bilder -Stable Diffusion
AI = Außerirdische Intelligenz (und Ästhetik). Die haben fünf Finger (und mindestens noch einen Daumen)
Naja, vielleicht ist es eine Art absichtliches Wasserzeichen, um eben die Herkunft solcher Portraits auf einen Blick erkennbar zu machen. Das fände ich gut.
Naja, vielleicht ist es eine Art absichtliches Wasserzeichen, um eben die Herkunft solcher Portraits auf einen Blick erkennbar zu machen. Das fände ich gut.
Re: Der Faden für KI-Bilder -Stable Diffusion
Tjoah, das ist so eine grundlegende Frage. Stable Diffusion und Large Language Models (ChatGPT etc.) basieren im Prinzip auf geschichteten neuronalen Netzen. Es gibt leider keinen Algorithmus, der nachvollziehbar wäre. Statt des Algorithmus sind da nur "Gewichte", die vorher so trainiert wurden, dass eine Zielfunktion möglichst gut erfüllt wird. Offenbar war die korrekte Fingeranzahl einfach kein Kriterium beim Training Bei ChatGPT ist die Zielfunktion auch nur "kling überzeugend", was auch echt gut funktioniert. Allerdings spielt es aus Sicht von ChatGPT keine Rolle, ob das Ergebnis richtig oder falsch ist.
Unterm Strich find ich dieses ganze AI-Gehype ziemlich schwierig. Es kann eben niemand nachweisen, dass so eine AI irgendwas tut oder unterlässt. Man kann auch nicht den TÜV (oder wen auch immer) drübergucken lassen und danach wissen, was das Ding macht, weil: Kein Algorithmus zum nachvollziehen vorhanden.
Re: Der Faden für KI-Bilder -Stable Diffusion
Ich denke, dass lässt sich recht einfach erklären. Schaut mal auf die Ergebnisse der Google- Bildersuche nach "Hände". Sehr oft sind Hände abgebildet, wo man nicht alle Finger sieht. Mit diesen Daten wird die KI trainiert. Eine generierte Hand, bei der eigentlich alle Finger sichtbar sein müssten, aber nicht sind, enthält die gleichen Muster wie eine echte Hand, deren Finger teilweise verdeckt sind. Daher erkennt die KI keine Fehler in ihren Darstellungen. Der Unterschied zwischen vorhandenen und sichtbaren Fingern liegt in der Perspektive, und ich denke nicht, dass die KI die Änderungen der Darstellung, die sich aus verschiedenen Perspektiven ergeben, durchschaut.
Re: Der Faden für KI-Bilder -Stable Diffusion
Nachvollziehen bzw. gegenprüfen ist bei diesen ganzen Auswürfen von ChatGPT das Wichtigste überhaupt. Ist halt so ähnlich wie früher in der Schule, wenn man Copy & Paste beim Sitznachbarn bei der Klassenarbeit gemacht hat. Konnte gutgehen, es kann aber auch sein, das man seine Fehler mitkopiert und dann doof dasteht. Diese ganze AI-Geschichte kann Abläufe im besten Fall beschleunigen, aber Menschen deswegen wegrationalisieren sollte man tunlichst unterlassen, zumindest derzeit noch.gonium hat geschrieben: ↑Mi 12. Apr 2023, 14:48Tjoah, das ist so eine grundlegende Frage. Stable Diffusion und Large Language Models (ChatGPT etc.) basieren im Prinzip auf geschichteten neuronalen Netzen. Es gibt leider keinen Algorithmus, der nachvollziehbar wäre. Statt des Algorithmus sind da nur "Gewichte", die vorher so trainiert wurden, dass eine Zielfunktion möglichst gut erfüllt wird. Offenbar war die korrekte Fingeranzahl einfach kein Kriterium beim Training Bei ChatGPT ist die Zielfunktion auch nur "kling überzeugend", was auch echt gut funktioniert. Allerdings spielt es aus Sicht von ChatGPT keine Rolle, ob das Ergebnis richtig oder falsch ist.
Unterm Strich find ich dieses ganze AI-Gehype ziemlich schwierig. Es kann eben niemand nachweisen, dass so eine AI irgendwas tut oder unterlässt. Man kann auch nicht den TÜV (oder wen auch immer) drübergucken lassen und danach wissen, was das Ding macht, weil: Kein Algorithmus zum nachvollziehen vorhanden.