Der Faden für KI-Bilder -Stable Diffusion

Wenn das Irrenhaus überfordert ist

Moderatoren: Heaterman, Finger, Sven, TDI, Marsupilami72, duese

Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

japanese temple with trees and mount fuji

Bild


flying saucer in the year 1953

Bild

und überhaupt... science fiction :mrgreen:

the day the earth stood still

Bild
Dateianhänge
the day the earth stood still.png
flying saucer in the year 1953 HQ1.png
japanese temple with trees and mount fuji HQ4.png
ichwersonst
Beiträge: 103
Registriert: Mo 12. Aug 2013, 17:56
Wohnort: ZZ 9 Plural Z Alpha

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von ichwersonst »

Meine bekloppten Ideen:

Minions im H.R. Giger-Style
Bild
Bild

Minions a la Hieronymus Bosch
Bild

vintage monster movie
Bild

Gruß
Pit
Benutzeravatar
phettsack
Beiträge: 1184
Registriert: Mo 12. Aug 2013, 18:17

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von phettsack »

Zabex hat geschrieben: Sa 17. Sep 2022, 19:50 Inzwischen habe ich die Software lokal ans laufen bekommen. Damit habe ich nun planbare Berechnungszeiten und inzwischen hunderte komischer Bilder.
Na das wäre schon ein Tutorial wert wie man das lokal installiert.
Vermutlich nur interessant für Leute mit Solarstrom oder eigenem Kernkraftdingens ;) Naja, Staudamm ginge sicher auch.
xanakind
Beiträge: 12537
Registriert: So 11. Aug 2013, 21:55

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von xanakind »

Minions....
Hier mal was für Lötfahne:
11.jpg
22.jpg
(A realistic photo of a streetcar with Minion style in Germany.)
:lol:
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

hmm, ich versuch gerade diesen schwarzen Quader, idealerweise mit Affen darum zu generieren.
Ihr wisst schon, Odyssey2001...

was DABEI alles raus kommt :lol:

Quader mit Füssen dran etc :mrgreen:
Benutzeravatar
Julez
Beiträge: 3511
Registriert: Di 5. Apr 2016, 15:38
Wohnort: Münster

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Julez »

" boomers panic, market crashes"
:mrgreen:

Bild

Bild

Bild

Bild

Bild

Bild

Und dann habe ich noch versucht, einen Roboter(arm) darzustellen, der eine Landschaft auf einer Staffelei malt, naja geht so:

Bild

Bild

Bild

Bild
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

:shock: Das ist aber jetzt wirklich ziemlich gelungen! Auch die Idee muss man erstmal haben, ganz schön meta! Soll keiner sagen, hier ginge es nicht kreativ zu.
Benutzeravatar
phettsack
Beiträge: 1184
Registriert: Mo 12. Aug 2013, 18:17

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von phettsack »

Bob Ross while painting a portrait of Angela Merkel, Bob Ross style, HQ
Bob Ross while painting a portrait of Angela Merkel, Bob Ross style, HQ.png
Portrait of Elvis, Picasso style, HQ
Portrait of Elvis, Picasso style, HQ.png
World domination with Thomas Gottschalk, electric style, HQ
World domination with Thomas Gottschalk, electric style, HQ.png
Wird Weltherrschaft damit gleichgesetzt das man mindestens 2x vorhanden ist? :D
Benutzeravatar
Zabex
Beiträge: 632
Registriert: Di 2. Jul 2013, 08:45
Wohnort: Aldenhoven
Kontaktdaten:

KI zu Hause installieren

Beitrag von Zabex »

Recht brauchbare Anleitung, wie man die Software (gut 4GB) zu Hause ans Laufen bekommt:
https://harishgarg.com/writing/install- ... n-windows/
Ich habe versucht, die GUI-Variante zu installieren.
Das hat bei mir nicht ganz auf Anhieb funktioniert. Eventuell, weil ich bereits eine andere Python Version installiert hatte. War aber kein Problem:
Nach dem Starten der Anaconda Powershell und wechsel ins stable-diffusion main Verzeichnis (Bei mir:
cd E:\StableDiffusion\stable-diffusion-main
) musste ich noch GRADIO nachinstallieren mit

pip install gradio


Zum Starten des Systems muss ich nun nacheinander diese 3 Zeilen in die Anaconda Shell eingeben:

cd E:\StableDiffusion\stable-diffusion-main
conda activate ldm
python .\optimizedSD\txt2img_gradio.py



Hilfreich fand ich außerdem folgende Seite:
https://old.reddit.com/r/StableDiffusio ... nt_suck_a/

Hier einige der besseren Fotos zu immer dem gleichen Text. Ich habe aus ein paar Hundert Bildern die für mich künstlerisch interessantesten ausgewählt.
Die Angabe des Vorgabetextes reicht leider nicht, damit ihr dieses Bild auch bekommt.
high_tech_radio_tube,_glass_bulb,_dim_glowing,_shiny_metal_inside,_placed_on_wodden_pod,_realistic
Zusätzlich ist noch der Seed (steht im Dateinamen) , die Anzahl der Durchläufe und der Name des Samplers nötig. Letzteres ich mir leider nicht notiert und es ist schade, dass die Angaben nicht in den EXIF Daten des Bildes stecken.
seed_550143_00096.png
seed_550407_00360.png
seed_550055_00008.png
seed_550370_00323.png
seed_550328_00281.png
Viel Spaß beim Installieren...



Edit: Eine hab ich noch:
seed_550058_00011.png
Dateianhänge
seed_550093_00046.png
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: KI zu Hause installieren

Beitrag von Desinfector »

Zabex hat geschrieben: Mo 19. Sep 2022, 18:57 Recht brauchbare Anleitung, wie man die Software (gut 4GB) zu Hause ans Laufen bekommt:
https://harishgarg.com/writing/install- ... n-windows/
paar Fragen:

für Lokalbetrieb:

- Linux (Ubuntu/Mint etc)
-grössere Bilder möglich?

UND:
wie bekommt man es hin, das der interessante Teil des Bildes (z.B. Köpfe) nicht immer abgeschnitten wird?
Benutzeravatar
Zabex
Beiträge: 632
Registriert: Di 2. Jul 2013, 08:45
Wohnort: Aldenhoven
Kontaktdaten:

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Zabex »

Ob ein Betrieb unter Linux geht weiß ich nicht. Mit einem Windows Simulator (Wine z. B.) könnte das aber klappen, da der Code im Wesentlichen in der Grafikkarte läuft (Cuda interface).
Grössere Bilder mit 1024x1024 kann man erzeugen. Aber die enthalten bei mir alle Quatsch. Möglich, dass es am Speicher der Grafikkarte liegt. Ich vermute aber, die KI hat nur 512x512 grosse Bilder gelernt und eiert bei größeren Bildern nur rum. Selbst bei 150 Iterationen kam bei mir nur ein 512x512 Pixel großer Teil mit vernünftigem Inhalt raus, umgeben von diversen Fragmenten dieses Teils.

Wie man Einfluss auf den Bildausschnitt hat: weiß ich nicht. Ich lasse einfach eine längere Serie berechnen und suche von Hand gut gewordene Bilder raus.
Benutzeravatar
Zabex
Beiträge: 632
Registriert: Di 2. Jul 2013, 08:45
Wohnort: Aldenhoven
Kontaktdaten:

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Zabex »

Kurz Google gefragt: Stable Diffusion gibt's auch für Linux. Wo/wie/was: bitte selber rausfinden und hier posten.
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

Zabex hat geschrieben: Di 20. Sep 2022, 13:34 Kurz Google gefragt: Stable Diffusion gibt's auch für Linux. Wo/wie/was: bitte selber rausfinden und hier posten.
wieviel Zeit benötigt es bei Dir für eine Bilderzeugung?
auch schon mal 2...3 Minuten wie auf der Page?
Benutzeravatar
Zabex
Beiträge: 632
Registriert: Di 2. Jul 2013, 08:45
Wohnort: Aldenhoven
Kontaktdaten:

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Zabex »

Mit Standardparametern knapp eine Minute. Die Anzahl der Itertationen spielt dabei eine wesentliche Rolle. Auch die Wahl des Sampler macht viel aus. Ich kann in unter 10s ein Bild rausrotzen. Gut, um zu sehen, ob der Text grob verstanden wurde.
Wichtig war dabei, daß Häkchen bei "Turbo" zu machen. Dann wird die GPU zu 100% ausgelastet.
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

hmm, das sind dann genug Parameter um eine angedachte Installation erstmal zu verschieben
Benutzeravatar
Gobi
Beiträge: 4402
Registriert: Fr 29. Mai 2015, 08:12
Wohnort: Kreuzberg
Kontaktdaten:

Re: Interessante und kuriose technische Bilder

Beitrag von Gobi »

Nello hat geschrieben: Mi 14. Sep 2022, 12:39 Das ist zu unspezifisch. Warte mal ...

a tinkering fingers world domination, electric style, HQ

Das probiere ich jetzt mal.

Das scheint einfach gewesen zu sein, ging jedenfalls ziemlich schnell :)


Tja. Ist das jetzt Kunst? Meine eingangs gestellte Frage ist noch offen: Wie habt Ihr das gemacht, Eure eigenen Fotos bearbeiten zu lassen?
Bild
Was kostet dieses Bild? Ich finde es sehr gut!

Was hast du als Begriffe eingegeben? "a tinkering fingers world domination, electric style, HQ" brignt mir ganz andere Ergebnisse.
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

wenn da Schrift in den Bildern vorkommt,
wirkt das so wie eine Mischung aus Türkisch und Vietnamesisch

meine Versuche schräge Kombinationen zu erstellen scheitern irgendwie.
aber anders als gedacht.

Cheetah with borg ocular implant

brachte nur Müll.

aber einen Künstler-Stil dazu dann das.
Zwar ohne Borg aber immer noch gut.

cheetah with borg ocular implant in rubens-style
Dateianhänge
cheetah with borg implants in rubens-style HQ1.png
Benutzeravatar
zauberkopf
Beiträge: 9481
Registriert: So 11. Aug 2013, 15:33
Wohnort: gefährliches Halbwissen

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von zauberkopf »

Ich vermute aber, die KI hat nur 512x512 grosse Bilder gelernt und eiert bei größeren Bildern nur rum. Selbst bei 150 Iterationen kam bei mir nur ein 512x512 Pixel großer Teil mit vernünftigem Inhalt raus, umgeben von diversen Fragmenten dieses Teils.
So ein neuronales Netz ist im gegensatz zur "von Neumann" Maschine was völlig anderes.
Es wird ja in der letzteren nur simuliert.
Aber ein Neuron ist sowohl Rechenwerk wie auch Speicher in einem.
Deswegen ist dann so ein Netz auch ziemlich Starr, was die eingabeschicht (also die erste Schicht von Neuronen) angeht.
Und auch die anderen Schichten.. sind für eine gewisse Datenmenge oftmals optimiert.

Frickelbezug :
Netzte werden mehr gefrickelt als zielgerichtet entwickelt....

Sind die Trainigsdaten für Stable Diffusion verfügbar ?
Weil das könnte spassig werden... mal sowas mit einer Handelsüblichen Graka mal zu hause zu machen..
Netz vergrößern, dann mal neu trainieren...
Heizen mit Strom und Grafikkarte.. ;-)
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

komm nicht so ganz von steampunk los :lol:
image of a humanoid steampunk-lion with white fur wearing a copper suit
Bild
Dateianhänge
image of a humanoid steampunk-lion with white fur wearing a copper suit1.png
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Interessante und kuriose technische Bilder

Beitrag von Nello »

Gobi hat geschrieben: Mi 21. Sep 2022, 13:14 Was kostet dieses Bild? Ich finde es sehr gut!
:lol: Geschenkt! Für Dich sowieso!
Gobi hat geschrieben: Mi 21. Sep 2022, 13:14 Was hast du als Begriffe eingegeben? "a tinkering fingers world domination, electric style, HQ" brignt mir ganz andere Ergebnisse.
Das war genau so. Ich habe aber nicht den Seed dazu aufgeschrieben, die Zahlenreihe, die bei den weiteren Einstellungen ganz rechts zu finden ist. Man müsste wohl alle Parameter identisch eingeben (wie Zabex schon schrieb, wäre dazu ein Eintrag in den EXIF-Daten des Bildes hilfreich), und selbst dann ... Mir ist das alles unheimlich. Lustig, aber unheimlich. "Jede hinreichend fortschrittliche Technik muss dem Unwissenden wie Zauberei erscheinen." Von wem war das nochmal?
Benutzeravatar
Finger
Administrator
Beiträge: 7392
Registriert: Di 12. Jun 2012, 20:16
Kontaktdaten:

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Finger »

Terry Pratchet vielleicht? Ne, es war Arthur C. Clarke:
Jede hinreichend fortgeschrittene Technologie ist von Magie nicht mehr zu unterscheiden
Quelle: https://beruhmte-zitate.de/zitate/12699 ... logie-ist/
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

Ah! Danke!

Erstaunlich, daß Du auf Pratchet kommst. "Jede Technik beruht ursprünglich auf fortgeschrittener Zauberei." So hätte das von ihm sein können.
Moment mal. Das ist gut, oder? Ich glaube, ich mach mir nachher ein Schild.
Benutzeravatar
Kuddel
Beiträge: 5074
Registriert: Fr 28. Jun 2013, 10:56
Wohnort: Denk immer an St. Alamo!

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Kuddel »

RMK hat geschrieben: Fr 16. Sep 2022, 15:00 Zitat Julez:
"Wer selber mal will:
https://huggingface.co/spaces/stability ... -diffusion "
viel Spass. :-)
Ich könnte den ganzen Tag damit rumspielen. Bei "Ein Nerd der in der Werkstatt etwas elektronisches Bastelt" kam unter anderem ein Gerät raus, das ich sofort nachbauen wollte. Irgendwas mit Spulen und Bildschirm. Toll.
Ab wann kommen Stable Diffusion Filme raus?
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

Kuddel hat geschrieben: Do 22. Sep 2022, 13:51 Ab wann kommen Stable Diffusion Filme raus?
wenn das passiert, zusammen mit Musik, kannste mich einweisen.
Dateianhänge
image of mick jagger2.png
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

:o Ist das ein Selfie? Ich glaube, Du solltest dringend jetzt schon eine Reha beantragen!
Benutzeravatar
Julez
Beiträge: 3511
Registriert: Di 5. Apr 2016, 15:38
Wohnort: Münster

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Julez »

Kuddel hat geschrieben: Do 22. Sep 2022, 13:51 []
Ab wann kommen Stable Diffusion Filme raus?
Bitteschön:

https://www.youtube.com/watch?v=ZCKdPhepB1s
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

Das ist zwar sehr beeindruckend, aber als Film würde ich das nicht bezeichnen. Eher als Diashow.
Habt Ihr auch schon versucht, Liedtext als EIngabe zu benutzen? "She had fun, fun, fun, 'til her daddy took the T-Bird away."
Asko
Beiträge: 548
Registriert: Di 13. Dez 2016, 12:27
Wohnort: JO62QP

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Asko »

Nello hat geschrieben: Do 22. Sep 2022, 15:52 Das ist zwar sehr beeindruckend, aber als Film würde ich das nicht bezeichnen. Eher als Diashow.
Ich bezeichne das eher als optionale Visualisierung......

Diese Musik höre ich gerne, jedoch ist das "neue" Bildmaterial "Gewöhnungsbedürftig" ....


Gruss Asko
Benutzeravatar
phettsack
Beiträge: 1184
Registriert: Mo 12. Aug 2013, 18:17

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von phettsack »

Nello hat geschrieben: Do 22. Sep 2022, 15:52 Das ist zwar sehr beeindruckend, aber als Film würde ich das nicht bezeichnen. Eher als Diashow.
Habt Ihr auch schon versucht, Liedtext als EIngabe zu benutzen? "She had fun, fun, fun, 'til her daddy took the T-Bird away."
Ich hab's mit stümperhaft übersetzten Texten der NDW versucht, Ergebnisse durchwachsen.
Benutzeravatar
video6
Beiträge: 6794
Registriert: Mi 23. Sep 2015, 09:18
Wohnort: Laage bei Rostock

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von video6 »

Mal sehen wann KI Musik kommt :lol:
Wird bestimmt echt schräg klingen.
Benutzeravatar
StrippenLümmel
Beiträge: 706
Registriert: Mo 16. Mai 2016, 15:46
Wohnort: Heiligenberg

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von StrippenLümmel »

Texte aus wortgruppen kann die ki auch.
Die website hat da manigfaltige projekte... Sehr lustig. Da könnt ich stundenlang dran versumpfen...
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

StrippenLümmel hat geschrieben: Fr 23. Sep 2022, 08:22 Texte aus wortgruppen kann die ki auch.
Die website hat da manigfaltige projekte... Sehr lustig. Da könnt ich stundenlang dran versumpfen...
viel besser als Fäännseh'n :lol:

aber manchmal muss man schon ziemlich viel versuchen, bis etwas annähernd erkennbar wird was dat sein soll
Bei mir kommen eher Puppenstuben raus

front view of an RCA TV-set from the Year 1956
Dateianhänge
front view of an RCA TV-set from the Year 1956.png
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

Es gibt eine Suchmaschine für Stable-Diffusion.

das gibt einem natürlich noch viel mehr Ideen

https://lexica.art

Bild
Dateianhänge
longprompt1.png
Benutzeravatar
grobschmied
Beiträge: 1115
Registriert: Mo 13. Apr 2015, 17:10
Wohnort: bei Radeberg / Sachsen

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von grobschmied »

Was ist denn mit Gollum passiert :D
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

Igors Wohnung
steam necropolis, memento mori, gothic, neo - gothic, art nouveau, hyperdetailed copper patina medieval icon, stefan morrell, philippe druillet, ralph mcquarrie, concept art, steampunk, unreal engine, detailed intricate environment, octane render, moody atmospherics, volumetric lighting, ultrasharp, ominous, otherworldly
Bild

Bild
Dateianhänge
longprompt81_house-of-IGOR.jpg
longprompt80_house-of-IGOR.jpg
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

:shock: Sehe ich jetzt erst. Meine Fresse. Die Nebenkosten! Aber wer weiß, mit was da geheizt wird.

Jedenfalls hat sich die anfängliche Euphorie ja ein bisschen abgekühlt. Vorhin aber vier Ergebnisse, die glatt auch Bilder von einem Finger-Treffen sein könnten.

Ice cream cannon firing vanilla:
33-4.png
33-3.png
33-2.png
33-1.png
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

bei mir werden jetzt nur noch jpeg Bilder ausgegeben.

vorher waren es noch png
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

Ist mir auch aufgefallen. Obendrein mit falscher Datei-Endung.
Automator
Beiträge: 93
Registriert: Di 13. Aug 2013, 18:47

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Automator »

video6 hat geschrieben: Fr 23. Sep 2022, 08:07 Mal sehen wann KI Musik kommt :lol:
Wird bestimmt echt schräg klingen.
Neuronales Netz spielt Deathmetal:
https://www.youtube.com/watch?v=MwtVkPKx3RA

DADABOTS RELENTLESS DOPPELGANGER

https://www.heise.de/newsticker/meldung ... 04000.html
xanakind
Beiträge: 12537
Registriert: So 11. Aug 2013, 21:55

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von xanakind »

Mir wurden ein paar sehr realistische Bilder zugespielt:
1.jpg
2.jpg
3.jpg
4.jpg
5.jpg
6.jpg
7.jpg
8.jpg
9.jpg
10.jpg
Beeindruckend, dass könnten wirklich echte Fotos sein! :shock:
Ja, genau so sieht es bei mir Zuhause aus :lol:
xanakind
Beiträge: 12537
Registriert: So 11. Aug 2013, 21:55

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von xanakind »

Abbildungen von mir sehen auch erschreckend echt aus:
1.jpg
2.jpg
:o
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

Es können eigentlich nur gehässige Frauen gewesen sein, die den zur Formulierung der Bildbeschreibungen nötigen Einfall hatten.
Benutzeravatar
Desinfector
Beiträge: 10966
Registriert: Mo 12. Aug 2013, 07:50
Wohnort: ___3,1415(...)___

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Desinfector »

in Richtung (Firmen-)Logos geht auch was

face of a fox in the style of a brand logo
mountains ...

aber wenn es Finger, Hände oder Werkzeuge, Zahnräder werden sollen, kneift es sich voll einen ab.
Dateianhänge
58-mountains-logo.jpeg
51-fox-logo.jpeg
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

Natürlich wirkende Menschen darzustellen scheint in der Tat eine besondere Herausforderung zu sein. Sehr interessant sind die Ergebnisse bei Verwendung von Sätzen, die aus einem normalen Text sein könnten. Die meisten Menschen sind hässlich, machen wir uns nichts vor. Aber das hier sind Freaks :shock:

Cony bras showed up in every day life then. :mrgreen:
Diese Nase ...
Diese Nase ...
matthias89
Beiträge: 102
Registriert: Mi 9. Nov 2016, 18:02

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von matthias89 »

Natürlich wirkende Menschen darzustellen scheint in der Tat eine besondere Herausforderung zu sein.
...für Stable Diffusion. Andere GANs bekommen das mit bemerkenswerter Qualität hin:

https://thispersondoesnotexist.com/
Benutzeravatar
Julez
Beiträge: 3511
Registriert: Di 5. Apr 2016, 15:38
Wohnort: Münster

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Julez »

Also wenn man lange genug übt, scheint es recht gut zu funktionieren.
Hier gibt es einige Experten:

Achtung! Folgender Link ist "Not Safe For Work" und kann auch moralisch fragwürdiges Material enthalten.
Auf eigene Gefahr klicken:

https://boards.4channel.org/g/thread/89298782
https://boards.4channel.org/g/thread/89299537
Nello
Beiträge: 2464
Registriert: Mo 2. Sep 2013, 23:44
Wohnort: Das westliche Ende des Sofas

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Nello »

Danke, Julez. Wirst Du denn da schlau draus? Entweder bin ich zu blind, oder zu den vielen, beeindruckenden Bilder wird nie der ganze Prompt preisgegeben. Allenfalls Bruchstücke oder extrem kryptische Allgemeinrezepte zum Ausfüllen - was ohne Anleitung auch nicht geht. Wie es richtig gemacht wird, kann man da also auch nicht lernen. Zudem scheinen viele die Engine Zuhause laufen zu lassen und auf eine eigene Auswahl von Bildern anzulernen.
Benutzeravatar
video6
Beiträge: 6794
Registriert: Mi 23. Sep 2015, 09:18
Wohnort: Laage bei Rostock

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von video6 »

matthias89 hat geschrieben: Mi 19. Okt 2022, 10:05
Natürlich wirkende Menschen darzustellen scheint in der Tat eine besondere Herausforderung zu sein.
...für Stable Diffusion. Andere GANs bekommen das mit bemerkenswerter Qualität hin:

https://thispersondoesnotexist.com/
gibt es auch mit Katzen
https://thiscatdoesnotexist.com/
Benutzeravatar
Julez
Beiträge: 3511
Registriert: Di 5. Apr 2016, 15:38
Wohnort: Münster

Re: Der Faden für KI-Bilder -Stable Diffusion

Beitrag von Julez »

Nello hat geschrieben: Mi 19. Okt 2022, 20:47 Danke, Julez. Wirst Du denn da schlau draus? []
Naja, die Frage ist vielmehr, ob ich da unbedingt schlau draus werden will. :?

Anscheinend haben viele Leute zuviel Zeit und probieren ordentlich rum:

https://github.com/AUTOMATIC1111/stable ... sions/2670

Bild

Bild

Bild

Und irgendwie kommen die dann auf Prompts, die ungefähr so lauten:

((illustration)), ((floating hair)), ((chromatic aberration)), ((caustic)), lens flare,
dynamic angle, ((portrait)), (1 girl), ((solo)), cute face, ((hidden hands)),
asymmetrical bangs, (beautiful detailed eyes), eye shadow, ((huge clocks)),
((glass strips)), (floating glass fragments), ((colorful refraction)), (beautiful
detailed sky), ((dark intense shadows)), ((cinematic lighting)), ((overexposure)),
(expressionless), blank stare, big top sleeves, ((frills)), hair_ornament, ribbons,
bowties, buttons, (((small breast))), pleated skirt, ((sharp focus)), ((masterpiece)),
(((best quality))), ((extremely detailed)), colorful, hdr
Negative prompt: nsfw, lowres, bad anatomy, bad hands, text error, missing fingers, extra digits,
fewer digits, cropped, worst quality, low quality, standard quality, peg artifacts,
signature, watermark, username, blurry
Steps: 30, Sampler: DPM2 Karras, CFG scale: 11, Seed: 3760675009, Size: 640x1024, Model hash: e6e8e1fc, Denoising strength: 0.64, Eta: 0.67, Clip skip: 2, First pass size: 448x704

extremely detailed CG unity 8k wallpaper, (masterpiece), best quality, illustration, (1 girl), wet skin, expressionless, yellow eyes, (anger), horns, (silver armor), metal, complex pattern, corner, cape, indifference
Negative prompt: lowres, bad anatomy, bad hands, text,error, missing fngers,extra digt ,fewer digits,cropped, wort quality ,low quality,normal quality, jpeg artifacts,signature,watermark, username, blurry, bad feet,blush,helmet
Steps: 28, Sampler: DPM2 Karras, CFG scale: 11, Seed: 854846186, Size: 512x832, Model hash: e6e8e1fc, Batch size: 4, Batch pos: 1, Eta: 0.67, Clip skip: 2


Oder so:

cute, (((perfect face))). (facing viewer). (cute smirk). Intricate. (High detail). ((Sharp)). slender. (((puffy nipples))). ((wide hips)). (((thick thighs))). ((skindentation)). (midriff) photorealistic picture of young maiden, ((busty)), ((sheer tight classic dress)), ((bodycon)), Anders Zorn, Ilya Kuvshinov, Sophie Anderson, Norman Rockwell, (Frank Cho), choker
Negative prompt: (((bad proportions))). ((extra limbs)). (((disfigured))). (((three nipples))). (((Asian))), extra limbs. (bad anatomy). gross proportions. ((((ugly)))). (old woman). (aggressive makeup). anime. long neck. ((tiling)). (((double torso))). ((extra legs)). (three legs). out of frame. child
Steps: 35, Sampler: DPM2 a Karras, CFG scale: 9.5, Seed: 1082613731, Face restoration: CodeFormer, Size: 512x768, Model hash: 7460a6fa

Und die Ergebnisse sind dann durchaus objektiv ästhetisch:

Bild

Bild

Bild

Bild

Und wo wir gerade bei Ästhetik sind: Wer findet den "1970 BMW X7" besser als das Gerümpel, was heutzutage so angeboten wird?

Bild

*handheb*
Zuletzt geändert von Julez am Do 20. Okt 2022, 11:16, insgesamt 1-mal geändert.
Antworten