Bildgenerierende KI können schöne, überraschende und beeindruckende Bilder generieren – aber selten das, was man sich vorgestellt hat. Solange man einfach ein Bild zu einem Thema braucht, ist das kein Problem. Wenn man aber einen bestimmten Raum, oder eine bestimmte Körperposition malen möchte, verzweifelt man rasch…
Der Zusatz ControlNet für stable diffusion erlaubt das Hinzufügen eines Bildes, das als Vorlage dient. Damit kann man beispielsweise ein Foto von einem Mann hinzufügen, der nach rechts schaut und den Prompt «Frau mit elegantem Hut» eingeben. Es erscheint dann ein Bild einer Frau, welche genau wie der Mann nach rechts schaut. Die KI malt nach Vorlage und ist nicht länger eigenwillig. Eine umfangreiche Anleitung findet sich bei stable diffusion art.
Ich habe eine Variante verwendet, welche beim hinzugefügten Bild einzelne Objekte wie Pflanzen, Lampen oder Wasser erkennt. Dies ist besonders geeignet um Landschaften oder Räume mit Hilfe eines Prompts umzugestalten.
Dies ist mein Schulzimmer, so wie es tatsächlich ausschaut:
Mit dieser Vorlage und dem Prompt für einen Wildwest-Saloon malt stable diffusion ein neues Bild, wobei es versucht, alle Objekte wie Tische, Bücher oder Stühle als solche zu bewahren. Es erscheint tatsächlich ein Wildwest-Saloon, aber mein Schulzimmer ist immer noch erkennbar.
Ich habe eine ganze Serie von neuen Inneneinrichtungen meines Schulzimmers generiert.