c't 23/2023
S. 144
Praxis
Stable Diffusion XL
Bild: KI Midjourney | Bearbeitung c't

Groß geworden

Mit Stable Diffusion XL detailreiche Bilder erzeugen

Wenige Wörter genügen, um mit der Bilder-KI Stable Diffusion beeindruckende Bilder im Briefmarkenformat zu erzeugen. Mit dem neuen XL-Modell verdoppelt sich nicht nur die Auflösung, in einem zweiten Schritt fügt es feinste Details hinzu. Wir beschreiben, wie Sie Ihr System für Stable Diffusion XL vorbereiten und Bilder mit bislang unerreichter Detailtiefe generieren.

Von Mirko Dölle

Die Open-Source-Bilder-KI Stable Diffusion fertigt anhand einfacher Beschreibungen erstaunlich komplexe Bilder. Doch die Auflösung ist beim Standardmodell begrenzt, weil die Version 1.5 mit Bildern im Format von lediglich 512 × 512 Pixeln trainiert wurde. Zwar können Sie auch größere Bilder erzeugen lassen, doch mit zunehmender Auflösung füllt das Standardmodell den zusätzlichen Platz mit den immergleichen Objekten und Motivteilen auf: Die Ergebnisse sehen aus wie Wimmelbilder. Für höher aufgelöste Bilder mit etwas mehr Details können Sie den HiRes-Fix nutzen, doch mehr als Faktor vier und somit 2048 × 2048 sind auch damit nicht drin.

Das neue Modell Stable Diffusion XL von Hugging Face verschiebt diese Grenze deutlich nach oben, denn es wurde mit Bildern bis zu einer Auflösung von 1024 × 1024 Pixeln trainiert. In Kombination mit dem HiRes-Fix entstehen so Bilder mit bis zu 4096 × 4096 Pixeln Auflösung, ohne dass sich Motive wiederholen – genug selbst für Ultra-HD-Monitore. Allerdings benötigt das neue Modell zusätzliche Bibliotheken, weshalb Sie eine bestehende Stable-Diffusion-Installation zumindest aktualisieren und ergänzen müssen, bevor Sie Stable Diffusion XL nutzen können. Wir beschreiben außerdem nachfolgend, wie Sie eine vorhandene Installation aus [1] sichern und Stable Diffusion samt XL-Modell unter Windows neu installieren.

Kommentare lesen (1 Beitrag)