Zum Inhalt springen

Revolutionäre Bildbearbeitung direkt in ChatGPT: GPT-4o macht’s möglich!

Direkte Bearbeitung im Chat: Der wohl größte Unterschied zur bisherigen Lösung mit DALL-E 3 ist die nahtlose Verbindung von Chat und Bilderzeugung. Mit GPT-4o können Sie jetzt ein Bild erstellen und es direkt im Chatfenster weiterbearbeiten. Das Modell berücksichtigt dabei sowohl den Kontext Ihrer Anweisungen als auch den Kontext der bereits erzeugten Bilder. Stellen Sie sich vor, Sie erstellen ein Bild und fordern dann einfach eine Ergänzung oder eine stilistische Änderung an – GPT-4o setzt dies intelligent um.

Technologischer Sprung: Hinter den Kulissen werkelt ein autoregressives Modell, das direkt in ChatGPT integriert ist. Im Gegensatz zu den bisherigen Diffusionsmodellen arbeitet sich GPT-4o Pixel für Pixel vor, ähnlich wie bei der Textgenerierung. Dies führt zu einem verbesserten Kontextverständnis und ermöglicht eine präzisere und relevantere Bilderzeugung3.

Highlights der neuen Bildgenerierung:

Starke Bildbearbeitung: GPT-4o glänzt besonders bei der Bearbeitung existierender Bilder. So ist es nun möglich, den Stil eines Bildes zu ändern (z.B. in einen Cartoon-Look wie South Park) oder Elemente anzupassen, ohne das gesamte Bild neu zu generieren.

Verbesserte Textdarstellung: Texte auf Bildern werden von GPT-4o deutlich besser verarbeitet. Ob Whiteboards, Visitenkarten oder Infografiken – die Darstellung von Text integriert sich nun harmonischer in die Bilder. Allerdings weisen erste Tests darauf hin, dass es noch zu Tippfehlern bei der Textgenerierung kommen kann.

Kreative Freiheit und vielfältige Anwendungsfälle: Die Möglichkeiten scheinen schier endlos. Von der Erstellung von YouTube Thumbnails über Produktfotos und Mockups bis hin zur Generierung von Comics und der Anpassung von Bildstilen – GPT-4o eröffnet neue Dimensionen der visuellen Gestaltung.

Optionale Nutzung über Sora: Für die reine Bilderstellung bietet OpenAI mit Sora eine separate Plattform an. Hier können Sie bis zu vier Bildvarianten gleichzeitig erstellen und das Format flexibler festlegen. Allerdings fehlt hier die direkte Chat-basierte Bearbeitung.

Erste Eindrücke und Ausblick:

Erste Tests zeigen, dass GPT-4o in vielen Bereichen bereits beeindruckende Ergebnisse liefert, insbesondere bei der kontextbezogenen Bearbeitung von Bildern. Zwar gibt es noch Verbesserungspotenzial, beispielsweise bei der fehlerfreien Textgenerierung auf Bildern und der vollständigen Konsistenz von wiederholten Charakteren. Dennoch markiert dieses Update einen bedeutenden Fortschritt im Bereich der KI-gestützten Bildgenerierung und macht professionelle Bildbearbeitung einem breiteren Publikum zugänglich. 

Probieren Sie es selbst aus und entdecken Sie die immensen Möglichkeiten von GPT-4o!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert