Gemini erhält ein leistungsstarkes Update mit generativer Bildbearbeitung

Von: Anry Sergeev | heute, 10:54

Google hat ein großes Update für seine Bildbearbeitungswerkzeuge in der Gemini-App angekündigt. Entwickelt vom DeepMind-Team, hat das neue Modell bereits die höchsten Punktzahlen in frühen Tests erreicht und steht allen Gemini-Nutzern zur Verfügung. Das Modell ermöglicht es Ihnen, Fotos zu erstellen und zu ändern, sodass die abgebildeten Personen oder Tiere erkennbar und natürlich bleiben.

PlatzModellPunktzahl95% CI (±)StimmenOrganisationLizenz
1gemini-2.5-flash-image-preview (nano-banana)1362±22 521 035Google.Proprietär
2flux-1-kontext-max1191±3357 196Black Forest LabsProprietär
3flux-1-kontext-pro1174±22 015 530Black Forest LabsProprietär
3gpt-image-11170±31 026 399OpenAIProprietär
5flux-1-kontext-dev1152±31 584 400Black Forest LabsProprietär
6qwen-image-edit1145±21 585 904AlibabaApache 2.0
6seededit-3.01142±41 285 080BytedanceProprietär
8gemini-2.0-flash-preview-image-generation1093±31 700 785GoogleProprietär
9bagel1044±512 774BytedanceApache 2.0
10step1x-edit1017±4138 399StepFunApache 2.0

Quelle: lmarena.ai

Was sich geändert hat

Die neue Version von Gemini arbeitet mit einem Fokus auf Authentizität. Zuvor konnte die künstliche Intelligenz Gesichtszüge "umformen" oder das Aussehen während der Bearbeitung ändern, aber jetzt minimiert das System solche Abweichungen. Das bedeutet, dass Freunde auf Fotos wie Freunde aussehen und Tiere wie Tiere aussehen, selbst nach Änderungen an Frisur, Kleidung oder Umgebung.

Gemini hat gelernt,

  • Personen oder Objekte in eine andere Umgebung zu versetzen, ohne die Erkennung zu verlieren;
  • Dinge und Möbel in einem Foto hinzuzufügen oder zu ersetzen, während andere Elemente unverändert bleiben;
  • den Stil eines Teils des Bildes auf einen anderen anzuwenden (zum Beispiel die Farbe von Blumen auf Kleidung);
  • Fotos zu kombinieren, um ganz neue Szenen zu erstellen.

Ein Beispiel für die Rollenänderung eines Charakters. Illustration: Google

Anwendungsbeispiele

  • Familienfotos: Wenn jemand blinzelt, passt der Algorithmus nur den Gesichtsausdruck an.
  • Haustiere: Ein Hund mit einem neuen Halsband bleibt dasselbe Haustier und wird nicht zu einer "neuen Rasse".
  • Modeexperimente: Sie können verschiedene Kleidung oder Schuhe direkt im Foto anprobieren.
  • Renovierung und Design: Es ist einfach, sich vorzustellen, wie ein Raum mit neuen Möbeln oder einer neuen Wandfarbe aussehen wird.
  • Fantastische Szenen: Freunde aus dem Garten können sich in Paris oder auf dem Mars wiederfinden - und trotzdem erkennbar bleiben.

Ein Beispiel für das Mischen zweier Bilder. Illustration: Google

Warum es wichtig ist

Google positioniert das aktualisierte Gemini als ein Werkzeug für ein neues Niveau der Personalisierung und visuellen Erzählung. Das Modell eröffnet Möglichkeiten für Kreativität, Online-Kommunikation und professionelle Arbeit mit visuellen Inhalten - von der Erstellung von Familienalben bis hin zu Werbekampagnen.


Ein Beispiel für eine Designkombination. Illustration: Google

Laut den Entwicklern werden alle Berechnungen unter Wahrung der Privatsphäre der Nutzer durchgeführt, und das Update ist nur der erste Schritt in Richtung noch flexiblerer Bearbeitungsfunktionen.

Quelle: Google