Gemini erhält ein leistungsstarkes Update mit generativer Bildbearbeitung

Google hat ein großes Update für seine Bildbearbeitungswerkzeuge in der Gemini-App angekündigt. Entwickelt vom DeepMind-Team, hat das neue Modell bereits die höchsten Punktzahlen in frühen Tests erreicht und steht allen Gemini-Nutzern zur Verfügung. Das Modell ermöglicht es Ihnen, Fotos zu erstellen und zu ändern, sodass die abgebildeten Personen oder Tiere erkennbar und natürlich bleiben.
Platz | Modell | Punktzahl | 95% CI (±) | Stimmen | Organisation | Lizenz |
---|---|---|---|---|---|---|
1 | gemini-2.5-flash-image-preview (nano-banana) | 1362 | ±2 | 2 521 035 | Google. | Proprietär |
2 | flux-1-kontext-max | 1191 | ±3 | 357 196 | Black Forest Labs | Proprietär |
3 | flux-1-kontext-pro | 1174 | ±2 | 2 015 530 | Black Forest Labs | Proprietär |
3 | gpt-image-1 | 1170 | ±3 | 1 026 399 | OpenAI | Proprietär |
5 | flux-1-kontext-dev | 1152 | ±3 | 1 584 400 | Black Forest Labs | Proprietär |
6 | qwen-image-edit | 1145 | ±2 | 1 585 904 | Alibaba | Apache 2.0 |
6 | seededit-3.0 | 1142 | ±4 | 1 285 080 | Bytedance | Proprietär |
8 | gemini-2.0-flash-preview-image-generation | 1093 | ±3 | 1 700 785 | Proprietär | |
9 | bagel | 1044 | ±5 | 12 774 | Bytedance | Apache 2.0 |
10 | step1x-edit | 1017 | ±4 | 138 399 | StepFun | Apache 2.0 |
Quelle: lmarena.ai
Was sich geändert hat
Die neue Version von Gemini arbeitet mit einem Fokus auf Authentizität. Zuvor konnte die künstliche Intelligenz Gesichtszüge "umformen" oder das Aussehen während der Bearbeitung ändern, aber jetzt minimiert das System solche Abweichungen. Das bedeutet, dass Freunde auf Fotos wie Freunde aussehen und Tiere wie Tiere aussehen, selbst nach Änderungen an Frisur, Kleidung oder Umgebung.
Gemini hat gelernt,
- Personen oder Objekte in eine andere Umgebung zu versetzen, ohne die Erkennung zu verlieren;
- Dinge und Möbel in einem Foto hinzuzufügen oder zu ersetzen, während andere Elemente unverändert bleiben;
- den Stil eines Teils des Bildes auf einen anderen anzuwenden (zum Beispiel die Farbe von Blumen auf Kleidung);
- Fotos zu kombinieren, um ganz neue Szenen zu erstellen.

Ein Beispiel für die Rollenänderung eines Charakters. Illustration: Google
Anwendungsbeispiele
- Familienfotos: Wenn jemand blinzelt, passt der Algorithmus nur den Gesichtsausdruck an.
- Haustiere: Ein Hund mit einem neuen Halsband bleibt dasselbe Haustier und wird nicht zu einer "neuen Rasse".
- Modeexperimente: Sie können verschiedene Kleidung oder Schuhe direkt im Foto anprobieren.
- Renovierung und Design: Es ist einfach, sich vorzustellen, wie ein Raum mit neuen Möbeln oder einer neuen Wandfarbe aussehen wird.
- Fantastische Szenen: Freunde aus dem Garten können sich in Paris oder auf dem Mars wiederfinden - und trotzdem erkennbar bleiben.

Ein Beispiel für das Mischen zweier Bilder. Illustration: Google
Warum es wichtig ist
Google positioniert das aktualisierte Gemini als ein Werkzeug für ein neues Niveau der Personalisierung und visuellen Erzählung. Das Modell eröffnet Möglichkeiten für Kreativität, Online-Kommunikation und professionelle Arbeit mit visuellen Inhalten - von der Erstellung von Familienalben bis hin zu Werbekampagnen.

Ein Beispiel für eine Designkombination. Illustration: Google
Laut den Entwicklern werden alle Berechnungen unter Wahrung der Privatsphäre der Nutzer durchgeführt, und das Update ist nur der erste Schritt in Richtung noch flexiblerer Bearbeitungsfunktionen.
Quelle: Google