Neuer KI-Agent von OpenAI kann anstelle von Nutzern Tickets buchen, Essen bestellen und andere Aufgaben auf Websites erledigen

Von Nastya Bobkova | 24.01.2025, 05:44
OpenAI präsentiert einen KI-Agenten, der für Sie Aktionen auf Websites durchführt OpenAI bringt einen KI-Agenten auf den Markt, der alles für die Nutzer auf Websites erledigt: Er klickt, gibt Text ein und sucht sogar nach den benötigten Informationen. Quelle: OpenAI

OpenAI hat einen neuen KI-Agenten Operator vorgestellt, der für Nutzer Aufgaben im Internet erledigen kann.

Was bekannt ist

Der Agent verwendet seinen eigenen Browser, um im Internet zu surfen, auf Schaltflächen zu klicken, Text einzugeben und durch Inhalte zu blättern. Auf diese Weise kann er Aufgaben im Internet erledigen wie eine Person, die auf Schaltflächen klickt, durch Seiten blättert und Text auf Websites eingibt. Zunächst wird das neue Produkt nur für ChatGPT Pro-Abonnenten in den Vereinigten Staaten verfügbar sein.

Der Operator läuft auf einem speziellen Modell, das die Fähigkeiten von GPT-4o mit einer eingehenden Schulung kombiniert. So kann er nicht nur Seiten durch Screenshots "sehen", sondern auch mit Schnittstellen interagieren, wie wir es von Maus und Tastatur gewohnt sind.

Das Interessanteste daran ist, dass der Agent nicht nur Aufgaben ausführt, sondern sich auch selbst korrigieren kann. Wenn etwas schief geht, gibt er Ihnen die Kontrolle über den Prozess. Er bittet auch um Erlaubnis, wenn die Website sensible Daten (z. B. Passwörter) benötigt oder bittet um Ihre Zustimmung, bevor er eine E-Mail versendet.

OpenAI hat sich mit bekannten Unternehmen wie Uber, DoorDash, Instacart und anderen zusammengetan, um sicherzustellen, dass der Agent reale Aufgaben ausführt und dabei Sicherheits- und ethische Standards einhält. Allerdings funktioniert noch nicht alles perfekt - komplexe Schnittstellen wie das Erstellen einer Diashow sind für Operator noch schwierig.

In naher Zukunft wird Operator für Nutzer von Plus-, Team- und Enterprise-Plänen verfügbar sein, und OpenAI plant, diese Technologie direkt in ChatGPT zu integrieren.

Quelle: OpenAI