Neuer KI-Agent von OpenAI kann anstelle von Nutzern Tickets buchen, Essen bestellen und andere Aufgaben auf Websites erledigen

OpenAI hat einen neuen KI-Agenten Operator vorgestellt, der für Nutzer Aufgaben im Internet erledigen kann.
Was bekannt ist
Der Agent verwendet seinen eigenen Browser, um im Internet zu surfen, auf Schaltflächen zu klicken, Text einzugeben und durch Inhalte zu blättern. Auf diese Weise kann er Aufgaben im Internet erledigen wie eine Person, die auf Schaltflächen klickt, durch Seiten blättert und Text auf Websites eingibt. Zunächst wird das neue Produkt nur für ChatGPT Pro-Abonnenten in den Vereinigten Staaten verfügbar sein.
Der Operator läuft auf einem speziellen Modell, das die Fähigkeiten von GPT-4o mit einer eingehenden Schulung kombiniert. So kann er nicht nur Seiten durch Screenshots "sehen", sondern auch mit Schnittstellen interagieren, wie wir es von Maus und Tastatur gewohnt sind.
Das Interessanteste daran ist, dass der Agent nicht nur Aufgaben ausführt, sondern sich auch selbst korrigieren kann. Wenn etwas schief geht, gibt er Ihnen die Kontrolle über den Prozess. Er bittet auch um Erlaubnis, wenn die Website sensible Daten (z. B. Passwörter) benötigt oder bittet um Ihre Zustimmung, bevor er eine E-Mail versendet.
OpenAI hat sich mit bekannten Unternehmen wie Uber, DoorDash, Instacart und anderen zusammengetan, um sicherzustellen, dass der Agent reale Aufgaben ausführt und dabei Sicherheits- und ethische Standards einhält. Allerdings funktioniert noch nicht alles perfekt - komplexe Schnittstellen wie das Erstellen einer Diashow sind für Operator noch schwierig.
In naher Zukunft wird Operator für Nutzer von Plus-, Team- und Enterprise-Plänen verfügbar sein, und OpenAI plant, diese Technologie direkt in ChatGPT zu integrieren.
Quelle: OpenAI