OpenAI verschärft seinen Wettbewerb mit Google mit einem weiteren kühnen Projekt - einem KI-gesteuerten Webbrowser namens ChatGPT Atlas. Der Browser, so die jüngste Ankündigung in einer Live-Stream-Sitzung, ist weltweit für macOS freigegeben und wird bald auch für Windows, Android und iOS verfügbar sein. Sein "Agentenmodus" ist jedoch vorerst nur für ChatGPT Plus- und Pro-Nutzer zugänglich.
Der CEO von OpenAI, Sam Altman, sieht dieses neue Tool als einen Weg in die Zukunft der Internetnutzung, in der das Chat-Erlebnis innerhalb eines Browsers eine entscheidende Rolle spielen wird. Bei der Live-Stream-Präsentation waren auch einige andere wichtige Mitglieder des OpenAI-Teams anwesend, insbesondere Will Ellsworth, Adam Fry, Ben Goodger, Ryan O'Rourke, Justin Rushing und Pranav Vishnu. Sie unterstrichen die Leistungsfähigkeit von ChatGPT Atlas und wie es das Webbrowsing revolutionieren kann.
Ein herausragendes Merkmal, das Adam Fry mit Beifall bedachte, ist die Speicherfunktion des Browsers. Diese Funktion zielt darauf ab, den Browser zu einem personalisierten Werkzeug zu machen, das an die individuellen Webpräferenzen jedes Nutzers angepasst ist. Abgesehen von der Speicherung der Benutzerpräferenzen verfügt er auch über einen Agentenmodus, in dem ChatGPT effektiv Aufgaben wie Flugbuchungen, Hotelreservierungen oder die Bearbeitung von Dokumenten im Namen des Benutzers durchführen kann. Die Einstellungen erlauben es dem Benutzer, alle Browser-"Erinnerungen" einzusehen und zu verwalten.
Dies unterstreicht das Engagement von OpenAI, das Potenzial der agentenbasierten KI zu erweitern. Das Unternehmen hat diesen Bereich bereits mit seinem Operator-Tool erforscht, mit dem ChatGPT einen Computer im Namen eines Benutzers bedienen kann. Die nächste Iteration, ChatGPT Agent, versuchte, die Funktionalität auf komplexe Aufgaben und Online-Shopping zu erweitern, wenn auch mit unterschiedlichem Erfolg.
Wenn Sie auf einen Link aus einem Suchergebnis in ChatGPT Atlas klicken, zeigt die Plattform einen geteilten Bildschirm mit der Webseite und dem ChatGPT-Transkript, um jederzeit einen "Begleiter" anzuzeigen. Die Benutzer haben die Möglichkeit, diese Split-Screen-Funktion nach Belieben auszuschalten. Bei der Demonstration der Fähigkeiten des Browsers stellten die Mitarbeiter die Zusammenfassungsfunktionen für Webseiten und eine interessante Funktion namens "Cursor-Chat" vor, die es den Benutzern ermöglicht, Text aus einer E-Mail auszuwählen, auf eine Schaltfläche zu klicken und ChatGPT den Satz inline aufräumen zu lassen.
Altman äußerte sich zufrieden mit dem neuen Produkt und beschrieb es als reibungslos, schnell und insgesamt angenehm in der Anwendung. Dies ist ein weiterer wichtiger Meilenstein in den laufenden KI-Browserkriegen, die einige bahnbrechende Fortschritte erlebt haben, seit OpenAI Mitte 2024 einen Prototyp seiner Suchmaschine SearchGPT angekündigt hat.
Zu den weiteren bemerkenswerten Entwicklungen in diesem Bereich gehört die Einführung des KI-gestützten Browsers Comet durch Perplexity in diesem Sommer. Comet soll das Surfen im Internet und die Erledigung von Aufgaben vereinfachen und ersetzt eine herkömmliche Google-Suche durch eine "Antwortmaschine" von Perplexity, die einige Links zu relevanten Websites bereitstellt und Antworten auf Anfragen generiert. Ein weiteres vielversprechendes Update gab Google im September bekannt, als es eine tiefere Integration seines KI-Assistenten Gemini in Chrome ankündigte, damit dieser Aufgaben im Namen der Nutzer effizienter erledigen kann.
Inmitten all des Hypes und der Durchbrüche ist es klar, dass die Rolle der KI beim Surfen im Internet auf lange Sicht zu erwarten ist. Während Unternehmen wie OpenAI und Google die Grenzen des KI-Potenzials immer weiter ausreizen, schauen Nutzer weltweit mit angehaltenem Atem zu und sind bereit, sich auf die Zukunft des Internets einzulassen.
Hinweis auf den Originalartikel: The Verge