Amazon stellt Nova Act vor: Ein KI-Agent, der den Webbrowser steuern kann
Amazon hat am Montag den Nova Act vorgestellt, einen KI-Agenten, der in der Lage ist, einen Webbrowser zu steuern und eigenständig einfache Aktionen auszuführen. Zusammen mit dem neuen KI-Modell veröffentlicht Amazon das Nova Act SDK, ein Toolkit, das Entwicklern ermöglicht, Prototypen von Agenten mit Nova Act zu erstellen.
Nova Act, entwickelt im kürzlich eröffneten AGI-Labor von Amazon in San Francisco, wird auch zentrale Funktionen des kommenden Alexa+-Updates unterstützen, einer generativen KI-verbesserten Version von Amazons beliebtem Sprachassistenten. Die heute verfügbare Version von Nova Act ist jedoch noch nicht vollständig ausgereift und wird als Forschungs-Vorschau bezeichnet.
Entwickler können auf das Nova Act Toolkit über eine neue Website, nova.amazon.com, zugreifen, die auch als Schaufenster für Amazons verschiedene Nova-Grundlagenmodelle dient.
Mit Nova Act versucht Amazon, mit OpenAI’s Operator und Anthropic’s Computer Use im Bereich der allgemeinen KI-Agententechnologie konkurrieren. Mehrere führende Technologieunternehmen glauben, dass KI-Agenten, die das Web für Benutzer navigieren können, die heutigen KI-Chatbots erheblich nützlicher machen werden.
Amazon ist möglicherweise nicht der erste Anbieter dieser Art von Agententechnologie, aber über Alexa+ könnte es die größte Reichweite haben.
Amazon behauptet, dass Entwickler, die mit dem Nova Act SDK arbeiten, in der Lage sein sollten, grundlegende Aktionen im Namen der Benutzer zu automatisieren, wie z.B. Salate bei Sweetgreen zu bestellen oder Tischreservierungen vorzunehmen. Mit dem Nova Act Toolkit können Entwickler Werkzeuge zusammenstellen, die es einem KI-Agenten ermöglichen, Webseiten zu navigieren, Formulare auszufüllen oder Daten in einem Kalender auszuwählen.
Amazon gibt an, dass Nova Act in mehreren internen Tests besser abschneidet als die Agenten von OpenAI und Anthropic. Beispielsweise erzielte Nova Act bei ScreenSpot Web Text, das misst, wie ein KI-Agent mit Text auf einem Bildschirm interagiert, eine Punktzahl von 94%, während OpenAI’s CUA 88% und Anthropic’s Claude 3.7 Sonnet 90% erreichten.
Allerdings benchmarkte Amazon Nova Act nicht mit gängigeren Agentenbewertungen wie WebVoyager.
Nova Act ist das erste öffentliche Produkt, das aus Amazons oben erwähntem AGI-Labor hervorgeht, einer Initiative, die von ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel geleitet wird. Beide gründeten zuvor eigene Startups, bevor Amazon sie im letzten Jahr engagierte, um die Bemühungen um KI-Agenten voranzutreiben.
Obwohl es seltsam erscheinen mag, dass ein AGI-Labor KI-Agenten entwickelt, die Salate bestellen können, erklärte Luan gegenüber TechCrunch, dass er Agenten als einen entscheidenden Schritt zur Schaffung von superintelligenten KI-Systemen sieht. Luan definiert AGI als „ein KI-System, das Ihnen hilft, alles zu tun, was ein Mensch am Computer tut.“
Luan sagt, sein Team habe das Nova Act SDK so konzipiert, dass es zuverlässig kurze, einfache Aufgaben automatisiert und Entwicklern Werkzeuge an die Hand gibt, um genau zu definieren, wann sie möchten, dass ein Mensch in einen agentischen Workflow eingreift. Er hofft, dass es Entwicklern ermöglicht, zuverlässigere agentische Anwendungen zu erstellen, wenn auch nicht unbedingt vollständig autonome.
Amazon bringt seinen ersten allgemeinen KI-Agenten auf einen stark umkämpften Markt, aber es handelt sich um eine entscheidende Technologie, auf die das Unternehmen viel setzt. Frühe Tests von Nova Act könnten einen Einblick in einige der Fähigkeiten des lange erwarteten Alexa+ geben, einen entscheidenden Moment für Amazons KI-Bemühungen.
Ein großes Problem bei frühen KI-Agenten von OpenAI, Google und Anthropic sind deren Zuverlässigkeit in verschiedenen Bereichen. In den Tests von TechCrunch zeigen die Systeme langsame Reaktionen, Schwierigkeiten bei der selbstständigen Ausführung über längere Zeiträume und sind anfällig für Fehler, die ein Mensch nicht machen würde. Es wird nicht lange dauern, bis wir sehen, ob Amazon den Code geknackt hat oder ob seine Agenten unter denselben Mängeln leiden wie die Wettbewerber.