Veröffentlicht am

Künstliche-Intelligenz-Agenten-Computer-Schnittstelle

Autoren

Eine neue Klasse von KI-Agenten entwickelt sich mit der Fähigkeit, ein grafisches Computer-Interface wie ein Mensch zu verstehen und zu navigieren.

Image

Neue Fortschritte bei Foundation-Modellen, insbesondere bei Large Language Models (LLMs) und Multimodalen Sprachmodellen (MLMs), haben es ermöglicht, dass KI-Agenten komplexe Aufgaben ausführen.

Einige dieser KI-Agenten mit visuellen Fähigkeiten nutzen MLMs, um grafische Benutzeroberflächen (GUIs) zu interpretieren und zu interagieren, indem sie das Verhalten eines Menschen bei der Interaktion mit einer GUI nachahmen. Indem sie Aktionen wie Klicken und Tippen ausführen, um Benutzeranfragen zu erfüllen.

Diese Studie überprüft und kartiert den Fortschritt bei KI-Agenten-Computer-Schnittstellen (ACI), wobei der Fokus auf Innovationen in Daten, Frameworks und Anwendungen liegt.

Bitte beachten Sie, dass die deutsche Version von Ai unterstützt wird und daher geringfügige Fehler auftreten können.

AUTOR

Über ABN Asia: Ai Base Network (ABN), ABN Asia wurde im Jahr 2012 gegründet und ist ein Unternehmen mit akademischem Hintergrund, das von Lehrkräften und ehemaligen Studierenden aus Ungarn, den Niederlanden, Russland, Deutschland und Japan gegründet wurde. Wir teilen eine gemeinsame Leidenschaft und eine klare Vision für Technologie, die Innovation und erstklassige Qualität für unsere Kunden bringt. Unser Motto lautet: Besser. Schneller. Sicherer. In vielen Fällen: Günstiger.

Zögern Sie nicht, uns zu kontaktieren, wenn Sie IT-Dienstleistungen, digitale Beratung, Standardsoftwarelösungen benötigen oder uns Angebotsanfragen (RFPs) senden möchten. Sie können uns unter [email protected] kontaktieren. Wir sind bereit, Ihnen bei all Ihren Technologiebedürfnissen zu helfen.

ABNAsia.org

© ABN ASIA