OpenAI lanceert ChatGPT-agent met geavanceerde taakautomatisering en interactie met het web

The combination of its various capabilities and potential for future enhancements makes it a valuable tool for professionals and individuals alike.

Nu beschikt het over een nieuw agentisch systeem waarmee het zelfstandig complexe taken kan uitvoeren met behulp van zijn eigen virtuele computer. Dit systeem integreert mogelijkheden van eerdere tools – de webinteractie van Operator, de synthesetechnologie van diepgaand onderzoek en de conversatie-intelligentie van ChatGPT – waardoor het websites kan navigeren, gegevens kan analyseren, code kan uitvoeren en producten kan produceren zoals bewerkbare slideshows en spreadsheets. Gebruikers behouden de controle, met de mogelijkheid om toestemming te geven, taken te onderbreken of over te nemen op elk moment.

Geintegreerd agentisch systeem en mogelijkheden

De nieuwe ChatGPT-agent combineert de sterke punten van Operator en diepgaand onderzoek en overwint hun individuele beperkingen door zowel diepgaande analyse als interactieve webnavigatie mogelijk te maken, inclusief beveiligde aanmelding voor gepersonaliseerde inhoud. Het maakt gebruik van verschillende tools zoals een visuele browser, tekstgebaseerde browser, terminal en API-toegang, waarbij de optimale methode wordt gekozen om taken efficiënt te voltooien. Het ondersteunt iteratieve, collaboratieve workflows waar gebruikers de agent kunnen begeleiden of pauzeren en meldingen ontvangen bij voltooiing van taken.

Praktische toepassingen

De ChatGPT-agent verbetert de productiviteit in professionele en persoonlijke contexten door taken te automatiseren zoals het maken van presentaties van dashboards, het plannen van vergaderingen, het bijwerken van financiële spreadsheets, het plannen van reizen en het maken van afspraken. Het behaalt state-of-the-art prestaties op verschillende benchmarks, waaronder:

  • Het Laatste Exam van de Mensheid: Behaalt een nieuwe score van 41,6 voor pass@1 SOTA, die stijgt naar 44,4 bij parallelle pogingen.
  • FrontierMath: Bereikt een nauwkeurigheid van 27,4% op de moeilijkste wiskundige problemen, beter dan vorige modellen.
  • DSBench and SpreadsheetBench: Overtreft menselijke prestaties en bestaande modellen bij taken op het gebied van data science en spreadsheetbewerking.
  • Investment Banking Modeling: Overtreft eerdere modellen bij complexe financiële modelingtaken.
  • BrowseComp en WebArena: Stelt nieuwe records in voor het browsen op internet en het voltooien van webtaken in de echte wereld.

Gebruik en integratie

Gebruikers met Pro, Plus en Team abonnementen kunnen de agentmodus activeren vanuit de gereedschapskeuzelijst in elke conversatie. De agent kan toegang krijgen tot door gebruikers verbonden apps (bijvoorbeeld Gmail, GitHub) via ChatGPT-verbinders, waardoor het kan integreren met workflows en kan handelen op relevante gegevens, terwijl expliciete aanmelding vereist is voor gevoelige websites. Taken kunnen automatisch worden gepland voor herhaling.

Veiligheid en risicobeperking

Gezien het vermogen van de agent om op internet te handelen en toegang te krijgen tot gebruikersgegevens, heeft OpenAI robuuste veiligheidsmaatregelen geïmplementeerd, waaronder:

  • Expliciete bevestiging door de gebruiker voorafgaand aan ingrijpende acties.
  • Actief toezicht (“Watch Mode”) voor kritieke taken.
  • Proactieve weigering van hoogrisicoacties zoals bankoverschrijvingen.
  • Privacy-instellingen waarmee gebruikers browsen kunnen verwijderen en kunnen uitloggen bij sessies.
  • Beveiligde browserovername-modus die invoer van de gebruiker privé houdt.
  • Sterke verdediging tegen aanvallen met promptinjectie, die de agent via kwaadaardige webinhoud zouden kunnen manipuleren.
  • Voortdurend toezicht en snelle respons op beveiligingsproblemen.

De agent valt onder het High Biological and Chemical Capabilities Preparedness Framework van OpenAI, met uitgebreide bioveiligheidsmaatregelen en lopende samenwerking met externe bioveiligheidsexperts.

Beperkingen en toekomstige richtingen

De ChatGPT-agent bevindt zich in een vroeg stadium en kan fouten maken. De diavoorstellingengeneratie bevindt zich momenteel in bèta, met voortdurende verbeteringen gepland voor opmaak en polish. Spreadsheet bewerking is geavanceerder, maar het uploaden van dia’s ter bewerking wordt nog niet ondersteund. OpenAI plant iteratieve verbeteringen om de efficiëntie, diepgang, veelzijdigheid en balans van gebruikerstoezicht van de agent te verbeteren.

Beschikbaarheid

De ChatGPT-agent wordt uitgerold voor Pro, Plus en Team-gebruikers, met toegang voor Enterprise en Onderwijs binnenkort beschikbaar. Gebruikslimieten verschillen per abonnementsniveau, met opties voor extra credits. De Operator-onderzoekvoorstelling zal binnenkort worden afgesloten, met diepgaand onderzoek geïntegreerd in de nieuwe agent.

Dit nieuwe agente systeem vertegenwoordigt een significante vooruitgang in de mogelijkheid van AI om autonomie complexe, realistische taken uit te voeren terwijl gebruikerscontrole en veiligheid behouden blijven. Door de combinatie van zijn verschillende mogelijkheden en het potentieel voor toekomstige verbeteringen, is het een waardevol hulpmiddel voor zowel professionals als individuen.