OpenAI introduceert o3 en o4-mini AI-modellen voor verbeterde redeneringscapaciteiten

OpenAI heeft twee nieuwe AI-modellen gelanceerd, o3 en o4-mini, die zijn ontwikkeld om de prestaties van ChatGPT aanzienlijk te verbeteren. Deze geavanceerde modellen zijn geoptimaliseerd om langer na te denken voordat ze antwoorden genereren en kunnen gebruik maken van alle beschikbare tools binnen ChatGPT, zoals webzoekopdrachten, bestandsanalyse met Python, visueel redeneren en beeldgeneratie. Dankzij deze verbeteringen kunnen de modellen snel en efficiënt gedetailleerde antwoorden bieden, meestal binnen een minuut, en zijn ze uitstekend in het oplossen van complexe en veelzijdige problemen.

Belangrijkste kenmerken van OpenAI o3

Het o3-model is het krachtigste van de twee en excelleert op het gebied van codering, wiskunde, wetenschap en visuele waarneming. Het model heeft nieuwe SOTA-benchmarks (state-of-the-art) neergezet in verschillende tests, waaronder Codeforces en SWE-bench. o3 verlaagt de belangrijkste fouten met 20% in vergelijking met zijn voorganger, o1, vooral op gebieden zoals programmeren, zakelijke vraagstukken en creatief denken. Vroege testers hebben het model geprezen voor zijn analytisch vermogen en zijn capaciteit om hypotheses te genereren en te evalueren in vakgebieden zoals biologie en engineering.

Belangrijkste kenmerken van OpenAI o4-mini

o4-mini is een kleinere, kosteneffectieve variant die toch indrukwekkende prestaties levert op gebieden als wiskunde, codering en visuele taken. Het heeft de hoogste scores behaald in de AIME 2024 en 2025 benchmarktests en overtreft o3-mini in niet-STEM-taken en datawetenschap. Door zijn efficiëntie kan het model hogere gebruikslimieten ondersteunen, wat het ideaal maakt voor het verwerken van grote hoeveelheden zoekopdrachten die geavanceerde redenering vereisen.

Verbeteringen en concurrentieanalyse

Externe experts hebben beide modellen beoordeeld als beter in staat om instructies te volgen en nuttige, verifieerbare antwoorden te geven dan eerdere versies. Ze bieden ook verbeterde gespreksmogelijkheden, waarbij ze geheugen gebruiken en eerdere interacties betrekken voor gepersonaliseerde antwoorden. Deze release maakt deel uit van de bredere strategie van OpenAI om zijn leiderschap in de AI-sector te behouden, met de focus op redeneringsmodellen die de prestaties verbeteren. Dit komt op een moment dat bedrijven zoals Google, Meta en Anthropic ook hun AI-aanpakken verfijnen.