23 Maart 2025

Waarom GPT Niet Zoals Mensen Kan Redeneren

In een studie van AI- en taalexperts Martha Lewis van de Universiteit van Amsterdam en Melanie Mitchell van het Santa Fe Institute werd de capaciteit van GPT-4 om analogieën te begrijpen getest in vergelijking met menselijke prestaties. Analogisch redeneren – het vermogen om vergelijkingen te maken tussen verschillende dingen op basis van gedeelde overeenkomsten – is een cruciale manier waarop mensen de wereld begrijpen. Bijvoorbeeld: "Kop is voor koffie zoals soep is voor ???"

Hoewel GPT-4 goed presteert in standaard analogie-taken, bleek uit de studie dat het model moeite had wanneer de problemen licht werden aangepast. In tegenstelling tot mensen, die hun prestaties consistent hielden ondanks variaties in de analogieën, daalden de resultaten van GPT-4.

De Gebrek aan Flexibiliteit van GPT in Redeneren

De studie testte zowel AI- als menselijke prestaties op drie verschillende soorten analogieën:

Lettersequenties
Cijfer matrices
Verhaal-analogieën

GPT-4 presteerde goed op standaardtests, maar wanneer de problemen werden aangepast – zoals het veranderen van de positie van een ontbrekend cijfer of een lichte herformulering van een verhaal – daalde de prestaties van GPT-4 aanzienlijk. Mensen bleven echter consistent. Dit suggereert dat GPT-modellen niet over de flexibiliteit van menselijk redeneren beschikken en vaak afhankelijk zijn van patroonherkenning in plaats van echt begrip.

De Uitdagingen voor AI in Besluitvorming

Dit onderzoek toont aan dat AI-modellen zoals GPT-4 de analogieën die ze genereren niet echt "begrijpen". Hun redenering imiteert vaak patronen uit de trainingsdata in plaats van abstract begrip, wat een belangrijk kenmerk is van menselijke cognitie. De studie concludeert dat GPT-modellen zwakker zijn dan menselijke cognitie, vooral wanneer ze worden geconfronteerd met complexe redeneringstaken. Dit benadrukt de beperkingen van AI in kritieke besluitvormingsgebieden zoals gezondheidszorg, recht en onderwijs.

Dit is een belangrijke herinnering dat hoewel AI een krachtig hulpmiddel kan zijn, het nog niet in staat is om menselijk denken te vervangen in complexe, genuanceerde scenario’s.

Artikelgegevens:
Martha Lewis en Melanie Mitchell, 2025, ‘Evaluating the Robustness of Analogical Reasoning in Large Language Models’
Transactions on Machine Learning Research

Gepubliceerd door de UvA

Vergelijkbaar >

Vergelijkbare nieuwsitems

>Bekijk alle nieuwsitems >

23 Maart 2025

Waarom GPT Niet Zoals Mensen Kan Redeneren >

In een studie van AI- en taalexperts Martha Lewis van de Universiteit van Amsterdam en Melanie Mitchell van het Santa Fe Institute werd de capaciteit van GPT-4 om analogieën te begrijpen getest in vergelijking met menselijke prestaties. Analogisch redeneren – het vermogen om vergelijkingen te maken tussen verschillende dingen op basis van gedeelde overeenkomsten – is een cruciale manier waarop mensen de wereld begrijpen. Bijvoorbeeld: "Kop is voor koffie zoals soep is voor ???"

Lees meer >

20 Maart 2025

Oproep: Test een nieuw AI-aanbevelingssysteem voor NEMO Kennislink! >

NEMO Kennislink test samen met onderzoekers van de UvA, HvA en CWI een nieuw AI-gestuurd aanbevelingssysteem in het AI Media & Democracy Lab. We zoeken enthousiaste deelnemers die twee maanden lang NEMO Kennislink willen lezen via een speciale test-app op hun smartphone.

Lees meer >

18 maart

Lemni haalt €3,3 miljoen pre-seed investering op voor AI-gedreven klantinteractie >

De Amsterdamse AI-startup Lemni is officieel gelanceerd en heeft €3,3 miljoen aan pre-seed financiering opgehaald in een ronde geleid door Sequoia Capital. De investering helpt Lemni bij het versnellen van productontwikkeling, het uitbreiden van het team en het wereldwijd opschalen van hun AI-gedreven klantinteractieplatform.

Lees meer >