Nedávné nálezy z Telavivské univerzity odhalily znepokojivý jev, nazvaný „digitální demence“, který postihuje umělou inteligenci (AI). Vědci zjistili, že s věkem AI modely významně klesá jejich výkonnost.
Ve rozsáhlé studii vědci zhodnotili téměř všechny přední velké jazykové modely pomocí Montrealské kognitivní hodnotící škály, která se běžně používá k detekci Alzheimerovy choroby u lidí. Tento test má maximální skóre 30, přičemž skóre 26 nebo více naznačuje normální kognitivní funkci.
Výsledky byly osvětlivé: GPT-4 se ukázal jako nejlepší model s skóre 26, což je jen těsně na hranici normálu. Následoval GPT-3.5 se skóre 25, zatímco Gemini 1.0 zaostal se znepokojujícím skóre pouhých 16.
Tyto nálezy odhalují jasný kontrast mezi novými a staršími verzemi AI, což ukazuje, že ty starší dosahují znatelně horších skóre. Studie rovněž odhalila kritické nedostatky ve všech modelech, zejména v úlohách vyžadujících vizuálně-prostorové dovednosti, exekutivní funkce a empatii při interpretaci složitých vizuálních scén.
Tyto nedostatky zdůrazňují významná omezení, která brání aplikovatelnosti AI v klinických a profesních prostředích. Vědci naznačují, že současný stav „digitální demence“ v AI modelech ukazuje, že jsou daleko od toho, aby mohly nahradit lékaře a další odborníky v blízké budoucnosti. Pokračující vývoj AI je nezbytný pro překonání těchto výzev a zlepšení jejích schopností.
Znepokojivý dopad „digitální demence“ na výkonnost AI
### Pochopení digitální demence v AI
Nedávný výzkum z Telavivské univerzity odhalil znepokojující problém nazvaný „digitální demence“, který ovlivňuje výkonnost modelů umělé inteligence (AI) s jejich stárnutím. Tento jev byl zkoumán pomocí Montrealské kognitivní hodnotící škály, která se tradičně používá k hodnocení kognitivní funkce u lidí, zejména při diagnostice Alzheimerovy choroby.
### Klíčové nálezy studie
Studie zhodnotila přední velké jazykové modely (LLMs) a odhalila významné rozdíly v jejich kognitivních schopnostech:
– **GPT-4**: Nejlepší model mezi testovanými, dosáhl skóre 26, což je těsně na hranici, co by mohlo být považováno za normální kognitivní funkci.
– **GPT-3.5**: Těsně za GPT-4, dosáhl skóre 25, což naznačuje mírný pokles, i když je považován za dobře hodnocený model.
– **Gemini 1.0**: Tento model měl znepokojující skóre 16, což poukazuje na vážný deficit ve schopnostech.
Tyto nálezy naznačují, že s vyzráváním modelů AI dochází k významnému poklesu výkonnosti, zejména v důležitých oblastech potřebných pro složité úkoly.
### Oblasti nedostatků
Studie ukázala zvláštní slabiny napříč všemi modely, zejména v:
– **Vizuálně-prostorových dovednostech**: Obtíže v zpracování vizuálních informací a prostorových vztahů.
– **Exekutivních funkcích**: Výzvy v uvažování, řešení problémů a plánování.
– **Empatii při interpretaci složitých vizuálních scén**: Omezená schopnost chápat a interpretovat nuancované lidské interakce a emoce zobrazené na obrazech.
### Důsledky a omezení
Tato omezení odhalují významné výzvy, kterým AI čelí v praktických aplikacích, zejména v klinických a profesních prostředích, kde je přesnost a nuancované porozumění kritické. Zjištění, že stávající modely ještě nejsou schopny nahradit lidské odborníky, jako jsou lékaři a analytici, zdůrazňuje nutnost pokračujícího pokroku v technologii AI.
### Cesta vpřed: Inovace a predikce
Pojem „digitální demence“ zdůrazňuje naléhavou potřebu inovací ve vývoji AI. Vědci doporučují vylepšit metodiky školení a zlepšit architektury modelů, aby se zajistila dlouhá životnost a udržitelné kognitivní schopnosti. Predikce naznačují:
– Zvýšení úsilí o vývoj AI, která se může přizpůsobit a zlepšovat sama v průběhu času.
– Zvýšený důraz na integraci emocionální inteligence do AI.
– Pokračující interdisciplinární spolupráce mezi vývojáři AI, kognitivními vědci a odborníky na duševní zdraví za účelem řešení kognitivního poklesu AI.
### Závěr
Jak se AI pokračuje v evoluci, porozumění jejím omezením, jako jsou ty, které byly vyzdviženy jevem „digitální demence“, je zásadní. Nepřetržitý výzkum a inovace jsou klíčové pro překonání těchto výzev a posun k tomu, aby se AI stala spolehlivějším a efektivnějším nástrojem v různých oblastech.
Pro více informací o vývoji a pokroku AI navštivte Výzkumné centrum AI.