Штучний інтелект поступився людям у математичному тесті

📅 17.06.2026    🕐 10:55

Попри стрімкий розвиток штучного інтелекту в обробці природної мови та програмуванні, сучасні мовні моделі все ще поступаються провідним математикам у розв’язанні складних дослідницьких задач. Про це свідчать результати нового експерименту в межах проєкту First Proof, який вважається одним із найсуворіших тестів для перевірки математичних здібностей ШІ, повідомляє WION.

У межах дослідження чотирьом передовим моделям штучного інтелекту запропонували розв’язати десять задач дослідницького рівня. Важливою умовою було те, що всі завдання не входили до навчальних даних моделей, а правильність відповідей перевіряли незалежні експерти-математики.

Організатори підкреслюють, що експеримент проводився повністю автономно, без участі людей у процесі виконання завдань. До тестування також допускалися лише загальнодоступні ШІ-системи. Серед учасників — OpenAI з моделлю ChatGPT 5.5 Pro, а також дослідницькі команди з Каліфорнійського університету, Принстонського університету та Швейцарського федерального технологічного інституту в Цюриху. Вони застосовували спеціальні автоматизовані системи, які змушували моделі багаторазово перевіряти та уточнювати свої відповіді.

Результати показали, що навіть найкраща система змогла правильно розв’язати лише 6 із 10 задач. Оскільки всі завдання вже були вирішені професійними математиками, це свідчить про те, що людська експертиза досі залишається сильнішою у роботі з новими, складними науковими проблемами.

Автори проєкту зазначають, що штучному інтелекту ще належить значний шлях розвитку, перш ніж він зможе виступати надійним інструментом для перевірки математичних доказів або повноцінним дослідницьким асистентом для науковців.

Як повідомляло раніше ForUa, у найближчі роки штучний інтелект закладе основу для нової парадигми ведення війни та кардинально скоротить час на ухвалення рішень на полі бою.

 

 

 

 

 

 


Главные новости

Полiтика Економіка Суспiльство Столиця Надзвичайні події Свiт Аналітика Головнi Недвижимость
2001 — 2026 © ForUm. (AMP)