AI Bulgaria

Исторически пробив: Модел на OpenAI печели злато на Международната олимпиада по математика

математика
Image: Created with Sora

За първи път в историята на изкуствения интелект езиков модел (LLM) завоюва медал на най-престижното математическо състезание в света – Международната олимпиада по математика (IMO). Това обявиха изследователи от OpenAI, които съобщиха, че техен „експериментален модел“ е постигнал 35 от възможни 42 точки върху задачи от тазгодишното издание на олимпиадата – резултат, достатъчен за злато.

Моделът е бил подложен на абсолютно същите условия като човешките участници: две изпитни сесии по 4.5 часа, без достъп до интернет, помощни средства или инструменти. Моделът е успял да реши пет от шестте задачи, като само последната (традиционно най-трудната) е останала нерешена. Трима бивши медалисти от IMO са оценили решенията независимо, като крайната оценка е била приета едва след постигане на пълен консенсус между тях.

До този момент най-силното представяне на изкуствен интелект на Международната олимпиада по математика беше постигнато от AlphaGeometry и AlphaProof – два специализирани модела на Google DeepMind, които през 2024 г. спечелиха сребърен медал.

„Това е пробив, който мнозина смятаха за невъзможен поне още няколко години“, написа в X (Twitter) Ноам Браун, един от водещите изследователи на OpenAI, който работи върху разсъждаващите модели на компанията. Според него значимостта на резултата не е само в самото постижение, а в самия подход: вместо специализиран модел, обучен конкретно за IMO, става дума за нов тип „универсален разсъждаващ агент“, способен на дълги, структурирани разсъждения в напълно непознати условия.

„Обикновено при такива постижения – в Go, Dota, покер, дипломация – изследователите прекарват години, за да създадат AI, който майсторски овладява една конкретна област, но не може нищо друго. Тук ситуацията е различна. Това не е модел, специализиран за IMO. Това е разсъждаващ агент, който обединява нови експериментални техники с универсално предназначение“, обяснява Браун. По думите му, докато o1 мисли за секунди, а Deep Research – за минути, този модел мисли с часове. „И най-важното: мисли по-ефективно.“

Водещият изследовател зад проекта – Александър Уей – заяви, че компанията не планира да пуска система с „толкова напреднали математически умения“ в близките няколко месеца. Въпреки това той разкри, че OpenAI скоро ще представи дългоочаквания GPT-5.

Пробивът в математиката идва само дни след друго впечатляващо постижение: изкуственият интелект на OpenAI бе на крачка от победата в едно от най-престижните състезания по програмиране в света – AtCoder World Tour 2025 – където само един човек успя да надделее над машината.

Последвайте ни в социалните мрежи – FacebookInstagramX и LinkedIn!

Остави коментар


The reCAPTCHA verification period has expired. Please reload the page.

Абонирайте се за нашите седмични бюлетини

Получавайте всяка неделя в 10:00ч последно публикуваните в сайта статии

Бюлетини: