Изкуственият интелект продължава да покорява върхове. Само дни след като два независими езикови модела – единият на Google, другият на OpenAI – завоюваха злато на Международната олимпиада по математика (IMO), най-мощните AI системи на Google постигнаха нов триумф – този път на университетско ниво. Това съобщиха учени от българския институт INSAIT и ETH Zurich, които стоят зад независимата платформа за оценка на езикови модели – MathArena.
Резултатите идват от току-що приключилото Международно математическо състезание за студенти (IMC 2025) – престижна надпревара, в която участват над 400 от най-добрите студенти по математика от цял свят.
От MathArena са тествали три системи: Gemini Deep Think (версията, която спечели златен медал на IMO 2025), Gemini-2.5-Pro с агентна система и Gemini 2.5 Pro Best-of-32 – модел, който избира най-доброто решение измежду множество опити.
„Всички модели се справиха отлично, значително над прага за златен медал, изпреварвайки редица медалисти от IMO“, коментира основателят на INSAIT проф. Мартин Вечев. По думите му, Gemini Deep Think не само е намерил правилните решения, но и е предложил няколко доказателства, които са „по-изчистени и по-елегантни от официалните“.

В основата на този пробив стои способността на „разсъждаващите“ AI модели да отделят значително повече време и изчислителни ресурси за анализ и решаване на даден проблем. Ако преди година GPT-4 даваше мигновени отговори, то системи като o3 мислят в продължение на няколко минути, а моделите, използвани в математическите олимпиади, разсъждават с часове. Освен това вече говорим за мултиагентни системи, които, по думите на Google, „генерират паралелни потоци от разсъждения – сравняват, преценяват и комбинират идеи, за да достигнат до по-добри отговори“.
И така, ако допреди година беше немислимо езиков модел да реши сложна задача, която не е „виждал“ в своите тренировъчни данни, днес това вече е факт. Логично възниква въпросът: какво да очакваме след две, пет или десет години? Възможно ли е AI системите да достигнат, а може би дори да надминат, математици от ранга на Терънс Тао? И още по-интригуващо – ще могат ли да създават изцяло нови идеи и хипотези, отвъд пределите на човешкото въображение? Отговорите на тези въпроси може би са по-близо, отколкото предполагаме.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: