По-малко от 500 дни след пускането на първия си модел, xAI на Илон Мъск представи Grok 4 – AI система, която оглави редица класации и за първи път изпревари водещите модели на OpenAI, Google и Anthropic. По думите на Мъск, „Grok 4 е първият AI, който решава трудни инженерни проблеми, за които няма отговори нито онлайн, нито в книги.“
Огромният скок в способностите се дължи на суперкомпютъра Colossus, който осигурява необходимата изчислителна мощ. Докато при Grok 3 фокусът е бил върху мащабното предварително обучение (pre-training), при Grok 4 акцентът се измества към обучението с утвърждение (reinforcement learning – RL), което позволява на модела да се учи от собствените си грешки.

Grok 4 е пуснат в две версии – стандартна и Grok 4 Heavy, мултиагентна конфигурация, при която няколко агента работят паралелно по една задача и сравняват резултатите. „Това е като група студенти, които си сверяват решенията“, обясни Мъск. „Често само един от агентите открива същината на проблема, но след като сподели решението, останалите могат да го верифицират и надградят.“
Моделът вече е достъпен в социалната мрежа X и чатбот приложението Grok. По-мощната версия – Grok 4 Heavy – се предлага като част от новия абонамент SuperGrok Heavy на цена от $300 месечно. Базовият модел е наличен и през API, като цената е $3 за милион входни токени и $15 за милион изходни – идентична с тази на Claude Sonnet 4, но по-висока от o3 и Gemini 2.5 Pro.
Grok 4 разполага със значително разширен контекстен прозорец от 256 хиляди токена и поддържа както текстови, така и визуални входове. Една от ключовите му характеристики е способността да използва външни инструменти, като тази функционалност е интегрирана директно в обучението му. Въпреки това, Мъск описва настоящите инструменти като „все още доста примитивни“ в сравнение със сложните симулатори, използвани в Tesla и SpaceX. Планът е в бъдеще Grok да получи достъп до същите мощни инструменти, а крайната цел е да може да „взаимодейства с реалния свят“ чрез хуманоидния робот Optimus.
Що се отнася до тестовете, Grok 4 оглавява редица от най-трудните бенчмаркове в области като математика, физика, биология и химия. Например на Humanity’s Last Exam – мултидисциплинарен тест с особено трудни въпроси от тези и други дисциплини – Grok 4 постига 38.6%, а мултиагентната версия Grok 4 Heavy – 44.4%. „Няма човек, който може да постигне по-добър резултат на този тест“, коментира Мъск. „Може да си гений в една област, но не и във всички едновременно. Grok е на нивото на докторанти във всяка дисциплина, без изключение.“

В още по-показателния ARC-AGI 2 – визуално-логически тест, смятан за индикатор за „бъдещи AGI способности“ – Grok 4 постига рекордните 15.9%, почти двойно над Claude 4 Opus с 8.6%. Моделът също така оглавява класациите на математическите изпити AIME и USAMO, а платформата Artificial Analysis го класира на първо място сред публично достъпните модели.


Въпреки впечатляващите резултати, „човешките тестове скоро ще станат безсмислени“, твърди Мъск. По думите му „всичко става тривиално, а единственият истински тест ще бъде реалността“. Според него развитието на AI навлиза в „интелигентен взрив“, а ние се намираме в „най-интересното време в историята“. „Очаквам Grok да открие нови, реално полезни технологии не по-късно от следващата година, а може би още тази… и може да открие нова физика следващата година, а до две години – почти сигурно“, прогнозира милиардерът.
От xAI заявиха, че в следващите месеци ще пуснат специализиран модел за програмиране, подобрени визуални способности, а веднага след това – видео модел, обучен на 100 000 от най-новите чипове на Nvidia. Мъск прогнозира, че „първата наистина добра AI видеоигра ще се появи следващата година“, както и „първият гледаем AI филм“. По отношение на безопасността той подчертава, че най-важното е AI да бъде „максимално търсещ истината“.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: