След като в края на миналата седмица Илон Мъск заяви, че следващият модел на xAI – Grok-3 – ще бъде „най-умният изкуствен интелект на Земята“, тази сутрин компанията направи официалната му премиера. По време на живо излъчване милиардерът и трима инженери на xAI демонстрираха възможностите на системата, която според тях превъзхожда конкурентни модели като GPT-4o на OpenAI и Gemini на Google.
„Мисията на xAI и Grok е да разберем същността на Вселената“, заяви Мъск в началото на презентацията. „Искаме да разберем какво всъщност се случва. Къде са извънземните? Какъв е смисълът на живота? Как ще приключи Вселената? Как е започнала?“
— Elon Musk (@elonmusk) February 18, 2025
За обучение на Grok-3 екипът на xAI е използвал суперкомпютъра „Colossus“ – гигантски център за данни в Мемфис, Тенеси, разполагащ с 200 000 графични процесора Nvidia H100.
Grok-3 всъщност представлява семейство от модели, включително базова версия, по-лека и бърза Grok-3 mini, както и две разсъждаващи – Grok-3 Reasoning и Grok-3 mini Reasoning. Разсъждаващите модели използват т.нар. верига от мисли (chain-of-thought), а за особено сложни заявки потребителите на чатбота могат да активират режим „Big Brain“, използващ допълнителни изчислителни ресурси.
Разсъждаващите модели са в основата и на нова функция в чатбота Grok, наречена DeepSearch (Дълбоко търсене) – отговорът на xAI на алтернативни решения, предлагани от OpenAI, Google и Perplexity. Подобно на тях системата анализира и извлича информация от интернет и X (Twitter), предоставяйки структуриран доклад, придружен с връзки към оригиналните източници.
Според проведените от xAI тестове, Grok-3 превъзхожда модели като GPT-4o, Gemini 2.0 Pro, Claude 3.5 Sonnet и DeepSeek V3 в области като математика, наука и програмиране. От компанията твърдят, че разсъждаващите версии също надминават конкурентни системи като o3-mini и о1 на OpenAI и R1 от DeepSeek в тези области.


В платформата lmarena.ai, където различни AI модели се състезават анонимно, ранна версия на Grok-3, под кодовото име „Chocolate“, постигна рекорден рейтинг над 1402 точки.
BREAKING: @xAI early version of Grok-3 (codename "chocolate") is now #1 in Arena! 🏆
— lmarena.ai (formerly lmsys.org) (@lmarena_ai) February 18, 2025
Grok-3 is:
– First-ever model to break 1400 score!
– #1 across all categories, a milestone that keeps getting harder to achieve
Huge congratulations to @xAI on this milestone! View thread 🧵… https://t.co/p8z8lccNd5 pic.twitter.com/hShGy8ZN1o
Grok 3 е достъпен за Premium+ абонатите на социалната мрежа X (Twitter), като xAI предлага и нов абонамент, наречен SuperGrok, за мобилното приложение и уебсайта Grok.com. След седмица се очаква добавянето на гласов режим, а в близко бъдеще моделът ще стане достъпен и за бизнес клиенти чрез API.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: