Нов модел на изкуствен интелект (AI), наречен „gpt2-chatbot”, се появи мистериозно на уебсайта LMSYS Chatbot Arena, предизвиквайки вълнения и спекулации в AI средите. Впечатляващите му възможности накараха мнозина да се запитат дали това не е замаскиран тест на предстоящия модел на OpenAI.
🔮 A Mysterious ‘gpt2-chatbot’ appears.
— Rituraj Tiwari (@tiwarituraj) April 30, 2024
A mysterious new AI model called “gpt2-chatbot” just appeared on the Chatbot Arena, showing off advanced capabilities and leading to speculation that it could be an early @OpenAI stealth test of GPT 4.5https://t.co/zpjNz2bIpV
Спекулациите за произхода на „gpt2-chatbot” варират от предшественик на GPT-4.5 или GPT-5, през модифицирана версия на GPT-4, до версия на GPT-2, надградена с мистериозния алгоритъм Q* (Q star).
my guess is this mysterious 'gpt2-chatbot' is literally OpenAI's gpt-2 from 2019 finetuned with modern assistant datasets.
— albs — 3/staccs (@albfresco) April 29, 2024
in which case that means their original pre-training is still amazing and better than everyone else's 4 years later pic.twitter.com/GPgG1b6QIT
So there is a real chance that GPT2 is in fact GPT-2 fine-tuned with Q*. So far the best explanation for this outstanding model, if it really is GPT-2 at GPT-4 level. https://t.co/9aN6593IJs
— Chubby♨️ (@kimmonismus) April 30, 2024
Първоначалните тестове на модела показват впечатляващи резултати в областта на математиката, кодирането и разсъжденията. Например Андрю Гао, специалист в областта на изкуствения интелект от Станфордския университет, заяви, че “gpt2-chatbot” е успял да реши престижна задача от Международната олимпиада по математика от първия опит – постижение, което той определи като „изключително трудно“.
uh…. gpt2-chatbot just solved an International Math Olympiad (IMO) problem in one-shot
— Andrew Gao (@itsandrewgao) April 29, 2024
the IMO is insanely hard. only the FOUR best math students in the USA get to compete
prompt + its thoughts 🧵 https://t.co/CuO0ToJmb9 pic.twitter.com/3xxWPvtmuG
От друга страна, Чейс Маккой, инженер и основател на CodeGen, твърди, че “gpt2-chatbot” превъзхожда дори най-добрите модели като GPT-4 и Claude Opus при писането на код.
Can confirm gpt2-chatbot is definitely better at complex code manipulation tasks than Claude Opus or the latest GPT4
— Chase (@ChaseMc67) April 29, 2024
Did better on all the coding prompts we use to test new models
The vibes are deffs there 👀
Съли Омар, съосновател на Cognosys, пък е решил да постави на изпитание способностите на “gpt2-chatbot” в областта на ASCII изкуството. Той е накарал модела да нарисува еднорог, използвайки само текстови символи – тест, който е бил част от противоречивия проект на Microsoft, наречен “Sparks of AGI”. За негова изненада “gpt2-chatbot” се справил отлично, по думите му “много по-добре от всеки друг модел”.
Gpt2 drawing unicorns vs Claude opus
— Sully (@SullyOmarr) April 29, 2024
Whatever this model is, its really good. pic.twitter.com/XHDMWaFdW9
Главният изпълнителен директор на OpenAI Сам Aлтман отговори на спекулациите с загадъчен пост в X (Twitter), гласящ: „Имам слабост към gpt2″, което допълнително разпали любопитството и хипотезите в AI средите.
i do have a soft spot for gpt2
— Sam Altman (@sama) April 30, 2024
В крайна сметка, въпреки че е интригуващ, няма категорични доказателства, че „gpt2-chatbot” е официален модел на OpenAI.
Ако желаете, можете да изпробвате модела на уебсайта chat.lmsys.org.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: