Нов алгоритъм от DeepMind: Mайстор в широк спектър от игри

Изкуственият интелект е овладял някои от най-сложните игри, познати на човека, но моделите обикновено са пригодени за решаване на специфични видове предизвикателства. Сега DeepMind в сътрудничество с изследователи от EquiLibre Technologies, Sony AI, Amii и Midjourney представят нов алгоритъм, наречен Student of Games (SoG), който може да се справи с по-широк кръг игри. Според създателите му той може да бъде важна стъпка към разработването на по-общ изкуствен интелект.

Игрите винаги са били мерило за развитието на изкуствения интелект. От историческата победа на IBM Deep Blue над световния шампион по шахмат Гари Каспаров през 1997 г. до триумфа на AlphaGo на DeepMind над най-добрия играч на Го, Ли Седол, през 2016 г., те предоставят платформа за демонстрация на възможностите на изкуствения интелект.

Тези успехи подготвиха почвата за създаването на AlphaZero от DeepMind – алгоритъм, който овладя шах, Го и шоги, и то на свръхчовешко ниво. Въпреки че това е наистина впечатляващо, AlphaZero се справя само с игри с пълна информация, където всеки детайл от играта, освен намеренията на противника, е видим за двамата играчи.

Student of Games

За разлика от шаха и Го, игрите с непълна информация включват някои детайли, които са скрити. Покерът е класически пример, тъй като играчите не могат да видят какви ръце държат техните опоненти.

Новият алгоритъм на DeepMind комбинира елементи на дървовидно търсене (Tree search), самоигра (Self-play) и теорията на игрите (Game theory), за да се справи в игрите с непълна информация.

Когато става въпрос този тип за игри, изследователите са склонни да разчитат на теорията на игрите, като използват математически модели, за да очертаят най-рационалните решения на стратегически проблеми.

Теорията на игрите се използва широко в икономиката, за да се разбере как хората правят избор в различни ситуации, много от които включват непълна информация.

Например, в областта на игрите с непълна информация, като покера, изкуственият интелект използва теория на игрите не само за предвиждане на ходовете на опонентите, но и за разработване на стратегии, които оптимизират вероятността за победа, въз основа на скритата информация.

През 2016 г. изкуствен интелект, наречен DeepStack, победи професионалисти в покера без лимит, но моделът беше тясно специализиран за хедс-ъп Texas hold ’em. Голяма част от екипа на DeepStack обаче сега работи в DeepMind и комбинира техниките, използвани за създаването на DeepStack, с тези, използвани в AlphaZero.

В статия, публикувана в списание „Science“, екипът споделя, че алгоритъмът е победил най-добрия изкуствен интелект за игра на покер – Slumbot, и също така може да играе шах и Го на професионално ниво.

„Student of Games“ е значителна стъпка напред в усилията ни да създадем по-общи форми на AI. Макар не може да се сравнява със специализирани алгоритми като AlphaZero, способността му да се справя с по-голямо разнообразие от игри е значително постижение
– DeepMind.

Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!

Остави коментар

Student of Games

Споделете:

Like this:

Суперинтелектът е цел №1 на Meta –

Търсене 2.0 – как AI променя начина,

Свръхспособности, лечение на заболявания и пълна симбиоза

AI вече е в класната стая: 60%

Абонирайте се за нашите седмични бюлетини