RT-2: Как визията на Джордж Лукас става реалност

Когато Джордж Лукас възроди своята идея за „Междузвездни войни„, ни представи R2-D2 – симпатичен робот, който въпреки че не говори човешки език, успяваше да комуникира чрез звуци и светлини. Малцина предполагаха, че скоро ще видим реален прототип на този робот. Сега, благодарение на Google DeepMind, кино фантазиите придобиват конкретни форми.

Днес, обявяваме RT-2: модел за визия, език и действие, първият от своя вид, предназначен за управление на роботи. Той асимилира информация от интернет и роботични източници, превръщайки знанието в ясни инструкции.
– споделят DeepMind в Twitter..

Today, we announced 𝗥𝗧-𝟮: a first of its kind vision-language-action model to control robots. 🤖

It learns from both web and robotics data and translates this knowledge into generalised instructions.

Find out more: https://t.co/UWAzrhTOJG pic.twitter.com/U4VW8IsvAD
— Google DeepMind (@GoogleDeepMind) July 28, 2023

Визия, Език и Действие: Революция в Роботиката с RT-2

Визия, Език и Действие: Революционните стъпки на RT-2 в роботиката. Роботиката е област на непрекъснато развитие и предизвикателства. За роботите, които трябва да изпълняват задачи в разнообразни условия, е жизненоважно да се справят с различни и сложни сценарии. Ефективното им обучение изисква практическа „основа“ – способността да разпознават и интерпретират реални обекти и явления.

Примерите с ябълката и банана в видеото по горе илюстрират сложността на този процес – роботът трябва не само да знае фактите около плодовете, но и да тълкува взаимоотношенията между обектите, за да определи кой обект да вземе и къде да го постави. Ключов аспект е, че много от задачите могат да включват нови обекти, които роботът никога не е срещал досега.

Но как може да се постигне този сложен процес на разпознаване и действие?

Роботичният Трансформер (RT-2) предлага решение на този въпроси. Това е нов модел, който свързва визуални данни, език и действие (VLA), като съкращението RT означава „трансформатор за роботика“. Този модел се обучава с помощта на обширни набори от данни, което го прави изключително ефективен при разпознаване на визуални и езикови образци.

С RT-2, роботите могат да учат по сходен с нашия начин – прехвърляйки научени концепции към нови ситуации. RT-2 не само показва как напредъкът в областта на изкуственият интелект бързо се прехвърля към роботиката, но и показва огромна перспектива за създаване на по-универсални роботи
– Google Deepmind.

Основите на RT-2: Съчетание на интернет и реален свят

RT-2 е върхово постижение в областта на роботиката и представлява автентична връзка между човешкия език и автоматизираните действия. Това е възможно благодарение на най-новите постижения в областта на изкуствения интелект, които позволяват на RT-2 да комбинира различни модели като Pathways Language and Image (PaLI-X) и Pathways Language model Embodied (PaLM-E).

Тези модели се наричат модели за визия-език. Както подсказва името, моделите за визия-език са програми, които съчетават данни от текст с данни от изображения. Това означава, че RT-2 не само вижда света около себе си чрез камери, но и може да „интерпретира“ и „отговаря“ на езикови команди.

Особено впечатляваща е способността на RT-2 да извършва заключения, които са извън поставените рамки. Например, може да се оцени дали камък би бил по-ефективен от чук, или коя напитка би удовлетворила най-добре нуждите на преуморен човек.

Това са само някои примери за това как робота може да адаптира действията си, тълкувайки нови указания и правейки логични изводи на основата на своя предишен опит.

Сега би било важно да споменем малко за предшественика на RT-2 – RT-1, който беше началната версия. Той беше обучен в специфична среда – офис кухня, като е работил съвместно с 13 други роботи за период от 17 месеца. Практичестия опит на RT-1, плюс интернет данните, превръщат RT-2 в значително по-ефективен робот.

Video by Google DeepMind https://www.deepmind.com

R2-D2 и C-3PO: От кино екрани към нашата действителност

С тези бързи темпове на развитие в технологичния свят, където роботите се превръщат в нашите спътници, ние влизаме в епоха, която изглежда като взета от страниците на ‘Междузвездни войни’. Това е бъдеще, в което роботите не са само изобретения – те са визията ни за света на утрешния ден, материализирана чрез технологията.

Роботи като R2-D2 и C-3PO, които веднъж бяха част от далечна галактика в киното, вече са реалност в нашия свят.

Целта на AIBulgaria.com е да предоставя актуална и стойностна информация от света на изкуствения интелект (AI). Последвайте ни в социалните мрежи – Facebook, Twitter и LinkedIn. Също така, може да се присъедините към нашия Discord сървър!

Остави коментар

Визия, Език и Действие: Революция в Роботиката с RT-2

Основите на RT-2: Съчетание на интернет и реален свят

R2-D2 и C-3PO: От кино екрани към нашата действителност

Споделете:

Like this:

Luma AI представи Ray3 – „разсъждаващ“ видео

OpenAI с нова, по-мощна версия на GPT-5

ByteDance с нов генератор на изображения, конкуриращ

Replit с нов AI агент, който може

Абонирайте се за нашите седмични бюлетини