По време на конференцията re:Invent Amazon Web Services (AWS), подразделението за облачни услуги на Amazon, обяви нова серия мултимодални генеративни модели на изкуствен интелект, наречени „Nova”. От Amazon твърдят, че моделите балансират между цена и ефективност, конкурирайки се с тези на OpenAI, Google и Meta.
Серията Nova включва четири модела: Micro, Lite, Pro и Premier. Micro, най-малкият от тях, е предназначен единствено за обработка на текст, но предлага изключително ниска латентност и ефективност. Lite моделът може да обработва изображения, видео и текст на достъпна цена, докато Pro предлага висока производителност за по-сложни мултимодални задачи.
Най-мощният модел, Nova Premier, е създаден за изключително сложни задачи и се очаква да бъде пуснат в началото на 2025 година. От Amazon твърдят, че моделът ще бъде способен да извършва сложни разсъждения и ще може да генерира синтетични данни за други AI системи, потенциално конкурирайки се с „o1″ на OpenAI.
Що се отнася до контекстните прозорци, Micro разполага със 128 000 токена, а Lite и Pro с 300 000 токена, което се равнява на около 225 000 думи, 15 000 реда компютърен код или 30 минути видео.
Главният изпълнителен директор на Amazon, Анди Джаси, заяви, че моделите Nova са сред най-бързите и най-евтините в своите класове. Те са достъпни чрез AWS Bedrock, платформата на Amazon за разработка на изкуствен интелект, където могат да бъдат допълнително настройвани.
Освен мултимодалните модели, Amazon представи и два специализирани – „Nova Canvas” за генериране на изображения и „Nova Reel” за създаване на видео съдържание. Canvas, подобно на модели като FLUX, Midjourney и DALL·E, генерира изображения от текстови указания (prompts). Reel, от друга страна, може да генерира видеоклипове с дължина до 6 секунди, но според AWS скоро ще се появи версия, която ще създава двуминутни клипове.
Amazon планира да разшири серията Nova през 2025 г. с въвеждането на модел за преобразуване на реч в реч, както и универсален модел, способен да работи с всички видове входни и изходни данни. По думите на Джаси, този модел ще може да приема текст, реч, изображения или видео и да генерира същите типове съдържание.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!
Споделете: