Alibaba представила свою модель ИИ Qwen 2.5 Max после успеха DeepSeek
Фото: Shutterstock.
На днях Китай удивил мир, выпустив нейросеть DeepSeek. Впечатляющая мощь нового продукта и его стоимость (12 миллионов долларов по сравнению с сотнями миллионов у американских соперников) произвели мрачное впечатление на Силиконовую долину. Акции западных ИИ-компаний обрушились, например, производитель чипов Nvidia потерял сразу 600 миллиардов долларов. Но неудачи (для Запада) не заканчиваются на этом. В первый день китайского нового года крупный ИИ-игрок Alibaba представил нейросеть Qwen 2.5 Max, которая еще более мощная. С такими темпами лидерство Китая становится неоспоримым.
Alibaba в Китае аналогична Open AI в США, и компания давно успешно разрабатывает сетевые технологии. Весной прошлого года на технологический рынок Поднебесной вышла новая (созданная в 2023 году) компания DeepSeek. На Западе первичную версию их нейросети не заметили (а теперь кусают локти). В Китае она вызвала большой резонанс. В самой Alibaba проводили совещания и создавали антикризисные штабы. Молодежь нас обходит!
И вот новый поворот. Сеть от Alibaba разрывает внутренний рынок, а вместе с DeepSeek они активно конкурируют на международной арене.
Продукт от Alibaba превзошел DeepSeek во всех тестах (бенчмарках), на которых обычно проверяются возможности нейросети. Сеть оказалась более точной в ответах, быстрее обрабатывала данные и была более адаптивной. Что неудивительно: её обучали тщательно.
На самом деле разработчики нейросетей уже давно соревнуются именно в области обучения. Если верить американской Open AI, это очень дорого и долго. Например, на обучение следующего поколения GPT, GPT5, Open AI планирует потратить миллиард долларов. Компании приобретают целые электростанции для питания центров обучения. А воровство контента в Интернете, социальных сетях и даже в персональных данных стало предметом споров и разбирательств. Но контент крайне необходим, ведь ИИ нуждается в примерах, чтобы изучить жизнь людей.
DeepSeek стала выдающейся нейросетью, так как смогла обучиться всего за 5,5 миллионов долларов (хотя говорят, что в сумму не включили некоторые расходы; все равно это дешево), и результат оказался довольно хорошим. Нейросеть точно не хуже GPT4, а обошлась в сотни раз дешевле.
Qwen обучали не на минималках. В неё было загружено 20 триллионов единиц информации (токенов), и дополнительно использовались методики тонкой настройки (SFT) и обратная связь с человеком (RLHF), то есть применялись самые современные подходы. Это не будет так быстро, как с DeepSeek, но будет лучше. Неудивительно, что Qwen превзошла существующие американские аналоги.
Alibaba не утверждает, что обучила сеть за копейки, но намекает, что это было не так дорого, как у американцев. Компания подробно рассказала, как именно происходило обучение. Что больше всего поразило экспертов, так это оптимизация на каждом этапе. В результате для обучения (и затем для работы) требуется минимум вычислительных мощностей.
Сообщается, что Qwen способна единовременно обрабатывать 1 миллион единиц информации. Это все равно, как если бы вы могли мгновенно запомнить 10 романов объема «Властелина колец». Эксперты утверждают, что это переломный момент в развитии ИИ. Большинство нейросетей едва способны запомнить 120 тысяч единиц информации.
Разработчики уже начали тестировать: сеть доступна для экспериментов по свободной лицензии.
Хотя у Qwen, как и у DeepSeek, есть чат, где можно пообщаться с нейронкой (после регистрации), в основном Qwen – это набор инструментов, с помощью которых продвинутые пользователи могут создавать решения под себя, например, генерировать изображения, анализировать компьютерные коды, решать инженерные и научные задачи и так далее.
По сути, так же работает и тот GPT, который мы знаем. Вы, вероятно, обращались за помощью к GPT, но где вы её нашли? Явно не сами скачали, а, например, в телеграме или на каком-то сайте. Это значит, что кто-то купил доступ к основной системе, адаптировал её и теперь предлагает воспользоваться рядовым пользователям. Его интерес, как правило, реклама, которая вставляется в тг-канал или на сайт, или авторские права на созданные ИИ изображения-тексты.
Отзывов от российских пользователей пока немного, но на Западе новинка получила положительные отклики.
Выход DeepSeek привлек внимание президента США: Дональд Трамп отметил, что мировая конкуренция усиливается, и американским компаниям необходимо активизироваться, чтобы опередить соперников.
Команда Трампа рассматривает ИИ-технологии очень серьезно. Они понимают: тот, кто владеет мощным ИИ, контролирует современный мир. ИИ в руках противника раскрывает все твои секреты, как на ладони. Не говоря уже о том, что мощный ИИ может быстро разрабатывать новые лекарства, технологии и оружие.
Что может сделать Америка? Эксперты согласны с тем, что американские компании оказались не в самой лучшей ситуации. Во-первых, они были первопроходцами и потратили кучу денег на то, что сейчас кажется «очевидным». Это похоже на ситуацию с сотовой связью: первые телефоны и тарифы были дорогими. Во-вторых, крупные компании уже обросли жирком и потеряли темп. Огромные расходы на зарплаты и необязательные проекты, приоритет управленцев над инженерами – все как всегда.
Сможет ли Запад собрать команду молодых, амбициозных стартаперов и вступить в гонку с новыми силами? Скорее всего, да, но им придется пройти через кризис.
Так или иначе, 2025 год действительно становится годом ИИ, но не только потому, что Open AI выпускает какую-то потрясающую нейросеть. Все гораздо интереснее.