Конкуренция нейросетей

Как я уже написал в материале «Искусственный интеллект эволюционировал» — конкуренция нейросетей пока идет не за самого пользователя, а скорее за качество нейросети на «бумаге», то есть за цифры в бенчмарках по итогам исследований.
Причина этого очевидна — фирмы зарабатывают не на услугах своих нейросетей, а на биржевом хайпе вокруг них. Рост акций на бирже важнее, чем реальная польза от технологии.
Это приводит к совершенно анекдотическим результатам. Те же Сбер и Яндекс всё так же дрочат на свои «голосовые ассистенты», которые ничего осмысленнее «Алиса, включи мне пейсню кэрелес виспер» делать не умеют. Качество рисования картинок «Кандинским» — хреновое, а YandexART (Шедеврум) так задушен ограничениями, что им практически невозможно пользоваться. Шедеврум даже карикатуру на Байдена нарисовать не в состоянии, ахахаха.
Я уже приводил пример запроса к YandexART — «Американцы вышли на демонстрацию 1 мая», результат:
Тот же самый запрос к seaart.ai (фактически картинку рисует немецкая нейросеть Flux.1 Dev — кстати, её вместе с базой знаний можно загрузить себе на локальный компьютер, это открытый проект):
Я думаю, ситуация вполне очевидна. Сколько денег было потрачено на разработку YandexART? А она работает хуже, чем доступная совершенно бесплатно Flux.1 Dev. Но про гогносеть Яндекса все знают, а что вы слышали про Flux 1? Полагаю, что ничего. Потому что немцы работают над продуктом — а Яндекс работает над раздуванием «около-ИИ» хайпа (как, впрочем, и все остальные «занимающиеся ИИ» компании, что у вас на слуху). Даже китайцы со своим DeepSeek во многом хайпожоры — ведь на самом деле они делают деньги на биржевой игре (да-да — DeepSeek прямо разработан хедж-фондом High-Flyer, занимающимся биржевыми спекуляциями).
При этом еще в 2006 году правительство Китая запустило национальную программу развития искусственного интеллекта. Но я более чем уверен, что вы ничего об этом не знаете — хотя успехи китайцев велики. Что вы знаете о нейросетях PanGu-Coder 2 от Huawei, iFlyCode от iFlytek Corporation, CodeWave от NetEase? Между тем это ИИ-системы генерации программного кода, которые широко используются китайскими разработчиками софта.
Известны ли вам системы генерации изображений ERNIE-ViLG от Baidu или Tongyi Wanxiang от Alibaba Group? Думаю, что вы про них даже не слышали — а ведь они существуют и развиваются еще с 2022 года.
Что вы знаете про Baichuan, Zhipu AI, Moonshot AI и MiniMax? Ничего? Я так и думал. А это самые крутые разработчики AI в Китае в 2024 году. Что вы знаете про мультимодальную нейросеть Zidong Taichu 2.0 от Института автоматизации Китайской академии наук? Тоже ничего? Понятненько.
Это происходит потому, что мы живем в информационном пузыре. 99% населения не знает ничего за пределами хайпа, разгоняемого в СМИ. High-Flyer разогнал хайп вокруг своего DeepSeek — ок, мы это услышали. До этого хайп разгонялся вокруг Stable Diffusion и сетей GPT от OpenAI. Биржевые спекулянты сделали состояния на дураках, поведшихся на этот хайп — но реальных технических достижений там не слишком много.
До сих пор неясно, как делать деньги на нейросетях вне пределов биржевых спекуляций. Но китайцы работают над этим.
Недавно стало известно, что текущая итерация PanGu-Coder2 от Хуавея заткнула за пояс все существующие модели ИИ-генераторов программного кода. В 62.20% случаев модель генерирует правильно работающий код (программу на языке программирования) по описанию задачи с первой же попытки (довольно очевидно, что человек так не умеет). После 10 проходов (генерируется 10 вариантов кода, затем анализатор отбрасывает «неудачные») качество кода (процент правильно работающих программ) поднимается почти до 80%, после 100 проходов — до 92%.
Что вы об этом знаете? Идиотский вопрос — вам даже негде про это прочитать на русском языке, кроме нашего сайта, хе-хе. Хайпожорам из СМИ это не интересно, за это же никто не платит.
А я это взял вот отсюда — zhuanlan.zhihu.com/p/548457445
Аналитики из СМИ не умеют в пиньин и мандарин, ахахаха. Даже при том, что отчет о тестировании модели Хуавея вообще-то на английском — до него еще надо добраться через иероглифы. А это, как вы понимаете, «аналитикам из СМИ» нахрен не надо — они обслуживают хайп.
PS. Китайцы понятно почему лидируют незаметно. Знаете, как Хуавей обучал свой PanGu-Coder2? Они сгенерировали огромное количество заданий на разработку кода — и слили их студентам. Студенты писали свои варианты кода и отправляли Хуавею. Всего после валидации было отобрано 15 миллиардов примеров кода — заметьте, связанных с формально поставленными задачами
и верифицированных на правильность работы. Затем на этой базе обучили нейросеть.
Студенты за свой труд получили какую-то копеечку, наиболее крутые получат работу в Хуавее. В целом это обошлось для Хуавея в сущие копейки. А теперь внимание, вопрос: кто еще (кроме индусов) сможет пройти по такому пути?
Да, вы всё правильно поняли — «обучение AI на Гитхабе» страдает тем, что там слишком много гогнокода, который не работоспособен в принципе, и который при этом не формализован с заданием. Из этого источника уже выжато всё, что можно. А генерить код для обучения по «китайскому методу» может себе позволить только 1.5-миллиардный Китай (ну и Индия). В 300-миллионных США же основные массы населения в школе учатся складывать 2+2 на калькуляторе, а в институте учатся управлять бизнесом, искать прецеденты в уголовных делах да разбираться в полутора сотнях гендеров — на программистов там учатся те же китайцы да индусы, и их уже немного — ибо не у кого и нечему в США учиться.
Вот так вот. И никакие ограничения поставок чипов от Нвидии в Китай — США уже не спасут.
А для позитива — вот вам немножко расовых аппроприаций от немецкого ИИ Flux.1 Dev:
Пусть вам станет немного теплее среди этой беспощадной весенней сырости.
Игорь Ашманов пишет, что подобные успехи невозможны в частном порядке. За всеми такими разработками стоит как правило государство.
Только мне кажется, что у нас подобная инициатива выльется в новое роснано.
пы.сы. Прочитал забавную заметку про то как эволюционировал ИИ. Нейросети предложили сыграть в шахматы со специализированным компом. Просчитав варианты, нейросеть сделала вывод, что победить не удастся и предложила подправить програмщину у шахматного компьютера.
ИИ научился мухлевать. То ли прятаться, то ли смеяться…