bhide11_Anthony KwanGettyImages_deepseek Anthony Kwan/Getty Images

DeepSeek - это реальная угроза?

КЕМБРИДЖ (США) – Томаса Эдисона, телеграфиста-самоучку, ставшего предпринимателем, часто называют величайшим изобретателем всех времен, а о Николе Тесле, до эмиграции в Америку работавшем в компании Эдисона в Париже, мало кто вспоминает (разве что из-за компании электромобилей Илона Маска). Но именно прорывное изобретение Теслой технологии переменного тока, а не технология постоянного тока Эдисона, сделало финансово доступной массовую электрификацию. Из-за запретительно высокой цены технологии постоянного тока городская электрификация Эдисона оставалась бы игрушкой для богатых – как и многие другие его изобретения.

Могут ли модели искусственного интеллекта (ИИ) DeepSeek китайского инвестора Лян Вэньфэна привести к аналогичному прорыву в сфере ИИ, или же это шарлатанство – такое же, как холодный термоядерный синтез или сверхпроводимость при комнатной температуре? И если подтвердится первое, должна ли Америка считать DeepSeek смертельной угрозой или подарком миру?

Как и многие другие революционные технологии, ИИ эволюционировал несколько десятилетий, прежде чем в конце 2022 года компания OpenAI выпустила ChatGPT, спровоцировав нынешний бум. Благодаря совершенствованию алгоритмов и дополнительных устройства, включая мобильные телефоны, а также удешевлению и увеличению мощности облачных вычислений эта технология стала использоваться повсеместно, но малозаметно. Методом проб и ошибок выяснялось, где ИИ может, а где не может превзойти работу и суждения человека.

Волшебная словесная бойкость ChatGPT и других больших языковых моделей (сокращённо LLM) создавала иллюзию, будто генеративный ИИ – это новый прорыв. Через пять дней после начала работы у ChatGPT уже был миллион пользователей, а через два года – 300 млн еженедельных пользователей. Гиганты высоких технологий, включая компании Microsoft, Meta и Alphabet, сделали многомиллиардную ставку на ИИ-продукты и дата-центры, быстро позабыв о своём предыдущем увлечении – виртуальной и дополненной реальности.

В 2024 году Nvidia, вложившая $2 млрд в разработку ИИ-чипа Blackwell, стала самой дорогой компанией в мире: за два года её рыночная капитализация увеличилась в девять раз. Глава компании Дженсен Хуан прогнозировал, что в дата-центры, использующие такие чипы, в ближайшие годы будет инвестирован $1 трлн. На этом фоне осторожные, выжидательные подходы к ИИ в компании Apple выглядели поразительно старомодными.

Мало кого интересовало, что новый ИИ не приносил конечным пользователям стоимость, размеры которой были бы хотя бы отдалённо соразмерны этим огромным инвестициям (не говоря уже о ненасытном спросе ИИ на электричество). Инвестиции продолжали увеличиваться, потому что предполагалось, что огромные дата-центры помогут снизить себестоимость ИИ, а благодаря активному использованию модели поумнеют.

Secure your copy of PS Quarterly: The Year Ahead 2025
PS_YA25-Onsite_1333x1000

Secure your copy of PS Quarterly: The Year Ahead 2025

Our annual flagship magazine, PS Quarterly: The Year Ahead 2025, has arrived. To gain digital access to all of the magazine’s content, and receive your print copy, subscribe to PS Digital Plus now.

Subscribe Now

Но скрываясь под новой дивной оболочкой, модели LLM, подобно многим другим ИИ-моделям, созданным десятилетия назад, по-прежнему используют технологию выявления тенденций и статистического прогнозирования для выдачи ответов. Это означает, что их надёжность зависит от будущего, похожего на прошлое, а это важный недостаток. Люди могут использовать воображение при интерпретации исторических фактов, чтобы предвидеть, что может произойти в будущем иначе; и они могут улучшить качество прогноза, ведя креативные беседы между собой. ИИ-алгоритмы на это неспособны.

Впрочем, этот недостаток не фатален. Процессы, подчиняющиеся законам природы, естественным образом стабильны, поэтому будущее во многом оказывается похожим на прошлое. В однозначных ситуациях можно повысить надёжность ИИ-моделей с помощью обучения, и даже если базовый процесс нестабилен (или информация неоднозначна), статистическое прогнозирование может оказаться эффективней человеческих суждений. Реклама, которую подбирают алгоритмы Google или Meta, часто выглядит дико не актуальной, но это в любом случае лучше рекламы «вслепую». Диктуя фразы в мобильный телефон, можно получить текст с грубейшими ошибками, но это всё равно быстрее и удобнее, чем набирать его на маленьком экране.

К 2022 году обеспеченные ресурсами инноваторы выявили множество ситуаций, когда ИИ со статистическим анализом был достаточно хорош или даже лучше альтернатив, опирающихся на человеческое суждение. По мере совершенствования компьютерной техники и программного обеспечения рентабельные варианты использования ИИ расширялись. Но будет заблуждением считать модели LLM огромным скачком вперёд лишь потому, что они способны говорить как люди. По моему личному опыту, LLM-приложения хуже, чем просто бесполезны, для проведения исследований, составления конспектов, генерации графики.

И всё же сообщения о достоинствах DeepSeek потрясли финансовые рынки. Компания утверждает, что добилась производительности ИИ на уровне OpenAI и Google, используя лишь чипы Nvidia низкого класса и затратив гораздо меньше средств на обучение и техподдержку. Если это правда, тогда спрос на ИИ-чипы высокого класса окажется ниже ожидавшегося. Именно поэтому новость о DeepSeek за один день уменьшила рыночную капитализацию Nvidia примерно на $600 млрд и мощно ударила по акциям других компаний, которые выпускают полупроводники, инвестируют в дата-центры или продают им электричество.

Да, утверждения DeepSeek могут оказаться неверными. Многие заявления Теслы о его изобретениях после прорыва с переменным током были сильным преувеличением (или даже мошенничеством), а пропагандистская машина СССР регулярно сообщала о выдуманных научно-технических прорывах, наряду с реальными достижениями. Но недорогие и нестандартные инновации могут быть революционными. Взгляните на низкозатратные многоразовые ракеты Маска. Или успешную миссию Индии на Марс, которая обошлась всего в $73 млн, что меньше бюджета голливудского фантастического фильма «Гравитация».

Если заявления DeepSeek подтвердятся, эта технология может стать для LLM-моделей тем же, чем стало изобретение Теслой переменного тока для электрификации. Хотя она не сможет преодолеть неизбежную ограниченность статистических моделей, которые ориентированы на прошлое, она может улучшить их ценовые характеристики, открыв путь для широкого использования. Разработчикам LLM-моделей больше не придётся зависеть от субсидий крупных операторов, заинтересованных в закреплении своего контроля. Менее ресурсоёмкие модели позволят снизить спрос на дата-центры или перенаправить их мощности на экономически более оправданные цели.

А как же геополитика? Весной прошлого года двухпартийная Рабочая группа Сената США по вопросам искусственного интеллекта опубликовала доклад, призвав ежегодно выделять $32 млрд на «чрезвычайные» расходы, связанные с невоенным искусственным интеллектом: чтобы лучше конкурировать с Китаем. Венчурный капиталист Марк Андреессен сравнил появление DeepSeek с запуском первого «Спутника». Президент США Дональд Трамп назвал китайскую ИИ-модель «тревожным звонком для американской экономики», которая должна «полностью сосредоточиться на победе в этой конкурентной борьбе». Он объявил о планах ввести новые пошлины на импорт полупроводников из Китая, в то время как его предшественник ввёл контроль за экспортом ИИ-чипов высокого класса.

В книге «Венчурная экономика» я писал, что технические успехи за рубежом нельзя считать угрозой внутреннему благополучию. Слепое стремление к технологическому или научному лидерству – глупая затея. Главным является готовность и способность бизнеса и потребителей разрабатывать и использовать продукты и технологии, появляющиеся благодаря передовым исследованиям, и не важно откуда они появляются. Это относится и к ИИ-моделям DeepSeek с их открытым кодом.

Да, нам надо контролировать опасное использование передовых западных технологий враждебными режимами в военных целях. Но это другая, сложная задача. Если бы её можно было решить с помощью экспортного контроля, мы бы уже давно не беспокоились о ядерном оружии в Северной Корее или Иране.

https://prosyn.org/C46PAyXru