bhide11_Anthony KwanGettyImages_deepseek Anthony Kwan/Getty Images

A DeepSeek é realmente uma ameaça?

CAMBRIDGE – Thomas Edison, o operador de telégrafo autodidata que se tornou empresário, é muitas vezes considerado o maior inventor de todos os tempos, enquanto Nikola Tesla, que trabalhou para uma empresa do grupo Edison em Paris antes de emigrar para os Estados Unidos, é pouco recordado, exceto através da empresa de veículos elétricos de Elon Musk. No entanto, foi o avanço de Tesla com a corrente alternada (CA), e não a tecnologia de corrente contínua (CC) de Edison, que tornou a eletrificação em massa acessível. Os custos proibitivos da corrente contínua teriam mantido a eletrificação urbana de Edison na categoria de brinquedos dos ricos, tal como muitas das suas outras invenções.

Poderão os modelos de IA da empresa DeepSeek, do investidor chinês Liang Wenfeng, representar um avanço semelhante na IA, ou serão fraudes como a fusão a frio e a supercondutividade à temperatura ambiente? E se isso se confirmar, deverão os EUA tratá-los como uma ameaça mortal ou como uma dádiva para o mundo?

À semelhança de muitas tecnologias transformadoras, a IA evoluiu ao longo de muitas décadas antes de o lançamento do ChatGPT pela empresa OpenAI, no final de 2022, ter desencadeado a atual euforia. Melhores algoritmos, dispositivos complementares como os telemóveis e uma computação em nuvem mais barata e mais potente tornaram a utilização da tecnologia generalizada, mas pouco notada. A tentativa e o erro mostraram onde a IA podia ou não superar o esforço e o discernimento humanos.

A magia do ChatGPT e de outros grandes modelos de linguagem (LLM, na sigla em inglês) criou a ilusão de que a IA generativa era uma descoberta totalmente nova. O ChatGPT teve um milhão de utilizadores nos cinco dias seguintes ao seu lançamento e 300 milhões de utilizadores semanais dois anos depois. Os gigantes da alta tecnologia como a Microsoft, a Meta e a Alphabet apostaram milhares de milhões de dólares em produtos de IA e centros de dados, esquecendo rapidamente o seu entusiasmo anterior pela realidade virtual e aumentada.

Em 2024, a Nvidia, que tinha investido 2 mil milhões de dólares no seu chip de IA Blackwell, tornou-se a empresa mais valiosa do mundo, tendo a sua capitalização bolsista aumentado nove vezes em dois anos. O seu presidente-executivo, Jensen Huang, estimou que, nos próximos anos, serão investidos 1 bilião de dólares em centros de dados que utilizem esses chips. Tudo isto fez com que a abordagem cautelosa e de “esperar para ver” da Apple em relação à IA parecesse estranhamente antiquada.

Não importava que a nova IA não proporcionasse aos utilizadores finais um valor remotamente proporcional ao monumental investimento (para não falar da sua insaciável procura de eletricidade). Os investimentos continuaram a crescer sob o pressuposto de que os centros de dados em hiperescala reduziriam os custos da IA e que o aumento da utilização tornaria os modelos mais inteligentes.

Winter Sale: Save 40% on a new PS subscription
PS_Sales_Winter_1333x1000 AI

Winter Sale: Save 40% on a new PS subscription

At a time of escalating global turmoil, there is an urgent need for incisive, informed analysis of the issues and questions driving the news – just what PS has always provided.

Subscribe to Digital or Digital Plus now to secure your discount.

Subscribe Now

Mas, por baixo das suas novas coberturas brilhantes, os LLM, tal como muitos dos modelos de IA com décadas de existência, continuam a utilizar o reconhecimento de padrões e as previsões estatísticas para produzir os seus resultados, o que significa que a sua fiabilidade assenta no facto de o futuro ser idêntico ao passado. Esta é uma limitação importante. Os seres humanos podem interpretar de forma imaginária as provas históricas para antecipar o que poderá acontecer de diferente no futuro; podem também melhorar as suas previsões através de um discurso criativo entre si. Os algoritmos de IA não conseguem.

Mas esta falha não é fatal. Uma vez que os processos que obedecem às leis da natureza são naturalmente estáveis, o futuro é como o passado em muitos aspetos. Propensos a fornecer respostas inequívocas, os modelos de IA podem tornar-se mais fiáveis através do treino e, mesmo que o processo subjacente seja instável – ou as respostas sejam ambíguas – as previsões estatísticas podem ser mais rentáveis do que o julgamento humano. Os anúncios que não se enquadram nos padrões de qualidade apresentados pelos algoritmos da Google ou da Meta continuam a ser superiores à publicidade às cegas. Ditar textos para um telemóvel pode produzir erros, mas continua a ser mais rápido e mais conveniente do que “debicar” com os dedos num pequeno ecrã.

Em 2022, inovadores engenhosos descobriram inúmeros casos em que a IA baseada em estatísticas era suficientemente boa ou melhor do que as alternativas que dependiam do julgamento humano. À medida que o hardware e o software dos computadores melhoravam, os casos de utilização rentáveis não deixariam de se expandir. Mas era ilusório pensar que os LLM constituíam um grande avanço pelo simples facto de poderem conversar como os humanos. Na minha experiência pessoal, as aplicações LLM têm sido mais do que inúteis para fazer investigação, produzir resumos ou gerar gráficos.

No entanto, as notícias sobre as proezas do LLM da DeepSeek provocaram ondas de choque nos mercados financeiros. A DeepSeek afirma ter alcançado um desempenho de IA com a qualidade da OpenAI e da Google utilizando apenas chips da Nvidia de gama baixa e com uma fração dos custos de preparação e de funcionamento. A ser verdade, a procura de chips de IA topo de gama será menor do que o previsto. É por isso que as notícias da DeepSeek apagaram cerca de 600 mil milhões de dólares da capitalização bolsista da Nvidia num único dia, além de terem afetado as ações de outras empresas de semicondutores e de empresas que investiram em centros de dados ou que vendem eletricidade a esses centros.

É certo que as afirmações da DeepSeek podem vir a revelar-se inexatas. Muitas das afirmações de Tesla sobre as suas invenções após a sua descoberta da CA foram extremamente exageradas, até mesmo fraudulentas, e a máquina de propaganda soviética fabricava rotineiramente descobertas científicas e tecnológicas juntamente com avanços reais. Mas as inovações frugais e inovadoras podem ser transformadoras. Basta olhar para os foguetões reutilizáveis de baixo custo de Musk. A bem-sucedida missão da Índia a Marte custou apenas 73 milhões de dólares, menos do que o orçamento do filme de ficção científica de Hollywood Gravidade.

Se for confirmada, a tecnologia da DeepSeek poderá ser para os LLM o que as invenções de Tesla foram para a eletrificação. Embora não consiga superar as inevitáveis limitações dos modelos estatísticos retrospetivos, poderá tornar o seu desempenho em termos de preço suficientemente bom para uma utilização mais alargada. Quem desenvolve modelos LLM deixará de ter de depender de subsídios concedidos por grandes operadores com interesse em mantê-los no mercado. Os modelos menos exigentes no que diz respeito a recursos poderão reduzir a procura de centros de dados ou ajudar a direcionar a sua capacidade para utilizações economicamente mais justificáveis.

E em relação à geopolítica? Na primavera passada, um relatório do Bipartisan Senate AI Working Group exigia 32 mil milhões de dólares em despesas anuais de “emergência” em IA não relacionada com a defesa, supostamente para competir melhor com a China. O capitalista de risco Marc Andreessen descreveu a chegada da tecnologia da DeepSeek como “o momento Sputnik da IA”. O presidente dos EUA, Donald Trump, considera que o modelo chinês de IA é um “alerta para as indústrias norte-americanas”, que devem estar “concentradas em competir para ganhar”. Ele anunciou planos para impor novas tarifas sobre as importações de semicondutores da China, e o seu antecessor impôs controlos na exportação de chips de IA de ponta.

No meu livro The Venturesome Economy, argumentei que ver os avanços transformacionais no estrangeiro como uma ameaça ao bem-estar nacional é incorreto. Perseguir cegamente a liderança tecnológica ou científica é um empreendimento insensato. O que mais importa é a vontade e a capacidade das empresas e dos consumidores para desenvolver e utilizar produtos e tecnologias resultantes de investigação avançada, independentemente da sua origem. Isto também se aplica aos modelos de IA de código aberto da DeepSeek.

É claro que temos de controlar as ameaçadoras utilizações militares de tecnologias de ponta ocidentaisa por parte de regimes hostis. Mas este é um desafio diferente e difícil. Se fosse possível resolvê-lo através do controlo das exportações, já teríamos deixado de nos preocupar com as armas nucleares norte-coreanas ou iranianas há muito tempo.

https://prosyn.org/C46PAyXpt