bhide11_Anthony KwanGettyImages_deepseek Anthony Kwan/Getty Images

Ist DeepSeek wirklich eine Bedrohung?

CAMBRIDGE – Thomas Edison, der autodidaktische Telegrafist, der zum Unternehmer wurde, wird oft als der größte Erfinder aller Zeiten bezeichnet, wohingegen Nikola Tesla, der für ein Unternehmen von Edison in Paris arbeitete, bevor er in die USA auswanderte, kaum noch in Erinnerung ist – außer durch das Elektrofahrzeug-Unternehmen von Elon Musk. Dabei war es Teslas Durchbruch mit Wechselstrom (AC) und nicht Edisons Gleichstromtechnologie (DC), der die Elektrifizierung für die breite Masse erschwinglich machte. Die unerschwinglichen Kosten des Gleichstroms hätten Edisons städtische Elektrifizierung zu einem Spielzeug der Reichen gemacht, wie viele seiner anderen Erfindungen.

Könnten die DeepSeek-KI-Modelle des chinesischen Investors Liang Wenfeng einen ähnlichen Durchbruch in der KI darstellen, oder sind sie ein Schwindel wie die kalte Fusion und die Supraleitung bei Raumtemperatur? Und wenn sie einen Durchbruch darstellen, sollten die USA sie als tödliche Bedrohung oder als Geschenk an die Welt betrachten?

Wie viele transformative Technologien hat sich auch die KI über viele Jahrzehnte hinweg entwickelt, bevor die Veröffentlichung von ChatGPT durch OpenAI Ende 2022 den aktuellen Hype auslöste. Bessere Algorithmen, ergänzende Geräte wie Mobiltelefone und billigere, leistungsfähigere Cloud-Computing-Systeme hatten zwar zu einer weit verbreiteten Nutzung dieser Technologie geführt, die jedoch kaum wahrgenommen wurde. Versuch und Irrtum hatten gezeigt, wo KI die menschliche Leistung und das menschliche Urteilsvermögen übertreffen konnte und wo nicht.

Die magische Gewandtheit von ChatGPT und anderen großen Sprachmodellen (Large Language Models, LLMs) schuf die Illusion, dass es sich bei der generativen KI um einen brandneuen Durchbruch handelte. ChatGPT hatte innerhalb von fünf Tagen nach seiner Veröffentlichung eine Million Nutzer und zwei Jahre später 300 Millionen wöchentliche Nutzer. Hightech-Giganten wie Microsoft, Meta und Alphabet setzten Milliarden auf KI-Produkte und Datenzentren und vergaßen schnell ihre frühere Begeisterung für virtuelle und erweiterte Realität.

Im Jahr 2024 wurde Nvidia, das 2 Mrd. US-Dollar in seinen KI-Chip Blackwellinvestiert hatte, zum wertvollsten Unternehmen der Welt, dessen Marktkapitalisierung sich innerhalb von zwei Jahren verneunfachte. Der Chef des Unternehmens, Jensen Huang, prognostizierte, dass in den nächsten Jahren 1 Billion US-Dollar in Datenzentren investiert würden, die solche Chips verwenden. All dies lässt Apples vorsichtige und abwartende Haltung gegenüber KI geradezu altmodisch erscheinen.

Dabei spielt es keine Rolle, dass die neue KI den Endnutzern keinen Wert bot, der auch nur annähernd den enormen Investitionen entsprach (ganz zu schweigen von ihrem unersättlichen Energiebedarf). Die Investitionen stiegen weiter in der Annahme, dass die Kosten der KI durch überdimensionierte Datenzentren sinken und die Modelle durch die zunehmende Nutzung intelligenter werden würden.

Secure your copy of PS Quarterly: The Year Ahead 2025
PS_YA25-Onsite_1333x1000

Secure your copy of PS Quarterly: The Year Ahead 2025

Our annual flagship magazine, PS Quarterly: The Year Ahead 2025, has arrived. To gain digital access to all of the magazine’s content, and receive your print copy, subscribe to PS Digital Plus now.

Subscribe Now

Aber unter ihrer glänzenden neuen Haube verwenden LLMs, wie viele Jahrzehnte alte KI-Modelle, immer noch Mustererkennung und statistische Vorhersagen, um ihre Ergebnisse zu produzieren, was bedeutet, dass ihre Zuverlässigkeit darauf beruht, dass die Zukunft so ist wie die Vergangenheit. Das ist eine bedeutende Einschränkung. Menschen können historische Fakten fantasievoll interpretieren, um vorherzusagen, was in der Zukunft anders sein könnte, und sie können ihre Vorhersagen auch verbessern, indem sie fantasievoll miteinander diskutierenn. KI-Algorithmen vermögen dies nicht.

Dieser Fehler ist jedoch nicht fatal. Da naturgesetzliche Prozesse gewöhnlich stabil sind, gleicht die Zukunft in vielerlei Hinsicht der Vergangenheit. Ist das Feedback eindeutig, können KI-Modelle durch Training zuverlässiger gemacht werden, und selbst wenn der zugrunde liegende Prozess instabil oder das Feedback mehrdeutig ist, können statistische Vorhersagen kostengünstiger sein als menschliches Urteilsvermögen. Völlig unpassende Anzeigen, die von den Algorithmen von Google oder Meta geliefert werden, sind immer noch besser als blinde Werbung. Das Diktieren von Texten in ein Mobiltelefon kann zwar zu Fehlern führen, ist aber immer noch schneller und bequemer als das Tippen auf einem kleinen Bildschirm.

Bis 2022 hatten findige Innovatoren zahllose Fälle entdeckt, in denen statistisch basierte KI gut genug oder besser war als Alternativen, die sich auf menschliches Urteilsvermögen stützten. Mit der Verbesserung der Computerhardware und -software würden die kosteneffizienten Anwendungsfälle zwangsläufig zunehmen. Es war jedoch eine Illusion zu glauben, dass LLMs einen großen Sprung nach vorne bedeuten würden, nur weil sie sich wie Menschen unterhalten können. Nach meiner persönlichen Erfahrung waren LLM-Anwendungen für die Recherche, die Erstellung von Zusammenfassungen oder die Anfertigung von Grafiken mehr als unbrauchbar.

Dennoch haben Berichte über die Fähigkeiten von DeepSeek Schockwellen durch die Finanzmärkte geschickt. DeepSeek behauptet, eine KI-Leistung auf dem Niveau von OpenAI und Google erreicht zu haben, allerdings mit Low-End-Chips von Nvidia und zu einem Bruchteil der Trainings- und Betriebskosten. Sollte sich dies bestätigen, wird die Nachfrage nach High-End-KI-Chips geringer ausfallen als erwartet. Aus diesem Grund hat die DeepSeek-Meldung die Marktkapitalisierung von Nvidia an einem einzigen Tag um etwa 600 Mrd. US-Dollar verringert und auch die Aktien anderer Halbleiterunternehmen und Firmen, die in Datenzentren investiert haben oder Strom an diese Zentren verkaufen, unter Druck gesetzt.

Die Behauptungen von DeepSeek könnten sich jedoch als falsch erweisen. Viele von Teslas Behauptungen über seine Erfindungen nach dem Durchbruch des Wechselstroms waren stark übertrieben oder sogar betrügerisch, und die sowjetische Propagandamaschinerie fabrizierte routinemäßig wissenschaftliche und technologische Durchbrüche neben echten Fortschritten. Aber sparsame, unkonventionelle Innovationen können transformativ sein. Man denke nur an Musks kostengünstige wiederverwendbare Raketen. Die erfolgreiche indische Mars-Mission kostete nur 73 Mrd. US-Dollar, weniger als das Budget des Hollywood-Science-Fiction-Films Gravity.

Wenn sich die Technologie von DeepSeek bewährt, könnte sie für die LLMs das sein, was Teslas AC-Erfindungen für die Elektrifizierung waren. Auch wenn sie die unvermeidlichen Einschränkungen rückwärtsgewandter statistischer Modelle nicht überwinden kann, könnte sie ihr Preis-Leistungs-Verhältnis für eine breitere Anwendung attraktiv genug machen. Diejenigen, die LLM-Modelle entwickeln, werden nicht länger auf Subventionen von großen Betreibern angewiesen sein, die ein Interesse daran haben, sie an sich zu binden. Weniger ressourcenintensive Modelle könnten die Nachfrage nach Rechenzentren verringern oder dazu beitragen, deren Kapazitäten für wirtschaftlich tragfähigere Zwecke zu nutzen.

Und die Geopolitik? Im vergangenen Frühjahr forderte ein Bericht der überparteilichen KI-Arbeitsgruppe des Senats jährliche „Notausgaben“ in Höhe von 32 Mrd. US-Dollar für KI außerhalb des Verteidigungssektors, angeblich um besser mit China konkurrieren zu können. Der Risikokapitalgeber Marc Andreessen bezeichnete den Start von DeepSeek als „Sputnik-Moment der KI“. US-Präsident Donald Trump sieht das chinesische KI-Modell als „Weckruf für die US-Industrie“, sich „auf den Wettbewerb zu konzentrieren, um zu gewinnen“. Er hat angekündigt, neue Zölle auf Halbleiterimporte aus China zu erheben, und sein Vorgänger hatte Exportkontrollen für hochwertige KI-Chips eingeführt.

In meinem Buch The Venturesome Economy argumentiere ich, dass es ein Irrtum ist, bahnbrechende Fortschritte im Ausland als Bedrohung für den Wohlstand im eigenen Land zu betrachten. Das blinde Streben nach technologischer oder wissenschaftlicher Führerschaft ist ein törichtes Unterfangen. Was zählt, ist die Bereitschaft und Fähigkeit von Unternehmen und Verbrauchern, Produkte und Technologien zu entwickeln und zu nutzen, die aus der Spitzenforschung hervorgehen, egal woher sie kommen. Dies gilt auch für die Open-Source-KI-Modelle von DeepSeek.

Natürlich müssen wir die bedrohliche militärische Nutzung westlicher Spitzentechnologien durch feindliche Regime kontrollieren. Aber das ist eine andere und schwierige Herausforderung. Wäre es möglich, sie durch Exportkontrollen zu lösen, müssten wir uns längst keine Sorgen mehr über nordkoreanische oder iranische Atomwaffen machen.

Deutsch von Andreas Hubig

https://prosyn.org/C46PAyXde