DeepSeek macht seit dem Wechsel zum Jahr der Schlange (24.01.2025) Schlagzeilen und die Finanzmärkte reagieren heftig und unterschiedlich. Gleichzeitig finden Diskussionen über Datenschutz, geistiges Eigentum und geopolitische Spannungen statt. Wir möchten jedoch einen Schritt von diesen allgemeinen Debatten zurücktreten und uns auf die technischen Fortschritte bei den Modellen von DeepSeek und ihre potenziellen Auswirkungen auf den Software-Sektor konzentrieren.
Welche Innovationen hat DeepSeek entwickelt?
Das Künstliche-Intelligenz-Modell (KI) von DeepSeek basiert auf der Transformer-Architektur, enthält jedoch zahlreiche Optimierungen in Design und Technik zur Verbesserung der Effizienz. Anstatt völlig neue Methoden einzuführen, kombiniert DeepSeek bestehende Innovationen und greift praktische Herausforderungen auf, wie etwa begrenzte Rechenleistung, um einen Ausgleich zwischen theoretischen Fortschritten und starker technischer Ausführung zu schaffen.
Insbesondere glauben wir, dass die DeepSeek-Modelle DeepSeek V3 und DeepSeek R1 Zero zwei entscheidende Durchbrüche darstellen:
Mixture of Experts (MoE) mit hilfsverlustfreier Strategie: DeepSeek V3 unterteilt das Modell in mehrere „Experten“-Module, um die Rechenlast effizient zu verteilen. Während des Trainings laufen die verschiedenen Experten auf unterschiedlichen GPUs, was die Effizienz erhöht. Während der Inferenz werden nur 37 Milliarden aktive Parameter pro Token anstelle der vollen 671 Milliarden verwendet. Dadurch sinken die Rechenkosten erheblich. Eine häufige Herausforderung bei MoE ist das Ungleichgewicht der Workloads zwischen den Expertenmodulen. DeepSeek begegnet diesem Problem mit relevanzbasiertem Routing anstelle von Hilfsverlustfunktionen, was sicherstellt, dass alle Token während des Trainings und der Inferenz erhalten bleiben.
Reinforcement Learning ohne menschliches Feedback: DeepSeek R1 Zero ist ein Reasoning-Modell wie GPT-o1 und zeigt, dass reines Reinforcement Learning (RL) logische Fähigkeiten entwickeln kann, ohne auf Reinforcement Learning mit menschlichem Feedback (Reinforcement Learning from Human Feedback, RLHF) angewiesen zu sein. Die meisten großen Sprachmodelle (Large Language Models, LLM) beziehen menschliches Kennzeichnen und Feedback durch überwachte Feinabstimmung (Supervised Fine-Tuning, SFT) und RLHF ein. Doch DeepSeek R1 Zero ersetzt SFT1 und RLHF durch reines RL ohne menschliches Feedback.
Traditionelles RL ist mit hohen Rechenkosten verbunden und lässt sich nur begrenzt auf verschiedene Aufgaben skalieren. Durch die Einführung einer innovativen Methode namens Group Relative Policy Optimisation (GRPO) geht DeepSeek R1 Zero auf diese Herausforderungen ein. Darüber hinaus zeigen die Fortschritte von DeepSeek, dass eine reine RL-Methode eine Alternative zur kontinuierlichen Verbesserung von KI-Modellen sein könnte, da die qualitativ hochwertigen, von Menschen generierten Daten endlich sind und irgendwann erschöpft sein könnten. Das erhöht die Nachhaltigkeit von Verbesserungen der Modellfähigkeiten.
Die Auswirkungen auf Software-Unternehmen
Seit der Einführung von ChatGPT haben Software-Anleger mit einer wichtigen Frage gerungen: Wie viel Wert bringt KI für SaaS-Unternehmen? Die Entwicklungen von KI weckten Bedenken über die Nachhaltigkeit des Software-Wachstums – insbesondere darüber, ob KI irgendwann herkömmliche Software ersetzen könnte. Darüber hinaus entstehen durch die Integration von KI-Modellen in SaaS-Angebote neue Nutzungskosten, die Fragen über möglichen Margendruck aufkommen lassen. Neuere Entwicklungen deuten jedoch auf günstigere Aussichten hin, die einige dieser Bedenken ausräumen.
Ein wichtiger Motor für diesen Wandel ist DeepSeek, dessen Open-Source-Modelle mit der Leistung führender großer Sprachmodelle mithalten können, aber billiger in der Anwendung sind. Diese Erschwinglichkeit senkt die Hürde für SaaS-Firmen, KI-Funktionen zu ergänzen, und ermöglicht ihnen die Integration von KI in ihr Geschäft mit relativ geringen Kosten. Darüber hinaus haben führende Cloud-Plattformen wie Microsoft Azure, AWS und Google Cloud bereits DeepSeek R1 in ihre Dienste aufgenommen. Das greift Datenschutz- und Regulierungsfragen auf, da es außerhalb von China eingesetzt wird. Mehrere US-Unternehmen setzen bereits auf DeepSeek. Perplexity, das für seine KI-gestützten Frage- und Antwortdienste bekannt ist, hat das Modell DeepSeek R1 in seine Suchmaschine eingebaut. Auch Cerebras und Groq schlossen sich diesem Trend an. Unterdessen hat ZoomInfo sein Interesse bekundet, den Zugang zu DeepSeek R1 über US-Cloud-Plattformen zu erwerben2.
Die attraktive Preisgestaltung von DeepSeek könnte einen „Catfish-Effekt“ bewirken, der andere Modellanbieter dazu veranlasst, kosteneffizientere und billigere Modelle herauszubringen. OpenAI hat zum Beispiel GPT-o3 mini bereits zu einem sehr niedrigen Preisniveau lanciert. Die Ausgabekosten pro 1 Million Token betragen nur 4,40 US-Dollar und liegen damit rund 63 % unter dem Preis von GPT-o1 mini. Dieser Wettbewerb kommt Software-Unternehmen zugute, denn so können sie KI einführen, ohne ihre Gewinnmargen zu schmälern. Darüber hinaus hat DeepSeek seine Optimierungsmethoden veröffentlicht, was Open-Source-Communitys fördert und die Kluft zwischen Open-Source- und Closed-Source-Modellen weiter verringern könnte. Im Laufe der Zeit sollte diese Offenheit den Wettbewerb beleben und die KI-Kosten überschaubar halten.
Abbildung 1: Der Leistungsunterschied zwischen Closed-Source-Modellen und Open-Source-Modellen wird kleiner
Quelle: Artificial Analysis. Der Artificial Analysis Quality Index bezieht sich auf das durchschnittliche Ergebnis unserer Bewertungen, die verschiedene Dimensionen der Modellintelligenz abdecken. Aktuell umfasst er MMLU, GPQA, Math und HumanEval. Die Zahlen des o1-Modells von OpenAI sind vorläufig und basieren auf den von OpenAI angegebenen Zahlen. Daten vom 31. Januar 2025. Die historische Wertentwicklung ist kein Hinweis auf die künftige Wertentwicklung, und Anlagen können im Wert sinken.
Abbildung 2: Gegenüber großen KI-Modellen sind die APIs von DeepSeek recht erschwinglich
Quelle: Bloomberg, DeepSeek, OpenAI, Anthropic, Google, Artificial Analysis. Die API-Preise werden von den Modelleigentümern gesetzt und können von den Preisen von Drittanbietern abweichen. Der Artificial Analysis Quality Index bezieht sich auf das durchschnittliche Ergebnis unserer Bewertungen, die verschiedene Dimensionen der Modellintelligenz abdecken. Aktuell umfasst er MMLU, GPQA, Math und HumanEval. Die Zahlen des o1-Modells von OpenAI sind vorläufig und basieren auf den von OpenAI angegebenen Zahlen. Daten vom 31. Januar 2025. Die historische Wertentwicklung ist kein Hinweis auf die künftige Wertentwicklung, und Anlagen können im Wert sinken.
Kann Cloud-Software auf der DeepSeek-Welle reiten?
Der BVP NASDAQ Emerging Cloud Index wählt reine Marktchancen aus der Cloud-Computing-Landschaft aus und fokussiert sich dabei auf Unternehmen, deren Umsatzwachstum das des breiten Marktes übertrifft. Anhand dieses Index, der die Anlegerstimmung widerspiegelt, haben wir die Marktreaktionen auf die Veröffentlichung von DeepSeek am 27. und 28. Januar bewertet. Mit Ausnahme von PayPal reagierten alle Unternehmen positiv mit einer durchschnittlichen Rendite von 4,9 % in diesem Zeitraum (siehe Abbildung 3). Da in diesem Zeitraum keine Ergebnisberichte veröffentlicht wurden, führen wir diese Reaktion hauptsächlich auf die Ankündigung von DeepSeek zurück. Darüber hinaus trübte die Sitzung des Offenmarktausschusses der US-Notenbank am 28. und 29. Januar die Stimmung gegen Ende der Woche, sodass die mittlere Fünf-Tages-Rendite auf 2,7 % absank.
Abbildung 3: Renditen von Cloud-Computing-Unternehmen nach der Veröffentlichung von DeepSeek
Quelle: WisdomTree, Bloomberg. Die Renditen werden für die Unternehmen des BVP NASDAQ Emerging Cloud Index für den Zeitraum vom 27. und 28. Januar 2025 dargestellt. Es ist nicht möglich, direkt in einen Index zu investieren. Die historische Wertentwicklung ist kein Hinweis auf die künftige Wertentwicklung, und Anlagen können im Wert sinken.
Im Gegensatz zu Anbietern von KI-Infrastruktur und Modellentwicklern galten Cloud-Software-Unternehmen in den letzten zwei Jahren nicht als direkte Nutznießer von KI. Ihre Rolle in der KI-Revolution wurde als nachgelagert eingeschätzt, sodass sie zunächst KI in ihre Produkte einbetten müssen, bevor sie einen Mehrwert verzeichnen. Darüber hinaus gab es Bedenken über die Auswirkungen der KI-bezogenen Kosten auf die Margen, insbesondere vor dem Hintergrund einer geringeren Preissetzungsmacht angesichts des makroökonomischen Gegenwinds und der eingeschränkten Software-Budgets.
Die Ära erschwinglicherer KI-Modelle, die durch die Einführung von DeepSeek eingeläutet wurde, stellt einen potenziellen Wendepunkt dar und bietet Cloud-Software-Unternehmen Möglichkeiten zur Produktdifferenzierung, Kosteneffizienz und neue Einnahmequellen. Aktuelle Trends deuten auf eine strategische Verschiebung bei Cloud-Software hin. Unternehmen konzentrieren sich zunehmend auf agentengestützte KI (autonome Systeme, die Aufgaben mit minimalem menschlichem Eingriff ausführen) und vertikale KI (hochspezialisierte KI-Modelle in einer bestimmten Branche oder einem bestimmten Gebiet, z. B. Gesundheits-, Rechts-, Finanzwesen). Das Entstehen von KI-nativen Cloud-Unternehmen unterstreicht diese Entwicklung weiter und ermöglicht es Cloud-Anbietern, unmittelbarer von den Fortschritten der KI zu profitieren.
Die Einführung von DeepSeek löst eine neue Welle von Innovationen im Bereich der KI aus und wird die Nutzung von KI vorantreiben. Mit dem zunehmenden Einsatz von KI werden Unternehmen ihre Ausgaben für Software erhöhen, da die Nachfrage nach KI-Technologie in allen Bereichen steigt. Kurzfristig erzeugt eine restriktivere Geldpolitik in den USA Gegenwind für Anbieter von Cloud-Software. Doch die Ergebnisveröffentlichungen im Februar und Anfang März könnten Aufschluss über die Pläne der Unternehmen zur Nutzung der KI-getriebenen Transformation der Branche geben.
1 In der nachfolgenden Version, DeepSeek R1, wurde SFT beim Modelltraining eingesetzt. Der Schwerpunkt lag jedoch auf der Verbesserung der Lesbarkeit und Kohärenz der Modellantworten. Die logischen Fähigkeiten und die Entscheidungsfindung des Modells wurden in erster Linie durch Reinforcement Learning (RL) optimiert.
2 The Information: https://www.theinformation.com/articles/deepseek-attracts-surge-of-business-users.
Wichtige Informationen
Dieses Material wurde von WisdomTree und seinen verbundenen Unternehmen erstellt und soll nicht für Prognosen, Research oder Anlageberatungen herangezogen werden. Zudem stellt es weder eine Empfehlung noch ein Angebot oder eine Aufforderung zum Kauf bzw. Verkauf von Wertpapieren oder zur Übernahme einer Anlagestrategie dar. Die geäußerten Meinungen wurden am Herstellungsdatum getätigt und können sich je nach den nachfolgenden Bedingungen ändern. Die in diesem Material enthaltenen Informationen und Meinungen wurden aus proprietären und nicht proprietären Quellen abgeleitet. Daher übernehmen WisdomTree und seine verbundenen Unternehmen sowie deren Mitarbeiter, Führungskräfte oder Vertreter weder die Haftung für ihre Richtigkeit oder Zuverlässigkeit noch die Verantwortung für anderweitig auftretende Fehler und Auslassungen (einschließlich Verantwortlichkeiten gegenüber einer Person aufgrund von Fahrlässigkeit). Die Verwendung der in diesem Material enthaltenen Informationen erfolgt nach eigenem Ermessen des Lesers. Wertsteigerungen in der Vergangenheit lassen keinen Schluss auf zukünftige Ergebnisse zu.
]]>