Der Softwarehersteller Snowflake $SNOW (-3,37 %) beschloss am Montag, die Modelle von DeepSeek in seinen Marktplatz für KI-Modelle aufzunehmen, nachdem er eine Reihe von Kundenanfragen erhalten hatte.
Da auch Mitarbeiter die Modelle von
DeepSeek als "erstaunlich" bezeichneten, wog der US-Softwareanbieter
die potenziellen Risiken des Hostings von in China entwickelter KI-Technologie
ab, bevor er sich schließlich entschied, sie seinen Kunden anzubieten, sagte
Christian Kleinerman, Executive Vice President of Product bei Snowflake.
"Wir haben entschieden, dass
wir keine Probleme bei der Unterstützung dieser Technologie sehen, solange wir
unseren Kunden gegenüber klar sind", sagte er.
Inzwischen beeilen sich die
amerikanischen KI-Entwickler, das V3-Modell von DeepSeek zu analysieren.
DeepSeek hat im Dezember ein Forschungspapier zu dem Modell veröffentlicht, das
die Grundlage für seine beliebte App bildet, aber viele Fragen wie die Gesamtentwicklungskosten
werden in dem Dokument nicht beantwortet.
China ist nun von 18 Monaten auf
sechs Monate hinter den modernsten KI-Modellen, die in den USA entwickelt
wurden, zurückgefallen, sagte eine Person. Da DeepSeek mit seiner Strategie der
kostenlosen Veröffentlichung so viel Aufsehen erregt, könnte das Unternehmen
bald nicht mehr genug Chips haben, um die Nachfrage zu befriedigen, sagte diese
Person voraus.
Die Fortschritte von DeepSeek
beruhen nicht nur auf einem bescheidenen Budget von 6 Millionen Dollar - eine
winzige Summe im Vergleich zu den 250 Milliarden Dollar, die nach Schätzungen
von Analysten große US-Cloud-Unternehmen in diesem Jahr für KI-Infrastruktur
ausgeben werden. In der Studie wird darauf hingewiesen, dass sich diese Kosten
speziell auf die Chipnutzung für den letzten Trainingslauf beziehen und nicht
auf die gesamten Entwicklungskosten.
Der Trainingslauf ist nur die Spitze
des Eisbergs in Bezug auf die Gesamtkosten, sagten Führungskräfte von zwei
Top-Laboren gegenüber Reuters. Die Kosten für die Festlegung des Designs des
Trainingslaufs können um ein Vielfaches höher sein, sagten sie.
In dem Papier heißt es, dass der
Trainingslauf für V3 mit 2.048 H800-Chips von Nvidia durchgeführt wurde, die so
konzipiert wurden, dass sie den 2022 erlassenen US-Exportkontrollen
entsprechen, Regeln, die Chinas KI-Fortschritt laut Experten gegenüber Reuters
kaum bremsen würden.
Quellen in zwei KI-Labors sagten,
sie hätten erwartet, dass frühere Entwicklungsstadien auf eine viel größere
Menge an Chips angewiesen gewesen wären. Eine der Personen sagte, dass eine
solche Investition mehr als 1 Milliarde Dollar hätte kosten können.
Einige amerikanische
KI-Führungskräfte lobten die Entscheidung von DeepSeek, seine Modelle als Open
Source zu veröffentlichen, was bedeutet, dass andere Unternehmen oder
Einzelpersonen sie frei verwenden oder verändern können.
"DeepSeek R1 ist eine der
erstaunlichsten und beeindruckendsten Errungenschaften, die ich je gesehen habe
- und als Open Source ein großes Geschenk an die Welt", sagte der
Risikokapitalgeber Marc Andreessen in einem Beitrag auf X am Sonntag.
Der Beifall, den die Modelle von
DeepSeek erhalten haben, unterstreicht die Lebensfähigkeit der
Open-Source-KI-Technologie als Alternative zu kostspieligen und streng
kontrollierten Technologien wie ChatGPT von OpenAI, so Branchenbeobachter.
Die wertvollsten Unternehmen an der
Wall Street sind in den letzten Jahren in der Erwartung gestiegen, dass nur sie
Zugang zu dem enormen Kapital und der Rechenleistung haben, die für die
Entwicklung und Skalierung neuer KI-Technologien erforderlich sind. Diese
Annahmen werden in dieser und der nächsten Woche weiter auf den Prüfstand
gestellt, wenn viele amerikanische Tech-Giganten ihre Quartalsergebnisse
vorlegen werden.
