מלחמת השבבים בין ארה"ב לסין
מלחמת השבבים בין ארה"ב לסיןצילום: ISTOCK

האם סטארטאפ סיני יכול לשנות את חוקי המשחק של עולם הבינה המלאכותית? DeepSeek, חברה סינית קטנה יחסית, מצליחה לעורר גלים בסיליקון וואלי ובוול סטריט עם מודלי שפה חדשים, עוצמתיים וזולים במיוחד.

בעוד ענקיות הטכנולוגיה כמו OpenAI, מטא, וגוגל משקיעות מיליארדים בפיתוח מודלי AI מתקדמים, DeepSeek מוכיחה שאפשר להגיע לתוצאות פורצות דרך עם תקציב זעום ויכולת חישוב מינימלית.

מודלים בקוד פתוח שעוקפים את הגדולים

DeepSeek נכנסה לכותרות לאחרונה בזכות המודל DeepSeek-V3, מודל שפותח בארכיטקטורת Mixture-of-Experts וכולל 671 מיליארד פרמטרים. המודל מצטיין במטלות מתמטיות וכתיבת קוד, ואף השיג תוצאות מרשימות במבחנים כמו Codeforces, עם אחוזי הצלחה כפולים מ-GPT-4 של OpenAI.

המודל פותח בעזרת כ-2,000 יחידות GPU בלבד ובעלות כוללת של 6 מיליון דולר, לי המפתחים, נתונים מרשימים במיוחד כשמשווים אותם להשקעות הענק של החברות האמריקאיות המובילות בתחום.

לאחרונה שחררה החברה את מודלי ההיסק R1 ו-R1-Zero. מודלים אלה מתחרים ישירות במודל o1 של OpenAI, והם מציגים ביצועים כמעט זהים ואף עוקפים אותו בסיטואציות מסוימות. הייחודיות של R1-Zero טמונה בשיטת האופטימיזציה שפיתחו חוקרי החברה, המאפשרת למודל לשפר את עצמו ללא פיקוח אנושי.

פאניקה במטא וב-OpenAI

ההצלחה של DeepSeek לא נעלמה מעיניהן של המתחרות האמריקאיות. על פי דיווחים, במשרדי מטא הוקמו "חדרי מלחמה" כדי לנתח את המודלים של DeepSeek ולנסות לשחזר את שיטות הפיתוח שלה.

מת'יו אולדהם, ראש תחום תשתיות ה-AI של מטא, אף הביע חשש שמודל Llama 4 של החברה לא יצליח להתחרות במודלים של DeepSeek. גם ב-OpenAI עוקבים בדריכות אחר ההתפתחויות, כאשר האפליקציה של DeepSeek כבר הפכה לפופולרית ביותר בחנות האפליקציות של אפל בארה"ב, ועקפה את ChatGPT.

ההשפעה על וול סטריט

הצלחת DeepSeek גרמה לטלטלה בשווקים הפיננסיים. לפני פתיחת המסחר, החוזים העתידיים בנאסד‏‍‍‎‏​‌‌‍‎‎‎‏‌‍ק ירדו ב-4.5%, ועם פתיחת המסחר המדדים תיקנו מעט אך עדיין נרשמו ירידות חדות: הנאסד‏‍‎‏​‎‎‎‏‌‌‎‍‌ק ירד ב-2.7%, ה-S&P ירד ב-1.6%, והדאו ירד ב-0.2%. מניית אנבידיה איבדה 11%, וחברות טכנולוגיה נוספות בתחום השבבים רשמו ירידות חדות.

האם מודלים זולים יפילו את ענקיות השבבים?

מודלי DeepSeek מציבים אתגר משמעותי לענף השבבים. החברה הוכיחה שאפשר לפתח מודלים עוצמתיים גם עם שבבים זולים יחסית. מנכ"ל DeepSeek, ליאנג וונפנג, הצהיר בעבר ש”OpenAI היא לא אלוהים“, והמודלים שלו מוכיחים שיותר הוצאות לא בהכרח מובילות ליותר ביצועים או חדשנות. אם ההצלחה של DeepSeek תימשך, ייתכן שמחירי מניות השבבים יתמודדו עם לחצים משמעותיים. כבר כעת נרשמה ירידה של כמעט 10% במניית Advantest, ספקית גדולה של אנבידיה, בבורסה היפנית.

DeepSeek הצליחה לשבור את המוסכמות בתחום הבינה המלאכותית ולהציג מודלים שווים ואף עולים על אלו של הענקיות, תוך שימוש ביצירתיות ובחשיבה מחוץ לקופסה. המשך ההצלחה של החברה עשוי לא רק להשפיע על החברות המובילות בתחום, אלא גם לשנות את כללי המשחק בכלכלה העולמית.