[ ARTICLE · 18.06.2026 ]
Qwen ו-DeepSeek הסיניות כובשות שווקים — ומדברות את השפות של אפריקה
מפתחת תוכנה בניירובי בת 28 פתחה את Hugging Face ביום שלישי כדי להוריד גרסה חדשה של מודל. היא לא הורידה את Llama של Meta, ולא את GPT-OSS של OpenAI. היא הורידה את Qwen 3.5 של Alibaba — והסיבה שהיא נתנה לעמיתים שלה הייתה פשוטה: היא צריכה מודל שמדבר Swahili, Hausa ו-Amharic, ושלושת המודלים הסיניים שעל השולחן שלה יודעים את זה. המודלים המערביים, גם המתקדמים שבהם, מתקשים איתם.
המספרים: 15% משוק עולמי, מ-1% לפני שנה
הנתון המרכזי שמסביר את המהלך מופיע בניתוח שפרסם Foreign Policy ב-8 ביוני 2026: Qwen של Alibaba ו-DeepSeek מחזיקים יחד כ-15% משוק ה-AI העולמי. לפני כשנה, הנתון הזה עמד על כ-1%. זו קפיצה של פי 15 בתוך 12 חודשים — קצב שלא היה מוכר עד כה בשוק המודלים הגדולים.
הנתון הזה אינו מדד של הכרזות או ציטוטים בתקשורת. הוא מבוסס על שימוש בפועל — כמות הורדות מ-Hugging Face, קריאות API, ופריסות מקומיות. זה חשוב, כי הוא מראה לא רק שהמודלים 'מפורסמים' אלא שמפתחים באמת בוחרים בהם, משלבים אותם במוצרים, ומסתמכים עליהם בעבודה יומיומית.
המשמעות: השוק העולמי של ה-AI, שנחשב במשך שנתיים כמונופול של ספקי המערב, עבר ב-12 חודשים למצב שבו רבע מהמודלים שעובדים בייצור הם סיניים. זה לא סיפור של מודל סיני אחד ש'תפס' — זו תופעה של מודלים סיניים רבים שמילאו נישות שהשוק המערבי הזניח.
איך הגיעו לשם: open-weight כאסטרטגיית הפצה
ההצלחה של Qwen ו-DeepSeek לא נבעה ממודל אחד גנרי שהצטיין בהכל. היא נבעה מאסטרטגיית הפצה שונה מזו של המערב. שני המודלים שוחררו כ-open-weight — משמע, המשקלות (weights) של המודל זמינים להורדה חופשית, ומי שמוריד אותם יכול להריץ אותם על התשתית שלו, לאמן אותם מחדש על הדאטה שלו, ולהטמיע אותם במוצרים מסחריים בלי לשלם תמלוגים.
זה נשמע טכני, אבל ההשפעה עצומה. מודל סגור כמו GPT-5.5 דורש קריאה דרך API של OpenAI — מה שאומר תלות בשרת חיצוני, עלויות חוזרות לכל טוקן, ושליטה של הספק במה שרואים המשתמשים שלך. מודל open-weight, לעומת זאת, נותן למפתח עצמאות מוחלטת: הוא מריץ את המודל על השרת שלו, מתאים אותו לדאטה שלו, ולא משלם לאף אחד על כל קריאה.
בשווקים שבהם תקציבי ה-IT מצומצמים, או שבהם רגולציה מקומית אוסרת על שליחת דאטה לשרתים זרים, האפשרות הזו היא לא 'פיצ'ר נחמד' אלא תנאי מקדים. מפתח בקניה או ניגריה שרוצה לבנות מוצר ללקוחות מקומיים לא יכול להסתמך על API של OpenAI — גם בגלל מחיר, גם בגלל רגולציה, וגם בגלל שאין לו ערבויות לגבי מה קורה לדאטה של הלקוחות שלו.
אפריקה: החזית שבה המודלים הסיניים ניצחו
הסיפור המעניין ביותר אינו הנתון העולמי של 15%, אלא מה שקורה באפריקה. ביבשת הזו, Qwen ו-DeepSeek הפכו לברירת המחדל של מפתחים — לא רק בגלל מחיר או זמינות, אלא בגלל שהם פותרים בעיה שהמודלים המערביים לא פתרו: שפות אפריקאיות.
לפי הדיווחים, מפתחים אפריקאים משתמשים ב-Qwen וב-DeepSeek בעיקר בגלל שהמודלים האלה יודעים לעבוד עם שפות low-resource — שפות שאין להן מספיק טקסט דיגיטלי בשפות המערב הגדולות (אנגלית, צרפתית, ספרדית) כדי שמודלים מערביים ילמדו אותן היטב. Swahili, Hausa, Yoruba, Amharic, Igbo — אלו שפות שמאות מיליוני אנשים מדברים, אבל מודלים מערביים מתקשים איתן.
הסיבה טכנית: כמות הדאטה שעליה אומן מודל היא הגורם המרכזי שקובע כמה טוב הוא מדבר שפה מסוימת. אם אין מספיק טקסט איכותי בשפה, המודל ייצר תשובות חסרות משמעות או יעבור לאנגלית באמצע משפט. המודלים המערביים אומנו בעיקר על אנגלית; גם המאמצים להוסיף שפות אחרות התמקדו בשפות עם הרבה דאטה — ערבית, סינית, הינדית, פורטוגזית — ולא בשפות אפריקאיות.
איך סין אספה את הדאטה האפריקאי
המודלים הסיניים לא נולדו עם השפות האפריקאיות. הם אספו אותן במשך שנים, בחלק ממהלך רחב יותר של סין לבנות נוכחות דיגיטלית ביבשת. חלק מהדאטה הגיע משיתופי פעולה אקדמיים, חלק ממאגרי תרגום שנבנו במימון ממשלתי, וחלק מפרויקטים של חברות סיניות שפעלו באפריקה בעשור האחרון.
המשמעות: כשמודל סיני יודע לדבר Swahili, זה לא במקרה. זה תוצאה של השקעה אסטרטגית ארוכת-טווח בדאטה שאף ספק מערבי לא טרח לאסוף. זה גם ההבדל בין 'מודל טוב יותר' לבין 'מודל שמתאים לשוק' — המודלים הסיניים לא בהכרח חזקים יותר באנגלית, אבל הם נוכחים בשווקים שהמערב הזניח.
זה גם ההסבר לכך שמודלים מערביים לא 'יתפסו' את הפער במהירות. איסוף דאטה בשפות low-resource הוא לא מהלך של חודשים; זה מהלך של שנים. הסינים הקדימו, ועכשיו הם נהנים מ-first-mover advantage שאי אפשר לסגור בלי השקעה דומה.
ההשלכות למערב: תחרות שלא מדברת על מחיר
עד לפני שנה, הדיון על תחרות ב-AI התמקד בעיקר בביצועים על benchmarks אנגליים. מי מוביל ב-MMLU? מי מוביל ב-HumanEval? מי עובר את הרף הבא? הדיון הזה החמיץ נקודה חשובה: ביצועים באנגלית לא מתרגמים אוטומטית לביצועים בשווקים שבהם אנגלית אינה השפה הדומיננטית.
המודלים הסיניים לימדו את השוק שיעור חשוב: תחרות אמיתית קורית בשווקים שבהם הצרכן לא דובר אנגלית. באותם שווקים, יתרון של 5% ב-MMLU לא שווה כלום אם המודל לא מסוגל לייצר טקסט בסיסי בשפת היעד. הספק המערבי שינצח באפריקה יהיה לא זה שיש לו את המודל החזק ביותר, אלא זה שיש לו מודל שמדבר את השפות שבהן מדברים באפריקה.
המשמעות למערב אינה רק תחרותית — היא גם גיאופוליטית. תלות של מדינות אפריקאיות במודלים סיניים יוצרת תלות טכנולוגית רחבה יותר: אם המודל שלך סיני, התשתית שלך נוטה להיות סינית, המומחים שלך מכירים סינית, וההחלטות שלך על פיתוח עוברות דרך בייג'ינג. זה תהליך שלוקח שנים לבנות, אבל גם שנים לפרק.
מה משתנה עבור מי שבונה מוצר בעברית
עבור מפתחים בישראל, הסיפור הזה רלוונטי בשני מישורים. הראשון — תחרות. אם חברה סינית תחליט להשיק מודל מותאם לעברית או לערבית (מהלך שלא בלתי-אפשרי בעוד שנתיים), היא תתחרה ישירות במי שמציע היום מוצרים בשפות אלה. ישראל לא תהיה יעד אסטרטגי ראשון של סין, אבל היא תהיה חלק ממהלך רחב של 'שפות לא-אנגליות'.
המישור השני — הזדמנות. המודלים הסיניים הוכיחו שאפשר לבנות מודל חזק בשפות low-resource. השיטה אינה סוד: איסוף דאטה איכותי בשפה, fine-tuning על משימות ספציפיות, ושילוב במודל בסיס גדול. מי שיעשה את זה לעברית — לא רק תרגום אנגלית-עברית, אלא מודל שמבין את הניואנסים של השפה — יוכל לבנות מוצרים שאף ספק זר לא מציע כרגע.
השוק הישראלי קטן מכדי למשוך מהלך של חברה סינית בעצמה, אבל הוא גדול מספיק כדי להצדיק מאמץ מקומי. השאלה היא אם יימצא מישהו שיעשה את המאמץ הזה — או אם הישראלים ימשיכו להסתמך על מודלים שמדברים עברית 'בסדר', אבל לא 'טוב'.
הצעד הבא: מה יקרה ב-12 החודשים הבאים
התחזית הסבירה: החלק היחסי של Qwen ו-DeepSeek ימשיך לגדול, בעיקר בשווקים שאינם דוברי אנגלית. המודלים הבאים שלהם ישפרו את התמיכה בשפות נוספות, ויוסיפו כיסוי לשפות שעדיין לא מטופלות. במקביל, הספקים המערביים ינסו לסגור את הפער — אבל זה ידרוש מהם לאסוף דאטה בשפות שהם מעולם לא התעניינו בהן, וזה לא קורה ברבעון אחד.
התחזית הפחות סבירה: ספק מערבי ישיק מודל open-weight שמתחרה ישירות ב-Qwen בשפות אפריקאיות. Meta הוציאה את Llama, אבל היא לא משחררת אותו עם fine-tunes לשפות אפריקאיות בקנה מידה שמתחרה ב-Qwen. OpenAI בכלל לא משחררת open-weight. התחרות האמיתית, אם תבוא, תבוא כנראה ממיקרוסופט (Phi) או גוגל (Gemma) — אבל שתיהן עדיין לא השיקו מהלך דומה.
בסוף 2026, צפוי שהמודלים הסיניים יחזיקו כ-20% מהשוק העולמי, לפי המגמה הנוכחית. זה לא רוב, אבל זה מספיק כדי שאף מהלך מערבי לא יוכל להתעלם מהם. השאלה היא לא אם המודלים הסיניים 'ינצחו' — הם לא ינצחו באנגלית. השאלה היא אם המערב יסגור את הפער בשווקים שבהם המודלים הסיניים כבר נוכחים. התשובה הנוכחית: לא בקרוב.
המודל הטוב ביותר ב-MMLU לא יעזור לרופא בניירובי שצריך לסכם תיק רפואי ב-Swahili — וזה הפער שבו המודלים הסיניים ניצחו, לא בביצועים גנריים.
השורה התחתונה: הסיפור של Qwen ו-DeepSeek אינו סיפור של 'מודל סיני שעף קדימה בביצועים'. זה סיפור של מודלים שמילאו נישות שהמערב הזניח — בעיקר שפות low-resource באפריקה. הנתון של 15% מהשוק העולמי הוא סימפטום; המחלה היא חוסר הנוכחות של המערב בשווקים שאינם דוברי אנגלית. עבור מי שבונה מוצר בעברית או בערבית, המסקנה דומה: אם לא תבנה מודל שמדבר את השפה שלך ברמה גבוהה, מישהו אחר יבנה אותו בשבילך.
נקודות עיקריות
- לפי ניתוח שפורסם ב-8 ביוני 2026 ב-Foreign Policy, Qwen של Alibaba ו-DeepSeek מחזיקים יחד כ-15% משוק ה-AI העולמי — קפיצה מכ-1% לפני כשנה.
- הצמיחה מבוססת על מודלי open-weight חינמיים לשימוש מסחרי, שמאפשרים למפתחים להריץ אותם מקומית בלי תלות ב-API של ספק מערבי.
- באפריקה הפכו Qwen ו-DeepSeek לברירת המחדל של מפתחים — לפי הדיווחים, בעיקר בגלל תמיכה בשפות אפריקאיות שמודלים מערביים לא מכסים.
- המודלים הסיניים מציעים כיסוי רחב של שפות low-resource — כאלה שאין להן מספיק טקסט דיגיטלי כדי שמודלים מערביים ילמדו אותן היטב.
- ההצלחה האפריקאית משלימה מהלך רחב יותר של סין לבנות תלות טכנולוגית מחוץ לגוש המערבי — דרך תשתית, הכשרה, ומימון ממשלתי.
- עבור מפתח ישראלי שבונה מוצר לקהל דוברי עברית או ערבית, המשמעות היא תחרות חדשה — וגם הזדמנות ללמוד מודלים שעובדים היטב על שפות לא-אנגליות.
- הסיפור האמיתי אינו טכני אלא גיאוגרפי: היכן הדאטה נמצא, מי מממן את האימון, ולאילו שווקים מגיע המודל.
שאלות נפוצות
כמה משוק ה-AI העולמי מחזיקים Qwen ו-DeepSeek יחד?
לפי ניתוח שפורסם ב-8 ביוני 2026 ב-Foreign Policy, Qwen של Alibaba ו-DeepSeek מחזיקים יחד כ-15% משוק ה-AI העולמי. זו קפיצה חדה מכ-1% בלבד לפני כשנה. הנתון מבוסס על שימוש בפועל במודלים, לא רק על הכרזות.
למה דווקא אפריקה הפכה לחזית הצמיחה של המודלים הסיניים?
מפתחים אפריקאים בחרו ב-Qwen ו-DeepSeek מכמה סיבות: המודלים חינמיים לשימוש מסחרי, ניתנים להרצה מקומית (בלי תלות ב-API חיצוני), ומציעים כיסוי רחב של שפות אפריקאיות — כולל שפות low-resource שמודלים מערביים כמעט לא תומכים בהן. סין גם מימנה תוכניות הכשרה ותשתית ביבשת, מה שמחזק את התלות.
איך שפות אפריקאיות הפכו לנכס אסטרטגי של המודלים הסיניים?
רוב שפות אפריקה הן low-resource — אין להן מספיק טקסט דיגיטלי באנגלית או בצרפתית (שפות הממשל הקולוניאלי) כדי שמודלים מערביים ילמדו אותן טוב. הסינים, לעומת זאת, אספו דאטה בשפות כמו Swahili, Hausa, Yoruba ו-Amharic ושילבו אותן במודלים שלהם. זה נתן להם יתרון שאף ספק מערבי לא מציע כרגע.
האם המודלים הסיניים באמת עובדים טוב יותר בשפות אלה?
ההשוואה הישירה קשה, כי אין בנצ'מרק סטנדרטי לרוב השפות האפריקאיות. אבל דיווחים מהשטח מצביעים על כך שהמודלים הסיניים מצליחים לייצר טקסט בסיסי בעשרות שפות אפריקאיות, בעוד שמודלים מערביים לעיתים קרובות מחזירים תשובות חסרות משמעות. הפער נובע מכמות הדאטה שאספו הסינים באימון, לא רק מארכיטקטורה טובה יותר.
מה המשמעות לישראל ולמפתחים בעברית או בערבית?
המשמעות דו-מימדית. מצד אחד, מודלים סיניים מציבים תחרות חדשה — במיוחד בשווקים שבהם עברית או ערבית הן שפת היעד, והמודלים הסיניים כבר ניסיוניים בשפות לא-אנגליות. מצד שני, הניסיון שלהם בשפות low-resource יכול לשמש מקור השראה טכני למי שרוצה לבנות מוצר בעברית חזקה יותר. השוק הישראלי קטן מכדי להיות יעד אסטרטגי לסין, אבל מספיק גדול כדי להרגיש את ההשפעה.