[ ARTICLE · 18.06.2026 ]

Rio-3.5-Open-397B: המודל של עיריית ריו שהתגלה כמיזוג משקלים של אחרים

בשביל מפתח שמוריד מודלים מ-Hugging Face, קובץ המשקלים הוא לרוב קופסה שחורה. פותחים את ה-model card, מסתכלים על ה-benchmark, בודקים את הרישיון, ומשלבים ב-pipeline. כשעלה Rio-3.5-Open-397B באמצע יוני 2026, הוא נראה כמו סיפור הצלחה יוצא דופן: עירייה שמפרסמת מודל בן 397 מיליארד פרמטרים תחת MIT. תוך ימים ספורים התברר שהסיפור מורכב יותר — והוא הפך לאחת הפרשות הבולטות השנה על attribution בעולם ה-open weights.

עירייה בתפקיד מעבדת AI

השחקן שפרסם את המודל אינו סטארטאפ או חברת big tech אלא IplanRIO — חברת ה-IT של עיריית ריו דה ז'ניירו. המודל עצמו, Rio-3.5-Open-397B, הועלה ל-Hugging Face תחת רישיון MIT, שהוא אחד הרישיונות הפתוחים ביותר שיש — מתיר שימוש מסחרי, מודיפיקציה והפצה מחדש כמעט ללא מגבלות.

הבחירה במבנה Mixture-of-Experts (MoE) בן 397 מיליארד פרמטרים הציבה את המודל, על הנייר, בליגה של ה-open weights הגדולים של 2026 — לצד משפחות Qwen ו-DeepSeek. MoE מאפשר להפעיל רק חלק מהפרמטרים בכל inference, ולכן הוא פופולרי כשרוצים כוח גדול בעלות יחסית נמוכה ל-run.

הטענות הרשמיות היו נועזות. על פי הפרסום של IplanRIO, Rio-3.5-Open-397B ניצח את Qwen 3.7 Plus בארבע מתוך חמש בדיקות benchmark. כשעירייה מפרסמת מודל שלכאורה מנצח את אחת המשפחות החזקות בעולם ה-open source, זה בדיוק סוג הסיפור שגורם למפתחים להוריד את המודל ולבדוק בעצמם.

Nex מציגה את הקבלות

תוך ימים ספורים מהפרסום נכנסה לתמונה מעבדת ה-AI Nex. במקום להסתפק בביקורת כללית, Nex פרסמה הדגמה פומבית שבה השוותה את המשקלים של Rio-3.5-Open-397B למשקלים של שני מודלים קיימים: Nex-AGI שלה עצמה ו-Qwen3 של Alibaba. התוצאה, לפי דיווח Decrypt, הראתה התאמה שקשה להסביר במקרה.

המסקנה של Nex הייתה חד-משמעית: Rio-3.5-Open-397B אינו מודל שעבר אימון עצמאי, אלא מיזוג (model merge) של המשקלים של Nex-AGI ו-Qwen3. במילים אחרות, לטענת Nex, מי שעשו את העבודה הקשה של אימון המודלים המקוריים הם אחרים — ו-IplanRIO לקחה את התוצר המוגמר, מזגה אותו מחדש ופרסמה תחת שם חדש.

הדיווחים הראשוניים עלו ב-Decrypt, ומשם התפשטו ל-Yahoo Tech, squaredtech ו-Let's Data Science. כל המקורות האלה מצביעים על אותה תבנית: Nex מציגה ראיות, IplanRIO לא מציגה הפרכה פומבית במקורות שנבדקו, והקהילה נשארת עם שאלה אחת מרכזית — מה בעצם הכללים.

למה הסיפור הזה משמעותי

במבט ראשון אפשר לחשוב שמדובר בעוד מריבה פנימית בין מעבדות AI. אבל פרשת Rio נוגעת בבעיה מבנית של עולם ה-open weights: אין מנגנון חובה לאמת את מקורם של משקלים. כל מי שמוריד מודל מ-Hugging Face מקבל קובץ ענק של מספרים, ובלי חתימה קריפטוגרפית או תיעוד אימון ציבורי, קשה להוכיח מה באמת עבר שם.

המקרה הזה מעלה גם שאלה ייחודית כי המפרסם הוא גוף עירוני, לא סטארטאפ פרטי. כשעירייה מפרסמת מודל, היא לרוב נהנית מתחושת אמינות מוסדית. גם אם המודל עצמו הוא מיזוג של משקלים קיימים, הפרסום העירוני נותן לו תו תקן של גוף ציבורי — וזה בדיוק מה שהופך את היעדר ה-attribution לבעייתי.

בנוסף, הפרשה חשפה את הפער בין ה-benchmark הרשמי לבין המציאות שמאחורי הקלעים. קל יחסית לפרסם תוצאות benchmark טובות כשמתחילים ממודל שכבר מנצח — וקשה יותר לזהות את זה מבחוץ. זו אחת הסיבות שהקהילה הטכנית מסתמכת יותר ויותר על מעבדות עצמאיות (כמו Nex במקרה הזה) שמבצעות היפוך-הנדסי של משקלים כדי לאמת טענות של מפרסמים.

לפי IplanRIOמודל MoE מקורי, 397B פרמטריםתחת רישיון MIT; מנצח את Qwen 3.7 Plus ב-4 מתוך 5 בדיקות benchmark

לפי Nexמיזוג (model merge) של Nex-AGI + Qwen3ללא סימנים לאימון עצמאי; משקלים תואמים למקור

ההקשר: המירוץ הגלובלי אחר open weights

הפרשה מגיעה ברגע שבו השוק הגלובלי של open weights להוט. Qwen ו-DeepSeek הסיניות מחזיקות, על פי נתונים שפורסמו ביוני 2026, בערך 15% משוק ה-AI העולמי (למעלה מ-1% בלבד שנה קודם לכן). MiniMax M3 מצהירה על ביצועים שעוקפים את GPT-5.5 עם 95% פחות כוח מחשוב. בשוק כזה צפוף ותחרותי, הלחץ להוציא מודלים 'משלך' גבוה — והתמריץ לקחת קיצורי דרך גדל בהתאם.

במקביל, שחקנים ממשלתיים ועירוניים בכל העולם מנסים לבסס עצמאות AI — מה שמכונה sovereign AI. עירייה שמפרסמת מודל משלה מקבלת נראות תקשורתית, קרדיט אזרחי, ובמקרים מסוימים גם גישה לתקציבים ולמענקים. הבעיה מתחילה כשהנראות הזו לא מגובה בעבודת אימון אמיתית, ואז המודל העירוני הופך לכרזה על חשבון מי שבאמת עשה את העבודה.

זו אינה סוגיה של מדינה אחת. אותו דפוס יכול להופיע בכל מקום שבו גוף ציבורי או פרטי רוצה להיראות כ-competitor עצמאי. השאלה האם הקהילה הבינלאומית תאמץ תקני attribution מחייבים למודלים פתוחים נשארה פתוחה גם אחרי שהאבק של פרשת Rio ישקע.

מה זה אומר למפתחים שמורידים מודלים

הלקח המעשי למפתח vibe-coding הוא פשוט ולא נעים: אי אפשר להסתפק בקריאה של model card. בעידן שבו מיזוג משקלים קל יחסית לביצוע, ופרסום תחת שם חדש הוא בלתי מבוקר, מי שמשלב מודל ב-pipeline ייצורי צריך לבצע הערכת מקור מינימלית. זה נכון שבעתיים כשהמפרסם הוא גוף שאין לו היסטוריה מוכחת של אימון frontier models.

בפועל, זה אומר לבדוק שלושה דברים. מי הצוות שלכאורה אימן את המודל ומה ההיסטוריה הפומבית שלו; האם המודל עבר הערכה עצמאית של גוף חיצוני (מעבדה, אוניברסיטה, ולו בלוגר טכני מוכר); והאם יש ראיות ל-dataset, כרטיסי אימון או checkpoint intermediate שמעידים על עבודת אימון אמיתית. היעדר כל אחד מאלה לא אומר בהכרח שמשהו לא תקין — אבל הוא מצדיק זהירות.

כדאי גם לזכור שמודל שהוא למעשה מיזוג אינו בהכרח חסר ערך. הרבה שחקנים לגיטימיים משתמשים ב-merge כדי לשלב יכולות ממקורות שונים, והתוצאה יכולה להיות מצוינת. הבעיה אינה בטכניקה עצמה אלא בטענות המקוריות שמתלוות אליה. מי שמציין בשקיפות 'מודל זה מבוסס על מיזוג של X ו-Y' משחק הוגן; מי שמציג מיזוג כאימון עצמאי — לא.

בדיקת provenance מינימלית למודל פתוח לפני שילוב ב-pipeline: (1) מצא את שם הצוות שפרסם ואת היסטוריית הפרסומים הקודמת שלו. (2) חפש דוחות עצמאיים של גוף חיצוני שמאמת את הביצועים או את מקור המשקלים. (3) בדוק אם יש dataset card, training notes או checkpoint intermediate. (4) השווה את המשקלים מול מודלים ידועים בעזרת כלי השוואה כמו model-diff או חישוב cosine similarity של תת-קבוצת טנזורים.

מה לא ידוע עדיין

למרות הראיות שהציגה Nex, יש כמה נקודות שלא התבהרו עד אמצע יוני 2026. לא ברור אם IplanRIO תפרסם תגובה רשמית מפורטת, אם יוסר המודל מ-Hugging Face, ואם תהיינה השלכות משפטיות כלשהן בין הצדדים. המקורות שנבדקו (Decrypt, Yahoo Tech, squaredtech, Let's Data Science) לא דיווחו על תגובה פומבית מטעם העירייה שחוזרת בה מהטענות או מסבירה אותן.

גם לא ברור מה תהיה ההשפעה ארוכת הטווח על שוק ה-open weights. הקהילה יכולה לאמץ תקני attribution מחמירים יותר, או להמשיך להסתמך על ביקורת עצמית של מעבדות עצמאיות כמו Nex. מה שבטוח הוא שהפרשה הזו תוזכר בכל דיון עתידי על אמון במודלים פתוחים, ושהיא תופיע כ-case study בכל דיון רציני על provenance.

נקודה נוספת שכדאי לעקוב אחריה היא האם יהיו מקרים דומים נוספים. אם הטכניקה של Nex (השוואת משקלים מול מודלים ידועים) תהפוך לסטנדרט, סביר שנראה עוד מקרים של מודלים 'עירוניים' או 'לאומיים' שמתגלים כמיזוגים של עבודת אחרים. לעת עתה, מי שמוריד מודל חדש מ-Hugging Face כדאי שישאל את עצמו לפחות שאלה אחת: מאיפה המשקלים האלה באמת הגיעו.

התקדים וההשלכות

גם אם הפרשה תיסגר בשקט יחסי, היא כבר יצרה תקדים תקשורתי. המקרה של Rio הוא הדוגמה הברורה ביותר ב-2026 לאיך נראית חשיפה ציבורית של מודל שלכאורה מוגזם בטענות שלו — והוא מראה שהקהילה הטכנית מסוגלת לאמת בעצמה, בלי להסתמך על המפרסם, מה באמת עומד מאחורי קובץ המשקלים.

ההשלכה המעשית היא שמפרסמי מודלים יידרשו להצטייד ביותר מ-benchmark כדי לשכנע. תיעוד אימון, פרסום dataset, חתימה קריפטוגרפית של checkpoint והפניה מפורשת למקורות הופכים מ'נחמד לעשות' ל'קריטי אם רוצים שהמודל יתקבל ברצינות'. מי שממשיך לפרסם מודלים בלי תיעוד כזה חשוף לחשיפה דומה.

לבסוף, הפרשה מדגישה את הצורך בכלים אוטומטיים. השוואת משקלים ידנית, כפי שביצעה Nex, אפשרית אבל לא סטנדרטית. אם פלטפורמות כמו Hugging Face יוסיפו בדיקת provenance אוטומטית שמזהה מיזוגים ידועים, חלק גדול מהבעיה תיפתר בלי להזדקק למעבדות עצמאיות. עד שזה יקרה, האחריות נותרת על המפתח.

בעידן שבו העלות של מיזוג משקלים היא שעות על GPU אחד והעלות של אימון frontier model היא מיליארדי דולרים, היעדר attribution הופך את רישיון ה-MIT לתווית שקשה לסמוך עליה בלי בדיקה נוספת.

השורה התחתונה: פרשת Rio-3.5-Open-397B אינה רק סיפור על עירייה שהסתבכה עם הקהילה הטכנית, אלא על אתגר מבני של עולם ה-open weights — איך מבטיחים שה-credit והרישיון שאתה רואה על model card באמת משקפים את מי שעשה את העבודה. מפתחים שמשלבים מודלים פתוחים ב-pipeline צריכים להוסיף בדיקת provenance ל-checklist, ולא להסתפק ב-benchmark או ברישיון בלבד.

מקורות

נקודות עיקריות

IplanRIO, חברת ה-IT של עיריית ריו דה ז'ניירו, פרסמה באמצע יוני 2026 ב-Hugging Face את Rio-3.5-Open-397B — מודל MoE בן 397 מיליארד פרמטרים תחת רישיון MIT.
על פי הפרסום הרשמי של IplanRIO, המודל ניצח את Qwen 3.7 Plus בארבע מתוך חמש בדיקות benchmark — טענה שהציבה אותו לכאורה בשורה הראשונה של ה-open weights.
מעבדת ה-AI Nex פרסמה הדגמה פומבית שבה הראתה שהמשקלים של Rio-3.5-Open-397B תואמים למיזוג (model merge) של Nex-AGI ו-Qwen3, ללא עדות לאימון עצמאי.
הפרשה נחשפה לראשונה בדיווח Decrypt ואושרה על ידי Yahoo Tech, squaredtech ו-Let's Data Science — והפכה לאחת הדוגמאות הבולטות לסוגיית ה-attribution בעידן ה-open weights.
המקרה מדגיש את הקושי לאמת provenance של מודלים פתוחים: כשמותר למזג משקלים של אחרים ולפרסם תחת שם חדש, קשה להבחין בין יצירה מקורית לבין rebrand.

שאלות נפוצות

מה זה Rio-3.5-Open-397B?

Rio-3.5-Open-397B הוא מודל Mixture-of-Experts בן 397 מיליארד פרמטרים שפורסם ב-Hugging Face תחת רישיון MIT על ידי IplanRIO, חברת ה-IT העירונית של ריו דה ז'ניירו, באמצע יוני 2026. המפרסמים טענו שהמודל ניצח את Qwen 3.7 Plus בארבע מתוך חמש בדיקות.

מה הטענה נגד המודל של IplanRIO?

מעבדת ה-AI Nex פרסמה הדגמה שבה הראתה שהמשקלים של Rio-3.5-Open-397B תואמים למיזוג (model merge) של משקלי Nex-AGI ו-Qwen3 — כלומר לא מדובר באימון עצמאי. הפרסום עלה בימים שאחרי ההשקה ודווח לראשונה ב-Decrypt.

מה זה model merge?

model merge היא טכניקה שבה לוקחים את המשקלים של שני מודלים קיימים ומשלבים אותם לכדי מודל חדש — לרוב באמצעות ממוצע משוקלל או פעולות דומות על הטנזורים. התהליך אינו דורש אימון מאפס ולכן זול יחסית, אך הוא משאיר את המודל החדש תלוי לחלוטין בעבודה המקורית של אחרים.

מי חשף את הפרשה?

הפרסום הראשון היה ב-Decrypt, והוא אושר והורחב על ידי Yahoo Tech, squaredtech ו-Let's Data Science. הראיות עצמן הוצגו על ידי מעבדת Nex, שפרסמה הדגמה פומבית של הזהות בין המשקלים.

מה המשמעות של הפרשה לעולם ה-open weights?

הפרשה מעלה שאלות קשות על attribution: כשמותר למזג משקלים של מודלים אחרים ולפרסם תחת שם חדש, קשה מאוד להבחין בין יצירה מקורית לבין rebrand. מפתחים שמורידים מודלים מ-Hugging Face נדרשים לבדוק provenance בעצמם.