[ ARTICLE · 28.05.2026 ]
Claude Opus 4.8 יצא: אותו מחיר, קפיצה בקידוד אגנטי
ביום חמישי בלילה, מפתח שהריץ מיגרציה של 80 אלף שורות מ-Jest ל-Vitest ב-Claude Code פתח את הסשן בבוקר וגילה שהמודל שמאחורי הסוכן (agent) השתנה. ב-28 במאי 2026 Anthropic שחררה את Claude Opus 4.8 — מודל הדגל החדש שמניע את Claude Code — וזמין מהיום הראשון בכל מקום: Claude Pro, Max, Team ו-Enterprise, וגם דרך Claude Platform, AWS, Google Cloud ו-Microsoft Foundry. מזהה המודל ל-API הוא claude-opus-4-8. השאלה שמעניינת מפתחי vibe-coding היא לא 'כמה חכם יותר', אלא מה משתנה בפועל ב-loop היומי — ושם יש כמה שינויים קונקרטיים.
אותו מחיר, יכולות משודרגות
המהלך הראשון שכל founder בודק הוא העלות. כאן Anthropic לא נגעה: התמחור הסטנדרטי נשאר 5$ למיליון טוקני קלט ו-25$ למיליון טוקני פלט — בדיוק כמו Opus 4.7 — עם עד 90% חיסכון בעזרת prompt caching ו-50% חיסכון ב-batch processing. הנקודה החשובה למי שמתכנן עבודה על codebase גדול: חלון ההקשר המלא של מיליון טוקנים (1M) כבר GA ונכלל בתמחור הסטנדרטי, כך שאפשר להזרים repo שלם להקשר בלי tier מיוחד.
Fast mode: פי 2.5 מהר, זול פי שלושה
מי שבונה agent שעושה עשרות קריאות קצרות ברצף — לדוגמה לולאת תיקון לינט או triage של issues — חי או מת על לטנסי, לא על איכות ה-reasoning בכל step. בשביל זה נוסף fast mode: הרצה מהירה פי 2.5 שעולה 10$ למיליון טוקני קלט ו-50$ למיליון פלט. Anthropic מציינת שה-fast mode הזה זול פי שלושה לעומת מצבי המהירות במודלים הקודמים שלה, כך שגם כשמשלמים את הפרמיה על מהירות, העלות לכל משימה צונחת. במקביל, Claude.ai ו-Cowork מקבלים הגדרת effort מתכווננת — שליטה ידנית בכמה Claude משקיע בתגובה, עם ברירת מחדל גבוהה.
כנות: פי ארבעה פחות פגמים שעוברים בשתיקה
מי שנתן פעם ל-agent לכתוב migration ואז גילה שהוא הצהיר 'הכל עובד' על קוד שבור — יזהה את השדרוג הזה מיד. לפי Anthropic, Opus 4.8 פי ארבעה פחות נוטה מקודמו להעביר פגמים בקוד שכתב בעצמו בלי לסמן אותם. בודקים מוקדמים מדווחים שהמודל נוטה יותר לסמן אי-ודאות לגבי העבודה שלו ופחות להשמיע טענות לא מבוססות. בשפה של vibe-coding: פחות מקרים שבהם הסוכן 'מבטיח' שהבדיקות עוברות בלי שהריץ אותן, ויותר דגלים על מקומות שצריך לבדוק ידנית.
בודקים מדווחים שהמודל נוטה יותר לסמן אי-ודאות לגבי עבודתו ופחות להשמיע טענות לא מבוססות — פי ארבעה פחות פגמים שעוברים בשתיקה.
Online-Mind2Web: 84% בעבודת browser-agent
כשהסוכן צריך לצאת מה-IDE ולתפעל דפדפן — למלא טופס ב-dashboard, ללחוץ דרך flow של תשלום, לאמת UI — נמדדת יכולת ה-computer-use. כאן Opus 4.8 קיבל 84% ב-Online-Mind2Web, ולדברי Anthropic זו התוצאה החזקה ביותר שהיא בדקה ב-browser-agent, שעוקפת גם את Opus 4.7 וגם את GPT-5.5. בקידוד עצמו, דיווחים על הבנצ'מרקים מצביעים על 69.2% ב-SWE-Bench Pro מעל GPT-5.5 ו-Gemini 3.1 Pro, אם כי GPT-5.5 עדיין מוביל בבנצ'מרק של terminal-coding — כך שהיתרון תלוי-משימה ולא גורף.
Claude Code: dynamic workflows עם מאות subagents
השינוי המשמעותי ביותר למשתמשי Claude Code הוא dynamic workflows, שיוצא כ-research preview. במקום סוכן יחיד שעובר קובץ-קובץ, Claude מתכנן את המשימה ואז מריץ מאות subagents מקביליים בסשן אחד. זה פותח מיגרציות בקנה מידה של מאות אלפי שורות קוד — סוג העבודה שעד עכשיו דרש לפצל ידנית לעשרות runs. בשילוב עם חלון 1M שכבר GA, אפשר להחזיק תמונת repo רחבה בהקשר בזמן שהסוכנים המקביליים עובדים.
תכנן והרץ מיגרציה של כל קבצי הבדיקה מ-Jest ל-Vitest ברחבי ה-monorepo. פצל לעבודה מקבילית: subagent לכל package. לכל subagent — המר imports, עדכן mocks ל-API של Vitest, הרץ את הסוויטה, ודווח בנפרד על כל בדיקה שלא עוברת. אל תסמן package כ'הושלם' לפני שהבדיקות שלו ירוקות בפועל.ומה עם Mythos?
במקביל ל-Opus 4.8, Anthropic רמזה על Mythos — מחלקת המודלים המתקדמת ביותר שלה, שכרגע ב-preview למספר מצומצם של ארגונים לעבודת cybersecurity. לפי ההכרזה, היא צפויה להגיע לכלל הלקוחות 'בשבועות הקרובים', אחרי שיושלמו מנגנוני הבטיחות. כלומר, Opus 4.8 הוא לא קצה הקרחון — אלא המודל הזמין-לכל הטוב ביותר עד שהדור הבא ייפתח.
השורה התחתונה למפתח vibe-coding: אותו מחיר, אבל סוכן שמשקר פחות, רץ מקבילית בקנה מידה גדול, ויודע לתפעל דפדפן ברמה הגבוהה ביותר שנמדדה — שדרגו את Claude Code והריצו את ה-loop הכבד שדחיתם.
מקורות
- Introducing Claude Opus 4.8 (official Anthropic announcement)
- Anthropic Launches Claude Opus 4.8 With Gains in Coding and Honesty - MacRumors
- Anthropic releases new model, Opus 4.8 - Axios
- Claude Opus 4.8 is here: effort controls, dynamic workflows, cheaper fast mode - The New Stack
- Claude Opus 4.8 is now available on AWS - AWS Machine Learning Blog
- Pricing - Claude API Docs (1M context GA, caching/batch discounts)
נקודות עיקריות
- Opus 4.8 זמין מהיום הראשון בכל מקום: Claude Pro/Max/Team/Enterprise, Claude Platform, AWS, Google Cloud ו-Microsoft Foundry — מזהה המודל הוא claude-opus-4-8.
- התמחור לא עלה: 5$ למיליון טוקני קלט / 25$ פלט, עם עד 90% חיסכון ב-prompt caching ו-50% ב-batch.
- Fast mode רץ פי 2.5 מהר (10$/50$ למיליון טוקנים) — Anthropic טוענת שהוא זול פי שלושה לעומת מודלים קודמים.
- 84% ב-Online-Mind2Web — לדברי Anthropic התוצאה החזקה ביותר שבדקה ב-browser-agent, מעל Opus 4.7 ו-GPT-5.5.
- Claude Code מקבל dynamic workflows (research preview): מאות subagents מקביליים בסשן אחד, למיגרציות בקנה מידה של מאות אלפי שורות.
- המודל פי ארבעה פחות נוטה להעביר פגמים בקוד שלו בלי הערה, ומסמן אי-ודאות יותר — פחות hallucinations בעבודה אגנטית.
שאלות נפוצות
מתי שוחרר Claude Opus 4.8 ואיפה הוא זמין?
המודל שוחרר ב-28 במאי 2026 וזמין מהיום הראשון בכל מקום: Claude Pro, Max, Team ו-Enterprise, וגם דרך Claude Platform, AWS, Google Cloud ו-Microsoft Foundry. מזהה המודל ל-API הוא claude-opus-4-8.
האם המחיר עלה בעקבות שדרוג היכולות?
לא. התמחור הסטנדרטי נשמר: 5$ למיליון טוקני קלט ו-25$ למיליון טוקני פלט, עם עד 90% חיסכון בעזרת prompt caching ו-50% ב-batch. חלון ההקשר המלא של 1M טוקנים כלול בתמחור הסטנדרטי וכבר GA.
מה זה fast mode וכמה הוא עולה?
Fast mode הוא מצב הרצה מהיר פי 2.5 שעולה 10$ למיליון טוקני קלט ו-50$ למיליון פלט. Anthropic טוענת שהוא זול פי שלושה לעומת מצבי המהירות במודלים קודמים — מתאים ל-loops אגנטיים צפופים שבהם הלטנסי הוא הצוואר.
מה חדש ב-Claude Code עם Opus 4.8?
נוסף dynamic workflows ב-research preview: Claude מתכנן משימה ואז מריץ מאות subagents מקביליים בסשן אחד, מה שמאפשר מיגרציות בקנה מידה של מאות אלפי שורות קוד. בנוסף נוספה הגדרת effort מתכווננת ב-Claude.ai וב-Cowork.
מתי יוצא Mythos?
Mythos היא מחלקת המודלים המתקדמת ביותר של Anthropic, כרגע ב-preview למספר מצומצם של ארגונים לעבודת cybersecurity. לפי ההכרזה היא צפויה להגיע לכלל הלקוחות 'בשבועות הקרובים', אחרי השלמת מנגנוני בטיחות.