הערכת T‑Shirt לפרויקטי LLM: למה היא נכשלת ואיך עוברים ל-Checkpoint Sizing
**הערכת T‑Shirt (S/M/L) לפרויקטי LLM ומערכות רב-סוכנים נוטה להיכשל כי המאמץ והסיכון אינם ליניאריים, ניסיון עבר לא משחזר תוצאות, ו”Done” אינו דטרמיניסטי. לפי arXiv:2602.17734, חמש הנחות בסיסיות של תכנון אג’ילי נשברות ב-AI—בעיקר בגלל שיחות רב-סבביות, “צימוד הדוק” בין דאטה למודל, וריבוי נקודות אינטגרציה.** החלופה המעשית היא Checkpoint Sizing: חלוקת הפרויקט לשערי החלטה עם מדדים (למשל דיוק ≥85% על 200 שיחות), תקרת תקציב לפיילוט, ועצירה יזומה אם המדדים לא מתקיימים. לעסקים בישראל שמחברים WhatsApp Business API ל-Zoho CRM דרך N8N, השיטה מצמצמת הפתעות, מאפשרת עמידה בחוק הגנת הפרטיות, ומונעת “התחייבות מוקדמת” על בסיס S/M/L.
קרא עוד