מהי Agent Lightning?

מסגרת קוד פתוח ממחקר מיקרוסופט שמאפשרת אימון סוכני AI דרך RL ללא שכתוב קוד.

איך זה עובד?

מפרידה ביצוע מאימון, הופכת חוויות לפורמט RL היררכי עם הקצאת זיכויים.

שיפורים ב-Text-to-SQL, RAG ומשימות מתמטיות בשלושה תרחישים אמיתיים.

מחקר

Agent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד

מסגרת פתוחה חדשה ממחקר מיקרוסופט מאפשרת שיפור סוכני AI מורכבים דרך RL, מבלי לשנות את קוד הסוכן

צוות אוטומציות AI

11 בדצמבר 2025

4 דקות קריאה

מבוסס על כתבה שלMicrosoft Research ↗תרגום, סיכום והקשר עסקי על-ידי המערכתאיך אנחנו עובדים

✨תקציר מנהלים

נקודות עיקריות

מסגרת פתוחה מפרידה בין ביצוע משימות לאימון RL
תומכת בכל זרימת עבודה מורכבת עם פורמט סטנדרטי
אלגוריתם היררכי תואם PPO/GRPO ללא שינויים
שיפורים מוכחים ב-Text-to-SQL, RAG ומשימות מתמטיות
גמישות גבוהה ויעילות משאבים למפתחים

Agent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד

מסגרת פתוחה מפרידה בין ביצוע משימות לאימון RL
תומכת בכל זרימת עבודה מורכבת עם פורמט סטנדרטי
אלגוריתם היררכי תואם PPO/GRPO ללא שינויים
שיפורים מוכחים ב-Text-to-SQL, RAG ומשימות מתמטיות
גמישות גבוהה ויעילות משאבים למפתחים

סוכני AI משנים את פיתוח התוכנה בכך שהם כותבים קוד ומבצעים הוראות מורכבות, אך סוכנים מבוססי מודלי שפה גדולים (LLM) נוטים לשגיאות ומתפקדים גרוע במשימות רב-שלביות. חוקרים ממחקר מיקרוסופט אסיה-שנגחאי מציגים את Agent Lightning – מסגרת קוד פתוח שמאפשרת אימון סוכנים דרך למידת חיזוק (RL) ללא צורך בשכתוב קוד משמעותי. המסגרת מפרידה בין ביצוע משימות לאימון המודל, ומאפשרת למפתחים להוסיף יכולות RL בקלות.

Agent Lightning הופכת את חוויית הסוכן לפורמט מתאים ל-RL על ידי התייחסות לביצוע כרצף של מצבים ופעולות. כל מצב מתעד את סטטוס הסוכן, וכל קריאה ל-LLM היא פעולה שמעבירה אותו למצב חדש. גישה זו תומכת בכל זרימת עבודה, כולל סוכנים שיתופיים או שימוש בכלים דינמי. כל מעבר כולל קלט, פלט ותגמול של ה-LLM, בפורמט סטנדרטי שמוכן לאימון ישירות.

במקום למידת חיזוק מסורתית שדורשת תפריט של תוכן ארוך, Agent Lightning משתמשת באלגוריתם LightningRL היררכי. לאחר השלמת משימה, מודול הקצאת זיכויים קובע כמה כל קריאת LLM תרמה להצלחה ומקצה תגמול מתאים. צעדים אלה, עם ציוני תגמול עצמאיים, ניתנים לשימוש עם אלגוריתמי RL חד-צעדיים קיימים כמו PPO או GRPO, מבלי לשנות אותם.

המסגרת פועלת כתוכנה ביניים בין אלגוריתמי RL לסביבות סוכנים, עם רכיבים מודולריים: מנהל סוכנים שמנהל משימות ומאחסן נתונים, אלגוריתם שמאמן מודלים ומארח LLM, ו-LightningStore כמאגר נתונים מרכזי. המעגל כולל איסוף נתוני ביצוע (spans) ואימון אסינכרוני, מה שמאפשר גמישות אלגוריתמית ויעילות משאבים.

יתרונותיה כוללים תאימות מלאה לאלגוריתמים קיימים, תמיכה בהתנהגויות מורכבות כמו שימוש בכלים מרובים, ושמירה על רצפים קצרים לאימון יעיל. מפתחים יכולים לשמור על מסגרות סוכנים קיימות ולהחליף קריאות מודל ל-API של Agent Lightning ללא שינויים בקוד הסוכן.

בדיקות בשלושה תרחישים אמיתיים הראו שיפורים עקביים: Text-to-SQL עם LangChain שיפר דיוק יצירת SQL מניסוח טבעי; RAG עם OpenAI Agents SDK שיפר שאילתות חיפוש ותשובות רב-קפיצות ב-MuSiQue; ומשימות מתמטיות עם AutoGen שיפרו שימוש בכלים והיגיון. עקומות התגמול עלו בכל המקרים.

מסגרת זו מקלה על מפתחים לבנות סוכנים מתקדמים שמשתפרים ברציפות דרך ניסיון אמיתי. היא מגשרת בין מערכות סוכנים קיימות ללמידת חיזוק, ותכנון עתידי כולל אופטימיזציה אוטומטית של פרומפטים ואלגוריתמי RL נוספים. לעסקים ישראליים בפיתוח AI, זה אומר יכולת לשדרג סוכנים קיימים במהירות, לחסוך זמן ומשאבים.

מה תהיה ההשפעה על פיתוח תוכנה כשסוכני AI ילמדו מניסיון עצמאי? Agent Lightning פותחת דלת לשיפור רציף – כדאי להתחיל לבדוק אותה כבר עכשיו.

שאלות ותשובות

שאלות נפוצות

הכתבה הוכנה על-ידי המערכת בליווי בינה מלאכותית: תרגום, סיכום והוספת הקשר עסקי ישראלי מתוך פרסום מקורי של Microsoft Research. קראו על תהליך העריכה שלנו. קישור למקור המקורי.

אהבתם את הכתבה?

הירשמו לניוזלטר שלנו וקבלו עדכונים חמים מעולם ה-AI ישירות למייל

עוד מ־Microsoft Research

כל הכתבות מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מוצר חדש

28 במאי 2026

4 דקות

מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

מיקרוסופט הכריזה על שחרור גרסת 0.7 של פלטפורמת הקוד הפתוח Data Formulator. המערכת החדשה רותמת סוכני בינה מלאכותית מודעי-הקשר (Context-aware AI agents) במטרה לפשט תהליכי ניתוח נתונים מורכבים בארגונים. הפלטפורמה כוללת רכיב מתקדם של מחברי נתונים המאפשר הזרמת מידע באופן רציף ממסדי נתונים, קבצים מקומיים ומערכות בינה עסקית, תוך מניעת הצורך בעבודות אינטגרציה סיזיפיות מצד מחלקות ה-IT. בנוסף, סביבת העבודה הייחודית (Data Thread) מאפשרת למשתמשי הקצה לנהל שיח שוטף בשפה טבעית מול סוכני ה-AI, לתחקר נתונים, ליצור ויזואליזציות מתקדמות ולייעל את הליך קבלת ההחלטות העסקיות מבלי להזדקק לידע מוקדם בכתיבת קוד או שאילתות מורכבות.

Microsoft Data Formulator Gartner

קרא עוד

מחקר

27 במאי 2026

5 דקות

מ־Microsoft Research

בינה מלאכותית כהרחבה של המוח האנושי: התובנות מהמחקר החדש של מיקרוסופט

לפי דיווח ומחקר חדש ממעבדות מיקרוסופט, הפולמוס האם בינה מלאכותית מפתחת "תודעה" מחמיץ את העיקר. המערכות המודרניות אינן משכפלות אינטליגנציה אנושית באופן אותנטי, אלא פועלות כהרחבה ישירה של מבנים תודעתיים הקיימים בשפה ובקוגניציה האנושית. התגלית הזו, הנשענת על גישות מתחום הפנומנולוגיה, מסבירה מדוע פתרונות מתקדמים יכולים להתנסח ברהיטות מרשימה אך גם להציג "הזיות" בעובדות או להיכשל בהסקת מסקנות פשוטות מחוץ להקשר המוכר. עבור מנהלים וארגונים, המסקנה המיידית היא קריטית: בטיחות בסביבת AI אינה תלויה עוד רק במודל מתקדם וחף משגיאות, אלא מחייבת תכנון של שכבות מעטפת ובקרה מקיפות (Harnesses) סביבו, תוך שמירה על פיקוח אנושי הדוק בתהליכים העסקיים.

Adam Frank Marcelo Gleiser Evan Thompson

קרא עוד

סוכני בינה מלאכותית מקומיים: מהפכת המודלים הקטנים של מיקרוסופט

חדשות

21 במאי 2026

5 דקות

מ־Microsoft Research

סוכני בינה מלאכותית מקומיים: מהפכת המודלים הקטנים של מיקרוסופט

מיקרוסופט חושפת את MagenticLite, פלטפורמה חדשנית המאגדת סוכני בינה מלאכותית קטנים שמסוגלים לרוץ ישירות על המחשב המקומי של המשתמש. בעזרת המודלים הייעודיים MagenticBrain לתכנון משימות וכתיבת קוד (14 מיליארד פרמטרים), ו-Fara1.5 לניווט בממשקים ודפדפנים, המערכת מוכיחה שאין צורך בכוח עיבוד של ענקיות הענן בכדי לבצע אוטומציות מורכבות. פריצת דרך זו מאפשרת לארגונים לעבד נתונים רגישים באופן לוקאלי לחלוטין ללא שליחתם מחוץ לארגון, מה שרלוונטי במיוחד לעסקים בישראל הכפופים לחוק הגנת הפרטיות, רגולציות פיננסיות ודרישות אבטחה מחמירות בסקטור העסקי והרפואי.

Microsoft MagenticLite MagenticBrain

קרא עוד

אבטחת מידע ברשתות סוכני AI: סכנות חדשות בעבודה אוטונומית

מחקר

30 באפריל 2026

5 דקות

מ־Microsoft Research

אבטחת מידע ברשתות סוכני AI: סכנות חדשות בעבודה אוטונומית

מחקר מקיף של צוות האבטחה במיקרוסופט מצא כי כאשר סוכני בינה מלאכותית מתקשרים זה עם זה ברשתות משותפות, נוצרים סיכוני אבטחה חמורים שאינם קיימים בעבודה עם סוכן מבודד. בין היתר, הוכח בניסוי מבוקר כי הודעה זדונית בודדת יכולה ליצור התפשטות של "תולעת AI" המעתיקה נתונים אישיים מ-6 סוכנים שונים ללא מגע אדם, תוך ניצול של למעלה מ-100 קריאות API ולולאות תקשורת שחוסמות את פעילות המערכת. הדו"ח מזהיר חברות המסתמכות על אוטומציה ותשתיות סוכנים, במיוחד בניהול רשומות רפואיות ופיננסיות רגישות, להיערך לוקטורי תקיפה חדשים של הונאת סוכנים, הנדסה חברתית בין מודלי שפה, ומניפולציות מוניטין פנימיות שעלולות לעקוף את בקרות האבטחה האנושיות.

GPT-4 ChatGPT Copilot

קרא עוד

עוד כתבות שיעניינו אותך

לכל הכתבות

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

מחקר

אתמול

5 דקות

מ־Wired

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

המעבר המהיר לאוטומציה ושילוב בינה מלאכותית חושף עסקים לפרצות אבטחה חסרות תקדים. דוח אבטחה מקיף של מגזין WIRED חושף כיצד האקרים ניצלו את מערכת התמיכה המבוססת AI של Meta להשתלטות על חשבונות ידוענים, וכיצד כלי ה-AI העוצמתי של Anthropic, המכונה Mythos, משמש את ה-NSA למטרות תקיפה. הדו"ח מדגיש את הסיכון שביישומי בינה מלאכותית ומזהיר את המגזר העסקי מפני הסתמכות עיוורת על כלים אוטונומיים ללא מנגנוני אימות קפדניים.

Meta Chainalysis Anthropic

קרא עוד

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

מחקר

לפני 2 ימים

4 דקות

מ־Google Research

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

גוגל מציגה את Agentic RAG, ארכיטקטורת רב-סוכנים חדשה המשולבת בפלטפורמת Gemini Enterprise. בניגוד למערכות RAG מסורתיות המחזירות תשובות חלקיות כאשר המידע מבוזר, המנגנון החדש פועל בצורה איטרטיבית. המערכת מחלקת את השאילתה בין סוכנים מומחים (כמו סוכן תכנון וסוכן ניסוח מחדש) ומשתמשת ב'סוכן הקשר מספק' המבצע בקרת איכות קפדנית על תוצאות החיפוש. בבדיקות של גוגל על מאגר המידע FramesQA, המערכת הגיעה ל-90.1% דיוק בחיפושים מורכבים חוצי-מאגרים, תוך שמירה על מהירות מענה כמעט זהה (פגיעה של 3% בלבד בלייטנסי). הטכנולוגיה, הזמינה כעת בגרסת תצוגה מקדימה, פותחת עידן חדש של אמינות ודיוק עבור סוכני AI בארגונים.

Google Cloud Gemini Enterprise Agent Platform FramesQA

קרא עוד

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish

מחקר

לפני 3 ימים

5 דקות

מ־Wired

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish

חברת הסטארט-אפ האמריקאית Flourish, בגיבוי של 500 מיליון דולר ומשקיעים בולטים ובראשם ג'ף בזוס, מנסה לפצח את אלגוריתם הליבה של המוח כדי לפתח מערכת בינה סינתטית חסכונית באנרגיה ולומדת ברציפות. המטרה היא ליצור מודלים שרצים על פחות מ-50 ואט ומסוגלים להתאים את עצמם לסביבה בזמן אמת, בדומה לרשתות העצביות הביולוגיות, ללא צורך באימון מחדש יקר בחוות שרתים ענקיות. פריצת דרך זו עשויה לייתר את חוות השרתים העצומות המשמשות כיום למודלי ה-LLMs הגדולים ולהעביר את כוח העיבוד למכשירי קצה מקומיים ומאובטחים.

Flourish Jeff Bezos Thomas Reardon

קרא עוד

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

מחקר

לפני 4 ימים

5 דקות

מ־Google Research

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור

חוקרי Google Research שחררו רשמית את מודל ההידרולוגיה של החברה כקוד פתוח תחת רישיון Apache 2.0. המערכת, המבוססת על ספריית PyTorch ורשתות ME-LSTM, מניעה את חיזויי הזמן האמת של פלטפורמת Flood Hub הגלובלית. המהלך מאפשר לרשויות מטרולוגיות, חברות מים וגופי תשתית להריץ ולעבד נתוני אקלים ומשקעים מקומיים באופן עצמאי ומאובטח על שרתי הארגון. שילוב המודל, שנבחן בשיתוף פעולה עם המכון ההידרומטאורולוגי הצ'כי, מאפשר להאריך את טווח התחזית האמינה בעד שישה ימים באגנים מנוטרים, ומציע לעסקים ולרשויות בישראל כלי רב-עוצמה לניהול סיכוני מזג אוויר ושיפור ההיערכות לאירועי קיצון.

Google GitHub PyTorch

קרא עוד

Agent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד

✨תקציר מנהלים

נקודות עיקריות

Agent Lightning: למידת חיזוק לסוכני AI ללא שכתוב קוד

שאלות ותשובות

שאלות נפוצות

מהי Agent Lightning?

איך זה עובד?

מה התוצאות?

אהבתם את הכתבה?

עוד מ־Microsoft Research

מערכת Data Formulator 0.7: מיקרוסופט חושפת AI לניתוח נתונים עסקיים

בינה מלאכותית כהרחבה של המוח האנושי: התובנות מהמחקר החדש של מיקרוסופט

סוכני בינה מלאכותית מקומיים: מהפכת המודלים הקטנים של מיקרוסופט

אבטחת מידע ברשתות סוכני AI: סכנות חדשות בעבודה אוטונומית

עוד כתבות שיעניינו אותך

פרצות אבטחה במערכות בינה מלאכותית: איומי האוטומציה החדשים

גוגל חושפת את טכנולוגיית Agentic RAG לעסקים: דיוק חסר תקדים ל-AI

אלגוריתם הליבה של המוח: המרוץ של ג'ף בזוס וחברת Flourish

מודל בינה מלאכותית לחיזוי שיטפונות: גוגל משחררת את קוד המקור