בנצ'מרק ScratchWorld: בדיקת סוכני AI ב-Scratch

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

בנצ'מרק ScratchWorld: בדיקת סוכני AI ב-Scratch

חוקרים השיקו את ScratchWorld, בנצ'מרק לבדיקת סוכני AI ב-Scratch. הוא חושף פערים בביצוע GUI ומציע הערכה מדויקת. גלו כיצד זה משפיע על עסקים.

ScratchWorld Scratch

קרא עוד

Moltbook: רשת חברתית ראשונה לסוכני AI שצומחת בברק

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

Moltbook: רשת חברתית ראשונה לסוכני AI שצומחת בברק

Moltbook, רשת חברתית לסוכני AI, צומחת במהירות ומציגה שיח פוליטי ורעיל. מחקר חדש חושף ממצאים מדאיגים – גלו כיצד זה משפיע על עסקים.

Moltbook

קרא עוד

מודלי LLM נכשלים בהתאמה תרבותית של מתכונים

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

מודלי LLM נכשלים בהתאמה תרבותית של מתכונים

מחקר חדש מוכיח שמודלי שפה גדולים נכשלים בהתאמה תרבותית של מתכונים, בניגוד לבני אדם. זה חושף מגבלות יסודיות ב-AI. גלו את הממצאים וההשלכות לעסקים.

GlobalFusion

קרא עוד

OmniSapiens-7B: מודל בסיסי חדש להתנהגות חברתית ב-AI

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

OmniSapiens-7B: מודל בסיסי חדש להתנהגות חברתית ב-AI

OmniSapiens-7B 2.0 מציג פריצת דרך בעיבוד התנהגות חברתית ב-AI באמצעות HARPO. שיפורים משמעותיים בביצועים – גלו איך זה משפיע על עסקים.

OmniSapiens-7B HARPO

קרא עוד

NSAM: מסכות פעולות חכמות ללמידה מחוזקת עמוקה

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

NSAM: מסכות פעולות חכמות ללמידה מחוזקת עמוקה

חוקרים מציגים NSAM, מסגרת שמונעת פעולות בלתי אפשריות בלמידה מחוזקת עמוקה ומשפרת יעילות. גלו כיצד זה משפיע על עסקים.

NSAM Deep Reinforcement Learning

קרא עוד

Flow of Spans (FoSS): מודל שפה חדשני מבוסס GFlowNets

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

Flow of Spans (FoSS): מודל שפה חדשני מבוסס GFlowNets

חוקרים מפתחים FoSS, מודל שפה מבוסס GFlowNets שמשפר יצירת טקסט ב-12.5%. גישה זו פותחת אפשרויות חדשות לעסקים ישראליים באוטומציה.

FoSS GFlowNets Transformer

קרא עוד

מודלי שפה גדולים מייצרים תיאורים מופשטים לתכנון AI

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

מודלי שפה גדולים מייצרים תיאורים מופשטים לתכנון AI

מחקר חדש מראה שמודלי שפה גדולים יכולים לייצר תיאורים מופשטים לתכנון כללי עם debugging אוטומטי. זה פותח אפשרויות חדשות לאוטומציה עסקית. גלו כיצד זה משפיע על עסקים ישראליים.

QNP GP

קרא עוד

AgoraBench: בנצ'מרק חדש לשיפור משא ומתן ב-LLM

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

AgoraBench: בנצ'מרק חדש לשיפור משא ומתן ב-LLM

חוקרים השיקו AgoraBench, בנצ'מרק חדש לבדיקת משא ומתן ב-LLM. הכלי חושף חולשות ומשפר ביצועים דרך משוב תועלת. גלו כיצד זה משפיע על עסקים.

AgoraBench MERIT Feedback

קרא עוד

Found-RL: למידת חיזוק משופרת לנהיגה אוטונומית עם מודלים יסודיים

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

Found-RL: למידת חיזוק משופרת לנהיגה אוטונומית עם מודלים יסודיים

Found-RL משלבת מודלים יסודיים בלמידת חיזוק לנהיגה אוטונומית ומאפשרת אימון בזמן אמת. גלו את החידושים שמשפרים יעילות וביצועים. התחילו עם [סוכני AI](/services/ai-agents) עכשיו.

Found-RL Reinforcement Learning Vision-Language Models

קרא עוד

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

האם חשיבה איטית עוזרת ל-AI בתיאוריית הנפש? מחקר חדש חושף כשלונות

מודלי חשיבה גדולים נכשלים בתיאוריית הנפש למרות הצלחות במתמטיקה. מחקר חדש חושף כשלונות בחשיבה איטית וקיצורי דרך. גלו את ההשלכות לעסקים.

arXiv:2602.10625v1 Large Reasoning Models Theory of Mind

קרא עוד

LiveMedBench: בנצ'מרק רפואי חדשני למודלי שפה גדולים

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

LiveMedBench: בנצ'מרק רפואי חדשני למודלי שפה גדולים

LiveMedBench חושף חולשות במודלי LLM ברפואה עקב זיהום נתונים. בנצ'מרק חדשני זה מבטיח בדיקות אמיתיות ומגלה הצלחה נמוכה של 39.2% במודלים הטובים ביותר. חיוני לעסקי בריאות בישראל.

LiveMedBench

קרא עוד

גילוי הבדלים אסטרטגיים: LLM עולים על בני אדם

מחקר

12 בפברואר 2026

4 דקות

מ־arXiv cs.AI

גילוי הבדלים אסטרטגיים: LLM עולים על בני אדם

מחקר חדש מגלה שמודלי LLM מציגים התנהגות אסטרטגית עמוקה יותר מבני אדם במשחקי אבן-נייר-מספריים. גלו כיצד זה משפיע על עסקים.

AlphaEvolve

קרא עוד

xAI חושפת שאיפות בין-כוכביות במפגש כל העובדים

חדשות

12 בפברואר 2026

4 דקות

מ־TechCrunch

xAI חושפת שאיפות בין-כוכביות במפגש כל העובדים

xAI חשפה שאיפות בין-כוכביות במפגש ציבורי: מפעלים על הירח, Macrohard שמתכנן רקטות ונתוני שימוש מרשימים. אילון מאסק מדבר על כיבוש הגלקסיות. גלו את ההשלכות לעסקים ישראליים והתחילו להטמיע AI מתקדם עכשיו.

xAI Elon Musk Grok

קרא עוד

Modal Labs מגייסת 2.5 מיליארד דולר בתשתית השמה AI

חדשות

11 בפברואר 2026

4 דקות

מ־TechCrunch

Modal Labs מגייסת 2.5 מיליארד דולר בתשתית השמה AI

Modal Labs, סטארט-אפ להשמה AI, במו"מ לגיוס בשווי 2.5 מיליארד דולר – כפול מהשווי הקודם. ARR של 50 מיליון דולר. גלו כיצד זה משפיע על עסקים ישראליים. קראו עכשיו!

Modal Labs General Catalyst Erik Bernhardsson

קרא עוד

חדשות

11 בפברואר 2026

4 דקות

מ־TechCrunch

גלין נלחמת על שכבת ה-AI בכל ארגון

Glean מתפתחת לעוזר AI לעבודה ששולט בשכבה הבסיסית של כל הארגון ומתחרה בענקיות. גייסה 150 מיליון דולר בשווי 7.2 מיליארד. גלו כיצד זה משפיע על עסקים ישראליים.

Glean Arvind Jain Microsoft

קרא עוד