News (Hebrew only) | Automaziot AI | אוטומציות AI

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

סוכני LLM משתנים בעצמם: פער 55% בדיוק

סוכני LLM לא עקביים: מחקר חדש מראה פער של 55% בדיוק בין משימות עקביות ללא. בדקו את הכלים שלכם עכשיו!

Llama 3.1 70B GPT-4o Claude Sonnet 4.5

קרא עוד

מסגרת INTENT: תכנון מבוסס כוונה לסוכני AI מוגבלי תקציב

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

מסגרת INTENT: תכנון מבוסס כוונה לסוכני AI מוגבלי תקציב

מחקר חדש מציג INTENT, מסגרת תכנון שמאפשרת לסוכני LLM לבצע משימות עם כלים חיצוניים תחת תקציב קשיח. השיטה משפרת ביצועים ומתמודדת עם שינויי מחירים. גלו כיצד זה משפיע על עסקים ישראליים.

INTENT StableToolBench arXiv:2602.11541

קרא עוד

CausalAgent: ניתוח סיבתי אוטומטי בשפה טבעית

מוצר חדש

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

CausalAgent: ניתוח סיבתי אוטומטי בשפה טבעית

CausalAgent משנה את כללי המשחק בניתוח סיבתי: מערכת רב-סוכנים שמאפשרת ניתוח מקצה לקצה בשפה טבעית, ללא ידע מומחה. גלו כיצד זה משפיע על עסקים ישראליים.

CausalAgent

קרא עוד

AgentLeak חושף דליפת פרטיות בסוכני AI מרובים

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

AgentLeak חושף דליפת פרטיות בסוכני AI מרובים

AgentLeak חושף דליפות פרטיות פנימיות בסוכני AI מרובים, שמגיעות ל-68.9%. בדיקות פלט מפספסות 41.7% מהסיכונים. התחילו לבדוק ערוצים פנימיים עכשיו.

AgentLeak GPT-4o Claude 3.5 Sonnet

קרא עוד

למידת חיזוק עם עוגנים ויזואליים משפרת חשיבה ב-MLLMs

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

למידת חיזוק עם עוגנים ויזואליים משפרת חשיבה ב-MLLMs

מחקר חדש חושף כיצד למידת חיזוק עם עוגנים ויזואליים משפרת חשיבה ב-MLLMs, עם שיפור של 80.2% במשימות מתמטיות. גלה כיצד זה משפיע על עסקים ישראליים.

AT-RL RLVR MLLMs

קרא עוד

למידת חיזוק רב-סוכנים חסינה: פריצת דרך ב-MARL

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

למידת חיזוק רב-סוכנים חסינה: פריצת דרך ב-MARL

מחקר חדש מציג DrIGM – גישה חסינה ללמידת חיזוק רב-סוכנים שמתמודדת עם אי-ודאות אמיתית ומשפרת ביצועים. גלו כיצד ליישם זאת בעסק שלכם.

DrIGM VDN QMIX

קרא עוד

TRACER: מדד חדש להערכת אי ודאות בסוכני AI

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

TRACER: מדד חדש להערכת אי ודאות בסוכני AI

האם סוכני ה-AI שלכם נכשלים ברגעים קריטיים? TRACER, מדד חדש, מזהה כשלים בשיחות מרובות תורים. גלה איך לשפר אמינות עם [סוכני AI](/services/ai-agents).

TRACER τ²-bench sinatayebati

קרא עוד

Causal-JEPA: מודל עולם חדש ללמידת התערבויות אובייקטיות

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

Causal-JEPA: מודל עולם חדש ללמידת התערבויות אובייקטיות

חוקרים מציגים C-JEPA, מודל עולם אובייקטי שמשפר חשיבה נגד-עובדתית ב-20% ומאפשר תכנון סוכנים ב-1% מהמשאבים. גלה כיצד זה משפיע על אוטומציה עסקית.

C-JEPA galilai-group

קרא עוד

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

ReplicatorBench: בנצ'מרק חדש לבדיקת סוכני AI בשכפול מחקרים

ReplicatorBench הוא בנצ'מרק חדש לבדיקת סוכני AI בשכפול מחקרים במדעי החברה. הוא חושף חוזקות בחישובים וחולשות באיתור נתונים חדשים. גלו כיצד זה משפיע על אוטומציה עסקית.

ReplicatorBench ReplicatorAgent CenterForOpenScience

קרא עוד

מסגרת BAO מקדמת סוכני AI פרואקטיביים לגבולות חדשים

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

מסגרת BAO מקדמת סוכני AI פרואקטיביים לגבולות חדשים

מחקר חדש מציג את מסגרת BAO, שדוחפת סוכני LLM פרואקטיביים קדימה ומאזנת בין ביצועים למעורבות משתמשים. גלו כיצד זה משפיע על עסקים ישראליים.

BAO Agentic RL UserRL

קרא עוד

AgentNoiseBench: בנצ'מרק חדש לבדיקת סוכני LLM ברעש

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

AgentNoiseBench: בנצ'מרק חדש לבדיקת סוכני LLM ברעש

מחקר חדש מציג AgentNoiseBench לבדיקת עמידות סוכני LLM ברעש. התוצאות חושפות רגישות גבוהה – מה זה אומר לעסקים? קראו עכשיו.

AgentNoiseBench LLM agents

קרא עוד

BLPO: אופטימיזציית פרומפטים דו-רמתית לשופטי LLM רב-מודליים

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

BLPO: אופטימיזציית פרומפטים דו-רמתית לשופטי LLM רב-מודליים

מחקר חדש מציג BLPO, שיטת אופטימיזציית פרומפטים דו-רמתית לשיפור שופטי LLM רב-מודליים בהערכת תמונות AI. פתרון יעיל ללא אימון יקר. גלו כיצד זה משפיע על עסקים ישראליים.

BLPO LLM-as-a-Judge

קרא עוד

ארכיטקטורת PBSAI: אבטחת אחוזות AI ארגוניות

מחקר

13 בפברואר 2026

4 דקות

מ־arXiv cs.AI

ארכיטקטורת PBSAI: אבטחת אחוזות AI ארגוניות

עסקים ממהרים לשלב AI, אך חסרות ארכיטקטורות אבטחה. PBSAI מציעה פתרון מבוסס סוכנים מרובים לאחוזות AI ארגוניות. גלו כיצד ליישם.

PBSAI NIST AI RMF

קרא עוד

חדשות

13 בפברואר 2026

4 דקות

מ־TechCrunch

IBM מגדילה פי 3 גיוס מתחילים בעידן AI

IBM מתכננת להכפיל פי 3 גיוס מתחילים ב-2026, תוך התמקדות בכישורים אנושיים. גישה זו רלוונטית לעסקים ישראליים המתמודדים עם AI. גלו כיצד ליישם.

IBM Nickle LaMoreaux Bloomberg

קרא עוד

פינטרסט: יותר חיפושים מ-ChatGPT למרות רווחים מאכזבים

חדשות

13 בפברואר 2026

4 דקות

מ־TechCrunch

פינטרסט: יותר חיפושים מ-ChatGPT למרות רווחים מאכזבים

למרות רווחים מאכזבים, פינטרסט טוענת ל-80 מיליארד חיפושים חודשיים – יותר מ-ChatGPT. יותר ממחציתם מסחריים. גלו כיצד זה משפיע על עסקים ישראליים ומה לעשות.

Pinterest ChatGPT Bill Ready

קרא עוד

OpenAI משיקה מודל קודינג מהיר פי 15 על שבבי Cerebras

חדשות

12 בפברואר 2026

4 דקות

מ־Ars Technica

OpenAI משיקה מודל קודינג מהיר פי 15 על שבבי Cerebras

OpenAI השיקה מודל קודינג מהיר פי 15 על שבבי Cerebras. GPT-5.3-Codex-Spark מייצר 1,000+ טוקנים לשנייה, זמין למנויי Pro. גלו כיצד זה משפיע על פיתוח תוכנה.

OpenAI Cerebras GPT-5.3-Codex-Spark

קרא עוד