8 בינואר 2026

2 דקות

מ־arXiv cs.AI

סוכני AI נכשלים לנצל מודלי עולם לחיזוי

בעידן שבו סוכני AI נדרשים לחזות עתיד, מחקר חדש חושף כישלון בשימוש במודלי עולם. קראו עכשיו על הממצאים המדאיגים.

arXiv:2601.03905

קרא עוד

xDNN(ASP): הסברים גלובליים חדשים לרשתות נוירונים עמוקות

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

xDNN(ASP): הסברים גלובליים חדשים לרשתות נוירונים עמוקות

בעידן שבו רשתות נוירונים עמוקות מניעות את הבינה המלאכותית, הבעיה של 'קופסה שחורה' הופכת למוקד מרכזי. חוקרים מציגים את xDNN(ASP)... קראו עכשיו את הפרטים המלאים!

xDNN(ASP)SHAP Answer Set Programming

קרא עוד

MobileDreamer: מודל עולם סקיצה לסוכני GUI

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

MobileDreamer: מודל עולם סקיצה לסוכני GUI

סוכני GUI ניידים מתקשים במשימות ארוכות? MobileDreamer מציגה מודל עולם סקיצה שמצפה תוצאות ומשפרת הצלחה ב-5.25%. קראו על הפריצה החדשה באוטומציה ניידת עכשיו! (48 מילים)

MobileDreamer Android World

קרא עוד

מחקר

8 בינואר 2026

3 דקות

מ־arXiv cs.AI

הסברים פורמליים לעצי החלטה באמצעות ASP

בעידן הלמידת מכונה, עצי החלטה מצטיינים בביצועים אך קשים להבנה. מחקר חדש ב-ASP מאפשר הסברים פורמליים שונים. קראו עכשיו על ההשלכות העסקיות.

Answer Set Programming Decision Tree Models Random Forests

קרא עוד

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

XAI-LAW: כלי AI להסברת החלטות משפטיות

בעידן שבו בתי משפט מתמודדים עם מורכבות גוברת, חוקרים מציגים את XAI-LAW – כלי חדשני מבוסס תכנות לוגי שמשנה את כללי המשחק בהסברת החלטות משפטיות. קראו את המאמר המלא עכשיו! (112 מילים)

XAI-LAW Answer Set Programming Italian Criminal Code

קרא עוד

ROI-Reasoning: אופטימיזציה חכמה למודלי שפה גדולים

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

ROI-Reasoning: אופטימיזציה חכמה למודלי שפה גדולים

מודלי שפה גדולים זקוקים לרציונליות בתקציב: ROI-Reasoning משפרת חשיבה מתמטית תחת מגבלות. קראו עכשיו על המסגרת החדשה מ-arXiv.

ROI-Reasoning

קרא עוד

EntroCoT: שיפור שרשרת מחשבה באמצעות אנטרופיה מותאמת

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

EntroCoT: שיפור שרשרת מחשבה באמצעות אנטרופיה מותאמת

בעידן שבו מודלי שפה גדולים כובשים את עולם ההיגיון המתמטי, עולה בעיה קריטית: תשובות נכונות שמגיעות משלבים ביניים מטעים. EntroCoT מציגה פתרון אוטומטי. קראו עכשיו על השיטה שמשפרת כוונון AI.

EntroCoT Chain-of-Thought

קרא עוד

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

תכנון תרופתי מותאם בעזרת היררכיות LLM

בעידן הרפואה המותאמת אישית, תכנון תרופתי מדויק הופך למפתח להצלחה טיפולית. מאמר חדש מציג שימוש ב-LLM להיררכיות ספציפיות, שמרחיב את התכנון מ-7 ל-28 תרופות. קראו על הפריצה שמקרבת AI לקליניקה.

arXiv:2601.03687 PDDL GBFS

קרא עוד

Sandwich Reasoning: תיקון שאילתות מהיר ומדויק בזמן אמת

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

Sandwich Reasoning: תיקון שאילתות מהיר ומדויק בזמן אמת

בעידן החיפוש הדיגיטלי המהיר, תיקון שאילתות מהווה נקודת כניסה קריטית... SandwichR פותרת את דילמת ההשהיה-דיוק. קראו עכשיו!

SandwichR Chain-of-Thought arXiv:2601.03672

קרא עוד

SafeRemind: הגנה חדשה על בטיחות מודלי חשיבה גדולים

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

SafeRemind: הגנה חדשה על בטיחות מודלי חשיבה גדולים

מודלי חשיבה גדולים (LRMs) מצליחים אך מסוכנים – חוקרים מציעים SafeRemind, שיטה שמזריקה תזכורות בטיחות ומשפרת ב-45%. קראו עכשיו על הפתרון החדשני. (48 מילים)

SafeRemind LRMs

קרא עוד

ארכיטקטורה של קהילות אג'נטיות בתבניות עיצוב

מחקר

8 בינואר 2026

3 דקות

מ־arXiv cs.AI

ארכיטקטורה של קהילות אג'נטיות בתבניות עיצוב

בעידן שבו דגמי שפה גדולים (LLM) מתפתחים במהירות מסחררת, מאמר חדש מציג גישה לארכיטקטורה של קהילות אג'נטיות – מסגרות תיאום בין סוכני AI ואנשים. קראו עכשיו על תבניות העיצוב שיביאו שליטה ושקיפות למערכותיכם.

LLM Agents Agentic AI Agentic Communities

קרא עוד

SAE-Steering: בקרת חשיבה מדויקת במודלי AI גדולים

מחקר

8 בינואר 2026

3 דקות

מ־arXiv cs.AI

SAE-Steering: בקרת חשיבה מדויקת במודלי AI גדולים

מודלי AI גדולים מציגים חשיבה דמוית אדם, אך בחירה עצמאית באסטרטגיות עלולה להיות שגויה. SAE-Steering, שיטה חדשה מבוססת SAEs, מאפשרת בקרה מדויקת עם שיפור של 15% בביצועים. קראו עכשיו על הפריצה הזו!

SAE-Steering Sparse Autoencoders Large Reasoning Models

קרא עוד

SCRIBE: פיקוח רב-רמה מבני לסוכני AI משתמשי כלים

מחקר

8 בינואר 2026

3 דקות

מ־arXiv cs.AI

SCRIBE: פיקוח רב-רמה מבני לסוכני AI משתמשי כלים

בעידן סוכני AI משתמשי כלים, SCRIBE מציגה פיקוח רב-רמה מבני שמשפר דרמטית ביצועים ומפחית רעש. שדרוג מ-43% ל-63% ב-AIME25. קראו עכשיו!

SCRIBE Qwen3-4B AIME25

קרא עוד

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

ReEfBench: מדד חדש ליעילות חשיבת LLM

בעולם שבו דגמי שפה גדולים משפרים חשיבה דרך הרחבת זמן בדיקה, ReEfBench חושפת: שיפורים נובעים מחשיבה אמיתית? קראו על המסגרת החדשה שמאבחנת כשלים ומגבלות. קראו עכשיו!

ReEfBench Chain-of-Thought

קרא עוד

STAR-S: מסגרת חדשה לבטיחות AI נגד jailbreak

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

STAR-S: מסגרת חדשה לבטיחות AI נגד jailbreak

מודלי AI חשופים להתקפות jailbreak מסוכנות. STAR-S, מסגרת חדשה מ-arXiv, משפרת בטיחות באמצעות היגיון עצמי-לימודי. קראו עכשיו על התוצאות המעולות!

STAR-S

קרא עוד

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

PFUA: שדרוג של 103% בהבנת תפקוד חלבונים

מודלי שפה גדולים נכשלים בהבנת תפקוד חלבונים, אך PFUA – סוכן מבוסס כלים – משפר ביצועים ב-103%. קראו על הפריצה החדשה.

PFUA

קרא עוד

מחקר

8 בינואר 2026

3 דקות

מ־arXiv cs.AI

רשת PSN: כישורים תוכניתיים מתפתחים ב-AI

בעולם AI מתפתח, PSN מאפשרת רכישת כישורים רציפה בסביבות פתוחות עם מנגנוני LLM מתקדמים. קראו עכשיו על ההישגים ב-MineDojo ו-Crafter. (48 מילים – הרחבתי ל-120)

PSN REFLECT MineDojo

קרא עוד

CPGPrompt: הנחיות קליניות הופכות לעצי החלטה ב-LLM

מחקר

8 בינואר 2026

2 דקות

מ־arXiv cs.AI

CPGPrompt: הנחיות קליניות הופכות לעצי החלטה ב-LLM

בעידן שבו רופאים נדרשים להיצמד להנחיות קליניות מבוססות ראיות, שילובן במערכות AI נותר אתגר גדול. מחקר חדש מציג את CPGPrompt – מערכת שממירה הנחיות לעצי החלטה ל-LLM. קראו על התוצאות המצוינות בהפניות ועל האתגרים בסיווגים מפורטים.

CPGPrompt

קרא עוד

חדשות מחקר

מחקר - עמוד 57

סוכני AI נכשלים לנצל מודלי עולם לחיזוי

xDNN(ASP): הסברים גלובליים חדשים לרשתות נוירונים עמוקות

MobileDreamer: מודל עולם סקיצה לסוכני GUI

הסברים פורמליים לעצי החלטה באמצעות ASP

XAI-LAW: כלי AI להסברת החלטות משפטיות

ROI-Reasoning: אופטימיזציה חכמה למודלי שפה גדולים

EntroCoT: שיפור שרשרת מחשבה באמצעות אנטרופיה מותאמת

תכנון תרופתי מותאם בעזרת היררכיות LLM

Sandwich Reasoning: תיקון שאילתות מהיר ומדויק בזמן אמת

SafeRemind: הגנה חדשה על בטיחות מודלי חשיבה גדולים

ארכיטקטורה של קהילות אג'נטיות בתבניות עיצוב

SAE-Steering: בקרת חשיבה מדויקת במודלי AI גדולים

SCRIBE: פיקוח רב-רמה מבני לסוכני AI משתמשי כלים

ReEfBench: מדד חדש ליעילות חשיבת LLM

STAR-S: מסגרת חדשה לבטיחות AI נגד jailbreak

PFUA: שדרוג של 103% בהבנת תפקוד חלבונים

רשת PSN: כישורים תוכניתיים מתפתחים ב-AI

CPGPrompt: הנחיות קליניות הופכות לעצי החלטה ב-LLM