למה LLM נכשלים במודלינג לומדים בחינוך K-12?

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

למה LLM נכשלים במודלינג לומדים בחינוך K-12?

מודלי שפה גדולים נכשלים במעקב אחר ידע מתפתח של תלמידים, לפי מחקר חדש. DKT מנצח את LLMs בביצועים וביציבות. קראו את הניתוח המלא.

Deep Knowledge Tracing EU AI Act

קרא עוד

TravelBench: בנצ'מרק חדש לסוכני AI בתכנון טיולים

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

TravelBench: בנצ'מרק חדש לסוכני AI בתכנון טיולים

בעידן שבו סוכני שפה גדולים (LLM) מבטיחים להפוך את התכנון היומיומי לקל יותר, האם הם באמת מסוגלים להתמודד עם משימות מורכבות כמו תכנון טיול? TravelBench, בנצ'מרק חדש שפורסם ב-arXiv, בודק זאת לעומק. קראו עכשיו על הבנצ'מרק שמשנה את כללי המשחק.

TravelBench LLM agents

קרא עוד

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

DICE: הערכה פרשנית ומדויקת למערכות RAG

מערכות RAG מתקדמות דורשות הערכה אמינה. DICE – שיטה חדשה המספקת שיפוטים פרשניים ויעילים, עם 85.7% התאמה למומחים. קראו עכשיו על הפריצה הזו!

DICE RAG RAGAS

קרא עוד

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

דיון מובנה משפר תחזיות AI: מחקר חדש מגלה

מחקר חדש מראה שדיון מובנה בין מודלי AI מגוונים משפר תחזיות ב-4%. קראו עכשיו על התוצאות המלאות!

GPT-5 Claude Sonnet 4.5 Gemini Pro 2.5

קרא עוד

SANet: רשת AI חכמה לאופטימיזציה צולבת ב-6G

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

SANet: רשת AI חכמה לאופטימיזציה צולבת ב-6G

בעידן ה-6G מציגים את SANet – רשת AI שמבינה מטרות משתמשים ומבצעת אופטימיזציה אוטונומית. שיפור של 14.61% בביצועים עם פחות חישובים. קראו עכשיו על הפריצה הזו!

SANet AgentNet MoPS

קרא עוד

לקחים ממדעי המוח ל-AI: פעולות, מבנה וזיכרון אפיזודי

מחקר

31 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

לקחים ממדעי המוח ל-AI: פעולות, מבנה וזיכרון אפיזודי

בעידן שבו מודלי שפה גדולים שולטים, מאמר חדש מציע לשלב לקחים ממדעי המוח: פעולות, מבנה היררכי וזיכרון אפיזודי. זה יפתור הזיות וחוסר בטיחות. קראו עכשיו!

קרא עוד

מסגרת סוכני AI חושפת 'שומר השער התחמוצתי' בחמצון אלומיניום

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

מסגרת סוכני AI חושפת 'שומר השער התחמוצתי' בחמצון אלומיניום

ננו-חלקיקי אלומיניום הם דלקים אנרגטיים מובילים, ומחקר חדש באמצעות מסגרת סוכני AI חושף את 'שומר השער התחמוצתי' ששולט בחמצונם. קראו עכשיו על המנגנונים הכפולים והפתרון למחלוקת בת עשורים. (112 מילים)

Aluminum nanoparticles AI Agents machine learning potential

קרא עוד

GatedBias: התאמה אישית קלה לגרפי ידע קפואים

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

GatedBias: התאמה אישית קלה לגרפי ידע קפואים

בעולם ההמלצות הדיגיטליות, מודלים יסודיים לגרפי ידע מצטיינים בחיזוי קישורים ברמת קבוצה, אך נכשלים בהתאמה אישית למשתמשים בודדים. GatedBias משנה זאת עם התאמה קלה בזמן אי-למידה. קראו עכשיו!

GatedBias Amazon-Book Last-FM

קרא עוד

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

HalluMat: זיהוי הזיות ב-LLM למדע חומרים

מודלי שפה גדולים משנים מחקר, אך הזיות מסכנות אמינות. HalluMatData ו-HalluMatDetector מציעים פתרון חדשני. קראו עכשיו על הפחתת 30% בהזיות.

HalluMatData HalluMatDetector

קרא עוד

Agent2World: יצירת מודלי עולם סמליים במשוב רב-סוכנים

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

Agent2World: יצירת מודלי עולם סמליים במשוב רב-סוכנים

בעידן שבו תכנון מבוסס מודלים הופך למרכזי בתחום הבינה המלאכותית, חוקרים מציגים את Agent2World – מסגרת רב-סוכנים מתקדמת שמאפשרת למודלי שפה גדולים לייצר מודלי עולם סמליים מדויקים יותר. קראו את המאמר המלא עכשיו!

Agent2World PDDL Deep Researcher

קרא עוד

סוכני LLM כמשקיעי VC: ניבוי הצלחת סטארט-אפים בסימולציה

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

סוכני LLM כמשקיעי VC: ניבוי הצלחת סטארט-אפים בסימולציה

בעולם הסטארט-אפים שבו שיעורי הכישלון גבוהים, חוקרים מציגים את SimVC-CAS – מערכת סוכני AI שמדמה החלטות VC קבוצתיות ומשפרת ניבויים ב-25%. קראו עכשיו על הפריצת דרך הזו! (112 מילים)

SimVC-CAS PitchBook LLM Agents

קרא עוד

DarkPatterns-LLM: מדד חדש לזיהוי מניפולציות ב-AI

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

DarkPatterns-LLM: מדד חדש לזיהוי מניפולציות ב-AI

האם AI מניפולציה אותנו? DarkPatterns-LLM חושף חולשות במודלי שפה גדולים. קראו על הבנצ'מרק החדשני שמשנה את כללי הבטיחות. קראו עכשיו!

DarkPatterns-LLM GPT-4 Claude 3.5

קרא עוד

SAMP-HDRL: שיטת AI חדשה לניהול תיקי השקעות מתקדמים

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

SAMP-HDRL: שיטת AI חדשה לניהול תיקי השקעות מתקדמים

שוק ההון אינו סטטי – שינויי משטר, מתאמים דינמיים ותנודתיות מאתגרים את ניהול תיקי ההשקעות. חוקרים מציגים את SAMP-HDRL, מסגרת למידת חיזוק עמוקה היררכית שמשפרת תשואות ב-5% ומעלה. קראו עכשיו על הפריצה הזו!

SAMP-HDRL Hierarchical Deep Reinforcement Learning SHAP

קרא עוד

M³ob: חיזוי תנועת אנושית רב-מודלי להמלצות מיקום מדויקות

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

M³ob: חיזוי תנועת אנושית רב-מודלי להמלצות מיקום מדויקות

בעולם שבו חיזוי תנועת אנושית משפיע על שירותי המלצות מיקום והכוונת פינוי, שיטות קיימות נתקלות בקשיים. חוקרים מציגים את M³ob – שיטת חיזוי תנועת אנושית רב-מודלי. קראו עכשיו על הפריצת דרך.

M³ob STRG STKG

קרא עוד

הנדסת הקשר מונדי: פרדיגמה חדשה לסוכני AI

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

הנדסת הקשר מונדי: פרדיגמה חדשה לסוכני AI

בעידן שבו דגמי שפה גדולים מניעים סוכנים אוטונומיים, ארכיטקטורות נוכחיות שבירות. הנדסת הקשר המונדית (MCE) משנה את חוקי המשחק עם מונאדים לפיתוח חזק. קראו עכשיו על הפרדיגמה החדשה!

Monadic Context Engineering Meta-Agents

קרא עוד

LSP: פרומפטינג לוגיקה סקצ'י לשיפור אמינות LLM

מחקר

31 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

LSP: פרומפטינג לוגיקה סקצ'י לשיפור אמינות LLM

מודלי שפה גדולים נכשלים בציות לכללים קפדנים, אך LSP – פרומפטינג לוגיקה סקצ'י – משיגה דיוק של 89% ומעלה. קראו על הפריצה החדשה.

Logic Sketch Prompting Gemma 2 Mistral

קרא עוד

הגדרה מאוחדת להזיות ב-AI: הבעיה בדגימת העולם

מחקר

29 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

הגדרה מאוחדת להזיות ב-AI: הבעיה בדגימת העולם

בעידן שבו מודלי שפה גדולים מניעים חדשנות עסקית, הבעיית ההזיות נותרת אתגר מרכזי אפילו במודלים המובילים בעולם. מאמר חדש מציע הגדרה מאוחדת ומציע בנצ'מרקים חדשים. קראו עכשיו כדי להבין איך לשפר את המודלים שלכם.

קרא עוד