FIBER: בנצ'מרק חדש חושף הטיות עובדתיות ב-LLM

15 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

FIBER: בנצ'מרק חדש חושף הטיות עובדתיות ב-LLM

מודלים לשונאיים גדולים סובלים מהטיות עובדתיות תלויות שפה, כך מראה בנצ'מרק FIBER החדש באנגלית, איטלקית וטורקית. קראו על הממצאים.

FIBER Llama-3.1-8B Qwen-2.5-7B

קרא עוד

TriFlow: מסגרת רב-סוכנית חדשה לתכנון טיולים AI

מחקר

15 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

TriFlow: מסגרת רב-סוכנית חדשה לתכנון טיולים AI

TriFlow היא מסגרת AI רב-סוכנית חדשה לתכנון טיולים שמשיגה 97% הצלחה ביעילות גבוהה. קראו על השלבים והתוצאות המרשימות.

TriFlow TravelPlanner TripTailor

קרא עוד

מוטיף-2-12.7B-Reasoning: מודל שפה פתוח להיגיון מורכב

מחקר

15 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

מוטיף-2-12.7B-Reasoning: מודל שפה פתוח להיגיון מורכב

Motif-2-12.7B-Reasoning סוגר את הפער למודלים פרונטיריים עם מתכון אימון חדשני להיגיון מורכב והקשר ארוך. קראו על התוצאות המרשימות ועל ההשלכות לעסקים ישראליים.

Motif-2-12.7B-Reasoning

קרא עוד

AgentBalance: עיצוב חסכוני למערכות רב-סוכנים תחת אילוצי תקציב

מחקר

15 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

AgentBalance: עיצוב חסכוני למערכות רב-סוכנים תחת אילוצי תקציב

מערכות רב-סוכנים מבוססות LLM חיוניות לאפליקציות גדולות, אך חיסכון בעלויות הוא המפתח. AgentBalance מציגה גישה חדשה: קודם מודלים בסיסיים, אחר כך טופולוגיה, עם שיפורים של 10%-22%. קראו את המאמר המלא כדי להבין איך ליישם זאת בעסק שלכם. (98 מילים)

AgentBalance usail-hkust

קרא עוד

בפעם הראשונה: AI מנתח שפה ברמה של מומחה אנושי

מחקר

14 בדצמבר 2025

4 דקות

מ־Wired

בפעם הראשונה: AI מנתח שפה ברמה של מומחה אנושי

בפעם הראשונה, מודל AI כמו o1 של OpenAI מנתח שפה ברמה של מומחה אנושי, כולל רצורסיה וחוסר ודאות. קראו את המחקר המפתיע שמאתגר את צ'ומסקי. (48 מילים – הרחבה ל-120)

OpenAI o1 Gašper Beguš

קרא עוד

גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות

מחקר

13 בדצמבר 2025

4 דקות

מ־VentureBeat

גוגל חושפת מסגרת חדשה: סוכני AI מנהלים תקציבי כלים ביעילות

חוקרים מגוגל מציגים Budget Tracker ו-BATS – כלים שחוסכים 30%+ בעלויות כלים בסוכני AI ומשפרים דיוק. קראו כיצד ליישם בעסק שלכם.

Google UC Santa Barbara Gemini 2.5 Pro

קרא עוד

מדענים פיתחו עוזר AI לידיים ביוניות מתקדמות

מחקר

12 בדצמבר 2025

2 דקות

מ־Ars Technica

מדענים פיתחו עוזר AI לידיים ביוניות מתקדמות

ידיים ביוניות מתקדמות נזנחות על ידי חצי מהמשתמשים בגלל קושי בשליטה. חוקרים מאוניברסיטת יוטה פיתחו עוזר AI שמקל על התהליך ומחקה רפלקסים טבעיים. קראו את המאמר המלא כדי להבין את ההשלכות העסקיות.

Jake George University of Utah

קרא עוד

CAPTAIN: פתרון חדשני למניעת שינון במודלי דיפוזיה

מחקר

12 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

CAPTAIN: פתרון חדשני למניעת שינון במודלי דיפוזיה

מודלי דיפוזיה עלולים לשכפל תמונות אימון, אך CAPTAIN מציעה פתרון ללא אימון שמגן על פרטיות. קראו על החידוש שמשנה את כללי המשחק. עכשיו!

CAPTAIN diffusion models arXiv:2512.10655

קרא עוד

מחקר

12 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

סוכני LLM מייצרים מפות 3D באפס הכשרה

חוקרים פיתחו ארכיטקטורה ללא אימון שמשתמשת בסוכני LLM לייצור מפות 3D מורכבות מתיאורים בשפה טבעית. קראו על הפריצה ב-PCG.

PCG Actor agent Critic agent

קרא עוד

AgentProg: ניהול הקשר מונחה תוכנית לסוכני GUI ארוכי טווח

מחקר

12 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

AgentProg: ניהול הקשר מונחה תוכנית לסוכני GUI ארוכי טווח

סוכני GUI ניידים מתקשים במשימות ארוכות בשל עומס הקשרי. AgentProg פותרת זאת באמצעות ניהול מונחה תוכנית ומצב אמונה גלובלי, עם תוצאות SOTA. קראו על הפריצה החדשה.

AgentProg AndroidWorld MobileLLM

קרא עוד

מחקר

12 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

אתגרים בהערכת בטיחות LLM לרווחת משתמשים

מחקר חדש חושף כשלים בהערכת בטיחות LLM לעצות אישיות. הערכות סטנדרטיות מתעלמות מהקשר משתמש, מה שמוביל להמלצות מסוכנות לפגיעים. קראו על הממצאים והשלכות לעסקים.

GPT-5 Claude Sonnet 4 Gemini 2.5 Pro

קרא עוד

Phythesis: עיצוב מרכזי נתונים חסכוניים באנרגיה בעזרת LLMs ופיזיקה

מחקר

12 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

Phythesis: עיצוב מרכזי נתונים חסכוניים באנרגיה בעזרת LLMs ופיזיקה

מרכזי נתונים צורכים אנרגיה עצומה, ו-Phythesis משנה את חוקי המשחק: מסגרת המשלבת LLMs עם פיזיקה משפרת ב-57% הצלחת עיצוב וב-11.5% את PUE. קראו על הפריצה החדשה בעיצוב DC יעיל. (92 מילים)

Phythesis

קרא עוד

דחייה הופכת לקבלה: הפגיעות של שופטי LLM בביקורת מדעית

מחקר

12 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

דחייה הופכת לקבלה: הפגיעות של שופטי LLM בביקורת מדעית

שופטי LLM בביקורת מדעית פגיעים להתקפות PDF עוינות שמפילות דחיות לקבלות, לפי מחקר חדש. קראו על הממצאים המדאיגים וההשלכות.

AAAI Stanford Agents4Science GPT-5

קרא עוד

EmerFlow: המלצות פריטים חדשים בעזרת LLM ולמידת ייצוגים

מחקר

12 בדצמבר 2025

3 דקות

מ־arXiv cs.AI

EmerFlow: המלצות פריטים חדשים בעזרת LLM ולמידת ייצוגים

מחקר חדש מציג את EmerFlow, שיטה מופעלת LLM להמלצות פריטים חדשים עם מעט אינטראקציות. היא מעשירה תכונות, מיישרת embeddings ומשלבת meta-learning. ביצועים מעולים בסרטים ותרופות. קראו עכשיו להבין כיצד זה משפיע על העסק שלכם.

EmerFlow

קרא עוד

InfoCom: תקשורת בקילובייטים לתפיסה שיתופית בנהיגה אוטונומית

מחקר

12 בדצמבר 2025

2 דקות

מ־arXiv cs.AI

InfoCom: תקשורת בקילובייטים לתפיסה שיתופית בנהיגה אוטונומית

תפיסה שיתופית יעילה לנהיגה אוטונומית: InfoCom מפחיתה תקשורת בפי 440 תוך שמירה על דיוק. פריצת דרך במחקר AI שמשנה את חוקי המשחק. קראו עכשיו! (112 מילים)

InfoCom Where2comm ERMVP

קרא עוד