AgentCPM-Explore: סוכן AI קומפקטי שמתעלה על ענקיות
AgentCPM-Explore, סוכן AI של 4B פרמטרים, משיג SOTA ומתעלה על מודלים גדולים. גלו כיצד זה משנה את עולם האוטומציה. התחילו עם [סוכני AI](/services/ai-agents) עכשיו!
קרא עודמחקרים ופרסומים אקדמיים בתחום הבינה המלאכותית
AgentCPM-Explore, סוכן AI של 4B פרמטרים, משיג SOTA ומתעלה על מודלים גדולים. גלו כיצד זה משנה את עולם האוטומציה. התחילו עם [סוכני AI](/services/ai-agents) עכשיו!
קרא עודבנצ'מרק חדש חושף שמודלי שפה גדולים חלשים בסימבוליזציה לוגית ובניית מודלים נגדיים, למרות הצלחה בהערכת תקפות. גלו את ההשלכות לעסקים ישראליים.
קרא עודמודלי שפה גדולים נכשלים במשימות ארוכות בגלל חוסר יציבות אוטורגרסיבי, לא רק מורכבות. מחקר חדש מציע מבנים גרפיים כפתרון. גלו כיצד זה משפיע על עסקים ישראליים.
קרא עודבנצ'מרק GrAlgoBench חושף חולשות במודלי חשיבה גדולים: דיוק נמוך בגרפים גדולים וחשיבה מיותרת. גלו כיצד זה משפיע על AI עסקי.
קרא עודמחקר חדש בודק אם מודלי שפה גדולים פועלים כסוכנים רציונליים באתגרי אבחון רפואי. התוצאות חושפות תובנות על עקביות אמונותיהם. גלו כיצד זה משפיע על עסקים.
קרא עודמודלי שפה גדולים נכשלים בהיגיון פשוט? סקר חדש ב-arXiv מציג סיווג מקיף של כשלי היגיון ב-LLMs ומציע פתרונות. קראו על ההשלכות לעסקים ישראלים והורידו את המאגר מ-GitHub.
קרא עודJackpot מציגה מסגרת חדשה ללמידת חיזוק יעילה ב-LLM, מפחיתה עלויות ומשפרת יציבות. גלו כיצד זה משפיע על עסקים ישראליים.
קרא עודבעידן שבו מודלי שפה גדולים נתקלים בקושי להגיע לרמת חשיבה של מומחים, חוקרים מציגים את ALIVE – מסגרת אימון פורצת דרך שמתגברת על בעיית התגמולים ומשפרת ביצועים במתמטיקה, קוד ולוגיקה. קראו את הניתוח המלא עכשיו! (112 מילים)
קרא עודבעידן שבו אינטראקציה בין אדם למחשב הופכת חכמה יותר, סוכני GUI בנייד הם המפתח להתקדמות. החוקרים מציגים את M²-Miner, מסגרת כריית נתונים אוטומטית בעלות נמוכה ראשונה מסוגה. קראו כיצד היא משנה את חוקי המשחק. קראו עכשיו!
קרא עודמחלקות ניהול בבתי חולים גדולים מטפלות בלמעלה מ-10,000 בקשות יומיות. H-AdminSim, מסגרת סימולציה חדשה, מאפשרת בדיקת אוטומציה מבוססת LLM בזרימות עבודה מלאות עם שילוב FHIR. קראו עכשיו על הפוטנציאל לשיפור יעילות. (112 מילים)
קרא עודבעידן שבו LLM רפואיים תופסים מקום בחינוך מטופלים ברפואת עיניים, מחקר חדש בדק ארבעה מודלים קטנים ומצא: Meerkat-7B מצטיין. קראו עכשיו על התוצאות והשלכות.
קרא עודבעידן שבו דגמי שפה גדולים דורשים כוח חישוב עצום, RaBiT מציגה בינאריזציה חדשנית שמאיצה השפלה פי 4.5 ללא פגיעה בדיוק. קראו עכשיו על הפתרון המהפכני.
קרא עודבעידן שבו עסקים ישראליים משלבים נוכחות AI לניווט אוטומטי באינטרנט, חוקרים מפרסמים את בנצ'מרק PATHWAYS – קובץ של 250 משימות קבלת החלטות רב-שלביות. קראו עכשיו על הכשלים הגדולים!
קרא עודמודלי שפה גדולים פותרים בעיות מורכבות, אך מערכות אג'נטיות רבות נותרות קופסאות שחורות. AgentXRay חושף את זרימת העבודה הפנימית באמצעות קלט-פלט בלבד. קראו על הפריצה החדשה במחקר AI. קראו עכשיו!
קרא עודהאם AI יכול לנהל משא ומתן כמו MBA? PieArena חושף ש-GPT-5 מתעלה על סטודנטים. קראו עכשיו על הביצועים המהפכניים!
קרא עוד