VIGIL: זמן ריצה רפלקטיבי שמתקן סוכני AI בעצמם
סוכני AI נשברים בקלות? VIGIL היא זמן ריצה רפלקטיבי שמאבחן כשלים, מציע תיקונים ומתקן עצמי – ללא התערבות אנושית. במקרה בדיקה, תיקנה השהיות וקונפליקטים. קראו עכשיו! (92 מילים)
קרא עודמחקרים ופרסומים אקדמיים בתחום הבינה המלאכותית
סוכני AI נשברים בקלות? VIGIL היא זמן ריצה רפלקטיבי שמאבחן כשלים, מציע תיקונים ומתקן עצמי – ללא התערבות אנושית. במקרה בדיקה, תיקנה השהיות וקונפליקטים. קראו עכשיו! (92 מילים)
קרא עודכשל לבבי גורם לאשפוזים חוזרים רבים, ו-ClinNoteAgents משתמשת ב-LLM כדי לנתח רשומות קליניות ולחזות סיכונים. קראו כיצד המערכת משנה את חוקי המשחק. (48 מילים) – הרחבה מלאה זמינה.
קרא עודגליובלסטומה, סרטן מוח קטלני, זוכה למערכת AI מקיפה לאבחון ותכנון טיפול. הפרויקט מפחית עלויות ב-22x ומשפר דיוק – קראו על הפוטנציאל להצלת חיים. (48 מילים)
קרא עודמודלי עולם מבוססי טרנספורמר משתפרים עם מנגנוני זיכרון חדשים שמאריכים את זיכרונם ומאפשרים תכנון ארוך טווח. קראו את הניתוח המלא.
קרא עודמחקר חדש מוכיח: פרסונות אסטרטגיות משפרות ביצועי LLMs במשחק PERIL, אך רק עם מתווך מתקדם. גלו כיצד ליישם זאת בעסקים. קראו עכשיו!
קרא עודJT-DA-8B הוא מודל שפה גדול חדש לניתוח טבלאות מורכבות, מבוסס על מאגר של 3 מיליון טבלאות. קראו על הזרימה החדשנית ועל הביצועים המרשימים. קראו עכשיו!
קרא עודמערכות LLM רב-סוכנים סובלות מכשלים מורכבים, אך DoVer – מסגרת דיבוג חדשה – מתקנת 18-49% מהם בעזרת התערבויות חכמות. קראו על התוצאות המרשימות. (92 מילים)
קרא עודProAgent משנה את כללי המשחק בעולם סוכני ה-LLM: עוזר פרואקטיבי שקורא את הסביבה ומספק עזרה ללא הוראות. קראו על הטכנולוגיה שמשפרת דיוק ב-33% ועוד. קראו עכשיו! (92 מילים)
קרא עודסוכני LLM פגיעים להתקפות IPI שמשבשות אותם. ארכיטקטורת CCA מציעה פיקוח מלא ומאוזן. קראו עכשיו על הפתרון החדשני.
קרא עודמודלי שפה גדולים במערכות סוכניות זקוקים להערכה אמינה. ICC חושף חוסר עקביות ומבדיל שיפורים אמיתיים. קראו על התוצאות ב-GAIA ו-FRAMES.
קרא עודמדיניות AI בכתבי עת נכשלה: שימוש זינק למרות 70% כללים. רק 0.1% מגלים שימוש. קראו את המחקר המלא.
קרא עודמודל LightSearcher החדש משפר יעילות חיפוש עמוק ב-AI ב-40% מבלי לפגוע בדיוק. קראו על הזיכרון החווייתי שמשנה את כללי המשחק. קראו עכשיו.
קרא עודמחקר חדש חושף כיצד תיבות אמונות בפרומפטים של סוכני LLM משנות התנהגות, מגבירות עמידות ומשפרות שכנוע בתרחישי דיון. קראו עכשיו! (48 מילים)
קרא עודמודלי שפה גדולים עלולים לטעות בסביבות קריטיות. UncertaintyZoo – כלי חדש שמאחד 29 שיטות להערכת אי ודאות, נבדק בהצלחה על זיהוי פגיעויות בקוד. קראו עכשיו על הפוטנציאל לעסקים ישראלים.
קרא עודGENIUS, מסגרת AI חדשה, מאפשרת סימולציות חומרים אוטונומיות עם 80% הצלחה. קראו כיצד היא משנה את ICME לקראת עידן הנגישות. קראו עכשיו המלצות ליישום.
קרא עודמודלי שפה גדולים מתקשים בחשיבה ארוכת טווח? DaGRPO פותרת בעיות יציבות ב-GRPO עם תיקון גרדיאנט והגברת נתונים, ומשיגה שיאים במבחנים. קראו על הפריצה החדשה.
קרא עוד