סמנטיק צ׳אנקינג למסמכים ארוכים: מהפך במהירות ובדיוק
**סמנטיק צ׳אנקינג למסמכים ארוכים הוא חלוקה של טקסט לפי נושא, לא לפי אורך קבוע.** זה חשוב כי איכות האחזור במערכות RAG תלויה ישירות באיכות המקטעים. במחקר חדש ב-arXiv, מודל דיסקרימינטיבי מבוסס Qwen3-0.6B תומך בעד 13 אלף טוקנים לקלט יחיד ומציג, לפי הדיווח, מהירות הסקה גבוהה פי 100 לעומת שלוש חלופות גנרטיביות מבוססות Qwen2-0.5B של Jina. עבור עסקים בישראל, המשמעות היא פוטנציאל ממשי לבנות מנועי חיפוש וידע טובים יותר למסמכים משפטיים, תיעוד שירות ונהלים, במיוחד כשהם מחוברים ל-Zoho CRM, ל-WhatsApp Business API ול-N8N.