יצירה מבוססת אחזור
שיטה שמשלבת חיפוש במסמכים שלכם עם יצירה של AI — כדי שהתשובה תהיה מבוססת על העובדות שלכם.
בקצרה
RAG (Retrieval-Augmented Generation) הוא ארכיטקטורה שמחברת חיפוש סמנטי במסמכים שלכם עם LLM. במקום שהמודל ינסה לזכור או להמציא, הוא קודם מחפש בקובץ הידע שלכם — ואז מייצר תשובה מבוססת על המסמכים שמצא.
למה זה חשוב לעסק שלכם
RAG פותר את שני הכאבים הגדולים של LLMs: 1) הזיות (כשהמודל ממציא עובדות), 2) ידע ישן (המודל לא יודע מה קרה אחרי תאריך האימון). עם RAG הסוכן עובד על המידע שלכם — מסמכים, FAQs, קטלוג מוצרים — ומחזיר תשובות מדויקות שמצטטות מקור.
דוגמה מספרית
עסק עם 200 מסמכי מדיניות פנימיים. עובד שואל "כמה ימי חופש מגיעים אחרי 3 שנים?". RAG: 1) ממיר את השאלה לאמבדינג, 2) שולף את 3 המסמכים הרלוונטיים ביותר ממאגר הוקטורים, 3) שולח אותם ל-LLM יחד עם השאלה, 4) מקבל תשובה מדויקת עם ציטוט המקור. בלי RAG: המודל היה מנחש.
טעויות נפוצות
- לא להגדיר רענון של מאגר הידע. RAG על מסמכים מ-2022 = תשובות מ-2022.
- לחתוך מסמכים בצורה אקראית (chunking). חיתוך גרוע = שליפה גרועה = תשובה גרועה.
- לסמוך על RAG בלי בקרה. תמיד לתעד מקור ולאפשר לבדוק.