RAG

יצירה מבוססת אחזור

שיטה שמשלבת חיפוש במסמכים שלכם עם יצירה של AI — כדי שהתשובה תהיה מבוססת על העובדות שלכם.

בקצרה

RAG (Retrieval-Augmented Generation) הוא ארכיטקטורה שמחברת חיפוש סמנטי במסמכים שלכם עם LLM. במקום שהמודל ינסה לזכור או להמציא, הוא קודם מחפש בקובץ הידע שלכם — ואז מייצר תשובה מבוססת על המסמכים שמצא.

למה זה חשוב לעסק שלכם

RAG פותר את שני הכאבים הגדולים של LLMs: 1) הזיות (כשהמודל ממציא עובדות), 2) ידע ישן (המודל לא יודע מה קרה אחרי תאריך האימון). עם RAG הסוכן עובד על המידע שלכם — מסמכים, FAQs, קטלוג מוצרים — ומחזיר תשובות מדויקות שמצטטות מקור.

דוגמה מספרית

עסק עם 200 מסמכי מדיניות פנימיים. עובד שואל "כמה ימי חופש מגיעים אחרי 3 שנים?". RAG: 1) ממיר את השאלה לאמבדינג, 2) שולף את 3 המסמכים הרלוונטיים ביותר ממאגר הוקטורים, 3) שולח אותם ל-LLM יחד עם השאלה, 4) מקבל תשובה מדויקת עם ציטוט המקור. בלי RAG: המודל היה מנחש.

טעויות נפוצות

לא להגדיר רענון של מאגר הידע. RAG על מסמכים מ-2022 = תשובות מ-2022.
לחתוך מסמכים בצורה אקראית (chunking). חיתוך גרוע = שליפה גרועה = תשובה גרועה.
לסמוך על RAG בלי בקרה. תמיד לתעד מקור ולאפשר לבדוק.

בקצרה

למה זה חשוב לעסק שלכם

דוגמה מספרית

טעויות נפוצות

מונחים קשורים