מה זה Weaviate?
Weaviate הוא מאגר נתונים וקטורי בקוד פתוח (Vector Database) שתוכנן במיוחד לצורכי אחזור מידע
סמנטי מהיר ומדויק, תוך שימוש ב־Machine Learning, בינה מלאכותית ואינדוקס באמצעות וקטורים
מרובי־ממדים (Embeddings).
Weaviate מאפשר חיפוש מבוסס משמעות (Semantic Search) ולא רק התאמה טקסטואלית פשוטה,
מה שהופך אותו לכלי מרכזי בעידן של NLP, בינה מלאכותית ומערכות המלצה.
Weaviate נבנה להיות מדרגי, מבוזר, real-time וקל לשימוש, עם RESTful API ו־GraphQL API,
כולל תמיכה בתוספים לניהול embeddings (כמו OpenAI, Cohere, Hugging Face) או הטמעה של
מודלים מותאמים אישית.
למה Weaviate משמש?
Weaviate נמצא בשימוש למטרות הבאות:
חיפוש סמנטי
במקום התאמה מילולית של טקסטים, Weaviate מאפשר חיפוש לפי משמעות — לדוגמה, שאילתה
כמו “מה ההבדל בין DNA ל־RNA?” תמצא מסמכים עם תוכן סמנטי רלוונטי, גם אם לא מופיעים בהם בדיוק אותם מילים.
מערכות המלצה (Recommendation Engines)
אפשר להשתמש בווקטורים כדי לייצג פרופילים של משתמשים ומוצרים, ולהמליץ על תכנים/מוצרים/שירותים
על בסיס קרבה וקטורית.
סיווג ואחזור מסמכים
ב־NLP, Weaviate מאפשר לאחסן ולחפש בתוך אלפי/מיליוני מסמכים באמצעות embeddings,
לשם הפקת מידע רלוונטי במהירות.
תמיכה בצ’אטבוטים מבוססי Retrieval Augmented Generation (RAG)
Weaviate יכול לשמש בסיס ידע תומך־קונטקסט למודלים כמו GPT, כך שהמודל מקבל תשובות ממאגר מסמכים
ולא רק מהמודל הטרייני.
קלאסיפיקציה ואנליזה של תמונות, קוד, אודיו וטקסט
באמצעות embeddings של סוגי תוכן שונים.
ארכיטקטורה של Weaviate
Core Vector Engine – אחראי על שמירת הנתונים הווקטוריים וניתוח הקרבה ביניהם.
Modules – תוספים לקליטת Embeddings ממודלים חיצוניים (OpenAI, Cohere וכו’).
Data Schema – כל פריט נתונים מאוחסן כאובייקט עם שדות, כולל embedding.
API Access – תמיכה ב־GraphQL וב־REST API לשאילתות וחיפושים.
עלויות Weaviate
Weaviate ניתן לשימוש בקוד פתוח (Self-Hosted) ללא עלות, אך קיימות גם גרסאות SaaS מסחריות
בענן המנוהל של Weaviate.
Self-Hosted (קוד פתוח):
בחינם, אפשר להריץ ב־Docker, Kubernetes או על שרת פרטי.
הוצאות: מחשוב, אחסון, GPU/CPU לפי צורך.
Weaviate Cloud Service (WCS):
תשלום חודשי לפי נפח:
Starter: החל מ-$20–$50 לחודש (מוגבל באחסון וחיפושים)
Pro: $200+ לחודש, כולל ביצועים מוגברים ותמיכה
Enterprise: מותאם אישית (כולל אבטחת מידע, SLA, High Availability)
עלויות עקיפות:
שימוש ב־embedding providers כמו OpenAI, Cohere וכו’, שדורשים תשלום פר שימוש.
שאלות ותשובות בנושא Weaviate
איך Weaviate שומר על ביצועים גבוהים בחיפוש בקרב מיליוני וקטורים?
Weaviate משתמש באלגוריתמים של Approximate Nearest Neighbor (ANN), בדגש על HNSW,
מה שמאפשר חיפוש קרוב־אמיתי במהירות גבוהה גם עבור מאות מיליוני וקטורים.
האם ניתן להשתמש ב־Weaviate לצרכים מולטימודליים (טקסט, תמונה, אודיו)?
כן. כל עוד יש לך יכולת להפיק embedding מהתוכן (למשל CLIP לתמונות, Whisper לאודיו, BERT לטקסט),
Weaviate לא מגביל את סוג הנתונים, אלא רק את הפורמט הווקטורי.
האם אפשר לאנדקס מסמכים בשפות שונות?
כן, כל עוד ה־embedding model שבו אתה משתמש תומך בשפות אלה.
לדוגמה, מודלים רב־לשוניים כמו multilingual BERT או Cohere multilingual מאפשרים אחזור סמנטי חוצה שפות.
האם Weaviate תומך באבטחה וב־RBAC?
כן. בגרסאות הענן ובפריסה עצמאית, ניתן להגדיר הרשאות, OAuth, JWT, ו־API Tokens. כמו כן,
ניתן לפרוס בסביבה מבודדת עם תקשורת מוצפנת.

