OpenBMB: פיתוח, אימון ופריסה של LLM

מה זה OpenBMB?

OpenBMB או של Open Big Model Base הוא פרויקט קוד פתוח שפותח על ידי קבוצת מחקר סינית
בשם BAAI או Beijing Academy of Artificial Intelligence.

מטרתו של OpenBMB היא להנגיש תשתיות מתקדמות לפיתוח, אימון ופריסה של מודלי שפה (LLMs).

OpenBMB נבנה כדי להאיץ את המחקר והיישום של מודלים טרילינגואליים, בייחוד סיניים, אך הפלטפורמה
עצמה כללית ויכולה לתמוך במודלים בשפות רבות.

OpenBMB כוללת אוסף עשיר של כלים, מסגרות עבודה (frameworks), תשתיות וטכניקות יעילות
לאימון מודלים בקנה מידה גדול בסגנון GPT, BERT, LLaMA ואחרים.

מה כולל פרויקט OpenBMB?

OpenBMB הוא אקו־סיסטם שלם, ובתוכו מספר רכיבים חשובים:

BMTrain

ספרייה ללימוד מקבילי (parallel training) של מודלים גדולים, עם תמיכה ב־ZeRO,
Pipeline Parallelism ו־Tensor Parallelism.
זה מאפשר לאמן מודלים של מיליארדי פרמטרים על גבי אשכולות GPU.

BMInf

מנוע יעיל להרצת מודלים גדולים בזמן אמת (Inference Engine), עם תמיכה באופטימיזציות של CUDA,
INT8, ו־GPU memory offloading כדי להריץ מודלים על חומרה מוגבלת.

OpenChatKit / OpenLLM

סדרה של מודלים מוכנים לשימוש, כולל fine-tuned LLMs עבור משימות כמו שאלות ותשובות,
שיחות, ותרגום, בדומה ל־ChatGPT.

ToolBench

מערכת לבניית סוכנים אינטראקטיביים המשתמשים בכלים חיצוניים (כגון מחשבון, ויקיפדיה, מנוע חיפוש)
בדומה ל־Toolformer של Meta. תומך ב־Function Calling.

Promptor

ממשק נוח ונגיש להגדרת Prompt Templates ואופטימיזציה של פרומפטים עבור Zero-shot
ו־Few-shot learning.

יתרונות OpenBMB

קוד פתוח לחלוטין – כולל את מודלי ה־base וה־fine-tuned.

תמיכה מעולה בהאצת ביצועים על חומרה קיימת, כולל שיטות קומפרסיה והרצה על GPU בודד.

תיעוד מצוין עם דוגמאות שימוש ו־notebooks מוכנים.

מודולריות – ניתן להטמיע חלקים שונים בפרויקטים קיימים.

השוואת OpenBMB מול פרויקטים אחרים

מאפיין	OpenBMB	Hugging Face Transformers	DeepSpeed	OpenLLM (BentoML)
שפת תכנות	Python + CUDA	Python	Python	Python
תשתית לאימון	BMTrain	PyTorch	DeepSpeed	PyTorch
מנוע להרצה	BMInf	None (משתמש ב־HF)	DeepSpeed Inference	Bento Server
סוכנים מבוססי כלים	ToolBench	LangChain / AutoGPT	לא קיים	חלקי
דגש על סינית	כן	לא	לא	לא
רישיון	Apache 2.0 / MIT	Apache 2.0	MIT	Apache 2.0

שימושים של OpenBMB

אימון מודלי שפה משלך (GPT-like)

הטמעה של מודלי שיחה מותאמים לארגון

פיתוח סוכני בינה מלאכותית מבוססי־כלים

הרצה יעילה של מודלים על חומרה בינונית

מחקר ב־Natural Language Processing עם קוד פתוח

מי צריך OpenBMB?

אוניברסיטאות וחוקרי NLP

סטארטאפים בתחום ה־AI

חברות המעוניינות להקים LLM פנים־ארגוני

מהנדסי למידת מכונה המעוניינים בביצועים גבוהים על תשתיות קיימות

שאלות ותשובות בנושא OpenBMB

האם אפשר להשתמש ב־OpenBMB כדי לאמן מודל בעברית?

כן. אף ש־OpenBMB פותחה עם דגש על השפה הסינית, כל הרכיבים שלה הם גנריים.
אפשר להשתמש ב־BMTrain לאימון כל מודל שפה, כולל בעברית כל עוד יש לך קורפוס מתאים.

מה היתרון של BMInf לעומת ONNX או TensorRT?

BMInf מותאם ספציפית להרצת LLMs תוך תמיכה בזיכרון יעיל, INT8, ו־offloading
מה שהופך אותו לאופטימלי עבור מודלים גדולים במיוחד, לעיתים גם טוב יותר מ־ONNX בשימושים מסוימים.

האם ToolBench תומך בחיבור ל־API חיצוניים?

כן. המערכת כוללת ממשק להטמעת כלים חיצוניים (tool-use), כולל פונקציות מותאמות אישית עם API,
בדומה ל־function calling של OpenAI.

האם ניתן לאמן מודל בסגנון LLaMA באמצעות BMTrain?

בהחלט. BMTrain תומך באימון של Transformer-based models, כולל LLaMA, GPT, GLM, וכו’.

מהו גודל הדאטהסט המומלץ לאימון מודל GPT חדש?

תלוי בגודל המודל, אך כלל אצבע הוא 10-20 מיליארד מילים למודל בגודל של 1B פרמטרים.
יש לוודא שהדאטהסט מגוון ובעל ניקוי מתאים.