מהם אלגוריתמים של למידת מכונה?
אלגוריתמי למידת מכונה הם מודלים מתמטיים המאפשרים למחשבים ללמוד מנתונים ולבצע תחזיות או החלטות
מבלי להיות מתוכנתים לכך במפורש.
אלגוריתמים של למידת מכונה נועדו לזהות דפוסים בנתונים ולחלץ תובנות שימושיות, אשר לאחר מכן ניתן להשתמש
בהן כדי לבצע תחזיות או לבצע אוטומציה של משימות.
את הסקירה הזו נקדיש לאלגוריתמים של למידת מכונה שבגדול ניתן לסווג אותם ל-4 קטגוריות על: למידה מפוקחת (Supervised),
למידה חצי מפוקחת (Semi-Supervised), למידה בלתי מפוקחת (Unsupervised) ולמידה מחוזקת (Reinforcement).
למידה מפוקחת (Supervised)
בלמידה מפוקחת המכונה לומדת באמצעות הדגמה.
המפעיל מספק למכונה אלגוריתם עם דאטא בייס נתון שכולל דוגמאות לדגשים רצויים ולא רצויים.
הדוגמאות האלו מאפשרות לאלגוריתם לחזות ובמידה והוא טועה המפעיל מתקן אותו עד שהוא לומד,
מדובר בתהליך הכשרה הדרגתי שבסופו יגיע האלגוריתם ליכולת חיזוי אופטימלית. תחת המטרייה של
למידה מפוקחת ניתן לפגוש אלגוריתמים מהטיפוסים הבאים:
סוגי אלגוריתמים של למידה מפוקחת
אלגוריתמים מסווגים
אלגוריתמים שנועדו למיין מידע לפי קבוצות בהתאם לחשיבות או קטגוריה.
למשל, האלגוריתם שעובר על הדוא”ל שלנו ומפריד בין דוא”ל רגיל לספאם.
אלגוריתמים נסוגים
אלגוריתמים נסוגים לומדים את יחסי הגומלין בין משתנים שונים ועל פי יחסי גומלין אלו לחזות מה יקרה ולהגיב בהתאם.
אלגוריתמים לחיזוי
אלגוריתמים אלו לומדים פעולות עבר מזהים בהן דפוסים ועל סמך זה חוזים להמשך.
טכנולוגיה זו משמשת, בין היתר, לזיהוי טרנדים עתידיים.
למידה חצי מפוקחת (Semi-Supervised)
למידה חצי מפוקחת מאוד דומה ללמידה המפוקחת, אך במקום לתקן את המכונה כל הזמן יש
בדאטא תיוגים שמאפשרים לצמצם את ההתערבות של המפעיל.
מבחינת התוצאה הסופית האלגוריתמים בלמידה החצי מפוקחת מתפלגים באופן דומה לטיפוסי האלגוריתמים
של הלמידה המפוקחת. (אלגוריתמים מסווגים, אלגוריתמים נסוגים ואלגוריתמים לחיזוי).
למידה בלתי מפוקחת (Unsupervised)
בלמידה בלתי מפוקחת האלגוריתם נדרש לזהות דפוסים ללמוד אותם ולהטמיע אותם, אין אפשרות להיעזר במפעיל אנושי שיכוון אותו.
במקום זה המכונה היא שקובעת את התיקונים ויחסי הגומלין באמצעות אנליזה של מידע זמין.
בלמידה בלתי מפוקחת האלגוריתם נדרש לסרוק הרבה מאוד מידע ולארגן אותו על פי מבנים וקריטריונים שהוגדרו.
הרבה פעמים זה אומר קיבוץ (Clustering) של המידע.
ככל שאלגוריתם בלמידה בלתי מפוקחת סורק יותר מידע יכולת הפעולה משתפרת ומתעדנת.
את האלגוריתמים שמבצעים למידה בלתי מפוקחת ניתן לסווג לשני קבוצות עיקריות:
- אלגוריתמים מקבצים (Clustering)
האלגוריתם בעצם ממיין מידע על פי סוגי דאטא דומים ובאופן זה מארגן ומסווג את כל המידע בקבוצות (Clusters),
כל קבוצה כזו היא בעלת מאפיינים משותפים מסוימים וכך ניתן לארגן את המידע ולגשת אליו.
- אלגוריתמים מצמצמי ממדים
אלגוריתמים אלו מצמצמים את מספר המשתנים כדי להגיע בדרך האלימינציה לתשובה הנדרשת.
למידה מחוזקת (Reinforcement)
בגישה טכנולוגית זו הפוקוס הוא על למידה ממשטרת בתהליך מאוד מובנה.
אלגוריתם למידת המכונה מקטגוריה זו יספק מסגרת פעולות, פרמטרים וערכים.
ברגע שהחוקים קיימים האלגוריתמים יבחן אפשרויות שונות ויבצע אנליזות בהתאם לערכים והפרמטרים שהוכנסו בו.
כך בהליך של ניסוי וטעיה המכונה תלמד ועם הזמן תדע מה הדרך הכי טובה להתמודד עם מצב נתון.
איך בוחרים את סוג האלגוריתם הכי מתאים?
בחירת האלגוריתם המתאים ללמידת מכונה תלויה במספר פקטורים הכוללים, בין היתר: גודל הדאטא, איכות ומגוון שנדרשים,
צרכים עסקיים וסוג התובנות שרוצים לשאוב מהדאטא.
שיקולים נוספים יהיו דיוק, זמן אימון המכונה ועוד הרבה מאוד פרמטרים שיכולים להשתנות בהתאם לפרויקט והדרישות הספציפיות שלו.
לכן, בחירת אלגוריתם ללמידת מכונה, תמיד תהיה שילוב של שיקולים טכניים עם שיקולים עסקיים (עלות היא בהחלט שיקול לגיטימי).
חשוב לזכור שתהליך למידת מכונה הנו ‘תהליך’, כלומר זה עשוי לקחת זמן ולעיתים ניתן לעשות פיילוט ולנסות כמה גישות.
כי גם מדען המחשבים המנוסה ביותר יתקשה לקבוע בוודאות איזה סוג של אלגוריתם יניב את התוצאה הכי טובה ואין מנוס מפשוט – לנסות.
אחרי שזה נאמר ניתן למצוא ברשת סימולטורים וטבלאות שעשויות לתת כיוון כללי לסוג האלגוריתם המתאים.