מהי מערכת זיהוי אנומליות?
זיהוי אנומליות הוא מרכיב מהותי בכמעט כל מערכת שאמורה לנתח מידע ומערכות לכריית מידע,
ולא משנה אם מדובר בניתוח מידע פיננסי, במכשור רפואי או במערכות לאבטחת מידע.
כדי להבין למה חשוב לזהות אנומליות צריך, קודם כל, להבין מהי ‘אנומליה’. על פי מילון רב מילים
ההגדרה ל’אנומליה’ היא: “סטייה מן הנורמאלי או מן המקובל, חריגה מהכלל, מוזרות, עיוות הסדר או הצורה הכללית”.
במילים אחרות הצפייה בניתוח דאטה הנה לפגוש דפוסים מוכרים ולכן כאשר יש חריגה מהדפוס הזה היא מוגדרת כ’אנומליה’.
מה עושות מערכות לזיהוי אנומליות?
מאחר ואנומליה היא חריגה מדפוס צפוי, מערכות לזיהוי אנומליות (סטיות) הן מערכות שיודעות לזהות את החריגות האלה
ובהמשך גם לנתח את המשמעות של האנומליות ולהסיק מהן מסקנות.
למעשה, מדובר ברכיב הכרחי כמעט בכל מערכת לניתוח מידע ובכל מערכת של למידת מכונה (ML).
זיהוי אנומליות בכל תחום, הוא משהו שנדרש לאורך כל קשת המוצרים שמשלבים תוכנה, בין אם מדובר
במערכות לאבטחת מידע, ניתוח פיננסי או מכשור רפואי.
בתחום הרפואי לזיהוי אנומליות יש משמעות קריטית.
למשל, מכשור שתפקידו למפות בדיקות של כימיה בדם.
כאשר מבצעים בדיקות מהסוג הזה, זיהוי אנומליות הם לב העניין, כי הרעיון הוא לאתר את מה שחורג מהנורמה –
כי לחריגה עצמה יש משמעות קלינית (ריכוז גבוה של מולקולה X או ריכוז נמוך מידי של מינרל Y).
הרציונל הזה עובד בזיהוי אנומליות בכל תחום – באמצעות איתור מה שחורג מהדפוס ניתן להסיק מסקנות.
למשל, אנומליה בתעבורה של רשת מחשבים היא הרבה פעמים אינדיקציה למתקפת סייבר ולכן מערכות לזיהוי אנומליות
ממלאות תפקיד פתח גם בפלטפורמות של אבטחת מידע.
סוגים של מערכות ואפליקציות לזיהוי אנומליות
יש 3 גישות טכנולוגיות עיקריות שלאורן מתכננים מערכות לזיהוי אנומליות: טכניקות לא מונחות (unsupervised),
טכניקות מונחות (supervised) וטכניקות מונחות למחצה (semi-supervised).
מערכות זיהוי אנומליות באמצעות טכניקות לא מונחות
נקודת המוצא של הגישה הזו היא שהרוב המוחלט של בסיס הנתונים מייצג מצב נורמאלי אותו ניתן לשייך לאשכול מסוים
ומכאן כל מה שלא משתייך לאשכול יוגדר כאנומליה. בגישה זו מרבים להשתמש בכלי שנקרא ‘ניתוח אשכולות’ (Cluster Analysis).
מערכות זיהוי אנומליות באמצעות טכניקות מונחות
נקודת המוצא של הגישה הזו שכל תצפית תסווג מראש כ’נורמלית’ או ‘לא נורמלית’
והמערכת סורקת ומחפשת את התצפיות הלא נורמליות.
מערכות זיהוי אנומליות באמצעות טכניקות מונחות למחצה
גישה זו תהיה מושתתת על מודל שמייצג את הדפוס הנורמלי ובאמצעות השוואה של הנתונים
עם המודל הזה ניתן לזהות את האנומליות.
בסופו של יום הגישה הטכנולוגית שתיבחר לבניית מערכת לזיהוי אנומליות תהיה זו שתשרת את צרכי הלקוח
והפלטפורמה בצורה הטובה והאמינה ביותר.
זה המקום לציין שלא ניתן להצביע על גישה אחת כ’גישה הטובה ביותר’ לכל תחום ואפילו בכל מקרה פרטי יש את הגישה הכי טובה
עבורו אם אתם נדרשים למערכת לזיהוי אנומליות, אנחנו נשמח לפתח עבורכם מערכת כזו בהתאמה אישית מלאה לצרכים והאתגרים שלכם.

