Feedforward Neural Network (FFNN): רשת עצבית קדמית

מהי רשת עצבית קדמית?

רשת עצבית קדמית (FFNN) היא סוג בסיסי של רשת עצבית מלאכותית בה זרימת המידע
מתבצעת בכיוון אחד בלבד – מהקלט (input), דרך שכבות נסתרות (hidden layers),
ועד לפלט (output), ללא לולאות או מעגלים חוזרים.

FFNN זהו המודל הקלאסי של רשתות עצביות, אשר שימש כבסיס לפיתוחים מתקדמים יותר בתחום
למידת המכונה ולמידה עמוקה (Deep Learning).

מבנה רשת FFNN

רשת FFNN מורכבת מהמרכיבים הבאים:

שכבת קלט (Input Layer)

מייצגת את המאפיינים של הדאטה (features).

כל נוירון בשכבה זו מקבל ערך מתוך הדאטה.

שכבות נסתרות (Hidden Layers)

כוללות נוירונים אשר מבצעים חישובים לא ליניאריים באמצעות פונקציות הפעלה (activation functions).

ניתן להוסיף מספר שכבות לפי הצורך (ככל שיש יותר – הרשת “עמוקה” יותר).

שכבת פלט (Output Layer)

מייצגת את תוצאת המודל (מסווג, חיזוי ערך, תוצאה בינארית וכו’).

פונקציות הפעלה נפוצות

כדי לאפשר לרשת ללמוד פונקציות לא ליניאריות, משתמשים בפונקציות הפעלה. הנפוצות ביותר:

ReLU (Rectified Linear Unit) – f(x)=max⁡(0,x)f(x) = \max(0, x)f(x)=max(0,x)

Sigmoid – f(x)=11+e−xf(x) = \frac{1}{1 + e^{-x}}f(x)=1+e−x1

Tanh – f(x)=tanh⁡(x)f(x) = \tanh(x)f(x)=tanh(x)

Softmax – משמשת לרוב בשכבת הפלט של סיווגים רב-קטגוריאליים.

כיצד מתבצע הלמידה במודל FFNN?

הזנה קדימה (Feedforward)

הקלט מועבר קדימה בכל שכבה תוך חישוב סכום משוקלל של הקלטים, והחלת פונקציית הפעלה.

חישוב שגיאה (Loss)

מחשבים את השגיאה בין הפלט המתקבל לפלט הרצוי (למשל באמצעות פונקציית loss
כמו MSE או Cross-Entropy).

למידה לאחור (Backpropagation)

מעדכנים את המשקלים וההטיות (weights and biases) לפי הנגזרות של פונקציית השגיאה,
כדי למזער את הטעות. נעשה בעזרת אלגוריתם Gradient Descent.

חזרה על האימון

התהליך מתבצע על כל הדאטה במספר אפוקים (epochs) עד שהמודל מתכנס.

יתרונות FFNN

פשטות יחסית: מבנה ישיר וללא לולאות.

גמישות: ניתן להשתמש ב-FFNN למגוון בעיות (סיווג, רגרסיה, חיזוי).

יסוד ללמידה עמוקה: מהווה את הבסיס למודלים מתקדמים יותר.

חסרונות FFNN

אינו מתאים לנתונים סדרתיים: כמו טקסט או נתוני זמן (time series) – שם נדרשים מודלים כמו RNN או LSTM.

דורש דאטה רב: כדי למנוע overfitting.

נוטה לאיבוד מידע אם לא נבחרים מספר שכבות ונוירונים מתאים.

שימושים נפוצים של FFNN

סיווג תמונות או טקסטים

חיזוי ערכים (Regression)

ניתוח סנטימנט

זיהוי כתב יד

זיהוי דפוסים במידע מובנה

שאלות ותשובות בנושא FFNN

למה רשת FFNN אינה טובה ללמידה של הקשרים זמניים?

מכיוון שהיא אינה כוללת זיכרון פנימי או לולאות. לכן אינה מסוגלת “לזכור” שלבים קודמים בתהליך הלמידה.
עבור בעיות סדרתיות נדרש שימוש ב־RNN או Transformers.

האם רשת FFNN מסוגלת לפתור בעיות לא ליניאריות?

כן, בתנאי שהיא כוללת שכבה נסתרת אחת לפחות עם פונקציית הפעלה לא ליניארית.
זה מוכח לפי משפט האוניברסליות (Universal Approximation Theorem).

כיצד נמנעים מ־Overfitting ב־FFNN?

שימוש ב־Dropout

רגולריזציה (L1 / L2)

הפסקת אימון מוקדמת (early stopping)

שימוש בדאטה רב ומגוון