למידת מכונה בפועל - קורס 41,500 רובל. ממרכז הדרכה IBS, הדרכה 24 שעות, תאריך 26 בנובמבר 2023.
Miscellanea / / December 02, 2023
הקורס בנוי סביב מספר מקרים מעשיים המכילים טבלאות עם נתונים ראשוניים.
עבור כל מקרה, אנו עוברים את מחזור החיים המלא של פרויקט למידת מכונה:
מחקר, ניקוי והכנת נתונים,
בחירת שיטת אימון המתאימה למשימה (רגרסיה לינארית לרגרסיה, יער אקראי לסיווג, K-means ו-DBSCAN לאשכולות),
אימון בשיטה שנבחרה,
הערכת תוצאות,
אופטימיזציה של מודל,
הצגת התוצאה ללקוח.
במהלך חלק הדיון של הקורס, נדון בבעיות מעשיות העומדות בפני התלמידים הניתנות לפתרון באמצעות השיטות שנדונו.
נושאים מכוסים:
1. סקירת המשימה (תיאוריה - שעה)
אילו בעיות נפתרות היטב על ידי למידת מכונה, ואילו בעיות הם מנסים לפתור?
מה קורה אם במקום Data Scientist שוכרים אדם שאינו מומחה בתחום (רק מפתח/אנליסט/מנהל) בציפייה שילמדו תוך כדי.
2. הכנה, ניקיון, מחקר נתונים (תיאוריה – שעה, תרגול – שעה)
כיצד להבין את הנתונים העסקיים המקוריים (ובדרך כלל לזהות כל סדר בהם).
רצף של עיבוד.
מה אפשר וצריך להאציל למנתחי תחום, ומה הכי טוב לעשות על ידי Data Scientist עצמו.
סדרי עדיפויות לפתרון בעיה ספציפית.
3. מסווגים ורגרסורים (תיאוריה – שעתיים, תרגול – שעתיים)
חלק מעשי - משימות מסודרות היטב עם נתונים מוכנים.
הבדל בין משימות (סיווג בינארי/לא בינארי/הסתברותי, רגרסיה), חלוקה מחדש של משימות בין מחלקות.
דוגמאות לסיווג בעיות מעשיות.
4. אשכולות (תיאוריה - שעה, תרגול - שעתיים)
היכן וכיצד לבצע אשכולות: מחקר נתונים, בדיקת הצהרת הבעיה, בדיקת התוצאות.
אילו מקרים ניתן לצמצם לאשכולות.
5. הערכת מודל (תיאוריה - שעה, תרגול - שעה)
מדדים עסקיים ומדדים טכניים.
מדדים לבעיות סיווג ורגרסיה, מטריצת שגיאות.
מדדים פנימיים וחיצוניים של איכות מקבץ.
אימות צולב.
הערכת הסבה מקצועית.
6. אופטימיזציה (תיאוריה – 5 שעות, תרגול – 3 שעות)
מה עושה דגם אחד טוב יותר מאחר: פרמטרים, תכונות, הרכבים.
ניהול הגדרות.
תרגול בחירת תכונות.
סקירת כלים למציאת הפרמטרים, התכונות והשיטות הטובות ביותר.
7. תרשימים, דוחות, עבודה עם משימות חיות (תיאוריה – שעתיים, תרגול – שעתיים)
איך להסביר בבירור מה קורה: לעצמך, לצוות, ללקוח.
תשובות יפות יותר לשאלות חסרות משמעות.
כיצד להציג שלושה טרה-בייט של תוצאות בשקופית אחת.
בדיקות חצי אוטומטיות, אילו נקודות בקרת תהליך באמת נחוצות.
ממשימות חיות ועד תהליך מו"פ מלא ("מו"פ בפועל") - ניתוח וניתוח משימות מהקהל.