למידת מכונה: כלים ושיטות עבודה בסיסיות - קורס RUB 51,590. מ-Netology, הכשרה 10 חודשים, תאריך 30.11.2023.
Miscellanea / / December 02, 2023
השתמש בדוגמאות כדי ללמוד את האלגוריתמים הבסיסיים ולברר באילו מקרים להשתמש בהם
למד להשוות אלגוריתמים על מערכי נתונים מוכנים ולזהות שיטות לשיפור האיכות
בניית דגמים
למד מהי ספריית Sklearn וכיצד להשתמש בה. למד אלגוריתמי מקבץ ולהיות מסוגל לבנות אנסמבלים של מודלים. למד להעריך מודלים ולעבוד עם התאמה יתר. תלמדו כיצד להשתמש ב-GridSearch ו-RandomizedSearch, קורות חיים ספציפיים לדגם, גישת Out of Bag.
• ספריית סקלרן
• אלגוריתמי סיווג: שיטות ליניאריות, רגרסיה לוגיסטית ו-SVM
• אלגוריתמי סיווג: עצי החלטה
• אלגוריתמי רגרסיה: ליניארי ופולינום
• אלגוריתמים באשכולות
• אנסמבל
• הערכת דיוק מודל, הסבה מחדש, רגולציה
• שיפור איכות הדגם
• ארגון פרויקט, הכנת דוחות מחקר
• עבודת מעבדה
• מסירת פרויקט הביניים
עבודה מול הלקוח
תלמד לתכנן את הפיתוח של פרויקטים בתחום מדעי הנתונים, כמו גם לספר ללקוחות בצורה מוכשרת על תוצאות מחקר.
• ארגון הפרויקט
• הכנת דוחות מחקר
מערכות ממליצים
בלוקים זה ובבלוקים הבאים, תיישמו את הידע הנרכש בתחומים שונים של למידת מכונה. במהלך הבלוק הזה, למד כיצד לבנות מערכות המלצות מותאמות ולא מותאמות אישית, וכיצד לשלב ביניהן.
• הקדמה וסיווג מערכות ממליצים
• המלצות מבוססות תוכן
•סינון שיתופי
• מערכות המלצות לא מותאמות אישית
• אלגוריתמים היברידיים
ראייה ממוחשבת
תשלוט בטכניקות בסיסיות של ראייה ממוחשבת: מיצוי תכונות, חיפוש תמונות, פילוח, זיהוי אובייקטים, וגם תלמד כיצד לבנות רשתות עצביות.
• חיפוש לפי תמונות
• פילוח תמונה, זיהוי אובייקטים
• יישום של רשתות עצביות מדויקות במיוחד למשימות פילוח וזיהוי
• יישום רשתות חוזרות בבעיות עיבוד תמונה
• רשתות יריביות (GAN)
עיבוד שפה טבעית (NLP)
תשלוט בניתוח מורפולוגי ותחבירי, סמנטיקה של הפצה ואחזור מידע, ללמוד להפחית מימדיות במודל וקטור, לסווג, לחלץ מידע ולהפיק טקסטים.
• ניתוח מורפולוגי ותחבירי
• שיטות להקטנת מימדיות במודל וקטורי. חיפוש מידע
• עיצוב נושאים (LSA, LDA, HDP)
• סמנטיקה חלוקתית (word2vec, GloVe, AdaGram)
• מודלים של שפה ניתנים לספור ומודלים של שפה הסתברותית. LSTM. תרגום מכונה
• יצירת טקסט (יצירת שפה טבעית)
• בעיית סיווג ב-AOT
סדרת זמן
ביחידה אינטנסיבית זו, תלמד לזהות את המקור והמבנה של סדרת זמן, לחזות ערכים עתידיים לקבלת החלטות אפקטיביות בעת בניית מודלים של למידת מכונה. אתה תבין מה נמצא "מתחת למכסה המנוע" של שיטות וספריות פופולריות.
• אלגוריתמים לעיבוד סדרות זמן
• דגמי ARIMA ו-GARCH
• תהליכים אקראיים של מרקוב
האקתון אחרון
בואו נשלים את ההכשרה בתחרות עם חברי הקורס: כחלק ממיני צוות לזמן מוגבל ומבוסס על מערכי נתונים של שחקנים גדולים בשוק, תצטרך לפתור בעיות של חיזוי מכירות או אופטימיזציה של הייצור, תוך שימוש בכל הידע והמיומנויות שנרכשו ב קוּרס. אינטגרציה ושימוש בפתרונות למידת מכונה בעסק, ככלל, כרוכים במשחק קבוצתי, כך שהאקתון שימושי גם כהכשרת הכישורים הרכים הדרושים.
פרויקט גמר
כחלק מפרויקט התזה שלך, תבנה מודל ML כדי לפתור את הבעיות המקצועיות הנוכחיות שלך: זו יכולה להיות מערכת חיזוי מכירות, זיהוי אובייקטים בתמונות או בסרטונים, ניתוח סדרות זמן, ניתוח כמויות טקסט גדולות וכו'. ד. אם כרגע אין לך רעיונות לפרויקט שלך (או גישה לנתונים הדרושים), נציע לך מקרה בוחן בתחום שמעניין אותך בהתבסס על מערך נתונים אמיתי של חברות אחרות. עבודת התזה מתבצעת באופן עצמאי בהנחיית מומחי הקורס ומאפשרת לך לגבש את מכלול הידע והמיומנויות הנרכשות בתוכנית.