פיתוח למידת מכונה - קורס חינם מבית הספר לניתוח נתונים, הכשרה 4 סמסטרים, תאריך: 2 בדצמבר 2023.
Miscellanea / / December 06, 2023
כיוון זה מתאים למי שאוהב לתכנת וליצור שירותים ואפליקציות שיכולים לשמש אלפי ומיליוני אנשים.
כתוב קוד יעיל, בנה וייעל מערכות מונעות נתונים יעילות מבחינה תעשייתית.
בפיתוח מוצרי היי-טק המבוססים על למידת מכונה.
כל סטודנט חייב להשלים בהצלחה לפחות שלושה קורסים במהלך הסמסטר. לדוגמה, אם יש שניים מהם בתוכנית הראשית, אז אתה צריך לבחור אחד מהקורסים המיוחדים.
הידע נבחן בעיקר באמצעות שיעורי בית - בחינות ומבחנים נערכים רק בחלק מהמקצועות.
סמסטר ראשון
חובה
אלגוריתמים ומבני נתונים, חלק 1
01מורכבות ומודלים חישוביים. ניתוח ערכים חשבונאיים (התחלה)
02ניתוח ערכים חשבונאיים (סוף)
03Merge-Sort ו-Quick-Sort אלגוריתמים
04סטטיסטיקה רגילה. ערימות (התחלה)
05 ערימות (סוף)
06Hashing
07חיפוש עצים (התחלה)
08חיפוש עצים (המשך)
09חיפוש עצים (סוף). מערכת של סטים מפורקים
10 בעיות של RMQ ו-LCA
11 מבני נתונים לחיפוש גיאומטרי
12בעיה של קישוריות דינמית בגרף לא מכוון
אימון שפת C++, חלק 1
C++ היא שפה רבת עוצמה עם מורשת עשירה. למי שזה עתה יצא לדרך של שליטה בשפה זו, קל מאוד ללכת לאיבוד בתוך שפע הטכניקות והטכניקות שנוצרו במהלך 30 השנים האחרונות. הקורס מלמד "C++ מודרני" - תת-קבוצה מודרנית של השפה (תקנים 11, 14 ו-17). תשומת לב רבה מוקדשת לכלים וספריות – דברים שאינם חלק מהשפה, אך בלעדיהם לא ניתן יהיה לבנות פרויקט גדול ומורכב.
01מבוא ל-C++.
02 קבועים. מצביעים וקישורים. העברת ארגומנטים לפונקציה.
03שיעורים.
04ניהול זיכרון דינמי.
05משתנים, מצביעים והפניות.
06ניהול זיכרון, מצביעים חכמים, RAII.
07 ספריית תבניות סטנדרטית.
08ירושה ופונקציות וירטואליות.
09טיפול בשגיאות.
10 דפוסי עיצוב.
11מרחבי שמות הזזת סמנטיקה העברה מושלמת.
12 ייצוג מבנים וכיתות בזיכרון. יישור נתונים. מצביעים לחברי הכיתה/שיטות. תבניות Variadic.
למידת מכונה, חלק 1
01 מושגי יסוד ודוגמאות לבעיות יישומיות
02שיטות סיווג מטריות
03שיטות סיווג לוגיות ועצי החלטה
04שיטות סיווג ליניארי שיפוע
05תמוך במכונת וקטור
06 רגרסיה ליניארית רב-משתנית
07 רגרסיה לא ליניארית ולא פרמטרית, פונקציות אובדן לא סטנדרטיות
08 חיזוי סדרת זמן
09שיטות סיווג בייסיאניות
10 רגרסיה לוגיסטית
11חפש חוקי ההתאחדות
קדנציה שניה
חובה
למידת מכונה, חלק 2
01שיטות רשת עצביות לסיווג ורגרסיה
02שיטות קומפוזיציוניות של סיווג ורגרסיה
03קריטריונים לבחירת דגמים ושיטות לבחירת תכונות
04דירוג
05למידת תגבור
06למידה ללא מורה
07בעיות באימון חלקי
08סינון שיתופי
09 דוגמנות נושא
לבחור מ
אלגוריתמים ומבני נתונים, חלק 2
01 עוקף ברוחב. מעבר עומק ראשון (התחלה)
02 זחילה לעומק (המשך)
03 זחילת עומק (סוף). 2 חתכים
04מציאת השבילים הקצרים ביותר (התחלה)
05מציאת השבילים הקצרים ביותר (המשך)
06מינימום עצים משתרעים
07 חתכים מינימליים. חפש מחרוזות משנה (התחלה)
08חפש מחרוזות משנה (המשך)
09חפש מחרוזות משנה (סוף)
10 עצי סיומת (התחלה)
11 עצי סיומת (סיום). מערכי סיומת (התחלה)
12 מערכי סיומת (סיום)
13 מחרוזות המשנה הנפוצות הארוכות ביותר. חיפוש משוער של מחרוזת משנה.
אוֹ
שפת פייתון
01 יסודות השפה (חלק 1)
02 יסודות השפה (חלק 2)
03תכנות מונחה עצמים
04טיפול בשגיאות
05 עיצוב ובדיקה של קוד
06עבודה עם מיתרים
07דגם זיכרון
08 תכנות פונקציונלי
09 סקירת ספרייה (חלק 1)
סקירת ספרייה 10 (חלק 2)
11 מחשוב מקביל בפייתון
12 עבודה מתקדמת עם חפצים
אוֹ
אימון שפת C++, חלק 2
החלק השני של קורס C++, המכסה נושאים מתקדמים ויכולות שפה.
01 תכנות מרובה חוטים. סנכרון שרשורים באמצעות mutexes ומשתני תנאי.
02 משתנים אטומיים. דגם זיכרון C++. דוגמאות למבני נתונים ללא נעילה.
03טכניקות מטא-תכנות מתקדמות ב-C++. Metafunctions, SFINAE, מושגים.
04תכנות תחרותי, אינטראקציה עם הרשת.
ארכיטקטורת 05llvm. עבודה עם עץ הניתוח C++. פיתוח כלים לניתוח קוד C++.
סמסטר ג'
לבחור מ
עיבוד שפה טבעית
"NLP (עיבוד שפה טבעית) היא תת-קבוצה של התחום הרחב יותר של AI המנסה ללמד מחשב להבין ולעבד נתונים גולמיים בשפה טבעית. רוב המידע הקיים כיום אינו טקסט מובנה. כבני אדם, כמובן, לא קשה לנו להבין אותם (אם הם בשפת האם שלנו), אבל אנחנו לא מסוגלים לעבד נתונים כמו שמכונה יכולה לעבד. אבל איך אתה יכול לגרום למכונה להבין את הנתונים האלה, ויותר מכך, לחלץ מהם קצת מידע? לפני מספר שנים, בפתיחתו של ACL (אחד מכנס ה-NLP המרכזי, אם לא החשוב ביותר) הנאום הנשיאותי מרטי הרסט הודתה שהיא כבר לא יכולה לתת לתלמידים את המועדף עליה תרגיל. באמצעות HAL 9000 כדוגמה (אחת הדוגמאות לבינה מלאכותית במדע בדיוני), היא שאלה את התלמידים מה המכונה יכולה לעשות כמו HAL ומה היא לא יכולה לעשות עדיין. כיום זה כבר לא תרגיל כל כך טוב, מכיוון שכמעט כל זה יכול להיעשות כעת על ידי מחשב. מדהים כמה מהר התחום צומח וכמה השגנו. בקורס ננסה לגרום לכם להבין ולהרגיש מה קורה בעולם. אילו בעיות נפתרות, איך זה קורה; כיצד כמה גישות סטטיסטיות (שלהם הוקדשו כמעט כל הקורסים ב-NLP לפני כמה שנים) זוכות לחיים חדשים ולפרשנות חדשה ברשתות עצביות, ואילו מהן גוועות בהדרגה. נראה ש-NLP אינו קבוצה של זוגות (בעיה, פתרון), אלא רעיונות כלליים שחודרים לבעיות שונות ומשקפים מושג משותף כלשהו. תלמד גם מה קורה בפועל ומתי אילו גישות ישימות יותר. זה מה שאנחנו עושים, מה שאנחנו אוהבים, ואנחנו מוכנים לחלוק את זה איתך :)"
01 https://lena-voita.github.io/nlp_course.html
02 https://github.com/yandexdataschool/nlp_course
אוֹ
ראייה ממוחשבת
"הקורס מוקדש לשיטות ואלגוריתמים של ראייה ממוחשבת, כלומר חילוץ מידע מתמונות וסרטונים. בואו נסתכל על היסודות של עיבוד תמונה, סיווג תמונות, חיפוש תמונות לפי תוכן, זיהוי פנים, פילוח תמונה. לאחר מכן נדבר על אלגוריתמים של עיבוד וידאו וניתוח. החלק האחרון של הקורס מוקדש לשחזור תלת מימדי. עבור רוב הבעיות נדון במודלים קיימים של רשתות עצבים. בקורס אנו מנסים לשים לב רק לשיטות המודרניות ביותר הנהוגות כיום בפתרון בעיות מעשיות ומחקריות. הקורס הוא בעיקרו מעשי ולא תיאורטי. לכן, כל ההרצאות מצוידות במעבדה ובשיעורי בית, המאפשרים לנסות את רוב השיטות הנידונות בפועל. העבודה מתבצעת ב-Python באמצעות ספריות שונות".
01הדמיה דיגיטלית ותיקון גוון
02 יסודות עיבוד תמונה
03 תפירת תמונה
04סיווג תמונות וחיפוש דומים
05 רשתות עצביות מתהפכות לסיווג וחיפוש תמונות דומות
06זיהוי אובייקטים
07 פילוח סמנטי
08 העברת סגנון וסינתזת תמונה
09זיהוי וידאו
10 שחזור תלת מימד דל
11 שחזור תלת מימד צפוף
12שחזור ממסגרת אחת וענני נקודה, מודלים פרמטריים
אוֹ
שיטות בייסיאניות בלמידת מכונה
01 גישה בייסיאנית לתורת ההסתברות
02 הסקה בייסיאנית אנליטית
03בחירת דגמי בייסיאני
04קביעה אוטומטית של רלוונטיות
05 שיטת וקטור רלוונטיות לבעיית סיווג
06מודלים הסתברותיים עם משתנים סמויים
07מסק בייסיאני וריאציוני
08מודל הפרדת תערובת בייסיית של גאוסים
09שיטות מונטה קרלו עם רשתות מרקוב
10הקצאת דיריכלה סמויה
11 תהליכים גאוסים לרגרסיה וסיווג
12 שיטות בייסיאניות לא פרמטריות
סמסטר רביעי
חובה
הנדסאי ML
הקורס הוא עבודת פרויקטים על פיתוח פרויקטי ML בצוותים.
פרקטיקת מחקר ML
הקורס מייצג עבודה על פרויקטי מחקר צוותים בתחום למידת מכונה.
קורסים מיוחדים מומלצים
למידה עמוקה
01חומר הקורס
לימוד עם חיזוקים
01חומר הקורס
מכוניות בנהיגה עצמית
הקורס מכסה את מרכיבי הליבה של טכנולוגיה לנהיגה עצמית: לוקליזציה, תפיסה, חיזוי, רמת התנהגות ותכנון תנועה. עבור כל רכיב, יתוארו הגישות העיקריות. בנוסף, התלמידים יכירו את תנאי השוק הנוכחיים ואת האתגרים הטכנולוגיים.
01 סקירה של הרכיבים והחיישנים העיקריים של כלי רכב בלתי מאויש. רמות של אוטונומיה. Drive by Wire. מכוניות לנהיגה עצמית כמוצר עסקי. דרכים להעריך התקדמות ביצירת רחפנים. יסודות לוקליזציה: gnss, אודומטריית גלגל, מסננים בייסיאניים.
02שיטות לוקליזציה של לידר: ICP, NDT, LOAM. מבוא ל-SLAM חזותי באמצעות ORB-SLAM כדוגמה. הצהרה על בעיית GraphSLAM. צמצום בעיית GraphSLAM לשיטת ריבועים קטנים לא ליניאריים. בחירת הפרמטר הנכון. מערכות בעלות מבנה מיוחד ב- GraphSLAM. גישה אדריכלית: frontend ו-backend.
03משימת זיהוי במכונית לנהיגה עצמית. מכשולים סטטיים ודינמיים. חיישנים למערכת הזיהוי. ייצוג של מכשולים סטטיים. איתור מכשולים סטטיים באמצעות lidar (VSCAN, שיטות רשת עצביות). שימוש בלידר בשילוב עם תמונות כדי לזהות סטטיקה (פילוח תמונה סמנטית, השלמת עומק). מצלמת סטריאו וקבלת עומק מתמונה. Stixel World.
04ייצוג מכשולים דינמיים במכונית בנהיגה עצמית. שיטות רשת עצבית לזיהוי עצמים בדו מימד. זיהוי מבוסס על מבט ממעוף הציפור של ייצוג ענן לידר. שימוש בלידר עם תמונות כדי לזהות מכשולים דינמיים. זיהוי רכב בתלת מימד על בסיס תמונות (התאמת קופסאות תלת מימד, דגמי CAD). זיהוי מכשולים דינמי מבוסס מכ"ם. מעקב אחר אובייקטים.
05 דפוסי נהיגה במכונית: גלגל אחורי, גלגל קדמי. תכנון נתיב. הרעיון של מרחב תצורה. שיטות גרפיות לבניית מסלולים. מסלולים שממזערים טלטלות. שיטות אופטימיזציה לבניית מסלולים.
06 תכנון מהירות בסביבה דינמית. תכנון ST. חיזוי התנהגות של משתמשי דרך אחרים
שיטות נוירו-בייסיאניות
הקורס מתמקד ביישום שיטות בייסיאניות בלמידה עמוקה. ההרצאות ידברו על השימוש במודל הסתברותי לבניית מודלים של נתונים גנרטיביים, השימוש במתחרים רשתות להסקה משוערת, אי ודאות במודלים בפרמטרים של רשת עצבית וכמה בעיות פתוחות בעומק הַדְרָכָה.
01 מסקנות וריאציות סטוכסטיות
02 הסקת וריאציה סטוכסטית כפולה
03מקודד אוטומטי משתנה, מנרמל זרימות להסקת וריאציות
04שיטות להפחתת השונות במודלים של משתנים סמויים
05הערכה של היחס בין צפיפות הפצה, יישום באמצעות הדוגמה של \alpha-GAN
06 רשתות עצבים בייסיאניות
07 דחיסה בייסיאנית של רשתות עצביות
08 מסקנות וריאציות חצי-מרומזות