מודלים ליניאריים מוכללים - קורס 3600 לשפשף. מחינוך פתוח, הכשרה 3 שבועות, כ-6 שעות שבועיות, תאריך 29 בנובמבר 2023.
Miscellanea / / December 01, 2023
אחד התנאים לתחולתם של מודלים ליניאריים קונבנציונליים הוא חוסר תלות של תצפיות זה מזה, שעל בסיסן נבחר המודל. עם זאת, בפועל יש לעתים קרובות מצבים שבהם עיצוב איסוף החומר הוא כזה שהפרה של תנאי זה היא בלתי נמנעת. תארו לעצמכם שהחלטתם לבנות מודל שמתאר את הקשר בין ביצועי חינוך גופני וציוני מבחני מנת משכל בקרב תלמידים. כדי לפתור בעיה זו, עשית דגימות רבות במספר מוסדות. האם ניתן לשלב נתונים כאלה לניתוח אחד, שנבנה לפי הסכמה המסורתית? ברור שלא. סטודנטים בכל אוניברסיטה עשויים להיות דומים זה לזה במובנים מסוימים. אפילו אופי הקשר בין הכמויות הנבדקות עשוי להיות שונה במקצת. יש לנתח סוג זה של נתונים, בהם יש מתאמים תוך-קבוצתיים, באמצעות מודלים מעורבים ליניאריים. אנו נראה שיש לכלול כמה מנבאים במודל בתור מה שנקרא "גורמים אקראיים". תלמד שניתן להכפיף גורמים אקראיים באופן היררכי. נדון כיצד ניתן לבנות מודלים מעורבים כאלה עבור משתנים תלויים העוקבים אחר סוגים שונים של התפלגויות. בנוסף, נראה שהחלק האקראי של המודל יכול להיות אפילו יותר מורכב – יכול להיות לו רכיב שמדגל את התנהגות השונות בתגובה להשפעה של משתנית משנה. בסוף הקורס תמצאו פרויקט בו תוכלו לתרגל בניית מודלים מעורבים על ידי בחירה באחד ממספר מערכי נתונים. בהתבסס על ניתוח הנתונים הללו, אתה יכול ליצור דו"ח במסורת של מחקר בר-שחזור.
פרופסור חבר, המחלקה לזואולוגיה של חסרי חוליות, הפקולטה לביולוגיה, אוניברסיטת סנט פטרסבורג, Ph.D.
תחומי עניין מדעיים: מבנה ודינמיקה של קהילות בנתוס ימיות, קנה מידה מרחבי, רצף, בין-ספציפי ותוך-ספציפי אינטראקציות ביוטיות, צמיחה ורבייה של חסרי חוליות ימיים, מבנה דמוגרפי של אוכלוסיות, מיקרו-אבולוציה, ביוסטטיסטיקה.
הקורס מורכב מ-4 מודולים:
1) מבוא לדגמים לינאריים כלליים
מודלים לינאריים כלליים (GLMs) מאפשרים לך לדגמן את התנהגותם של כמויות שאינן עוקבות אחר התפלגות נורמלית. כדי להקל על הצעדים הראשונים שלך בעולם GLM, אנו ננתח את המבנה שלהם באמצעות הדוגמה של GLM לכמויות מופצות בדרך כלל - בדרך זו תוכלו לצייר הקבלות עם דגמים לינאריים פשוטים. תלמד מהי פונקציית קישור, עד כמה הסבירות המרבית עובדת וכיצד לבדוק השערות GLM באמצעות בדיקות WALD ובדיקות יחס סבירות.
2) בעיית בחירת המודל
במודול זה נדבר על סוגיות מתודולוגיות הקשורות לדגמי בנייה. מודל הוא ייצוג מפושט של המציאות, ובחירה בין שיטות מתחרות שונות של פשט כזה היא משימה תכופה עבור האנליסט. במודול זה תלמדו להשוות מודלים באמצעות קריטריוני מידע. נדון באפשרויות העיקריות לניתוח בבחירת מודלים ונדבר על הקשיים הנובעים בקשר לריבוי הנסתר של הדגמים. לבסוף, אנו נלמד אותך לזהות את הסוגים העיקריים של התעללות בבחירת מודלים (דיג נתונים, P-Hacking).
3) מודלים לינאריים כלליים לספירת נתונים
במודול זה נדון בשיטות בסיסיות למודלים של כמויות ניתנות לספירה. ראשית, נדון מדוע מודלים לינאריים קונבנציונליים אינם מתאימים לספירת נתונים. המאפיינים של התפלגויות ניתנות לספירה יעזרו לכם להבין את ההבדלים בין סוגי ה- GLM לנתונים ניתנים לספירה לבין התכונות של האבחון שלהם. תראה את פונקציית הקישור בעבודה כשאתה מדמיין תחזיות GLM בסולם פונקציות הקישור ובסולם משתנה התגובה.
4) מודלים לינאריים כלליים עם תגובה בינארית
לפעמים יש צורך לדמות אם אירוע כלשהו התרחש או לא, בין אם קבוצת כדורגל או הפסידה, בין אם המטופל התאושש לאחר הטיפול ובין אם לא, בין אם הלקוח ביצע לרכוש או לא. דגמים לינאריים קונבנציונליים אינם מתאימים למודלים של נתונים בינאריים כאלה (אירועים עם שתי תוצאות), אך ניתן לעשות זאת בקלות באמצעות מודלים לינאריים כלליים. במודול זה תלמדו לדגמן את ההסתברויות של אירועים המתרחשים על ידי ייצוגם כסיכויים. נבחן כיצד פונקציית קישור Logit פועלת ואיך מתפרשים מקדמי GLM בעת השימוש בהם. לבסוף, תוכלו לתרגל ניתוח מודלים לינאריים כלליים עם התפלגויות שונות על ידי השלמת פרויקט ניתוח נתונים. יש להציג את תוצאות ניתוח זה כדוח בפורמט HTML, שנכתב באמצעות RMarkdown/Knitr.
• למד אילו מיומנויות נדרשות כדי להתחיל באנליטיקה ובמדעי הנתונים • למד להשתמש ב-Excel, SQL, Power BI, Google Data Studio כדי לעבוד איתם נתונים וכתוב את הקוד הראשון שלך ב-Python• קבל מדריך שלב אחר שלב ולמד כיצד להיכנס לתחום מדעי הנתונים ולבחור תפקיד ב-Data Science
4,4
1 490 ₽