מדוע המספרים אינם אובייקטיביים כפי שאנו חושבים
Miscellanea / / July 29, 2022
למעשה, קל לתפעל אותם.
כל אמירה מפוקפקת יכולה להיתפס כנכונה אם היא נתמכת בסטטיסטיקה, טבלאות, גרפים ומונחים מדעיים. כדי לא ליפול לטריקים כאלה, חשוב לדעת לזהות שטויות ובכלל להבין מה זה. ספר חדש מבית הוצאת MIF "שטויות גמורות!" יעזור בזה. הוא נכתב על ידי הביולוג האבולוציוני פרופסור קרל ברגסטרום ועוזר פרופסור בבית הספר למידע של אוניברסיטת וושינגטון, ג'ווין ווסט. ו-Lifehacker מפרסם קטע מהפרק החמישי.
העולם שלנו דיגיטלי ממש. הכל מחושב, נמדד, מנותח ומוערך. חברות אינטרנט עוקבות אחרינו באינטרנט ומשתמשות באלגוריתמים כדי לחזות מה נקנה. סמארטפונים סופרים את הצעדים שלנו, מודדים את משך השיחות ועוקבים אחר התנועות שלנו לאורך היום. מכשירים חכמים שולטים כיצד אנו משתמשים בהם ויודעים יותר על שגרת היומיום שלנו ממה שאנו יכולים לדמיין. מכשירים רפואיים מושתלים מזינים זרם רציף של מידע על המטופל ועוקב אחר סימני סכנה בזמן אמת. במהלך התחזוקה, המכוניות שלנו מעלות נתונים לגבי הביצועים שלהן וסגנון הנהיגה שלנו. שלל החיישנים והמצלמות המותקנים בערים עוקבים אחר כל דבר, החל מזרימות תנועה ועד לאיכות האוויר, ואף מסוגלים להגדיר אישיות של עוברי אורח.
במקום לאסוף נתונים על התנהגות צרכנים באמצעות סקרים וסקרים יקרים, חברות מאפשרות לאנשים להגיע אליהן בעצמן ואז לתעד את כל מה שהם עושים. פייסבוק* יודע את מי אנחנו מכירים. גוגל - מה אנחנו רוצים לגלות. אובר - לאן אנחנו מתכוונים להגיע. אמזון - מה אנחנו רוצים לקנות. התאמה - עם מי אנחנו מתכננים ליצור איגוד משפחתי. חומר דליק - ממנו אנו מחכים להזמנה לתקשר.
נתונים יכולים לעזור לנו להבין את העולם במונחים של עובדות אובייקטיביות, אבל הנתונים אינם קרובים לאובייקטיביים כפי שאנו חושבים. בדיחה ישנה עולה בראשי. מתמטיקאי, מהנדס ורואה חשבון מקבלים עבודה. מובילים אותם למשרד ועושים מבחן במתמטיקה. המשימה הראשונה, לחימום: כמה זה שתיים ועוד שתיים? המתמטיקאי מגלגל עיניים, כותב "ארבע" ועובר למשימות הבאות. המהנדס חושב שנייה, ואז כותב "בערך ארבע". רואה החשבון מביט סביבו בדאגה, ואז קם מכיסאו, ניגש אל מי בוחן, ובקול שקט מבקש: "לפני שאני כותב משהו, תגיד לי מה אתה רוצה לקבל?"
מספרים מושלמים לדבר שטויות. הם נראים אובייקטיביים אך ניתן לתמרן בקלות כדי לספר את הסיפור הנכון.
מילים בהחלט נוצרות על ידי המוח האנושי, אבל מה לגבי מספרים? מספרים כאילו ניתנים לנו מהטבע עצמו. אנחנו יודעים שמילים הן סובייקטיביות. אנחנו יודעים שהם רגילים לעוות ולעוות את האמת. מילים משקפות אינטואיציה, רגשות, תשוקה. נראה שמספרים קיימים בנפרד מהאדם שמדבר עליהם.
האמונה של אנשים במספרים חזקה להפליא. הספקנים טוענים שהם "רק רוצים לראות את הנתונים" או דורשים להציג להם "נתוני בסיס" או מתעקשים ש"המספרים צריכים לדבר בעד עצמם". אנו משוכנעים ש"נתונים לעולם לא שקר». אבל השקפה זו עלולה להיות מסוכנת. גם אם הערכים או המספרים נכונים, עדיין ניתן להשתמש בהם כדי לשטות בראש […]. כדי שמספרים יהיו מובנים, עליהם להיות בהקשר מתאים. צריך להדגים אותם בצורה כזו שתהיה לנו השוואה כנה.
תחילה נחשוב מאיפה המספרים הללו מגיעים. חלק מהם אנו מקבלים ישירות, על ידי ספירה או מדידה מדויקת. יש 50 מדינות בארה"ב. ישנם 25 מספרים ראשוניים פחות מ-100. בניין האמפייר סטייט כולל 102 קומות. אגדת הבייסבול, טוני גווין, פגע ב-3,141 חבטות מתוך 9,288 במכות עבור ממוצע חבטות של ליגת העל של .388. באופן עקרוני, ספירה מדויקת צריכה להיות די פשוטה. יש תשובה חד משמעית, ובדרך כלל ישנו הליך חישוב או מדידה מסוים שניתן להשתמש בו כדי להגיע אליו. אבל התהליך הזה לא תמיד קל. זה בהחלט אפשרי לטעות בחישובים, מדידות, או במה בדיוק אנחנו רואים. קחו למשל כוכבי לכת. מערכת השמש. מרגע שהתגלה נפטון ב-1846 ועד שהתגלה פלוטו ב-1930, חשבנו שיש שמונה כוכבי לכת במערכת השמש. לאחר גילוי פלוטו, אמרנו שיש לנו תשעה כוכבי לכת. ואז, בשנת 2006, "העולה החדש" האומלל הורד למעמד של כוכב לכת ננסי, והיו שמונה כוכבי לכת מלאים שהקיפו שוב את השמש.
עם זאת, לעתים קרובות יותר, ספירות מדויקות או מדידות ממצות אינן אפשריות.
איננו מסוגלים לספור בנפרד כל כוכב במדד הנצפה עוֹלָםלהגיע לקירוב טריליון טריליון הנוכחי.
באופן דומה, אנו מסתמכים על אומדנים גסים כאשר אנו מסתכלים על אינדיקטורים כגון גובהו של מבוגר במדינה מסוימת. גברים מהולנד נחשבים לגבוהים בעולם - ממוצע של 183 סנטימטרים. אך כדי להשיג את הנתונים הללו לא מדדו את כל תושבי הארץ ולא חישבו את הממוצע של כל הערכים שהתקבלו. במקום זאת, החוקרים השתמשו במדגם אקראי של גברים מקומיים, מדדו מי נפל לתוכו, והוציאו את הממצאים לכלל האוכלוסייה.
אם מודדים חצי תריסר גברים ומחשבים את הגובה הממוצע שלהם, רק במקרה התוצאה הייתה שגויה. נניח שכמה מהם היו גבוהים בצורה יוצאת דופן. זה נקרא שגיאת דגימה. למרבה המזל, מדגם גדול בדרך כלל ישווה את השונות, כך שלטעות כזו יש השפעה מינימלית על התוצאה.
בעיות יכולות להתעורר גם בהליך המדידה. נניח שהחוקרים ביקשו מהמשתתפים לדווח על הגובה שלהם, אבל גברים נוטים לנפח את המספרים, כאשר גברים נמוכים עושים זאת לעתים קרובות יותר מגברים גבוהים.
מקור שגיאה נוסף, ההטיה של המדגם עצמו, מסוכן אף יותר. נניח שהחלטת לקבוע את גובה האנשים, הלכת למגרש הכדורסל המקומי והתחלת למדוד את השחקנים. שחקני כדורסלהוא בדרך כלל מעל הגובה הממוצע, כך שהמדגם שלך לא יהיה מייצג את האוכלוסייה הכללית ובסופו של דבר יהיה גבוה מדי. רוב השגיאות מהסוג הזה אינן כל כך ברורות. […]
בדוגמאות אלה, בדקנו קבוצות של אנשים בטווח של ערכים - למשל, טווח של גבהים - ולאחר מכן אספנו מידע זה למספר בודד, הנקרא סטטיסטיקה מסכם. לדוגמה, כשמתארים הולנדי גבוה, אנחנו מדברים על גובה ממוצע.
סטטיסטיקת סיכום יכולה להיות דרך נוחה לסכם מידע, אבל אם היא לא נכונה, אתה יכול בקלות להטעות את הקהל שלך.
פוליטיקאים משתמשים בטריק הזה כשהם מציעים להציג הפחתת מס, שיחסוך מאות אלפי דולרים ל-1% העשירים ביותר מהאזרחים, אבל לא יקל בשום אופן את נטל המס של כל השאר. הם לוקחים את ניכוי המס הממוצע וטוענים שתוכנית המס שלהם תחסוך למשפחות בממוצע 4,000 דולר בשנה. אולי כן, אבל המשפחה הממוצעת - אם נתכוון לזו שבאמצע חלוקת ההכנסות - לא תחסוך דבר. לרובנו יהיה הרבה יותר שימושי לדעת מה יהיה הניכוי למשפחה עם הכנסה חציונית. במקרה זה, החציון הוא ההכנסה ה"חציונית" בין מחצית מהמשפחות שמרוויחות יותר משווי זה לבין מחצית מהמשפחות שמרוויחות פחות משווי זה. כך, המשפחה החציונית לא תקבל ניכוי כלל, כי הוא מועיל רק ל-1% העליון של האוכלוסייה עם ההכנסה הגבוהה ביותר.
לפעמים אנחנו לא יכולים למדוד ישירות את המדד שמעניין אותנו. קרל נכנס לאחרונה מתחת לרדאר של הכביש המהיר בקטע כביש מהיר ישר ושטוח במדבר יוטה, שם נקבעה מסיבה בלתי מוסברת מהירות מוגבלת של חמישים מייל לשעה. הוא עצר לצד הדרך, הציץ בהבזקי האורות האדומים והכחולים המוכרים במראה האחורית. "אתה יודע באיזו מהירות נסעת?" שאל פַּטרוֹל. "אני לא חושב כך, קצין," ענה קרל. "שמונים ושלושה מייל לשעה."
שמונים ושלוש זה מספר רציני, שעלול לאיים בצרות גדולות. אבל מאיפה זה הגיע? מצלמות תנועה מסוימות מחשבות את המהירות שלך על ידי מדידת המרחק שאתה נוסע בפרק זמן מסוים, אבל הכבישים המהירים של המדינה עושים זאת אחרת. השוטר מדד משהו אחר - תזוזת הדופלר בגלי הרדיו שנפלט מהרדאר הנייד שלו כשהם קפצו על המכונית הדוהרת של קארל. התוכנה המוטמעת במכ"ם משתמשת במודל מתמטי המבוסס על מכניקת גלים כדי לחשב את מהירות הרכב באמצעות המדידות שהוא מקבל. מאחר והסייר אינו מודד ישירות מְהִירוּת קרלה, יש לכייל את המכ"ם באופן קבוע. הדרך הסטנדרטית להיפטר מדוח מהירות היא לדרוש מהשוטר להציג רישומי כיול בזמן. נכון, קארל לא היה צריך את זה. הוא ידע שעבר את המהירות המותרת, ושמח שעל חפזונו ירד עם קנס בלבד, אם כי גדול.
מכ"מים מסתמכים על עקרונות פיזיקליים חזקים מאוד, אבל המודלים המשמשים לחישוב מדדים אחרים יכולים להיות מורכבים יותר ולכלול יותר הנחות. הוועדה הבינלאומית לציד לווייתנים מפרסמת נתונים על מספר האוכלוסיות של כמה מינים של לווייתנים. כשהיא מדווחת שיש 2,300 לווייתנים כחולים במימי חצי הכדור הדרומי, היא מגיעה למספר הזה לא בגלל שכל אחד נמצא ונספר. בעל חיים. והם לא סרקו מחלק מהאוקיינוס ואליו. לווייתנים אינם עומדים במקום, ולרוב אינם נראים מפני המים. לכן, מדענים זקוקים לדרכים עקיפות כדי לקבוע את גודל האוכלוסייה. לדוגמה, הם סופרים מפגשים עם פרטים ייחודיים שניתן לזהותם על ידי סימנים על סנפיריהם הזנב והזנב. אז הקביעה שלהם לגבי מספרי הלווייתנים אינה מדויקת כמו הטכניקה הזו.
בחישובים ובעובדות שנראות ברורות לחלוטין, מתגנבות שגיאות מסיבות שונות. אפשר להתבלבל במספרים. אתה יכול להשתמש במדגם קטן מדי, אשר משקף באופן שגוי את המאפיינים של הקבוצה כולה. השיטות שבהן אנו גוזרים מספרים ממידע אחר עשויות להתברר כשגויות. ולבסוף, המספרים עשויים להיות פשוט שטות גמורה, שהומצאה מאפס בניסיון לתת יכולת שכנוע טיעונים פתטיים. עלינו לזכור זאת כאשר מראים לנו משהו לפי מספרים. אומרים שמספרים אף פעם לא משקרים, אבל צריך לזכור שהם לרוב מטעים.
"שטות גמורה!" מדבר על האופן שבו מידע שגוי מתפשט, מדוע אנו מאמינים בו וכיצד ללמוד כיצד להעריך נכון קשרים סיבתיים. הספר הזה מוכיח שאתה לא צריך להיות מומחה בסטטיסטיקה בשביל זה לזהות זיופים ושינוי מושגים. מספיק היגיון וחשיבה ביקורתית.
קנה ספר
קרא גם🧐
- מלכודות של תפיסה: איך החושים מעוותים את המציאות
- האם ההיסטוריה חוזרת על עצמה? האם ניתן לערוך הקבלות בין אירועי עבר להווה?
- הטיית אישור: למה אנחנו אף פעם לא אובייקטיביים
- למה מציאות אובייקטיבית לא קיימת
- מדוע אנו מאמינים בניחושים ושמועות יותר מאשר בסטטיסטיקה
*פעילויות Meta Platforms Inc. והרשתות החברתיות שלה פייסבוק ואינסטגרם אסורות בשטח הפדרציה הרוסית.