גשם של מספרים

מקורן של רב הרעות החולות הפוקדות אותנו הוא בחוסר יכולתו של האדם לשבת בשקט בחדר. (בלייז פסקל)

למרות מנהגי להימנע מפעילויות מסוכנות לבריאותי, מצאתי את עצמי השבוע בתל אביב בעיצומו של הגשם השוטף. הייתי אחרי ישיבה מעצבנת במיוחד וניסיתי למצוא את דרכי חזרה לירושלים, בינות לשלוליות הענק. התל אביבים האלה, אפילו גשם הם לא יודעים לארגן כמו שצריך. ספרתי מחשבות וחשבתי על מספרים. אני למדתי באוניברסיטה שני תארים (וחצי). הראשון בסטטיסטיקה והשני בסוציולוגיה ואנתרופולוגיה. שם למדתי על היכולת לנתח נתונים וללמוד מהם, וגם על המקום המיתולוגי  שיש בתרבותנו לערימות של מספרים. אנשים נוטים לבלבל בין מחשבה בהירה שיטתית ואנליטית, לבין גליונות של אקסל וטבלאות מספרים ערוכות במסדר. שכחו שהבסיס הוא לברר היטב מה הנחות היסוד שלך, מה ההשערות ומה אתה בעצם מבקש להוכיח.

נסתכל קצת על סקרים ושאלונים. אלה מהסוג של "האם אתה מרוצה במידה רבה או מועטה, סמן מאחד ועד חמש".  הכשל הראשון הוא חוסר ההבחנה בין סולם סדר לסולם מכפלה. כלומר, אני יודע ש"מרוצה רץ לקנות עשר כאלה לתת לכולם" נמצא גבוה יותר מ"לא מרוצה מאד תעזבו אותי באמ'שכם"(function() { var scribd = document.createElement("script"); scribd.type = "text/javascript"; scribd.async = true; scribd.src = "http://www.scribd.com/javascripts/embed_code/inject.js"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(scribd, s); })();, אבל האם אפשר לומר שהוא גבוה ממנו פי חמש? האם הממוצע של "חלום חיי" ו"לא אגע בזה עם מקל של שני מטר" הוא "בסדר, אתה יודע מה, שיהיה"? גם אם יש לנו תחושה מסוימת שאכן אפשר לדבר במושגים הללו, כשמתחילים לחשב ממוצעים זה הופך לאבסורדי. מה המשמעות של ציון 4.6 ? אין לו. אנחנו פשוט מניחים שיש פה מכפלה ויש רצף של נתונים. וכבר הייתי בישיבות שהתפלפלו שעות על ההבדל בין 3.2 ל 2.8 .  ולא  נשכח את גודל המדגם ואת ההשפעה שיש לנתונים קיצוניים במדגמים קטנים. מי שאינו מיומן בכך אינו מבחין בין שינוי משמעותי לתנועה קטנה ומקרית. כך למשל ה'סוציומטריה'  משמשת ככלי ניהולי לקבלת החלטות.  לעונים על השאלונים ולאלה שקוראים את התוצאות יש מושג מעורפל של "סוציומטריה" עוד מהזמן שהיו בצבא, ולמדו ש"סוציומט" הוא אחד שדואג רק לעצמו ולא אכפת לו מאחרים. אך למרות אין להם כלים אנליטיים לנתח מה יש בשאלון ומה לא, הם משוכנעים במספרים.

זה לא חשוב, אל תדבר איתנו במלים – גיב מי דה נאמברז, הם אומרים.  נער הייתי וגם זקנתי (קצת) ואוסף השטויות שנתמכות בגרפים צבעוניים שראיתי הייתה גורמת אפילו לצדיק לעזוב הכל ולברוח מפה. נכון, יש דברים שצריך לספור ולמנות ולחשב היטב. אבל חישוב לא יכול להיות  תחליף למחשבה. האם הדבר שאותו אתה סופר הוא הדבר שאתה רוצה לבדוק באמת? או שזה נתון מקורב, או משהו שלא קשור בכלל? השימוש בנתונים מוצדק ככלי תומך לניתוח עובדתי של תופעות. וכל ניתוח שכזה צריך לדעת מה איכותם של המספרים שאתה מנתח, ומה הם מייצגים. במקרים רבים, מספרים הם ייצוג חלקי לתופעות ונוח לתלות בהם את כל מה שאנחנו לא יודעים ולא יכולים לדעת. כבר קרה לי שנדרשתי לתת אומדן לתופעה כלשהי, וטענתי שאי אפשר על סמך הנתונים שבידינו, הבוס אמר אז תתן לי הערכה, משהו. הצעתי לו לזרוק מטבע. הוא זרק, כלומר אותי מהחדר.

[youtube https://www.youtube.com/watch?v=qJ8ahL8LsEQ?hl=en&hd=1&w=420&h=315]

2 Comments

התגובות סגורות.