שרון דוידוביץ' יצא השבוע במניפסט נוקב כנגד השימוש המוגזם במספרים ב-NBA. במובנים רבים הוא צודק. כאוהד כדורסל אני מרגיש מרומה לאחר צפייה בשחקן שפוגע בקבוצה שלו ומפסיד, אבל בבוקר שאחרי אני מגלה את המדיה שרה לו שיר הלל. גם אותי מכעיס ששחקנים לא לוקחים זריקות בסוף שעון כדי לא להרוס את האחוזים או מוסרים בהגזמה כדי להעלות את כמות האסיסטים לטריפל דאבל. האנקדוטות האיזוטריות על ג'ייק ליימן שמוביל את הליגה בכל הזמנים בנקודות פר. דקה הן בדיחה במקרה הטוב. אבל המספרים הללו לא נמצאים בחיים שלנו סתם כך, ואני רוצה לנצל את הדיון שפתח שרון כדי לעשות בהם קצת סדר. אני מקווה שאחרי קריאת הטור הזה המילה "סטטיסטיקה" תיזרק הרבה פחות לאוויר העולם.
מדדים – רוב מה שאנחנו נתקלים בו בעולם המספרים הוא מדד. נקודות הן מדד. ריבאונדים, אסיסטים, חטיפות – גם. 40% מהשדה זה מדד ליכולת של השחקן לקלוע. מדדים הם כיף כי כל תלמיד בית ספר יסודי יכול להבין אותם. להבחין ש-30 נקודות הן יותר מ-25, או חמש חסימות הן יותר משניים, זה תרגיל בדידים קלאסי. להבחין שההבדל הזה יכול להיות חסר משמעות, זה החלק הקשה.
הקטע עם מדדים הוא שאפשר למדוד כל מה שרוצים. ובאמת עושים את זה. אם תיכנסו לאיזור הנתונים המתקדמים באתר ה-NBA תגלו שהוא מלא בהמון, המון מדדים. כמה שחקן זרק, כמה הוא רץ, מה אחוז הריבאונדים שלקח, כמה נקודות קלעו עליו ליד הטבעת. חלק מהמדדים נשארים אצל הקבוצות ולא משוחררים לקהל הרחב. ביוסטון רוקטס, לדוגמה, סופרים "ראסלים" (שאלו חסימות שבהן הקבוצה החוסמת זוכה בכדור) ומקזזים זריקות סוף שעון מחישוב אחוזי השדה.
להיכנס לעולם המדדים בעולם שבו המגרש מרושת במצלמות וכל פעולה נמדדת מבלבל יותר מארוחת בוקר במלון בסגנון "אכול כפי יכולתך". הכול נמצא על השולחן ומוכן לשימוש, אבל במה לבחור? זה גורם לאנשים להשתמש באחת מתוך שלוש גישות:
הראשונה היא ניסיון לבנות על-מדד, כמו הPER (Player Efficiency Rating) המפורסם של ג'ון הולינג'ר, שאמור להגדיר במספר אחד את היכולת של שחקן. הבעיה מתחילה כשלוקחים הרבה מדדים שלא אומרים כמעט כלום, ויוצרים משהו מקיף שבתורו, לא בעל משמעות מיוחדת.
השנייה היא להתייאש מכל המספרים הללו ולחלום על אותם הימים בשכונה, שבהם השחקן הטוב ביותר היה זה עם הקרוס-אובר הטוב ביותר (עד ששמנו לב שהקבוצה שלו בדרך כלל מפסידה). האמת היא שאפילו לצופים מיומנים קשה להבחין בכל הפעולות הטובות ששחקן עושה, במיוחד אם הן רחוקות מהכדור. ואם אנחנו לוקחים בחשבון שבעונה הרגילה משחקים 1,230 משחקים ואף אחד לא הולך להתעמק אפילו ברבע מהם, בסוף נהיה ראויים לתגובה האגדית של רוי היברט .
השלישית, היא סטטיסטיקה.
סטטיסטיקה – בשנת 2012 הכתיר ה-הרוורד ביזנס ריוויו את הסטטיסטיקה כ"מקצוע הסקסי ביותר של המאה ה-21". סטטיסטיקאים הם אלו שמקבלים את ערימת דאטה והמדדים, ועובדים כדי להפוך אותם למשהו משמעותי.
בסוף שנות ה80' היה דין אוליבר שחקן חובבני באחת מקבוצות הקולג'ים הגרועות אי פעם – נבחרת הכדורסל של המכון הטכנולוגי של קליפורניה. לצד זה, התמזל מזלו של אוליבר ללמוד באחד מהמוסדות המדעיים החזקים בעולם. "היכולת לדבר על כדורסל עם מדענים ועל מדע עם אנשי כדורסל עזרה לי לבנות את השפה של הספורטס אנליטיקס", כתב אוליבר על התקופה ההיא.
העבודה של אוליבר הייתה בשני מישורים. מצד אחד, הוא בנה 'מטריקות', כלומר מדדים משוכללים. הוא היה הראשון שהתחיל לנתח כדורסל על בסיס פוזשנים, מה שיצר את הרייטינג ההגנתי וההתקפי. מצד שני, הוא התחיל לנתח את המשמעות של הנתונים הללו. על ידי בחינת קשר מובהק בין המדדים לניצחונות, הוא יצר את מודל "ארבעת הפקטורים" שכולל ארבעה גורמים מרכזיים להערכת יכולת של קבוצה: אחוזי שדה, אחוז ריבאונדי ההתקפה, איבודים לפוזשן ומספר זריקות עונשין לפוזשן. עד שנת 2004, אז יצא ספרו "Basketball On Paper", זכר לימים בהם היה אוסף נתונים עם עיפרון ודף, היו ברזומה של אוליבר ניתוחים מורכבים על קבוצות, שחקנים, מאמנים ושופטים.
ההצלחה של אוליבר, לצד שיגעון המאני-בול מהבייסבול, פרצה את הדרך למהפכת הסטטיסטיקה בNBA. היום מודלים סטטיסטיים ומתמטיים (יש קצת הבדל) נמצאים בשימוש תדיר אצל רוב הקבוצות בליגה, אבל הקהל הרחב מקבל הצצה אליהם רק כשמתפרסמים דירוגי הRPM ודומיהם. להסביר מהי סטטיסטיקה יהיה מעבר ליריעה של הטור הזה, אבל בגדול הרעיון הוא למצוא קשרים בין המדדים השונים ובינם לבין הצלחה קבוצתית, ולחזות השפעה של תוצאות עתידיות. בנוסף, סטטיסטיקה עוסקת בלהבדיל בין תוצאות עקביות ומקריות (שוב ג'ייק ליימן?).
בעוד שהסתכלות על מדדים פשטניים (נקודות, אסיסטים) מובילה לרידוד השיח, תוצרים של עבודה סטטיסטית אמיתית מובילים אותנו לתובנות שלא היינו מגיעים אליהן אחרת. לסלי אלכסנדר, הבעלים של יוסטון, מספר שדאריל מוריי היה צריך לעבוד קשה כדי למכור לו את ההבאה של שיין באטייה תמורת רודי גיי הצעיר. שום אינטואיציה או מדד שאלכסנדר הכיר לא הובילו אותו לחשוק בבאטייה. ועדיין, מחקר יסודי של הנתונים הראה שיותר מדי שחקנים ששיחקו מול באטייה פשוט תפסו "יום רע".
הגל הפסיכולוגי – בתקופה האחרונה אפשר לראות בליגה סממנים של עידן אנליטיקס מסוג אחר. המודלים הסטטיסטיים המתקדמים קידמו את ההבנה לגבי מיהם השחקנים הטובים ואיך נכון לקבוצות לעשות, אך הם פספסו מורכבויות שקיימות בעולם האמיתי. קל בהרבה לנבא מי יקלע טוב שלשות חופשיות מהפינה מאשר איך תיראה הכימיה הקבוצתית במידה ומוסיפים או מורידים שחקן (וגם את זה יש דרכים לעשות). מחקרים על בסיס נתונים יכולים למצוא שווינגספאן הוא תכונה חשובה בתיכונים לניבוי הצלחה מקצוענית (הסיקרס עשו משהו כזה) אבל לא איך אופי של שחקן ישפיע על ההצלחה שלו. סטטיסטית, יוסטון רוקטס משחקים בדרך היעילה ביותר – מוותרים על זריקות חצי מרחק לטובת שלשות ודאנקים. רק שבתגובה לכך מופיעה תופעת החיים האמיתיים כמו דמאר דרוזן שנותן מספרים אדירים דווקא במשחק חצי-המרחק הלא יעיל.
כאן נכנס המחקר הפסיכולוגי. לפני דראפט 2014 לקחו מילווקי באקס מומחה להבעות פנים, דן היל, כדי לנסות ולהעריך לפי הבעות הפנים במשחק מי מהשחקנים יוכל להתאים את עצמו טוב יותר לליגה. מעקב הכיפים המפורסם (והנלעג) בפיניקס הוא תוצאה ממחקר שמצא קשר בין כיפים שנותנים השחקנים אחד לשני ובין מדדים של קבוצתיות והצלחה קבוצתית. אז ברור שכל אחד יכול לתת כיפים, וזה בטח המדד היחיד שבו ג'יימס ג'ונס מקליבלנד יצא השחקן הטוב בליגה, אבל יש פה גם היגיון מסוים. Fake it till you make it. כשלא נותנים כיפים המצב נראה גרוע בהרבה.
הצפת הליגה בנתונים עשתה רק טוב למי שיודע לעשות עליהם את הניתוח הסטטיסטי הנכון, למרות שגרמה לרידוד השיח באופן כללי. עבור 99% מהאנשים, שלא נמצאים בנבכי הנתונים, כתב פעם דרור האס שנתונים סטטיסטיים הם כמו הרוטב של ההמבורגר. זה מוסיף, אבל לא מחליף את חוויית המשחק הממשית.