עונת הNBA החדשה לפנינו, ואיתה, כמו תמיד, שחקנים במדים חדשים וקבוצות ששינו את פניהן. יותר מ-100 שחקנים עברו קבוצה בקיץ, וההתרגלות לפנים החדשות של קבוצה היא דבר שלוקח זמן.
הסטארטרס אפילו הקדישו חלק בתכנית שלהם לשאלה "מי נראה הכי מוזר במדים החדשים שלו?":
כל קבוצה השתנתה מהעונה שעברה – בין אם זה בסגנון המשחק או בחמישיות וברוטציות . הכמות הגדולה של השינויים קשה לעיכול עבור רובנו. כבר בקיץ, אחרי ששוק ההעברות נרגע, ניסיתי ליצור כלי שיעזור להבין לגבי כל קבוצה מי נגד מי, כמה ולמה.
החלטתי לנסות לחזות את הרוטציות של הקבוצות – מספר הדקות למשחק שישחק כל שחקן בעונה הקרובה. הכול התחיל בקיץ, בנסיעה במונית בדרך לשדה התעופה. בשעה של נסיעה התחלתי לפתח רעיון למודל חיזוי דקות, ועד שעליתי על המטוס כבר מצאתי מעטפה שהפכה לחתיכת נייר עליה כתבתי את הבסיס למודל. אז עוד חשבתי שבזה המצאתי את הגלגל, ונשאר לי רק לכתוב תוכנה שתמיר את הרעיון לנתונים ותראה לי שהמודל שלי חוזה בדיוק מושלם.
כשהגעתי לארץ והתחלתי לעשות נסיונות ולהתייעץ עם זאב סוביק, שעזר לי המון בכל התהליך. רק אז הבנתי למה נכנסתי – דקות למשחק הוא נתון שתלוי בהרבה גורמים, שחלקם לא מספריים. לכן, כמו שהשכיל זאב להסביר לי, לא אגיע לדיוק מושלם, ואני צריך לשאוף לשפר את המודל כמה שאני יכול כך שיצליח לחזות בצורה טובה חלק גדול מהמקרים.
התחלתי לנסות קומבינציות של גורמים שמסבירים דקות, ולבדוק אותן עם סטטיסטיקות השנה שעברה. שאלות בסגנון ״איך אני חוזה לקווין דוראנט 20 דקות ולמריו צ׳אלמרס 38 דקות?״ היו דבר שבשגרה לזמן מה, אך לאט לאט הצלחתי להגיע לנוסחה שחוזה באופן הטוב ביותר.
על מנת להשתמש במספרים מדויקים, יצרתי קשר עם nylon calculus, אתר NBA שעוסק בסטטיסטיקה. הם הסכימו לספק לי את הסטטיסטיקות שלהם שעוסקות בעמדות שבהן משחק כל שחקן ומספר הדקות בהן שיחק בכל עמדה. עם העמדות המדויקות עד לרמת עשרות האחוזים, שהיו הרבה יותר טובות מכל מה שהיה חי עד אז, המודל שלי השתפר פלאים.
בו בזמן פתרתי בעיות טכניות קטנות שעיכבו אותי זמן רב (לדוגמה, באתר אחד כותבים Karl Anthony Towns ובאתר אחר כותבים Karl Towns. כך גם עם Larry Nance Jr מול Larry Nance ועוד הרבה דוגמאות שהשאירו אותי שעות נוספות מול המחשב על מנת לתקן אותן). משום שבמודל שלי דקותיהם של חברים לקבוצה תלויים אחד בשני, וידאתי שאני מתקן את כל אותן הבעיות הקטנות לפני שאני ממשיך.
אחרי הרבה עבודה, המודל הסופי לחיזוי הדקות מורכב מהגורמים הבאים:
• כמות הדקות למשחק ששיחק שחקן בעונה האחרונה.
• כמות הזריקות למשחק שזרק שחקן בעונה האחרונה.
• מספר השנים של השחקן בליגה.
• העמדות בהן השחקן משחק ומספר הדקות שהוא שיחק בהן בעונה האחרונה.
• חבריו לקבוצה של השחקן המשחקים בעמדות שלו.
• מספר המשחקים ששיחק השחקן בשלוש עונותיו האחרונות.
• ההפרש בין קבוצתו הקודמת של השחקן לקבוצתו הנוכחית (אם עבר קבוצה בקיץ).
• הבחירה בה נבחר השחקן בדראפט (לשחקני שנה ראשונה ושנייה).
בעזרת הגורמים הללו הצלחתי להגיע לתוצאות טובות, שמראות כמה דקות צפוי לשחק כל שחקן בכל עמדה בעונה הקרובה. המודל לא מושלם – ישנם מקרים בהם הוא נוגד את ההיגיון, וחוזה מספר דקות גדול הרבה יותר מדי או נמוך מדי – אך המקרים האלו לא רבים.
באופן כללי המודל נותן תחושה טובה לגבי הרוטציה המסתמנת של הקבוצות השונות בעונה הקרובה. תוכלו לראות אילו שחקנים מהקבוצה שלכם צפויים לשחק יותר ואילו פחות, ואיך יתחלקו הדקות שלהם בין העמדות בהן הם משחקים.
והרי התוצאות: