אנחנו כבר יודעים שהסתברות מותנת יכולה לשמש אותנו כדי לתפוס מידע שמועבר על ידי מספר מאורעות על ההסתברויות השונות של משתנה רנדומי. אם כן, נרצה להציג התנייה על פונקציית מסת ההסתברות, שבהינתן שמאורע מסויים התרחש או בהינתן שיש לנו ערך מסויים של משתנה רנדומי אחר.
התנייה של משתנה רנדומי עם מאורע
ה PMF המותנה של משתנה רנדומי מותנה במאורע כלשהו עם מוגדר על ידי
המסקנה המתבקשת היא ש היא פונקציית מסת הסתברות תקינה.
החישוב של PMF מותנה די דומה לגרסה הלא מותנת שלא,
כדי להשיג את נסכום את כל ההסתברויות שיתנו וגם שנמצאות במרחב של .לאחר הסכימה נבצע נורמליזצייה על ידי חילוק ב .
ניתן לראות בתמונה באופן ויזואלי את הליך החישוב של פונקציית מסת ההסתברות המותנת במאורע, לוקחים את החלק היחסי של הערך שאותו אנחנו מחפשים בעולם של המאורע המתנה במקרה זה .
דוגמה : תלמיד ייקח מבחן באופן חוזר עד פעמים. כל פעם ההסתברות למעבר היא בלי תלות למספר הפעמים שנבחן קודם לכן.
בהינתן שהתלמיד עבר את המבחן בניסיון כלשהו, מהי פונקציית מסת ההסתברות על מספר הניסיונות.
נגדיר את להיות המאורע שהסטודנט עבר את המבחן (לכל היותר בניסיון ה ). נציג משתנה רנדומי שמייצג את מספר הניסיונות הדרושים כדי לעבור אם מספר לא מוגבל של ניסיונות היה מותר.
במצב זה הוא משתנה גיאומטרי עם פרמטרים והמאורע ויתקיים
נשים לב שהסכימה כאן היא בגלל ש הוא חסם עליון ולא מספר הניסיונות המדוייק שצריך לעשות עד להצלחה.
אם כן , יתקיים ש
המונה בביטוי שהבאנו הוא בידיוק כי החיתוך של כל הניסיונות עד עם פונקציית מסת ההסתברות של המשתנה הגיאומטרי שהייתה הצלחה ב בידיוק היא עדיין המשתנה הגיאומטרי שכן הוא מוכל במאורע .
Info
נשים לב שלעתים ההתפלגות של משתנה מקרי מותנה נשארת זהה אבל מבצעים עליה נורמליזצייה כדי שהתכונה של פונקציית PMF תקינה תישמר.
התנייה של משתנה רנדומי עם משתנה רנדומי אחר
יהי שתי משתנים רנדומיים המשוייכים לאותו ניסוי.
אם אנחנו יודעים שהערך של הוא ערך כלשהו עם פונקציית מסת התסברות גדולה מ0, נוכל לקבל ידע חלקי על הערך של . הידע הזה נתפס על ידי פונקציית מסת ההסתברות המותנת של בהינתן . זה מקרה פרטי של התנייה של משתנה רנדומי עם מאורע
ולכן יתקיים ש
נראה שזאת אכן פונקציית מסת התסתברות תקינה,
עבור כלשהו שיקיים יתקיים
כלומר הפונקצייה הזאת היא תקין של (נשים לב שזה אינטואיבית יכול לבלבל בגלל שלכאורה הpmf המותנה הוא חלק מהpmf הכולל של אבל החילוק בפונקציית מסת ההתסברות שלנעלם אחר היא זאת שמאפשרת את תכונת הנרמול הזאת).
ה המותנה מאפשר לנו לחשב באופן נוח את ה המשותך של עבור כלשהם:
דוגמה
הפרופסור באוניברסיטה לעתים קרובות טועה בנתונים ועונה לתלמידים תשובות שגויות בהסתברות של , בלי תלות מסויימת בשאלות האחרות.
בכל הרצאה הפרופסור נשאל (לכל היותר 2) שאלות עם הסתברות שווה של (ההסתברות לכמה שאלות ישאלו היא ) .
נגדיר את להיות מספר השאלות שנשאלו ומספר השאלות שנענו עם טעות בתשובה , בהתאמה.
נרצה לבנות את פונקציית מסת ההסתברות המשותפת לכל ערכי האפשריים. נוכל לתאר זאת כעץ החלטות באופן הבא
לדוגמה עבור המקרה שבו שאלה אחת נענתה שגוי בהינתן ששאלה אחת נשאלה נקבל
נשים לב שיש לנו כאן סימונים שונים לבעיות שאנחנו כבר מכירים מהסתברות מותנת כי בעצם חישבנו כאן חיתוך בין שתי מאורעות על ידי שימוש בעץ החלטות סדרתי.
נוכל לתאר את התוצאות של ה המשותף בטבלה באופן הבא
ומכאן כפי שאנחנו כבר יודעים נוכל לחשב את פונקציית מסת ההסתברות השולית
ה המותנה הוא בעצם פונקציית מסת הסתברות סטנדרטית תחת ״יקום״ חדש שנקבע על ידי המאורע המותנה.
באותו נשימה, נוכל להגדיר תוחלת מותנת באופן דומה. היא כמו התוחלת הטריוויאלית רק שהיא כפופה ליקום החדש. כמו כן כל ההסתברויות ופונקציות מסת ההסתברות מוחלפות בגרסאות המותנות שלהן. (שונות מותנת גם כן מתנהגת כך).
מספר תכונות חשובות: א) התוחלת המותנת של בהינתן מאורע A עם הסתברות גדולה ממש מ0 מוגדרת להיות
ב) עבור פונקצייה יתקיים
ג) התוחלת המותנת של בהינתן שקיבלנו ערך של משתנה רנדומי יהיה
ד) אם הן מאורעות זרים שמהווים חלוקה של מרחב המדגם וכל אחד מהם עם התסברות גדולה מ0 אזי
יתרה מכך, לכל מאורע שיקיים אזי
ה) יתקיים כתוצאה מסעיף ד. (כי לכל המאורעות זרות אחת לשנייה)
שתי המשפטים האחרונים שקולים והם נקראים משפט התוחלת השלמה.הרעיון הוא שבדומה להסתברות השלמה שאומרת שמרכיבים את ההסתברות הלא מותנת על ידי סכימה של כל ההסתברויות המותנות שלה. באותו אופן נוכל להוכיח את משפט התוחלת השלמה
אם נרצה להוכיח את המשפט על פשוט נוסיף התנייה על ההוכחה הנ״ל ונקבל:
תוחלת ושונות של משתנה גיאומטרי
אנחנו כותבים תוכנה שוב ושוב בהסתברות שהיא תעבוד כמו שצריך. אין תלות בין ניסיונות. מהי התוחלת והשונות של , מספר הניסיונות עד שהתוכנה עובדת כמו שצריך.
נזהה ש הוא משתנה גיאומטרי עם פונקציית מסת הסתברות
אם נחשב את התוחלת והשונות נקבל ש
החישוב של הסכום הזה יכול להיות קשוח מאוד. כאלטרנטיבה נוכל להשתמש בנוסחת התוחלת השלמה עם כלומר הניסיון הראשון הוא הצלחה ו כלומר הניסוי הראשון הוא כשלון, ובאופן הזה נקבל חישוב פשוט יותר.
אם כן, נקבל שאם הניסיון הראשון הוא מוצלח אז
אם הניסיון הראשון נכשל, אז זרקנו ניסיון אחד וחוזרים לאן שהתחלנו, ולכן לאחר הנסיון הראשון נקבל שמספר הניסיונות הנותרים המצופה הוא עדיין
הנ״ל נכון לאור העובדה שהערכים ש מקבל הם אינסופיים (כעוצמת הטבעיים). הרעיון הוא שבגלל שתוחלת היא תלויה בכל הקלטים אז גם אחרי שהזריקה הראשונה נכשלה זה לא ישנה כי אנחנו לא מחפשים הצלחה בנקודה ספיצפית ולכן מרגע הכשלון בעצם אנחנו ממשיכים לזרוק כרגיל בלי חשיבות למה היה קודם, עד להצלחה בזמן לא ידוע.
למשל: אם נזרוק מטבע עד לקבלת H ונרצה לחשב את פונקציית מסת ההסתברות עבור הצלחה בפעם השלישית נקבל
עם זאת, נניח שההטלה הראשונה הביאה ונרצה עדיין להצליח בניסיון השלישי נקבל
קיבלנו את אותה התוצאה.
תכונה זאת של המשתנה הגיאומטרי נקראת חוסר הזכרון והיא באה להגיד שאין תלות מתי לנקודת ההתחלה של הניסוי זה תמיד יצא אותה התוצאה (מצב שבו מישהו זרק שלוש הטלות והלך ומישהו אחר בה אחריו ומנסה להגיע להצלחה בזריקה השלישית שלו, הסיכויים של שניהם שווים למרות שכבר עברו 3 הטלות).
באופן כללי נוכל לנסח את התכונה הזאת כך
אם כן, נקבל
נפשט את המשוואה ונקבל
באופן דומה יתקיים
וגם
בדומה ל נקבל
ויתקיים
וסך הכל נקבל
משתנה מתפלג גיאומטרי שסופר את הכשלונות בלבד
עד כה מידלנו את ההתפלגות הגיאומטרית ככזאת שסופרת את מספר הניסיונות כולל ההצלחה הראשונה, נוכל בקלות למדל אותו כך שיספור רק את הכשלונות . למשל נוכל פשוט להחסיר מהתוחלת את כדי לקבל את התוחלת הרצוייה. כלומר ה pmf יהיה פשוט
כלומר ספרנו את כל הכשלונות לא כולל ההצלחה. ההשפעה של זה על התוחלת תהיה :
ההחסרה נובעת מכך שפשוט הורדנו ספירה אחת בניסוי.
כמו כן- השונות נשארת אותו דבר כלומר: