ב) חוק הסתברות שמצמיד בין מאורע להסתברות שלו שהיא אי שלילית ומייצגת את הסיכוי להתרחשות האיברים בתוך .
ג) תוצאות הן תמיד זרות אחת לשנייה
אקסיומות ההסתברות
א)
ב) אדטיביות- בהינתן ש הן קבוצות זרות : (עובד גם על מאורעות זרים).
ג) נורמליזציה
ד) חוק ההסתברות הבדיד- אם מרחב המדגם מכיל מספר סופי או בן מנייה של תוצאות אז ההסתברות של כל מאורע יהיה
ה) אם כל התוצאות הן בסבירות שווה לקרות אזי
תכונות נוספות
התסברות מותנת
א)
התנייה זה הסתברות לכל דבר תחת עולם חדש שהוא במקרה הנ״ל .
ב) במרחב מדגם שווה הסתברות
ג)
חוק הכפל
התמונה מקלה לראות את החוק עבור 2 מאורעות למשל ,
משפט ההסתברות השלמה וחוק בייס
משפט ההסתברות השלמה
חוק בייס
אי תלות
הגדרה:
או
מאורעות זרים הם תמיד בלתי תלויים.
אם בלתי תלויים כלומר ההתרחשות של לא משפיע על אז גם אי ההתרחשות ולכן אם בלתי תלויים אז גם בלתי תלויים.
אי תלות מותנת
הגדרה:
או
אי תלות של n מאורעות
נאמר שהמאורעות בלתי תלויים אם מתקיים
למשל עבור אי תלות בין שלושתם תתקיים אם :
שלושת התנאים הראשונים מבטיחים לנו שכל שתי מאורעות הם בלתי תלויים, התכונה הזאת נקראת pairwise independent כלומר אי תלות בזוגות. אי תלות בזוגות לא מראה על אי תלות
מנייה, צירופים וחלוקות
מספר תרחישים בהם אנחנו משתמשים בספירה כדי לחשב הסתברות.
כאשר מרחב המדגם הוא מרחב מדגם שווה הסתברות בדיד. כלומר יש בו מספר סופי של תוצאות שלכל אחת הסתברות זהה. במצב זה ההסתברות של מאורע תהיה
כאשר נרצה לחשב התסברות של מאורע עם מספר סופי של תוצאות אפשריות כאשר לכל אחד יש הסתברות . במצב זה ההסתברות של מאורע תהיה
עקרונות ספירה
נכליל את עקרונות הספירה כך:
נניח שיש תהליך שמכיל שלבים
בשלב הראשון יש תוצאות אפשריות.
לכל תוצאה אפשרית בשלב הראשון יש , תוצאות אפשריות בשלב השני.
באופן כללי, לכל רצף של תוצאות אפשריות ב השלבים הראשונים יש אפשרויות בשלב ה .
דוגמאות
מספר הסוגים האפשריים למספר טלפון - מספר טלפון הוא בעל 7 ספרות כאשר הספרה הראשונה חייבת להיות שונה מ . נוכל לתאר את הבעיה הזאת כתיאור של עץ סדרתי כאשר הרמה ה מייצגת את הספרה ה ואפשרותיה. כלומר באופן הזה עבור הספרה הראשונה יש לנו 8 אפשרויות וכל השאר עם 10 ולכן נקבל
מספר תתי הקבוצות לקבוצה בגודל . נוכל להסתכל על זה כבחירה על כל איבר בקבוצה של האם להכניס אותו לתת הקבוצה או לא. כלומר שישנן אפשרויות לבניית תת קבוצה מ איברים.
פרמוטציה מסדר k
נרצה לבחור k אובייקטים מתוך אוסף המכיל n אובייקטים שונים ולסדר אותם איכשהו.
במקרה הפרטי ש זה פשוט נקרא פרמוטצייה ונקבל אפשרויות.
צירופים
רצה לבנות ועדה של חברי צוות מקבוצה של אנשים.
זה שקול ל מקדם בינומי שזה בעצם בחירה של מתוך איברים. כלומר
משתנים מקריים בדידים
ניתן גם לסמן
נורמליות:
פונקציות של משתנים רנדומיים בדידים
תוחלת ושונות
תוחלת:
שונות:
סטיית תקן:
תכונות חשובות של תוחלת ושונות
ליניאריות התוחלת:
כאשר הם סקלרים כלומר הוא פונקצייה ליניארית על , יתקיים:
עבור קבוע יתקיים
אחיד
ב :
ברנולי
עבור פרמטר המייצג הסתברות להתרחשות של מאורע או הצלחה של ניסוי.
בינומי
עבור ו
גיאומטרי
עבור פרמטר ההסתברות להצלחה בניסוי
CDF:
חוסר זכרון של גיאומטרי:
או
משתנה מתפלג גיאומטרי שסופר את הכשלונות בלבד
עד כה מידלנו את ההתפלגות הגיאומטרית ככזאת שסופרת את מספר הניסיונות כולל ההצלחה הראשונה, נוכל בקלות למדל אותו כך שיספור רק את הכשלונות . למשל נוכל פשוט להחסיר מהתוחלת את כדי לקבל את התוחלת הרצוייה. כלומר ה pmf יהיה פשוט
כלומר ספרנו את כל הכשלונות לא כולל ההצלחה. ההשפעה של זה על התוחלת תהיה :
ההחסרה נובעת מכך שפשוט הורדנו ספירה אחת בניסוי.
כמו כן- השונות נשארת אותו דבר כלומר:
פואסון
עם פרמטר (כאשר גדול ממש ו קטן ממש נקבל )
איחוד PMF של מספר משתנים רנדומיים
עבור :
במקרה הליניארי :
הפונקציות השוליות
הכללה למספר משתנים אקראיים
התניות על משתנה רנדומי בדיד
התנייה של משתנה רנדומי עם מאורע
התנייה של משתנה רנדומי עם משתנה רנדומי אחר
תוחלת מותנת
התוחלת השלמה :
אם הן מאורעות זרים שמהווים חלוקה של מרחב המדגם וכל אחד מהם עם התסברות גדולה מ0 אזי
יתרה מכך, לכל מאורע שיקיים אזי
אי תלות על משתנה רנדומי בדיד
אי תלות של משתנה רנדומי עם מאורע
כל עוד , אי תלות היא זהה לתנאי
אי תלות בין משתנים רנדומים
אי תלות מותנת
תוחלת ואי תלות
מסקנה
שונות ואי תלות
אי תלות של מספר משתנים רנדומים
משפט אם הם משתנים בלתי תלויים אזי
תוחלת ושונות של sample mean
נגדיר את ה sample mean להיות
נשים לב שזה משתנה רנדומי שמהווה אסטימצייה טובה לשיעורי ההצבעה בגלל שהתוחלת שלו היא עדיין שמייצג את שיעור ההצבעה ״האמיתי״ של ביידן. נשים לב שכל עוד בלתי תלויים אחד בשני ויש להם תוחלת ושונות שווים אז יתקיים
משתנים רנדומיים - רציף
PDF
התכונות ש צריכה לקיים כדי להיות תקין הן:
כלומר פונקצייה אי שלילית לכל ערכיה
נורמליזציה הסכום של כל ערכי התמונה האפשריים צריך להיות
תוחלת
משתנה רנדומי אחיד רציף
ה CDF של התפלגות אחידה:
משתנה מקרי מעריכי
נשים לב שההסתברות של לעלות על ערך מסויים קטנה באופן מעריכי. עבור נקבל
CDF:
משתנה מקרי נורמלי
נהוג לסמן משתנה נורמלי כ
משתנה נורמלי ופונקצייה ליניארית
אם הוא משתנה נורמלי עם תוחלת ושונות נגדיר עבור ו סקלרים:
אזי, הוא משתנה נורמלי ומקיים
משתנה נורמלי סטנדרטי
משתנה נורמלי עם תוחלת 0 ושונות באורך 1 מוגדרת כ נורמלי סטנדרטי . ה CDF שלה מסומן כ והיא מקיימת
נירמול משתנה נורמלי: בהינתן משתנה מקרי עם תוחלת ושונות , נבצע תהליך בין 2 שלבים:
א) ״נירמול״ והגדרת משתנה נורמלי סטנדרטי
ב) חישוב ה CDF באופן הבא
CDF פונקציית ההתפלגות המצטברת
תכונות
היא מונוטונית עולה כלומר
שואפת ל כאשר ושואפת ל כאשר .
אם הוא משתנה רציף אז היא פונקצייה רציפה של כלומר רציפה מימין. ויתקיים
אם הוא בדיד ומקבל ערכים טבעיים, נוכל לחלץ את ה CDF וה PMF על ידי סכימת ההפרשים כלומר
אם הוא רציף, ה וה מתקבלים אחד מהשני על ידי גזירה ואינטגרצייה.
הרבה פעמים נרצה להשתמש ב CDF כדי לחשב את ה PMF או ה PDF, את ה PDF נוכל לחשב על ידי חישוב CDF וגזירה ובאופן דומה על ה PMF על ידי הנוסחה הנ״ל
משתנה מקרי מעורב
מודלים הסתברותיים לרוב מערבים משתנים רנדומים שמערבים בתוכם מעין מיקס של בדיד ורציף כלשהו בכך אנחנו מתכוונים שהערך של מורכב מהחוקים ההסתברותיים הפועלים תחת עם הסתברות ומהחוקים ההסתברותיים הפועלים תחת עם הסתברות משלימה של הרעיון הוא שיש אזורים נקודתיים במרחב שלנו שיש בהם נקודות אי רציפות ואז במקום שההסתברות של ערך בודד תהיה 0 במקרה רציף יהיה שם ערך מסויים וסכום כל ההסתברויות של הנקודות האלה יהיה המשלים של שאר השטח.
במצב זה ייקרא משתנה מקרי מעורב. וה CDF שלו ניתן לחישוב באמצעות נוסחת ההסתברות השלמה
באמצעות משפט התוחלת השלמה נקבל
איחוד PDF ו CDF של מספר משתנים רנדומיים
JOINT PDF
השוליות:
באופן דומה נקבל
PDF משותף אחיד
לכל תת קבוצה במישור הדו מימדי, הPDF המשותף האחיד על S יהיה
ולכל ההסתברות ש נמצא ב תהיה
CDF משותף
תוחלת משותפת
הכללה למספר משתנים מקריים
ה PDF המשותף של שלושה משתנים מקריים מוגדר באופן דומה למקרה של שתי משתנים מקריים רציפים:
באופן דומה למקרה של שתי משנים נוכל לחלץ את הפונקציות השוליות
התוחלת תקיים:
והמקרה הפרטי הליניארי:
כמובן שנוכל להכליל את הנוסחה של התוחלת הנ״ל באופן ברור עבור משתנים מקריים רציפים:
אי תלות בין משתנים מקריים רציפים
אם בלתי תלויים אז גם כל שנבחר יהיו בלתי תלויים. באופן דומה , כל 2 משתנים מקריים מהצורה הם בלתי תלויים. למרות זאת ברוב המקרים שתי פונקציות כן יהיו תלויות אחד בשני בגלל ששתיהן מושפעות מ .
קונבולוצייה
שונות משותפת ומתאם
תכונות השונות המשותפת
כמו כן בהינתן ש בלתי תלויים אנחנו יודעים ש ולכן יתקיים .
מקדם המתאם של פירסון
השונות של סכום של משתנים מקריים
משפטי גבול
אי שוויון מרקוב (Markov inequality)
אי שוויון צבישב (Chebyshev inequality)
יהי משתנה מקרי עם תוחלת ושונות אזי
משלים של אי שיוויון צ׳בישב
החוק החלש של המספרים הגדולים
הגדרה
הי סדרה של משתנים בלתי תלויים שמתפלגים באופן זהה עם תוחלת . אזי לכל נקבל
משפט הגבול המרכזי
נגדיר:
הוא בעל תוחלת 0 ושונות 1
נגדיר את משפט הגבול המרכזי באופן הבא:
קירובים מבוססים משפט הגבול המרכזי
משפט קירוב נורמלי מבוסס משפט הגבול המרכזי:
יהי נוכל להתייחס להסתברות בקירוב נורמלי באופן הבא: