משתנים רנדומיים - רציף

PDF

משתנה רנדומי X ייקרא רציף אם ישנה פונקצייה אי שלילית fX, נסמנה PDF= probability density function של X (פונקציית צפיפות ההסתברות) כך ש:

P(XB)=BfX(x)dx

כאשר B היא תת קבוצה של R או של מרחב מדגם שעוצמתו היא עוצמת הממשיים כלומר real axis.
באופן ספציפי, נאמר שההסתברות של ערך כלשהו ב X להיות בטווח ערכים מסויים הוא

P(aXb)=abfX(x)dx
הבחנה

נשים לב שמההגדרה הנ״ל נוכל לראות כי

P(aXb)=P(Xb)P(Xa)
Info

נזכיר שעוד במודלים הסתברותיים אמרנו שחוק הסתברות תקין במקרה רציף היא הסתברות=שטח, וכעת חוזרים לזה
במילים פשוטות אם ישנה פונקצייה שהאינטגרל הכלוא שלה מתאר את ההסתברות של ערך להיות בשטח הכלוא אז המשתנה הזה רציף.

מהגדרת האינטגרל אנחנו יכולים להסיק שהמשמעות היא שההסתברות הינה השטח שמתחת לגרף. וגם נוכל להסיק שמרחבים רציפים ההסתברות לקבל ערך בודד הינה 0 כיוון ש לכל a יתקיים P(X=a)=aafX(x)dx=0
Pasted image 20221216184800.png|500
מהסיבה הזאת יתקיים שהוספה או הורדה של נקודות מקצוות התחום לא תשפיע על ההסתברות

P(aXb)=P(a<X<b)=P(aX<b)=P(a<Xb)

התכונות שfX צריכה לקיים כדי להיות PDF תקין הן:

  1. fX(x)0 כלומר פונקצייה אי שלילית לכל ערכיה
  2. נורמליזציה בדומה ל PMF הסכום של כל ערכי התמונה האפשריים צריך להיות 1
±fX(x)dx=P(<X<)=1

באופן גרפי זה אומר שכל השטח שמתחת לגרף צריך לשאוף ל1.

כדי לקבל אינטואיצייה על PDF, נשים לב שעבור הקטע [x,x+δ] עם δ קטנה מאוד נקבל

P([x,x+δ])=xx+δfX(t)dtfX(x)δ

זה נובע מהגדרת האינטגרל המסויים לפי דרבו שמגדירה אינטגרל כסדרה של סכום שטחי המלבנים (בגלל זה ניתן להתייחס לסכום כאינטגרל ולאינטגרל כסכום בהמון מצבים).
אם כן fX(x) היא מעין ״מסת הסתברות עבור יחידת אורך״ בקרבת x .
Pasted image 20221216192313.png|550
נשים לב שה PDF משמשת אותנו לחישוב הסתברויות אבל fX(x) היא לאו דווקא הסתברות של מאורע כלשהו .

משתנה רנדומי אחיד רציף

נניח שישנו מהמר שמסובב גלגל מזלות עם ערכים בין 0 ל 1 והוא עוקב אחר התוצאות שיוצאות. נניח שלכל תתי הקטעים של [0,1] שהם באותו האורך יש הסתברות שווה, אם כן, נוכל למדל את הניסוי הזה עם משתנה רנדומי X באופן הבא:

PDF=fX(x)={cx[0,1]0else

כאשר c הוא קבוע כלשהו. כלומר הערך הוא קבוע בקטע הזה. אם כן נרצה לבדוק שהפונקצייה שהגדרנו אכן תקינה כ PDF ומקיימת את תכונת הנורמליזציה

1=fX(x)dx=01cdx=c01dx=c

כלומר השטח של הפונקצייה בקטע [0,1] הוא 1 כי מסביב לקטע הזה הערך של הפונקצייה הוא 0 ולכן זאת פונקציית צפיפות תקינה.
אם כן נוכל באופן דומה לחלץ את c עבור כל תת מקטע [a,b] שנבחר :

fX(x)={1bax[a,b]0else

באופן הזה נקבל שלכל תתי מקטעים באותו אורך יתקיים שישנו אותו השטח.
Pasted image 20221216212012.png|550
הערך הנ״ל משמר גם כן את תכונת הנורמליזצייה

ab1badx=1baabdx=1ba(ba)=1

PDF קבוע ״בחתיכות״

זמן הנהיגה של סער לעבודה הוא בין 15 ל 20 דקות ביום שמשי ובין 2025 דקות ביום גשום. כל זמני ההגעה הם שווי הסתברות.
נניח שההסתברות ליום שמשי היא 23 וליום גשום היא 13. מהי פונקציית ה PDF של זמן הנהיגה שנסמנו X .
זמני ההגעה שווים בכל מקרה בנפרד כלומר X הוא קבוע שונה בכל אחד מהמקטעים [15,20],[20,25] .
יתרה מכך, שתי המקטעים האלה מכילים את כל זמני הנהיגה האפשריים ולכן פונקציית הPDF תחזיר 0 לכל ערך שאינו במקטעים הללו.
אם כן נקבל פונקציית צפיפות הסתברות כזאת

fX(x)={c1x[15,25]c2x[20,25]0else

כאשר c1,c2 הם קבועים שאותם נוכל לחלץ מההסתברויות הנתונות לנו על יום גשום ויום שמשי:

23=P(sunny day)=1520fX(x)dx=1520c1dx=5c1

אם כן נוסחה דומה תיתן לנו גם את c1 ונקבל

c1=215   ,   c2=115

נשים לב שזה לא מצב של התפלגות אחידה, אלא קבוע בצורה חלקים למשל בגרף עם שלושה קבועים זה ייראה כך
Pasted image 20221218000354.png|550
התפלגות אחידה בקטע דורשת שבקטע הזה תהיה את אותה הסתברות ומסביב הכל 0, כך ששטח המלבן הנוצר בקטע הזה יהיה 1.
נוכל להכליל את הדוגמה, עבור משתנה רנדומי X שהPDF שלו מכיל מספר מקטעים קבועים n:

fX(x)={cix[ai,ai+1]0else

כאשר i=1,2,,n1 . נשים לב ש ci יהיו חייבים לקיים את תכונות הנורמליזציה ולכן יש לנו כבר נתון אחד על הסכום של כל המלבנים שגובהם הם הקבועים הללו (סכום כל המלבנים הוא 1).

תוחלת

התוחלת של משתנה רנדומי רציף X מוגדרת כך

E[X]=xfX(x)dx

זה דומה לתוחלת חוץ מהעובדה שפונקציית מסת ההסתברות הוחלפה בפונקציית הצפיפות, והסכימה נעשית על ידי אינטגרל.
המשמעות של התוחלת במקרה הרציף זהה למשמעות במקרה הבדיד שכן זה מעין ״מרכז גרביטציה״ של פונקציית הצפיפות. בסופו של דבר מדובר בגבול של סכום אינסופי של ניסויים חוזרים בלתי תלויים.
אם X הוא משתנה רנדומי רציף עם pdf מוגדר, כל פונקצייה ממשית Y=g(X) היא גם כן משתנה רנדומי. נשים לב ש Y יכול להיות רציף אבל גם יכול להיות בדיד למשל

g(x){1x>00else

במצב זה Y=g(x) הוא משתנה רנדומי בדיד שלוקח ערכים מהקבוצה הסופית הבינארית.
בשתי המקרים נקבל שהתוחלת של g(x) מקיימת את כלל התוחלת

E[g(x)]=g(x)fX(x)dx

באופן דומה השונות והמומנט מוגדרים באופן דומה רק במקום סכום משתמשים באינטגרל

moment(X)=E[Xn]=xnfX(x)dxvar(X)=E[(XE[X])2]=(xE[X])2fX(x)dx

ועבור התוחלת תתקיימנה התכונות שלמדנו מהמקרה הבדיד.

תוחלת ושונות של משתנה אחיד

נחשב את התוחלת של #משתנה רנדומי אחיד רציף שדיברנו עליו

E[X]=xfX(x)dx=abx1badx=1ba12x2|ab=1bab2a22=a+b2

האינטואיצייה שלנו הייתה מחזירה לנו אותו דבר שכן a+b2 זה בידיוק האמצע של המלבן.
כעת נחשב את השונות

E[X2]=abx2badx=1baabx2dx=1ba13x3|ab=b3a33(ba)=a2+ab+b23

ומכאן השונות תתקבל באופן הבא

var(X)=E[X2](E[X])2=a2+ab+b23(a+b)24=(ba)212

משתנה מקרי מעריכי

משתנה מקרי מעריכי הוא מהצורה

fX(x)={λeλxx00else

כאשר λ הוא פרמטר חיובי שמאפיין את הPDF .

fX(x)dx=0λeλxdx=eλx|0=1

נשים לב שההסתברות של X לעלות על ערך מסויים קטנה באופן מעריכי. עבור a0 נקבל

P(Xa)=eλx|a=eλa

משתנה מהסוג הזה יכול למדל באופן די טוב את כמות הזמן שלוקחת למאורע כלשהו להתרחש, כמו הודעה שמגיע למחשב, הזמן שייקח למכשיר להשבר, מנורה שנשפרת ועוד...
Pasted image 20221218014805.png|350
בCDF נראה שהוא מתקשר למשתנה גיאומטרי שהוא מתקשר ל״זמן בדיד״ כלומר מספר הפעמים עד שאירוע כלשהו מתרחש.

התוחלת והשונות שלו יהיו:

E[X]=0xλeλxdx=(xeλx)|0+0eλx=0eλxλ|0=1λ

המעבר השמח הזה נובע מאינטגרציה בחלקים
בדומה נקבל

E[X2]=0x2λeλxdx=(x2eλx)|0+02xeλxdx=0+2λE[X]=2λ2

ומכאן נוכל לקבל שהשונות היא

var(X)=2λ21λ2=1λ2

נשים לב שגם משתנה מקרי מערכי הוא חסר זכרון כמו הגיאומטרי כלומר:

fXn|X>n(k)=fX(k)
מה זה בכלל λ ?

המשמעות של λ למעשה זה מעין קבוע דעיכה, כלומר ככל שקבוע הדעיכה גדול יותר ככה התוחלת קטנה יותר כלומר מרכז המסה נמצא בהתחלה והמשמעות של זה היא שההסתברות למאורע גדולה יותר, שזה בעצם אומר שהזמן עד שמאורע יתרחש קצר יותר. באופן דומה אם קבוע הדעיכה קטן יותר ככה התוחלת גדולה יותר (אפשר לראות בתמונה למטה שלוקח זמן עבור הגרף האדום להתקרב ל 0 יותר מהאחרים ולכן מרכז המסה של הפונקצייה יהיה יותר ימינה בציר הx) ולכן ההסתברות שהמאורע יתרחש קטנה יותר כלומר יותר זמן המתנה.
היא מתארת תופעות אקראיות שהסיכוי להתרחשותן קבוע בזמן, כגון התפרקות רדיואקטיבית או הזמן עד לתקלה בנורה או ברכיב חשמלי
Pasted image 20230126133931.png|300
ההתפלגות המעריכית מתאימה לתיאור הזמן בין אירועים המתרחשים באקראי אך בקצב ממוצע קבוע.
דוגמה מצויינת שמסיברה על ההבדל בין למדה בפואסון ולמדה במעריכי ומה הוא בכלל מייצג