#statistics #cs_biu

רווח סמך ועקרונות בבדיקת השערות

דיברנו על אומדן סטטיסטי נקודתי $\hat{Θ}$ לפרמטר $θ$ ועל אומדנים המקיימים תכונות מסויימות כמו חוסר הטייה.

נרצה כעת לענות על השאלה מהי מידת הדיוק של האומד.
כפי שניתן לצפות, מידת הדיוק של אומד תגדל ככל שהמדגם שעליו הוא מבוסס גדול יותר.
מכאן תעלה באופן טבעי שאלה נוספת: מה צריך להיות גודלו של המדגם שיבטיח רמת דיוק רצויה באמידה מסוימת?

מידת הדיוק של אומד

משפט הגבול המרכזי שבמדגם מקרי $X_{1}, \dots, X_{n}$ מתוך משתנה מקרי $X$ בעל תוחלת $μ$ ושונות $σ^{2}$ מתקיים עבור $n > 30$

\overset{―}{X} \sim N (μ, \frac{σ^{2}}{n})

כלומר עבור מדגמים גדולים מ $30$ ממוצע המדגם מתפלג נורמלית (בקירוב). ואם המ״מ שממנו דוגמים מתפלג נורמלית אז בלי תלות ב $n$ ממוצע המדגם גם מתפלג נורמלית.

נסתכל על הדוגמה הבאה:
במדגם שגודלו $25$ מתוך מ״מ $X$ המפולג נורמלית בעל סטיית של $10$ ותוחלת $μ$ נרצה לדעת מהי ההסתברות שממוצע המדגם שיתקבל יהיה שונה מ $μ$ בלא יותר מ $4$ יחידות.

כלומר נתון לנו $X \sim N (μ, 100)$ ו $n = 25$ מכאן שממוצע המדגם מפולג נורמלי עם תוחלת $μ$ ושונות $\frac{100}{25} = 4$ (כלומר סטיית תקן $2$ ). $\overset{―}{X} \sim N (μ, 4)$ .

אנחנו מנסים לחשב את ההסתברות $P (μ - 4, \overset{―}{X}, μ + 4)$ . ננרמל כל אחד מהטווחים: $z_{μ + 4} = \frac{μ + 4 - μ}{2} = 2$ , $z_{μ - 4} = \frac{μ - 4 - μ}{2} = - 2$ כלומר לאחר הנרמול מתקיים $P (μ - 4 < \overset{―}{X} < μ + 4) = P (- 2 < Z < 2)$ .

השאלה ״מהי ההסתברות שהממוצע יהיה במרחק 4 יחידות מממוצע ההתפלגות״ שקולה לשאלה ״מהי ההסתברות שהממוצע יהיה במרחק 2 סטיות תקן מממוצע ההתפלגות״. זאת משום שסטיית התקן של ההתפלגות היא $2$ . נחשב ונקבל

Φ (2) - Φ (- 2) = 2 (Φ (2)) - 1 = 0.95

Screenshot 2023-08-04 at 14.04.41.png
התרשים מציג את התוצאה שקיבלנו כאשר ציר $Z$ הוא ציר שאומד את המרחק ביחידות של סטיות תקן.

אפשר להתסכל על זה גם בדרך אחרת:
Screenshot 2023-08-04 at 14.11.50.png
הציר האנכי הוא ציר $\overset{―}{x}$ , כלומר ערכי המשתנה $\overset{―}{X}$ . על הציר האופקי מסומנים מספרי הניסויים (החזרות על הדגימה). כל נקודה מתארת ערך של ממוצע המדגם $\overset{―}{x}$ עבור הניסוי ה $i$ בציר האנכי. ככל שנעשה יותר דגימות נראה כי $95 %$ מהערכים נמצאים בסביבה של $\pm 4$ יחידות סביב התוחלת.

האי שיוויון:

μ - 4 < \overset{―}{X} < μ + 4

שקול לאי שיוויון

\overset{―}{X} - 4 < μ < \overset{―}{X} + 4

ולכן גם ההסתברות $P (\overset{―}{X} - 4 < μ < \overset{―}{X} + 4) = 0.95$ . נבטא זאת באופן מילולי:
$\overset{―}{X} - 4 < μ < \overset{―}{X} + 4$ הוא רווח-סמך ברמה של $95 %$ עבור $μ$ . כלומר, במדגם שגודלו $n = 25$ מתוך מ״מ $X$ המפולג נורמלית עם סטיית תקן $10$ ותוחלת $μ$ בלתי ידועה, ההסתברות ש $μ$ תהיה שונה ממוצע המדגם בלא יור מאשר $4$ יחידות היא $0.95$ .

נדגיש כי $μ$ הוא קבוע ובלתי ידוע ואילו קצוות הטווח משתנים מניסוי לניסוי.
Screenshot 2023-08-04 at 14.16.59.png
ניתן לראות בתרשים את רווח הסמך הנ״ל כל נקודה מותחת קו של 4 יחידות מלמעלה ומלמטה וניתן לראות שכ $95 %$ מהנקודות אכן חוצות את הקו האופקי שמתאר את $μ$ .

השיוויון $P (\overset{―}{X} - 4 < μ < \overset{―}{X} + 4) = 0.95$ הוא מקרה פרטי של שיוויון מהצורה $P (A < θ < B) = 1 - α$ כאשר $θ$ הוא הפרמטר הנאמד.

הרווח $(A, B)$ נקבע על ידי הסטטיסטי האומד $\hat{Θ}$ ומשתנה ממדגם למדגם (נקרא ״רווח מקרי״). $1 - α$ הוא קריטריון דיוק שבדרך כלל יהיה קרוב ל $1$ . כלומר
הרווח $A < θ < B$ הוא רווח-סמך ברמה של $100 (1 - α)$ אחוז עבור $θ$ .

באופן כללי אפשר לבטא את רווח הסמך מהדוגמה שלנו כך

P (μ - z \frac{σ}{\sqrt{n}} < \overset{―}{X} < μ + z \frac{σ}{\sqrt{n}}) = 2 Φ (z) - 1

כדי שאגף ימין ישווה ל $1 - α$ צריך שיתקיים $Φ (z) = 1 - \frac{α}{2}$ . נסמן את ערך $z$ המקיים זאת כ $z_{1 - \frac{α}{2}}$ ונציב:

P (μ - z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}} < \overset{―}{X} < μ + z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}}) = 1 - α

Screenshot 2023-08-04 at 14.25.23.png|450

כל שנשאר לעשות כעת הוא להחליף בסדר של הא״ש ונקבל

P (\overset{―}{X} - z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}} < μ < \overset{―}{X} + z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}}) = 1 - α

כלומר רווח-סמך ברמה של $(1 - α) \cdot 100$ אחוז עבור $μ$ הוא

\overset{―}{X} - z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}} < μ < \overset{―}{X} + z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}}

מסקנה

ככל שרמת הסמך גבוהה יותר, כך מתרחב רווח הסמך

הקשר בין גודל המדגם לדיוק הנדרש

במקרים רבים אנו קובעים מראש את רמת הסמך באחוזים ושואלים מהו גודל המדגם, שיבטיח ברמת סמך זו, ששגיאת האמידה, כלומר ריחוקו של האומד $\overset{―}{X}$ מן הערך האמיתי $μ$ , לא תעלה על $ε$ . במילים אחרות, נרצה להבטיח שנקבל רווח סמך של $(\overset{―}{X} - ε < μ, \overset{―}{X} + ε)$ ברמת סמך $(1 - α)$ . כלומר נרצה לפתור את הביטוי

z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}} = ε

סך הכל נקבל

n = {(\frac{z_{1 - \frac{α}{2}} σ}{ε})}^{2}

וכדי להבטיח ש $n \in N$ נחליף את הכמת $=$ בכמת $\geq$ . וסך הכל קיבלנו ביטוח לגודל המדגם.

עקרונות של בדיקת השערות

האומדן של פרמטר בלתי ידוע הוא רק יישום אחד של ההסקה הסטטיסטית.
לעתים קרובות יותר משאנו מעוניינים באומדן של פרמטר, אנו מעוניינים בבדיקת השערה מסוימת שיש לנו לגביו.

נסתכל על דוגמה של מבחן סטטיסטי כדי להבין יותר טוב:
אל משרד המסחר והתעשייה הגיעו תלונות צרכנים על כך, שמשקל הלחם הנאפה במאפייה מסוימת נופל מן המשקל הנקוב על האריזה שהוא 500 גרם.

כדי לבדוק את התלונה הזו, החליט המשרד לבצע מבחן סטטיסטי כלומר בדיקת השערה בשיטות סטטיסטיות. לשם כך נדגמו ונשקלו 30 כיכרות לחם של אותה מאפייה והרי המשקלים:
Screenshot 2023-08-04 at 15.13.33.png
אנשי המחקר במשרד מודעים לכך שלא ייתכן שמשקלה של כל כיכר יהיה בידיוק 500 גרם. הניסיון הראה כי סטיית התקן של משקלן של כיכרות לחם הנאפים במאפייה מודרנית, תוך הקפדה סבירה על אחידותן, היא 3 גרמים, אך תוחלת המשקל חייבת להיות 500 גרם.

אנשי המחקר צריכים להסיק מתוך הנתונים שנאספו במדגם של 30 ככרות הלחם אם הצרכנים צדקו בתלונתם.

נמצא שממוצע המשקלים של כיכרות הלחם במדגם הוא $498.5$ גרם. משקלה של כיכר לחם $X$ הוא משתנה מקרי, שיכול לקבל ערכים שונים, וכך גם ממוצע המדגם $\overset{―}{X}$ . לכן, גם כאשר תוחלת המשקל של כיכרות הלחם היא $500$ ממוצע המשקלים של מדגם מקרי בן $30$ יכול להיות שונה. אולם, ממוצע כזה יכול גם לרמז שתוחלת המשקל אינה $500$ גרם אלא פחות מכך. התוחלת, אם כן, ״עומדת למשפט״ ואנשי המחקר משערים שתי השערות מנוגדות עליה:

תוחלת המשקל שווה ל 500 ורק במקרה התקבל במדגם ממוצע שונה.
התוחלת של המשקל קטנה מ500 וממוצע המדגם מרמז על כך.

החוקרים כעת צריכים להחליט באיזו משתי ההשערות לתמוך לאור המדגם הנתון, שהממוצע שלו הוא $\overset{―}{x} = 498.5$ .

הגישה שהחוקרים נוקטים היא: נניח שההשערה הראשונה נכונה, כלומר תוחלת המשקל של כיכר לחם היא אמנם 500 גרם. באיזו מידה סביר לקבל מדגם שהממוצע שלו זהה לממוצע שנתקבל או קטן ממנו?

כלומר, החוקרים רוצים לבדוק $P (\overset{―}{X} \leq 498.5)$ , בהנחה שטענת המאפייה נכונה. אם יתברר שהסתברות זו קטנה מאוד, החוקרים ייאלצו להסיק שתוחלת המשקל של כיכר לחם במאפייה זו כנראה קטנה מ $500$ ושהמאפייה פוגעת בציבור הצרכנים. אבל אם יתברר שבמדגם בגודל $30$ ״סביר מאוד״ לקבל ממוצע כנ״ל או קטן ממנו (מתוף מ״מ עם תוחלת $500$ גרם וסטיית תקן של $3$ גרם), אזי אין לבוא בטענות אל המאפייה.

על מנת לבדוק את ההסתברות הנ״ל החוקרים נעזרים בעובדה שהמדגם בגודל 30 ומניחים ש

\overset{―}{X} \sim N (μ, \frac{σ^{2}}{n})

במקרה שלנו $μ = 500$ ו השונות היא $0.3$ . כלומר $\overset{―}{X} \sim N (500, 0.3)$ .
כעת אפשר לחשב את ההסתברות באמצעות נרמול.

למרות שחישבנו את ההסתברות, החוקים עדיין לא יודעים מה זה אומר הסתברות ״קטנה״ או ״סבירה״ לכן צריך להחליט לפני שמחשבים את ההסתברות , כלל הכרעה ומחליטים לפיו. למשל, אם יוברר שההסתברות שיתקבל ממוצע של $498.5$ ומטה היא $5 %$ או פחות תחת התפלגות הדגימה הנ״ל, הרי ההשערה המצדיקה את המאפייה תידחה, וההשערה המצדיקה את הצרכנים תתקבל.

עוד לפני חישוב ההסתברות, ניתן לראות שהחוקרים קובעים לעצמם איזשהו כלל הכרעה ולמעשה קובעים את הגבול בין הסתברות ״ניכרת״ להסתברות ״זעומה״. בהתאם לכך, יכולים החוקרים לבדוק באיזו השערה לתמוך לפי כלל ההכרעה שקבענו.

Screenshot 2023-08-04 at 16.48.56.png|300
זוהי התפלגות הדגימה הנורמלית שתיארנו למעלה.
אם ננרמל את ההתפלגות שלנו נקבל $Z \sim N (0, 1)$ , אנו יודעים שבהתפלגות זו הערך שמתחתיו נמצאים $5$ אחוז מן ההתפלגות הוא : $- 1.645$ הוא: $P (Z \leq - 1.645) = P (Z > 1.645) = 1 - Φ (1.645) = 1 - 0.95 = 0.05$ .
לפיכך נוכל להציע את הכלל הבא:
אם ציון התקן של ממוצע המדגם קטן מ $- 1.645$ נקבע שתלונת הצרכנים מוצדקת.

במילים אחרות: אם בגרף הנ״ל יימצא שערך המשתנה $Z$ המתאים לממוצע המדגם $498.5$ הוא משמאל לנקודה $- 1.645$ אז נקבל את טענת הצרכנים אחרת נקבל את טענת המאפייה.
Screenshot 2023-08-04 at 17.01.56.png|450
לאזור משמאל קוראים אזור דחייה ולתחום מימין קוראים אזור קבלה. אם נחשב נראה שציון התקן $z_{498.5} = - 2.73 < - 1.645$ ולכן על החוקרים להסיק כי מאחר שההסתברות לקבל את הערך $498.5$ או ערך נמוך ממנו, ממשתנה מקרי שתוחלתו $500$ גרם (עם $σ = 3$ ) היא קטנה, יש יסוד לחשד שתוחלת המשתנה המקרי אינה $500$ גרם אלא קטנה יותר, ויש לדחות את טענ המאפייה, כלומר לקבל את טענת הצרכנים.

באופן שקול, יכולים החוקרים לקבוע רווח סמך ל $μ$ לפי ממוצע המדגם ברמה של $95 %$ .

הנוסחה הכללי של רווח סמך היא

\overset{―}{X} - z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}} < μ < \overset{―}{X} + z_{1 - \frac{α}{2}} \frac{σ}{\sqrt{n}}

אם רמת הסמך היא $0.95$ אז $α = 0.05$ ו $\frac{α}{2} = 0.025$ כלומר $z_{1 - \frac{α}{2}} = 1.96$ כלומר :

Φ (1.96) = 1 - \frac{α}{2} \to P (Z \leq 1.96) = 0.975 \to P (Z \geq 1.96) = 0.025

אם כן, נוכל להציב בנוסחה הנ״ל את $z = 1.96, \frac{σ}{\sqrt{n}} = \frac{3}{\sqrt{30}} = 0.55, \overset{―}{X} = 498.5$
כאשר נציב נקבל

497.42<\mu< 499.58$$ נזכיר שהמשמעות של רווח סמך היא שאם היינו מוציאים אינסוף מדגמים בגודל $30$ מאותה אוכלוסייה ועבור כל אחד מהם מחשבים ממוצע ורווח סמך, היינו מקבלין ש$95$ אחוז מהרווחים היו כוללים את הפרמטר ו $5\%$  לא היו כוללים אותו. לפי הרווח סמך קיבלנו  שהתוחלת $500$ לא נמצאת בתחום ברווח הסמך שרצינו ולכן גם כאן יש תמיכה בצרכנים שהתוחלת איננה 500 גרם.  >[!note] הבחנה >אם יש לנו השערה כלשהי $H_{0}$ נרצה לבדוק האם בהנחה שהיא נכונה ממוצע המדגם שלנו נמצא באזור הדחייה או לא.  באופן מקוצר לדרך הנ״ל אפשר לחשב את אזור הדחייה נסמנו $C$ על ידי  $$C=\mu + z_{1- \frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}$$            בעצם זה שקול לחישוב שעשינו למעלה שבוא קבענו מהו אזור הדחייה לפי רמת המובהקות ($\alpha$) רק שבמקום להתאים את המדגם להתפלגות נורמלית סטנדרטית מבצעים התאמה של אזור הדחייה להתפלגות של ממוצע המדגם $\overline{X}\sim N(\mu,\frac{\sigma^{2}}{n})$ . לאחר מכן כל שצריך לעשות הוא האם ממוצע המדגם הספציפי שלנו נמצא בטווח המתאים לפי ההשערה $H_{1}$ .  ### שלבים כלליים לבדיקת השערות #### קביעת ההשערות בכל בדיקת השערות מנוסחות שתי השערות אשר סותרות זו את זו. __השערת האפס__ : $H_{0}$ - מתארת את ההנחות הקיימות בנקודת מוצא. __השערה אלטרנטיבית__ : $H_{1}$  ![Screenshot 2023-08-05 at 15.28.18.png|350](/img/user/Assets/Screenshot%202023-08-05%20at%2015.28.18.png) הדוגמאות מדגימות מספר מצבים: 1. ההשערות יכולות להתייחס לפרמטרים שונים. 2. השעה יכולה להתייחס לפרמטר של אוכלוסייה אחת או להשוואה של פרמטר מסויים באוכלוסיות שונות. 3. בהשערות לגבי פרמטר של אוכלוסייה, או של משתנה מקרי, נהוג להבחין בין __השערה פשוטה-__ שבה ערכו של הפרמטר נקוב בה באופן חד משמעי.   __השערה מורכבת-__ שבה מצויין טווח שבו נמצא הפרמטר. 4. ההשערות ייקראו __חד צדדיות__ אם $H_{1}$ מתייחס רק לערכים שנמצאים מצד אחד לערך הנקוב ב$H_{0}$ ו __דו צדדית__ כאשר $H_{1}$ מתייחס לערכים הנקובים משני הצדדים.  האפשריות הנ״ל משפיעות על קביעת אזור הדחייה שלנו. 1. בדוגמה הנ״ל אזור הדחייה היה רק בצד שמאל של ההתפלגות כיוון שההשערה האלטרנטיבית הייתה $\mu<500$ . 2. אם ההשערה האלטרנטיבית הייתה $H_{0}:\mu=500$ כלומר $H_{1}:\mu\neq 500$ כלומר השערה דו״צ אז אזור הדחייה היה מחולק לפי כלל ההכרעה לשני חלקים (במקרה של הדוגמה 5%) אזור המתאים ל 2.5% מימין ואזור מתאים ל 2.5% משמאל.  __לסיכום__ בקביעת ההשערות אנחנו בפועל מתייחסים ל3 אפשריות: א. $H_0:\theta=c,H_{1}:\theta>c$  ב. $H_0:\theta=c,H_{1}:\theta<c$ ג. $H_0:\theta=c,H_{1}:\theta\neq c$  #### בחירת סטטיסטי  לאחר שנוסחו ההשערות, יש לבחור בסטטיסטי שיהווה אומד מתאים לפרמטר שנבדק ושאותו נחשב מהמדגם. בדרך כלל נשתמש בסטטיסטי המהווים __אומד חסר הטייה.  #### קביעת ההנחות קביעה של הגבול בין אזור הדחייה לאזור הקבלה. בשביל זה צריך לדעת את התפלגו הדגימה של המ״מ בו נשתמש, כדי להכריע בין $H_{0}$ ל $H_{1}$ . הרבה פעמים התצפיות מפולגות בהתפלגות נורמלית או בינומית. אם אנחנו לא יודעים את ההתפלגות של תצפיות אז הבעיה נעשית סבוכה יותר.   #### קביעת גודל המדגם ממשפט הגבול המרכזיאנחנו יודעים של $n$ יש חשיבות גבוהה בקביעת התפלגות הדגימה. וגם תהיה לו חשיבות בחישוב הסתברות ההכרעה המוטעית.  #### חישוב התפלגות הדגימה כל מה שהגדרנו למעלה, מאפשר את חישוב של התפלגות הדגימה כדי לבדוק מהי ההסתברות לקבלת ערך הסטטיסטי שנתקבל במדגם בהנחת נכונות $H_{0}$ .  #### קביעת רמת המובהקות קביעת כלל ההכרעה, שבו יהיה תלוי גודל אזור הדחייה. אחוז זה מסומן ב$\alpha$ ונקרא __רמת המובהקות__ של מבחן. בעצם זהו גודל השטח של אזור הדחייה של $H_{0}$ בהתפלגות הדגימה, בהנחה ש $H_{0}$ נכונה. זה גם מסמן את ההסתברות שקיבלנו מדגם יוצא דופן אשר יטעה אותנו ונדחה את $H_{0}$ למרות שהיא נכונה.  #### קביעת אזורי דחייה וקבלה אזורי דחייה וקבלה של ההשערה $H_{0}$. גודל האזור נקבע לפי רמת המובהקות, ומיקומו בהתפלגות הדגימה תלוי בסוג ההשערה: חד צדדית או דו צדדית.