#programming_language

Type inference

בOCaml אחד הפיצרים שהקומפיילר נותן הוא type inference. הפיצ׳ר הזה מאפשר למתכנת לא להצהיר על המשתנה ישירות אלא לתת לקומפיילר באמצעות כללי היסק לפרש את הטיפוס בעצמו. Type inference נותן לנו את היכולת להמיר תחשיב למדא ללא טיפוסים לתחשיב למדא עם טיפוסים וככה לקבל את הפיצ׳ר של type safety.

נבין את כיצד עובד המנגנון של הסקת טיפוסים על מקרה מצומצם של השפה. נגדיר אותו כ $λ OCaml$ , שילוב של תחשיב למדא ואוקמל .בשפה זאת הביטויים מוגדרים כך

כל משתנה הוא ביטוי.
אם x משתנה ו t ביטוי אז $fun x \to t$ ביטוי.
אם $t_{1}, t_{2}$ ביטויים אז $t_{1} t_{2}$ ביטויים.

הגדרה:
נניח קבוצה אינסופית של משתני טיפוס.
- אם $α$ משתנה טיפוס אז הוא טיפוס.
- אם T,S טיפוסים אז כך גם $T \to S$ .

הגדרה:
יחס ההטפסה של $λ O C a m l$ $Γ ⊢ t : T$ מוגדר כך -

\begin{matrix} O-VAR : \frac{x : T \in Γ}{Γ ⊢ x : T} \\ O-APP \frac{Γ ⊢ t_{12} : T_{1} \to T_{2} Γ ⊢ t_{1} : T_{1}}{Γ ⊢ t_{12} t_{1} : T_{2}} \\ O-ABS \frac{Γ ⊢ x : T_{1} Γ ⊢ t : T_{2}}{Γ ⊢ (fun x \to t) : T_{1} \to T_{2}} \end{matrix}

בעיית הסקת הטיפוסים

נגדיר את בעיה זו כך:
קלט- ביטוי t
פלט- הקשר הטפסה $Γ$ ומיפוי m מביטויים שמופיעים ב t לטיפוסים כך שלכל תת-ביטוי $t^{'}$ של t מתקיים $Γ ⊢ t^{'} : m (t^{'})$ (כולל t עצמו).

פתרון:

יצירת מערכת משוואות בין ביטוי לטיפוס
פתרון המערכת
תרגום הפתרון ל $Γ$ ו m המתאימים.

יצירת מערכת משוואות

נגדיר t ביטוי נורמלי אם לכל 2 ביטויים $t_{1} = fun x...$ ו $t_{2} = fun y...$ שמופיעים ב t , המשתנים x ו y שונים זה מזה.

נשים לב: לכל ביטוי יש ביטוי נורמלי השקול לו על ידי שימוש בכלל אלפה .

הגדרה עבור t ביטוי נגדיר $A_{t}$ קבוצת המשוואות. לכל מופע של כל ביטוי שמופיע ב t ניצור משתנה טיפוס משלו ואז

אם $α, β$ מתאימים למופעים שונים של אותו הטיפוס אז נוסיף את $α = β$ ל $A_{t}$ .למשל עבור הפונקציה $f u n x \to x$ נסמן עבור ה x הראשון שהוא מטיפוס $α_{x}^{1}$ והשני הוא מטיפוס $α_{x}^{2}$ ונוסיף את $α_{x}^{1} = α_{x}^{2}$ ל $A_{t}$ .
אם משתני הטיפוס $α, β, γ$ מתאימים ל $t_{1}, t_{2}, t_{1} t_{2}$ בהתאמה אז נוסיף את $α = β \to γ$ ל $A_{t}$ .
לכל מופע $f u n x \to t^{'}$ אם $α, β, γ$ מתאימים ל $x, t^{'}, f u n x \to t^{'}$ בהתאמה אז נוסיף את $γ = α \to β$ ל $A_{t}$ .

דוגמה: עבור הביטוי $t = (fun x \to x) y$

\begin{matrix} y \mapsto α_{y} \\ x \mapsto y_{x}^{1} \\ x \mapsto α_{x}^{2} \\ fun x \to x \mapsto α_{fun x \to x} \\ t \mapsto α_{t} \end{matrix}

כעת נגדיר את $A_{t}$ :

A_{T} = {α_{x}^{1} = α_{x}^{2}, α_{fun x \to x} = α_{x}^{1} \to α_{x}^{2}, α_{fun x \to x} = α_{y} \to α_{t}}

תרגום הפתרון

כיצד מתרגמים את הפתרון לכללי הטפסה ומיפוי?
באמצעות כללי substitution. החלפה היא פונקציה שמתאימה טיפוס לכל משתנה טיפוס.
החלפה $σ$ מורחבת לטיפוסים באופן הבא

σ (T_{1} \to T_{2}) = σ (T_{1}) \to σ (T_{2})

הגדרה: החלפה $σ$ מאחדת שיוויון $T_{1} = T_{2}$ אם $σ (T_{1}) = σ (T_{2})$ .
$σ$ מאחדת קבוצת שוויונות אם היא מאחדת את כל השיוויונות בקבוצה.

נסתכל על הדוגמה ממקודם-

σ (α_{x}^{1}) = σ (α_{x}^{2}) = σ (α_{y}) = σ (α_{t}) = α

וגם

σ (α_{f u n x \to x}) = α \to α = σ (α_{y}) \to σ (α_{t}) = σ (α_{y} \to α_{t}) = σ (α_{x}^{1} \to σ_{x}^{2})

הגדרה: יהי t ביטוי ו $β$ פונקציה שמתאימה לכל תת ביטוי $t^{'}$ של t את משתנה הטיפוס המתאים לאחד המופעים של $t^{'}$ ותהי $α$ החלפה שמאחדת את $A_{t}$ אז

Γ_{σ}^{β} = {x : σ (β (x)) | x \in Vars(t)}

משפט: $Γ_{σ}^{β}$ ו $σ \circ β$ הם הפתרון לבעיית ההטפסה של t. בצורה פורמלית: יהי $t$ ביטוי ו $β, σ$ כמו לעיל אז $Γ_{σ}^{β} ⊢ t^{'} : σ (β (t^{'}))$

אם אין $σ$ כנ״ל אז t לא מטופס היטב.

פתרון מערכת משוואות

הגדרה:
בעיית היוניפיקציה-
קלט- קבוצה של שוויונות בין ביטויים
פלט- החלפה $σ$ שמאחדת אותם

למשל אם x=y נרצה לבנות $σ$ כך ש $σ (x) = σ (y)$ נוכל להגדיר ש $σ (x) = σ (y) = x$ .

ומה אם המשוואה אומרת ש $x + y = x \cdot y$ ? כיוון שלא משנה מה יהיו כללי ההחלפה של המשתנים יתקיים $σ (x + y) = σ (x) + σ (y)$ וכנ״ל עבור $\cdot$ אז אין פתרון.

מקרה נוסף שיכול לעניין אותנו בניתוח האלגוריתם שנראה בהמשך הוא מהצורה

f (t_{1}, \dots, t_{n}) = f (s_{1}, \dots, s_{n})

נוכל למצוא $σ$ שתאחד כל $t_{i}, s_{i}$ בנפרד כלומר סיגמה שתקיים $σ (t_{i}) = σ (s_{i})$ .

והמקרה האחרון שיכול לעניין הוא $x = f (y)$ נוכל להגדיר ש $σ (x) = f (y)$ ו $σ (y) = y$ .

כעת נסתכל על האלגוריתם בOCaml:

type id = string;;
type term = | Var of id | Term of id * term list
(*invariant for substitution*)
(*no id on a lhs occurs in any term earlier in the list*)

type substitution = (id * term) list

(*check if a variable occurs in a term*)
let rec occurs (x : id)(t : term) = match t with 
	| Var y -> x = y
	| Term (_ , s)-> List.exists ( occurs x )s

(*substitute term s for all accurrences of variable x in term t*)
let rec subst (s : term)(x : id)(t : term) = match t with
	| Var y -> if x = y then s else t
	| Term (f,u) -> Term ( f, List.map (subst s x) u)


(*apply a substitution right to left *)
let apply (s: substitution)(t:term) = 
	List.fold_right (fun (x,u)->subst u x)s t

(*unidy one pair*)
let rec unify_one (s:term)(t:term) = match (s,t) with
	| (Var x, Var y) -> if x = y then [] else [(x,t)]
	| (Term(f,sc), Term(g,tc))-> if 
		f = g && List.length sc = List.length tc
			then unify(List.combine sc tc)
			else failwith "not unifiable: head symbol conflict"

	| ((Var x, Term(_,_ as t)))
	| (( Term(_,_ as t), Var x))->
		if occurs x t 
			then failwith "not unifiable: circularity"
			else [(x,t)]

(*unify a list of pairs*)
and unify (s: (term * term)list) = match s with
	| []->[]
	| (x,y) :: t ->
		let t2 = unify t in 
			let t1 = unify_one (apply t2 x)(apply t2 y) in t1@t2;;

ובפסודו קוד זה האלגוריתם לקביעת הטיפוסים
Pasted image 20240322221846.png|400

נסתכל על דוגמה של ה ביטוי $α \to α$ . לפי הקוד זה יהיה מהצורה Term("->", [Var ('a'), Var('a')].

substitution הוא פונקצית ההחלפה $σ$ .
occurs היא פונקציה שבודקת אם id כלשהו מופיע בביטוי t מסויים.
subst - מחליפים את המופיעים החופשיים של x ב s בביטוי t
apply - מפעילה את subst על כל איבר ב s מהסוף.
unify_one and unify - נזכיר ש and זה keyword שמאפשר mutual recursion ב OCaml. זה נועד לפתור את המקרה של $f (t_{1}, t_{2}) = f (s_{1}, s_{2})$ .
- unify- מקבל רשימה של זוגות של term כאשר היחס בינהם הוא שיוויון. אם הרשימה ריקה אז המקרה ברור, אם יש איבר מהצורה (x,y) אז פותרים את יתר הרשימה t ואז מבצעים unify_one על התוצאה עם x ועל התוצאה עם y ומחזירים את שרשור התוצאה.
- unify_one- מבצע unify על זוג של term יחיד שהיחס בינהם הוא שיוויון.
  - אם שניהם משתנים שונים אז מבצעים substitution לביטוי t.
  - אם המקרה יותר מורכב של פונקציות אז בודקים האם הם מכילים את אותו מספר ארגומנטים וגם שהם שווים ואז מבצעים unify לכל זוג בנפרד בצורה רקורסיבית
  - המקרה השלישי והאחרון בודק מצב שיש בצד אחד משתנה ובצד השני ביטוי ופשוט בודקים האם יש מצב שהמשתנה מופיע בביטוי ואם כן מחזירים שגיאה כי אחרת נקבל רקורסיה אין סופית של החלפות.

Note

האלגוריתם הזה הוא לא היחיד שפותר את בעיית היוניפיקציה, האלגוריתם הזה מוצא את מה שנקרא Most General Unifier (MGU) וכל פתרון אחר אפשר למצוא באמצעות MGU . נאמר ש $σ$ היא יותר ״כללית״ מ $σ^{'}$ אם קיימת $σ^{″}$ כך ש $σ^{'} = σ^{″} \circ σ$

דוגמה
let f x = 2+x .

נשים טיפוסים גנריים לכל משתנה

let f : t_{1} x : t_{2} = (2 : t_{3} + : t_{4} x) : t_{5}

משתנה שמופיע מספר פעמים בעל אותו טיפוס
יש להוסיף טיפוס עבור הפלט של התוכנית
פונקציה תמיד תהיה מטיפוס $d o m a i n \to r a n g e$
מבחינה פורמלית כדי למצוא את כל המשתנים והפונקציות משתמשים בעץ הגזירה של הביטוי (ניתן להחשיב את יצירת עץ הגזירה כשלב נוסף באלגוריתם)

קובעים את האילוצים

\begin{matrix} t_{1} = t_{2} \to t_{5} \\ t_{4} = t_{3} \to t_{2} \to t_{5} \\ t_{4} = i n t \to i n t \to i n t \\ t_{3} = i n t \end{matrix}

נפתור את האילוצים, מהמערכת הנ״ל אפשר לקבוע ש $t_{4} = i n t \to t_{2} \to t_{5}$ . אבל גם מאיך ש $t_{4}$ מוגדר אפשר להסיק כי $t_{2} = i n t$ וגם $t_{5} = i n t$ . סך הכל נקבל $f : i n t \to i n t$ .
קביעת הטיפוס של הפונקציה לפי מה שאמרנו למעלה $f : i n t \to i n t$ .

נחזור לפסודו קוד של של Hindley-milner type inference ממקודם

Screenshot 2024-03-24 at 19.05.55.png|400

ננסה להבין איך האלגוריתם עובד על הדוגמה ממקודם בתצורת למדה כלומר $f = λ x . x + 2$ :

Screenshot 2024-03-24 at 19.07.41.png|400

ניתן לראות שמה AST חילצו את כל האילוצים. כעת עם האלגוריתם unify ניתן לפתור את האילוצים באופן הבא-

כל על טיפוס ועל המשוואה שלו
1. חפש משוואה אחרת המכילה את הטיפוס
2. אם מצאת החלף את הטיפוס במשוואה שהתקבלה.

ניתן לראות בסדרת הפעולות הנ״ל שכל ריצה חיפשנו את המקומות שבהם נמצא הטיפוס הזה וממש החלפנו אותו בהשמה. למשל עבור $T_{3} = T_{4} \to T_{2}$ מצאנו את $T_{3}$ ב $T_{5}$ וביצענו הצבה וכעת $T_{5} = T_{1} \to T_{3} = T_{1} \to T_{4} \to T_{2}$ . ככה המשכנו להציב שוב ושוב עד שהגענו לביטוי האחרון שבו כבר היה כלל החלפה. כיוון ש $T_{1} \to n a t \to T_{2} = n a t \to n a t \to n a t$ אז יכלנו להחליף את $T_{1}, T_{2}$ ב nat בהתאמה.

בצורה פורמלית:
Screenshot 2024-03-24 at 19.15.08.png|400

נסתכל על דוגמה נוספת $let f x = 5.+x$ .
נבצע השמה של טיפוסים גנריים לכל התוכנית
Screenshot 2024-03-24 at 19.21.02.png|200

נסתכל על האילוצים

\begin{matrix} t_{1} = t_{2} \to t_{5} \\ t_{4} = t_{3} \to t_{2} \to t_{5} \\ t_{4} = i n t \to i n t \to i n t \\ t_{3} = f l o a t \end{matrix}

כעת אם ננסה לפתור אותם נקבל ש $t_{4} = f l o a t \to t_{2} \to t_{5}$ וגם $t_{4} = int \to int \to int$ שזה conflict בין הטיפוסים ולכן type error.

דוגמה
$let f x y = x y$ .

השמת טיפוסים
אילוצים : $t_{1} = t_{2} \to t_{3} \to t_{4}$ וגם $t_{2} = t_{3} \to t_{4}$
פתרון לאילוצים: $t_{1} = (t_{3} \to t_{4}) \to t_{3} \to t_{4}$
סה״כ $f : (a \to b) \to a \to b$ , מצב כזה נקרא type variable כלומר פונקציה גנרית.

רקורסיה
נסתכל על הקוד הבא:

let rec length xs = 
	match xs with 
		| [] -> 0
		| (h:t) -> 1 + length t

כאשר עובדים עם pattern match מסתכלים על כל מקרה בנפרד, הטיפוסים גם של כל מקרה צריכים להיות שקולים באופן הבא

הטיפוס של כל אחד מהקלטים (צד שמאל של החץ) צריכים להיות שווים
הטיפוס של כל אחד מהפלטים (צד ימין של החץ צריך להיות שווה)

נשים טיפוסים לקטע הקוד הנ״ל

Screenshot 2024-03-24 at 20.12.19.png|300

נשים לב שאת הרשימה שמנו מראש בטיפוס עטוף ב $[]$ כי אנחנו יודעים שהטיפוס הוא רשימה מסוג של משהו.

נבנה את האילוצים
Pasted image 20240324201744.png|350

קל להבין למה $t_{1}$ הוא פונקציה שהקלט שלה $t_{2}$ והפלט הוא $t_{3}$
$t_{2}$ הוא טיפוס של רשימה מסוג $t_{4}$ בגלל ה case הראשון וגם מטיפוס $t_{7}$ בגלל ה case השני.
בגלל ערך החזרה של המקרה הראשון - 0 , ניתן להגיד ש $t_{3}$ הוא שקול ל int.
בנוסף $t_{3} = t_{8}$ בגלל אותו הסבר
בגלל פעולת ה apply אנחנו יודעים שמצד ימין יש רשימה ומצד שמאל יש אלמנט שהוא מהטיפוס של איבר ברשימה.
length היא פונקציה בגלל המקרה השני שהפלט שלה הוא int.

כך ניתן לפתור את האילוצים ולגלות ש $l e n g t h : [a] \to i n t$ .