טרנספורמציה של ציונים
מחבר: ד"ר שמואל אבן-זהר
מחשבים בחינוך, גיליון 39, 1997
מבוא:
כל מרצה באוניברסיטה או מורה בבית-הספרניצב בפני הבעיה של מתן ציונים אובייקטיבים לתלמידים, אשר ישקפו את מידת השליטהשלהם בחומר. לשם כך עליהם לענות על שאלון (המכונה "מבחן"), והציון הניתן עליו הינוהמדד הנפוץ המציין את "מידת הידע" של הסטודנט בנושא הנלמד.
הנחת היסוד היאשפריטי המבחן מהווים מדגם אקראי מתוך החומר כולו בו אמור התלמיד לשלוט. כמו כל כלימדידה מסוג זה (שאלונים) גם המבחן צריך להיותמהימן ותקף. אתמהימנותהמבחן, (שמשמעה באיזה מידה בודקים כל חלקי המבחן מדד מסוים) קל לבדוק על-ידי חישובקורלציות בין ציונים המחושבים בנפרד לחלקי המבחן השונים, אךתקיפותהמבחןשהיא המידה בה הוא באמת בודק את הידע, בעייתית יותר. הידע הוא פנימי, אינפורמציההשתולה במוחו של הסטודנט ולא ניתן למדדו באופן ישיר, שכן לא ניתן לערוך "דגימתמוח". ציון המבחן אמור לשקף אתכמות הידע, אך ברור שאין שום מבחן המודד זאתבמדויק.
לא זו בלבד, אלא שהמדידה עצמה מקלקלת את המידה, ולא אחת נכשלים תלמידיםעקב התרגשות, או מצליחים בעזרת ניחוש (או שכן טוב), שלא לדבר על קריטריונים לבדיקהשל אותו מבחן השונים בין בודק לבודק. על חלק מהבעיות שהוזכרו בא לענות המאמרהנוכחי.
הסטודנט העונה על המבחן עובר תהליך שלשליפת (אחזור) האינפורמציה ממוחו. הטבעת החומר הנלמד אל המוח דורשקידוד (ENCODING) - מעברמצורה פיזיקלית חיצונית (אור, קול) לצורה פיזיולוגית פנימית (שינויים כימיים ב- RNA, או גם פעילויות חשמליות במוח). תהליך השליפה הוא הפוך, פענוח (DECODING) - מעבר מצורה פיזיולוגית פנימית לצורה פיזיקלית חיצונית, כתיבה אודיבור. בכל מעבר כזה ישנו איבוד מסוים של החומר. תהליך הלמידהעצמו המתחוללבמוח (RECODING), הינו שזירת קשרים אסוציאטיביים, ולא זה נושא המאמר הנוכחי. קללהבחין שמודל זה לקוח מעולם המחשב.
ישנם גורמים שונים המפריעים לשליפה, כמותכונות אישיות של הסטודנט (איטיות בתגובה, חוסר ריכוז) או הפרעות זמניות, שלא יבואובהכרח לביטוי בעיתוי אחר, וכךאין המבחן משקף ידע אמיתי.
יתכן גםופריטי המבחן אינם מהווים מדגם מייצג של החומר הנלמד. אם למשל השאלות אינן מפוזרותבאופן אקראי על-פני כל חומר הקורס אלא מרוכזות על תחילת החומר, גם הסטודנטים שלאהספיקו לגמור ללמוד יכולים להצליח, ואלו שעברו על כל החומר, יספיקו אולי לשכוח אתההתחלה, ויכשלו. אם השאלות לקוחות מסוף החומר הלימודי, ייתכן ובעלי זיכרון קצר, שלאהפנימו את כל החומר יצליחו, וכדומה.
מכל האמור לעיל ברור שהציון הגולמיהמתקבל במבחן כל שהוא אין לו קיום בפני עצמו ואינו משקף את "אחוז הידע". מטרת מבחן היא (כשמו) - לאבחן בין הטובים יותר והטובים פחות, ולא משנה כלל מהו טווחציוני המבחן. לכן, חשוב לדעת לגבי כל סטודנט מהומיקומו היחסי לקבוצה (ציוןהפרסנטיל - PERCENTIL) או מהומיקומו יחסית לממוצע הכיתה (למשל, ציון התקן - Z SCORE), ולא מהו ציונו הגולמי במבחן. מבחן טוב מוגדר כמבחן שציוניו מתפלגים כמורוב המדדים בטבע - התפלגות נורמלית (במובנה הסטטיסטי), כך שישנם נבחנים מעטיםגרועים, מעטים מצוינים, והרוב מתרכז באופן סימטרי סביב הממוצע.
מבחינותמסוימות, במידת האפשר, עדיף מבחן בשיטה האמריקאית (תשובות סגורות לבחירה), אשרמאפשר מדגם גדול יותר של פריטי ידע, אובייקטיבי יותר וקל יחסית לבדיקה (באמצעותתוכנית מחשב).
היות ונהוג באוניברסיטה, או גם בבתי-ספר סולם אחיד של טווחציונים (לגבי ציון עובר) הנע בין 60 ל-100, על המרצה לדאוג אם כן להעביר את הציוניםהגולמיים המתקבלים במבחן כל-שהוא, לטווח קרוב לזה באמצעות נוסחה אחידה אובייקטיבית. טרנספורמציה זו של הציונים חייבת לשמור על סדר, אך לא חייבת להיות לינארית. ישנןשיטות שונות לטרנספורמציה של ציונים. חלק מהן יפורטו להלן:
1.הבונוס הקבוע:
המרצה או המורה מבחיןשציוניו נמוכים מדי, והם נעים למשל, בין 40 ל-80. מצב זה מורה על מבחן קשה מדי. יתכן והוא כולל פריטים שאינם בחומר הנדרש, או שאלות לא ברורות, או שהמרצה פשוט גרועולא הצליח להבהיר את החומר. לא סביר שהכיתה כולה חלשה. במצב זה אפשר פשוט להוסיףלכל תלמיד 20 נקודות. בונוס זה אינו יעיל כשהציונים נעים מ-0 עד 100, למשל. תוספתהנקודות היא אחידה הן לחלשים והן לחזקים, ואינה פרוגרסיבית.
2. הבונוס היחסי:
המרצה מכפיל כל ציון בפקטורקבוע. אם למשל הציונים נעים בין 40 ל-80, ניתן להכפיל כל ציון ב-1.25. כך מקבלהתלמיד הטוב בונוס גדול יותר מהתלמיד הגרוע, ויש בזה מידה מסוימת של אי-צדק.
3. טרנספורמציה בהנחה של התפלגות נורמלית:
בטרנספורמציה זו, המרצה מחליט מהו ממוצע הכיתה המועדף, ומה סטייתהתקן הראויה. נניח שהמרצה מעוניין בממוצע של 80 וסטיית תקן 10 נקודות. כידוע, כ2.5%מהאוכלוסייה נמצא מעל ציון תקן של 1.96, וכ2.5% נמצאים מתחת לציון תקן 1.96-. בהחלטה הנ"ל של המרצה, כל סטיית תקן ערכה 10 נקודות. לכן, ציון 100נמצא שתי סטיותתקן מעל לממוצע וציון 60 נמצא שתי סטיות תקן מתחת לממוצע. בהנחה (סבירה) שהציוניםמתפלגים נורמלית, ההשלכה הישירה של החלטת המרצה הנ"ל היא שכ2.3% מהסטודנטים יכשלו, ואחוז דומה יקבל ציון 100 ומעלה.
אם המרצה ירצה להגדיל אחוזים אלו, עליו להחליטעל טרנספורמציה עם פיזור גבוה יותר, למשל סטיית תקן של 15 נקודות. במצב זה הציון 100 מקביל לציון התקן 1.33 מעל הממוצע וציון 60 ציון התקן שלו הוא 1.33-. מבט בטבלתההתפלגות הנורמלית מורה על כך שבמצב זה 9.18% מהסטודנטים יכשלו ואחוז דומה יקבלוציון 100 ומעלה. מרצה מחמיר יותר יכול להחליט על ממוצע נמוך יותר.
בהמשךמוצעת הדרך המעשית לחישוב זה, בעזרת גיליון אלקטרוני כל-שהוא.
4. טרנספורמציה להתפלגות נורמלית:
אם הציוניםהגולמיים אינם מתפלגים נורמלית ניתן להעבירם להתפלגות נורמלית למשל על-ידי לקיחתהפרסנטילים שלהם כציונים (ניתן לעשות זאת בקלות בעזרת הפונקצייה PERCENTILE או PERCENTRANK של EXCEL). הפרסנטיל הוא המיקום באחוזים של כל סטודנט בקבוצה. הממוצעשל ציונים אלו יהיה קרוב ל-50. ניתן כמובן להמשיך ולהעביר ציונים אלו לכל ממוצעהתפלגות רצוי בשיטה המתוארת קודם לכן.
5. טרנספורמציה למצבים "קטסטרופליים":
ישנןנוסחאות שונות ל"הצלת מבחן" אשר רבים מהכיתה נכשלו בו (התפלגות לא נורמלית עם זנבשמאלי). למשל הנוסחה - שורש ריבועי כפול 10. במצב זה מי שקיבל 100, ימשיך לקבל 100, ומי שקיבל ציון 36 יקבל ציון עובר - 60. טרנספורמציה זו מטיבה מאד עם החלשים ואינהגורעת מהחזקים.
6. ניכוי פריטי מבחן:
במבחן אמריקאי ניתןלנכות פריטים שרוב התלמידים בכיתה לא ענו נכון, לפני חישוב הציון הסופי. ניתן לבדוקמה אחוז העונים נכון לכל שאלה. אם למשל ישנם 4 תשובות לכל פריט, ורק כ25% ומטהמהכיתה ענו נכון לשאלה מסוימת, יש להניח שהסטודנטים ענו לשאלה זו באופן אקראי. שאלהזו לא מבחינה בין הטובים יותר והפחות טובים, ולכן ניתן להורידה מחישוב הציון. באותואופן, שאלה שכל התלמידים בכיתה ענו עליה נכון, אף היא אינה מבחינה וניתן להורידה.
מכל האמור לעיל, נראה שבכל מקרה כדאי לתת מבחן קצת יותר קשה מאשר מבחן קלמדי, שכן קל יותר להסביר לסטודנט תוספת לציון המקורי מאשר להסביר הפחתה לציון. ההסבר שהציון המקורי אינו משמעותי כלל, והמיקום הקבוצתי קובע, אינו עומד בפניטיעונים רגשיים של קיפוח.
יש להסתייג ולא לבצע טרנספורמציה המסתמכת עלהמיקום הקבוצתי כאשר ישנם מעט מדי נבחנים בקבוצה.
תיאור תוכנית מחשב לחישובים הנ"ל:
אף כי ניתןבקלות לכתוב תוכנית מחשב לחישובי הטרנספורמציות הנ"ל בשפה סטטיסטית כמו SAS או SPSS, המשתמש בהם למטרות אלו דומה להורג זבוב בתותח במקום במחבט, מה גם שחסרה לשפותאלו אינטראקטיביות אמיתית.
טבעי ביותר לכתוב תוכנית בגיליון אלקטרוני כלשהוא - QUATRO-PRO, LOTUSאו EXCEL תחתWINDOWS . נתקתק את הנתונים כמטריצה סטטיסטיתרגילה של נבדקים*משתנים, כלומר, נבדקים בשורות, והתשובות למבחן (אם זה מבחןאמריקאי) בעמודות.
לדוגמא, בטור A נתקתק את מספר הזיהוי או מספר המחברת שלכל הסטודנטים, ומטור B ואילך - את תשובות הנבחנים. יש להשאיר שורות ראשונות לכותרותשונות. השורה שלפני הנבחן הראשון תכיל את התשובות הנכונות לפי הסדר.
בהמשךהטורים (מטור AA, למשל, תלוי במספר פריטי המבחן) נכין מטריצה נוספת כשבטורים משתניםלוגיים מחושבים המקבילים לפריטי המבחן, אשר ערכם המחושב יהיה 1 או 0 (נכון או לאנכון) לנבדקים השונים. ניתן לעשות זאת בפשטות על-ידי הצבת הפונקצייה הלוגית IF בשורת הנבדק הראשון בטור של הפריט הלוגי הראשון: (IF(B3=B$2,1,0= או פשוט יותרבנוסחא: B3=B$2=, כאשר, בשורה 2 נמצאים התשובות הנכונות ומשורה 3 ואילך התשובות שלהנבחן הראשון.
הערך של הביטוי הלוגי הנ"ל יהיה 1 אם התשובה הראשונה של הנבדקהראשון זהה לתשובה הנכונה של המבחן, ו-0 אם לא. תא זה יועתק לכל הטורים בהמשך (המקבילים לפריטים) ולכל השורות (הנבדקים) כך שתתמלא מטריצה של 1 או 0. בהמשך, מתחתלכל טור במטריצה הנ"ל נסכם כל טור (פונקצייה SUM), וכך נדע כמה ענו נכון לכל שאלהנוכל להוריד מהחישוב הסופי שאלות לא מייצגות, כגון, אלו שרק 25% ומטה מהנבחנים ענונכון, לגבי מבחן בו לכל פריט 4 תשובות אפשריות.
בטור נוסף מימין, נסכם אתהשורות של התשובות הנכונות, וכך נקבל את מספר התשובות הנכונות שענה כל נבחן (כרגילבגיליון אלקטרוני, מספיק להציב נוסחא במשבצת אחת ולהעתיקה לכל שאר התאים בטור). בטור נוסף נחלק מספר זה במספר השאלות ונכפיל ב-100, וזהוהציון הגולמי.
אם יש חלק נוסף למבחן, כמו שאלות פתוחות, ניתן לתת ציון לחלק זה בטור נפרד, ולהקציב טור נוסף לחישוב ממוצע של שני החלקים בשקלול הרצוי (50% לכל חלק, או 40%ו60% וכדומה). ניתן להוסיף בטור נפרד ציון על תרגילים אם היו בקורס, ולשקלל אףאותו.
אם המבחן אינו בסגנון אמריקאי, ניתן פשוט לתקתק את הציון בטור הציוןהגולמי, או את חלקי הנקודות של פריטי המבחן, ולסכמם לטור הציון הגולמי לכל נבדק.
כעת, בתא בתחתית הטור של הציון הגולמי הסופי נחשב את הממוצע הכיתתי (פונקצייה AVERAGE) ותחתיו את ציון התקן (פונקצייה SD). בטור נוסף נחשב אתציוןהתקןשל כל סטודנט: הציון פחות הממוצע חלקי סטיית התקן. לדוגמא, אםהממוצע נמצא בטור Z בשורה 50 ותחתיה בשורה 51 סטית התקן, והטור החדש (BB) נמצאמימין לטור בו הציון הגולמי, נתקתק בתא BB3 לנבחן הראשון:
Z3-$Z$50)/$Z$51)= ונעתיק נוסחא זו לשאר השורות באותו טור.
בטור נוסף מימין נתקתק את נוסחתהטרנספורמציה הדרושה. אם נבחר, למשל, בטרנספורמציה הנורמליתשממוצעה 80וסטית התקן 10, ובטור BB נמצאים ציוני התקן, נתקתק בטור BC3 את הנוסחא: BB3*10+80= ונעתיק זאת לשאר השורות בטור BC. אם נבחר בטרנספורמציה למצבים קטסטרופליים, ובטור הציונים הגולמיים, נתקתק: Z3^0.5*10= ונעתיק זאת לשאר השורות בטור BC. (הסימן ^ מציין חזקה, ולכן 0.5^ הוא למעשה הוצאת שורש. נוכל כמובן להשתמש בפונקצייה SQRT.)
ניתן להשתמש בכל טרנספורמציה אחרת הנראית לנו, או בשילוב ממוצע משוקלל שלכמה סוגי טרנספורמציות. המטרה הסופית היא להביא את הציונים להתפלגות נורמלית בהמספר מסוים (נמוך) של נכשלים ומספר דומה של ציון 100 (ומעלה). תזוזת הממוצע המבוקשלמעלה או למטה תעזור לנו להפחית את מספר הנכשלים או ציונים מעל 100. כל טרנספורמציההמתקרבת להתפלגות נורמלית היא לגיטימית בתנאי, כמובן, שסדר הציונים נשמר.
ניתןלבדוק נורמליות של משתנה על-ידי פונקצייה מתאימה כמו (SKEWNESS) או אף לשרטט גרףהתפלגויות. הדבר קל מאוד לביצוע בגליונות אלקטרוניים, ובעיקר ב- EXCEL.