תוכן המאמר: 1. פתיחה 2. סוגי שיבושים וסיבותיהם א. תפיסה חושית לקוייה ב. בעיות זיכרון, ריכוז ותת-מודע ג. השפעת תהליכים פסיכו-לינגויסטיים כלליים ד. הבנה לקוייה ה. שיבושים מכניים וטכניים 3. ספירת גרסאות שוות ושיבושים כבסיס לקישור עדי-נוסח 4. "צבת ראשונה" - שקלול חילופי גרסאות כתנאי לעיבוד ממוכן 5. מודל סודר להשוואת חילופי גרסאות 5.1 דרגות מובהקות 5.2 סולם אחיד לחילופי גרסה ושיבושים 6. סיום (שאיננו אלא פתיחה) תקציר: המאמר עומד על שני קשיים מתודיים בפילולוגיה-היסטורית. האחד הוא כמות הנתונים העצומה העומדת בפני חוקרי עדי-נוסח בחיבורים ארוכים ו/או נפוצים. השני הוא הקושי בבחירת קריטריונים להפיק אילן-יחס קוהרנטי מאוסף הבדלי הגרסאות של עדי-הנוסח. מאמר זה הוא עיון מקדים להצגת מתודה כוללת, שאמורה לתת פתרון בו-זמני לשני הקשיים. בחלקו הראשון מוצג ניתוח פנומנולוגי של סוגי שיבושי-העתקה וסיבות לשיבושים. בחלק השני מוצע סולם אחיד לחילופי גרסאות ושיבושים. רשימת הסולם מהווה כלי תיאורטי ראשוני לעיצוב וליישום המתודה. במקביל לפיתוח המתודה, נערכה סידרת ניסויים קונקרטית לקידוד חילופי גרסאות ועיבודם באלגוריתם פילוגנטי, שפותח לצורך מחקרים גנטיים. דיווח מפורט על הליכי הניסוי, משמעותו ותוצאותיו יימסר בעתיד. מילות מפתח: מחקר תלמודי, גרסאות. |
1. פתיחה מדעי הרוח אינם משופעים בכלים טכניים אובייקטיביים לטיפול בחומרים שבהם הם עוסקים2. למרות ההישגים וההתקדמות המתמשכת בכל ענפי מדעי הרוח, עדיין שמור בהם מעמד מכריע לגישתו האישית של החוקר, לידע ולניסיון שלו, בבואו לקבוע מה היא התיאוריה המקובלת עליו, מה המתודות לבדיקה ולביקורת שישתמש בהן, ואפילו מה הן העובדות הרלבנטיות שיכללו בדיון. ביקורת הטקסט הקלאסית של טקסטים ספרותיים, התנהלה עד עתה בשיטות מובנות (ב' שוואית) למקוטעין3. הן הניתוח התיאורטי והן הניסיון, העלו קשיים מרובים ביישום המתודה, אך לא זה הוא נושא המאמר. לענייננו מספיק לציין את הקשיים העיקריים בזיהוי "שלשלת העתקה" על סמך השיבושים: מקריות יצירת השיבושים, הטמעה (conflation, contamination) בין נוסחים שונים ותופעת תיקון-מלומד. בדור האחרון, ובמיוחד עם חדירת השימוש במחשבים גם לתחומים שמחוץ למדעים המדויקים, הוצעו שיטות שונות לעיבוד ממוכן של נתונים טקסטואליים4. אתגר בלתי קונבנציונלי שכזה, דורש עבודת הכנה רבה, הן תיאורטית והן מעשית. ברור, שכל מתודה מתמטית או סטטיסטית-הסתברותית וכל אלגוריתם, מניחים הנחות מסוימות על "העולם" ומערכות היחסים בין ה"אירועים" שבו. גם הפילולוגיה ההיסטורית מניחה הנחות-עבודה מסוימות. שימוש מושכל בכלים החדשים, צריך לציין במפורש מה הן ההנחות של שני השותפים, וצריך לבדוק את מידת ההתאמה בין המערכות. לאחרונה נעשו ניסיונות מעניינים של שימוש בשיטות פילוגנטיות5, שמקורן במדעי החיים לניתוח טקסטים עתיקים6. פרוייקטים אלה, שהתחילו כגישושי-סרק בשיטת "נסה וטעה", מציבים כעת אתגר של פיתוח תיאוריה, מתודולוגיה ומתודות לפאראדיגמה חדשה בפילולוגיה ההיסטורית. עד כה, החוקרים לא עסקו (כמעט) במשימה זו, ועלינו לפתוח ב"חריש ראשון"7. דומני, שאחת הדרישות המוקדמות ביותר היא כימות העובדות הנחקרות. אלא שעוד קודם לכן מן הראוי לסקור - ולו בראשי פרקים - מקצת מן הרקע, שיבהיר באלו נתונים עסקינן8. במאמר זה ברצוני להציג תיאור טיפולוגי (מצומצם) של סיבות לשיבושים, לנמק את הצורך בשיקלול התופעות ולעצב מודל נורמטיבי אחיד של חילופי גרסה ושיבושים. ה"סולם" המוצע לבסוף, אמור לסייע בהגדרה כמותית של מובהקות הקשרים בין הגרסאות. הגדרה כזו היא תנאי להערכה יחסית כוללת של הגרסאות, ובעיקבותיה גם להקבצה מתוכנתת של עדי-הנוסח. 2. סוגי שיבושים וסיבותיהם ניתוח השיבושים ומקורם איננו (בעיקר) בעיה לוגית, אלא אנושית- התנהגותית. "שיבושים אינם קורים אלא נגרמים", ולכן יש צורך לבדוק כיצד הם נגרמים, ומה משמעותם במקום שהם מופיעים. מעתיק ספר עלול לטעות בגלל גורמים רבים, מהם התלויים באישיותו ומהם חיצוניים לה. השפעת אישיותו של המעתיק באה לידי ביטוי לעיתים קרובות בשיבושים קטנים, שלא תמיד ניתן בקלות לזהות אותם ככאלה. טיפולוגיה של שיבושים יכולה להערך על בסיס קריטריונים שונים. מהם כמותיים (שיבוש באות, מילה או משפט), מהם איכותיים (שיבוש שאינו משנה משמעות לעומת שיבוש משנה משמעות ושיבוש חסר משמעות), תוספות (הכפלה והחדרת גלוסות) לעומת השמטות, שיבושי כתיבה כנגד שיבושי דיבור ושמיעה, ואחרים. כצפוי, השיבושים יכולים להיות מסוגים שונים ויכולים לנבוע מסיבות שונות. מכל מקום, חשוב להבחין בין השיבושים כשלעצמם, לבין סיבותיהם. למען האמת, גם הסיווג וגם הסיבות אינם אקסקלוסיביים. לא תמיד ניתן לשייך בוודאות סיבה מסוימת לשיבוש מסוים. לעיתים קרובות, יתכן ששיבוש אחד יכול לנבוע מאחת מבין כמה סיבות שונות, או מצירוף של כמה סיבות. גם ההיפוך אפשרי: סיבה מסוימת אחת, עלולה לגרום לשיבושים מסוגים שונים. הוא הדין גם בסיווג. מטעמים דידאקטיים נוח להציג את הסיבות לשיבושים ביחד עם סוגיהם, ודעת לנבון נקל. האבחנה החשובה ביותר היא, לדעתי, שאלת המודעות של המעתיק לשינוי הטקסט. שינוי הגרסה יכול שייעשה ביודעין (למשל, מתוך רצון לתקן שגיאה שעשה המחבר, או להבדיל, מתוך כוונת זיוף) או כטעות בבלי משים, של אדם שמתכוון להעתיק את טופס החיבור כמות שהוא לפניו, ולא עלתה בידו. ישנן בעיות טקסטואליות שמקבלות משמעות שונה לחלוטין אם מעמידים אותן על בסיס של שיבוש טכני, או על בסיס של שינוי מגמתי. מחקר מקיף על העתקת ספרים בכלל ושיבושים בפרט, חייב לקחת בחשבון את הרקע התרבותי וההיסטורי הרחב של הנפשות הפועלות12. ברשימה הבאה נמנים כמה סוגים שיסודם באישיות הכותב והרגליו, ואחד חיצוני-טכני. הרשימה איננה ממצה את הנושא, אך מספקת מיפוי ראשוני למרחב הדיון13. א. תפיסה חושית לקוייה כמו טעות קריאה, גם טעות שמיעה15 יכולה לגרום השמטת הגאים, היתוך או פיצול16. אותיות נחות (בלתי מבוטאות) מועדות ביותר להשמטה. התופעה של גרירה או נטיה לשינוי מורפולוגי, בהשפעת מילים שכנות17, מתחזקת לעיתים על ידי צליל משותף בשתי מילים קרובות, אשר גורר השלכת הצליל הבא שבמילה הראשונה אל השניה18, או להיפך. מאותה סיבה, נמצא לפעמים שימוש מוטעה במילה אחת במקום בחברתה, בגלל דמיונן בצליל או בכתיב (heterophemy), והן מוחלפות זו בזו. ככלל, יש סיכוי מוגבר להחלפה בין מילים בעלות כתיב או צילצול דומה, אם הן גם דומות במשמעותן או לפחות מאותו מרחב סמאנטי19. ב. בעיות זיכרון, ריכוז ותת-מודע חוסר ריכוז (אך לעיתים גם בעיית השכלה וידע) עלול לגרור טעויות כגון העתקת-חסר של אחת מתוך שתי אותיות דומות בחיתוכן22 או החלפת רכיבים בתוך ניב ידוע23. מקרה נדיר, אבל מרתק בייחודו, הוא אשגרה של תלמיד חכם, תוך כדי העתקה24. אפשר שקרה בשעת חולשה, עייפות רבה או זיקנה. ב"בעיות שמקורן בתת-מודע", אני מתכוון בעיקר לחוסר קואורדינציה בין המוח והיד הכותבת. בדומה לפליטת פה, תופעות אלו קשורות למערך העיצבי והפסיכולוגי. מצבים ותופעות אלו עלולים לגרום לשגיאות מסוגים שונים: - שיכול (spoonerism) - החלפת הגאים, צלילים או הברות בתוך מילה, או בין מילים סמוכות25. - השמטת מילים - או החלפת סידרן - בתוך "יחידת הכתיבה" שנשמרת בזיכרון המעתיק, בשעת המעבר מן הקריאה אל הכתיבה. דומה להן, אולי, גם התופעה של השמטת מיליות קצרות, ללא סיבה ניכרת לעין (לעיתים אפילו של מילות מפתח כמו: לא, אין וכדומה, שמשנות לחלוטין את המשמעות!). - טישטוש ההבדל המורפולוגי במין או במיספר, או יחוסו לרכיב אחר שבמשפט (במיוחד נפוץ באזורים שבהם לא עסקו בלימוד דקדוק). - חילופי מילים מאותו מרחב סמאנטי ("אשגרה מעלמא")26 - הוספת מילים או שינוי מילים בגלל קשר אסוציאטיבי שנוצר אצל הכותב27, כשנתקל במילה המהווה חלק מניב ידוע28, או לביטוי מיוחד29. לפעמים, אפשר שזו פשוט חזרה על מילה או ביטוי שהופיעו בטקסט כמה שורות למעלה, ונשארו בזיכרון המעתיק. אם ביטוי זה נפוץ בטקסט, הוא יכול "להתקע" בזיכרון ואז המעתיק חוזר עליו עוד ועוד, אם צריך או לא צריך. לפעמים הדליק את הדמיון ביטוי מוכר מן המקרא30 או מן הספרות התלמודית31, שקשור למילים32 או לענין33. יש שרתיעה נפשית ממושגים שליליים עלולה לגרום לשינויים בהם34 או לדילוג עליהם35. קורה אפילו, שאשגרה אסוציאטיבית נסמכת על השתבשות של המעתיק (בקריאה או בהבנה)36, בנקודה זו37 או בקטע הקודם38. - תיקון-יתר שאינו אלא שיבוש ותצורה בלתי תיקניתhyper-correction39. בקטגוריית התת-מודע, אפשר אולי להכניס גם שיבושים אופייניים למעתיק מסוים, כאשר לא ניתן למצוא להם הסבר פשוט יותר40. ג. השפעת תהליכים פסיכו-לינגויסטיים כלליים מעתיקי ספרים קוראים את הטקסט שלפניהם (אפילו בקריאה שתוקה), ועלולים לשכתב אותו בעיקר באחד או יותר מן התהליכים הבאים: - הידמות (assimilation) צלילים שונים שמבוצעים בסמיכות זה לזה, מקבלים תכונות משותפות42, לעיתים עד כדי הזדהות מלאה43. ההידמות עלולה להיות הדדית, פרוגרסיבית, רגרסיבית, או מרוחקת. - ביטול קוליות של עיצור חסר הגה עלולה לגרום להשמטתו גם מן הכתב44. - הפחתת הגה(elision) 45. - חיסור סמנטי (ellipsis) - כאשר המשמעות עוברת מן הצירוף השלם לאחד ממרכיביו, גם הכתיבה נוטה להתקצר46. - חילוף במילה השווה במשמעותה לחברתה, והיא גזורה מאותו שורש או משורשים קרובים, אך שונה קמעה בצורתה (polymorphy) 47. - צימוד מסולף (zougma) - מילה האמורה לשרת שני רכיבים, אך מותאמת כהלכה רק לאחד מהם. - שינוי צורה דיקדוקית של מילה, בהשפעת צורה "דומה" סמוכה48. - בידול (dissimilation) - שינוי הגה והפיכתו לדומה פחות להגה הסמוך לו. - צורות בלתי תקניות בשפה, בהשפעת שימוש יום-יומי בשפה זרה49. ועוד. ד. הבנה לקוייה במקרים קיצוניים של חוסר הבנה בסיסי, או חוסר תשומת-לב, המעתיק עלול שלא לחוש בחסרונם של דף או יותר בטופס המקור, ולהמשיך ברצף הכתיבה הלאה, חוסר הבנה נקודתי עלול לגרום לתקלות מצורות אחדות. למשל, מילים בודדות עלולות להיות בלתי מובנות למעתיק משום היותן נדירות (במיוחד מילים לועזיות)51, או משום היותן צורות ארכאיות או מחודשות ע"י המחבר52. ישנן פעמים שהמעתיק מחליף או משנה שם נדיר בשם אחר, דומה לו, אך נפוץ יותר. מאד נפוץ שיבוש במיספרים, בגלל הנוהג לייצג אותם באותיות (גימטריה), וכן פיענוח שגוי של ראשי-תיבות, או תפיסתן כמילה בפני עצמה (תוך ביטול הסימון הגראפי המייחד). גם מנהגי-סופרים מסויימים עלולים להיות בלתי מוכרים למעתיק בלתי מיומן. ישנם סופרים שמשלימים את קצה השורה באותיות הפותחות את המילה הבאה, עם או בלי חזרה עליהן בתחילת השורה הבאה. נוהג זה עלול להטעות את המעתיק, אשר חושב שלפניו מילה בפני עצמה. וכן קורה גם שהמעתיק משלב מילות-קשר ("שומר דף" ו"שומר קונטרס") של הטופס שלפניו, אל רצף הטקסט. שיבוש מצוי בהעתקת פירושים הוא אי-הבחנה בין "דיבור המתחיל" של המקור ומילות הפירוש של הפרשן. ה. שיבושים מכניים וטכניים תופעה דומה, אך שונה במקצת, אפשר למצוא כאשר קטע טקסט נמצא שלא במקומו, אבל אותו קטע נמצא גם במקומו הנכון. במקרה זה, יתכן שדף בודד הוכנס לטופס-האב מתוך עותק אחר של החיבור, ושולב גם הוא בהעתקת טופס-הבן. עוד תקלה שמקורה טכני (אמנם נדירה ביותר), נוצרת למשל עקב קרע במצע הכתיבה (של טופס-האב). הכותב עשוי לכתוב בשני צידי הקרע בכדי לנצל את מירב השטח. ואילו המעתיק עלול שלא להבחין בדבר, ולהעתיק לפי סדר השורות במקום סדר הטורים55. במקרים רבים, נמצא שהשיבושים הטכניים "שקופים", אפשר לזהותם מיידית ואף להגיע בבטחון יחסי אל הגרסה המקורית שלהם. 3. ספירת גרסאות שוות ושיבושים כבסיס לקישור עדי-נוסח הדרך לעמוד על קשר (תלות) בין עדי-נוסח, היא באמצעות קטעי טקסט אשר משותפים לשניים או יותר עדים, ושונים בגירסתם מעדים אחרים. בין אם הם שיבושים וודאיים, ובין אם אופיינו בזהירות כ"גרסה מקשרת" בלבד. הנחת עבודה בסיסית היא, שתיזמון של גרסאות משותפות בדרך כלל איננו אקראי גרידא. גרסאות משותפות - ועוד יותר שיבושים משותפים - עשוים לאפיין עדים אחדים כמשפחה או כטיפוס של טקסט. הגרסה המשותפת מצביעה על קשר-העתקה כלשהו ביניהם. הדיון בגרסה הבודדת נערך כמובן במושגי הפילולוגיה הקלאסית ובשיטותיה. אבל, בשעה שאנו עוברים להערכה כוללת של כל הפיסקאות בטופס מסוים, מול כל הפיסקאות שבטופס אחר, השיקולים העיקריים הופכים להיות שיקולים כמותיים-סטאטיסטיים. כאשר קובעים מהו היחס בין שתי גרסאות (למשל שאחת משתלשלת מן השניה), ורוצים להכליל קביעה זו על שני עדי-הנוסח, אין מנוס מן החובה לבדוק עד כמה הנתון הספציפי הזה מייצג את המערכת כולה, ומה משקלו היחסי, מול נתונים אחרים שאולי מציגים יחס אחר ביניהם (כיוון השתשלות הפוך, או אב משותף לשניהם). השלב המבוקש הבא הוא, אם כן, מציאת דרך לפרוט את העיקרון לאמצעים כמותיים, אשר יאפשרו הערכה יחסית של קשרים ספציפיים בין הגרסאות, לצורך עיצוב הקבצה כוללת של הקשר בין עדי-הנוסח. המתודות הקלאסיות של המקצוע, לא טיפלו בשיטת ה"מעבר" מאיסוף הבדלי הגרסאות אל הקבצת עדי-הנוסח ועיצובם כאילן-יחס. המתודות הממוכנות לעומתן, תובעות הגדרה ברורה (קרי: כמותית) של הקריטריונים להקבצה ולקישור תורשתי. הדרך המקובלת לקישור ולהקבצת עדים, היא על פי כמות הגרסאות והשיבושים המשותפים שלהם. זאת, כאשר הציון לכל גרסה הוא בינארי (שווה/שונה). עד כה, מי שרצה לעשות עבודה שיטתית, היה נאלץ לערוך השוואה טוטאלית של כל הבדלי הטקסט בין כל העדים. בחיבורים ארוכים ו/או מרובי עדים, זוהי ממש משימה בלתי אפשרית58 (השוואה פרטנית בכל lema, אמנם נערכת במהדורות מדעיות, אך כאן מדובר בהשוואה מסכמת ומשלבת). רוב החוקרים מסתפקים בהתייחסות למיספר מצומצם של הבדלים משמעותיים (לדעתם), ומהם הם מסיקים את מסקנותיהם באשר לקשר הגניאלוגי בין העדים59. חשוב לציין, שכל ההקבצות והקישורים שנערכו עד כה - הן האינטואיטיביים והן הממוכנים - התבססו על ספירת שיבושים משותפים כאמת מידה יחידה למדידת ההבדל (או הדמיון) בין עדי-הנוסח60. כלומר, "שקילת" העדויות התבטאה רק בהשוואה ישירה של מיספר השיבושים שנמצאו בזוגות עדים (לפעמים גם שלשות או רביעיות). תיאורטיקנים מודרניים שילבו חישובים מורכבים לשיקלול יחסי של המיספרים שנמצאו61. כמו כן נמצא מי שהתחשב במיספר הוואריאנטים שאינם דומים62, שהרי ככל שהגרסה נדירה יותר, גוברת הוודאות שקיים קשר הדוק בין העדים השותפים בה. לאחרונה, יש שעשו שימוש באלגוריתמים טבלאיים להערכת המרחק (המתמטי) בין הנשאים63. כאמור, בכל המחקרים הנ"ל, הנתון הבסיסי הנכנס לתחשיב הוא מיספר השיבושים. אך יש לזכור, שלא פחות מתיחכומו של האלגוריתם המופעל (שספק אם ניתן לתת לו הצדקה תיאורטית), מה שקובע את איכות התוצאה, הוא טיב הנתונים וערכם64. 4. "צבת ראשונה" - שקלול חילופי גרסאות כתנאי לעיבוד ממוכן הצעד הראשון ייושם כאן על ידי סילום רשימת כל ההבדלים ודירוגם היחסי. הדירוג הבא, מעמיד את כל ההבדלים לסוגיהם השונים על סולם אחד, ומאפשר להגדיר את מקומו של כל פריט (חילוף גרסה) ביחס לאחרים. מטרת הרשימה המוצעת, היא הערכה יחסית ל"מובהקות ההבדל" בין הבדלי גרסאות ושיבושים משותפים מכל המינים. אחרי דירוג הגרסאות בצורה אחידה וכללית, נפתחת הדרך גם לשקילה ושיקלול יחסיים שלהן. מאחר שמקובלת עלינו הטענה שהדימיון בגרסאות הוא הבסיס לקשר בין עדי-הנוסח, ננסה בצעד הבא לכמת את הקשר הזה בדרך פורמאלית - תרגום ערך המובהקות של הגרסאות הספציפיות ל"עוצמת קשר" בין עדי-נוסח. המשקל היחסי של כל הבדל גרסה, הוא ערך כמותי שאפשר להפעיל עליו מאניפולאציות מתמטיות. סיכום של ערכי-הקשר של כל הגרסאות, יתן הערכה כמותית להקבצה כוללת של עדי-נוסח שונים, על בסיס כל הגרסאות הדומות והשונות שבהם. החלוקה לקבוצות ולתת-קבוצות תעלה מתוך שיקלול הערכים שיתקבלו בצעד השני. ואם לנסח זאת בצורה קונקרטית - כימות השוואת הגרסאות, מהווה אמצעי חשוב להכרעה במצבי התנגשות: עד יחיד שנמצא קשור באופן חזק ("מובהק") לקבוצת עדים אחת, ובאופן חלקי וחלש לקבוצת עדים אחרת, אנו רואים אותו כשייך לקבוצה המובהקת. הקירבה לקבוצה האחרת אינה אלא סימן ל"הטמעת נוסחים". כפי שציינו בפתיחה, מהווה ההטמעה בעיה מתודולוגית חמורה, והרי לפנינו כאן כלי-עזר "לשים אותה בין סוגריים". בין מהדירי הטקסטים מקובל הכלל lectio deficilior. לאמור: חזקה היא, שדווקא הקריאה "הקשה" - היא המקורית. בדומה לכך, אני מבקש להעמיד כלל: ככל שההבדלים בין גרסאות הם "מובהקים" - לא סביר שהם יתרחשו באופן בלתי תלוי זה בזה. מובהקות ההבדל יכולה להוות קריטריון לעוצמת הקשר בין הגרסאות, ובאמצעותה גם לעוצמת הקשר בין עדיהן. כלומר, הקשר בתוך קבוצת עדים (מול קבוצה אחרת) חזק יותר, ככל שגבוהה יותר מובהקות הגרסאות המשותפות להם, ביחס לגרסאות הקבוצה האחרת. האלגוריתם המפורט המממש כלל זה יעוצב בשלב מאוחר יותר. גם בעיית הזימון המקרי של שיבושים, מקבלת בדרך זו תשובה חלקית. השיבושים ה"קטנים, פשוטים ונפוצים" מרוכזים בקבוצה הראשונה (ב"תחתית הסולם"), וניתן להעניק להם משקל נחות ביחס לשאר המימצאים. חשוב לציין: למיטב הבנתי, שיבושים שמקורם ב"תיקון מלומד", אינם ניתנים בדרך כלל לשקילה אפריורית, והערכתם נשארת כאתגר לאינטואיציה של החוקר66. אני מקבל כהנחת-עבודה שהשיבושים ה"בלתי מודעים" הם הכלי העיקרי להקבצת עדי-הנוסח. ועוד: במציאות הטקסטואלית הנפוצה, "טבעי" ששיבושים טריביאליים (בלתי מובהקים) מרובים יותר משיבושים מנקרי-עיניים. רקע תיאורטי לתופעה והשלכותיה על המתודה יידונו גם הם בעתיד67. |
המשך המאמר |
---|