תַקצִיר
כולנו חווינו את התסכול של חיפוש משהו שאנו רוצים ומציאת סדרה אינסופית של דברים שאיננו רוצים. התהליך הזה של חיפוש פריט שיש בו עניין נקרא חיפוש חזותי (ויזואלי). אנו מבצעים חיפוש חזותי כל הזמן בחיי היומיום מאחר שפריטים שאנו רוצים מוקפים כמעט תמיד על-ידי פריטים רבּים אחרים. אולם במקרים מסוימים נדרשת הכשרה מיוחדת כדי למצוא דברים, כמו למשל כשמחפשים תאים סרטניים באמצעות קרני X; נשקים או חומרי נפץ במזוודות בשדה תעופה או צַלָּף שמתחבא בשיחים. הֲבָנַת האופן שבו אנו מחפשים פריטים ומוצאים אותם הכרחית להבנת האופן שבו אנשים רגילים ומומחים כאחד פועלים בעולם האמיתי. בעוד שנותר הרבה לגלות, הדברים שכבר למדנו עד היום מאפשרים לנו חלון הצצה מרתק אל האופן שבו אנו רואים.
חיפוש חזותי הוא עובדה של החיים, ויכול להיות עניין של חיים ומוות
רבים מאתנו זוכרים איך העברנו את הזמן בנסיעות ארוכות ומשׁמימות באמצעות משחקי מציאת פריטים המוחבאים בתמונה, כמו למשל “אני רואה” (איור 1A) או ב “Airport Scanner” (“סורק שדה תעופה”) בטלפונים הניידים או בטאבלטים שלנו. אנשים מבוגרים יותר, כאלה שנמצאים בשנות השלושים והארבעים לחייהם, עשויים לזכור את המשחק “איפה אֶפִי?” שהיה משחק פופולרי בחוברות קומיקס בזמנם. הפעילויות האלה מהנות מאוד מאחר שהן מייצרות משחק ממה שאנו עושים כל הזמן בחיי היומיום, כלומר, חיפוש פרטים או “מטרות”, בין דברים שמסיחים את דעתנו ואיננו רוצים בהם, או “מסיחים”. המשחקים האלה מאפשרים לנו לחווֹת את התסכול המתוק של חיפוש המטרה ואי מציאתהּ, או את השמחה של מציאתהּ.
לפעמים מציאת המטרה דורשת הכשרה מיוחדת ויכולה להיות עניין של חיים ומוות. חוקרים מתמקצעים במשך שנים כדי להיות טובים, לדוגמה, במציאת תאים סרטניים בהקרנות קרני X (איור 1B). באופן דומה, מומחים צבאיים עוברים הכשרות אינטנסיביות כדי למצוא צלפים ומוקשים שמוסווים ברקע. אסונות יכולים להתרחש אם מכונות חכמות, כמו למשל מכוניות אוטונומיות, או ציוד לאבחון רפואי כושלים במציאת המטרות שהם מתוכננים למצוא. בטבע, חיות חייבות לְאַתֵּר טורפים פוטנציאליים במהירות מספיק גדולה כדי לברוח למקום מִבְטַחִים. מצד אחר טורף עשוי לגווע למוות אם הוא לא יהיה טוב מספיק במציאת הַטֶּרֶף שלו, או אם הטרף שלו מוצא אותו בקלות רבה מדי. לכן, אתם יכולים לראות בבירור שחיפוש חזותי הוא חלק חשוב מאוד מהאופן שבו מוחות פועלים בחיים האמיתיים.
המאפיינים הבסיסיים של חיפוש חזותי
כיצד המוח מוצא את מה שהוא מחפש, וכיצד אנו החוקרים מנסים להבין כיצד המוח עושה זאת? ראשית, לעיתים קרובות חוקרים משתמשים ב“סצנות” פשוטות שמיוצרות במחשב (איורים 1C-E). הסיבה לכך היא שֶׁקַּל יותר ליצור במחשב תמונות כאלה במספרים מספיק גדולים (דמיינו שאתם צריכים למצוא אלף תמונות מהעולם האמיתי של צלפים מוסווים), וכן מאחר שזה גורם לחיפוש החזותי להיות פשוט יותר, מה שבתורו גורם לחֵקֶר החיפוש החזותי במעבדה להיות קל יותר.
במסגרת מחקרים מוקדמים חשובים שבוצעו על-ידי אן טרייסמן (2018-1935), שהתחילו בשנות השישים של המאה הקודמת, נעשה שימוש בתמונות פשוטות כדי לגלות דברים בסיסיים על חיפוש חזותי [2, 1]. עבור תרומתה להבנתנו את החיפוש החזותי ד“ר טרייסמן קיבלה את המדליה הלאומית למדעים על-ידי נשיא ארצות הברית ברק אובמה, בשנת 2013.
דמיינו שאומרים לכם למצוא פריט שאינו שייך לסצנה, כלומר מסוג ”odd-man-out“ באיור 1D. מה שאתם מחפשים בתמונה הזאת, המטרה, היא בר אדום. במקרה הזה, המטרה ניתנת לזיהוי בקלות. הבר האדום ”קופץ החוצה“, והוא עושה זאת ללא תלות אם מסיחי הדעת הם ברים כחולים או פריטים אחרים, כמו תפוחים. אם כן, המטרה קופצת החוצה אם אפשר להבחין בה ביחס לכל מסיחי הדעת באמצעות מאפיין של חיפוש חזותי בסיסי, או ”סממן“. בדוגמה שלעיל, הסממן המייחד הזה הוא הצבע, אולם סממנים מייחדים יכולים להיות צורה; כּיווּניוּת; תנועה; עומק וכדומה. טרייסמן מצאה שמספר מסיחי הדעת אינו משנה במקרה הזה. אפשר למצוא את המטרה באותה הקלות בין ארבעה מסיחים ובין ארבעים מסיחים. במקרה הזה, הזמן שלוקח לצופה למצוא את המטרה, או ”זמן התגובה“, אינו תלוי במספר הפריטים בסצנה (קו ירוק באיור 1F).
זמני תגובה הם שונים כאשר המטרה חולקת חלק, אבל לא את כל, המאפיינים של חלק ממסיחי הדעת (איור 1E). במקרה הזה, המטרה אינה קופצת החוצה (“non-pop-out target”) וזמני התגובה עולים כתלות במספר הפריטים בסצנה החזותית (קווים אדומים באיור 1F).
מדוע זה קורה? מהו ההסבר הפשוט ביותר האפשרי לשני סוגי תבניות זמני התגובה שמוצגות באיור 1F? תובנה מכריעה התגבשה כאשר טרייסמן והעמיתים שלה בחנו מקרוב את הטעויות שבוצעו על-ידי המתבוננים. כאשר המתבוננים קלטו באופן שגוי מה הייתה המטרה (למשל, כאשר הם דיווחו שה-odd-man-out הוא הקו האדום האנכי כשלמעשה הוא היה הקו האדום האופקי, איור 1D), הם גם בסבירוּת גדולה יותר טעו בקליטת המיקום של המטרה. משמעות הדבר היא שכדי למצוא מטרה בצורה נכונה צריך לקלוט את המטרה נכון. ניסויים נוספים הראו שיכולת מנטלית להתמקד במיקום מסוים בסביבה חזותית – למשל, בבר שבפינה השמאלית העליונה של התמונה – נדרשת כאשר המטרה אינה קופצת החוצה, ואינה נדרשת כשהיא כן קופצת. היכולת הזו נקראת ”קשב מרחבי“. טרייסמן גם הראתה שבמהלך חיפוש חזותי של מטרה מסוג non-pop-out אנו ממקדים את הַקֶּשֶׁב במיקום נתון כדי לראות אם המיקום הזה מכיל את המטרה, ואם הוא לא אנו מסיטים את הקשב שלנו למיקום הבא וכך הלאה עד שהמטרה נמצאת. לכן, קשב מרחבי וחיפוש חזותי קשורים זה לזה באופן הדוק.
המודל הזה של חיפוש חזותי מסביר באופן מלא את זמני התגובה שבאיור 1F. אולם המודל הזה גם מסביר הרבה מאפייני מפתח של האופן שבו אנו מוצאים פריטים בסצנות מורכבות יותר מהחיים האמיתיים [2, 1].
אזורים שונים במוח ממלאים תפקידים שונים בחיפוש חזותי
הממצאים שתוארו לעיל מְסַפְּרִים לנו שחיפוש חזותי חייב לְעָרֵב תקשורת בין אזורי מוח שמעורבים בזיהוי הפריט (”מה זה?“) לבין אזורים שמעורבים במיקוד הקשב במיקום מסוים (”היכן זה?“) והֲסָטַת הקשב ממיקום אחד לאחר (”לאן מכאן?.“) אנו יודעים משהו על האופן שבו המוח נושא כל אחד מהחלקים האלה, אף על פי שהאופן שבו הם עובדים יחד בתהליך של חיפוש חזותי עדיין אינו מובן לגמרי.
בשנת 1993 רוברט דסימוֹן ועמיתים שלו השתמשו בחוטים ארוכים ודקים במיוחד שהוכנסו למוחותיהם של קופי מָקוֹק כדי לחקור כיצד המוח מגיב כאשר החיה מבצעת מטלה של חיפוש חזותי (איורים 2A,B). הם מצאו שחלק מתאי המוח שמגיבים אחרת תלויים באיזו משתי המטרות החיה חיפשה [3]. מאחר שמוחות של קופים ושל בני אדם דומים מאוד, אין זה מפתיע שתהליכים דומים מאוד נמצאו מאז גם במוחות של בני אדם במהלך חיפוש חזותי.
עבור משתתפים אנושיים בניסוי, מדענים אינם יכולים להכניס חוטים אל תוך המוח. הרבה ממה שאנו יודעים על האופן שבו המוח האנושי מבצע חיפוש חזותי מגיע משיטה שנקראת דימות תהודה מגנטית תפקודי (fMRI; איור 2). fMRI מודדת את הפעילות המוחית באופן עקיף באמצעות הסתכלות על שינויים בזרימת הדם במוח אשר מתרחשים כאשר התאים נעשים פעילים. הרבה מחקרי fMRI בחנו כיצד אזורי מוח מעורבים בתגובה של קשב כאשר בני אדם מבצעים חיפוש חזותי. כפי שניתן לצפּות מהמחקרים הקודמים שתיארנו, אזורים מוחיים שונים אכן מתמחים בחלקים שונים של חיפוש חזותי [4]. לדוגמה, חלק מהאזורים במוח פעילים יותר במהלך חיפוש חזותי (חיצים אדומים באיור 2D), מה שמציע שהם מתמחים בהסטת הקשב ממיקום חיפוש אחד למיקום הבא. אזורים אחרים במוח פעילים כאשר המשתתף מוצא את המטרה, מה שמציע שהאזורים האלה עשויים לסייע במיקוד הַקֶּשֶׁב על הפריט כשהמשתתף מסתכל על כיוון חיפוש אחד מסוים. עדיין נותר להבין כיצד אזורי המוח השונים האלה עובדים יחד כדי לבצע את החיפוש החזותי ואת זיהוי המטרה.
נזק באזורים מסוימים במוח יכול להקשות על החיפוש החזותי
אם אזורים מוחיים שונים מתמחים בחלקים שונים של תהליך החיפוש החזותי, כפי שתיארנו לעיל, הגיוני שכאשר אחד או יותר מהאזורים המוחיים האלה ניזוק (כתוצאה משָּׁבָץ, טראומה, גידול וכד’), חיפוש חזותי גם מושפע. זה אכן המקרה [5]. לדוגמה, מטופלים עם נזק באזורים מסוימים בחצי הימני של המוח נכשלים במציאת פריטים בחלק השמאלי של התמונה, תופעה שידועה בתור ”תסמונת הַזְנָחַת צד“ (איור 3F). הסיבה לכך היא שהחלק הימני של המוח מתעסק במידע שמגיע מהצד השמאלי של התמונה. באופן מעניין, נזק לאזורים מוחיים בצד השמאלי של המוח אינו גורם לתסמונת הזנחת צד כלל, מסיבות שנותרו ברובן בלתי ברורות.
סיכום
חיפוש חזותי הוא חלק גדול מהאופן שבו אנו רואים בעולם האמיתי. אנו מבינים לא מעט על הסיבות לכך שפריטים מסוימים בעלי עניין הם קלים יותר למציאה מאחרים. אולם הרבה נותר בלתי ידוע על האופן שבו המוח פועל במהלך חיפוש חזותי. בכל זאת, די ברור שמרבית אזורי המוח שממלאים תפקיד בראייה גם משתתפים בחיפוש חזותי, ככל הנראה מאחר שחיפוש חזותי הוא חלק גדול כל כך מראייה. לכן, נזק בחלק מאזורי המוח יכול להקשות על חיפוש חזותי. בעתיד, מחשבים שיוכלו לבצע חיפוש חזותי מוצלח – כמו אלה שיכולים לאתר דברים כגון אויבים בשדה קרב; תאים סרטניים בקרניX או סכנות פוטנציאליות בתיקים בשדות תעופה – צפויים להיות חלק גדול יותר מהחיים שלנו.
תרומת הכותבות
IN ו-AL חקרו את הנושא, השיגו את זכויות היוצרים הנדרשות וכתבו את הטקסט בהנחייתו של JH. כל הכותבים תרמו לסקירת המאמר, קראו ואישרו את הגרסה המוגשת.
מילון מונחים
חיפוש חזותי (Visual search): ↑ מטלה שמערבת סריקה פעילה של סביבה עבור מציאת פריט או מאפיין מסוים.
odd-man-out: ↑ הפריט שאינו שייך לשאר הסצנה.
קשב (Attention): ↑ תהליך של מיקוד בהיבט מסוים של מידע.
דימות תהודה מגנטית תפקודי (fMRI): ↑ functional magnetic resonance imaging. דימות תהודה מגנטית תפקודי (fMRI) - דימות אשר מודד את פעילות המוח על-ידי זיהוי שינויים בזרימת הדם.
הצהרת ניגוד אינטרסים
המחברים מצהירים כי המחקר נערך בהעדר כל קשר מסחרי או פיננסי שיכול להתפרש כניגוד אינטרסים פוטנציאלי.
תודות
IN ו-AL נתמכו על-ידי תוכנית החניכוּת לתואר ראשון של תוכנית ההשכלה החינוכית של צבא ארצות הברית. המחקר במעבדתו של JH נתמך על-ידי מענקים W911NF-11-1-0105 ו- W911NF-15-1-0311 של הצבא האמריקאי, וגם על-ידי מענקים מטעם המכונים הלאומיים לבריאות וקרן המדע הלאומית. אנו מודים ל-Heather Nall על הבדיקה הקפדנית של הטקסט.
מקורות
[1] ↑ Treisman, A. 1986. Features and objects in visual processing. Sci. Am. 255:114–25.
[2] ↑ Wolfe, J. M., and Robertson, L. C. 2012. From Perception to Consciousness: Searching With Anne Treisman. Oxford: Oxford University Press.
[3] ↑ Chelazzi, L., Miller, E. K., Duncan, J., and Desimone, R. 1993. A neural basis for visual search in inferior temporal cortex. Nature 363:345–7. doi: 10.1038/363345a0
[4] ↑ Corbetta, M., and Shulman, G. L. 2002. Control of goal-directed and stimulus-driven attention in the brain. Nature 3:201–15. doi: 10.1038/nrn755
[5] ↑ Bartolomeo, P. 2000. Inhibitory processes and spatial bias after right hemisphere damage. Neuropsychol. Rehabil. 10:511–26. doi: 10.1080/09602010050143577