EM Q&A
Eye movement patterns
閱讀中文篇章的凝視軌跡
→閱讀時的眼動基本特性
本實驗室主要研究中文閱讀過程中的詞彙處理和眼動控制機制。藉由記錄受試者閱讀句子或文章時的眼球運動,事後算出多項眼動指標,依照詞彙特性或當下的眼動狀態分析這些變項對眼動指標是否有影響、及影響的時間點。除了能在相對自然的情境下研究「閱讀」歷程外,亦可了解閱讀過程中,語言處理和眼動控制(在一個詞上要停多久、要移往何處等等)互動的關係。
2. 眼球運動的研究能讓我們瞭解什麼?What can eye movement study tell us?
由於視網膜上的感光細胞在中央小窩(fovea)的密度最高,使得眼睛凝視的地方能看得最清楚(即視覺敏銳度visual acuity最好),離眼睛凝視位置越遠就看得越不清楚,因此人們在生活中─例如:閱讀、尋找物體(在超市中找尋要買的東西或在人群中找尋朋友)、看圖片、辨識人臉等等─需要時常移動眼睛才能收集到閱讀或尋找物體等工作所需要的訊息。因此,研究者可以透過記錄和分析眼球運動的資料來了解人們在進行這些工作時的認知處理歷程。例如:眼睛在某一目標位置(一個字詞、人臉的眼鼻等部位、冰箱中的牛奶瓶等)停留的次數和時間可能反應出這個目標物或位置的重要性或難易程度。
2.1研究眼球運動的優點
探討閱讀中詞彙辨識歷程的研究方法很多,但在眼動實驗中,可以在相對自然的情境下研究閱讀歷程,而且眼動指標相當多樣化,可以反應不同的處理歷程。
在傳統的行為實驗中,通常將一個單字或單詞單獨地呈現在螢幕上(通常是正中央;或當要探討兩大腦半球的功能是否不同時,會將文字材料呈現在中央偏左或偏右的地方),受試者要將這個字詞盡快地唸出來(唸名,naming)、進行字/詞彙判斷作業(lexical decision task,實驗中會有一半的材料不是詞如「花增」或不是字─可能增減一個筆劃或偏旁放在不對的地方或任意組合兩個偏旁,另一半的材料則是真的字詞)、判斷這個字詞是否屬於某個語意類別(如動物類)、判斷依序呈現或同時呈現的兩個字詞是否同音等等。
從這些行為實驗的結果,已使我們對詞彙辨識歷程有很多了解,那麼研究眼球運動能讓我們有更多的了解嗎?首先,前述的作業都只有一個字詞單獨呈現,對研究「閱讀」歷程而言相當不自然,還要對這個單獨呈現的字詞做判斷或額外的作業(唸名)。反之,在眼動實驗中,受試者閱讀出現在螢幕上的句子或文章,通常只需要回答些理解題,較接近自然的閱讀情境,也不需要進行閱讀理解以外的判斷。另外,相較於以紙筆測驗來進行閱讀研究時,通常只能記錄讀一篇文章所需要的時間和理解程度,由於眼動儀持續記錄受試者閱讀文句時的眼球運動,可經由分析(7)得到字詞上的凝視次數、時間、位置等細部資訊,進行眼動實驗可以取得更豐富的資料。
3. 閱讀過程中眼球運動的特色(一)
和直覺不同的是,閱讀過程中的眼球運動並非連續的掃視,而是短而快速的眼跳(saccade)和相對靜止的凝視(fixation)交替組成。眼跳的距離平均而言是2.5個中文字(在英文的研究中顯示,眼跳距離平均為7個字母,而此眼跳距離和字體大小以及螢幕和眼睛的距離無關,但此結論不適用於極端的字體大小和視距)、眼跳的時間約在10到30毫秒之間(1毫秒等於千分之一秒)。凝視時間平均為250毫秒,但隨著文字特性和難易度會有變異,在”凝視”期間,眼睛還是會有些微的移動,主要的原因是若眼睛固定不動,視網膜上的感光細胞會反應疲乏而看不見東西。通常可藉由移動的速率來界定凝視期間的些微移動和真正的眼跳。
Eye-tracking System
眼動紀錄儀器設備
→如何紀錄眼球運動?
市面上有多種眼球追蹤儀(eye tracker,簡稱眼動儀),它們各自有不同的記錄眼動的原理。本實驗室使用的眼球追蹤儀是以小型攝影機偵測瞳孔的位置,依照可設定的取樣頻率(例如500Hz,即每秒取樣500次),每隔一段時間(例如2毫秒)記錄一次眼睛當下的位置。這種video-based eye tracker,有些是將攝影機固定在桌上或架子上,有些則是透過特製的帽子將攝影機固定在受試者的眼睛前方,不過,攝影機都不會接觸到眼睛。
4.1如何知道眼睛在看哪裡?為何要做校正(calibration)?
閱讀的眼動實驗中會呈現文章或句子請受試者閱讀,但研究者如何知道受試者某一時間點在看哪個字詞呢?眼球追蹤儀的記錄就像一般的攝影機,它可以記錄眼睛(瞳孔)的影像的移動,但要知道眼睛當下凝視何處就必須透過校正。通常的做法是在螢幕上的正中間、上下左右、左上左下、右上右下等九宮格的位置會隨機出現一個圓圈當作凝視點,受試者必須保持凝視在出現的圓圈上,藉由要求受試者凝視在已知的位置上,對應到攝影機拍攝到的影像,可產生一計算公式,接著在記錄眼動時即可計算出受試者在每個時間點凝視位置對應到螢幕上的確切位置。如果只有單行文字呈現在螢幕的中間,而非多行呈現,亦可做左中右的三點校正,但此時只能取得x方向的確切位置。
做完校正後通常還要做一次驗證(validation),這時,受試者仍需凝視著螢幕上隨機出現的圓圈,此時機器會根據校正時所產生的計算公式計算眼睛該在的位置(預測值),再和實際取得的眼睛位置(觀察值)做比較,如果兩者的差異在預設的範圍內(例如0.4度視角或一個字母大小)則可接受校正的結果,如果差異太大,則需要重做校正。通常若受試者能配合保持凝視在圓圈上不移動的話,校正都很容易達成。
4.2 眼動實驗的儀器配置
眼動實驗需要兩台電腦,一台電腦負責呈現實驗刺激材料(句子、文章、或圖片),另一台電腦連接到眼動儀負責記錄眼動,兩台電腦透過網路溝通。受試者坐在呈現刺激的電腦螢幕前閱讀句子或看圖片,實驗者則透過記錄眼動的電腦螢幕來監看眼球記錄的情形,並執行校正或開始記錄眼動等指令。透過兩台電腦的連接,眼動儀所記錄的眼動實況可即時(約有10毫秒上下的時間差)傳到呈現刺激的電腦,可依據眼睛的位置或狀態來改變呈現的刺激(5.2眼動誘發呈現技術);每一個句子呈現的開始和結束也可傳送到記錄眼動的電腦做為事後分析的標記。
4.3眼動實驗雙眼都記錄嗎?那雙眼的資料如何分析?若只記錄單眼,為什麼?
有些眼動儀只有拍攝單眼的攝影機。有些眼動儀本身配有兩個攝影機,各自拍攝左右眼的移動狀況,但是如前所述,眼動的資料是每隔一段時間就記錄一次眼睛的位置,取樣頻率為500Hz的話,一秒就有500個資料點,一個「半小時」的實驗累積下來資料量可觀,所以通常即使有兩個攝影機,還是只會記錄單眼,因為正常人雙眼注視的位置即使有些微的差異,換算成字詞的位置後這個差異不大,並且只記錄單眼可以減半資料量。有些實驗室會記錄右眼,有些實驗室會記錄優勢眼(即打靶或穿針線時會睜開的那隻眼睛),記錄哪隻眼睛並沒有定論。
但是從生理上的研究發現,眼球移動(眼跳saccade)時,往鼻側移動的眼睛速度較慢,往外側移動的眼睛速度較快,因此眼跳之後,雙眼間有些微的差距,這個差距和眼跳的距離成正相關,在閱讀中這個差距大概是一個字母以內,在凝視之後雙眼會向彼此接近(converge),故雙眼的差距(fixational disparity)會隨著時間而有變化,在閱讀研究社群裡,這樣細微的動態變化是近一兩年來新興的研究議題,主要是以往研究者假設雙眼凝視的位置是一致的,但這個現象是否會對閱讀研究的方法造成影響還有待研究。不過,雙眼資料的分析並不容易,兩眼被判定為凝視開始的時間點有時會略為不同,有時候一眼有一較長的凝視,而另一眼會被判定為有兩個較短的凝視。另外,對於校正的程序也沒有定論,有的實驗室認為應該雙眼分開校正,即先校正一眼(遮蓋另一眼)之後再換另一眼,有的實驗室認為雙眼同時校正較自然也較合理,有較生理取向的實驗室證實兩種校正方法結果相同,然而這兩種校正方法在閱讀研究裡的結果是否相同正在研究中。因此,除非是研究雙眼的議題,通常只記錄單眼。
4.4 頭動或身體動對實驗有影響嗎?
有些眼動儀會受頭動或身體動的影響(校正時是正對著螢幕,頭平移或轉動之後,經由校正時所計算的公式換算出來的眼睛位置就會有誤差),所以會使用下巴架或bite-bar來讓受試者盡量不要移動。有些眼動儀配備偵測和校正頭動的攝影機,例如將攝影機架設在特製帽子上的眼動儀可增加一攝影機,並在受試者面前的螢幕角落上貼上定位點,例如四個角落各貼一個,若受試者直視螢幕,則四個定位點的影像會呈現一個規則的長方形,若受試平移或轉動頭,定位點的影像位置會跟著移動或變形(梯形),機器可根據定位點影像的變化把頭動對眼動影像的影響校正回來,但仍不宜有大幅的移動。
4.5 一般的實驗程序
剛開始會跟受試者解釋實驗程序,進行數題練習讓受試者熟悉實驗情境。在開始正式實驗時會先做校正和校正的驗證,然後開始閱讀的部分。句子或文章開始之前會再有一個凝視點,除了提醒受試者注意之外,也可讓實驗者確認眼睛凝視的準確度,如果偏移凝視點太遠則必須重做校正。在凝視點之後,句子會呈現,受試者則以自己習慣的速率閱讀,閱讀完畢或理解了句子之後,由受試者按鍵結束句子的呈現,接著就是下一題的凝視點,偶爾在句子消失之後會出現理解題,受試者要按鍵或口頭回答,再接著下一題。實驗進行到一段落會讓受試者休息,休息過後通常會再做校正。在實驗進行中也會每隔一段時間做校正。
5.1實驗材料
實驗材料為單行的句子,或文章(可單行呈現,讀完一行再換頁,或呈現多行在一頁中,視文章長度而定,一篇文章可能有多頁)。假設討論的問題是詞彙辨識,且想探討一個詞彙常見與否(即詞頻)是否會影響閱讀歷程和眼球運動,例如常見的詞處理地較快,所以凝視時間較短等。一種做法是挑選n個常見的詞和n個不常見的詞,以這2n個詞造句或找2n個句子裡面分別包含這2n個詞,即一個句子裡面有一個實驗者挑選好的詞,這種事後要分析的對象稱為目標詞。另一種做法則是先不預設目標詞,即文句中的每一個詞彙都可以是要分析的目標詞,事後再依據它們的特性分成幾類(如常見/不常見)做比較。
5.2 正常閱讀
呈現句子或文章讓受試者閱讀,通常會夾雜著理解題,以確認受試者有認真閱讀。
文句裡的詞彙有各種不同的特性,例如:
‧ 字的複雜度(「龍」相較於「牛」)、
‧ 詞頻(常用常見的詞如「國家」相對於少用少見的詞如「月蝕」)、
‧ 詞類(動詞、名詞等等)、
‧ 鄰項個數(neighborhood size,即跟目標詞有同一個字的詞的個數,例如以「國」為首的雙字詞有95個,相較於以「勢」為首的雙字詞只有5個。在詞彙處理歷程中,和目標詞有同一個字的詞越多,可能對目標詞越熟悉,使得目標詞較容易處理,也可能越難從眾多的鄰項中正確選出目標詞,而使目標詞不易處理)、
‧ 文句的前後文對某一詞彙的可預測性(同樣是「掌印」這個詞,在「被打了一巴掌,他臉上留下紅紅的掌印到現在還清楚可見」這個句子中讀了前文之後較能預期「掌印」的出現,但在「幼稚園的第一堂美術課是用掌印完成創作,發揮想像空間」這個句子裡則不太能預期它的出現,雖然句子仍然合理)
上述的詞彙特性皆有可能影響眼動的指標(詳見6.2),例如凝視在常見的詞上的凝視時間會比較短,在文句閱讀中較有可能跳過常見的詞而不停留。除了目標詞本身的特性外,受試者在凝視目標詞之前離目標詞的距離(稱為launch distance)也可能會影響對目標詞的處理,離目標詞越遠,對目標詞的處理越少,在目標詞上的凝視時間也會越長。
實驗者可以根據文句中目標詞的詞彙特性或者在凝視目標詞前後的眼球位置、狀態等來分析資料,並可得到詞彙特性或閱讀中眼動的狀態對詞彙辨識和眼動控制的影響。
5.3 眼動誘發呈現技術(eye-movement contingent display change technique)
此技術是透過眼動儀持續記錄眼睛的位置和狀態(凝視或眼跳),再根據事先在程式中的設定,可根據當下的凝視位置來置換螢幕上呈現的刺激材料,例如可將凝視字的左右各兩個字保留,兩個字以外的字全部換成符號、極罕見的字、或不同的字,就像一個移動視窗(moving window),隨著眼睛的移動而移動,限制每次凝視所能看到的範圍(運用這些技術的目的請見6. 閱讀過程中眼球移動的特色(二))。
亦可在受試者眼睛移過某一預設的位置時置換材料,稱為邊界技術(boundary technique),這種實驗會在句子中選定一個目標字或詞,在受試者看到目標之前,先把目標換成別的材料,可以是完全無關的字詞、或同音、形似的字詞等等,待受試者眼睛跨過預設在目標左側的”邊界”(邊界是設定在實驗程式之中,不會呈現在螢幕上)時,就將目標換回正常的字詞,透過跨過邊界前後所呈現材料的不同或其相同性(同音、形似等)可了解正常閱讀當中對尚未凝視但相當接近的字詞處理的程度。
上述的移動視窗和邊界技術大多在受試者眼跳期間置換刺激,因為眼跳期間對外界訊息處理的能力較差(將眼睛比喻成照相機的話,移動中拍攝下來的影像通常是模糊不清的。此「眼跳抑制」saccadic suppression的生理機制仍是研究中的議題),所以通常不易被受試者發現,使用這些技術的實驗仍符合在接近自然閱讀的情境下研究閱讀歷程和眼動的目的。另有一種快速促發(fast priming)技術,則多半是探討凝視時不同的時間點處理到的訊息深度,例如從較表面的物理特性到較高層的語言處理(註:這不代表各種層次的處理一定是序列性的一層處理完才會進行到下一層,也有可能是部分重疊的狀況,這些都是可研究的議題),由於是探討凝視期間的處理,所以會在凝視開始後某特定的時間(例如30、60、120、180毫秒等等)置換刺激,置換刺激時所造成的閃動較容易被覺察到,但可用特別的安排降低其影響。
以上所述的三種動態的技術能探討的議題將在第6點中詳述,這些技術的優點是能”控制”呈現的刺激材料,相較於在5.2介紹的正常閱讀中,實驗者僅能被動地分析受試者主動的眼動和字詞特性的關係,多了一點主控權。兩種實驗方法(5.2和5.3)都希望在接近自然閱讀的情境下研究閱讀本身,各有其優點,也都很常用。
6.1一目十行?一次凝視之中能看到多少字詞?
如前所述(2),眼睛凝視的地方能看得最清楚,離眼睛凝視位置越遠就看得越不清楚,這些離凝視位置較遠的文字,我們雖然”看得到”,但不見得可以辨識出那是什麼字。運用前述的移動視窗技術(5.3),依照眼睛的凝視位置,呈現特定範圍內的正常文字,且取代範圍外的文字,發現中文閱讀中(由左往右讀時),平均而言若保留凝視點左側一個字、右側三個字,並將範圍外的文字換成罕見字或筆劃數接近但完全無關的字時,並不影響正常閱讀,即閱讀速率、凝視時間和眼跳距離與整行文字都正常呈現、無遮蔽的情況下無顯著差異,相對地,若把視窗縮小則顯著地減緩閱讀速率、增長凝視時間、和縮短眼跳距離,表示閱讀中每次凝視期間能處理的範圍大約是左一右三,這個範圍稱為知覺廣度(perceptual span),若遮蔽或更換此範圍內的文字會影響閱讀,若在此範圍外做更換則幾乎沒有影響。
造成一次凝視中只能處理一個範圍內的文字訊息的原因,除了視覺敏銳度(visual acuity,即凝視處看得最清楚、而遠離凝視點越遠看得越不清楚)的原因外,還有注意力分配的原因,順著閱讀方向,如由左往右讀,分配在已讀過的左側文字上的注意力資源較少,而正在凝視或尚未處理的右側文字的注意力資源較多,所以知覺廣度的不對稱性(左小右大)跟閱讀方向有關,會讀希伯來文(由右往左讀)和英文的雙語者在讀希伯來文的知覺廣度是左大右小,而在讀英文時是左小右大。另外,受試者的閱讀能力(剛學閱讀的小孩相對於對閱讀已經熟練的成人)和文章的難易程度都會影響知覺廣度的大小,閱讀能力不好或文章較難時,每次凝視所能處理的文字範圍較小。
再者,由平均的眼跳距離為2.5個字,和平均的知覺廣度為五個字(左一右三加上凝視字)的對比,以及實際眼動資料得知,眼睛的凝視位置是在上一次凝視的知覺廣度所及的範圍之內,也就是眼睛大多會停留在上一次凝視能處理的範圍之內,這表示一個字詞不只在凝視的當下被處理,可能在上一次凝視就已被處理了,這稱為週邊預視(parafoveal preview),詳見6.2,甚至離開這個字詞後的下一次凝視(即在凝視點的左側)仍會繼續處理。從移動視窗的實驗中也得知,若視窗過小阻礙了週邊預視會減緩閱讀速率等等,顯示週邊預視的重要性。若某一字詞在凝視前可被處理(即呈現正常的文字)相對於呈現不同的文字而無法預先處理,在此字詞的凝視時間,前者較短,這樣的現象稱為preview benefit。接下來的問題是兩次或多次凝視間對同一字詞取得的資訊為何?以及資訊之間如何整合。
6.2每次凝視,未直接凝視但已在知覺廣度內的週邊字詞(parafoveal character/word)的處理深度
由6.1介紹的知覺廣度的特性得知,同一個字詞可能在多次凝視中都有處理,那麼在尚未凝視(位於週邊parafovea)時到底能處理到哪個程度呢?藉由邊界技術(4.2)可讓某一目標位置在凝視之前和凝視之後呈現不同的字詞,例如,在凝視之前呈現一個和目標字同音的字,相較於呈現一個和目標字不同音的字,如果後來凝視在目標字上的凝視時間有不同的話,表示在尚未凝視(在週邊)時已處理到「音」的訊息,否則同音與否應無影響。目前的研究發現對週邊的字能處理到字形和字音的訊息,例如在週邊呈現偏旁相同的字「浴」對目標字「裕」的處理有幫助,而且形和音的幫助是獨立的,字形不像但音相同的「喻」和有相同偏旁但不同音的「俗」也會有幫助。目前週邊的語意處理還沒找到證據,例如在週邊呈現「song」對目標詞「tune」沒有幫助,反而是形似的「turc」才有幫助。
中文「詞」的層次的週邊處理請見8. 本實驗室探討的問題。
6.3知覺廣度內的每一個字詞是依序處理還是同時處理?
這是眼動研究和試圖描述閱讀過程中眼動控制的各個模型(model;主要是以西方語言的資料為基礎發展出來的)裡頗具爭議性的問題。部分研究者認為知覺廣度內的詞,必須先處理完一個詞才會開始處理下一個詞,屬於序列處理,也就是注意力會集中在一個詞n上,處理完才會移到下一個詞n+1接著才開始處理n+1,所以n+1的週邊預視是在被凝視的詞n處理完畢才開始的。另一群研究者則認為注意力資源分佈在整個知覺廣度之內,離凝視點越近的,因為視覺敏銳度越高,所以資源較多,因此凝視初期,注意力資源通常較集中在被凝視的詞上,但仍有部分的資源分布在週邊詞上,所以週邊詞也會被處理,因著知覺廣度裡面的詞的難易程度不同,詞彙處理速率也不同,注意力資源會隨著詞彙處理的狀況而有消長的情況。這一類的想法主張分散處理(distributed processing),雖然知覺廣度裡的詞並不是同時以同樣的進度做處理(極端的平行處理),但也不是一個接著一個的序列處理,即每一個詞的處理並不需要等到前一個詞處理完才能開始。 標籤內容
Eye movement analysis
眼動資料的分析
→如何分析閱讀文字的凝視次數與時間?
很可惜,目前並沒有一套商業化的分析軟體可完整地完成整個分析的程序,通常每個實驗室會自行發展各自的分析程式,原因是很多分析的方法必須因應各個實驗的特殊需求,所以不容易有一套通用的分析軟體。但分析的步驟大同小異,前置處理的程式各個眼動儀廠商通常會提供,當然也有實驗室自行發展程式來處理,但越到後段的步驟因實驗需求會有較多的差異。
7.1前置處理
眼動儀記錄的資料中有每個時間點(樣本)眼睛的位置x和y,單位是pixel,還有呈現刺激的程式送來的訊息(message),通常是句子開始呈現、結束呈現、受試者的按鍵反應等。通常眼動儀會附帶提供前置處理的程式,原理是由兩個樣本的位置差算出速度,由三個樣本算出加速度,依照設定的速度和加速度的標準,區辨出凝視和眼跳,還有大幅移動通常代表眨眼。這時的資料稱為事件(event),即凝視、眼跳、眨眼、按鍵等事件。
7.2 將物理位置(pixel)換成字詞位置
取得凝視、眼跳等事件後,眼動的資料內容變成凝視(平均位置、凝視時間)和眼跳(眼跳前、後的位置、眼跳時間)交錯,此時可根據凝視的平均位置換算成每一個字詞的位置(註一:字詞左側的空格也算在這個字詞的範圍之內;註二:若刺激材料是圖片,亦可劃出數個區域做分析),便可得出每一個目標詞是否有被凝視、凝視幾次、凝視的時間、在凝視目標詞之前的凝視位置、凝視目標詞之前後的眼跳方向等等。在計算這些指標之前,通常會把在凝視當中眨眼、眼睛移到句子範圍之外再移回來之後的情況先刪除。
(a)凝視次數
目標詞可能會被略過不停留,稱之為skipping。同一種類的目標詞中被略過不停留的比例稱為skipping rate。
同一個目標詞內可能會有多次凝視,在進入目標詞之後,在跳出目標詞之前的多次凝視,除了第一次凝視之外,稱為refixation。
在跳出目標詞之後,再度凝視目標詞,則稱為regression。(註:這個詞也會用在眼跳的方向上,逆著閱讀方向回到曾經經過的位置稱為regression或backward saccade,而順著閱讀方向到未曾讀過的位置稱為progression或forward saccade)
另一個分類稱為gaze或pass,進入目標詞到跳出目標詞之前的全部凝視稱為一個gaze。若在凝視目標詞之前,不曾到過目標詞的右邊(即不曾略過目標詞而往右讀),那麼這個gaze就稱為first-pass。其他的gaze,不管是曾經凝視過目標詞後再次凝視目標詞,或略過目標詞後再凝視目標詞,都算second-pass。
詞彙辨識的研究通常會用first-pass的指標來推論早期的歷程,而second-pass等晚期指標通常和文章脈絡的整合還有語法層次的問題比較有關。
(b)凝視時間
根據first-pass、second-pass還有凝視的次序,有不同的凝視時間計算方式,先看first-pass的部分。
Gaze duration:將在目標詞first-pass的gaze裡所有的凝視時間加總起來。
First fixation duration:在目標詞first-pass的gaze裡,不管有多少次凝視,只算第一次的凝視時間。
Single fixation duration:挑選在目標詞first-pass的gaze裡只有一次凝視的資料出來計算,此時,Gaze Duration、First Fixation Duration和Single Fixation Duration都相同。
以上的指標幾乎只用在在目標詞上有first-pass的gaze的情況下,若要用在second-pass則需標明,不過幾乎沒有研究者如此計算。
Total viewing duration:加入second-pass的部分,即不論first-pass和second-pass,將所有在目標詞上的凝視時間全部加總起來。
(c)落點位置
除了分析凝視某一目標字詞的機率外,可分析在一個字詞裡的凝視位置,限制於first-pass的第一次凝視,即第一次進入目標詞停留的位置(落點位置)。做法是選定某一類的目標詞,通常是以詞長區分,先以英文為例,假設先將五個字母的目標詞挑出來,再挑出這些目標詞有first-pass的gaze的資料,計算落在第一個字母、第二個字母、到第五個字母上的資料數,換算成比例,就可畫出一個以字母位置為x軸,凝視次數比例為y軸的圖,做完之後再挑出六個字母、七個字母等等的目標詞做同樣的整理。在英文的研究裡發現,在詞上的落點位置分布區線,在詞的中間偏左一點的地方達到最高,呈現一個偏左的倒U曲線,這個集中位置(中間偏左的位置)稱為偏好落點位置(preferred landing position,PVL),這個發現在詞與詞之間有空格格開的文字系統(西方的語言)裡面是個普遍現象,顯示在週邊預視時,已經處理到週邊詞左右側的邊界,也將週邊詞當做下一次眼跳的目標,所以有個集中的趨勢(若毫無目標,則應為隨機,因此應會得到平的曲線)。
在中文的研究裡,同樣是先以詞長分類,單字詞、雙字詞、三字詞等等。以雙字詞為例,若以一個字為單位,變成二選一的情況,似乎不易觀察到集中趨勢,所以通常會把字再細分,例如兩等分、四等分等等,再做上述的分析。本實驗室主持人的研究發現,將雙字詞切分為八等分(每個字切三等分,包括其左側的空格算一等分),其物理大小相當於一個七個字母的英文詞(包括左側的空格),仍畫出平的曲線,亦即沒有集中趨勢。其他實驗室大多也發現平的曲線,只有最近的研究發現如英文的曲線,但僅有一例。由於中文的書寫單位是字,從視覺上即可清楚的辨識出每個方塊字,但詞與詞的邊界沒有空格格開,所以「斷詞」的工作無法單憑視覺處理達成,而仰賴語言處理的成分較多。在這樣特殊的書寫系統下,閱讀者是否能在週邊處理到詞的層次,是否會運用週邊處理到的訊息來決定下一次眼跳的目標,仍是個難解的議題。
(d)Launch site
在凝視目標詞前的上一次凝視的位置稱為launch site,而距離launch distance的計算通常是由上一次凝視位置算到目標詞的詞首。在落點位置的研究裡面發現,落點位置分布曲線會隨著launch site而有變化,若launch site較遠,則落點位置分布曲線的最高點往左移,而曲線較鬆散,若launch site較近,則落點分布曲線的最高點往右移,這表示眼球運動控制並不精準,如果起點離目標較遠則不容易投中目標且會過短(undershoot),如果起點離目標太近則容易投過頭(overshoot)。在英文等研究將此現象和上述的偏好落點位置合起來解釋,在閱讀時會選定一個「詞」當做眼跳的目標,一旦決定之後,將眼睛投射到目標上的哪個位置則由launch site遠近有系統性的決定,再加上隨機的noise。
7.3統計分析
計算出在每個目標詞上的眼動指標(凝視次數、時間、位置等)之後,可以依目標詞的特性(詞頻、可預測性等)或眼動指標(launch site等)分組平均之後,做一般的變異數分析(analysis of variance, ANOVA),比較這些變項(目標詞的特性或眼動指標)對眼動指標是否有顯著的影響效果。由於目標詞都是事先精心挑選好的,如要研究詞頻的影響時,會控制好其他可能有影響的變項(詞類、字的複雜度等),在推論上可排除其他變項的干擾。
亦可將在每一個目標詞上收集的眼動指標當校標變項(criterion),以目標詞的特性或另一眼動指標當做預測變項(predictor)進行迴歸分析(regression analysis)。迴歸分析的特色是保留了預測變項的連續性(如詞頻由接近0到幾萬次),並得到校標變項(如凝視時間)如何隨預測變項的增加而變化,例如頻次每增加一單位時凝視時間如何遞減。第一段中介紹的分析方式係把目標詞分成常見組(如500次以上)和不常見組(如10以下)兩組或多組,僅能得到常見組比不常見組快幾毫秒的資訊,而失去了連續向度上的變化的關係。
迴歸分析可以運用在精心挑選目標詞的實驗結果上。但通常會運用在文句中每一個詞彙都是目標詞的情境下,這時目標詞的多個特性(如詞頻、字的複雜度、可預測性等等)都可同時研究,即多元迴歸(multiple regression),可以用統計的方式把其他會影響眼動指標的變項控制住,來分析所關心的變項(如詞頻)的貢獻,也可列出這些變項對某一眼動指標的相對影響力等等。好處是每個詞彙都納入分析,資料量變大,能同時探討的變項也變多了,並且保留每一變項的連續性。這種多元迴歸分析的結果通常可做為探索性的研究,也可以和第一段所述精心挑選目標詞的這種實驗結果互相驗證。
本實驗室主要研究中文閱讀過程中的詞彙處理和眼動控制機制。一方面收集閱讀中文時的眼動資料,探討字彙特性(字形、字音)、詞彙特性(詞頻、鄰項個數、由文章脈絡對目標詞的可預測性)對眼動指標(凝視時間等)的影響,運用眼動儀記錄自然閱讀情境下的資料,對字、詞彙處理的歷程有更深入的了解。
另一方面則由於中文書寫系統的特性,詞與詞沒有視覺上的邊界,故致力於探討「斷詞」的問題,即如何從連續的字串裡面辨識出一個個詞彙,以及詞彙處理如何影響眼球運動(例如,會把「詞」當做眼跳目標嗎?)。
其中一個問題是週邊的詞彙處理,目前本實驗室已發現,雖然沒有邊界的訊息,中文讀者可以從知覺廣度裡的字串中辨認出哪幾個字合起來可以是個詞,亦即使用邊界技術,當目標詞還沒被凝視之前,呈現一個雙字詞或由兩個字隨機組合而成的字串(假詞,pseudoword)取代目標詞,對目標詞的凝視有影響,即受試者在週邊就能區辨真詞和假詞。目前仍在研究中文閱讀者如何能在週邊取得「詞」的層次的訊息,週邊詞彙處理的深度為何?從週邊開始處理到下一次凝視之間,處理深度的變化,以及多次凝視間的整合等問題。
另一個耐人尋味的問題是眼跳目標的決定,雖然大部分的研究者發現平的落點位置分布曲線,這表示中文讀者不以詞當做眼跳的目標嗎?本實驗室主持人的研究裡發現,凝視字右側兩個字距離內的字,若屬於一個低頻詞的話,則凝視這個字的可能性較高,凝視字右側的三個字距離內,若筆劃數較多(即較複雜;筆劃數和字頻有相關,筆劃數多的字通常較低頻)的話,這個字被凝視的可能性也較高。顯示凝視在知覺廣度裡面的每個字的可能性,同時受到所屬詞頻和字的複雜度的影響,也就是字和詞都有其影響力。目前正在細部分析文章閱讀中的偏好落點位置,雖然整體看來仍是平的曲線,但仍有一些因素能影響分布的曲線,期能解開中文閱讀眼跳目標選擇的機制。