Forschungsfrage

In dieser Arbeit soll die Frage beantwortet werden, ob Redewendungen eine geringere Fixationsanzahl aufweisen, da sie ab einem bestimmten Punkt erkannt werden und ob das auf eine Parallelverarbeitung hinweist. Verglichen werden die Sprichwörter mit Sätzen, die eine ähnliche syntaktische Form aufweisen, aber nicht vorhersehbar sind. Es handelt sich insgesamt um 40 Sätze, die von den Probanden gelesen werden sollen. Diese erscheinen in willkürlicher Reihenfolge, um dem Problem entgegenzuwirken, dass sich die Testpersonen auf die darauffolgenden Sätze gedanklich vorbereiten können. Ziel dabei ist es zu ermitteln, ob die Vorhersagbarkeit der zu lesenden Äußerungen tatsächlich eine Auswirkung auf die Fixationsanzahl und dementsprechend die Sakkadenlänge hat. Der Grund für diese Art des Experimentes ist eine eventuelle Parallelverarbeitung der Informationen während dem Lesen festzustellen, die nicht nur durch eine geringere Fixationszahl zu vermuten wäre, sondern ebenfalls durch eine erhöhte Dauer der Fixationen. Bei einer Falsifizierung der Forschungsfrage wäre von einer seriellen Verarbeitung auszugehen wahrscheinlicher. Eine parallele Verarbeitung würde bedeuten, dass unser Gehirn anstatt jedes Wort für sich allein zu verarbeiten, eine Vorverarbeitung stattfindet, indem Informationen, die in unserem inneren parafovealen Sichtbereich liegen, neben dem fovealen Areal, ebenfalls verwertet werden. Dieses Gebiet unseres Sichtbereichs würde also parallel zum eigentlich fixierten Areal verarbeitet werden (vgl. Conklin 2018). Daraus ergeben sich folgende Hypothesen:  

  1. Je geringer die Fixationszahlen der Sprichwörter im Vergleich zu den normalen Sätzen, desto besser werden die Redewendungen erkannt.
  2. Je mehr sich die Fixationszahlen der Sprichwörter den normalen Sätzen annähern, desto geringer ist der Unterschied der Verarbeitung zwischen den beiden Testgruppen.
  3. Wenn bei den Sprichwörtern die Fixationszahlen geringer und die Fixationsdauer höher, dann Hinweis auf eine Parallelverarbeitung.
  4. Wenn bei den Sprichwörtern keine geringeren Fixationszahlen und keine höhere Fixationsdauer, dann Hinweis auf serielle Verarbeitung.

 
Um eine empirische Erhebung zu gewährleisten, wurde den Probanden zuvor ein Datenblatt vorgelegt, welches das Alter, den akademischen Grad und die Nutzung einer Sehhilfe abfragt. Bei Sehhilfen besteht dabei die Auswahl zwischen keine Sehhilfe, Brille, weichen Kontaktlinsen und harten Kontaktlinsen, da das Eyetrackermodell Eyelink Portable Duo Schwierigkeiten mit harten Kontaktlinsen haben kann. Des Weiteren wird darauf hingewiesen, dass keine Leseschwäche bei der Testperson vorliegen darf. Auch das Einverständnis Videoaufnahmen der Augenbewegungen zu tätigen und diese weiterzuverarbeiten und zu speichern zu dürfen wird eingeholt. Ebenfalls die Möglichkeit, dass Experiment bei Unwohlsein abbrechen zu können, wird erwähnt.
Im Operationalisierungsvorgang ergeben sich die Variablen Vorhersagbarkeit und Fixationen. Dabei sind die Indikatoren für Vorhersagbarkeit die Bekanntheit der Sätze im allgemeinen deutschen Sprachgebrauch und die Indikatoren für Fixationen die Ähnlichkeit zu den Nicht-Sprichwörtern. Die Merkmalsausprägungen sind bei der ersten Variable bekannt oder nicht bekannt und für die zweite gleich viele Fixationen im Vergleich zu den unbekannten Sätzen oder mehr oder weniger Fixationen (vgl. Empirischer Forschungsprozess: Ablauf und Beispiel 2022).

Testsetup

Getestet wurden insgesamt sechs Personen, von denen vier weiblichen und zwei männlichen Geschlechts waren. Alle Probanden hatten keine Leseschwäche, waren Muttersprachler und befanden sich im Alter zwischen 16 und 26. Des Weiteren war der niedrigste Bildungsabschluss die Mittlere Reife und der Höchste der B.A.. Zwei der Testpersonen trugen eine Brille, eine Person weiche Kontaktlinsen und drei der Probanden keine Sehhilfe. Keiner der Getesteten trug harte Kontaktlinsen. Gemessen wurden in allen Fällen beide Augen mit einer Sampling Rate von 500Hz in Kombination mit einer Klammer-Kinnstütze. Getrackt wurde das Auge durch die Cornea-Reflexion und alle Probanden waren innerhalb des optimalen Kamera-Augen-Abstands von 42-62cm. Es wurde eine mobile Setup Verkabelung genutzt, d.h. es gab einen Display PC, auf dem die Beispielsätze ausgegeben wurden und einen Laptop Host PC, auf dem unter anderem die Kalibrierung und Validierung gesteuert wurden, welche mit einem LAN-Kabel miteinander verbunden waren. Zusätzlich waren beide PCs an die Stromversorgung angeschlossen. Der EyeLink Portable Duo wurde auf dem Display PC positioniert und mit zwei USB 3.0 Ports am Laptop Host PC angeschlossen. Der Display PC wurde Mittig zwischen zuvor angebrachten Markierungen eines Tisches positioniert und der Host PC auf einem separaten Schreibtisch. Ein Vorhang trennte die beiden Plätze. Dieser sorgte dafür, dass der Tisch mit dem Eyetracker zusätzlich verdunkelt werden konnte, da sich um eine Ecke seitens des Host PCs ein Fenster befand. Die Klammer-Kinnstütze wurde wiederum Mittig des Display PCs positioniert (Frank a) 2023). Ein in der Höhe verstellbarer Stuhl sorgte dafür, dass alle Probanden unabhängig ihrer Größe eine gerade Sitzposition einnehmen konnten, ohne dass die Kinnstütze in ihrer Höhe verstellt werden musste. Vor der Testung unterschrieben alle Testpersonen ein Datenblatt, indem Forschungsrelevante Fragen gestellt wurden und die Einwilligung die Daten weiterverarbeiten zu dürfen abgefragt wurde. Bei der Testung lief soweit alles nach Plan, nur die Validierung sorgte bei drei Personen für Probleme. Jedoch glückte sie letztendlich.

Forschungsdesign

Die Parallelverarbeitung spielt in vielen Wissenschaften eine Rolle, beispielsweise in der Psychologie oder Neurologie. Auch in den Sprachwissenschaften findet diese ihren Platz, da sie besonders beim Lesen eine Rolle spielen könnte. So stellt sich die Frage, wie bereits schon erwähnt, ob das Gehirn Wörter seriell oder parallel verarbeitet. Es gab bereits schon Experimente, die durch Eyetracking versuchten, das zu untersuchen. Jedoch konnte ich in meiner Recherche bisher kein deutschsprachiges Eyetracking-Experiment mit diesem Forschungsgegenstand finden, was mich zu meiner Forschungsfrage motivierte. Die Beantwortung dieser Frage ist deshalb relevant, da sie uns hilft den Prozess des Lesens zu verstehen (vgl. Conklin 2018). Es handelt sich hierbei um eine quantitative Forschung, welche durch ein Experiment durchgeführt und durch eine statistische Analyse ausgewertet wird. Um eine Parallelverarbeitung nachzuweisen ist es jedoch nötig nicht nur die Fixationen zu betrachten, sondern ebenfalls deren Länge, da eine längere Fixierungsdauer auf eben diese hinweist.
Getestet werden sechs Personen, bei einer Sampling Rate von 500Hz mithilfe einer Klammer-Kinnstütze. Es sollen beide Augen betrachtet werden, falls das nicht möglich sein sollte, wird das Auge untersucht, welches vom Eyetracker besser erfasst werden kann. Die Anzahl von sechs Personen ist leider nicht ausreichend für eine statistisch relevante Studie, jedoch ist im Rahmen des Kurses keine größere Untersuchung umsetzbar. Trotz dessen ist es auch möglich mit einer kleineren Stichprobe eine Schlussfolgerung für diese Arbeit zu ziehen. Gemessen werden die einzelnen Fixationen.
Eine Auswertung findet im Anschluss über das Tool Dataviewer statt. Dabei werden alle Daten zusammen in einer .xls Datei gespeichert. Beachtet bei der Auswertung werden unter anderem die ID des Satzes, der Trial-Index, der Beginn der aktuellen Fixation, das Ende der aktuellen Fixation, die insgesamte Dauer der aktuellen Fixation usw. Diese Datei wird daraufhin weiterverarbeitet, indem diese in R eingespeist und nicht relevante bzw. überflüssige Informationen durch ein R-Skript entfernt werden. Darauf folgt die Erstellung aussagekräftiger Graphiken, die das Ergebnis des Experiments darstellen sollen. Abschließend wird das Resultat interpretiert, diskutiert und ein Fazit gezogen (vgl. Günther 2021).

Auswertung und Diskussion

library(data.table)
## Warning: Paket 'data.table' wurde unter R Version 4.1.3 erstellt
csv_data <- fread("Report Gesamt Bearbeitung.csv", header = TRUE)

str(csv_data)
## Classes 'data.table' and 'data.frame':   2378 obs. of  13 variables:
##  $ RECORDING_SESSION_LABEL     : chr  "Andreas" "Andreas" "Andreas" "Andreas" ...
##  $ TRIAL_INDEX                 : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ id                          : int  16 16 16 16 16 16 16 16 16 16 ...
##  $ sätze                      : chr  "Pech im Spiel, Glück in der Liebe." "Pech im Spiel, Glück in der Liebe." "Pech im Spiel, Glück in der Liebe." "Pech im Spiel, Glück in der Liebe." ...
##  $ CURRENT_FIX_END             : int  222 340 712 972 1342 1536 1896 2530 2698 2982 ...
##  $ CURRENT_FIX_DURATION        : int  220 66 350 238 354 170 340 606 146 266 ...
##  $ CURRENT_FIX_INTEREST_AREAS  : chr  "[ 6]" "[ 2]" "[ 1]" "[ 3]" ...
##  $ CURRENT_FIX_INTEREST_AREA_ID: chr  "6" "2" "1" "3" ...
##  $ CURRENT_FIX_START           : int  4 276 364 736 990 1368 1558 1926 2554 2718 ...
##  $ CURRENT_FIX_LABEL           : chr  "Fixation: 4 ms" "Fixation: 276 ms" "Fixation: 364 ms" "Fixation: 736 ms" ...
##  $ CURRENT_FIX_RUN_DWELL_TIME  : chr  "220" "66" "350" "238" ...
##  $ CURRENT_FIX_RUN_SIZE        : chr  "1" "1" "1" "1" ...
##  $ SATZNUMMER                  : int  1 1 1 1 1 1 1 1 1 1 ...
##  - attr(*, ".internal.selfref")=<externalptr>
csv_data <- csv_data[, c("CURRENT_FIX_INTEREST_AREAS",
                         "sätze"):=NULL]

csv_data <- csv_data[, (c( "CURRENT_FIX_INTEREST_AREA_ID")) 
             := lapply(.SD, as.integer), 
             .SDcols =  c("CURRENT_FIX_INTEREST_AREA_ID")]
## Warning in lapply(.SD, as.integer): NAs durch Umwandlung erzeugt
csv_data <- csv_data[!is.na(CURRENT_FIX_INTEREST_AREA_ID)]

library(dplyr)
## Warning: Paket 'dplyr' wurde unter R Version 4.1.3 erstellt
## 
## Attache Paket: 'dplyr'
## Die folgenden Objekte sind maskiert von 'package:data.table':
## 
##     between, first, last
## Die folgenden Objekte sind maskiert von 'package:stats':
## 
##     filter, lag
## Die folgenden Objekte sind maskiert von 'package:base':
## 
##     intersect, setdiff, setequal, union
csv_data <- csv_data %>% arrange(SATZNUMMER)

csv_data.group <- csv_data[, .(satz = SATZNUMMER[1],
                       id = id[1],
                       total_duration = sum(CURRENT_FIX_DURATION),
                       first_duration = CURRENT_FIX_DURATION[1]),
                   by=c("RECORDING_SESSION_LABEL", "TRIAL_INDEX", 
                        "CURRENT_FIX_INTEREST_AREA_ID", "SATZNUMMER")]


csv_data.blended <- csv_data.group[, .(
     total_duration = mean(total_duration),
     first_duration = mean(first_duration),
     num_seen = sum(!is.na(satz))
   ),
   by=c("SATZNUMMER")]

setorder(csv_data.blended, cols = "SATZNUMMER")
csv_data.blended <- csv_data.blended[, PRIMARY := as.factor(.I)]

sprichwörter <- subset(csv_data.blended, SATZNUMMER < 21)
nicht_sprichwörter <- subset(csv_data.blended, SATZNUMMER > 20)
library(ggplot2)
## Warning: Paket 'ggplot2' wurde unter R Version 4.1.3 erstellt
ggplot(sprichwörter, aes(x = PRIMARY, y = num_seen, fill=total_duration)) +
  scale_fill_gradient(low = "#B0E2FF", high = "#00008B") +
  geom_bar(stat = "identity") +
  scale_x_discrete(labels=paste(sprichwörter$SATZNUMMER, sep = "_")) +
  theme_bw() +
  labs(title="Fixationsanzahl bei Sprichwörtern", 
       x="Sätze", 
       y="Fixationsanzahl", 
       fill="Fixationsdauer in ms") +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1),
        plot.title = element_text(hjust = 0.5)) 

ggplot(nicht_sprichwörter, aes(x = PRIMARY, y = num_seen, fill=total_duration)) +
  scale_fill_gradient(low = "#B0E2FF", high = "#00008B") +
  geom_bar(stat = "identity") +
  scale_x_discrete(labels=paste(nicht_sprichwörter$SATZNUMMER, sep = "_")) +
  theme_bw() +
  labs(title="Fixationsanzahl bei Nicht-Sprichwörtern", 
       x="Sätze", 
       y="Fixationsanzahl", 
       fill="Fixationsdauer in ms") +
  theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1),
        plot.title = element_text(hjust = 0.5)) 

In der zuerst oben abgebildeten Graphik ist der erste Balken das Äquivalent zum ersten Balken der zweiten Graphik. Das gilt jeweils auch für alle anderen Balken. Es ist zu beobachten, dass in fast allen Fällen die Sprichwörter eine geringere Fixationszahl aufweisen. Ein Grund für die zwei Fälle mit einer gleichen Fixationszahl bei den Sätzen 4/24 und 17/37 könnte sein, dass einem oder mehreren der Probanden, die Redewendungen weniger bekannt waren. Des Weiteren ist zu beobachten, dass die vorhersehbaren Sprichwörter eine höhere Fixationsdauer aufweisen, was wiederum durch eine Parallelverarbeitung bedingt sein könnte, da das Gehirn neben der fixierten Satzstelle ebenfalls die darauffolgende Information verarbeitet und das einen längeren Prozess darstellt. Die Differenz zwischen den beiden Testdaten befindet sich bei 1-6 mehr Fixationen bei Nicht-Sprichwörtern.
Der Test mit sechs Probanden, lässt eine Tendenz erkennen, welche die anfängliche These unterstützt. Es wäre deshalb ratsam das Experiment auf eine größere Probandengruppe anzuwenden, da nur so eine valide und gültige Aussage gemacht werden kann. Ebenfalls könnte der Test mit einer größeren Datenbank an Sprichwörtern ausgeweitet werden und bei einer Reproduzierung sollten ebenfalls ältere Personen miteinbezogen werden, da in der vorliegenden Untersuchung nur Probanden zwischen 16-26 Jahren getestet wurden. Die Einbeziehung Älterer könnte auch zu interessanten Testergebnissen führen, da es wahrscheinlich ist, dass diese einen größeren Bezug zu Sprichwörtern haben als die hier getesteten jüngeren Personen.

Fazit

Aufgrund der vorhandenen Daten, lässt sich tatsächlich vermuten, dass der Leser mehr Informationen überspringt, da er den Satz erkennt. Ebenfalls die zum Teil deutlich erhöhte Fixationsdauer bei den Redewendungen, wie auch die geringeren Fixationen, deuten auf eine Parallelverarbeitung hin. Daraus folgt, dass je geringer die Fixationszahlen im Vergleich zu den Nicht-Sprichwörtern waren, desto besser die Sprichwörter erkannt wurden. Und ebenso folgt daraus, dass aufgrund der geringeren Fixationszahlen und höheren Fixationsdauer bei den Redewendungen von einer Parallelverarbeitung auszugehen ist. Somit konnte die Forschungsfrage in diesem Fall validiert werden, jedoch ist eine Ausweitung des Experiments ratsam.

Bibliographie