Wissenschaftliches Denken und das Rasch Modell
Theorie
Review
Simulationen
Diskussion
| Peter A. Edelsbrunner
| ETH Zuerich, Lehr- und Lernforschung
| &
| Fabian Dablander
| Eberhard Karls Universitaet Tuebingen, Kognitionswissenschaften
Theorie
Review
Simulationen
Diskussion
Theorie
Review
Simulationen
Diskussion
Prozesse fuer intentionale Wissenssuche und die Koordination von Theorie und Evidenz (Mayer et al., 2014).
Naturwissenschaftliche Fragen formulieren, Hypothesen generieren, Untersuchungen planen, Daten analysieren/Schlussfolgerungen ziehen (Mayer, 2007).
Langfristiges Interesse an Entwicklung, Erlernen, Erhebung.
Variablenkontrolle (Piaget & Inhelder, 1958)
Theorie-Evidenz Koordination; beyond CVS (Sodian, Zaitchick, & Carey, 1991; Kuhn, Ramsey, & Arvidsson, 2015; Kuhn, 2007; Kuhn et al., 2008; Kuhn & Pease, 2008)
Reviews (Zimmerman, 2000, 2007)
Langfristiges Interesse an Entwicklung, Erlernen, Erhebung.
Training: Review (Ross, 1988)
Training: Transfer (Chen & Klahr, 1999)
Training: Umfassend (Kuhn, Ramsey, & Arvidsson, 2015)
Langfristiges Interesse an Lernen, Entwicklung, Erhebung.
Seit 75 Jahren (Blair, 1940)
Zwei Wellen der Testentwicklung (Opitz, Fischer, & Heene, submitted)
Theorie
Review
Simulationen
Diskussion
Item Response Theorie
Mathematische/statistische Modellierung
Wahrscheinlichkeit von Antworten vorhergesagt durch Eigenschaften von Personen und Aufgaben
\(p(x_{pi})=\frac{exp(x_{pi}(\theta_p-\sigma_i))}\)
Personenfaehigkeit \(\theta_p\), Aufgabenschwierigkeit \(\sigma_i\)
\(p(x_{pi})=\frac{exp(x_{pi}(\theta_p-\sigma_i))}\)
Personenfaehigkeit \(\theta_p\), Aufgabenschwierigkeit \(\sigma_i\)
Klassische Testtheorie: Axiomatisch
Probabilistische Testtheorie: Parametrisiert
\(p(x_{pi})=\frac{exp(x_{pi}(\theta_p-\sigma_i))}\)
Personenfaehigkeit \(\theta_p\), Aufgabenschwierigkeit \(\sigma_i\)
Suffiziente Statistiken
Spezifische Objektivitaet
Invariante Messung
\(p(x_{pi})=\frac{exp(x_{pi}(\theta_p-\sigma_i))}\)
Personenfaehigkeit \(\theta_p\), Aufgabenschwierigkeit \(\sigma_i\)
Eindimensionalitaet
Lokale (stochastsche) Unabhaengigkeit
Homogene Aufgaben-Trennschaerfen
Starkes Modell, starke Annahmen.

Verschiedene Schulen der Rasch Modellierung.
Praktiken in der Anwendung des Rasch Modells.
Praktiken in der Interpretation des Rasch Modells.
Theorie
Review
Simulationen
Diskussion
Review: Opitz, Fischer, & Heene (eingereicht): 7 Quellen
| Referenz | Infit | Kriterium | Reliabilitaet | lrt | irem | mat | Software |
|---|---|---|---|---|---|---|---|
| Mayer at al. (2014) | x | - | EAP/PV | - | - | - | ConQuest |
| Koerber et al. (2014) | x | 0.85-1.15 (-) | EAP/PV | - | x | x | ConQuest |
| Hartmann et al. (2015) | x | - | EAP/PV | - | x | x | ConQuest |
| Nowak et al. (2013) | x | 0.8-1.2 (Adams, 2002) | EAP/PV | x | x | x | ConQuest |
| Grube (2010) | x | 0.8-1.2 (Adams, 2000) | EAP/PV | x | x | x | ConQuest |
| Heene (2007) | x | 0.8-1.2 (Wright, 2000) | PSR/ISR | - | x | - | ConQuest, WS, FC, WM |
| Brown et al. (2010) | x | - | PSR | - | - | - | ConQuest |
\[ \begin{equation} INFIT_i = \frac{\sum^n_{p=1}R^2_{pi}}{\sum^n_{p=1}VAR(X_{pi})} \end{equation} \]
- Grad der Abweichung von Item-Scores gegeben Rasch Modell
Rasch Schule
Stark empfohlen (Wu, Wilson, Wang, Boone,...)
Item infit statistiken sind generell eine passende Art das Rasch Modell zu ueberpruefen.
IRT Schule
Stark kritisiert (Christensen & Kreiner, 2013; Heene et al., 2014; Smith, 1995; Smith, 1996; Smith et al., 1998)
Item infit statistiken sind generell keine passende Art das Rasch Modell zu ueberpruefen.
Theorie
Review
Simulationen
Diskussion

Theorie
Review
Simulationen
Diskussion

Theorie
Review
Simulationen
Diskussion
Theorie
Review
Simulationen
Diskussion
| Referenz | Theoretische Modelle | Gefittete Modelle | Bester fit | Reliabilitaet | Itemfit |
|---|---|---|---|---|---|
| Mayer at al. (2014) | 4D | 1D | na | 1D | 1D |
| Koerber et al. (2014) | 1D, 5D | 1D | na | 1D | 1D |
| Hartmann et al. (2015) | 1D | 1D | na | 1D | 1D |
| Nowak et al. (2013) | 1D, 3D | 1D, 3D | 3D | 1D | 1D |
| Grube (2010) | 4D | 1D, 4D | 4D | 1D | 1D |
| Heene (2007) | 1D | 1D | na | 1D | 1D |
| Brown et al. (2010) | 1D | 1D | na | 1D | 1D |
Theorie
Review
Simulationen
Diskussion
Person Item Map vs. seitenweise Hypothesentests (Linacre, 2010)
Forscher wenden Praktiken der Nuetzlichkeits-Schule an. Potentielle Gruende?
Die IRT Schule (Andrich, 2004; Engelhard, 2013; Linacre, 2010).
Messmodelle ueberpruefen Messung.
Rasch ist eines unter vielen IRT Modellen.
Rasch ist nicht ideal type.
Modell muss Daten fitten.
Die Rasch Schule (Andrich, 2004; Engelhard, 2013; Linacre, 2010).
Nuetzlichkeit.
Rasch ist Messung.
Rasch ist naturwissenschaftliche Messung.
Rasch ist ideal type.
Rasch ist nicht IRT.
Rasch ist fundamental measurement.
Rasch ist ein Instrument zur Erstellung von Intervallskalen.
Daten muessen Modell fitten.
Unterschiedliche Auffassungen, inkompatible Paradigmen (Andrich, 2004).
Educational Testing vs. Psychological Theorizing.
Educational Testing: Rasch perspektive (utility).
Psychological Theorizing: IRT perspektive (hypothesis testing).
Educational Testing for Psychological Theorizing: Auswirkungen.
Informationsverlust.
Ergebnisse.
Theorie
Review
Simulationen
Diskussion
Exkurs: Mehrdimensionalitaet.
Essentielle Eindimensionalitaet (Stout, 1987, 1990, 1991).
Vermeidung von Theorieablehnung (Heene, 2011).
Theorie schlaegt Daten und Tests (cf. Fiedler, 2015).
Rasch needs to be battle-tested.
Use R.

Theoretische Foschung.
Aufarbeitung der Rasch-Schulen.
Theorieuebertragung auf Kompetenzmessung.
Erarbeitung Modellierungsframeworks.
Rasch vs. IRT. IRT vs. Faktorenanalyse. Wachstumsmodell vs. Mehrebenenmodell. Mehrebenenmodell vs. feste Effekte. Hypothesentestung vs. Effektschaetzung (p-Werte vs. Konfidenzintervalle). Credibility intervals vs. Bayes Faktoren. frequentistische vs. bayesianische Statistik. Itemebene vs. Parceling. Within- vs. between- Mehrdimensionalitaet. Alpha- vs. Betafehler.
Andrich (2004). Controversy and the Rasch model.
Heene (2011). An old problem with a new solution.
Stout, W. F. (1987). A nonparametric approach for assessing latent trait unidimensionality. Psychometrika, 52,589-617.
Stout, W. F. (1990). A new item response theory modelling approach and applications to unidimensionality assessment and ability estimation. Psychometrika, 55, 293-325.
Stout, W. F., Nandakumar, R., Junker, B., Chang, H. H., & Steidinger, D. (1991). DIMTEST and TESTSIM [Computer program]. Champaign: University of Illinois, Department of Statistics. Andrich (2004).
"a discrete quantitative difference need not be caused by a quantitative factor at all, let alone one that is a continuous quantity." (Michell, 2013)
Einfaches Modell mit versteckten Tuecken