dokumentation:regensburger_wortfluessigkeitstest

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Nächste Überarbeitung
Vorhergehende Überarbeitung
dokumentation:regensburger_wortfluessigkeitstest [2021/07/31 19:54] – angelegt resdokumentation:regensburger_wortfluessigkeitstest [2023/05/24 14:36] (aktuell) – keine S-Wörter in App res
Zeile 6: Zeile 6:
 ===== Hintergrund ===== ===== Hintergrund =====
  
-Geschwindigkeitsbetonte Denkspiele sind sicher schon seit Jahrhunderten bekannt. Mit //Stadt-Land-Fluss// hat man sich auch früher schon die Langeweile vertrieben.+Geschwindigkeitsbetonte Denkspiele sind seit Jahrhunderten bekannt. Mit //Stadt-Land-Fluss// hat man sich schon früher die Langeweile vertrieben.
    
 In die Testpsychologie wurden Wortflüssigkeitsverfahren wohl zuerst von Thurstone & Thurstone im //Primary Mental Abilities Test// eingeführt((Thurstone, L.L., & Thurstone, T.G.(1962). Primary mental abilities (Rev.). Chicago: Science Research Associates.)). Statt der von den Thurstones (und dementsprechend später auch im deutschen LPS((Horn, W. (1983) L-P-S Leistungsprüfsystem. 2. Auflage. Göttingen: Hogrefe.)) ) verwendeten schriftlichen Wortflüssigkeitsprüfung beschrieb Benton etwas später((Benton, A.(1967). Problems of test construction in the field of aphasia. Cortex, 3, 32-58.)) eine mündliche Testform, die //Controlled Verbal Fluency Task (CVFT)//: Innerhalb von jeweils 60 Sekunden müssen möglichst viele Wörter mit den Anfangsbuchstaben **F**, **A** und **S** genannt werden. Aus dem "F-A-S-Test" wurde später der //Controlled Oral Word Association Test (COWA)//((Benton, A., & Hamsher, K.(1978). Multilingual Aphasia Examination manual. Iowa City: Unversity of Iowa.)) mit zwei Parallelversionen entwickelt (Buchstaben C, F und L, bzw. P, R und W). Die dabei verwendeten Buchstaben kommen etwa gleich häufig als Anfangsbuchstaben bei englischen Wörtern vor.  In die Testpsychologie wurden Wortflüssigkeitsverfahren wohl zuerst von Thurstone & Thurstone im //Primary Mental Abilities Test// eingeführt((Thurstone, L.L., & Thurstone, T.G.(1962). Primary mental abilities (Rev.). Chicago: Science Research Associates.)). Statt der von den Thurstones (und dementsprechend später auch im deutschen LPS((Horn, W. (1983) L-P-S Leistungsprüfsystem. 2. Auflage. Göttingen: Hogrefe.)) ) verwendeten schriftlichen Wortflüssigkeitsprüfung beschrieb Benton etwas später((Benton, A.(1967). Problems of test construction in the field of aphasia. Cortex, 3, 32-58.)) eine mündliche Testform, die //Controlled Verbal Fluency Task (CVFT)//: Innerhalb von jeweils 60 Sekunden müssen möglichst viele Wörter mit den Anfangsbuchstaben **F**, **A** und **S** genannt werden. Aus dem "F-A-S-Test" wurde später der //Controlled Oral Word Association Test (COWA)//((Benton, A., & Hamsher, K.(1978). Multilingual Aphasia Examination manual. Iowa City: Unversity of Iowa.)) mit zwei Parallelversionen entwickelt (Buchstaben C, F und L, bzw. P, R und W). Die dabei verwendeten Buchstaben kommen etwa gleich häufig als Anfangsbuchstaben bei englischen Wörtern vor. 
  
-Neben solchen //lexikalischen// Wortflüssigkeitsaufgaben wurden auch //semantische// konstruiert. In USA hat sich der //Set-Test//((Isaacs, B. & Kennie, A. T. (1973) The Set Test as an aid to the detection of dementia in old people. //British Journal of Psychiatry, 123,// 467-470.)) etabliert, der das schnelle Aufzählen von Farben, Tieren, Früchten und Städten fordert. Bei der Testung von dementen Personen (zum Beispiel mit CERAD oder RBANS) werden semantische Wortflüssigkeitsaufgaben auch verwendet, allerdings wird meist nur eine einzige Kategorie verlangt. +Neben solchen //lexikalischen// Wortflüssigkeitsaufgaben wurden auch //semantische// konstruiert. In USA hat sich der //Set-Test//((Isaacs, B. & Kennie, A. T. (1973) The Set Test as an aid to the detection of dementia in old people. //British Journal of Psychiatry, 123,// 467-470.)) etabliert, der das schnelle Aufzählen von Farben, Tieren, Früchten und Städten fordert. Bei der Testung von dementen Personen (zum Beispiel mit [[dokumentation:cerad-testbatterie|CERAD]] oder RBANS((Randolph, C. (1998). Repeatable Battery for the Assessment of Neuropsychological Status (RBANS). San Antonio/Texas: Psychological Corporation))) werden semantische Wortflüssigkeitsaufgaben auch verwendet, allerdings wird meist nur eine einzige Kategorie verlangt. 
  
 Im deutschen Sprachbereich wurden solche Verfahren bis circa 2000 nur ad hoc zu Forschungszwecken und ohne formale Normierung eingesetzt. Seit 2000 liegt mit dem  RWT((Aschenbrenner, A., Tucha, O. & Lange K. (2000) RWT. Regensburger Wortflüssigkeits-Test. Handanweisung. Göttingen: Hogrefe)) ein Verfahren vor, das eine Reihe von lexikalischen und semantischen Wortflüssigkeitstests enthält, die gemeinsam an einer deutschen Normstichprobe standardisiert wurden. Bei Routinetestungen sollte man dieses standardisierte Testmaterial benutzen. Im deutschen Sprachbereich wurden solche Verfahren bis circa 2000 nur ad hoc zu Forschungszwecken und ohne formale Normierung eingesetzt. Seit 2000 liegt mit dem  RWT((Aschenbrenner, A., Tucha, O. & Lange K. (2000) RWT. Regensburger Wortflüssigkeits-Test. Handanweisung. Göttingen: Hogrefe)) ein Verfahren vor, das eine Reihe von lexikalischen und semantischen Wortflüssigkeitstests enthält, die gemeinsam an einer deutschen Normstichprobe standardisiert wurden. Bei Routinetestungen sollte man dieses standardisierte Testmaterial benutzen.
Zeile 22: Zeile 22:
   * Die letzten beiden Subtests erfassen die Geschwindigkeit eines semantischen Kategorienwechsels zwischen Sportarten und Früchten und zwischen Kleidungsstücken und Blumen. Wie beim formallexikalischen Kategorienwechsel ist auch hier von einem mittelgroßen Suchraum auszugehen.   * Die letzten beiden Subtests erfassen die Geschwindigkeit eines semantischen Kategorienwechsels zwischen Sportarten und Früchten und zwischen Kleidungsstücken und Blumen. Wie beim formallexikalischen Kategorienwechsel ist auch hier von einem mittelgroßen Suchraum auszugehen.
  
-In TDB2Online sind nur fünf der 14 Subtests eingeschlossen, zwei aus dem formallexikalischen Paradigma (die Buchstaben K und S) und jeweils einer aus den anderen drei Flüssigkeitsparadigmen. Die TDB2Online-Normen sind immer dann relevant, wenn der RWT zusammen mit anderen Testverfahren angewendet wird und die Testergebnisse gemeinsam betrachtet werden sollen. Dies ist vor allem bei Erstuntersuchungen der Fall, seltener bei Wiederholungsmessungen. Bei den Erstuntersuchungen wäre es vermutlich möglich und sinnvoll, sich auf die fünf ausgewählten Subtests zu fokussieren. **Tabelle 1** zeigt die diversen Subtests im Zusammenhang. +In TDB2Online sind nur fünf der 14 Subtests eingeschlossen, zwei aus dem formallexikalischen Paradigma (die Buchstaben K und S) und jeweils einer aus den anderen drei Flüssigkeitsparadigmen. Die TDB2Online-Normen sind vor allem dann relevant, wenn der RWT zusammen mit anderen Testverfahren angewendet wird und die Testergebnisse gemeinsam betrachtet werden sollen. Dies ist typisch für Erstuntersuchungen. Bei einer Erstuntersuchung wäre es durchaus möglich und sinnvoll, sich auf die fünf ausgewählten Subtests zu beschränken. **Tabelle 1** zeigt die diversen Subtests im Zusammenhang. 
  
 **Tabelle 1: Subtests des RWT** **Tabelle 1: Subtests des RWT**
  
 ^Flüssigkeitsparadigma  ^Untertests   ^in TDB2Online  ^ ^Flüssigkeitsparadigma  ^Untertests   ^in TDB2Online  ^
-|formallexikalische Wortflüssigkeit|S-Wörter-Test|ja  |+|formallexikalische Wortflüssigkeit|S-Wörter-Test|nein  |
 | |P-Wörter-Test|nein  | | |P-Wörter-Test|nein  |
 | |M-Wörter-Test|nein  | | |M-Wörter-Test|nein  |
Zeile 42: Zeile 42:
 | |Kleidungsstücke-Blumen|ja  | | |Kleidungsstücke-Blumen|ja  |
  
-Der Subtest Tiere wird im Diskussionsteil dieser Dokumentation besprochen, weil es für diesen Subtest die größte Anzahl unabhängiger Normierungsstudien gibt und man diese durchaus über die verschiedenen Sprachen hinweg vergleichen kann. Für die lexikalischen Subtest gilt das nicht, weil deren Anfangsbuchstaben in verschiedenen Sprachen einen unterschiedlich großen Suchraum aufspannen. Am Subtest Tiere kann man deshalb ungefähr beurteilen, wie sich die Normierung des RWT in den internationalen Kontext einordnet.+Der Subtest Tiere wird im [[dokumentation:regensburger_wortfluessigkeitstest#diskussion|Diskussionsteil dieser Dokumentation]] besprochen, weil es für diesen Subtest die größte Anzahl unabhängiger Normierungsstudien gibt und man diese durchaus über verschiedene Sprachen hinweg vergleichen kann. Für die lexikalischen Subtests gilt das nicht, weil deren Anfangsbuchstaben in verschiedenen Sprachen unterschiedlich große Suchräume aufspannen. Am Subtest Tiere kann man also ungefähr beurteilen, wie sich die Normierung des RWT in den internationalen Kontext einordnet.
  
 ===== Copyright ===== ===== Copyright =====
Zeile 52: Zeile 52:
 Die normale Testdauer beträgt beim RWT zwei Minuten pro Subtest. Auch die TDB2Online-Normen gelten für zwei Minuten Testdauer. Um trotzdem die Durchführung des Tests auch mit wenig belastbaren Probanden/Patienten zu gewährleisten, wurde zusätzlich eine Normierung für die jeweils erste Minute vergenommen. Die normale Testdauer beträgt beim RWT zwei Minuten pro Subtest. Auch die TDB2Online-Normen gelten für zwei Minuten Testdauer. Um trotzdem die Durchführung des Tests auch mit wenig belastbaren Probanden/Patienten zu gewährleisten, wurde zusätzlich eine Normierung für die jeweils erste Minute vergenommen.
  
-International ist eher eine Testdauer von nur einer Minute üblich. Die Vergleichsdaten, die in der Diskussion zum Tier-Paradigma zusammengestellt wurden, beruhen deshalb nur auf Ein-Minuten-Messungen.+International ist eher eine Testdauer von einer Minute üblich. Die Vergleichsdaten, die in der Diskussion zum Tier-Paradigma zusammengestellt wurden, beruhen deshalb nur auf Ein-Minuten-Messungen.
  
 ===== Testrohwerte ===== ===== Testrohwerte =====
Zeile 60: Zeile 60:
 ===== Verteilungseigenschaften der Rohwerte ===== ===== Verteilungseigenschaften der Rohwerte =====
  
-Da alle Normen des RWT (ausschließlich) als Prozentrangnormen vorliegen, ließen sich die Verteilungen der Normstichprobe leicht rückrechnen. Dazu wurden die nach dem Alter aufgeschlüsselten Gesamtnormen verwendet. Die **Abbildungen 1 bis 5** zeigen diese rückgerechneten Verteilungen für die Subtests //K-Wörter//, //S-Wörter//, //G-R-Wörter//, //Lebensmittel// und //Kleidung-Blumen//.  +siehe ausführliche [[tests:regensburger_wortfluessigkeitstest#Verteilungseigenschaften der Rohwerte|Testdokumentation]].
- +
-{{:tests:rwt_k_rohverteilung.png}} +
- +
-**Abbildung 1: Rohwertverteilungen im Subtest //K-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe** +
- +
-\\ +
- +
-{{:tests:rwt_s_rohverteilung.png}} +
- +
-**Abbildung 2: Rohwertverteilungen im Subtest //S-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe** +
- +
-\\ +
- +
-{{:tests:rwt_g-r_rohverteilung.png}} +
- +
-**Abbildung 3: Rohwertverteilungen im Subtest //G-R-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe** +
- +
-\\ +
- +
-{{:tests:rwt_lebensmittel_rohverteilung.png}} +
- +
-**Abbildung 4: Rohwertverteilungen im Subtest //Lebensmittel// für die fünf Altersgruppen der RWT-Normstichprobe** +
- +
-\\ +
- +
-{{:tests:rwt_kleidung-blumen_rohverteilung.png}} +
- +
-**Abbildung 5: Rohwertverteilungen im Subtest //Kleider-Blumen// für die fünf Altersgruppen der RWT-Normstichprobe** +
- +
-\\ +
-Man sieht auf diesen Abbildungen zunächst einmal, dass die Verteilungen weitgehend symmetrisch und normal sind. Dies ist bei solchen verbalen Produktionstests meistens der Fall, wenn sie nur lange genug dauern. Dann liegen die Rohwerte in einem Bereich, in dem es nicht mehr zu Bodeneffekten kommt. Es ist insofern durchaus verblüffend, dass die Autoren des RWT im Handbuch dazu in einem Nebensatz schreiben, dass "die Rohwertverteilung keiner Normalverteilung entspricht((Aschenbrenner, A., Tucha, O. & Lange K. (2000) RWT. Regensburger Wortflüssigkeits-Test. Handanweisung. Göttingen: Hogrefe, S. 23 unten))". Bei vielen anderen Tests würde man sich durchaus wünschen, dass Testautoren bei der Normalitätsbeurteilung ihrer Rohwerte so kritisch sind. Hier ist es dagegen nicht notwendig: Man kann allenfalls bei der ältesten Gruppe einen gewissen Bodeneffekt feststellen, beim Subtest K noch am ehesten erkennbar. Ansonsten sind die Rohwerte des RWT so linear wie man sie gerne für alle Tests hätte. +
- +
-Man sieht auf den Abbildungen zum anderen aber auch sehr deutlich, dass es zu vielen holprigen Kurvenverläufen sowohl innerhalb einer jeden Altersgruppe als auch zwischen den Altersgruppen kommt. Dies ist bei unkorrigierten Prozentrangnormen so, wenn die Stichprobengröße nicht 4- oder 5-stellig ist. Vor allem in den Randbereichen kommt es bei den üblichen Stichprobengrößen von einigen Hundert bis wenigen Tausend regelmäßig zu gestutzten Verteilungen. Man sieht das recht gut in der jüngsten Altersgruppe beim Subtest K-Wörter. Hier bricht die Verteilung bei einem Rohwert von 13 abrupt ab, weil in dieser Stichprobe nun mal kein Proband mit niedrigeren Werten enthalten war. Bei den 42-53-Jährigen ist das anders: Da gab es einen besonders leistungsschwachen Probanden mit einem Rohwert von 5, was dann allerdings dafür sorgt, dass die Verteilungsform auch in dieser Gruppe ungewöhnlich ist. Man kann sich den Sachverhalt klar machen, wenn man die Prozentrangverteilung direkt in Standardwerte (100;15) umrechnet. Das Ergebnis ist in **Abbildung 6** dargestellt. +
- +
-{{:tests:rwt_k_roh_zu_standardwerten.png}} +
- +
-**Abbildung 6: Flächentransformierte IQ-normierte Standardwerte des Subtests //K-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe** +
- +
-\\ +
- +
-Man sieht, dass die beiden abnormen Verläufe in der Verteilungskurve sich hier als Abweichungen von der geraden Linie darstellen (durch Pfeile gekennzeichnet). Ansonsten ist die Umrechnung von Roh- in Standardwerte tatsächlich in allen Altersgruppen sehr linear.+
  
 ===== Linearisierung der Messskalen ===== ===== Linearisierung der Messskalen =====
  
-Solche Stichprobenfehler in den Prozentrangnormen des RWT müssen eigentlich korrigiert werden, weil sie im Einzelfall durchaus unerwünschte Folgen haben. Man könnte sie nun heuristisch korrigieren, indem man nur die von der Linearität abweichenden Enden der Verteilungen durch lineare Extrapolationen ersetzt. Wir haben das beispielshalber einmal für die jüngste Altersgruppe beim Subtest K-Wörter gemacht. Die **Abbildungen 7 und 8** zeigen, wie sich eine (hier gestrichelt dargestellte) lineare Extrapolation auf die Verteilungsform auswirkt. +siehe ausführliche [[tests:regensburger_wortfluessigkeitstest#Linearisierung der Messskalen|Testdokumentation]].
- +
-{{:tests:rwt_k_roh_zu_standardwerten_extrapoliert.png}} +
- +
-**Abbildung 7: Flächentransformierte IQ-normierte Standardwerte des Subtests //K-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe mit linearer Extrapolation in den Randbereichen (gestrichelt)** +
- +
-\\ +
- +
-{{:tests:rwt_k_rohverteilung_extrapoliert.png}} +
- +
-**Abbildung 8: Rohwertverteilungen im Subtest //K-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe mit linearer Extrapolation in den Randbereichen (gestrichelt)** +
- +
-\\ +
- +
-Mit dieser Methode würden sich die gröbsten Fehler am Rande sinnvoll korrigieren lassen, es blieben aber noch die diversen Unstetigkeiten im Kurvenverlauf. Außerdem ist das Verfahren etwas aufwändig. Da bei allen vier Subtests die Rohwerte doch sehr linear sind, entschieden wir uns letztlich für eine einfache  lineare Transformation der Rohwerte in Standardwerte.  +
- +
-Im RWT-Handbuch werden nun weder Mittelwerte noch Standardabweichungen der Rohwerte mitgeteilt. Für deren Schätzung wurden die aus den Prozenträngen errechneten Standardwerte (wie in **Abbildung 7**) durch ihren linearen Trend ersetzt, wobei letzterer nur durch Rohwerte geschätzt wurde, die Prozenträngen zwischen 10 und 90 entsprachen. Dieses Vorgehen verhindert, dass ein einziger sehr auffälliger Wert am Ende einer Verteilung den Trend maßgeblich beeinflussen kann. Daraus ergab sich die Umrechnung von Roh- in Standardwerte, wie sie in **Abbildung 9** beispielhaft für den Subtest K-Wörter dargestellt ist. Die Mittelwerte und Standardabweichungen der Rohwerte wurden aus den Trendgeraden geschätzt. Die daraus abgeleiteten theoretischen Rohwertverteilungen sind in **Abbildung 10** dargestellt. +
- +
-{{:tests:rwt_k_roh_zu_standardwerten_linear.png}} +
- +
-**Abbildung 9: Lineare IQ-normierte Standardwerte des Subtests //K-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe ** +
- +
-\\ +
- +
-{{:tests:rwt_k_rohverteilung_theoretisch.png}} +
- +
-**Abbildung 10: Theoretische Rohwertverteilungen im Subtest //K-Wörter// für die fünf Altersgruppen der RWT-Normstichprobe** +
- +
-\\ +
- +
-Beim Subtest G-R-Wörter zeigte eine Altersgruppe (die 42-53-Jährigen) eine erheblich geringere Streuung als die anderen Gruppen. Man sah das schon in **Abbildung 3**. Auch dies muss man als Stichprobenfehler werten, weil es keinen sinnvollen Grund dafür gibt, dass eine mittlere Altersgruppe eine deutlich geringere Standardabweichung haben soll als die beiden altersmäßig benachbarten Gruppen. Derartige Stichprobenfehler lassen sich durch die Linearisierung innerhalb einer Altersgruppe alleine nicht korrigieren. Man braucht dazu Angleichungen über die Altersgruppen hinweg. Es gibt dazu diverse heuristische (zum Beispiel((Pauker, J.D. (1988) Constructing overlapping cell tables to maximize the clinical usefulness of normative test data: Rationale and an example from neuropsychology. //Journal of Clinical Psychology, 44//, 930-933.)) ) und parametrische Verfahren (z.B. das //Inferential Norming//, das bei WISC IV und WAIS IV benutzt wurde((Wilkins, C., Rolfhus, E., Weiss, L., & Zhu, J. J. (2005) A new method for calibrating translated tests with small sample sizes. Paper presented at the 2005 annual meeting of the American Educational Research Association, Montreal, Quebec, Canada))((Zhu, J. J. & Chen, H.-Y. (2011) Utility of inferential norming with smaller sample sizes. //Journal of Psychoeducational Assessment, 29//, 570-580)) ), die allerdings etwas aufwändig sind. Wir haben uns auf die Angleichung der Mittelwerte und Standardabweichungen durch eine gleitende Mittelwertsbildung dritter Ordnung, also mit den jeweils benachbarten Altersgruppen beschränkt, die sich relativ leicht und schnell durchführen ließ. Die Randgruppen //18-29// und //über 65// blieben unverändert+
  
 ===== Normuntersuchungen ===== ===== Normuntersuchungen =====
  
-Das Testhandbuch des RWT präsentiert Normen, die - je nach Subtest - an zwischen 532 und 634 Erwachsenen erhoben wurden. Über die angezielte Stichprobe wird im Handbuch nichts gesagt. Die Stichprobe ist im Handbuch nach Alter (relativ grob in fünf Altersgruppen18-29, 30-41, 42-53, 54-65 und über 65 Jahre), Geschlecht und Schulbildung (unter 10 Jahre Schulbildung, 10 bis 12 und über 12 Jahre) aufgeschlüsselt. Die Normen wurden über die Gesamtstichprobe berechnet. Sie sind im Handbuch als reine Prozentrangnormen angegeben.+siehe ausführliche [[tests:regensburger_wortfluessigkeitstest#Normuntersuchungen|Testdokumentation]].
  
-Weitere Normuntersuchungen zu den im RWT verwendeten Anfangsbuchstaben und Messzeiten sind uns im deutschen Sprachraum nicht bekannt. Für den Bereich der lexikalischen Wortflüssigkeit lassen sich Normuntersuchungen in anderen Sprachräumen nicht verwenden, weil die Zahl von Wörtern mit einem bestimmten Anfangsbuchstaben von Sprache zu Sprache unterschiedlich ist (mehr dazu in der [[tests:regensburger_wortfluessigkeitstest#Diskussion|Diskussion]]). 
- 
-Bei der semantischen Wortflüssigkeit sieht es etwas anders aus. Hier gibt es zumindest für den Bereich "Tiere" viele Normuntersuchungen, die man - auch über Sprachen hinweg - mit dem entsprechenden Subtest des RWT vergleichen kann. Wir haben hierzu metaanalytische Berechnungen angestellt, die in der [[tests:regensburger_wortfluessigkeitstest#kategorial-semantische_subtests|Diskussion]] dargestellt sind. Sie liefern eine gute Information darüber, wie denn die RWT-Normen im Vergleich zu anderen Normen für diesen speziellen Subtest aussehen. 
- 
-Die für TDB2Online berechneten Normen beruhen mangels weiterer Daten aus anderen Quellen ausschließlich auf den im RWT-Handbuch angegebenen Daten. Wie im vorhergehenden Abschnitt dargestellt, liegen sie in TDB2Online in linearisierter und geglätteter Form vor, womit Unzulänglichkeiten der Originalnormen beseitigt wurden. 
 ===== Leistungs- und Altersnormen im Überblick ===== ===== Leistungs- und Altersnormen im Überblick =====
  
-Die Abbildungen 11 bis 15 zeigen zusammenfassend die Leistungswerte und die Altersnormengrenzen der fünf Subtests, so wie sie in TDB2Online erscheinen.  +siehe ausführliche [[tests:regensburger_wortfluessigkeitstest#Leistungs- und Altersnormen im Überblick|Testdokumentation]].
- +
-**Abbildung 11** zeigt in einer zusammengesetzten Grafik den Zusammenhang von Roh- und Leistungswerten sowie den (durchschnittlichen) Einfluss des Alters auf die Leistungen im Subtest //K-Wörter// des RWT. Auf dieser und allen folgenden Abbildungen markieren die senkrechten Striche die Leistungswerte von 40 bis 145. Auf der schwarzen waagerechten Linie sind die Rohwerte lagerichtig eingetragen. Die abwechselnd rot und blau eingezeichneten Linien enthalten die Normgrenzen für alle Altersgruppen in der Übersicht. Die fünf Markierungen auf jeder Linie stehen für die Prozentränge 2.5, 16, 50, 84 und 97.5. Jeweils eine solche Linie, nämlich die, die der Altersgruppe des Probanden entspricht, wird (in anderer Form) im TDB2Online-Profilblatt eingezeichnet, um bei der individuellen Interpretation der Testergebnisse zu helfen. Weil die Leistungswerte aus den Ergebnissen der 18-29-jährigen jungen Erwachsenen errechnet werden, liegen die 5 Markierungen der Altersgruppe 18-29 genau auf den Leistungswerten 70, 85, 100, 115 und 130.  +
- +
-{{:tests:rwt_k_altersnormen.png}} +
- +
-**Abbildung 11: Leistungswerte im Subtest //K-Wörter// mit Rohwerten und Altersnormgrenzen (siehe Text)** +
- +
-\\ +
-In den ersten drei Dekaden des Erwachsenenalters ist im Subtest //K-Wörter// nach den Normen des RWT kein Leistungsabfall zu erkennen. Erst ab 50 lässt sich ein nennenswerter Abfall erkennen, der aber selbst um die 70 herum nur eine Standardabweichung im Vergleich zu den jungen Erwachsenen beträgt. Verglichen mit Tests, die hohe Anforderungen an das Gedächtnis oder die Visomotorik stellen, ist das eher wenig. +
- +
-**Abbildung 12** zeigt den Zusammenhang von Roh- und Leistungswerten sowie den (durchschnittlichen) Einfluss des Alters auf die Leistungen im Subtest //S-Wörter// des RWT. +
- +
-{{:tests:rwt_s_altersnormen.png}} +
- +
-**Abbildung 12: Leistungswerte im Subtest //S-Wörter// mit Rohwerten und Altersnormgrenzen (siehe Text)** +
- +
-\\ +
- +
-Obwohl der Suchraum bei den S-Wörtern im Deutschen etwa doppelt so groß ist wie bei den K-Wörtern, liegen die mittleren Rohwerte in der Standardisierungsstichprobe sehr eng beieinander. Auf die Abhängigkeit der Normwerte vom Suchraum wird in der Diskussion noch näher eingegangen. +
- +
-**Abbildung 13** zeigt den Zusammenhang von Roh- und Leistungswerten sowie den (durchschnittlichen) Einfluss des Alters auf die Leistungen im Subtest //G-R-Wörter// des RWT. +
- +
-{{:tests:rwt_g-r_altersnormen.png}} +
- +
-**Abbildung 13: Leistungswerte im Subtest //G-R-Wörter// mit Rohwerten und Altersnormgrenzen (siehe Text)** +
- +
-\\ +
-Es ist erstaunlich, wie gut die jüngeren Probanden im Durchschnitt mit der zusätzlichen Belastung durch das Alternieren des Anfangsbuchstabens zurecht kommen. Die durchschnittliche Leistungsmenge über 2 Minuten liegt in den Subtests //K-Wörter// und //G-R-Wörter// praktisch gleichauf bei rund 25 Wörtern in 2 Minuten. Erst im höheren Alter lässt sich ein größerer Leistungsabfall bei der alternierenden Testaufgabe feststellen. Hier wirken sich vermutlich die Flexibilitätseinbuße mehr aus. +
- +
-**Abbildung 14** zeigt den Zusammenhang von Roh- und Leistungswerten sowie den (durchschnittlichen) Einfluss des Alters auf die Leistungen im Subtest //Lebensmittel// des RWT. +
- +
-{{:tests:rwt_lebensmittel_altersnormen.png}} +
- +
-**Abbildung 14: Leistungswerte im Subtest Lebensmittel mit Rohwerten und Altersnormgrenzen (siehe Text)** +
- +
-\\ +
-Das schnelle Aufzählen von Lebensmitteln ist im Vergleich mit den beiden lexikalischen Aufgaben viel leichter, hier liegt der Mittelwert der jungen Erwachsenen bei rund 40 Wörtern in zwei Minuten.  +
- +
-**Abbildung 15** zeigt den Zusammenhang von Roh- und Leistungswerten sowie den (durchschnittlichen) Einfluss des Alters auf die Leistungen im Subtest //Kleidung-Blumen// des RWT. +
- +
-{{:tests:rwt_kleidung-blumen_altersnormen.png}} +
- +
-**Abbildung 15: Leistungswerte im Subtest Kleidung-Blumen mit Rohwerten und Altersnormgrenzen (siehe Text)** +
- +
-\\ +
-Im Subtest //Kleidung-Blumen// lässt sich ein etwas anderer Altersverlauf als beim Subtest //Lebensmittel// feststellen. Hier wird die höchste Leistung erst in späteren Altersgruppen erreicht. Möglicherweise spiegeln sich hier Interessensentwicklungen wider. Junge Leute haben sowohl mit Kleidungsstücken als auch mit Blumen vermutlich weniger Erfahrungen gesammelt als ältere+
  
 ===== Diskussion ===== ===== Diskussion =====
Zeile 200: Zeile 78:
 Die psychometrische Aufarbeitung des RWT für die graphische Präsentation in TDB2Online verlief weitestgehend problemlos, eine simple lineare Transformation erfüllte bei allen Subtests ihren Zweck, auch wenn man die dafür erforderlichen Stichprobenstatistiken erst aus den Prozentrangnormen ableiten musste. Auch der Stellenwert des Verfahrens als Test für einen bestimmten Aspekt der exekutiven Funktionen ist klar umrissen und in der neuropsychologischen Literatur weltweit gut diskutiert. Der RWT verdient also seinen Platz im Spektrum der TDB2Online-Verfahren, auch wenn angesichts der engen Zielsetzung von Wortflüssigkeitstests neuropsychologische Interpretationen von RWT-Ergebnissen inhaltlich begrenzter sind als dies bei manch anderen Tests der Fall ist und er deshalb auch wahrscheinlich seltener angewandt wird. Die psychometrische Aufarbeitung des RWT für die graphische Präsentation in TDB2Online verlief weitestgehend problemlos, eine simple lineare Transformation erfüllte bei allen Subtests ihren Zweck, auch wenn man die dafür erforderlichen Stichprobenstatistiken erst aus den Prozentrangnormen ableiten musste. Auch der Stellenwert des Verfahrens als Test für einen bestimmten Aspekt der exekutiven Funktionen ist klar umrissen und in der neuropsychologischen Literatur weltweit gut diskutiert. Der RWT verdient also seinen Platz im Spektrum der TDB2Online-Verfahren, auch wenn angesichts der engen Zielsetzung von Wortflüssigkeitstests neuropsychologische Interpretationen von RWT-Ergebnissen inhaltlich begrenzter sind als dies bei manch anderen Tests der Fall ist und er deshalb auch wahrscheinlich seltener angewandt wird.
  
-Das Hauptproblem bei dieser deutschen Version von Wortflüssigkeitstests ist - wieder einmal - die mangelnde Repräsentativität der Normierung. Aus der Beschreibung der Stichprobe lassen sich kaum Hinweise ziehen, dort wird Repräsentativität auch gar nicht erst beansprucht. Unabhängige Daten gesunder Probanden aus dem deutschen Sprachraum zu den RWT-Subtests ließen sich bis Ende 2012 nicht finden. In der deutschen [[http://de.groups.yahoo.com/group/neuropsychologie/|Neuropsychologie-Gruppe]] gab es im Februar 2004 von mehreren klinischen Anwendern Hinweise  darauf, dass der Test "zu schwer" ist und auch gesunde und normal leistungsfähige Personen Werte im unterdurchschnittlichen Bereich erhalten. +Das Hauptproblem bei dieser deutschen Version von Wortflüssigkeitstests ist - wieder einmal - die mangelnde Repräsentativität der Normierung. Aus der Beschreibung der Stichprobe lassen sich kaum Hinweise ziehen, dort wird Repräsentativität auch gar nicht erst beansprucht. Unabhängige Daten gesunder Probanden aus dem deutschen Sprachraum zu den RWT-Subtests ließen sich bis Ende 2012 nicht finden. In der ehemaligen deutschen Yahoo-Gruppe Neuropsychologie gab es im Februar 2004 von mehreren klinischen Anwendern Hinweise darauf, dass der Test "zu schwer" ist und auch gesunde und normal leistungsfähige Personen Werte im unterdurchschnittlichen Bereich erhalten. 
  
 Bei den in TDB2Online eingeschlossenen Tests versuchen wir im Allgemeinen, die Normdatenlage zu verbreitern und beziehen dazu auch internationale Quellen ein, wenn dies inhaltlich gerechtfertigt ist. Bei den Subtests des RWT ist das leider nur sehr indirekt möglich. Bei den formallexikalischen Subtests lassen sich fremdsprachliche Ergebnisse überhaupt nicht verwenden, weil die Häufigkeit von Wörtern mit bestimmten Anfangsbuchstaben je nach Sprache unterschiedlich ist. Wir haben aber versucht, die Ergebnisse von zwei anderen deutschsprachigen Publikationen mit den Ergebnissen des RWT abzugleichen. Dieser Versuch ist weiter unten dargestellt. Mit den kategorial-semantischen Subtests ist dagegen ein Vergleich über Sprachgrenzen durchaus möglich. Zumindest für die Kategorie //Tiere// gibt es international genügend Daten, die einen Vergleich ermöglichen, wenn auch nur für die Messzeit von einer Minute. Auch dies wird im Folgenden dargestellt. Bei den in TDB2Online eingeschlossenen Tests versuchen wir im Allgemeinen, die Normdatenlage zu verbreitern und beziehen dazu auch internationale Quellen ein, wenn dies inhaltlich gerechtfertigt ist. Bei den Subtests des RWT ist das leider nur sehr indirekt möglich. Bei den formallexikalischen Subtests lassen sich fremdsprachliche Ergebnisse überhaupt nicht verwenden, weil die Häufigkeit von Wörtern mit bestimmten Anfangsbuchstaben je nach Sprache unterschiedlich ist. Wir haben aber versucht, die Ergebnisse von zwei anderen deutschsprachigen Publikationen mit den Ergebnissen des RWT abzugleichen. Dieser Versuch ist weiter unten dargestellt. Mit den kategorial-semantischen Subtests ist dagegen ein Vergleich über Sprachgrenzen durchaus möglich. Zumindest für die Kategorie //Tiere// gibt es international genügend Daten, die einen Vergleich ermöglichen, wenn auch nur für die Messzeit von einer Minute. Auch dies wird im Folgenden dargestellt.
Zeile 212: Zeile 90:
 Man sieht, dass den Probanden zu den selten vorkommenden Anfangsbuchstaben M und P weniger Wörter einfallen als zu normal häufigen wie B oder K. Nach oben scheint der Zuwachs dagegen begrenzt zu sein: auch mit dem sehr häufig vorkommenden Buchstaben S fallen einem kaum mehr Wörter in einer oder auch zwei Minuten ein als mit den normal häufig vorkommenden Buchstaben B und K. Während die elexicon-Daten und die Ein-Minuten-Normen des RWT (hier für 18-29-Jährige) gut übereinstimmen, weichen die verbalen Suchraumangaben im RWT-Manuel bei den meisten Buchstaben davon ab. Lediglich beim Buchstaben S stimmen die Angaben überein. Im RWT-Manual ist nicht erwähnt, woher die Suchraumangaben stammen. Es macht große Unterschiede, ob man dazu Wörterbucheinträge (was wohl die richtige Ausgangsmenge ist) oder Fließtexte analysiert. In Fließtexten kommt zum Beispiel wegen der vielen bestimmten Artikel der Buchstabe D viel häufiger vor als in Lexika.  Man sieht, dass den Probanden zu den selten vorkommenden Anfangsbuchstaben M und P weniger Wörter einfallen als zu normal häufigen wie B oder K. Nach oben scheint der Zuwachs dagegen begrenzt zu sein: auch mit dem sehr häufig vorkommenden Buchstaben S fallen einem kaum mehr Wörter in einer oder auch zwei Minuten ein als mit den normal häufig vorkommenden Buchstaben B und K. Während die elexicon-Daten und die Ein-Minuten-Normen des RWT (hier für 18-29-Jährige) gut übereinstimmen, weichen die verbalen Suchraumangaben im RWT-Manuel bei den meisten Buchstaben davon ab. Lediglich beim Buchstaben S stimmen die Angaben überein. Im RWT-Manual ist nicht erwähnt, woher die Suchraumangaben stammen. Es macht große Unterschiede, ob man dazu Wörterbucheinträge (was wohl die richtige Ausgangsmenge ist) oder Fließtexte analysiert. In Fließtexten kommt zum Beispiel wegen der vielen bestimmten Artikel der Buchstabe D viel häufiger vor als in Lexika. 
  
-**Tabelle 2: Anzahl von Wörtern in allgemeinsprachlichen deutschen Wörterbüchern und Wortflüssigkeits-Rohwerte in Abhängigkeit vom Anfangsbuchstaben** +**Tabelle 2: Anzahl von Wörtern in allgemeinsprachlichen deutschen Wörterbüchern und mittlere Wortflüssigkeits-Rohwerte in Abhängigkeit vom Anfangsbuchstaben** 
-^ Buchstabe ^ Worthäufigkeit ^ Suchraum ^ Normdaten von Wortflüssigkeitstests ^^^^+^ Buchstabe ^ Worthäufigkeit ^ Suchraum ^ mittlere Rohwerte von Wortflüssigkeitstests ^^^^
 ^ ^ ^ ^ Dauer in s ^ RWT ^ LPS ^ LPS 50+ ^ ^ ^ ^ ^ Dauer in s ^ RWT ^ LPS ^ LPS 50+ ^
 | S | 12,0 | sehr groß | 60 | 16 | | | | S | 12,0 | sehr groß | 60 | 16 | | |
Zeile 224: Zeile 102:
 <sub>Worthäufigkeit: Prozentuale Häufigkeit von Wörtern mit diesem Anfangsbuchstaben im allgemeinsprachlichen Wörterbuch elexicon</sub>\\ <sub>Worthäufigkeit: Prozentuale Häufigkeit von Wörtern mit diesem Anfangsbuchstaben im allgemeinsprachlichen Wörterbuch elexicon</sub>\\
 <sub>Suchraum: Angabe im RWT-Manual</sub>\\ <sub>Suchraum: Angabe im RWT-Manual</sub>\\
-<sub>Normdaten von Wortflüssigkeitstests: Rohwerte</sub>\\ 
 <sub>Normierungsdatum RWT: 2000, LPS: 1962, LPS 50+: 1993</sub>\\   <sub>Normierungsdatum RWT: 2000, LPS: 1962, LPS 50+: 1993</sub>\\  
 <sub>Altersstufe RWT: 18-29 Jahre, LPS: 18-29 Jahre, LPS 50+: 50-69 Jahre</sub> <sub>Altersstufe RWT: 18-29 Jahre, LPS: 18-29 Jahre, LPS 50+: 50-69 Jahre</sub>
Zeile 267: Zeile 144:
 \\ \\
  
-In Abbildung 16 sind die Ergebnisse der 22 Studien aus Tabelle 3 graphisch dargestellt. In der Abbildung sind die meisten Studien als dünne Linien eingetragen. Fett sind nur 6 Verläufe markiert: In schwarzer Farbe die über alle Studien gemittelten Rohwerte und deren 1-Sigma-Grenzen, in blau die Normen des RWT und in gelb und magenta der Verlauf der beiden CERAD-Teilstichproben. +In Abbildung 16 sind die Ergebnisse der 22 Studien aus Tabelle 3 graphisch dargestellt. In der Abbildung sind die meisten Studien als dünne Linien eingetragen. Fett sind nur 6 Verläufe markiert: In schwarzer Farbe die über alle Studien gemittelten Rohwerte und deren 1-Sigma-Grenzen, in blau die Normen des RWT und in gelb und magenta der Verlauf der beiden CERAD-Teilstichproben (bis und über 12 Jahre Schulbildung)
  
 \\ \\
  
-{{:tests:rwt_tiere_metaanalyse.png}}+{{:dokumentation:rwt_tiere_metaanalyse.png}}
  
 **Abbildung 16: Altersverläufe der Ein-Minuten-Rohwerte für "Tiere" der Studien aus Tabelle 6 und deren metaanalytische Zusammenfassung** **Abbildung 16: Altersverläufe der Ein-Minuten-Rohwerte für "Tiere" der Studien aus Tabelle 6 und deren metaanalytische Zusammenfassung**
Zeile 277: Zeile 154:
 \\ \\
  
-Man sieht zunächst einmal, dass der Einfluss des Alters auf die semantische Wortflüssigkeit nicht so groß ist wie bei manchen anderen Funktionen. Die Differenz zwischen dem Mittelwert der jungen Erwachsenen und der 80-jährigen beträgt rund eine Standardabweichung. Bei visumotorischen Funktionen sind es regelmäßig eher zwei Standardabweichungen. Trotz der sehr heterogenen Stichproben liegen die meisten Daten der Einzelstudien auch innerhalb der Ein-Sigma-Grenzen. Als extrem gut erweist sich die CERAD-Stichprobe. Hier liegt die Teilstichprobe mit mehr als 12-jähriger Schulbildung oberhalb der Ein-Sigma-Grenze und auch die Stichprobe mit unter 12-jähriger Schulbildung liegt noch deutlich über den meisten anderen Studien in diesem Altersbereich. Die RWT-Stichprobe lässt sich in diesem Paradigma nicht pauschal bewerten: Es ist nämlich so, dass die jungen Probanden vergleichsweise sehr gut und die über 65-jährigen vergleichsweise sehr schlecht abschneiden, wenn man sie mit den Mittelwerten aller Stichproben vergleicht. Dies dürfte wohl Ausdruck einer selektiven Stichprobenziehung sein, bei der die jungen Teilstichproben eine viel höhere Bildung haben als die älteren. Teilweise muss das wegen der stets zunehmenden Bildung der Bevölkerung so sein, möglicherweise ist der Effekt aber bei der RWT-Stichprobe sehr stark ausgeprägt. +Man sieht zunächst einmal, dass der Einfluss des Alters auf die semantische Wortflüssigkeit nicht so groß ist wie bei manchen anderen Funktionen. Die Differenz zwischen dem Mittelwert der jungen Erwachsenen und der 80-jährigen beträgt rund eine Standardabweichung. Bei visumotorischen Funktionen sind es regelmäßig eher zwei Standardabweichungen. Trotz der sehr heterogenen Stichproben liegen die meisten Daten der Einzelstudien auch innerhalb der Ein-Sigma-Grenzen. Als extrem leistungsfähig erweist sich die CERAD-Stichprobe. Hier liegt die Teilstichprobe mit über 12-jähriger Schulbildung oberhalb der Ein-Sigma-Grenze und auch die Stichprobe mit bis 12-jähriger Schulbildung liegt noch deutlich über den meisten anderen Studien in diesem Altersbereich. Die RWT-Stichprobe lässt sich in diesem Paradigma nicht pauschal bewerten: Es ist nämlich so, dass die jungen Probanden vergleichsweise sehr gut und die über 65-jährigen vergleichsweise sehr schlecht abschneiden, wenn man sie mit den Mittelwerten aller Stichproben vergleicht. Dies dürfte wohl Ausdruck einer selektiven Stichprobenziehung sein, bei der die jungen Teilstichproben eine viel höhere Bildung haben als die älteren. Teilweise muss das wegen der stets zunehmenden Bildung der Bevölkerung so sein, möglicherweise ist der Effekt aber bei der RWT-Stichprobe sehr stark ausgeprägt. 
  
 Die Resultate dieser Analyse lassen sich vermutlich auf die anderen RWT-Subtests extrapolieren. Die Stichproben unterscheiden sich nicht nennenswert, das N schwankt bei den einzelnen Subtests zwischen 532 und 634, wahrscheinlich ja ohne Bezug zu den Stichprobenmerkmalen, die für die besonderen Verläufe des RWT in Abbildung 16 verantwortlich sind. Demnach sind die RWT-Normen bei den 18-39-jährigen wahrscheinlich um rund eine halbe Standardabweichung zu streng. Bei den 40-60-jährigen verringert sich diese Differenz zunehmend und bei den über 65-jährigen sind die Normen dann um eine halbe Standardabweichung zu mild. Da die TDB2Online-Normen für alle Zwei-Minuten-Subtests mangels geeigneter Daten aus anderen Quellen ausschließlich auf den RWT-Normen beruhen, gilt diese Bewertung natürlich auch für die in TDB2Online berechneten Werte. Die Resultate dieser Analyse lassen sich vermutlich auf die anderen RWT-Subtests extrapolieren. Die Stichproben unterscheiden sich nicht nennenswert, das N schwankt bei den einzelnen Subtests zwischen 532 und 634, wahrscheinlich ja ohne Bezug zu den Stichprobenmerkmalen, die für die besonderen Verläufe des RWT in Abbildung 16 verantwortlich sind. Demnach sind die RWT-Normen bei den 18-39-jährigen wahrscheinlich um rund eine halbe Standardabweichung zu streng. Bei den 40-60-jährigen verringert sich diese Differenz zunehmend und bei den über 65-jährigen sind die Normen dann um eine halbe Standardabweichung zu mild. Da die TDB2Online-Normen für alle Zwei-Minuten-Subtests mangels geeigneter Daten aus anderen Quellen ausschließlich auf den RWT-Normen beruhen, gilt diese Bewertung natürlich auch für die in TDB2Online berechneten Werte.
- 
  
 ===== Literatur ===== ===== Literatur =====
 +
 +#@VGW_ZM16_HTML@#
  • dokumentation/regensburger_wortfluessigkeitstest.1627761251.txt.gz
  • Zuletzt geändert: 2021/07/31 19:54
  • von res