Wortschatztest WST

Dies ist eine alte Version des Dokuments!

Abkürzung: WST

Autoren: Schmidt & Metzler, 1972¹⁾

Cave: Hier ist nicht die deutsche Version der Mill Hill Vocabulary Scale von Bulheller & Ibrahimovic gemeint,²⁾ die gelegentlich auch als „Wortschatztest (WST)“ erscheint.

Wortschatztests erfassen die kristallisierte verbale Intelligenz. Im Allgemeinen sind Wortschatztests diejenigen Verfahren, die innerhalb einer Testbatterie am höchsten mit dem Gesamtergebnis korrelieren. Damit erfassen sie einen relativ hohen Anteil des Generalfaktors g der Intelligenz. Sie sind deshalb immer dann sehr beliebt, wenn es darum geht, die Intelligenz eines Erwachsenen relativ schnell abzuschätzen.

Man kann zwei Varianten unterscheiden, nämlich solche, die den aktiven Wortschatz messen (ein Beispiel ist der Wortschatztest in den Wechsler-Batterien (z.B. dem WIE),³⁾ der das Erklären eines Wortes fordert) und solche, die das Wiedererkennen eines Wortes innerhalb einer Reihe von „Nicht-Wörtern“ verlangen und damit den Wortschatz passiv prüfen. Beispiele für die zweite Art sind der MWT-B⁴⁾ und der Wortschatztest WST.⁵⁾

Die passiven Wortschatztests haben den Vorteil, dass sie weniger auf ein intaktes Gedächtnis angewiesen sind. Das passive Unterscheiden, ob einem ein Wort als bekannt oder nicht bekannt vorkommt, stellt weit weniger Ansprüche an das Gedächtnis als die Erklärung eines Wortes mit anderen Worten. Insofern sind passive Wortschatztests die Verfahren der Wahl, wenn es um die Abschätzung der prämorbiden kristallisierten Intelligenz bei Personen mit Verdacht auf eine dementielle Erkrankung geht.

Der WST⁶⁾ ist ein Wortschatztest, den der Proband selbständig schriftlich ausfüllt. In jeder von 42 Zeilen muss man das real existierende Wort zwischen fünf Pseudowörtern erkennen und unterstreichen, Beispiel (Item aus der Testinstruktion):

Renek - Skerk - Erenk - Kern - Nerk - Lersk

Zur Durchführung braucht man das Testhandbuch, einen Antwortbogen und die Lösungsschablone zur Auswertung.

Der WST ist ein copyright-geschützter Test, die Rechte liegen bei der Beltz-Test-GmbH, die heute zu Hogrefe gehört. Er ist über die Testzentralen in Deutschland oder der Schweiz zu beziehen.

Die meisten Probanden bewältigen den Test in 5 Minuten, ein Zeitlimit gibt es nicht.

In der Originalinstruktion wird den Probanden gesagt, sie sollen nur dann antworten, wenn sie ein richtiges Wort erkannt haben, also nicht raten. Der Originaltext lautet:

Wenn Sie ein Wort als richtig erkannt haben, streichen Sie das Wort bitte durch. Es wird nicht gefordert, dass Sie eine Definition des Wortes geben sollen. Wir bitten Sie aber nicht zu raten! Sollten Sie in einer Zeile keines der Wörter kennen, streichen Sie also nichts durch.

Diese Instruktion ist bei den selbstunsicheren Patienten, die in einem klinischen Kontext sehr häufig anzutreffen sind, etwas problematisch. Bei sehr Intelligenten spielt es kaum eine Rolle, weil der geratene Teil der Items da klein ist. Bei den weniger Intelligenten kann diese Instruktiona aber dazu führen, dass Patienten mit Manien oder Persönlichkeitsstörungen immer ein paar IQ-Punkte mehr kriegen als selbstunsichere und depressive Patienten, weil die einen eben trotzdem raten und die anderen sich an die Instruktion halten. Das will man nicht wirklich. Eigentlich ist diese Instruktion deshalb in der Klinik nicht sinnvoll. Allerdings ist der Test mit dieser Instruktion normiert, auch wenn man nicht weiß, wie viele Personen in der Eichstichprobe sich tatsächlich an die Instruktion gehalten haben…

Es gibt nur einen Rohwert, die Summe der richtig beantworteten Items. Die Items des WST sind Rasch-skaliert. Das hat zwei praktische Konsequenzen: Zum einen ist der Rohwert damit eine Statistik, die das Testergebnis erschöpfend zusammenfasst. Zum zweiten gibt es für die möglichen Testrohwerte 0 und 42 keine Skalierungswerte.

Mit der Rasch-Skalierung der Items ist eine Normalisierung verbunden. Aus der Normtabelle im WST-Manual lässt sich die Rohwertverteilung der Eichstichprobe rückrechnen, die in Abbildung 1 gezeigt wird.

Abbildung 1: Rückgerechnete Verteilung der Rohwerte in der WST-Eichstichprobe

Man sieht eine unimodale Verteilung ohne Boden- und ohne größere Deckeneffekte, allerdings stark rechtsgipflig. Man kann daraus ableiten, dass die Sensitivität und Messgenauigkeit des WST im unteren Intelligenzbereich deutlich höher sein wird als im oberen, weiter unten wird das deutlicher.

Mit der Rasch-Skalierung ist die Normalisierung der Skala verbunden.

Nach unserem Wissen gibt es lediglich die im Testmanual publizierte Normierungsuntersuchung. Sie wurde von den Testautoren an einer Stichprobe von 300 weiblichen und 273 männlichen Personen, alle deutsche Muttersprachler, im Alter zwischen 16 und 90 Jahren durchgeführt. Es handelte sich um Patienten in allgemeinmedizinischen und Zahnarztpraxen sowie um Krankenhausbeschäftigte. Die Absicht hinter dieser Auswahl war es, von den Variablen Schulbildung oder Intelligenz weitgehend unabhängig zu bleiben. Eine reine Zufallsstichprobe war den Autoren damals nicht möglich.

Die Altersverteilung der Stichprobe ist im Manual angegeben. In den Altersklassen 16-19, 20-29, 30-39, 40-49 und 50-59 wurden zwischen 8 und 14 Personen pro Jahrgang untersucht, in den höheren Altersstufen waren es deutlich weniger (zwischen 60 und 69 noch rund drei pro Jahr, zwischen 70 und 90 nur ein bis zwei). Der Altersmittelwert lag bei 40 Jahren (SD 15,5). Nach Angaben der Autoren stehen die Berufsbildungsklassen, die ebenfalls im Handbuch tabelliert sind, in Übereinstimmung mit der Klassifikation des Statistischen Bundesamtes von 1990.

Leider gibt es keine Aufschlüsselung der Normen für verschiedene Altersklassen. Die Autoren begründen das damit, dass es keinen signifikanten Einfluss des Alters auf die Testwerte gab. Das ist in diesem Fall allerdings ein eher formalistisches Argument. Die Korrelation der Fähigkeitswerte, die in einem linearen Verhältnis zu den z-Werten und damit den IQs stehen, zum Alter betrug r=.08. Bei 573 Personen ist das mit einem p von 0,056 auf dem 5-Prozent-Niveau gerade nicht mehr signifikant. Da die Korrelation positiv ist, wird man wie bei den Wortschatztests im WIE oder HAWIE-R eine kurvilineare Beziehung vermuten müssen, mit einem Anstieg der Leistung in den ersten drei oder vier Dekaden der Stichprobe und einem Abfall danach. Durch die schwächer besetzten alten Jahrgänge dürfte das in einer niedrigen positiven Korrelation resultieren. Schade, dass sich der Alterseinfluss im WST mangels Normdaten nicht abbilden lässt.

Für den Einschluss des WST in TDB2Online heißt das, dass abweichend von dem üblichen Verfahren die Leistungswerte nicht auf einer separaten Gruppe junger Erwachsener basieren, sondern mangels weiterer Differenzierung auf der gesamten Eichstichprobe. Altersadäquate Ergebnisse lassen sich damit leider nicht berechnen. Wir trösten uns damit, dass bei den Wortschatztests, und insbesondere bei den passiven wie dem WST, der Alterseinfluss immerhin viel geringer ist als bei anderen Fähigkeiten.

Abbildung 2 zeigt die Leistungsnormen für den WST. Da es keine Altersdifferenzierung in der Eichstichprobe gibt, fallen die Altersnormen mit den Leistungsnormen zusammen.

Abbildung 2: Roh- und Leistungswerte für den WST

Bemerkenswert ist die stark unterschiedliche Differenzierungsfähigkeit des WST im unteren und oberen Intelligenzbereich: Zwischen den Leistungswerten 70 und 85 liegen 15 Rohpunkte, zwischen 115 und 130 nur vier, selbst zwischen 100 und 115 nur fünf. Der WST ist also ein Verfahren, das sehr gut und vergleichsweise präzise in der unteren Hälfte der Intelligenz misst, nicht aber in der Oberen. Das muss kein Nachteil sein, weil der Test ohnehin vorwiegend bei alten oder sehr alten Menschen zur Abschätzung der prämorbiden Intelligenz verwendet wird. Von klinischer Relevanz ist dabei vor allem die Differenzierung im unteren Leistungsbereich, die der Test gut kann.

Hier könnte man zunächst die Ergebnisse der Vergleichsuntersuchung von Satzger und al. 2002 bringen⁷⁾ Dort wurde allerdings nicht auf die unterschiedliche Metrik von Einzeltests und Globalwerten Rücksicht genommen, das könnte man noch mal separat untersuchen.

Es gibt auch ein Linking zwischen dem HAWIE-R-Wortschatztest und dem WST, das scheint allerdings noch von 2006 zu sein und wenn ich das richtig sehe, noch nicht zusammengefasst ??. Danach gibt es eine recht gute Korresponenz zwischen beiden Tests bei unseren Patienten mit einer konstanten Abweichung: der WST liefert einen IQ, der etwa um 5 Punkte höher ist als derjenige, der sich aus dem HAWIE-R-Wortschatztest alleine ergäbe. Diese Daten beruhen immerhin auf 810 Patienten und die Korrelation zwischen beiden Verfahren beträgt r=.78. Diejenige mit dem gesamten Verbal-IQ ist geringer (r=.73).

Wir müssten aus den letzten Jahren auch noch neuere Daten von WIE und WST haben, muss ich raussuchen. (Habe ich gerade nachgesehen, sind nur knapp 50 Personen).

Mache ich später.

¹⁾ , ⁵⁾ , ⁶⁾

Schmidt, K.-H. & Metzler, P. (1992). Wortschatztest. WST. Testmappe. Weinheim: Beltz.

²⁾

Ibrahimovic, N. & Bulheller, S. (2005) Wortschatztest - Aktiv und passiv. Deutschsprachige Version des Mill-Hill Vocabulary Tests. Frankfurt: Pearson Assessment & Information GmbH

³⁾

von Aster, M., Neubauer, A., & Horn, R. (2006). Wechsler Intelligenztest für Erwachsene WIE. Manual. Übersetzung und Adaptation der WAIS-III von David Wechsler. Frankfurt/M.: Pearson Assessment & Information GmbH.

⁴⁾

Lehrl, S. (1977). Mehrfachwahl-Wortschatz-Intelligenztest MWT-B. Erlangen: Straube.

⁷⁾

Satzger, W., Fessmann, H. & Engel, R.R. (2002). Liefern HAWIE-R, WST und MWT-B vergleichbare IQ-Werte? Zeitschrift fuer Differentielle und Diagnostische Psychologie, 23 (2), 159-170.

Melden Sie sich an, um einen Kommentar zu erstellen.