Inhaltsverzeichnis

Hamburg-Wechsler-Intelligenztest für Erwachsene - Revision

Abkürzung: HAWIE-R

Vorbemerkung (Readme!)

Der HAWIE-R ist sehr veraltet. Der Dokumentationstext zum HAWIE-R steht hier nur noch aus historischen Gründen und für wissenschaftliche Vergleichszwecke. Seit 2006 gab es mit dem WIE einen Nachfolger des 1991 erschienenen HAWIE-R. Die Normen beider Tests unterscheiden sich.1) Seit 2012 gibt es auch einen Nachfolger für den WIE, die WAIS-IV. Es dürfte keinen Grund mehr geben, bei der Erstuntersuchung eines Patienten oder Probanden den alten HAWIE-R statt dem neueren WIE oder - am besten - der WAIS-IV durchzuführen. Für den Fall, dass man alte HAWIE-R-Befunde mit neueren WIE-Befunden vergleichen möchte, gibt es eine Hilfsmöglichkeit in TDB2Online: Mit den Äquivalenztabellen aus der Arbeit von Erzberger & Engel (2010) wurde in TDB2Online unter dem „Test“-Gliederungspunkt HAWIE-R in WIE-Normen eine Umrechnung programmiert. Mit dem HAWIE-R erhobene Subtestrohwerte werden in der Auswertung als Leistungs- und altersassoziierte Standardwerte auf der Basis der WIE-Normen dargestellt. Damit können alte HAWIE-R-Ergebnisse nachträglich mit WIE-Ergebnissen (etwa bei Wiederholungsmessungen beim gleichen Patienten) vergleichbar gemacht werden. Ähnliche Auswertungsbrücken zur WAIS-IV fehlen, da es keine entsprechenden Äquivalenzuntersuchungen gibt.

Hintergrund

Der Hamburg-Wechsler Intelligenztest für Erwachsene – Revision (HAWIE-R)2) ist die deutsche Ausgabe der Wechsler Adult Intelligence Scale – Revised (WAIS-R).3) Die WAIS-R erschien 1981 in USA als die dritte „Generation“ der Intelligenztestbatterie, die David Wechsler in den vierziger Jahren, damals als „Wechsler-Bellevue-Scale“, vornehmlich für klinische Zwecke zusammengestellt hat. Der deutsche HAWIE-R erschien 1991, ein korrigiertes Manual gibt es aus dem Jahr 1994.

Die Testhandbücher enthalten nur das zur Durchführung und Auswertung notwendige Material. Historische Hintergrundinformationen zu den Wechsler-Tests findet man in dem klassischen Handbuch von Matarazzo4), das es auch in einer deutschen Übersetzung gibt.5) Dieses Buch bezieht sich allerdings auf die Vorgängertests des HAWIE-R.

Neuere Literatur zur klinischen Interpretation der Intelligenztestbatterien von Wechsler für Erwachsene gibt es derzeit nur auf Englisch.6) 7) Beide beziehen sich allerdings vorwiegend auf den WAIS-III, dessen deutsche Version der WIE ist.

Zusammensetzung

Der HAWIE-R bietet mit seinen 11 Subtests einen guten Überblick über die Struktur kognitiver Leistungen, speziell auch bei kognitiv beeinträchtigten Patienten. Die Zusammensetzung der Subtests wurde im Vergleich zum Vorgängerverfahren HAWIE8) nicht verändert, lediglich innerhalb der einzelnen Subtests finden sich Veränderungen auf Itemebene. Die Normen sind allerdings erheblich anders als beim HAWIE, was - wie schon zuvor bei der Kinderversion, dem HAWIK - zu diversen praktischen Problemen bei der Diagnostik führte. Details dazu haben Satzger et al. 1996 berichtet.9)

Der HAWIE-R gliedert sich in einen Verbalteil mit sechs und einen Handlungsteil mit fünf Subtests. Tabelle 1 gibt eine Übersicht über die Subtests, ihre Zuordnung zu den Testteilen, die im deutschen Handbuch übliche Abkürzung, den Rangplatz bei der Testdurchführung und den möglichen Rohwertebereich.

Tabelle 1: Subtests des HAWIE

Testteil Subtest Abkürzung Abfolge Rohwertbereich
Verbalteil: Allgemeines Wissen AW 1 0-24
Zahlennachsprechen ZN 3 0-28
Wortschatztest WT 5 0-32
Rechnerisches Denken RD 7 0-19
Allgemeines Verständnis AV 9 0-26
Gemeinsamkeitenfinden GF 11 0-32
Handlungsteil: Bilderergänzen BE 2 0-17
Bilderordnen BO 4 0-56
Mosaiktest MT 6 0-51
Figurenlegen FL 8 0-41
Zahlen-Symbol-Test ZS 10 0-93


Testmaterial

Für die Durchführung des HAWIE-R benötigt man den kompletten Testsatz, der neben dem Handbuch und einer Erstaustattung an Protokollbögen und Aufgabenheften auch das Testmaterial für die praktischen Subtests enthält. Seit 2006 ist das Testmaterial nicht mehr im Handel.

Das Copyright für den HAWIE-R liegt beim Verlag Hans Huber in Bern.

Testdurchführung

Alle Intelligenztestbatterien von Wechsler sind Individualtests. Das Testmaterial ist vielseitig und hält durch seinen Abwechslungsreichtum die meist eher mäßige Motivation klinischer Testpersonen so gut es geht aufrecht, dazu trägt auch die individuelle Durchführung mit nur einem Patienten bei.

Die Durchführung ist im Testhandbuch gut und ausführlich beschrieben. Sie ist schwieriger als bei vielen anderen Leistungstests und muss gelernt und geübt werden. Die verbalen Tests werden zum Beispiel frei beantwortet. Das ist gut für den Probanden, bedeutet aber für die Testleiter/innen, dass die Antwort mit Beispielantworten im Handbuch verglichen und bewertet werden muss. Dabei muss man auch wissen, in welchen Fällen man nachfragen muss. Es reicht nicht, wenn man später liest, dass man bei einer bestimmten Antwort hätte nachfragen müssen, um zu einer klaren Bewertung zu kommen.

Die Durchführung des kompletten HAWIE-R dauert bei psychiatrischen Patienten meistens rund 90 Minuten. Dazu kommt die Auswertungszeit, die stark von der Erfahrung der Testleiterin abhängt.

Testrohwerte

Die 11 Subtests des HAWIE-R liefern Rohpunkte von unterschiedlicher Herkunft. Für die Subtests Allgemeines Wissen (AW), Zahlennachsprechen (ZN), Wortschatztest (WT), Allgemeines Verständnis (AV) und Gemeinsamkeitenfinden (GF) des Verbalteils und die Subtests Bilderergänzen (BE) und Zahlen-Symbol-Test (ZS) des Handlungsteils stellen die Rohpunkte eine Summe der richtigen Lösungen dar, wobei bei AV und GF alle Antworten nach dem Grad ihrer Angemessenheit und Vollständigkeit mit einem oder zwei Punkten gewertet werden. Im Gegensatz dazu (und auch im Gegensatz zu den meisten anderen Tests) setzen sich die Rohpunkte bei dem Subtest Rechnerisches Denken (RD) des Verbalteils und bei den Subtests Bilderordnen (BO), Mosaik-Test (MT) und Figurenlegen (FL) des Handlungsteils für jedes Item aus bis zu neun Grundpunkten für eine richtige Lösung und aus bis zu drei zusätzlichen Zeitpunkten für die Geschwindigkeit der Lösung zusammen. Das führt dazu, das die Rohpunktverteilungen dieser Subtests – vor allem im unteren Bereich – an manchen Stellen gar nicht besetzt sind und an anderen stark springen. Die Maxima der Rohwerte variieren zwischen den Subtests von 17 (BE) bis zu 93 (ZS), die Minima liegen übereinstimmend bei 0.

Wertpunkttransformation

Schon wegen der unterschiedlichen Punktzahl, aber auch wegen der Abweichungen der Rohwertverteilungen von einer Normalverteilung wurden die Rohwerte schon seit der ersten Generation der Wechsler'schen Intelligenztests an Hand von Tabellen in sogenannte Wertpunkte umgewandelt. Wertpunkte sind beim HAWIE-R wie beim amerikanischen Original (WAIS-R) so skaliert, dass die Wertpunktverteilung junger Erwachsener zwischen 20 und 34 Jahren für jeden Subtest den Mittelwert 10 und die Standardabweichung 3 hat. Bei den Vorgängertests, nämlich der WAIS (Wechsler Adult Intelligence Scale) und deren Vorgängern im englischen Sprachbereich bzw. dem HAWIE im deutschen, waren die Wertpunkte noch so skaliert, dass die Gesamtverteilung der Eichstichprobe den Mittelwert 10 und die Standardabweichung 3 ergab. Die Lösung im HAWIE-R führt zu einer besseren Definition der Wertpunkte, ganz im Sinne der Leistungswerte in TDB2Online: Sie charakterisieren die Leistung junger gesunder Probanden auf dem Gipfelpunkt der kognitiven Leistungsfähigkeit. Der Altersbereich der Normierungsstichprobe hat darauf jetzt keinen Einfluss mehr. Altersbedingte Defizite finden sich nach beiden Seiten. Jugendliche um die 16 Jahre erreichen im Durchschnitt zum Beispiel im Wortschatztest nur 8 Wertpunkte, in den Subtests des Handlungsteils sind die Unterschiede zu Erwachsenen dagegen gering. Probanden mit einem Alter von siebzig Jahren erreichen in manchen Subtests des Handlungsteils nur eine mittlere Wertpunktleistung von vier bis sechs Wertpunkten. Vor allem letzteres beeinträchtigt die mögliche Skalierung einer schlechter Leistung bei alten Personen auf Grund der beschränkten Spannweite der Wertpunkte.

Normquellen

Für den HAWIE-R gibt es praktisch nur die im Handbuch mitgeteilten Normdaten. Das war beim HAWIE noch durchaus anders. Da wurden im Laufe der Anwendungsgeschichte des Tests für verschiedene Personengruppen Normdaten mitgeteilt, die die Ursprünglichen deutlich veränderten und ergänzten.

Aufarbeitung der Normdaten

Im Handbuch des HAWIE-R finden sich neben der üblichen, auf der Basis der 20-34-jährigen erstellten Tabelle für die Umrechnung von Roh- in Wertpunkte auch Tabellen mit den altersspezifischen Wertpunkten für jeden Subtest. Diese Tabellen enthalten die Ergebnisse einer linearisierenden Flächentransformation der Rohwerte auf die Wertpunktskala (10;3) für jede Altersklasse und jeden Subtest einzeln. Sie dienten als Grundlage für die Normwertberechnung in TDB2Online.

Die Tabellen im Handbuch geben die altersspezifischen Rohwert-Wertpunkte-Beziehungen nur ganzzahlig wieder. Es kommt einerseits vor, dass mehrere Rohwerte den selben Wertpunkt belegen. Andererseits gibt es für manche Wertpunkte kein Rohwertäquivalent. Durch eine gleitende Mittelwertbildung wurden die harten Stufen dieser Umwandlung zunächst geglättet. Dabei richtete sich die Ordnung der gleitenden Mittelwertsbildung nach der Feinheit der Rohwertskala. An den Enden der Verteilung wurden die Daten extrapoliert, damit man die Transformationsgleichung beibehalten konnte. Anschließend wurde mit einer gleitenden Mittelwertsbildung dritter Ordnung auch eine Angleichung der Daten zwischen den Altersklassen vorgenommen. Anschließend wurden die Daten für die beiden Altersgruppen 20-24 und 25-34 gemittelt. Diese Mittelwerte bildeten für jeden Subtest die Basis für die Berechnung der Leistungswerte.

Verteilungseigenschaften

Die Flächentransformation führt im Prinzip zu einer Linearisierung der Rohwerte und damit zu einer Normalverteilung. Dies war seinerzeit beim Einschluss des HAWIE-R in TDB2 nicht weiter überprüft worden.

Beim WIE, bei dem die Ausgangslage im Wesentlichen die Gleiche ist wie beim HAWIE-R wurden später einzelne Verteilungen überprüft (siehe den entsprechenden Abschnitt in der ausführlichen Testdokumentation für den WIE). Dabei wurden meistens gute Verteilungseigenschaften, manchmal aber auch bedeutendere Decken- oder Bodeneffekte gefunden. Dies könnte im Prinzip auch noch für den HAWIE-R berechnet und dargestellt werden. Angesichts der Überalterung des HAWIE-R dürfte es aber nicht mehr notwendig sein.

Linearisierung der Messskala

Eine Linearisierung der Rohwerte wird implizit über die Wertpunkttransformation vorgenommen, und zwar über diejenigen für die Altersgruppen 20-24 und 25-34, die kombiniert für die Berechnung der Leistungswerte verwendet werden.

Behandlung der Intelligenzquotienten

Wenn mehrere Subtests addiert oder gemittelt und das Ergebnis dieser Aktionen dann als neuer Messwert neu normiert wird, dann entsteht daraus eine neue Metrik, die mit derjenigen der Subtests nicht mehr kompatibel ist. Dieser Sachverhalt ist in der allgemeinen Dokumentation im Abschnitt Mehrfachstandardisierung auf unterschiedlichen Ebenen erläutert worden. Als Demonstrationsbeispiel diente dort der HAWIE-R, weshalb hier auf diesen Abschnitt verwiesen wird. Wir haben dort gesehen, dass ein Proband, der in jedem Subtest vier Wertpunkte erreicht, in den Intelligenzquotienten nicht den IQ 70 erhält, den man bei einer vergleichbaren Metrik erwarten würde (zwei Standardabweichungen unterhalb des Mittelwerts seiner Altersgruppe), sondern deutlich niedrigere Werte, und zwar 57 für den Verbal- und den Handlungs-IQ und 48 für den Gesamt-IQ. Die Änderung der Metrik hängt von der Korrelation zwischen den Subtests und der Anzahl der aggregierten Subtests ab. Beim HAWIE-R fallen die Änderungen in der Metrik wegen der niedrigen Subtestinterkorrelationen in der Normstichprobe besonders extrem aus. Dies führte beim Wechsel vom HAWIE zum HAWIE-R zu praktischen Probleme mit Wiederholungsmessungen, wie sie zuvor genau so, aber besser dokumentiert, beim Wechsel vom HAWIK zum HAWIK-R aufgefallen waren10) 11)

Wie im allgemeinen Teil der Dokumentation dargelegt und begründet, werden in TDB2Online die getrennt standardisierten Intelligenzquotienten nicht ausgewertet und nicht weiter berücksichtigt. Statt dessen geben wir für die zusammenzufassenden Bereiche schlicht deren mittlere Subtest-Leistungswerte bzw. deren altersabhängige Standardwerte an, genau mit der gleichen Metrik wie bei den Subtests auch.

Beurteilung der Normuntersuchung

Die Beschreibung der Normierungsuntersuchung ist im Handbuch zum HAWIE-R knapp gehalten. Die Stichprobenziehung folgte den Vorgaben des amerikanischen Lizenzgebers und entsprach weitgehend dem, was in USA für die WAIS-R gemacht wurde. Es wurden neun Altersbereiche zwischen 16 und 74 Jahre gebildet. In den Altersgruppen 20-24 und 25-34 wurden je 150 Männer und 150 Frauen untersucht, in allen anderen Altersbereichen jeweils 100 Männer und 100 Frauen. Innerhalb der Altersbereiche wurde im Sinne einer Quotenstichprobe eine Aufteilung auf die drei Schulbildungsgruppen Hauptschule, Realschule und Gymnasium nach einem Schlüssel angestrebt und erhalten, der dem Zensus von 1986 entsprach. In den älteren Gruppen waren daher viel mehr Hauptschüler vertreten als in den jüngeren. Die Erhebung erfolgte „in der gesamten Bundesrepublik“ (damals Westdeutschland), ohne nähere Beschreibung weiterer soziodemographischer Variablen.

Die Angemessenheit der erhaltenen Stichprobe ist schwer zu beurteilen. Es gibt keine anderen ähnlichen Untersuchungen mit dem HAWIE-R, die als Kontrolle herhalten könnten. Es gibt lediglich indirekte Evidenz aus Studien, die bei den gleichen Probanden oder Patienten zwei vergleichbare Intelligenztests vorgaben, und zwar einmal den HAWIE und den HAWIE-R (Satzger et al., 1996)12) und ein anderes Mal den WIE und den HAWIE-R (Erzberger & Engel, 2010)13). Der Hauptzweck beider Studien war es, ganz praktische Aussagen zur Normäquivalenz der jeweils untersuchten Verfahren zu machen. Damit ist aber als Nebeneffekt verknüpft, dass sich auch Aussagen über die Unterschiede in den Verteilungsformen der Eichuntersuchungen beider Verfahren machen lassen.

Abbildung 1: Verteilung der Gesamt-IQs der 88 Personen aus der Studie von Satzger et al. (1996) im HAWIE

Abbildung 2: Verteilung der Gesamt-IQs der 88 Personen aus der Studie von Satzger et al. (1996) im HAWIE-R

Im HAWIE-R (Abbildung 2) zeigte sich in der Untersuchung von Satzger et al. (1996) eine wesentlich breitere Streuung der Intelligenzquotienten als im HAWIE (Abbildung 1).

Abbildung 3: Streudiagramm der HAWIE- und HAWIE-R-Gesamt-IQs der 88 Personen aus der Studie von Satzger et al. (1996)

Die Abweichungen in der Verteilungsform korrespondieren mit dem anomalen Kurvenverlauf in dem Streudiagramm in Abbildung 3. Die nicht-linearen Abweichungen von der Winkelhalbierenden in der bivariaten Verteilung lassen sich gut auf die unterschiedliche Form der unimodalen Verteilungen zurückführen.

Es ist nun auf Grund dieser Daten nicht zu sagen, welche der beiden Normuntersuchungen (HAWIE oder HAWIE-R) „besser“ oder „zufälliger“ war. Die einzige Evidenz, die dafür spricht, dass eher die HAWIE-R-Normierungsstichprobe etwas anomal (leptokurtisch oder steilgipflig) ausfiel, liegt darin, dass sich in der oben erwähnten zweiten Untersuchung beim Vergleich von WIE und HAWIE-R ebenfalls die (deutlich) breitere Verteilung im HAWIE-R im Vergleich zum WIE fand (Daten bei Erzberger & Engel, 2010).14)

In diese Daten gehen allerdings auch die Skalierungseffekte für das Globalmaß Gesamt-IQ ein, die im HAWIE-R mit seinen geringen Subtestinterkorrelationen besonders stark ausfallen und deshalb ebenfalls solche Effekte erzeugen. Solange die Angemessenheit einer Normierungsstichprobe nicht durch andere Daten verlässlicher gezeigt wird, als dies im Allgemeinen der Fall ist, sind wir bestenfalls auf solche indirekten Schlüsse angewiesen, die leider nicht viel Klarheit bringen.

Leistungs- und Altersnormen der Subtests im Überblick

siehe ausführliche Testdokumentation

Leistungs- und Altersnormen der IQs

Die könnte man hier noch darstellen. Angesichts der Heterogenität der darin eingeschlossenen Subtests macht das aber keinen Sinn. Diese Globalmaße sind nur interpretierbar, wenn die Einzelmaße ziemlich gleich sind.

Literatur

1) , 13) , 14)
Erzberger, C.S. & Engel, R. R. (2010) Zur Äquivalenz der Normen des Wechsler-Intelligenztests für Erwachsene (WIE) mit denen des Hamburg-Wechsler-Intelligenztests für Erwachsene - Revision (HAWIE-R). Zeitschrift für Neuropsychologie, 21(1), 25-37
2)
Tewes, U. (Hrsg.) (1991) Hamburg-Wechsler Intelligenztest Für Erwachsene Revision 1991 (HAWIE-R). Bern: Huber
3)
Wechsler, D. (1981) Wechsler Adult Intelligence Scale - Revised (WAIS-R). New York: Psychological Corporation
4)
Matarazzo, J. D. (1972) Wechsler's Measurement and Appraisal of Adult Intelligence. 5th and enlarged Edition. Baltimore: Williams & Wilkins
5)
Matarazzo, J.D. (1982) Die Messung und Bewertung der Intelligenz Erwachsener nach Wechsler. Stuttgart: Hans Huber
6)
Tulsky, D., Saklofske, D., Chelune, G., Heaton, R. K., Ivnik, R. J., Bornstein, E. R. et al. (2003). Clinical Interpretation of the WAIS-III and WMS-III. New York: Academic Press.
7)
Kaufman, A. S. & Lichtenberger, E. O. (1999). Essentials of WAIS-III Assessment. New York: Wiley.
8)
Hardesty, A. & Lauber, H. (1956) Hamburg-Wechsler-Intelligenztest für Erwachsene (HAWIE). Bern: Huber
9) , 12)
Satzger, W., Dragon, E. & Engel, R. R. (1996) Zur Normenäquivalenz von HAWIE-R und HAWIE. Diagnostika, 43(2), 119-138
10)
Eggert, D., Liman, E. & Schirmacher, A. (1984) Vergleich des Hamburg-Wechsler-Intelligenztest für Kinder (HAWIK) mit der revidierten Version (HAWIK-R) bei sprachbehinderten Kindern. Zeitschrift für Heilpädagogik, 35, 54-58
11)
Ryan, J. J., Nowak, T. J., & Geisser, M. E. (1987) On the comparability of the WAIS and WAIS-R: Review of the research and implications for clinical practice. Journal of Psychoeducational Assessment, 5, 15-30.