dokumentation:wechsler_adult_intelligence_scale_-_fourth_edition

Dies ist eine alte Version des Dokuments!


Wechsler Adult Intelligence Scale - Fourth Edition

Abkürzung: WAIS-IV

Die Wechsler Adult Intelligence Scale - Fourth Edition (WAIS-IV) ist seit 2012 in einer deutschen Adaptation erhältlich. Dabei hat sie den englischen Titel behalten.1) Das Originalverfahren erschien 2008 in USA.2) David Wechsler, ein amerikanischer Psychologe, konstruierte Ende der 30er Jahre mit der Wechsler-Bellevue-Scale3) die erste Intelligenztestbatterie dieser Serie, die vor allem für klinische Zwecke gedacht war. Unter Einschluss der Wechsler-Bellevue-Scale stellt die WAIS-IV die fünfte Generation der Wechsler-Intelligenztestreihe dar.

Schon die Vorgänger aus der zweiten und dritten Generation der Wechsler Tests, HAWIE4) und HAWIE-R5), boten mit ihren 11 Untertests einen guten Überblick über die Struktur kognitiver Leistungen, speziell auch bei kognitiv beeinträchtigten Patienten. In der vierten Generation, dem WIE6), wurde die Zusammensetzung der Subtests erstmals stärker verändert, um den Bedürfnissen neuropsychologischer Untersuchungen besser Rechnung zu tragen. Die 14 Subtests des WIE erlaubten neben der bis dahin üblichen Aufgliederung der Testleistungen in einen Verbal- und Handlungsteil eine Aufgliederung nach neuropsychologischen Gesichtspunkten, die den Anschluss an die modernere, neuropsychologisch geprägte Forschung hinsichtlich der Struktur kognitiver Leistungen herstellte. Die WAIS-IV übernimmt im wesentlichen die Struktur des WIE und fasst die Subtestleistungen in vier Indizes (Sprachverständnis, Wahrnehmungsgebundenes logisches Denken, Arbeitsgedächtnis und Verarbeitungsgeschwindigkeit) und einem Gesamt-IQ zusammen. Die Aufgliederung in Verbal- und Handlungsteil entfällt.

Zum Testkit der deutschen Version der WAIS-IV gehören zwei Testhandbücher. Eines enthält die zur Durchführung notwendigen Anleitungen, das andere Informationen zu Grundlagen, Auswertung und Interpretation. Weitergehende anwendungsbezogene Literatur zur klinischen Interpretation der amerikanischen WAIS-IV (und damit ihrem deutschen Pendant) gibt es derzeit nur auf Englisch.7)8)9)

Tabelle 1 gibt eine Übersicht über die Subtests, ihre Zuordnung zu kognitiven Domänen, die im deutschen Handbuch übliche Abkürzung, den Rangplatz bei der Testdurchführung und den möglichen Rohwertebereich.

Tabelle 1: Domänen und Subtests der WAIS-IV in der Schreibweise des Handbuchs

Domäne Subtest Abkürzung Abfolge Rohwertbereich
Sprachverständnis (SV): Gemeinsamkeiten finden GF 2 0-36
Wortschatz-Test WT 5 0-57
Allgemeines Wissen AW 9 0-26
Allgemeines Verständnis AV (13) 0-36
Wahrnehmungsgebundenes Logisches Denken (WLD): Mosaik-Test MT 1 0-66
Matrizen-Test MZ 4 0-26
Visuelle Puzzles VP 8 0-26
Formenwaage FW (12) 0-27
Bilder ergänzen BE (15) 0-24
Arbeitsgedächtnis (AGD): Zahlen nachsprechen ZN 3 0-30
Rechnerisches Denken RD 6 0-22
Buchstaben-Zahlen-Folgen BZF (11) 0-30
Verarbeitungsgeschwindigkeit (VG): Symbol-Suche SYS 7 0-60
Zahlen-Symbol-Test ZST 10 0-135
Durchstreich-Test DT (14) 0-72


Die Subtests mit den Abfolgeplätzen 1 bis 10 werden als Kerntests bezeichnet, die mit den Rangplätzen 11 bis 15 sind optional. Bei den Kerntests ist der Subtest Visuelle Puzzles neu, bei den optionalen die Formenwaage und der Durchstreich-Test. Figurenlegen und Bilderordnen aus dem WIE sind in der WAIS-IV nicht mehr enthalten. In der WAIS-IV werden alle 15 Subtests einem Index zugeordnet, beim WIE blieben einige ohne Zuordnung. Näheres kann man erkunden, wenn man die Strukturtabelle im Abschnitt über den WIE zum Vergleich hinzuzieht.

An dieser Stelle seien einige Bemerkungen zur Benennung der Domänen und zur Schreibweise gestattet.

Wie schon beim WIE sind zwei der Domänenbezeichnungen problematisch. Aus dem „Sprachlichen Verständnis“ im WIE wurde ein „Sprachverständnis“ in der WAIS-IV. Beide Bezeichnungen sind zu eingeschränkt, weil zum Domänenbereich auch der Untertest Gemeinsamkeitenfinden gehört. Dieser verlangt eine aktive Oberbegriffproduktion, also eine Begriffsbildungsfähigkeit, die mit „Verständnis“ nicht hinreichend abgedeckt ist. In TDB2Online und im Befundbericht der TDB2Online-App wurde deshalb schon beim WIE der einerseits neutralere, andererseits aber umfassendere Begriff „Sprachliche Fähigkeiten“ verwendet. Wir behalten das auch bei der WAIS-IV bei.

Die zweite unpassende Bezeichnung war beim WIE „Wahrnehmungsorganisation“. Für eine kognitive Domäne, die vor allem etwas mit aktivem, handelndem Problemlösen zu tun hat, ist diese Bezeichnung unpassend, auch wenn sie die direkte Übersetzung der englischen Bezeichnung „Perceptual Organization“ war. In der WAIS-IV wurde die englische Bezeichnung zu „Perceptual Reasoning“ geändert und im Gleichklang damit heißt die Domäne in der deutschen Version jetzt „Wahrnehmungsgebundenes logisches Denken“. Das kommt der geprüften Fähigkeit schon näher, auch wenn „perceptual“ viel mehr beinhalten würde als die hier vorliegenden rein visuellen Stimuli. Außerdem ist die deutsche Übersetzung umständlich. Die TDB2Online-App hatte für diese Domäne beim WIE den Begriff „Visuelles Problemlösen“ verwendet und behält dies auch bei der WAIS-IV bei.

Eine kleine Abweichung ergibt sich noch bei der Domäne der Arbeitsgeschwindigkeit, die es seit WAIS-III bzw. WIE gibt. Auf Englisch heißt sie seither „Perceptual Speed“. Beim WIE wurde das einfach mit „Arbeitsgeschwindigkeit“ übersetzt. Da die „Wahrnehmungsgeschwindigkeit“ in den beiden Subtests dieser Domäne durch einfache Handlungen (Schreiben, Durchstreichen) geprüft wird, ist die Übersetzung mit „Arbeitsgeschwindigkeit“ durchaus zutreffend. Sie ist für die Leser von Testbefunden gut zu verstehen und wurde so in TDB2Online übernommen. Bei der WAIS-IV wurde daraus nun „Verarbeitungsgeschwindigkeit“. Dieser Begriff (dem im Englischen eher „processing speed“ entsprechen würde) ist im Zusammenhang mit der Geschwindigkeit von Computern sehr gebräuchlich, und hat von da seinen Eingang in die psychologische Kognitionsforschung gefunden. Allerdings würde dazu dann mehr gehören als in den beiden Subtests gemessen wird. Wir sehen deshalb keinen Grund, vom bisher verwendeten Begriff Arbeitsgeschwindigkeit abzuweichen.

Mit der Rechtschreibung der Subtestbezeichnungen haperte es bei den Wechsler-Tests auch früher schon. Es gab nie einen Grund, Wortschatz-Test statt Wortschatztest zu schreiben. Bei der WAIS-IV sind aber nun 8 von 15 Subtestnamen sowohl nach der aktuellen als auch nach früheren Rechtschreibregeln falsch geschrieben. Von Testanwendern kann man verlangen, dass sie ihre Befunde in korrekter Rechtschreibung verfassen. Es gibt keinen vernünftigen Grund, warum sie bei den Bezeichnungen der Subtests eine fehlerhafte Rechtschreibung übernehmen müssten, nur weil das Lektorat des Verlags in diesem Punkt versagt hat. Wir haben in der Tabelle 1 Subtests und Domänen so geschrieben, wie sie im Handbuch stehen (und darauf hingewiesen). Im weiteren Verlauf dieses Texts und in der TDB2Online-App bemühen wir uns um eine korrekte Schreibweise.

Für die Durchführung der WAIS-IV benötigt man den kompletten Testsatz, der neben den beiden Handbüchern und einer Erstaustattung an Protokollbögen auch Aufgabenhefte und Testmaterial enthält. Als Verbrauchsmaterial fallen laufend nur die Protokollbögen und die speziellen Aufgabenhefte für bestimmte Subtests an. Das Material ist urheberrechtlich geschützt und wird zudem nur an bestimmte Berufsgruppen ausgeliefert. Es ist über den Webstore des Verlags oder über die Testzentralen in Deutschland oder der Schweiz erhältlich. Der TDB2Online-Artikel über den WIE enthält auch einige Hinweise zur Copyright-Geschichte der Wechsler-Tests.

Alle Intelligenztestbatterien von Wechsler sind Individualtests. Das Testmaterial ist auch bei der WAIS-IV noch relativ vielseitig, auch wenn es in früheren Versionen mit den Subtests Bilderordnen und Figurenlegen für die Probanden handlungsreicher war. Abwechslung im Material hilft immer dabei, die meist eher mäßige Motivation von Testpersonen in klinischen Testsituationen aufrecht zu halten.

Die Durchführung ist im Durchführungshandbuch (Manual 2) gut und sehr ausführlich beschrieben. Sie ist bei der WAIS-IV schwieriger als bei vielen anderen Leistungstests und muss gelernt und geübt werden. Alle Tests aus der Domäne Sprachverständnis werden zum Beispiel frei beantwortet. Das ist gut für den Probanden, bedeutet aber für die Testleiter/innen, dass die Antwort mit Beispielantworten im Handbuch verglichen und bewertet werden muss. Dabei muss man auch wissen, in welchen Fällen man nachfragen muss. Es reicht nicht, wenn man später liest, dass man bei einer bestimmten Antwort hätte nachfragen müssen, um zu einer klaren Bewertung zu kommen. Bei vielen Subtests gibt es Sprung- und Abbruchregeln, mit denen man vertraut sein muss.

Die Durchführung der 10 Kerntests der WAIS-IV dauert bei psychiatrischen Patienten gute 90 Minuten, nimmt man weitere Subtests dazu, entsprechend länger. Dazu kommt die Auswertungszeit, die allerdings stark von der Erfahrung der Testleiterin abhängt.

Die Rohwerte der WAIS-IV sind über die Subtests hinweg ganz unterschiedlich definiert:

  • Anzahl richtiger Lösungen: ZN, MZ, AW, BZF
  • Anzahl richtiger Lösungen innerhalb einer bestimmten Zeit: RD, VP, ZST, FW, BE
  • Anzahl richtiger minus Anzahl falscher Lösungen innerhalb einer bestimmten Zeit: SYS, DT
  • Summe von Punkten für die Güte einer Lösung (0, 1 oder 2 Punkte pro Item): GF, WT, AV
  • Komplexe Bewertung nach Richtigkeit und Schnelligkeit der Lösung: MT

Auch die Rohwertbereiche sind unterschiedlich groß: Den kleinsten Bereich finden wir beim Rechnerischen Denken (0 bis 22), den größten beim Zahlen-Symbol-Test (0 bis 135).

Wegen der unterschiedlichen Rohwertbereiche und wegen der Abweichungen der Rohwertverteilungen von einer Normalverteilung wurden die Rohwerte schon seit der ersten Generation der Wechsler'schen Intelligenztests an Hand von Tabellen in sogenannte Wertpunkte umgewandelt. Wertpunkte sind bei Wechsler Standardwerte mit dem Mittelwert 10 und der Standardabweichunge 3. Die Umwandlung geschah immer über eine Flächentransformation, die zugleich zu einer Normalisierung der Verteilung führte. Allerdings ist die genaue Definition der Wertpunkte in den verschiedenen Versionen der Wechsler-Tests trotzdem unterschiedlich:

  • Bei der Wechsler Adult Intelligence Scale10) (WAIS) und deren Vorgängern im englischen Sprachbereich und dementsprechend beim HAWIE im deutschen Sprachbereich waren die Wertpunkte so skaliert, dass sich in der Gesamtverteilung der Eichstichprobe ein Mittelwert von 10 und eine Standardabweichung von 3 ergab. Diese Definition ist inhaltlich gesehen nicht glücklich, weil die Subtests ganz unterschiedliche Altersverläufe aufweisen. Ein so definierter Mittelwert von 10 charakterisiert bei einigen Subtests, insbesondere bei den sprachlichen, eine breite Altersspanne. Bei Subtests mit einer starken Leistungseinbuße im Alter kann er dagegen nur eine ziemlich enge Altersspanne wirklich charakterisieren. Ein weiterer Nachteil liegt darin, dass eine Änderung im Altersbereich der Normierungsstichprobe zu einer veränderten Definition der Wertpunkte führt. Auch dies wird vor allem bei den Subtests mit einer starken Leistungseinbuße im Alter wirksam.
  • Bei der revidierten Version der WAIS, der WAIS-R11), und dementsprechend beim HAWIE-R wurden die Wertpunkte so skaliert, dass ein Mittelwert von 10 und eine Standardabweichung von 3 in der Altersklasse der jungen Erwachsenen zwischen 20 und 34 Jahren erzielt wurde. Damit ließen sich die Wertpunkte inhaltlich enger charakterisieren als typische Leistung für junge gesunde Probanden auf dem Gipfelpunkt der kognitiven Leistungsfähigkeit. Der Altersbereich der Normierungsstichprobe hat darauf dann keinen Einfluss mehr. Altersbedingte Defizite finden sich nach beiden Seiten. Jugendliche um die 16 Jahre erreichen im Durchschnitt zum Beispiel im Wortschatztest nur 8 Wertpunkte. Probanden mit einem Alter von siebzig Jahren erreichen in manchen Subtests des Handlungsteils nur vier bis sechs Wertpunkte.
  • Bei der WAIS-III12) und dementsprechend beim WIE wurde diese Definition der Wertpunkte, die inhaltlich den Leistungswerten in TDB2 ähnlich ist, nicht weitergeführt. Ab dieser Generation (und damit auch bei der WAIS-IV) wurden die Wertpunkte nur noch gruppenweise altersbezogen definiert, so dass sich für jede Altersgruppe separat ein Mittelwert von 10 und eine Standardabweichung von 3 ergibt. (Beim HAWIE-R stand diese Methode als alternative Auswertung zur Verfügung). Bei WAIS-III und WAIS-IV wird also jede Altersgruppe anders transformiert und die Wertpunkte verlieren für einen Vergleich zwischen verschiedenen Altersgruppen ihren Sinn.

In TDB2Online erfolgt die Darstellung von Testergebnissen immer in Form von altersunabhängigen Leistungswerten. Für die Berechnung der Leistungswerte wurde bei den Subtests des WAIS-IV auf die Wertpunkttransformationen der Altersklassen 20-24 und 25-29 zurückgegriffen. Die Details sind weiter unten erläutert.

Für die WAIS-IV gibt es im deutschen Sprachraum bis heute keine Normdaten außer den im Handbuch mitgeteilten. Bei vielen sprachfreien neuropsychologischen Tests werden in TDB2Online allerdings auch nicht-deutschsprachige Normquellen hinzugezogen. Es wäre insofern durchaus denkbar, auch bei den nicht-sprachlichen Subtests der WAIS-IV andere Normen hinzuzuziehen, zum Beispiel die amerikanischen, britischen oder französischen Normen, und sie mit den deutschen metaanalytisch zu verrechnen. Auch ein einfacher Vergleich der deutschen Normen mit anderen Quellen wäre durchaus interessant. Das steht als Aufgabe an, wurde aber bisher nicht durchgeführt.

Im deutschen Handbuch zur WAIS-IV fehlt jegliche Angabe darüber, wie die Wertpunkte aus den Rohwertsummen berechnet wurden. Allerdings kann man dem Vorwort entnehmen, dass die Berechnungen von der gleichen Mitarbeiterin von Pearson in San Antonio durchgeführt wurden, die auch die Normen für die amerikanische Originalversion erstellt hat. Man darf also wohl annehmen, dass die Prozeduren identisch waren. Im amerikanischen Handbuch13) ist beschrieben, dass „the method of inferential norming“ benutzt wurde. Der zugehörige Literaturverweis bezieht sich auf einen unpublizierten Kongressvortrag von 2005, allerdings gibt es eine spätere Publikation14), die die Methode gut beschreibt. Es handelt sich dabei um eine Spielart des „continuous norming“: Zunächst wurden Mittelwerte, Standardabweichungen und Schiefe der Rohwerte separat für jede Altersgruppe berechnet und dann über die Altersgruppen hinweg mit polynomialen Regressionen geglättet. Mit den so angepassten Momenten wurden Verteilungsfunktionen berechnet und wiederum geglättet, auch über Altersgruppen hinweg. Deren Perzentile an den Mittelpunkten der Altersbereiche wurden letztlich für die Umrechnung von Rohpunktsummen in Wertpunkte verwendet.

Die Umrechnung von Roh- in Wertpunkte stellt also im Wesentlichen eine etwas mehr formalisierte Linearisierung durch Flächentransformation und eine Transformation in die Wertpunktskala (10;3) für jede Altersklasse dar. Das „continuous norming“ sorgt lediglich dafür, dass es keine groben stichprobenbedingten Sprünge in den Normen gibt. Die Tabellen im Handbuch geben diese Umrechnungsdaten leider nur ganzzahlig wieder, viele Rohwerte belegen denselben Wertpunkt. Um die Daten für die Darstellung in TDB2Online nutzbar zu machen, wurden die harten Stufen dieser Umwandlung durch eine gleitende Mittelwertbildung wieder geglättet. Dabei richtete sich die Ordnung der gleitenden Mittelwertsbildung nach der Feinheit der Rohwertskala. An den Enden der Verteilung wurden die Daten extrapoliert, damit man die gleitende Mittelwertsbildung beibehalten konnte. Anschließend wurde auch eine Angleichung der Daten zwischen den Altersklassen vorgenommen. Dies war zwar laut Handbuch schon bei der Erstellung der Normen durchgeführt worden. In den Daten wurden aber gelegentlich Unstetigkeiten im Altersverlauf beobachtet, die Ergebnis der begrenzten Stichprobengröße sind. Sie wurden durch eine Glättung über die Altersgruppen hinweg eliminiert. Hier war eine Glättung dritter Ordnung immer ausreichend. Anschließend wurden die Daten für die beiden Altersgruppen 20-24 und 25-29 gemittelt. Der Mittelwert war die Basis für die Berechnung der Leistungswerte.

In die 2012 durchgeführte Normierung der WAIS-IV gingen die Ergebnisse von 1425 Personen aus Deutschland im Alter zwischen 16 und 90 Jahren ein. Anders als bei der Normierung des WIE wurden Personen aus Österreich oder der Schweiz nicht einbezogen. Die Stichprobe hat einen beachtlichen Umfang und einen großen Altersbereich. Für alle Altersgruppen einzeln gibt es eine Aufschlüsselung nach Geschlecht, Bildungsabschlüssen, Migrationshintergrund und Region.

Für die Stichprobenziehung wurden Stichprobenpläne an Hand von nicht näher spezifizierten Veröffentlichungen des Statistischen Bundesamts zu Geschlecht, Schulabschlüssen, Migrationshintergrund und regionaler Verteilung entwickelt. Inwieweit die Merkmale der Normstichprobe die angestrebten Quoten erfüllen, ist nicht beschrieben. Weitere Angaben fehlen, unter anderem zum Schwund der Stichprobe (es wurden weit mehr als 1425 Personen untersucht), zur Art der Stichprobenziehung, zur Art der Kontaktaufnahme, zur Testumgebung und zur Schulung der rund 120 Testleiter, denen im Handbuch gedankt wird.

Für jeden Anwender, der von dem älteren WIE zur WAIS wechselt, stellt sich die Frage nach der Vergleichbarkeit der mit beiden Verfahren erhobenen Subtestwertpunkte, Indizes und IQs. Bei den beiden vergangenen Versionswechseln (vom HAWIE zum HAWIE-R 1991 und vom HAWIE-R zum WIE 2006) wurden von Mitarbeitern der Psychologischen Abteilung der Münchner Psychiatrischen Uniklinik einige Jahre nach dem Erscheinen der neuen Versionen Ergebnisse von Äquivalenzuntersuchungen vorgelegt15) 16). Zwischen HAWIE und HAWIE-R gab es danach große, zwischen HAWIE-R und WIE merkliche Unterschiede in den IQs und Subtestergebnissen. Das jeweils neuere Verfahren führte zu niedrigeren Werten, was auf Grund des Flynn-Effekts17) zu erwarten war. Eher unerwartet fanden sich auch starke qualitative Unterschiede zwischen den Verteilungsformen der jeweiligen Eichstichproben, die es eigentlich notwendig gemacht hätten, für jeden Rohwert einer jeden Altersgruppe eine individuelle Umrechnung vorzulegen.

Für die amerikanische Originalversion der WAIS-IV liegen die Ergebnisse einer Äquivalenzuntersuchung zur WAIS-III vor, die im Technischen Handbuch der WAIS-IV publiziert wurden18). Bei einzelnen Subtests fanden sich Differenzen im Bereich von 1/3 Standardabweichung oder 5 IQ-Punkten, im Verbalteil im Allgemeinen höher als im Handlungsteil.

Für die deutsche Version der WAIS-IV gibt es derzeit unseres Wissens nach keine Äquivalenzuntersuchung. Am sinnvollsten wäre gewesen, sie zusammen mit der Normierungsuntersuchung durchzuführen. Dies wurde wohl versäumt. Auch wenn der Flynn-Effekt sich nach manchen Berichten inzwischen abgeschwächt hat19), dürfte immer noch mit gewissen Unterschieden zu rechnen sein. Mit dieser Unsicherheit bleibt der Anwender alleine, vor allem dann, wenn ältere WIE-Befunde mit neueren WAIS-IV-Befunden verglichen werden sollen.

In diesem Abschnitt werden, gegliedert nach den Domänen, für jeden WAIS-IV-Subtest die rückgerechneten Rohwertverteilungen für ausgewählte Altersgruppen gezeigt und diskutiert. Rohwertverteilungen liefern basale Informationen über die Differenzierungsfähigkeit eines Tests. Ein zweites Diagramm zeigt die Abbildung der Rohwerte auf die Leistungswerte. An beiden Abbildungen lässt sich die Differenzierungsfähigkeit an unterschiedlichen Stellen der Verteilung gut feststellen. In die Abbildung der Roh- auf Leistungswerte sind zusätzlich Verteilungskennwerte aller Altersgruppen (Mittelwerte plus/minus ein und zwei Sigma) eingetragen. An diesem Diagramm lässt sich der Einfluss des Alters auf die Subtestleistungen gut erkennen. Besonderheiten werden jeweils kommentiert.

Zu der Domäne der sprachlichen Fähigkeiten zählen die Kerntests Gemeinsamkeitenfinden, Wortschatztest und Allgemeines Wissen. Damit ist die Zusammensetzung dieser Domäne die gleiche wie beim WIE. Als optionaler Untertest kommt der Subtest Allgemeines Verständnis hinzu. Alle vier Subtests sind alte Bekannte und waren in allen früheren deutschsprachigen Versionen der Wechsler-Tests seit dem HAWIE enthalten.

In der Rohwertverteilung des Subtests Gemeinsamkeitenfinden (GF, Abbildung 1) zeigt sich ein gewisser Deckeneffekte (vor allem bei den jungen Erwachsenen), der darauf zurückgeht, dass der Subtest relativ viele leichte, aber nur wenige schwere Items enthält. Eine solche Rohwertverteilung führt dazu, dass die Genauigkeit im oberen Leistungsbereich niedriger ist als im unteren. Wir werden ähnliche Verteilungen auch bei den drei anderen Subtests der Domäne Sprachliche Fähigkeiten sehen.

Abbildung 1: Rekonstruierte Rohwertverteilung des Subtests Gemeinsamkeitenfinden für ausgewählte Altersgruppen

Abbildung 2: Leistungswerte im Subtest Gemeinsamkeitenfinden mit Rohwerten und Altersnormgrenzen (siehe Text)

In einer Übersichtsgrafik zeigt Abbildung 2 den Zusammenhang von Roh- und Leistungswerten sowie den Einfluss des Alters auf die (durchschnittlichen) Leistungen für den Subtest Gemeinsamkeitenfinden. Auf dieser Abbildung (und allen ähnlichen folgenden) markieren die senkrechten Striche die Leistungswerte von 40 bis 145. Auf der schwarzen waagerechten Linie sind ausgewählte Rohwerte lagerichtig als Rhomben eingetragen. Die abwechselnd rot und blau eingezeichneten Linien enthalten die Normgrenzen für alle Altersgruppen in der Übersicht. Die fünf Markierungen auf jeder Linie stehen für die Prozentränge 2.5, 16, 50, 84 und 97.5. Jeweils eine solche Linie, nämlich die, die der Altersgruppe des Probanden entspricht, wird (in anderer Form) im TDB2Online-Profilblatt eingezeichnet, um bei der individuellen Interpretation der Testergebnisse zu helfen. Weil die Leistungswerte aus den Ergebnissen der 20-29-jährigen jungen Erwachsenen errechnet werden, umschließen die 5 Markierungen der Altersgruppen 20-24 und 25-29 immer die Leistungswerte 70, 85, 100, 115 und 130.

An der Lage der Rohwerte im Leistungswertgitter von Abbildung 2 lässt sich die geringere Differenzierungsfähigkeit im oberen Leistungsbereich gut erkennen. Zwischen den Leistungswerten 85 und 100 liegen etwa 8 Rohpunkte (etwa 17 bis 25), zwischen 115 und 130 nur 4 (31 bis 35). Eine zusätzliche (mit zwei Punkten bewertete) richtige Antwort führt im oberen Leistungsbereich zu einer um 7 bis 8 IQ-Punkte besseren Leistung, im unteren erhöht sie die Subtestleistung nur um 4 Punkte. Der maximal mögliche Rohwert von 36 entspricht einem Leistungswert von 137, bessere Leistungen sind mit dem Subtest nicht messbar. Nach unten ist die Schwierigkeitsabstufung der Items dagegen gut. Bei einem klinischen Test, der eher Leistungsdefizite als Leistungsspitzen erkennen soll, ist eine solche Charakteristik völlig akzeptabel.

Der altersassoziierte Leistungsabfall ist bei diesem Subtest nicht stark. Zwischen dem Mittelwert der besten Altersgruppe (30-34) und der schlechtesten (85-89) liegen nur 10 IQ-Punkte (entspricht 2/3 Standardabweichung).

In der Rohwertverteilung des Subtests Wortschatztest (WT, Abbildung 3) zeigt sich ein Deckeneffekt vom jungen Erwachsenen- bis zum beginnenden Rentenalter. Im oberen Bereich ist die Verteilungskurve für mittlere Jahrgänge sehr steil, kleine Rohwertdifferenzen bewirken große Leistungswertdifferenzen.

Abbildung 3: Rekonstruierte Rohwertverteilung des Subtests Wortschatztest für ausgewählte Altersgruppen

Abbildung 4: Leistungswerte im Subtest Wortschatztest mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Dem entsprechend ist beim Wortschatztest die Differenzierungsfähigkeit im oberen Leistungsbereich deutlich schlechter als im mittleren oder unteren. Der altersassoziierte Leistungsabfall ist mäßig stark. Zwischen dem Mittelwert der besten Altersgruppe (35-44) und der schlechtesten (85-89) liegt etwa eine Standardabweichung (15 IQ-Punkte).

Schon an der Verteilungskurve der Rohwerte des Subtests Allgemeines Wissen (AW, Abbildung 5) sieht man, dass die 65-69-Jährigen mehr wissen als die jungen Erwachsenen.

Abbildung 5: Rekonstruierte Rohwertverteilung des Subtests Allgemeines Wissen für ausgewählte Altersgruppen

Abbildung 6: Leistungswerte im Subtest Allgemeines Wissen mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Aus der genaueren Altersverteilung in Abbildung 6 sieht man dann, dass die 45-54-Jährigen die höchste mittlere Leistung erbringen. Der Leistungsabfall von dieser Gruppe bis zu den 85-89-Jährigen beträgt im Mittelwert etwa 10 IQ-Punkte.

Von den vier Subtests in der Domäne Sprachliche Fähigkeiten hat der Subtest Allgemeines Verständnis (AV, Abbildung 7) die schiefste Verteilung. Im unteren Leistungsbereich haben auch große Rohwertdifferenzen nur einen geringen Einfluss, im oberen Leistungsbereich haben kleine Änderungen dagegen einen großen Einfluss. Die Testdecke ist niedrig.

Abbildung 7: Rekonstruierte Rohwertverteilung des Subtests Allgemeines Verständnis für ausgewählte Altersgruppen

Abbildung 8: Leistungswerte im Subtest Allgemeines Verständnis mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Der Erwerb der von diesem Subtest gemessenen sprachlichen Fähigkeit setzt sich bis ins mittlere Erwachsenenalter fort, zwischen 35 und 54 liegt das Maximum (Abbildung 8). Mehr noch als bei GF findet sich bei AV eine Varianzverringerung bei den alten Personen der Stichprobe. Eigentlich sollte die Flächentransformation die Varianz auch über leistungsunterschiedliche Gruppen hinweg stabilisieren. Möglicherweise gehen bei GF und AV im hohen Alter andere kognitive Fähigkeiten in die Messung ein.

Zur Fähigkeitsdomäne Visuelles Problemlösen (im deutschen Handbuch: Wahrnehmungsgebundenes logisches Denken) gehören insgesamt fünf Subtests: die drei Kerntests Mosaiktest, Matrizentest und Visuelle Puzzles sowie die zwei optionalen Subtests Formenwaage und Bilderergänzen. Beim WIE gehörten zu dieser Domäne die Subtests Mosaiktest, Matrizentest und Bilderergänzen. Der neue Subtest Visuelle Puzzles ist eine sehr gute Ergänzung für diese Domäne, zu der das Bilderergänzen ohnehin nicht gepasst hat. Auch der Subtests Formenwaage ist neu. Der Mosaiktest und das Bilderergänzen sind seit dem HAWIE alte Bekannte, der Matrizentest seit dem WIE. Für die Formenwaage liegen Altersnormen nur bis zur Gruppe der 65-69-Jährigen vor.

Der Mosaiktest (MT) enthält viele leichte Aufgaben. Bei den leistungsstärkeren Altersgruppen gibt es eine linksschiefe Verteilung mit schlechter Differenzierung im oberen Leistungsbereich.

Abbildung 9: Rekonstruierte Rohwertverteilung des Subtests Mosaiktest für ausgewählte Altersgruppen

Abbildung 10: Leistungswerte im Subtest Mosaiktest mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Das Leistungsoptimum liegt bei den 18–29-Jährigen. Schwer zu glauben ist, dass der Leistungsabfall von 30 bis rund 60 rasanter verlaufen soll als von 60 bis 90, was nach den Daten aber der Fall ist. Der gleiche Effekt war schon beim WIE zu sehen. Da bei der WAIS-IV immerhin 4 von 14 Aufgaben im Vergleich zum WIE verändert wurden, ist ein Skalierungsartefakt oder ein Bodeneffekt (was wir damals beim WIE für wahrscheinlich hielten) jetzt weniger wahrscheinlich. Vielleicht werden beim Mosaiktest tatsächlich Fähigkeiten gebraucht, die im hohen Alter nicht so stark abnehmen wie im mittleren. Insgesamt ist die Altersdifferenz beträchtlich: der mittlere Leistungswert sinkt von rund 100 bei den jungen Erwachsenen auf 76 bei den 85–89-Jährigen.

Der Matrizentest (MZ) ist dem Mosaiktest in vielen Eigenschaften ähnlich. Auch hier finden wir eine schlechtere Diskriminierungsfähigkeit im oberen Leistungsbereich und einen rasanten Altersabbau.

Abbildung 11: Rekonstruierte Rohwertverteilung des Subtests Matrizentest für ausgewählte Altersgruppen

Abbildung 12: Leistungswerte im Subtest Matrizentest mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Die 85–89-Jährigen erreichen im Durchschnitt nur einen Leistungswert von 68, was eine Einbuße von mehr als zwei Standardabweichungen im Vergleich zu den jungen Erwachsenen (LW 100) bedeutet.

Bei den Rohwertverteilungen des Subtests Visuelle Puzzles (VP, Abbildung 13) sieht man große Mittelwertsunterschiede zwischen Jungen und Alten, allerdings auch große Streuungsdifferenzen mit einer engen Verteilung bei den Ältesten und breiteren bei jüngeren Altersgruppen. Beides erkennt man noch besser in dem Diagramm mit den Altersnormen (Abbildung 14).

Abbildung 13: Rekonstruierte Rohwertverteilung des Subtests Visuelle Puzzles für ausgewählte Altersgruppen

Abbildung 14: Leistungswerte im Subtest Visuelle Puzzles mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Auf der Leistungswertebene ist die Standardabweichung der 85–89-Jährigen nur rund halb so groß wie die der 20–24-Jährigen. Eigentlich sollte die Flächentransformation dafür sorgen, dass es keine direkte Abhängigkeit zwischen Leistungshöhe und Varianz gibt. Es ist eigenartig, dass das hier in diesem Maße auftritt. Viel spricht dafür, dass die Alten die Aufgaben anders wahrnehmen oder anders angehen als die Jungen. Möglicherweise spielt die Zeitbegrenzung der Aufgaben auf 20 oder 30 Sekunden hier eine Rolle. Diese Grenze (bei längerer Bearbeitungszeit zählt die Aufgabe als nicht gelöst) ist für die Jungen viel seltener relevant als für die Alten. Sie könnte dafür sorgen, dass alle Alten weniger Punkte erreichen, auch die, die fähig wären, die Aufgabe mit mehr Zeit zu lösen. Leider enthalten die Wechsler-Handbücher keine Itemstatistiken, an Hand derer man das nachverfolgen könnte.

Der durchschnittliche Leistung der 85–89-Jährigen liegt mit einem Leistungswert von 72 knapp zwei Standardabweichungen unter der Leistung der jungen Erwachsenen.

Für die Formenwaage (FW) liegen nur Standardisierungsdaten bis zur Altersgruppe 65-69 vor. Die Verteilungen (siehe Abbildung 15)sind relativ symmetrisch, Abweichungen von der Linearität gibt es nur im extrem hohen Leistungsbereich.

Abbildung 15: Rekonstruierte Rohwertverteilung des Subtests Formenwaage für ausgewählte Altersgruppen

Abbildung 16: Leistungswerte im Subtest Formenwaage mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Die durchschnittliche Leistung der 65–69-Jährigen ist mit einem Leistungswert von 82 um gut eine Standardabweichung niedriger als die der Jungen. Das entspricht in etwa auch dem Leistungsabfall bei VP oder MZ.

Die Verteilungen der Rohwerte beim Subtest Bilderergänzen (BE, Abbildung 17) ist bis auf den Bodeneffekt bei den ganz Alten eigentlich ganz vorbildlich und spricht für gute Differenzierungsfähigkeit über alle Leistungsgruppen hinweg.

Abbildung 17: Rekonstruierte Rohwertverteilung des Subtests Bilderergänzen für ausgewählte Altersgruppen

Abbildung 18: Leistungswerte im Subtest Bilderergänzen mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Dies bestätigt sich auch in den Altersnormen (Abbildung 18). Der durchschnittliche Leistungsabfall der 85–89-Jährigen beträgt knapp zwei Standardabweichungen.

Zur Fähigkeitsdomäne Arbeitsgedächtnis gehören drei Subtests: die beiden Kerntests Zahlennachsprechen (ZN) und Rechnerisches Denken (RD) sowie der optionale Subtest Buchstaben-Zahlen-Folgen (BZF). Alle drei waren schon im WIE enthalten, beim WIE bildeten auch alle drei Subtest den Indexwert für die Domäne. Bei der WAIS-IV liegen Altersnormen für BZF allerdings nur noch bis zur Gruppe der 65-69-Jährigen vor. Es gibt noch einen Unterschied: Im WIE bestand ZN nur aus den Teilaufgaben „vorwärts“ und „rückwärts“. Bei der WAIS-IV kommt die Bedingung „sequentiell“ dazu. Damit erhöht sich die Arbeitsgedächtnisbelastung dieses Subtests.

Der WAIS-IV-Subtest Zahlennachsprechen (ZN) weist eine ziemlich ideale Rohwertverteilung (Abbildung 19) auf: An beiden Seiten der Verteilung ist genügend Raum, sowohl die Rohwerte 0 bis 7 als auch die von 45 bis 48 werden nur sehr selten erreicht. Es gibt also weder Boden- noch Deckeneffekte. Außerdem sind die Verteilungen ziemlich symmetrisch und haben über den gesamten Altersbereich eine relativ einheitliche Varianz.

Abbildung 19: Rekonstruierte Rohwertverteilung des Subtests Zahlennachsprechen für ausgewählte Altersgruppen

Abbildung 20: Leistungswerte im Subtest Zahlennachsprechen mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Die altersassoziierte Leistungseinbuße (Abbildung 20) ist in diesem Test mäßig: die Leistung der 85–89-Jährigen sinkt auf einen Leistungswert von 81, also etwas mehr als eine Standardabweichung im Vergleich mit der Leistung junger Erwachsener (LW 100).

Der Subtest Rechnerisches Denken (RD) der WAIS-IV ist zu leicht. Wie man aus Abbildung 22 ersehen kann, erreichen 95 Prozent aller Personen der Normstichprobe (über alle Altersgruppen hinweg) Werte zwischen 5 und 22, wobei 22 der maximale Rohwert ist. Er entspricht nur einem Leistungswert von knapp 130. Im unteren Verteilungsbereich (Abbildung 21) ist die Differenzierungsfähigkeit dagegen gut.

Abbildung 21: Rekonstruierte Rohwertverteilung des Subtests Rechnerisches Denken für ausgewählte Altersgruppen

Abbildung 22: Leistungswerte im Subtest Rechnerisches Denken mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Die altersassoziierte Leistungseinbuße ist nicht sehr hoch: vom jungen Erwachsenenalter (LW 100) sinken die Leistungswerte bei den 85–89-Jährigen auf 88, das ist also etwas weniger als eine Standardabweichung.

Der Subtest Buchstaben-Zahlen-Folgen (BZF) hat eine relativ symmetrische Rohwertverteilung (Abbildung 23). Im unteren Bereich sind viele leichte Items, die von den allermeisten Personen richtig beantwortet werden. Es gibt kaum jemand, der weniger als 10 Rohwerte erreicht.

Abbildung 23: Rekonstruierte Rohwertverteilung des Subtests Buchstaben-Zahlen-Folgen für ausgewählte Altersgruppen

Abbildung 24: Leistungswerte im Subtest Buchstaben-Zahlen-Folgen mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Die altersassoziierte Leistungseinbuße (Abbildung 24) kann beim Subtest Buchstaben-Zahlen-Folgen nur teilweise erfasst werden, weil er nur bis zur Altersgruppe von 65-69 Jahren normiert ist. Bis zu diesem Alter beträgt die Einbuße nur 8 IQ-punkte.

Zur Fähigkeitsdomäne Arbeitsgeschwindigkeit (im deutschen WAIS-IV-Handbuch : Verarbeitungsgeschwindigkeit) gehören drei Subtests: die beiden Kerntests Symbolsuche (SYS) und Zahlen-Symbol-Test (ZST) sowie der optionale Subtest Durchstreichtest (DT). Die Domäne wurde auch beim WIE durch SYS und ZST gemessen. Für den Durchstreichtest liegen Altersnormen nur bis zur Gruppe der 65-69-Jährigen vor.

Alle Subtests, die die Arbeitsgeschwindigkeit erfassen, haben gute Verteilungseigenschaften. Dies gilt auch für den Subtest Symbolsuche (SYS, Abbildung 25).

Abbildung 25: Rekonstruierte Rohwertverteilung des Subtests Symbolsuche für ausgewählte Altersgruppen

Abbildung 26: Leistungswerte im Subtest Symbolsuche mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

Bei allen Subtests, die die Arbeitsgeschwindigkeit erfassen, lässt sich eine früh einsetzende und relativ linear verlaufende altersassoziierte Leistungseinbuße beobachten. Wie Abbildung 26 zeigt, beträgt sie bei der Symbolsuche von den 20ern bis zum Alter von 85-89 Jahre rund zwei Standardabweichungen oder 30 IQ-Punkte.

Das beim Subtest Symbolsuche Gesagte gilt weitgehend auch für den Zahlen-Symbol-Test (ZST, Abbildung 27). Hinzu kommt hier, dass der Rohwertbereich von 0 bis 135 im oberen Leistungsbereich bei Ersttestungen praktisch nie ausgenutzt wird. Der Leistungswert von 145, die maximal grafisch darstellbare Leistung in TDB2Online, wird schon mit einem Rohwert von 112 erreicht (siehe Abbildung 28). Der weite Messbereich ist trotzdem sinnvoll, weil der Subtest gelegentlich auch bei Mehrfachtestungen eingesetzt wird.

Abbildung 27: Rekonstruierte Rohwertverteilung des Subtests Zahlen-Symbol-Test für ausgewählte Altersgruppen

Abbildung 28: Leistungswerte im Subtest Zahlen-Symbol-Test mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

In diesem Subtest sind tatsächlich die 16–17-Jährigen am besten (mittlerer Leistungswert 101,2), wenn auch der Unterschied zu den jungen Erwachsenen, an denen der Leistungswert normiert ist (20–29-Jährige, LW 100), nur minimal ist. Die altersassoziierte Leistungseinbuße zwischen dem jungen Erwachsenenalter und der Gruppe der 85–89-Jährigen beträgt zwei Standardabweichungen.

Der Durchstrichtest (DT) hat eine gute Rohwertverteilung und einen vernünftigen Messbereich, wie aus Abbildungen 29 und 30 hervorgeht. Das einzige Manko liegt darin, dass er nur bis zur Altersgruppe 65-69 normiert ist.

Abbildung 29: Rekonstruierte Rohwertverteilung des Subtests Durchstreichtest für ausgewählte Altersgruppen

Abbildung 30: Leistungswerte im Subtest Durchstreichtest mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 2)

So weit man die altersassoziierte Leistungseinbuße bei dem eingeschränkten Altersbereich beurteilen kann, liegt sie im Bereich derjenigen der beiden anderen Subtests dieser Domäne.

Wenn mehrere Subtests addiert oder gemittelt und das Ergebnis dieser Aktionen dann als Messwert neu normiert wird, dann entsteht daraus eine neue Metrik, die mit derjenigen der Subtests nicht mehr kompatibel ist. Dieser Sachverhalt ist in der allgemeinen Dokumentation im Abschnitt Mehrfachstandardisierung auf unterschiedlichen Ebenen erläutert und am Beispiel der Intelligenzquotienten des HAWIE-R transparent gemacht worden. Wir haben dort gesehen, dass ein Proband, der in jedem Subtest vier Wertpunkte erreicht, in den Intelligenzquotienten nicht den IQ 70 erhält, den man bei einer vergleichbaren Metrik erwarten würde (zwei Standardabweichungen unterhalb des Mittelwerts seiner Altersgruppe), sondern deutlich niedrigere Werte, die von der Korrelation zwischen den Subtests und der Anzahl der aggregierten Subtests abhängen.

Bei der WAIS betrifft das die vier Indizes und den Gesamt-IQ. Diese fünf Maße sind noch einmal gesondert normiert worden und bauen deshalb eine eigene Metrik auf. Wir zeigen den Effekt in Abbildung 31 am Beispiel eines 25-jährigen Probanden, der in jedem Kerntest genau 4 Wertpunkte erzielt hat.

Abbildung 31: WAIS-Testprofil eines Probanden mit genau 4 Wertpunkten in jedem der 10 Kerntests (siehe Text)

Im TDB2Online-Profil erreicht dieser Proband in jedem Subtest einen Leistungswert von 70 oder ganz in der Nähe von 70, die geringen Abweichungen von der 70er-Linie sind auf die Ganzzahligkeit der Rohwerte zurückzuführen. Da es sich um einen 25-jährigen Probanden handelt, sind die Leistungswerte, die man im Profil ablesen kann, mit den altersabhängigen Standardwerten (ASW), die rechts am Rand als Zahl ausgedruckt sind, praktisch identisch. Auch die mittleren Leistungswerte in den vier Domänen und im Gesamtwert liegen alle bei oder sehr nahe bei 70, was dem Wunsch nach einer einheitlichen Metrik in TDB2Online entspricht.

Die im Profil nachträglich von Hand eingezeichneten roten Markierungen geben die Lage der IQ- bzw. Indexwerte wieder, wie sie sich bei einer Handauswertung nach den Tabellen des WAIS-Handbuchs errechnen. Sie liegen ausnahmslos unterhalb der Subtestwerte, wobei die Korrelation zwischen den aggregierten Subtests und die Anzahl der aggregierten Subtests das Ausmaß der Metrik-Spreizung bestimmen: Je niedriger die Interkorrelationen der Subtests sind und je mehr Subtests in den Globalwert eingehen, umso größer wird die Spreizung der Metrik. Bei den Domänenwerten, bei denen jeweils nur zwei oder drei relativ hoch miteinander korrelierende Subtests zusammengefasst werden, ergeben sich Indizes von 67 (Sprachliche Fähigkeiten), 65 (Visuelles Problemlösen), 66 (Arbeitsgedächtnis) und 68 (Arbeitsgeschwindigkeit), also nur wenig niedriger als die jeweiligen Subtestwerte. Beim Gesamt-IQ dagegen, in den 10 Subtests eingehen, die Unterschiedliches messen und niedriger miteinander korrelieren, ist die Spreizung der Metrik viel größer. Der von Hand ausgewertete Gesamt-IQ beträgt nur 60.

In TDB2Online werden keine getrennt standardisierten Globalmaße berücksichtigt. Statt dessen geben wir schlicht die mittleren Subtests-Leistungswerte bzw. deren altersabhängige Standardwerte an.

Die Abbildungen in diesem Abschnitt zeigen die Altersnormen der vier Domänen der WAIS-IV sowie der Gesamtleistung in allen 10 Kerntests. In TDB2Online werden diese mittleren Leistungswerte an Stelle der Indizes und des Gesamt-IQ erstellt. Für jede Fähigkeitsdomäne und für den Gesamttest wird der mittlere Leistungswert berechnet und in TDB2Online unterhalb der Subtests grafisch dargestellt. Es wird nur über die zu einer Domäne gehörenden Kerntests gemittelt. Wenn auch Rohwerte für optionale Subtests eingegeben wurden, werden die zwar in den Subtestergebnisse gezeigt, aber nicht in den Globalmaßen berücksichtigt. Auch die altersentsprechenden Normgrenzen wurden nur über die Kerntests gemittelt, weil für drei der fünf optionalen Subtests keine Normen für über 69-Jährige vorliegen.

Abbildung 32: Altersnormgrenzen der Domäne Sprachliche Fähigkeiten

In den sprachlichen Fähigkeiten werden im WIE die höchsten Leistungen von den Altersgruppen etwa zwischen 30 und 60 erzielt. Die beiden Altersgruppen, die die Leistungswerte definieren (20-24 und 25-29), liegen zwei oder drei IQ-Punkte darunter. Insgesamt liegen die altersassoziierten Schwankungen der mittleren Leistungswerte in dieser Domäne unterhalb einer Standardabweichung.

Abbildung 33: Altersnormgrenzen der Domäne Visuelles Problemlösen

Die Messbereiche der drei Subtests, die zum visuellen Problemlösen gehören, sind oben alle etwas begrenzt, was dazu führt, dass mittlere Leistungswerte über 130 in dieser Domäne kaum vorkommen. Der altersassoziierte Leistungsabfall beginnt etwa bei 30 Jahren und verläuft bis zum Alter von etwa 70 steiler als danach. Eine Erklärung dafür ist nicht leicht zu finden, beim WIE konnte man aber mit einer ganz anderen Normierungsstichprobe das Gleiche beobachten.

Abbildung 34: Altersnormgrenzen der Domäne Arbeitsgedächtnis

Arbeitsgedächtnis (Abbildung 34) und Arbeitsgeschwindigkeit (Abbildung 35) unterscheiden sich in ihrem Altersverlauf beträchtlich. Beim Arbeitsgedächtnis wird die maximale Leistung erst in einem Alter von rund 27 Jahren erreicht. Bis zum Ende der 80er sinkt die Leistung dann um rund eine Standardabweichung. Die Arbeitsgeschwindigkeit ist dagegen schon im Jugendlichenalter (16-17) am höchsten und sinkt ab Mitte 20 ziemlich linear um rund zwei Standardabweichungen. Dieser unterschiedliche Altersverlauf fand sich auch schon im WIE, wenn auch dort (in allen Domänen) die altersassoziierte Einbuße noch größer war.

Abbildung 35: Altersnormgrenzen der Domäne Arbeitsgeschwindigkeit

Abbildung 32: Altersnormgrenzen der Gesamtleistung in den Kerntests

Ein Globalwert über 10 Subtests ist eigentlich nur dann sinnvoll zu interpretieren, wenn die Subtestergebnisse sich kaum unterscheiden. Dann misst er schlicht die zentrale Tendenz der mit dem Test gemessenen kognitiven Fähigkeiten. In klinischen Fragestellungen stehen meist Einbußen in einzelnen kognitiven Bereichen im Fokus.


1)
Petermann, F. (Hrsg.) (2012). Wechsler Adult Intelligence Scale - Fourth Edition. Deutschsprachige Adaptation der WAIS-IV von D. Wechsler. Frankfurt/M.: Pearson Assessment & Information GmbH.
2) , 13)
Wechsler, D. (2008). Wechsler Adult Intelligence Scale - Fourth Edition. San Antonio, TX: Pearson.
3)
Wechsler, D. (1939). The Measurement of Adult Intelligence. Baltimore(MD): Williams & Wilkins.
4)
Hardesty, A. & Lauber, H. (1956). Hamburg-Wechsler-Intelligenztest für Erwachsene (HAWIE). Bern: Huber
5)
Tewes, U. (Hrsg.) (1991). Hamburg-Wechsler Intelligenztest für Erwachsene - Revision 1991 (HAWIE-R). Bern: Huber
6)
von Aster, M., Neubauer, A., & Horn, R. (2006). Wechsler Intelligenztest für Erwachsene (WIE). Manual. Übersetzung und Adaptation der WAIS-III von David Wechsler. Frankfurt/M.: Pearson Assessment & Information GmbH.
7)
Sattler, J. M. & Ryan, J. J. (2009). Assessment with the WAIS-IV. San Diego: Jerome M. Sattler, Publisher, Inc.
8)
Weiss, L. G., Saklofske, D. H., Coalson, D. L. & Raiford, S. E. (2010). WAIS-IV Clinical Use and Interpretation. London: Academic Press.
9)
Lichtenberger, E. O. & Kaufman, A. S. (2012). Essentials of WAIS-IV Assessment, 2nd Edition. New York: Wiley.
10)
Wechsler, D. (1955). Wechsler adult intelligence scale. New York: The Psychological Corporation
11)
Wechsler, D. (1981). Wechsler adult intelligence scale–revised. San Antonio, TX: The Psychological Corporation.
12)
Wechsler, D. (1997). Wechsler adult intelligence scale–third edition. San Antonio, TX: The Psychological Corporation
14)
Zhu, J. & Chen, H.Y. (2011). Utility of Inferential Norming With Smaller Sample Sizes. Journal of Psychoeducational Assessment, 29, 570-580
15)
Satzger, W., Dragon, E. & Engel, R. R. (1996). Zur Normenäquivalenz von HAWIE-R und HAWIE. Diagnostica, 43, 119-139.
16)
Erzberger, C. S. & Engel, R. R. (2010) Zur Äquivalenz der Normen des Wechsler-Intelligenztests für Erwachsene (WIE) mit denen des Hamburg-Wechsler-Intelligenztests für Erwachsene - Revision (HAWIE-R). Zeitschrift für Neuropsychologie, 21(1), 25-37
17)
Flynn, J. R. (1987). Massive IQ gains in 14 nations: What IQ tests really measure. Psychological Bulletin, 101, 171-191.
18)
Wechsler, D. (2008). WAIS-IV. Technical and Interpretive Manual. San Antonio: Pearson
19)
Sundet, J. M., Barlaug, D. G. & Torjussen, T. M. (2004). The end of the Flynn effect? A study of secular trends in mean intelligence test scores of Norwegian conscripts during half a century. Intelligence, 32, 349-362.
Melden Sie sich an, um einen Kommentar zu erstellen.
  • dokumentation/wechsler_adult_intelligence_scale_-_fourth_edition.1627998343.txt.gz
  • Zuletzt geändert: 2021/08/03 13:45
  • von res