dokumentation:verbaler_lern-_und_merkfaehigkeitstest

Dies ist eine alte Version des Dokuments!


Verbaler Lern- und Merkfähigkeitstest

Abkürzung: VLMT

Das Lernen und spätere Abprüfen von Wortlisten war sicher seit der zweiten Hälfte des 19. Jahrhunderts, vermutlich auch schon früher, als Methode zur Prüfung der Gedächtnisleistung bekannt. Die heute wohl am häufigsten verwendete Form solcher Prüfungen, nämlich mehrmals nacheinander eine Liste von rund 15 Wörtern lernen und nach einer Ablenkung aus dem Gedächtnis abrufen lassen, wurde erstmals 1919 von dem Genfer Psychologen Claparède publiziert (siehe dazu1)). Sein Schüler André Rey führte in den Vierziger Jahren des letzten Jahrhunderts klinische Untersuchungen mit diesem Gedächtnistest durch2). Eine ausführliche Darstellung des (modifizierten) Verfahrens erschien erst viel später in einer Buchpublikation 3). Zu dieser Zeit wurde der Test in Übersetzungen von Klinikern in anderen Ländern angewandt, ohne dass viel darüber publiziert wurde.4)

In die amerikanische Psychologie wurde das Verfahren unter dem Namen Auditory Verbal Learning Test (AVLT) zunächst von Taylor5) eingeführt. Durch die Aufnahme in Lezaks Handbuch zur Neuropsychologischen Diagnostik6) wurde es später allgemein bekannt. Die heutigen Versionen des AVLT und des VLMT stützen sich weitgehend auf die von Taylor benutzte Prozedur.

Heute ist der AVLT einer der weltweit am häufigsten benutzten Gedächtnistests. Er wird in allen Lehr- und Handbüchern der neuropsychologischen Diagnostik besprochen7) 8) 9). Schmidt hat 1996 die amerikanische empirische Literatur zum AVLT in einer Monographie zusammengetragen.10)

Deutsche Versionen des AVLT wurden zunächst in Zeitschriftenaufsätzen als VLMT11) bzw. AVLT12) vorgestellt. Der VLMT erschien 2001 als komplettes und anwendungsreifes Testverfahren13).

Im Folgenden stützen wir uns vorwiegend auf den VLMT. Er dürfte wohl auch die am meisten benutzte deutsche Form des AVLT sein. Bei den Normen werden wir allerdings weitere Literatur einbeziehen.

Wollte man einen beliebigen „auditorischen Wörterlerntest“ anwenden, brauchte man dazu lediglich 45 Hauptwörter (klassischerweise solche, die reale Gegenstände beschreiben). Die ersten 15 bilden eine Liste, die in fünf Durchgängen gelernt wird, die nächsten 15 werden als sogenannte Interferenzliste benutzt und werden danach einmal gelernt. Dann müssen die zuerst gelernten Wörter erinnert werden. Zuletzt bilden die letzten 15 der 45 Wörter zusammen mit den ersten 15 eine Liste von 30 Wörtern, in der die zuerst Gelernten wiederzuerkennen sind.

Angesichts der Vorteile, die die Standardisiertheit des Testmaterials bietet, ist es in den meisten Fällen höchst sinnvoll, auf publizierte Versionen zurückzugreifen, wenn es solche gibt. Seit 2001 liegt mit dem Verbalen Lern- und Merkfähigkeitstest (VLMT) eine publizierte deutschsprachige Version vor, die leicht anwendbar ist und alle Kriterien der Objektivität der Durchführungsbedingungen erfüllt. Zusätzlich kann man mit dem VLMT neben den klassischen Testwerten noch eine Reihe von weiteren Zusatzscores erheben, die allerdings in TDB2Online nicht weiter dargestellt werden. Auch ohne diesen Zusatznutzen denken wir, dass die Objektivität der Durchführungsbedingungen und der Komfort durch die anwendungsreife Aufarbeitung den Preis für das professionelle Testmaterial allemal wert ist. Es besteht beim VLMT aus dem Testhandbuch, Protokollbögen und Ergebnisbögen.

Über die vielen Jahrzehnte, die der AVLT schon existiert, wurden natürlich verschiedene Arten der Testdurchführung verbreitet. Allerdings hat sich eine von ihnen als Quasi-Standard etabliert, ihr folgt auch der VLMT:

Es gibt zwei Wortlisten mit jeweils 15 Substantiven für die Darbietung, eine davon (A) ist die Lernliste, die andere (B) die Interferenzliste. Die Wiedererkennungsliste besteht aus den beiden Listen A und B und weiteren 20 Distraktorwörtern, von denen 10 mit den Wörtern in A semantisch und 10 phonetisch ähnlich sind.

Die Liste A wird fünf Mal vorgelesen. Der Proband soll nach jedem Vorlesen möglichst viele Wörter aus dem Gedächtnis abrufen. Dieser Teil des Tests liefert (mindestens) zwei Rohwerte für die Lernleistung, nämlich die Anzahl der in allen fünf Durchgängen aus dem Gedächtnis wiedergegebenen Wörter (Dg1-5 in der Terminologie des VLMT) und die Anzahl der im letzten Durchgang wiedergegebenen Wörter (Dg5). Danach wird die Interferenzliste ein Mal vorgelesen, wie zuvor soll sie direkt anschließend wiedergegeben werden. Anschließend soll der Proband noch einmal - ohne erneutes Vorlesen - die zuerst gelernten Wörter der Liste A erinnern. Die Anzahl der hierbei erinnerten Wörter liefert einen ersten Rohwert für die Gedächtnisleistung, im VLMT heißt dieses Maß einfach Dg6, in vielen englischen Publikationen wird es auch als Post-Interference Recall (PIR) angeführt. Nach 30 Minuten, die mit nonverbalen Tests gefüllt werden sollen, erfolgt wiederum ein freier Abruf der Liste A ohne erneute Vorgabe. Die Anzahl der hierbei erinnerten Wörter ist der Rohwert für das Verzögerte Erinnern (Dg7 im VLMT, sonst auch oft Delayed Recall). Direkt danach wird die Wiedererkennensliste vorgelesen und der Proband muss mit Ja antworten, wenn er ein Wort aus der ursprünglich gelernten Liste A wiedererkennt. Der entsprechende Messwert ist in den meisten Verfahren die Anzahl der korrekt wiedererkannten Wörter (Recognition Memory oder Delayed Recognition). Diesen Messwert gibt es im VLMT auch, allerdings wird dort die Anzahl der korrekt wiedererkannten Wörter minus die Anzahl der Fehler als Messwert bevorzugt.

Der AVLT und damit auch der VLMT liefert traditionell für jeden Wiedergabedurchgang die Anzahl der richtig erinnerten Wörter als Rohwert.

Nicht alle diese Rohwerte sind gleich wichtig. Die fünf Lerndurchgänge etwa werden meistens nur in ihrer Summe betrachtet, also: wie viele Wörter konnte ein Proband in allen fünf Lerndurchgängen erinnern. Ein sinnvoller Rohwert ist auch die im letzten Lerndurchgang erinnerte Zahl von Wörtern, weil sie die beste Schätzung für den Postinterferenzdurchgang gibt.

International sind folgende Messwerte gebräuchlich:

Für die Lernleistung (beide Messwerte korrelieren sehr hoch miteinander):

  • Anzahl Richtige über alle fünf Trainingsdurchgänge (im VLMT: ΣDg1-5)
  • Anzahl Richtige in Durchgang fünf (Dg5)

Für das unmittelbare Erinnern:

  • Anzahl Richtige im spontanen Abruf direkt nach dem Abruf der Interferenz-Liste (Dg6)

Für das verzögerte Erinnern:

  • Richtige im Abruf nach 30 Minuten (Dg7)

Für das verzögerte Wiedererkennen:

  • Richtige im Wiedererkennen nach 30 Minuten (W)
  • gelegentlich auch: Richtige minus Fehler (W-F)

Alle diese Messwerte werden im VLMT protokolliert. Allerdings zählen dort nicht alle zu den favorisierten Messwerten. Auf Grund von faktorenanalytischen Ergebnissen bevorzugt der VLMT relativ „reine“ Messwerte für die Faktoren Lernen, Konsolidierung und Wiedererkennen. Es sind dies die Gesamtlernleistung ΣDg1-5 für das Lernen, der Verlust nach Interferenz (Dg6-Dg5) bzw. nach zeitlicher Verzögerung (Dg7-Dg5) für die Konsolidierung und die korrigierte Wiedererkennensleistung (W-F) für das Wiedererkennen. Derartige Differenz- oder auch Prozentwerte kommen international in der Literatur durchaus vor, allerdings findet man da die unterschiedlichsten Varianten, was eine metaanalytische Verarbeitung unmöglich macht. Eine hohe Schnittmenge liefern nur die Parameter Dg5, Dg6, Dg7 und W, weshalb wir uns in TDB2Online auf diese vier konzentrieren.

In der Literatur gibt es unseres Wissens nach nur zwei Publikationen, in denen umfangreichere, altersspezifizierte Perzentilverteilungen von Testergebnissen mit VLMT oder AVLT mitgeteilt wurden. Die erste Quelle ist das VLMT-Handbuch14), das vorangegangene ähnliche Daten der Arbeitsgruppe15) erweitert, und die zweite ist eine Publikation von Ivnik et al. (1992)16), in der Daten für ältere Patienten mitgeteilt werden. Aus den Perzentildaten in diesen Publikationen ließen sich für die vier in TDB2Online betrachteten Messwerte Rohwertverteilungen zurückrechnen. Sie sind in den Abbildungen 1 bis 4 dargestellt. (Ähnliche Daten gibt es auch für die entsprechenden Subtests in CERAD und RBANS)(Link fehlt noch)

Abbildung 1: Rückgerechnete Rohwertverteilung für die Lernleistung im fünften Durchgang, siehe Text)

Für den Parameter Dg5 (Abbildung 1) standen nur Daten des VLMT-Handbuchs zur Verfügung. Bei Ivnik et al. (1992) gibt es leider weder Daten für Dg5 noch für die ΣDg1-5. Statt dessen liefern die Autoren Daten für das „Learning over Trials“, einen Parameter, der die Gesamtlernleistung (ΣDg1-5) um die Leistung im ersten Trial korrigiert. Manchmal wünscht man sich, Testautoren wären weniger kreativ bei der Erschaffung neuer Kennwerte.

Bei der Verteilung der Lernleistung im fünften Durchgang lässt sich ein massiver Deckeneffekt konstatieren, und zwar bei allen drei Altersstufen. Wenn junge Erwachsene im Durchschnitt mehr als 13 von 15 Wörtern nach fünf Lerndurchgängen spontan abrufen können, muss das so sein. Der Deckeneffekt ließe sich nur durch erheblich längere Wortlisten beheben, was allerdings sicher zu längeren Testzeiten und vermutlich auch zu Frustrationen bei Leistungsschwächeren führen würde. Da solche Wortlisten im Allgemeinen mehr zur Defizitmessung als zur Potenzialmessung eingesetzt werden, kann man mit dem Deckeneffekt bei verkürzter Testzeit leben. Ähnliche Tests, die im Demenzbereich eingesetzt werden, kommen sogar mit 10 Wörtern aus (CERAD, RBANS).

Die niedrige Testdecke hat Auswirkungen auf die Linearität der Messskala, die am oberen Ende nicht mehr gegeben ist. Leider gibt es keine verlässliche Methode, dies zu korrigieren, weil uns nur eine sehr begrenzte Menge Daten von relativ jungen Personen zur Verfügung steht. Bei anderen Testverfahren (etwa beim HCT oder TMT) gab es größere Stichproben und einen größeren Altersbereich, was beides Auswirkungen auf die Qualität der Linearisierung hat.

Abbildung 2: Rückgerechnete Rohwertverteilung für die Erinnerungsleistung im Abruf nach Interferenz, siehe Text)

Verteilungsdaten zu den Parametern der Erinnerungsleistung (Dg6 und Dg7, Abbildungen 2 und 3) lagen für beide Studien vor, womit sich ein Altersbereich bis in die 80er ergibt. Für beide Messwerte ergeben sich im Allgemeinen recht symmetrische Verteilungen. Lediglich bei den jungen Erwachsenen (Altersgruppe 15-29, feiner ist das im VLMT nicht aufgeschlüsselt) findet man auch hier einen gewissen Deckeneffekt. Eine Linearisierung wäre hier zwar möglich, würde aber einen hohen Aufwand für einen begrenzten Ertrag darstellen.

Abbildung 3: Rückgerechnete Rohwertverteilung für die Erinnerungsleistung im Abruf nach 30 Minuten, siehe Text)

Abbildung 4: Rückgerechnete Rohwertverteilung für die Wiedererkennensleistung, siehe Text)

Anders sieht das beim Wiedererkennen (Abbildung 4) aus. Hier ist der Deckeneffekt gewaltig. Hier hätte man auch die Daten der Älteren, die man braucht, um geringe und sehr geringe Leistungen Junger richtig in Leistungswerten abbilden zu können. Auch hier stellt sich aber die Frage nach dem Verhältnis von Aufwand und Ertrag. Messwerte im Wiedererkennen sind meist nur dann sinnvoll zu interpretieren, wenn sich größere Differenzen zwischen Abruf und Wiedererkennen zeigen. Dies lässt sich vermutlich auch bei der hier vorliegenden nicht-linearisierten Skalierung feststellen, auch wenn diese die zugrunde liegende Fähigkeit nicht adäquat abbildet.

Aus den im letzten Abschnitt genannten Gründen wurde auf eine weitergehende Linearisierung der am oberen Ende sicher nichtlinearen Messskalen für Dg5 und W verzichtet. Falls später umfangreichere Normierungsdaten für den VLMT zur Verfügung stehen, könnte man das Prozedere noch mal überdenken und gegebenenfalls ändern.

Für die Erstellung der TDB2Online-Leistungswertnormen wurde systematisch auf möglichst alle zugänglichen Studien zurückgegriffen, in denen AVLT-Daten gesunder Probanden enthalten waren. Auch wenn es sich bei dem AVLT um einen Test auf der Basis von sprachlichem Material handelt, schien uns ein Vergleich über Sprachgrenzen hinweg möglich zu sein. Alle derzeit existierenden Versionen des AVLT benutzen gegenständliche Wörter der jeweiligen Sprache. Bis auf wenige Ausnahmen sind es sogar die gleichen Gegenstände in den verschiedenen Sprachen.

Die Bedingung für den Einschluss einer Studie war, dass Mittelwerte und Standardabweichungen für möglichst viele der vier in TDB2Online eingeschlossenen Rohwerte berichtet wurden, und zwar für eine Stichprobe von gesunden Probanden in mehreren differenzierten Altersbereichen. In der bekannten Sammlung von Normdaten für neuropsychologische Standardverfahren, die unter dem Titel Handbook of Normative Data for Neuropsychological Assessment als Monographie 2005 in zweiter Auflage publiziert wurde (Mitrushina et al., 200517) ) sind für den AVLT 24 Studien gelistet, von denen 9 für die TDB2Online-Normen verwendet werden konnten. Es handelt sich dabei um die Studien 218), 419), 720), 921), 1122), 1223), 1524), 1725) und 2026) in der Auflistungsreihenfolge des Handbuchs. Prinzipiell hätten noch zwei weitere Studien die Einschlusskriterien erfüllt, 1927) und 2428). Beide überlappen sich aber mit anderen schon eingeschlossenen Studien (19 mit 12 und 24 mit 11), wobei die eingeschlossenen Studien zwar in beiden Fällen nur eine Unterstichprobe der nicht eingeschlossenen darstellen, allerdings im Gegensatz zu den nicht eingeschlossenen jeweils alle vier Rohwerte behandeln.

Einschließlich des VLMT-Handbuchs ließen sich damit 10 Studien lokalisieren, in denen aufgeschlüsselte Normdaten für Altersbereiche zwischen 15 und 97 Jahren angegeben waren. Die Anzahl der engeschlossenen Probanden liegt dabei je nach Rohwert zwischen 1797 (Durchgang 7) und 2839 (Durchgang 5) Personen. Tabelle 1 zeigt die wichtigsten Merkmale der eingeschlossenen Studien. Mit Hilfe einer metaanalytischen Zusammenfassung wurden diese Normen integriert und damit von den Eigenheiten der einzelnen Studie unabhängig gemacht.


Tabelle 1: Übersicht über die metaanalytisch verrechneten Normierungsstudien

Erstautor Jahr Altersbereich N Ausbildung IQ % männl. Land
Query 1983 19-81 677 11 94 100 USA
Cohen k.A. 60-89 85 14 k.A. 35 USA
Wiens 1988 20-49 209 >12 111 87 USA
Nielson 1989 20-54 101 k.A. 99 53 Dänemark
Geffen 1990 16-86 153 11 k.A. 50 Australien
Ivnik 1990 55-97 390 13 107 37 USA
Mitrushina 1991 57-85 156 14 117 40 USA
Selnes 1991 25-54 696 16 k.A. 100 USA
Savage 1992 20-76 134 >11 k.A. 50 USA
Helmstaedter 2001 15-79 276 k.A. 108 68 Deutschland


Abbildung 5 zeigt die Altersverläufe der Rohwerte im Durchgang 5, also im letzten Lerndurchgang, für die 10 Studien, die Daten dafür geliefert haben. Insgesamt gehen in die Abbildung die Daten von 2839 Personen ein.

Abbildung 5: Altersverlauf der Rohwerte in Durchgang 5

Verglichen mit anderen Verfahren und anderen Rohwerten sind die Ergebnisse der 10 Studien relativ ähnlich. Am unteren Leistungsrand liegen die Daten von Query und Cohen, am oberen die von Helmstaedter für den VLMT sowie die von Wiens und Selnes. Die mit Mquer bezeichnete Kurve zeigt die gemittelten Rohwerte im Altersverlauf. Für diese Mittelwertsbildung wurden die Studien gemäß ihrer Stichprobengröße gewichtet. Glättet man das Ganze noch mit einer gleitenden Mittelwertbildung über die Altersklassen hinweg, dann resultiert die mit Mglatt gekennzeichnete Kurve (braune Linie mit Kreisen). Die beiden anderen dickeren braunen Kurven zeigen die plus/minus 1-Sigma-Grenzen, wobei die dabei verwendeten Standardabweichungen der Einzelstudien ebenfalls über die Studien gemittelt und geglättet wurden. In den jungen, leistungsstärkeren Altersgruppen waren die Standardabweichungen systematisch niedriger. Dies ist auf die Begrenzung der Variationsmöglichkeit durch den Deckeneffekt zu erklären, der um so mehr ins Gewicht fällt, je mehr sich die durchschnittliche Leistung dem oberen Rand nähert.

Der altersassoziierte Leistungsabfall flacht sich in diesen Daten ab einem Alter von 85 wieder ab. Das ist unplausibel und vermutlich wird die Leistung der über 84-Jährigen hier überschätzt. Der Mittelwert beruht in diesem Bereich nur auf sehr geringen Stichprobengrößen und ab 90 auch nur noch auf einer einzigen Studie. In diesem Altersbereich dürfte der VLMT wohl auch nur selten verwendet werden. Im Allgemeinen dürfte die Wahl hier eher auf Wortlisten mit nur 10 Elementen fallen, wie zum Beispiel in RBANS oder CERAD.

Abbildung 6 zeigt die Altersverläufe der Rohwerte im Durchgang 6 (das ist der Durchgang nach dem Interferenzdurchgang) in den 9 Studien, die dafür Daten geliefert haben. Diese Rohwerte messen die spontane Erinnerungsleistung nach der kurzen Interferenz durch die Ablenkungsliste. Die 9 Studien fassten die Ergebnisse von insgesamt 2462 Personen zusammen.

Abbildung 6: Altersverlauf der Rohwerte in Durchgang 6

Im Vergleich zum letzten Lerntrial (Abbildung 5) ändert sich zwar die absolute Abrufleistung, nicht aber die relative Stellung der einzelnen Studien. Die gleichen Studien wie in Abbildung 6 zeichnen sich auch hier durch über- oder unterdurchschnittliche Leistungen aus. Die gewichteten Mittelwerte fassen die Studienergebnisse gut zusammen, es gibt keine groben Ausreißer.

Die durch den Deckeneffekt in Durchgang 5 bedingte kleinere Standardabweichung in den jungen Jahrgängen ist in Durchgang 6 (fast) nicht zu sehen. Hier liegen die Leistungen mit rund 11 Wörtern weit genug vom Maximum 15 entfernt, es gibt kaum noch Deckeneffekte.

Abbildung 7 zeigt die Altersverläufe der Rohwerte im Durchgang 7, dem spontanen verzögerten Abruf der zuvor gelernten Liste nach rund einer halben Stunde. Nur 7 Studien haben dafür Daten geliefert haben. Sie beruhen auf den Ergebnissen von 1797 Personen.

Abbildung 7: Altersverlauf der Rohwerte in Durchgang 7

Wenn man den Verlauf der Leistung im verzögerten Abruf (Abbildung 7) mit derjenigen im Abruf nach Interferenz (Abbildung 6) vergleicht, stellt man fest, dass der Verlauf in Abbildung 7 zunächst eher flach ist und erst ab einem Alter von 60 Jahren stärker abfällt. Man sollte das nicht überbewerten. In Abbildung 7 fehlen die Daten aus der Studie von Query & Megran29)(1983), die sowohl in der Lernleistung als auch im unmittelbaren Abruf den deutlichsten altersbedingten Abfall schon in relativ frühen Jahren gezeigt hat. Hier spiegelt die Verlaufsform wohl eher die unterschiedliche Zusammensetzung der Studienstichprobe wieder.

Abbildung 8 zeigt die Altersverläufe der Rohwerte im verzögerten Wiedererkennen nach rund einer halben Stunde. Hier gab es wieder Daten aus 9 Studien, die auf den Ergebnissen von 2738 Personen beruhen.

Abbildung 8: Altersverlauf der Rohwerte im Verzögerten Wiedererkennen

Wie schon die Verteilungsdaten in Abbildung 4 zeigten, kommen gute Wiedererkennensleistungen in allen Altersklassen vor. Für den oberen Leistungsbereich differenzieren die Leistungen im Wiedererkennen viel zu wenig. Im unteren sind sie dagegen durchaus aussagekräftig. Für den ganz geringen altersassoziierten Leistungsabfall ab etwa 65 Jahren habe ich keine Erklärung. Der Befund beruht jedenfalls nicht nur auf den Ergebnissen einer einzelnen Studie.

Die Abbildungen in diesem Abschnitt zeigen zusammenfassend die Leistungs- und Altersnormen der vier Lern- und Gedächtnistestwerte, so wie sie in TDB2Online erscheinen. Besonderheiten werden jeweils kommentiert.

Abbildung 9 zeigt in einer zusammengesetzten Grafik den Zusammenhang von Roh- und Leistungswerten sowie den (durchschnittlichen) Einfluss des Alters auf die Lernleistungen im Durchgang 5 des VLMT. Auf dieser und allen folgenden Abbildungen markieren die senkrechten Striche die Leistungswerte von 40 bis 145. Auf der schwarzen waagerechten Linie sind die Rohwerte lagerichtig eingetragen. Die abwechselnd rot und blau eingezeichneten Linien enthalten die Normgrenzen für alle Altersgruppen in der Übersicht. Die fünf Markierungen auf jeder Linie stehen für die Prozentränge 2.5, 16, 50, 84 und 97.5. Jeweils eine solche Linie, nämlich die, die der Altersgruppe des Probanden entspricht, wird (in anderer Form) im TDB2Online-Profilblatt eingezeichnet, um bei der individuellen Interpretation der Testergebnisse zu helfen. Weil die Leistungswerte aus den Ergebnissen der 20-24-jährigen jungen Erwachsenen errechnet werden, umschließen 4 der 5 Markierungen der Altersgruppe 20-24 die Leistungswerte 70, 85, 100, 115. Weil die Testdecke bei Durchgang 5 viel zu niedrig ist und bei einem Rohwert von 15 endet, stimmt dies nicht für die 5. Markierung. Sie liegt rohwertbedingt bei einem Leistungswert von 119, weil es höhere Leistungswerte nicht geben kann.

Wie im Abschnitt Linearisierung der Messskala erläutert, wurde auf eine Linearisierung bei allen vier Parametern des VLMT verzichtet. Sie hätte allerdings den Deckeneffekt beim Durchgang 5 auch nicht beheben können.

Der altersassoziierte Leistungsabfall beträgt vom jungen Erwachsenenalter bis ins Senium rund zwei Standardabweichungen. Dass der nur geringe Abfall jenseits der 80 wohl ein Artefakt ist, wurde weiter oben schon erwähnt.

Abbildung 9: Leistungswerte im Durchgang 5 mit Rohwerten und Altersnormgrenzen (siehe Text)

Die beiden Parameter für den spontanen Abruf, Durchgang 6 unmittelbar nach der Interferenzliste (Abbildung 10) und Durchgang 7 nach einer halben Stunde (Abbildung 11), kann man zusammen betrachten, sie unterscheiden sich hinsichtlich ihrer Normen kaum. Hier beträgt der altersassoziierte Leistungsabfall etwas mehr als zwei Standardabweichungen. Dass die Verlaufsform des Abfalls in beiden Maßen unterschiedlich ist, dürfte darauf zurückzuführen sein, dass eine große Studie (Query & Megran,30) 1983) nur Werte für Durchgang 6, nicht aber für Durchgang 7 geliefert hat.

Abbildung 10: Leistungswerte im Durchgang 6 mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 9)

Auch mit den Parameter Dg 6 und Dg 7 lassen sich keine sehr guten Leistungen messen, zumindest nicht bei Jüngeren. Die Messskala endet bei einem Leistungswert von 125 (Dg6) bzw. 123 (Dg 7).

Abbildung 11: Leistungswerte im Durchgang 7 mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 9)

Beim verzögerten Wiedererkennen endet die Messskala schon bei einem Leistungswert von 113. Bessere Leistungen sind nicht messbar, überhaupt ist die Messskala sehr grob, wie man an der Aufteilung der Rohwerte sieht. Ein Rohwert mehr oder weniger bedeutet jeweils eine Differenz von 11 IQ-normierten Leistungswertpunkten, das ist mehr als 2/3 Standardabweichung. (Bei Dg 6 und Dg 7 ist die rohwertbedingte basale Messgenauigkeit etwas besser, da entspricht ein Rohwertabstand rund 6 Leistungswertpunkten).

Abbildung 12: Leistungswerte im Verzögerten Wiedererkennen mit Rohwerten und Altersnormgrenzen (Erklärung der Abbildung im Text zu Abbildung 9)

AVLT und VLMT existieren, weil sie in vielen klinischen Situationen eine gute Beurteilung der Gedächtnisleistung von Erwachsenen erlauben. Sie sind pragmatische Instrumente mit hoher inhaltlicher Gültigkeit. Patient wie Befundempfänger verstehen auf Anhieb, was gemessen wird. Die Ergebnisse lassen sich häufig schon als Rohwerte vermitteln. Sobald jemand das Procedere verstanden hat und ein paar Testergebnisse mit einem Neuropsychologen diskutiert hat, kann er sich meist schnell eine Meinung über die Bedeutung eines Rohwertergebnisses bilden.

Psychometrische Feingeister haben mit diesem Verfahren dagegen Probleme. Die Messskala ist schon von den Rohwerten her viel zu grob. Die Testdecke ist so niedrig, dass nie sehr gute, beim Verzögerten Wiedererkennen kaum gute Leistungen messbar sind. Die vier Kennwerte sind untereinander hoch korreliert. An die Bedingung einer seriellen Unabhängigkeit von Testitems denkt man besser gar nicht.

Wir haben den AVLT trotzdem in TDB2Online aufgenommen. Ziel war wie immer die optimale Visualisierung eines Testergebnisses. Auch beim AVLT funktioniert die Transformation der Roh- in Leistungswerte gut. Sie hat zwei Vorteile: Man sieht auf Anhieb, wie fein der Test auflösen kann und wie sich die Ergebnisse geändert hätten, wenn dem Probanden noch ein Wort mehr eingefallen wäre. Man ist sich durch die Art der Darstellung der Testdecke unmittelbar bewusst. Zusätzlich zu diesen generellen Merkmalen geben die altersnormierten Standardwerte die notwendige Orientierung für die klinische Interpretation.


1) , 4)
Boake, C. (2000) Édouard Claparède and the Auditory Verbal Learning Test. Journal of Clinical and Experimental Neuropsychology, 22(2), 286-292
2)
Rey, A. (1941) L'examen psychologique dans les cas d'encéphalopathie traumatique. (Les problèmes). Archives de Psychologie, 28, 215-285
3)
Rey, A. (1964) L’examen clinique en psychologie Paris: Presses Universitaires de France
5)
Taylor, E. M. (1959) Psychological Appraisal of Children with Cerebral Defects. Cambridge, MA: Harvard University Press, dort Seiten 423-428.
6)
Lezak, M. D. (1976) Neuropsychological Assessment. New York: Oxford University Press
10)
Schmidt, M. (1996) Rey Auditory and Verbal Learning Test. A Handbook. Los Angeles: Western Psychological Press.
11)
Helmstaedter, C. & Durwen, H. F. (1990) VLMT: Verbaler Lern- und Merkfähigkeitstest. Ein praktikables und differenziertes Instrumentarium zur Prüfung der verbalen Gedächtnisleistungen. Schweizer Archiv für Neurologie und Psychiatrie, 141, 21-30
12)
Heubrock, D. (1992) Der Auditiv-Verbale Lerntest (AVLT) in der klinischen und experimentellen Neuropsychologie. Durchführung, Auswertung und Forschungsergebnisse. Zeitschrift für Differentielle und Diagnostische Psychologie, 3, 161-174.
13) , 14)
Helmstaedter, C., Lendt, M. & Lux, S. (2001) Verbaler Lern- und Merkfähigkeitstest Göttingen: Hogrefe
15)
Lux, S., Helmstaedter, C. & Elger, C. E. (1999) Normierungsstudie zum Verbalen Lern- und Merkfähigkeitstest (VLMT). Diagnostica, 45, 205-211
16)
Ivnik, R. J., Malec, J. F., Smith, G. E., Tangalos, E. G., Petersen, R. C., Kokmen, E. & Kurland, L. T. (1992) Mayo's Older Americans Normative Studies: Updated AVLT Norms for Ages 56 to 97. The Clinical Neuropsychologist, 6 (Supplement), 83-104
17)
Mitrushina,M., Boone,K.B., Razani,J. & d'Elia,L.F. (2005) Handbook of Normative Data for Neuropsychological Assessment. Second Edition. New York: Oxford University Press
18) , 29) , 30)
Query, W. T., & Megran, J. (1983) Age-related norms for AVLT in a male patient population. Journal of Clinical Psychology, 39, 136-138
19)
Cohen, Andres & Smolen, Personal Communication to the authors of Mitrushina et al. (1999)
20)
Wiens, A. N., McMinn, M. R., & Crossen, J. R. (1988). Rey Auditory-Verbal Learning Test: Development of norms for healthy young adults. The Clinical Neuropsychologist, 2, 67-87
21)
Nielsen H, Knudsen L, Daugbjerg O. (1989) Normative data for eight neuropsychological tests based on a Danish sample. Scandinavian Journal of Psychology, 30, 37-45
22)
Geffen, G., Moar, K. J., O’Hanlon, A. P., Clark, C. R., & Geffen, L. B. (1990). Performance measures of 16- to 86- year-old males and females on the auditory verbal learning test. The Clinical Neuropsychologist, 4, 45–63
23)
Ivnik RJ, Malec, JF, Tangalos EG, Petersen RC, Kokmen E, Kurland LT. (1990) The Auditory-Verbal Learning Test (ALVT): Norms for ages 55 years and older. Psychological Assessment, 2, 304-312
24)
Mitrushina, M., Satz, P., Chervinsky, A.B., D’Elia, L. (1991) Performance of four age groups of normal elderly on Rey Auditory Verbal Learning Test. Journal of Clinical Psychology, 47, 351-357
25)
Selnes OA, Jacobson L, Machado AM, Becker JT, Wesch J, Miller EN, Visscher B, McArthur JC. (1991) Normative data for a brief neuropsychological screening battery. Multicenter AIDS Cohort Study. Perceptual & Motor Skills, 73, 539-550
26)
Savage, R.M. & Gouvier, W.D. (1992) Rey auditory-verbal learning test: The effects of age and gender, and norms for delayed recall and story recognition trials. Archives of Clinical Neuropsychology, 7, 407-414
27)
Ivnik, R. J., Malec, J. F., Smith, G. E., Tangalos, E. G., Petersen, R. C., Kokmen, E., & Kurland, L. T. (1992) Mayo's Older Americans Normative Studies: WAIS-R norms for ages 56 to 97. The Clinical Neuropsychologist, 6(Suppl.), 1-30
28)
Miller, 2003, Personal Communication to the authors of Mitrushina et al. (1999)
Melden Sie sich an, um einen Kommentar zu erstellen.
  • dokumentation/verbaler_lern-_und_merkfaehigkeitstest.1626453095.txt.gz
  • Zuletzt geändert: 2021/07/16 16:31
  • von res