Abkürzung: VLMT
Das Lernen und spätere Abprüfen von Wortlisten war sicher seit der zweiten Hälfte des 19. Jahrhunderts, vermutlich auch schon früher, als Methode zur Prüfung der Gedächtnisleistung bekannt. Die heute wohl am häufigsten verwendete Form solcher Prüfungen, nämlich mehrmals nacheinander eine Liste von rund 15 Wörtern lernen und nach einer Ablenkung aus dem Gedächtnis abrufen lassen, wurde erstmals 1919 von dem Genfer Psychologen Claparède publiziert (siehe dazu1)). Sein Schüler André Rey führte in den Vierziger Jahren des letzten Jahrhunderts klinische Untersuchungen mit diesem Gedächtnistest durch2). Eine ausführliche Darstellung des (modifizierten) Verfahrens erschien erst viel später in einer Buchpublikation 3). Zu dieser Zeit wurde der Test in Übersetzungen von Klinikern in anderen Ländern angewandt, ohne dass viel darüber publiziert wurde.4)
In die amerikanische Psychologie wurde das Verfahren unter dem Namen Auditory Verbal Learning Test (AVLT) zunächst von Taylor5) eingeführt. Durch die Aufnahme in Lezaks Handbuch zur Neuropsychologischen Diagnostik6) wurde es später allgemein bekannt. Die heutigen Versionen des AVLT und des VLMT stützen sich weitgehend auf die von Taylor benutzte Prozedur.
Heute ist der AVLT einer der weltweit am häufigsten benutzten Gedächtnistests. Er wird in allen Lehr- und Handbüchern der neuropsychologischen Diagnostik besprochen7) 8) 9). Schmidt hat 1996 die amerikanische empirische Literatur zum AVLT in einer Monographie zusammengetragen.10)
Deutsche Versionen des AVLT wurden zunächst in Zeitschriftenaufsätzen als VLMT11) bzw. AVLT12) vorgestellt. Der VLMT erschien 2001 als komplettes und anwendungsreifes Testverfahren13).
Im Folgenden stützen wir uns vorwiegend auf den VLMT. Er dürfte wohl auch die am meisten benutzte deutsche Form des AVLT sein. Bei den Normen werden wir allerdings weitere Literatur einbeziehen.
Wollte man einen beliebigen „auditorischen Wörterlerntest“ anwenden, brauchte man dazu lediglich 45 Hauptwörter (klassischerweise solche, die reale Gegenstände beschreiben). Die ersten 15 bilden eine Liste, die in fünf Durchgängen gelernt wird, die nächsten 15 werden als sogenannte Interferenzliste benutzt und werden danach einmal gelernt. Dann müssen die zuerst gelernten Wörter erinnert werden. Zuletzt bilden die letzten 15 der 45 Wörter zusammen mit den ersten 15 eine Liste von 30 Wörtern, in der die zuerst Gelernten wiederzuerkennen sind.
Angesichts der Vorteile, die die Standardisiertheit des Testmaterials bietet, ist es in den meisten Fällen höchst sinnvoll, auf publizierte Versionen zurückzugreifen, wenn es solche gibt. Seit 2001 liegt mit dem Verbalen Lern- und Merkfähigkeitstest (VLMT) eine publizierte deutschsprachige Version vor, die leicht anwendbar ist und alle Kriterien der Objektivität der Durchführungsbedingungen erfüllt. Zusätzlich kann man mit dem VLMT neben den klassischen Testwerten noch eine Reihe von weiteren Zusatzscores erheben, die allerdings in TDB2Online nicht weiter dargestellt werden. Auch ohne diesen Zusatznutzen denken wir, dass die Objektivität der Durchführungsbedingungen und der Komfort durch die anwendungsreife Aufarbeitung den Preis für das professionelle Testmaterial allemal wert ist. Es besteht beim VLMT aus dem Testhandbuch, Protokollbögen und Ergebnisbögen.
Über die vielen Jahrzehnte, die der AVLT schon existiert, wurden natürlich verschiedene Arten der Testdurchführung verbreitet. Allerdings hat sich eine von ihnen als Quasi-Standard etabliert, ihr folgt auch der VLMT:
Es gibt zwei Wortlisten mit jeweils 15 Substantiven für die Darbietung, eine davon (A) ist die Lernliste, die andere (B) die Interferenzliste. Die Wiedererkennungsliste besteht aus den beiden Listen A und B und weiteren 20 Distraktorwörtern, von denen 10 mit den Wörtern in A semantisch und 10 phonetisch ähnlich sind.
Die Liste A wird fünf Mal vorgelesen. Der Proband soll nach jedem Vorlesen möglichst viele Wörter aus dem Gedächtnis abrufen. Dieser Teil des Tests liefert (mindestens) zwei Rohwerte für die Lernleistung, nämlich die Anzahl der in allen fünf Durchgängen aus dem Gedächtnis wiedergegebenen Wörter (Dg1-5 in der Terminologie des VLMT) und die Anzahl der im letzten Durchgang wiedergegebenen Wörter (Dg5). Danach wird die Interferenzliste ein Mal vorgelesen, wie zuvor soll sie direkt anschließend wiedergegeben werden. Anschließend soll der Proband noch einmal - ohne erneutes Vorlesen - die zuerst gelernten Wörter der Liste A erinnern. Die Anzahl der hierbei erinnerten Wörter liefert einen ersten Rohwert für die Gedächtnisleistung, im VLMT heißt dieses Maß einfach Dg6, in vielen englischen Publikationen wird es auch als Post-Interference Recall (PIR) angeführt. Nach 30 Minuten, die mit nonverbalen Tests gefüllt werden sollen, erfolgt wiederum ein freier Abruf der Liste A ohne erneute Vorgabe. Die Anzahl der hierbei erinnerten Wörter ist der Rohwert für das Verzögerte Erinnern (Dg7 im VLMT, sonst auch oft Delayed Recall). Direkt danach wird die Wiedererkennensliste vorgelesen und der Proband muss mit Ja antworten, wenn er ein Wort aus der ursprünglich gelernten Liste A wiedererkennt. Der entsprechende Messwert ist in den meisten Verfahren die Anzahl der korrekt wiedererkannten Wörter (Recognition Memory oder Delayed Recognition). Diesen Messwert gibt es im VLMT auch, allerdings wird dort die Anzahl der korrekt wiedererkannten Wörter minus die Anzahl der Fehler als Messwert bevorzugt.
Der AVLT und damit auch der VLMT liefert traditionell für jeden Wiedergabedurchgang die Anzahl der richtig erinnerten Wörter als Rohwert.
Nicht alle diese Rohwerte sind gleich wichtig. Die fünf Lerndurchgänge etwa werden meistens nur in ihrer Summe betrachtet, also: wie viele Wörter konnte ein Proband in allen fünf Lerndurchgängen erinnern. Ein sinnvoller Rohwert ist auch die im letzten Lerndurchgang erinnerte Zahl von Wörtern, weil sie die beste Schätzung für den Postinterferenzdurchgang gibt.
International sind folgende Messwerte gebräuchlich:
Für die Lernleistung (beide Messwerte korrelieren sehr hoch miteinander):
Für das unmittelbare Erinnern:
Für das verzögerte Erinnern:
Für das verzögerte Wiedererkennen:
Alle diese Messwerte werden im VLMT protokolliert. Allerdings zählen dort nicht alle zu den favorisierten Messwerten. Auf Grund von faktorenanalytischen Ergebnissen bevorzugt der VLMT relativ „reine“ Messwerte für die Faktoren Lernen, Konsolidierung und Wiedererkennen. Es sind dies die Gesamtlernleistung ΣDg1-5 für das Lernen, der Verlust nach Interferenz (Dg6-Dg5) bzw. nach zeitlicher Verzögerung (Dg7-Dg5) für die Konsolidierung und die korrigierte Wiedererkennensleistung (W-F) für das Wiedererkennen. Derartige Differenz- oder auch Prozentwerte kommen international in der Literatur durchaus vor, allerdings findet man da die unterschiedlichsten Varianten, was eine metaanalytische Verarbeitung unmöglich macht. Eine hohe Schnittmenge liefern nur die Parameter Dg5, Dg6, Dg7 und W, weshalb wir uns in TDB2Online auf diese vier konzentrieren.
siehe ausführliche Dokumentation
Aus den im letzten Abschnitt genannten Gründen wurde auf eine weitergehende Linearisierung der am oberen Ende sicher nichtlinearen Messskalen für Dg5 und W verzichtet. Falls später umfangreichere Normierungsdaten für den VLMT zur Verfügung stehen, könnte man das Prozedere noch mal überdenken und gegebenenfalls ändern.
Für die Erstellung der TDB2Online-Leistungswertnormen wurde systematisch auf möglichst alle zugänglichen Studien zurückgegriffen, in denen AVLT-Daten gesunder Probanden enthalten waren. Auch wenn es sich bei dem AVLT um einen Test auf der Basis von sprachlichem Material handelt, schien uns ein Vergleich über Sprachgrenzen hinweg möglich zu sein. Alle derzeit existierenden Versionen des AVLT benutzen gegenständliche Wörter der jeweiligen Sprache. Bis auf wenige Ausnahmen sind es sogar die gleichen Gegenstände in den verschiedenen Sprachen.
Die Bedingung für den Einschluss einer Studie war, dass Mittelwerte und Standardabweichungen für möglichst viele der vier in TDB2Online eingeschlossenen Rohwerte berichtet wurden, und zwar für eine Stichprobe von gesunden Probanden in mehreren differenzierten Altersbereichen. In der bekannten Sammlung von Normdaten für neuropsychologische Standardverfahren, die unter dem Titel Handbook of Normative Data for Neuropsychological Assessment als Monographie 2005 in zweiter Auflage publiziert wurde (Mitrushina et al., 200514) ) sind für den AVLT 24 Studien gelistet, von denen 9 für die TDB2Online-Normen verwendet werden konnten. Es handelt sich dabei um die Studien 215), 416), 717), 918), 1119), 1220), 1521), 1722) und 2023) in der Auflistungsreihenfolge des Handbuchs. Prinzipiell hätten noch zwei weitere Studien die Einschlusskriterien erfüllt, 1924) und 2425). Beide überlappen sich aber mit anderen schon eingeschlossenen Studien (19 mit 12 und 24 mit 11), wobei die eingeschlossenen Studien zwar in beiden Fällen nur eine Unterstichprobe der nicht eingeschlossenen darstellen, allerdings im Gegensatz zu den nicht eingeschlossenen jeweils alle vier Rohwerte behandeln.
Einschließlich des VLMT-Handbuchs ließen sich damit 10 Studien lokalisieren, in denen aufgeschlüsselte Normdaten für Altersbereiche zwischen 15 und 97 Jahren angegeben waren. Die Anzahl der engeschlossenen Probanden liegt dabei je nach Rohwert zwischen 1797 (Durchgang 7) und 2839 (Durchgang 5) Personen. Tabelle 1 zeigt die wichtigsten Merkmale der eingeschlossenen Studien. Mit Hilfe einer metaanalytischen Zusammenfassung wurden diese Normen integriert und damit von den Eigenheiten der einzelnen Studie unabhängig gemacht.
Tabelle 1: Übersicht über die metaanalytisch verrechneten Normierungsstudien
Erstautor | Jahr | Altersbereich | N | Ausbildung | IQ | % männl. | Land |
---|---|---|---|---|---|---|---|
Query | 1983 | 19-81 | 677 | 11 | 94 | 100 | USA |
Cohen | k.A. | 60-89 | 85 | 14 | k.A. | 35 | USA |
Wiens | 1988 | 20-49 | 209 | >12 | 111 | 87 | USA |
Nielson | 1989 | 20-54 | 101 | k.A. | 99 | 53 | Dänemark |
Geffen | 1990 | 16-86 | 153 | 11 | k.A. | 50 | Australien |
Ivnik | 1990 | 55-97 | 390 | 13 | 107 | 37 | USA |
Mitrushina | 1991 | 57-85 | 156 | 14 | 117 | 40 | USA |
Selnes | 1991 | 25-54 | 696 | 16 | k.A. | 100 | USA |
Savage | 1992 | 20-76 | 134 | >11 | k.A. | 50 | USA |
Helmstaedter | 2001 | 15-79 | 276 | k.A. | 108 | 68 | Deutschland |
siehe ausführliche Testdokumentation
siehe ausführliche Testdokumentation
AVLT und VLMT existieren, weil sie in vielen klinischen Situationen eine gute Beurteilung der Gedächtnisleistung von Erwachsenen erlauben. Sie sind pragmatische Instrumente mit hoher inhaltlicher Gültigkeit. Patient wie Befundempfänger verstehen auf Anhieb, was gemessen wird. Die Ergebnisse lassen sich häufig schon als Rohwerte vermitteln. Sobald jemand das Procedere verstanden hat und ein paar Testergebnisse mit einem Neuropsychologen diskutiert hat, kann er sich meist schnell eine Meinung über die Bedeutung eines Rohwertergebnisses bilden.
Psychometrische Feingeister haben mit diesem Verfahren dagegen Probleme. Die Messskala ist schon von den Rohwerten her viel zu grob. Die Testdecke ist so niedrig, dass nie sehr gute, beim Verzögerten Wiedererkennen kaum gute Leistungen messbar sind. Die vier Kennwerte sind untereinander hoch korreliert. An die Bedingung einer seriellen Unabhängigkeit von Testitems denkt man besser gar nicht.
Wir haben den AVLT trotzdem in TDB2Online aufgenommen. Ziel war wie immer die optimale Visualisierung eines Testergebnisses. Auch beim AVLT funktioniert die Transformation der Roh- in Leistungswerte gut. Sie hat zwei Vorteile: Man sieht auf Anhieb, wie fein der Test auflösen kann und wie sich die Ergebnisse geändert hätten, wenn dem Probanden noch ein Wort mehr eingefallen wäre. Man ist sich durch die Art der Darstellung der Testdecke unmittelbar bewusst. Zusätzlich zu diesen generellen Merkmalen geben die altersnormierten Standardwerte die notwendige Orientierung für die klinische Interpretation.