dokumentation:benton-test

Dies ist eine alte Version des Dokuments!


Benton Visual Retention Test

Abkürzung: BVRT

Arthur Benton beschrieb 1945 in einem Zeitschriftenaufsatz1) einen einfachen, klinisch anwendbaren visuellen Gedächtnistest, der ein Jahr später unter dem gleichen Titel als Test bei der Psychological Corporation erschien. In diesem Test soll man sich nach kurzer Betrachtungszeit einfache visuelle Vorlagen einprägen und unmittelbar danach aus dem Gedächtnis zeichnen. Benton entwickelte diesen Test als Ergänzung zu den damals schon lange existierenden verbalen Gedächtnistests. Das Verfahren fand schnell internationale Verbreitung. 1955 erschien eine revidierte Fassung mit Parallel-Serien der Vorlagen. Diese war Grundlage für die von Otfried Spreen bearbeitete erste deutsche Fassung2), die unter dem vereinfachenden Namen Benton-Test erschien und gelegentlich auch nur mit BT abgekürzt wird. Inzwischen liegt die achte deutsche Auflage vor3). In den neueren Auflagen hat sich an der Grundform des Tests praktisch nichts verändert, in die Handbücher wurden vor allem neuere Norm- und Validitätsdaten eingearbeitet. Eine konsolidierte Zusammenführung der diversen Normen wurde in den Handbüchern allerdings nie versucht.

Das Copyright für die deutsche Bearbeitung des Verfahrens liegt bei Hogrefe. Handbuch und Testmaterial sind über die Testzentralen in Deutschland oder der Schweiz erhältlich.

Das deutsche Testkit enthält drei Vorlagenhefte. Sie enthalten unter anderem drei Vorlagenserien mit jeweils 10 Zeichnungen. Diese drei Vorlagenserien sind mit C, D. und E bezeichnet. Serie C ist die am häufigsten benutzte Vorlagenserie. Die Serien D und E werden normalerweise nur bei Wiederholungsmessungen eingesetzt.

Neben diesem klassischen Testmaterial enthält das deutsche Testkit Vorlagen, die zum Wiedererkennen (statt dem Zeichnen) der Bilder verwendet werden können, sowie erweiterte Vorlagen mit jeweils 20 Zeichnungen. Die Normsituation für diese Erweiterungen ist deutlich schlechter als für die Originalversion. Sie sind deshalb nicht in TDB2Online eingeschlossen.

Die Standardinstruktion für die Testdurchführung ist die im Handbuch als Instruktion A bezeichnete. Sie sieht eine Präsentationszeit von 10 Sekunden vor, sofort anschließend an die Präsentation soll die Zeichnung aus dem Gedächtnis reproduziert werden.

Schon seit den 50er Jahren gibt es neben der Standardinstruktion viele Varianten. Bei der Instruktion B wird die Präsentationszeit auf 5 Sekunden verringert. Instruktion C ist kein Gedächtnistest, sondern verlangt nur das Abzeichnen der Vorlagen. Instruktion D fügt eine Pause von 15 Sekunden zwischen Präsentation und Reproduktion ein. Die meisten Normuntersuchungen beziehen sich ausschließlich auf die Form C und die Instruktion A. Die zusätzlichen Varianten können bei der klinischen Anwendung höchst sinnvoll sein (zum Beispiel, um die Zeichenfähigkeit der Personen zu prüfen, unabhängig vom visuellen Gedächtnis). Für eine psychometrische Aufarbeitung sind deren Normen aber zu schwach.

Der Benton-Test verlangt bei der Auswertung eine sorgfältige Prüfung der Reproduktionen. Dazu muss man mit den Auswertungsrichtlinien vertraut sein und über eine gewisse Erfahrung mit dem Test verfügen. Es gibt je einen Rohwert für die „Richtigen“, also die Anzahl der fehlerfrei reproduzierten Vorlagen, und die „Fehler“, die Anzahl der beim Zeichnen gemachten Fehler (bei einer Vorlage können mehrere Fehler gemacht werden). In TDB2Online werden nur diese beiden Rohwerte verwendet.

Die Aufarbeitung der Benton-Normen stützt sich auf die in Mitrushina et al. (2005)4) analysierten Normierungsstudien, nicht auf ein darüber hinausgehendes Literaturstudium. Soweit das aus den dort referierten Studien erkennbar war, gab es keine Studien, die Perzentilverteilungen berichtet haben. Natürlich lassen sich leicht Vermutungen über die Verteilungsformen aufstellen: Wenn bei jungen Erwachsenen die erwartete Anzahl der richtigen Reproduktionen um 8 herum liegt (bei einem Rohwertbereich von 0 bis 10), dann wird die Rohwertverteilung stark schief sein, weil sie an die obere Decke stößt. Wir haben aber keine realen Daten dazu und können deshalb nur mit den mitgeteilten Mittelwerten und Standardabweichungen rechnen. Eine Linearisierung der Messskalen für Richtige und Fehler ist damit nicht möglich.

Für die Erstellung der TDB2Online-Leistungswertnormen wurde auf gut zugängliche Studien zurückgegriffen, in denen Daten gesunder Probanden enthalten waren, und zwar unabhängig vom Untersuchungsort. Ein Vergleich über Sprachgrenzen hinweg ist bei einem visuellen Test wie dem Benton-Test relativ problemlos. Wir begrenzten die Suche auf die Vorlagenserie C und die Standardinstruktion A (10 Sekunden Präsentation, unmittelbar danach Reproduktion). Neben dem deutschen Handbuch für den Benton-Test (mir lag die siebte Auflage von 1996 vor)5) wurde die Sammlung von Normdaten für neuropsychologische Standardverfahren von Mitrushina et al., 20056) durchgesehen. Tabelle 1 zeigt die wichtigsten Merkmale der eingeschlossenen Studien.

Tabelle 1: Übersicht über die metaanalytisch verrechneten Normierungsstudien

Nr. Erstautor Jahr Altersbereich N Ausbildung Land
1 Sivan7) 1996 15-69 ca. 1500 k.A. USA
2 Steck8) 1990 15-74 252 k.A. D
3 Youngjohn9) 1993 18-84 1121 16 Jahre USA
4 Robertson-Tchabo10) 1989 20-89 1643 well-educated USA
5 Klonoff11) 1965 80-92 172 7 Jahre USA
6 Prakash12) 1992 15-64 660 k.A. Indien
7 Coman13) 2002 55-89 156 13 Jahre USA

Man sieht, dass viele der Studien ziemlich alt sind, bis 1965 zurück. Auch gibt es nur gelegentlich gute Informationen zum Bildungsstand der Stichprobe, wobei die berichteten durchschnittlichen Schulzeiten erheblich schwanken. Dabei muss man allerdings auch den zeitlichen Bezug sehen: Im ländlichen Amerika (Klonoff & Kennedy, 1965) der 1960er Jahre waren 7 Jahre Schulbildung bei sehr alten Probanden völlig normal.

Zu den Studien im Einzelnen:

  1. Im deutschen Handbuch werden die Daten von mehreren Studien berichtet, wenn auch sehr knapp und nicht sehr transparent. In den ersten beiden Tabellen des Kapitels über die Normwerte werden „Erwartungswerte“ für Richtige Lösungen (Tabelle 4.1, Seite 66) und Fehler (Tabelle 4.2, Seite 67) für drei bzw. vier Altersgruppen und sechs bzw. acht Gruppen mit unterschiedlicher (geschätzter oder gemessener) intellektueller Leistungsfähigkeit mitgeteilt. Sie entstammen drei Untersuchungen, einer von Benton selbst an „über 600“ Probanden, die zuerst in der dritten englischen Auflage des Tests (1963)14) publiziert wurde, einer zweiten von Arenberg (1978)15) an 769 Probanden und einer dritten von Randall et al. (1988)16) an 120 Probanden. Die Daten dieser drei Untersuchungen wurden nach nicht weiter spezifizierter Methoke zusammengerechnet und führten zu den Normtabellen 4.1 und 4.2. Standardabweichungen werden in den Tabellen nicht mitgeteilt. Von den drei Orginaluntersuchungen, die den Tabellen zugrunde liegen, haben nur Randall et al. (1988) Standardabweichungen mitgeteilt, allerdings sind diese nicht altersspezifiziert. Ohne Standardabweichungen lassen sich die Daten für Normierungszwecke nicht gebrauchen. Wie bei manchen anderen neuropsychologischen Einzeltests sind die Normwerte im Handbuch häufig nach intellektueller Leistungsfähigkeit geschichtet. Die Normen von TDB2 und TDB2Online beziehen sich immer auf möglichst bevölkerungsrepräsentative Stichproben (mehr dazu in der TDB2Online-Dokumentation). Auch aus diesem Grund lassen sich die Normen in den Tabellen 4.1 und 4.2 nicht weiter verwenden. In den nächsten beiden Tabellen des Handbuchs (Tabellen 4.3 und 4.4) Handbuch sind die Ergebnisse zweier weiterer Untersuchungen gelistet:
  2. Steck et al. haben 199017) Daten einer deutschen Untersuchung berichtet. Für die Normierung konnten die Daten von 252 gesunden Probanden im Alter zwischen 15 und 74 verwendet werden. Steck et al. (1990) haben alle drei Vorlagensets hintereinander in Zufallsreihenfolge verwendet. Die Daten wurden deshalb schlicht gedrittelt.
  3. Youngjohn et al. (1993)18) berichteten Normwerte getrennt für drei Gruppen mit unterschiedlicher intellektueller Leistung. Für TDB2Online wurden die Werte über diese Gruppen hinweg gewichtet gemittelt.
  4. Die nächsten vier Untersuchungen sind nicht im Handbuch, sondern in Mitrushina et al. (2005) gelistet. Robertson-Tchabo & Arenberg publizierten 198919) Daten der Baltimore Longitudinal Study of Aging mit 1643 Probanden, geschichtet nach Alter, Schulbildung und Geschlecht. Die Daten liegen nur für die Fehler vor. Für TDB2 wurden sie innerhalb jeder Altersklasse über Geschlecht und Bildung gewichtet gemittelt.
  5. Klonoff & Kennedy untersuchten 196520) 172 Personen zwischen 80 und 92 Jahren mit dem Benton-Test.
  6. Von einer indischen Untersuchung (Prakash & Bhogle, 1992)21) liegen Daten an 660 Personen zwischen 15 und 64 Jahren vor, allerdings nur für Richtige, nicht für Fehler.
  7. Coman et al. berichteten 200222) Daten von 156 Personen im Alter zwischen 55 und 89 Jahren. Diese Daten liegen nur für Richtige vor.

Mitrushina et al. (2005) listen noch weitere Publikationen mit Daten der Baltimore Study23). Dabei scheint es sich aber um Teilstichproben der umfangreichen Publikation von Robertson-Tchabo zu handeln, weshalb wir diese hier weggelassen haben.

Mit Hilfe einer metaanalytischen Zusammenfassung wurden diese Normen integriert und damit von den Eigenheiten der einzelnen Studie relativ unabhängig gemacht.

Abbildung 1 zeigt die Altersverläufe der Richtigen für die fünf Studien, die Daten dafür geliefert haben. Die dicker gezeichnete Linie stellt die gewichteten Mittelwerte der fünf Studien dar, geglättet mit einem gleitenden Mittelwert dritter Ordnung. Zusätzlich sind die Werte aus der Tabelle 4.1 des Handbuchs (Bereich IQ 95-109) mit abgebildet.

Abbildung 1: Altersverlauf der Richtigen

Es erstaunt, wie eng die Werte der fünf Studien aus drei Ländern beieinander liegen. Auch die Werte aus der Tabelle 4.1 des Handbuchs liegen in einem vernünftigen Bereich, wenn man die grobe Altersstrukturierung (nur 3 Altersgruppen) berücksichtigt.

Abbildung 2 zeigt die entsprechenden Daten der Fehler. Hier liegen für die metaanalytische Integration nur vier Studien vor.

Abbildung 2: Altersverlauf der Fehler

Auch hier liegen die Werte der vier Studien sehr eng beieinander. Die Handbuchdaten der Tabelle 4.2 (mittlerer IQ-Bereich) fügen sich ebenso zwanglos ein.

Inhaltlich zeigt sich der erwartbare altersbedingte Leistungsverlust im visuellen Gedächtnis schon relativ früh im Altersverlauf, in den Fehlern noch etwas deutlicher als in den Richtigen.

Die Abbildungen 3 und 4 zeigen in zusammengesetzten Grafiken den Zusammenhang von Roh- und Leistungswerten sowie den (durchschnittlichen) Einfluss des Alters auf die Anzahl der richtigen Lösungen (Abbildung 3) und auf die Anzahl der Fehler (Abbildung 4) im BVRT. In beiden Abbildungen markieren die senkrechten Striche die Leistungswerte von 40 bis 145. Auf der schwarzen waagerechten Linie sind die Rohwerte lagerichtig eingetragen. Die abwechselnd rot und blau eingezeichneten Linien enthalten die Normgrenzen für alle Altersgruppen in der Übersicht. Die fünf Markierungen auf jeder Linie stehen für die Prozentränge 2.5, 16, 50, 84 und 97.5. Jeweils eine solche Linie, nämlich die, die der Altersgruppe des Probanden entspricht, wird (in anderer Form) im TDB2Online-Profilblatt eingezeichnet, um bei der individuellen Interpretation der Testergebnisse zu helfen. Weil die Leistungswerte aus den Ergebnissen der 20-24-jährigen jungen Erwachsenen errechnet werden, umschließen 4 der 5 Markierungen der Altersgruppe 20-24 die Leistungswerte 70, 85, 100, 115. Weil die Testdecke bei den 10 Vorlagen des Benton-Tests zu niedrig ist, um sehr hohe Leistungen messen zu können, liegt die 5. Markierung nicht bei 130. Die maximale Zahl der Richtigen, also ein Rohwert von 10, liegt bei einem Leistungswert von 122. Die minimale Zahl der Fehler, also ein Rohwert von 0, entspricht einem Leistungswert von 121.

Abbildung 3: Leistungswerte für die Richtigen im Benton-Test mit Rohwerten und Altersnormgrenzen (siehe Text)

Abbildung 4: Leistungswerte für die Fehler im Benton-Test mit Rohwerten und Altersnormgrenzen (siehe Text)

Beide Kennwerte des Benton-Tests reagieren im Altersverlauf sehr sensitiv. Der altersassoziierte Leistungsabfall beträgt vom jungen Erwachsenenalter bis ins Senium rund zwei Standardabweichungen.

Der Benton-Test ist - etwas Erfahrung in Vorgabe und Auswertung vorausgesetzt - ein ökonomischer Test zur Prüfung des visuellen Gedächtnisses in klinischen Settings. Er mag etwas von seiner früheren Beliebtheit eingebüßt haben, die zum Teil auf unrealistische Erwartungen hinsichtlich einer Sensitivität für alle möglichen neuropsychologischen Beeinträchtigungen gründete. Er ist aber immer noch ein guter Test, wenn - sei es in Ergänzung zum verbalen Gedächtnis oder auch unabhängig davon - eine Prüfung des visuellen Gedächtnisses erfolgen soll.

Ähnlich wie beim VLMT sind die psychometrische Eigenschaften des Tests hingegen nur mäßig. Die Testdecke ist ziemlich niedrig, weshalb sehr gute Leistungen nicht messbar sind. Die beiden Kennwerte korrelieren sehr hoch miteinander. Speziell bei den Fehlern muss man eine sehr hohe Abhängigkeit der Varianz vom Mittelwert (über das Alter hinweg) feststellen, eine Folge der fehlenden Linearisierung der Skala.


1)
Benton, A. L. (1945). A visual retention test for clinical use. Archives of Neurology and Psychiatry, 54(3), 212-216.
2)
Benton, A.L. (1961). Der Benton-Test. Deutsche Bearbeitung von Otfried Spreen. Bern: Huber
3)
Sivan, A. B. & Spreen, O. (2009). Der Benton-Test. Handbuch. Achte Auflage. Bern: Huber
4) , 6)
Mitrushina,M., Boone,K.B., Razani,J. & d'Elia,L.F. (2005) Handbook of Normative Data for Neuropsychological Assessment. Second Edition. New York: Oxford University Press
5) , 7)
Sivan, A. B. & Spreen, O. (1996). Der Benton-Test. Handbuch. Siebente Auflage. Bern: Huber
8) , 17)
Steck, P., Beer, U., Frey, A. Frühschütz, H. G., & Körner, A. (1990). Testkritische Überprüfung einer 30-Item-Version des Visual Retention Tests nach A. L. Benton. Diagnostica, 36, 38-49.
9) , 18)
Youngjohn, J. R., Larrabee, G. J., & Crook, T. H. (1993). New adult age- and education-correction norms for the Benton Visual Retention Test. Clinical Neuropsychologist, 7(2), 155-160.
10) , 19) , 23)
Robertson-Tchabo, E. A., & Arenberg, D. (1989). Assessment of memory in older adults. In: D. Hunt & J. Clyde (Eds.) Testing Older Adults: A Reference Guide for Geropsychological Assessments. Austin, TX: Pro-Ed.
11) , 20)
Klonoff, H., & Kennedy, M. (1965). Memory and perceptual functioning in octogenarians and nonagenarians in the community. Journal of Gerontology, 20, 328-333.
12) , 21)
Prakash, I. J., & Bhogle, S. (1992). Benton's Visual Retention Test: Norms for different age groups. Journal of the Indian Academy of Applied Psychology, 18(1-2), 33-36.
13) , 22)
Coman, E., Moses, J. A., Jr., Kraemer, H. C. Friedman, L., Benton, A. L., & Yesavage, J. (2002). Interactive influences on BVRT performance level: Geriatric considerations. Archives of Clinical Neuropsychology, 17(6), 595-610.
14)
Benton, A. L. (1963). Revised Visual Retention Test: Clinical and Experimental Applications (3rd. ed.). New York: Psychological Corporation.
15)
Arenberg, D. (1978). Differences and changes with age in the Benton Visual Retention Test. Journal of Gerontology, 33, 534-540.
16)
Randall, C. M., Dickson, A. L., & Plasay, M. T. (1988) The relationship between intellectual function and adult performance on the Benton Visual Retention Test. Cortex, 24, 277-289
Melden Sie sich an, um einen Kommentar zu erstellen.
  • dokumentation/benton-test.1626533800.txt.gz
  • Zuletzt geändert: 2021/07/17 14:56
  • von res