ktn:leistungswert

Leistungswert

Psychologische Testverfahren „messen“ nicht in dem Sinne, wie physikalische Messungen das tun, auf einer physikalisch definierten Messskala (Lit dazu). Im Sinne einer „pragmatischen Messung“ entstehen bei der Messung zwei Messebenen:

  1. Zunächst werden „Rohwerte“ gemessen, meist in Form von Zeitmaßen und/oder Häufigkeiten (Anzahl richtig gelöster Aufgaben, Zeit für die Lösung). Manche Tests begnügen sich mit diesen Werten und liefert Interpretationshinweise direkt auf Rohwertebene. Ein Beispiel dafür ist die Mini Mental State Examination von Folstein (1975), die in grober Form Richtwerte für die Klassifizierung der Leistung gibt (28-30 Punkte ist unauffällig, 24-27 Punkte ist „leichte kognitive Störung“ usw.).
  2. Dann werden diese Rohwerte in Standardwerte transformiert, die hinsichtlich der Zielpopulation des Tests standardisiert sind. Häufig kommt Berücksichtigung des Alters, gelegentlich auch anderer Parameter (Bildung, Geschlecht) hinzu. Diese Standardisierung soll die Interpretation erleichtern, weil sie sofort und unmittelbar den Bezug auf die Herkunftspopulation herstellt.

Bei der Standardisierung an Hand von Teilstichproben (zum Beispiel Altersklassen) geht die eindeutige Umrechnung von Roh- in Standardwerte verloren. Es gibt dann keine Skala mehr außer den Rohwerten, auf der man Leistungen unterschiedlicher Altersklassen oder auch unterschiedlich alter ProbandInnen vergleichen kann. Dieses Manko wird in den Anwendungsbereichen der psychologischen Diagnostik als Defizit empfunden, und zwar um so mehr, je größer die Schwankungen bei unterschiedlichen Teilstichproben sind und je wichtiger die Vergleiche zwischen diesen Teilstichproben werden (Kinder unterschiedlichen Alters zum Beispiel oder Leistungsvergleiche zwischen kognitiv Gesunden und Dementen.

usw.

Die Wechsler-Bellevue-Skala brachten zum Zeitpunkt ihrer Publikation vor allem zwei Neuerungen:

  1. Wechsler erstellte aus den unterschiedlichsten Einzeltests, die zuvor auch meist einzeln oder innerhalb unterschiedlicher Testbatterien normiert worden waren, eine einheitliche Testbatterie, die zusammen normiert wurde. Erst durch die gemeinsame Normierung wurden Leistungsunterschiede in zwei Tests überhaupt beurteilbar. Wenn man zwei getrennt normierte Tests anwendet (sagen wir mal einen Aufmerksamkeitstest und einen Gedächtnistest) und ein Proband in der Aufmerksamkeit um eine Standardabweichung besser ist als im Gedächtnis, dann kann das bei der üblich schlechten Qualität der Normierung genausogut auf die Unterschiede in den Normstichproben zurückzuführen sein. Was es wirklich für den Probanden heißt, kann man ohne „klinische Erfahrung“ mit solchen Tests dann nicht wissen. Bei einer gemeinsamen Normierung, die alle Subtests einschließt, ist dies anders: selbst wenn die Normierung per se schlecht ist, wären trotzdem die Ergebnisse zwischen zwei Subtests vergleichbar und damit auch klinisch interpretierbar, auch ohne klinische Erfahrungen mit diesen speziellen Tests.
  2. Zudem sorgte Wechsler mit der Erfindung der Wertpunkte für zweierlei: zum einen sorgte er durch die Flächentransformation der Rohpunkte in normalverteilte Wertpunkte für eine rudimentäre Linearisierung nicht-linearer und/oder aus Zeit- und Mengenmaßen zusammengesetzter Rohwerte und zum zweiten schuf er damit ein „Leistungsmaß“, das für die gesamte Zielpopulation des Tests verbindlich die absolute Leistung eines Probanden alters- und testübergreifend quantifizieren konnte.

blablaweiter

Melden Sie sich an, um einen Kommentar zu erstellen.
  • ktn/leistungswert.txt
  • Zuletzt geändert: 2006/08/10 09:04
  • von 127.0.0.1