dokumentation:planungstest

Dies ist eine alte Version des Dokuments!


Planungstest

Autoren: Joachim Kohler & Ulrich Beck. Seit etwa 2000 in Gebrauch. Infos und Bezug über die Webseite der Autoren.

Der Planungstest von Kohler und Beck ist eine computerisierte Variante des Tower of London von Shallice1). Dieser Handlungstest besteht aus einer Serie von Problemlöseaufgaben, bei denen man die Handlungen, die zur Lösung führen, ein paar Schritte im voraus planen muss. Damit erfasst der Test eine Teilkomponente des exekutiven Denkens und Handelns.

Der Planungstest ist ein Computerprogramm, das auf Windows-PCs seit Windows 95 läuft. Bei Betriebssystemwechseln von Windows wurden stets entsprechende Programm-Updates hergestellt. Aktuell (2020) ist die Version 3.0, die auf allen Windows-Versionen zwischen XP und Windows 10 läuft.

Auf dem Bildschirm sieht der Patient drei unterschiedlich lange Stäbe, die 1, 2 oder 3 Kugeln aufnehmen können. Dazu gibt es drei Kugeln unterschiedlicher Farbe. Zu Beginn jeder Aufgabe sind die drei Kugeln in unterschiedlicher Weise auf die Stäbe gesteckt. Gleichzeitig sieht der Patient oberhalb auf dem Bildschirm das gewünschte Zielbild. Seine Aufgabe besteht darin, mit möglichst wenigen Zügen (mit Maus oder Trackpad) das Zielbild herzustellen. Nach zwei Übungsaufgaben werden 6 Aufgaben präsentiert, die bei optimaler Planung in 3 bis 8 Zügen zum Ergebnis führen. Der Test liegt in zwei Parallelversionen vor.

Auf der Webseite des Tests kann man eine Demoversion kostenlos herunterladen, die einen guten Eindruck der Aufgaben vermittelt.

Die Ergebnisse werden in einer Tabelle ausgegeben. Wesentliche Daten sind die Gesamtzahl der Züge, die Zahl der fehlerfrei gelösten Aufgaben, die Fehlerzahl und die Bearbeitungszeiten.

Der Planungstest ist ein copyright-geschütztes Programm. Die Rechte liegen bei den Autoren, von denen man das Programm beziehen kann.

Viele Probanden bewältigen den Test in 5 bis 8 Minuten, es kann aber auch länger dauern. Eine Zeitbeschränkung gibt es nicht.

Das Programm liefert einen Instruktionstext mit, den man den Probanden auch zeigen kann. Besser ist es, ihnen an Hand der beiden Beispiele die Testaufgabe zu erläutern. Erfahrene Computerbenutzer arbeiten gerne gleich mit der Maus, bei unerfahreneren Computerbenutzern hat es sich bewährt, wenn sie die geplanten Kugelbewegungen auf dem Bildschirm zeigen und der Testleiter die entsprechende Mausbewegung macht. Inhaltlich sollte man sich an den Instruktionstext im Handbuch halten, auch wenn man die Aufgaben frei erklärt. Insbesondere ist die Instruktion wichtig, dass man die Aufgabe möglichst im Kopf planen soll, bevor man mit den Zügen beginnt.

Die Ergebnistabelle der Computerauswertung liefert viele Rohwerte, die aber hoch miteinander korrelieren. In TDB2Online werden drei davon ausgewertet:

  1. Gesamtzahl der Züge: Dies ist der brauchbarste Indikator für die Gesamtleistung im Test. Der Wertebereich startet bei 33 (die Mindestanzahl von Zügen über alle 6 Aufgaben). Rohwerte über 50 werden nur selten erreicht. Der Wertebereich umfasst also rund 20 Werte.
  2. Anzahl der richtig (sprich: mit minimaler Zugzahl) gelösten Aufgaben: Hier sind Rohwerte zwischen 0 und 6 möglich, in der Praxis kommen fast nur welche zwischen 2 und 6 vor.
  3. Gesamtzahl der Fehler: Theoretisch ist diese Skala nach oben offen, realistisch sind Zahlen zwischen 0 und 3.

Für Verteilungsanalysen eignet sich nur die Gesamtzahl der Züge, die beiden anderen Rohwerte sind für die qualitative Interpretation der Testleistung gelegentlich wichtig, wegen des kleinen Werteumfangs aber nicht für elaboriertere Skalierungen zu gebrauchen.

In der ersten Version des Planungstests gab es nur vorläufige Normen an wenigen Probanden. In der Version 2.0.0.3 von circa 2003 lagen die Daten von 241 gesunden Personen im Altersbereich zwischen 16 und 65 Jahren vor. Nur diese Daten werden in TDB2Online verwendet.

Seit der Version 3.0 des Planungstests sind neue Normen in die Auswertung integriert. Sie stammen von 419 Personen, die im Rahmen der Normierung der MNND (Materialien und Normwerte für die Neuropsychologische Diagnostik) in der deutschsprachigen Schweiz gesammelt wurden. Der Vorteil für den Planungstest besteht darin, dass die Normen nach Altersstufen getrennt vorliegen (in Zehn-Jahres-Klassen von 20 bis 60 Jahren). Der gravierende Nachteil besteht darin, dass die Normen im Handbuch des Planungstests nicht dokumentiert, sondern (irgendwie) in die automatische Auswertung integriert sind. Statt der bisherigen Rohwerte für „Richtig gelöste Aufgaben“ und „Qualität der Lösung“ (eine Umformung der Anzahl der benötigten Züge für alle Aufgaben) werden jetzt „alters- und bildungskorrigierte Rohwerte“ (sic) ausgegeben. Diese werden dann an Hand einer ebenfalls nicht weiter dokumentierten Umrechnungstabelle in z-Werte und Prozentränge umgerechnet. Schon wegen der zwangsweise durchgeführten Bildungskorrektur sind diese Normen für die Darstellung in TDB2Online ungeeignet.

Es bleibt ein kleiner Trost: Die Erweiterung der Stichprobe von 241 auf 419 Personen dürfte nicht so durchschlagend sein, dass man große Änderungen erwarten kann (dokumentiert sind sie ohnehin nicht), und in dem relativ engen Altersbereich der neuen Normierung dürften die Alterseffekte noch nicht so gravierend sein, wie es in höheren Altersklassen der Fall wäre.

Die in TDB2Online ausgewerteten Kennwerte lassen sich auch aus den neuen Ergebnisblättern der Version 3 gewinnen. Benötigt werden die Anzahl der Züge insgesamt, die Anzahl der Aufgaben, die mit der geringstmöglichen Anzahl an Zügen gelöst wurden, und die Anzahl der Fehler. Alle drei Daten lassen sich aus den Ergebnissen im Mittelteil des Auswertungsblatts ableiten.

Aus den Normen für die Version 2.0.0.3 des Planungstests lässt sich die Rohwertverteilung dieses Kennwerts in der Eichstichprobe (N=214) rückrechnen. Abbildung 1 zeigt diese Daten.

Abbildung 1: Rückgerechnete Verteilung der Gesamtzahl der Züge in der Version 2.0.0.3 des Planungstests

Man sieht eine unimodale Verteilung, die stark rechtsgiplig ist und einen deutlichen Deckeneffekt zeigt. Auf die obere Hälfte der Verteilung entfallen gerade mal vier Rohwerte (33-36), hier ist die Messgenauigkeit schwach. Defizite in der Planungsfähigkeit kann der Test hingegen differenzierter messen.

Da der Test nur 6 Aufgaben enthält, erstreckt sich der theoretische Rohwertbereich nur von 0 bis 6, der praktisch vorkommende eher von 2 bis 6. Dieser Parameter misst also nur sehr grob.

Das gleiche gilt für die Fehlerzahl, die in der Eichstichprobe eigentlich nur zwischen 0 und 2 schwanken.

Für die drei hier verwendeten Kennwerte (Zahl der Züge, Richtige und Fehler) liefert die Computerauswertung des Planungstests Rohwerte und Standardwerte. Die Standardwerte sind offensichtlich normale, linear transformierte Standardwerte mit Mittelwert 100 und Standardabweichunge 10. Sie werden in TDB2Online aus den Rohwerten in hier übliche Form der Leistungswerte (1000;15) transformiert.

Abbildung 2 zeigt die Leistungsnormen für die Gesamtzahl der Züge. Da es keine Altersdifferenzierung in der Eichstichprobe gibt, fallen die Altersnormen mit den Leistungsnormen zusammen.

Abbildung 2: Roh- und Leistungswerte für die Gesamtzahl der Züge

In der Eichstichprobe werden im Durchschnitt 36,3 Züge zur Lösung aller 6 Aufgaben gebraucht. Dies entspricht dem Leistungswert 100. Leistungswerte über 115 sind nicht erreichbar, dort liegt die Testdecke. Nach unten ist die Differenzierungsfähigkeit dagegen recht gut.

Abbildung 3 zeigt die Leistungsnormen für die Anzahl der mit minimal möglicher Zugzahl gelösten Aufgaben („Richtige“ im Ergebnisblatt des Plaungstests).

Abbildung 3: Roh- und Leistungswerte für die Anzahl der mit minimaler Zugzahl gelösten Aufgaben

Mit minimaler Zugzahl werden im Durchschnitt der Eichstichprobe rund 4,6 der 6 Aufgaben gelöst. Die Testwerte in diesem Kennwert erlauben nur eine grobe Abschätzung: zwischen zwei Rohwerten liegen mehr als eine Standardabweichung. Der höchstmögliche Leistungswert (bei 6 Richtigen) ist 124.

Das oben Gesagte gilt umso mehr für die Anzahl der Fehler, deren Altersnormen in Abbildung 4 dargestellt sind.

Abbildung 4: Roh- und Leistungswerte für die Gesamtzahl der Fehler

Bei der leistungsstärkeren Hälfte der Eichstichprobe kommen praktisch keine Fehler vor, der höchst erreichbare Leistungswert bei 0 Fehlern liegt deshalb nur bei rund 105. Schon 2 Fehler führen in der Normstichprobe zu einem sehr niedrigen Leistungswert von 61.

Wie bei vielen Testverfahren, die exekutives Denken messen, ist die qualitative Beurteilung des Testverhaltens auch beim Planungstest sehr wichtig. Die messbaren Leistungsparameter sind auch nur im Rahmen des beobachteten Testverhaltens vernünftig einzuordnen.

Von der drei hier dargestellten Parametern messen zwei (Richtige und Fehler) nur extrem grob. Dabei ist die Anzahl der mit minimaler Zugzahl gelösten Aufgaben immerhin ein wichtiger Parameter für die Lösungsgüte im Gesamttest. Bei den Fehlern gilt dies nicht unbedingt. Der Planungstest nimmt Mausklicks sehr genau. Fasst man zum Beispiel die untere von zwei Kugeln an und will sie bewegen, dann wird das als Fehler gewertet. Das kann aber bei mit der Maus Ungeübten (auch das gibt es heute noch) schnell zu mehreren Fehlern führen. Insofern teile ich nicht die Meinung der Testautoren im Handbuch, dass die Zahl der Regelbrüche der sensitivste Parameter zur Identifizierung exekutiver Störungen in diesem Test ist. Selbst wenn - wie oben im Abschnitt Durchführung erwähnt - bei ungeübten Personen der Testleiter selbst die Maus führt, kommen ungewollte Fehler vor.

Von den psychometrischen Eigenschaften ist die Gesamtzahl der Züge sicher der beste Parameter, zumindest für die Beschreibung defizitären Planungsverhaltens. Der nutzbare Rohwertbereich ist so groß, dass ein Rohwert etwa 4,5 Leistungswerten entspricht, also etwa dem Drittel einer Standardabweichung. Im unteren Leistungsbereich erlaubt das eine hinreichend feine Messung, im oberen ist allerdings die Testdecke bei einem Leistungswert von 115 erreicht.

Auch hier gilt aber, dass eine genaue Beobachtung des Testverhaltens für die Beurteilung der Testwerte ausschlaggebend ist.


1)
Shallice, T. (1982). Specific impairments of planning. Philosophical Transactions ot the Royal Society of London, 298, 199-209.
Melden Sie sich an, um einen Kommentar zu erstellen.
  • dokumentation/planungstest.1627830690.txt.gz
  • Zuletzt geändert: 2021/08/01 15:11
  • von res