Planungstest
Autoren: Joachim Kohler & Ulrich Beck. Seit etwa 2000 in Gebrauch. Infos und Bezug über die Webseite der Autoren.
Hintergrund
Der Planungstest von Kohler und Beck ist eine computerisierte Variante des Tower of London von Shallice1). Dieser Handlungstest besteht aus einer Serie von Problemlöseaufgaben, bei denen man die Handlungen, die zur Lösung führen, ein paar Schritte im voraus planen muss. Damit erfasst der Test eine Teilkomponente des exekutiven Denkens und Handelns.
Testmaterial
Der Planungstest ist ein Computerprogramm, das auf Windows-PCs seit Windows 95 läuft. Bei Betriebssystemwechseln von Windows wurden stets entsprechende Programm-Updates hergestellt. Aktuell (2020) ist die Version 3.0, die auf allen Windows-Versionen zwischen XP und Windows 10 läuft.
Auf dem Bildschirm sieht der Patient drei unterschiedlich lange Stäbe, die 1, 2 oder 3 Kugeln aufnehmen können. Dazu gibt es drei Kugeln unterschiedlicher Farbe. Zu Beginn jeder Aufgabe sind die drei Kugeln in unterschiedlicher Weise auf die Stäbe gesteckt. Gleichzeitig sieht der Patient oberhalb auf dem Bildschirm das gewünschte Zielbild. Seine Aufgabe besteht darin, mit möglichst wenigen Zügen (mit Maus oder Trackpad) das Zielbild herzustellen. Nach zwei Übungsaufgaben werden 6 Aufgaben präsentiert, die bei optimaler Planung in 3 bis 8 Zügen zum Ergebnis führen. Der Test liegt in zwei Parallelversionen vor.
Auf der Webseite des Tests kann man eine Demoversion kostenlos herunterladen, die einen guten Eindruck der Aufgaben vermittelt.
Die Ergebnisse werden in einer Tabelle ausgegeben. Wesentliche Daten sind die Gesamtzahl der Züge, die Zahl der fehlerfrei gelösten Aufgaben, die Fehlerzahl und die Bearbeitungszeiten.
Copyright
Der Planungstest ist ein copyright-geschütztes Programm. Die Rechte liegen bei den Autoren, von denen man das Programm beziehen kann.
Durchführung
Viele Probanden bewältigen den Test in 5 bis 8 Minuten, es kann aber auch länger dauern. Eine Zeitbeschränkung gibt es nicht.
Das Programm liefert einen Instruktionstext mit, den man den Probanden auch zeigen kann. Besser ist es, ihnen an Hand der beiden Beispiele die Testaufgabe zu erläutern. Erfahrene Computerbenutzer arbeiten gerne gleich mit der Maus, bei unerfahreneren Computerbenutzern hat es sich bewährt, wenn sie die geplanten Kugelbewegungen auf dem Bildschirm zeigen und der Testleiter die entsprechende Mausbewegung macht. Inhaltlich sollte man sich an den Instruktionstext im Handbuch halten, auch wenn man die Aufgaben frei erklärt. Insbesondere ist die Instruktion wichtig, dass man die Aufgabe möglichst im Kopf planen soll, bevor man mit den Zügen beginnt.
Testrohwerte
Die Ergebnistabelle der Computerauswertung liefert viele Rohwerte, die aber hoch miteinander korrelieren. In TDB2Online werden drei davon ausgewertet:
- Gesamtzahl der Züge: Dies ist der brauchbarste Indikator für die Gesamtleistung im Test. Der Wertebereich startet bei 33 (die Mindestanzahl von Zügen über alle 6 Aufgaben). Rohwerte über 50 werden nur selten erreicht. Der Wertebereich umfasst also rund 20 Werte.
- Anzahl der richtig (sprich: mit minimaler Zugzahl) gelösten Aufgaben: Hier sind Rohwerte zwischen 0 und 6 möglich, in der Praxis kommen fast nur welche zwischen 2 und 6 vor.
- Gesamtzahl der Fehler: Theoretisch ist diese Skala nach oben offen, realistisch sind Zahlen zwischen 0 und 3.
Für Verteilungsanalysen eignet sich nur die Gesamtzahl der Züge, die beiden anderen Rohwerte sind für die qualitative Interpretation der Testleistung gelegentlich wichtig, wegen des kleinen Werteumfangs aber nicht für elaboriertere Skalierungen zu gebrauchen.
Normuntersuchungen
In der ersten Version des Planungstests gab es nur vorläufige Normen an wenigen Probanden. In der Version 2.0.0.3 von circa 2003 lagen die Daten von 241 gesunden Personen im Altersbereich zwischen 16 und 65 Jahren vor. Nur diese Daten werden in TDB2Online verwendet.
Seit der Version 3.0 des Planungstests sind neue Normen in die Auswertung integriert. Sie stammen von 419 Personen, die im Rahmen der Normierung der MNND (Materialien und Normwerte für die Neuropsychologische Diagnostik) in der deutschsprachigen Schweiz gesammelt wurden. Der Vorteil für den Planungstest besteht darin, dass die Normen nach Altersstufen getrennt vorliegen (in Zehn-Jahres-Klassen von 20 bis 60 Jahren). Der gravierende Nachteil besteht darin, dass die Normen im Handbuch des Planungstests nicht dokumentiert, sondern (irgendwie) in die automatische Auswertung integriert sind. Statt der bisherigen Rohwerte für „Richtig gelöste Aufgaben“ und „Qualität der Lösung“ (eine Umformung der Anzahl der benötigten Züge für alle Aufgaben) werden jetzt „alters- und bildungskorrigierte Rohwerte“ (sic) ausgegeben. Diese werden dann an Hand einer ebenfalls nicht weiter dokumentierten Umrechnungstabelle in z-Werte und Prozentränge umgerechnet. Schon wegen der zwangsweise durchgeführten Bildungskorrektur sind diese Normen für die Darstellung in TDB2Online ungeeignet.
Es bleibt ein kleiner Trost: Die Erweiterung der Stichprobe von 241 auf 419 Personen dürfte nicht so durchschlagend sein, dass man große Änderungen erwarten kann (dokumentiert sind sie ohnehin nicht), und in dem relativ engen Altersbereich der neuen Normierung dürften die Alterseffekte noch nicht so gravierend sein, wie es in höheren Altersklassen der Fall wäre.
Die in TDB2Online ausgewerteten Kennwerte lassen sich auch aus den neuen Ergebnisblättern der Version 3 gewinnen. Benötigt werden die Anzahl der Züge insgesamt, die Anzahl der Aufgaben, die mit der geringstmöglichen Anzahl an Zügen gelöst wurden, und die Anzahl der Fehler. Alle drei Daten lassen sich aus den Ergebnissen im Mittelteil des Auswertungsblatts ableiten.
Verteilungseigenschaften der Rohwerte
siehe ausführliche Dokumentation
Linearisierung der Messskala
siehe ausführliche Dokumentation
Leistungs- und Altersnormen im Überblick
siehe ausführliche Dokumentation
Diskussion
Wie bei vielen Testverfahren, die exekutives Denken messen, ist auch beim Planungstest die qualitative Beurteilung des Testverhaltens sehr wichtig. Die messbaren Leistungsparameter sind nur im Rahmen des beobachteten Testverhaltens vernünftig einzuordnen.
Von den drei hier dargestellten Parametern messen zwei (Richtige und Fehler) nur extrem grob. Dabei ist die Anzahl der mit minimaler Zugzahl gelösten Aufgaben immerhin ein wichtiger Parameter für die Lösungsgüte im Gesamttest. Bei den Fehlern gilt dies nicht unbedingt. Der Planungstest nimmt Mausklicks sehr genau. Fasst man zum Beispiel die untere von zwei Kugeln an und will sie bewegen, dann wird das als Fehler gewertet. Bei mit Maus oder Trackpad Ungeübten (die gibt es noch) kann das schnell zu mehreren Fehlern führen. Insofern teile ich nicht die Meinung der Testautoren im Handbuch, dass die Zahl der Regelbrüche der sensitivste Parameter zur Identifizierung exekutiver Störungen in diesem Test ist. Selbst wenn - wie oben im Abschnitt Durchführung erwähnt - bei ungeübten Personen der Testleiter selbst die Maus führt, kommen ungewollte Fehler vor.
Von den psychometrischen Eigenschaften ist die Gesamtzahl der Züge sicher der beste Parameter, zumindest für die Beschreibung defizitären Planungsverhaltens. Der nutzbare Rohwertbereich ist so groß, dass ein Rohwert etwa 4,5 Leistungswerten entspricht, also etwa dem Drittel einer Standardabweichung. Im unteren Leistungsbereich erlaubt das eine hinreichend feine Messung, im oberen ist die Testdecke bei einem Leistungswert von 115 erreicht.
Auch bei der Gesamtzahl der Züge gilt, dass eine genaue Beobachtung des Testverhaltens für die Beurteilung der Testwerte ausschlaggebend ist.