dokumentation

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
Nächste ÜberarbeitungBeide Seiten der Revision
dokumentation [2020/07/16 16:29] – [Grenzen des Messbereichs] resdokumentation [2021/08/25 16:51] – [Ausblick] res
Zeile 5: Zeile 5:
 Die ausführliche Dokumentation besteht aus zwei Teilen: Die ausführliche Dokumentation besteht aus zwei Teilen:
   * Die vorliegende Seite beschreibt den Hintergrund, die Konzepte und die allgemeine Verfahrensweise von TDB2Online   * Die vorliegende Seite beschreibt den Hintergrund, die Konzepte und die allgemeine Verfahrensweise von TDB2Online
-  * Eine Beschreibung der einzelnen Tests, insbesondere der bei der Aufarbeitung angewendeten Methoden, ist über den Navigationspunkt [[TDB2OnlineApp|App und Test-Doku]] zu finden und nur für angemeldete professionelle Nutzer zugänglich.+  * Eine Beschreibung der einzelnen Tests, insbesondere der bei der Aufarbeitung angewendeten Methoden, ist über den Navigationspunkt [[TDB2OnlineApp|App und Test-Doku]] zu finden und nur für angemeldete professionelle Nutzer zugänglich. Eine Kurzbeschreibung der Tests ist auch ohne Anmeldung über die [[start#testverfahren|Startseite]] zugänglich.
  
 Zur schnellen Information gibt es zwei Kurzfassungen: Zur schnellen Information gibt es zwei Kurzfassungen:
Zeile 20: Zeile 20:
  
 Die Dokumentation ist nicht für psychodiagnostische Laien bestimmt. Sie geht davon aus, dass Leserinnen und Leser eine Vorbildung in Psychodiagnostik haben, wie sie im Allgemeinen durch ein Hochschulstudium der Psychologie erworben wird. Relevante Lehrbücher wären zum Beispiel Schmidt-Atzert & Amelang (2012)((Schmidt-Atzert, L. & Amelang, M. (2012). //Psychologische Diagnostik// (5., vollst. überarb. u. erw. Aufl.). Heidelberg: Springer.)) für den Gesamtbereich der psychologischen Diagnostik und Moosbrugger & Kevala (2012)((Moosbrugger, H. & Kelava, A. (Hrsg.). (2012). //Testtheorie und Fragebogenkonstruktion//. (2. Aufl.) Heidelberg: Springer.)) für den testtheoretisch-statistischen Hintergrund. Die Dokumentation ist nicht für psychodiagnostische Laien bestimmt. Sie geht davon aus, dass Leserinnen und Leser eine Vorbildung in Psychodiagnostik haben, wie sie im Allgemeinen durch ein Hochschulstudium der Psychologie erworben wird. Relevante Lehrbücher wären zum Beispiel Schmidt-Atzert & Amelang (2012)((Schmidt-Atzert, L. & Amelang, M. (2012). //Psychologische Diagnostik// (5., vollst. überarb. u. erw. Aufl.). Heidelberg: Springer.)) für den Gesamtbereich der psychologischen Diagnostik und Moosbrugger & Kevala (2012)((Moosbrugger, H. & Kelava, A. (Hrsg.). (2012). //Testtheorie und Fragebogenkonstruktion//. (2. Aufl.) Heidelberg: Springer.)) für den testtheoretisch-statistischen Hintergrund.
- 
-Aus dieser allgemeinen Dokumentation heraus, die auch ohne Anmeldung lesbar ist, wird zur Erläuterung an manchen Stellen auf spezielle Dokumentationstexte zu einzelnen Tests verwiesen. Diese Verweise sind nur für angemeldete und zugelassene Fachleute lesbar. 
- 
 ====== Konzepte ====== ====== Konzepte ======
  
Zeile 30: Zeile 27:
  
 Rohwerte sind die elementaren Werte, mit denen eine Leistung in einem Testverfahren beurteilt wird. Sie hängen von der Art der Aufgabe ab. Beispiele dafür sind: Rohwerte sind die elementaren Werte, mit denen eine Leistung in einem Testverfahren beurteilt wird. Sie hängen von der Art der Aufgabe ab. Beispiele dafür sind:
-  * Anzahl richtiger Lösungen in einem Wissenstest (Beispiel: Subtest Allgemeines Wissen in den [[tests:wechsler_adult_intelligence_scale_-_fourth_edition|Wechsler-Testbatterien]]) +  * Anzahl richtiger Lösungen in einem Wissenstest (Beispiel: Subtest Allgemeines Wissen in den [[dokumentation:wechsler_adult_intelligence_scale_-_fourth_edition|Wechsler-Testbatterien]]) 
-  * Anzahl der Fehler in einer Kategorisierungsaufgabe (Beispiel: [[tests:halstead_category_test|Halstead Category Test]]) +  * Anzahl der Fehler in einer Kategorisierungsaufgabe (Beispiel: [[dokumentation:halstead_category_test|Halstead Category Test]]) 
-  * Zeit für die Durchführung in Sekunden bei einer visokonstruktiven Aufgabe (Beispiel: [[tests:trail_making_tests|Trail Making Tests]]) +  * Zeit für die Durchführung in Sekunden bei einer visokonstruktiven Aufgabe (Beispiel: [[dokumentation:trail_making_tests|Trail Making Tests]]) 
-  * Anzahl richtig reproduzierter Wörter in einem Gedächtnistest (Bespiel: [[tests:verbaler_lern-_und_merkfaehigkeitstest|Verbaler Lern- und Merkfähigkeitstest]]) +  * Anzahl richtig reproduzierter Wörter in einem Gedächtnistest (Bespiel: [[dokumentation:verbaler_lern-_und_merkfaehigkeitstest|Verbaler Lern- und Merkfähigkeitstest]]) 
-  * Differenz zwischen der Anzahl richtig wiedererkannter Wörter minus Anzahl der fälschlich "wiedererkannten" Wörter in einer Wiedererkennensaufgabe (Bespiel: [[tests:verbaler_lern-_und_merkfaehigkeitstest|Verbaler Lern- und Merkfähigkeitstest]]) +  * Differenz zwischen der Anzahl richtig wiedererkannter Wörter minus Anzahl der fälschlich "wiedererkannten" Wörter in einer Wiedererkennensaufgabe (Bespiel: [[dokumentation:verbaler_lern-_und_merkfaehigkeitstest|Verbaler Lern- und Merkfähigkeitstest]]) 
-  * Punkte in einer komplexen Problemlöseaufgabe, die nach Richtigkeit und Schnelligkeit der Durchführung bewertet wird (Beispiel: Subtest Mosaiktest in den [[tests:wechsler_adult_intelligence_scale_-_fourth_edition|Wechsler Testbatterien]])+  * Punkte in einer komplexen Problemlöseaufgabe, die nach Richtigkeit und Schnelligkeit der Durchführung bewertet wird (Beispiel: Subtest Mosaiktest in den [[dokumentation:wechsler_adult_intelligence_scale_-_fourth_edition|Wechsler Testbatterien]])
  
 Rohwerte sind testspezifisch. Die Punkte im Mosaiktest zum Beispiel haben numerisch nichts mit den Zeiten im Trail-Making-Test zu tun, sie sind nicht einmal in die gleiche Richtung gepolt. Mit Rohwerten lassen sich Leistungen zwischen Verfahren (und damit zwischen verschiedenen Fähigkeitsbereichen) nicht vergleichen. Rohwerte sind testspezifisch. Die Punkte im Mosaiktest zum Beispiel haben numerisch nichts mit den Zeiten im Trail-Making-Test zu tun, sie sind nicht einmal in die gleiche Richtung gepolt. Mit Rohwerten lassen sich Leistungen zwischen Verfahren (und damit zwischen verschiedenen Fähigkeitsbereichen) nicht vergleichen.
Zeile 43: Zeile 40:
 ==== Standardisierte Testwerte ==== ==== Standardisierte Testwerte ====
  
-Standardisierte Testwerte verlassen die "physikalische" Ebene der Rohwerte. Sie beruhen auf einem Vergleich: Die Leistung des oder der aktuell Getesteten wird mit der Leistung einer Normstichprobe verglichen, die den Test zuvor schon absolviert hat. Im Idealfall stammen die Daten dazu aus Normierungsuntersuchungen an Zufallsstichproben, bei denen einige hundert Personen pro Altersgruppe getestet werden. Standardisierte Testwerte geben also die relative Stellung eines Probanden innerhalb einer sinnvollen populationsbezogenen Vergleichsgruppe an. Im Allgemeinen werden zur Standardisierung Skalen benutzt, die aus der Normalverteilung abgeleitet sind. In TDB2Online wird für alle Tests einheitlich die IQ-Skala mit dem Mittelwert 100 und der Standardabweichung 15 benutzt.+Standardisierte Testwerte verlassen die numerische Ebene der Rohwerte. Sie beruhen auf einem Vergleich: Die Leistung des oder der aktuell Getesteten wird mit der Leistung einer Normstichprobe verglichen, die den Test zuvor schon absolviert hat. Im Idealfall stammen die Daten dazu aus Normierungsuntersuchungen an Zufallsstichproben, bei denen einige hundert Personen pro Altersgruppe getestet werden. Standardisierte Testwerte geben also die relative Stellung eines Probanden innerhalb einer sinnvollen populationsbezogenen Vergleichsgruppe an. Im Allgemeinen werden zur Standardisierung Skalen benutzt, die aus der Normalverteilung abgeleitet sind. In TDB2Online wird für alle Tests einheitlich die IQ-Skala mit dem Mittelwert 100 und der Standardabweichung 15 benutzt.
  
 Je nach Wahl der Bezugsgruppe für den Vergleich lassen sich im Folgenden mehrere Arten von Testwerten unterscheiden, die unterschiedliche Anwendungsaspekte repräsentieren.  Je nach Wahl der Bezugsgruppe für den Vergleich lassen sich im Folgenden mehrere Arten von Testwerten unterscheiden, die unterschiedliche Anwendungsaspekte repräsentieren. 
Zeile 77: Zeile 74:
 Die IQ-Skala wird meistens bei der Messung kognitiver Fähigkeiten benutzt, die T-Skala eher bei Persönlichkeitstests. Die in Deutschland bei Intelligenztests durchaus beliebte Standardwertskala mit einem Mittelwert von 100 und einer Standardabweichung von 10 ist international kaum gebräuchlich. Die IQ-Skala wird meistens bei der Messung kognitiver Fähigkeiten benutzt, die T-Skala eher bei Persönlichkeitstests. Die in Deutschland bei Intelligenztests durchaus beliebte Standardwertskala mit einem Mittelwert von 100 und einer Standardabweichung von 10 ist international kaum gebräuchlich.
  
-Die besonderen numerischen Eigenschaften der IQ-Skala lassen sich an Hand der **Abbildung 1** erkennen. Am wichtigsten ist hier der Vergleich zwischen den Werten der IQ-Skala und den Werten der Prozentrangskala. Man sieht, dass ein IQ-Wert von 130 einem Prozentrang von 97,7 entspricht, was nichts anderes bedeutet, als dass 97,7 Prozent der Vergleichsstichprobe einen niedrigeren IQ als 130 haben und die restlichen 2,3 Prozent einen höheren. Zu jedem IQ-Wert gibt es einen entsprechenden Prozentrangwert, den man ausführlicheren Tabellen entnehmen kann.+Die besonderen numerischen Eigenschaften der IQ-Skala lassen sich an Hand der **Abbildung 1** erkennen. Am wichtigsten ist hier der Vergleich zwischen den Werten der IQ-Skala und den Werten der Prozentrangskala. Man sieht, dass ein IQ-Wert von 130 einem Prozentrang von 97,7 entspricht, was nichts anderes bedeutet, als dass 97,7 Prozent der Vergleichsstichprobe einen niedrigeren IQ als 130 haben und die restlichen 2,3 Prozent einen höheren. Zu jedem IQ-Wert gibt es einen entsprechenden Prozentrangwert, den man berechnen oder ausführlicheren Tabellen entnehmen kann.
  
 {{:normalverteilung_615.png|}} {{:normalverteilung_615.png|}}
Zeile 200: Zeile 197:
 **Abbildung 2** zeigt das an einem Beispielfall eines 31-jährigen Probanden mit niedriger Begabung, der in sämtlichen Subtests des HAWIE-R lediglich vier Wertpunkte erzielte. Die klassischen, nicht altersabhängigen Wertpunkte des HAWIE-R haben einen Mittelwert von 10 und eine Standardabweichung von 3. Vier Wertpunkte entsprechen deshalb einem Wert von 70 auf der IQ-Skala. Wegen der niedrigen Interkorrelation der Subtests betragen aber die tatsächlich bestimmten Teil-IQs statt der naiv erwarteten 70 nur 57 für den Verbalteil und 57 für den Handlungsteil. Weil der Effekt auf die Testmetrik umso größer wird, je mehr Subtests einbezogen werden, beträgt der Gesamt-IQ nur 48. Auf Grund der Subtestergebnisse hätte man einen von 70 erwartet, nach den Teil-IQs einen von 57. **Abbildung 2** wurde mit einem alten Programm  erzeugt, das die nach Handbuchvorschrift berechneten Wertpunkte und IQs darstellte und lediglich den altersspezifisch erwarteten Normbereich zusätzlich einzeichnete. **Abbildung 2** zeigt das an einem Beispielfall eines 31-jährigen Probanden mit niedriger Begabung, der in sämtlichen Subtests des HAWIE-R lediglich vier Wertpunkte erzielte. Die klassischen, nicht altersabhängigen Wertpunkte des HAWIE-R haben einen Mittelwert von 10 und eine Standardabweichung von 3. Vier Wertpunkte entsprechen deshalb einem Wert von 70 auf der IQ-Skala. Wegen der niedrigen Interkorrelation der Subtests betragen aber die tatsächlich bestimmten Teil-IQs statt der naiv erwarteten 70 nur 57 für den Verbalteil und 57 für den Handlungsteil. Weil der Effekt auf die Testmetrik umso größer wird, je mehr Subtests einbezogen werden, beträgt der Gesamt-IQ nur 48. Auf Grund der Subtestergebnisse hätte man einen von 70 erwartet, nach den Teil-IQs einen von 57. **Abbildung 2** wurde mit einem alten Programm  erzeugt, das die nach Handbuchvorschrift berechneten Wertpunkte und IQs darstellte und lediglich den altersspezifisch erwarteten Normbereich zusätzlich einzeichnete.
  
-{{:hawie-r-4wertpunkte.png?630|}}+{{:hawie-r-4wertpunkte-592.png|}}
  
 **Abbildung 2: Beispiel für die unterschiedliche Metrik von Subtests und IQs beim HAWIE-R** **Abbildung 2: Beispiel für die unterschiedliche Metrik von Subtests und IQs beim HAWIE-R**
Zeile 279: Zeile 276:
  
   - Die IQ-Skalierung dürfte die bei Leistungstests am häufigsten benutzte sein. Die T-Wert-Skalierung (50;10) ist zwar bei Persönlichkeitstests sehr gebräuchlich, aber nicht bei Intelligenztests und weniger bei sonstigen Leistungstests. Die "SW"- Skalierung (100;10) ist zwar bei deutschen Intelligenztests durchaus gebräuchlich, international aber kaum zu finden.   - Die IQ-Skalierung dürfte die bei Leistungstests am häufigsten benutzte sein. Die T-Wert-Skalierung (50;10) ist zwar bei Persönlichkeitstests sehr gebräuchlich, aber nicht bei Intelligenztests und weniger bei sonstigen Leistungstests. Die "SW"- Skalierung (100;10) ist zwar bei deutschen Intelligenztests durchaus gebräuchlich, international aber kaum zu finden.
-  - Bei der verbalen Interpretation von Testbefunden hat die IQ-Skala den Vorteil, dass die mittleren 50 Prozent der Verteilung, ein Bereich, der in der Statistik häufig als Durchschnittsbereich (Interquartildifferenz) gewertet wird, zwischen den markanten Werten 90 und 110 liegt. Auch ein weiterer Durchschnittsbereich (plus/minus eine Standardabweichung) ist mit den Werten 85 und 115 noch gut markiert, auch wenn man bei stetig verteilten Variablen gute Gründe braucht, um fast 70 Prozent einer Verteilung als „Durchschnitt“ zu bezeichnen. Die IQ-Skala macht es einem damit relativ leicht, Wechslers verbale Charakterisierung der kognitiven Leistungshöhe zu übernehmen (siehe dazu die Tabelle 1 im Abschnitt [[dokumentation#An der Normalverteilung orientierte Skalen|"An der Normalverteilung orientierte Skalen"]]).+  - Bei der verbalen Interpretation von Testbefunden hat die IQ-Skala den Vorteil, dass die mittleren 50 Prozent der Verteilung, ein Bereich, der in der Statistik häufig als Durchschnittsbereich (Interquartildifferenz) gewertet wird, zwischen den markanten Werten 90 und 110 liegt. Auch ein weiterer Durchschnittsbereich (plus/minus eine Standardabweichung) ist mit den Werten 85 und 115 noch gut markiert, auch wenn man bei stetig verteilten Variablen gute Gründe braucht, um fast 70 Prozent einer Verteilung als „Durchschnitt“ zu bezeichnen. Die IQ-Skala macht es einem damit relativ leicht, Wechslers verbale Charakterisierung der kognitiven Leistungshöhe zu übernehmen (siehe dazu die Tabelle 1 im Abschnitt [[dokumentation#An der Normalverteilung orientierte Skalen|"An der Normalverteilung orientierte Skalen"]]). Mit sieben Stufen von "extrem niedrig" über "sehr niedrig", "niedrig", "durchschnittlich", "hoch", "sehr hoch" bis zu "extrem hoch" lässt sich eine Leistung meistens ausreichend gut verbal charakterisieren, zumal Zwischentöne wie etwa "am unteren Rand einer durchschnittlichen Leistung" die Aussage weiter qualifizieren können. Der Messgenauigkeit kognitiver Tests wird eine solche Charakterisierung jedenfalls besser gerecht als das oft Gelesene "unterdurchschnittlich", "durchschnittlich", "überdurchschnittlich"
  
 ===== Berechnung von Leistungswerten ===== ===== Berechnung von Leistungswerten =====
  
-TDB2Online verfolgt das Ziel einer reinen Leistungsmessung auf einer Skala, die für alle verwendeten Messinstrumente vergleichbar ist. Die Interpretation eines Messwerts im Hinblick auf das Alter des Patienten wird mit Hilfsmitteln erleichtert, das Alter wird jedoch nicht dafür verwendet, den eigentlichen Messwert zu verändern. Andere biographische Parameter (Bildung, Geschlecht, was immer) werden nicht berücksichtigt. Welchen Stellenwert sie möglicherweise haben, muss im Testbefund verbal interpretiert werden, das ist nicht mehr Aufgabe der Leistungsmessung.+TDB2Online verfolgt das Ziel einer reinen Leistungsmessung auf einer Skala, die für alle verwendeten Messinstrumente vergleichbar ist. Die Interpretation eines Messwerts im Hinblick auf das Alter des Patienten wird mit Hilfsmitteln erleichtert, das Alter wird jedoch nicht dafür verwendet, den eigentlichen Messwert zu verändern. Andere biographische Parameter (Bildung, Geschlecht, was immer) werden nicht berücksichtigt. Welchen Stellenwert sie haben, muss im Testbefund verbal interpretiert werden, das ist nicht mehr Aufgabe der Leistungsmessung.
  
-Für die Leistungsmessung wird eine Skalierung benutzt, die die Testleistung gesunder Erwachsener auf dem Höhepunkt ihrer kognitiven Leistungsfähigkeit zum Maßstab der Darstellung macht. Das Verfahren ist keineswegs neu. Es entspricht im Prinzip Wechslers „Wertpunkten“, und zwar in der klassischen ("nicht-alterskorrigierten") Form, die mit der WAIS-R bzw. dem HAWIE-R eingeführt wurde (siehe auch den Abschnitt [[tests:wechsler_intelligenztest_fuer_erwachsene#Wertpunkttransformation|Wertpunkttransformation]] in der Testbeschreibung des WIE). Bei Wechslers Erwachsenentests beinhaltete die Umrechnung von Rohwerten in Wertpunkte zweierlei: zum einen eine Korrektur schiefer und verzerrter Verteilungsformen der Rohwerte hin zu einer Normalverteilung der Wertpunkte (was in TDB2Online meistens im Rahmen eines eigenen Arbeitsgangs durchgeführt wird) und zum zweiten die Standardisierung an einer Zufallsstichprobe junger gesunder Erwachsener, meist im Altersbereich zwischen etwa 20 und etwa 30). TDB2Online greift auf dieses Konzept zurück, allerdings mit einer skalierungstechnischen Änderung. Wechsler hatte seine Wertpunkte auf einen Mittelwert von 10 und eine Standardabweichung von 3 skaliert. Wegen der höheren Vertrautheit und der besseren Differenzierungsfähigkeit beziehen wir diese Leistungsmaße auf einen Mittelwert von 100 und eine Standardabweichung von 15 und bezeichnen sie als **Leistungswerte**. Leistungswerte sind immer positiv gepolt: Höhere Zahlen bedeuten bessere Leistungen.+Für die Leistungsmessung wird nach Möglichkeit eine Skalierung benutzt, die die Testleistung gesunder Erwachsener auf dem lebenszeitlichen Höhepunkt ihrer kognitiven Leistungsfähigkeit zum Maßstab der Darstellung macht. Das Verfahren ist keineswegs neu. Es entspricht im Prinzip Wechslers „Wertpunkten“, und zwar in der klassischen ("nicht-alterskorrigierten") Form, die mit der WAIS-R bzw. dem HAWIE-R eingeführt wurde (siehe auch den Abschnitt [[dokumentation:wechsler_intelligenztest_fuer_erwachsene#Wertpunkttransformation|Wertpunkttransformation]] in der Testbeschreibung des WIE). Bei Wechslers Erwachsenentests beinhaltete die Umrechnung von Rohwerten in Wertpunkte zweierlei: zum einen eine Korrektur schiefer und verzerrter Verteilungsformen der Rohwerte hin zu einer Normalverteilung der Wertpunkte (was in TDB2Online meistens im Rahmen eines eigenen Arbeitsgangs durchgeführt wird) und zum zweiten die Standardisierung an einer Zufallsstichprobe junger gesunder Erwachsener, meist im Altersbereich zwischen etwa 20 und etwa 30). TDB2Online greift auf dieses Konzept zurück, allerdings mit einer skalierungstechnischen Änderung. Wechsler hatte seine Wertpunkte auf einen Mittelwert von 10 und eine Standardabweichung von 3 skaliert. Wegen der höheren Vertrautheit und der besseren Differenzierungsfähigkeit beziehen wir diese Leistungsmaße auf einen Mittelwert von 100 und eine Standardabweichung von 15 und bezeichnen sie als **Leistungswerte**. Leistungswerte sind immer positiv gepolt: Höhere Zahlen bedeuten bessere Leistungen.
  
 ==== Leistungswerte bei Demenztests ==== ==== Leistungswerte bei Demenztests ====
  
-Bei vielen Testverfahren, die für die Demenzdiagnostik verwendet werden, gibt es keine Normen für junge Erwachsene. Ein prominentes Beispiel dafür ist die [[tests:cerad-testbatterie|CERAD-Testbatterie]]. Normen für gesunde Probanden gibt es hier nur in höheren Altersbereichen, frühestens von 50 an aufwärts, oft nicht sonderlich gut spezifiziert. Bei solchen Tests beziehen sich die Leistungswerte nicht auf junge Erwachsene, sondern auf Ältere. In der Überschrift zu den jeweiligen Testverfahren ist die Quelle der Leistungsnormdaten immer dann angegeben, wenn sie vom Standard (junge Erwachsene) abweicht.+Bei vielen Testverfahren, die für die Demenzdiagnostik verwendet werden, gibt es keine Normen für junge Erwachsene. Ein prominentes Beispiel dafür ist die [[tests:cerad-testbatterie|CERAD-Testbatterie]]. Normen für gesunde Probanden gibt es hier nur in höheren Altersbereichen, frühestens von 50 an aufwärts, oft nicht sonderlich gut spezifiziert. Bei solchen Tests beziehen sich die Leistungswerte nicht auf junge Erwachsene, sondern auf Ältere. In der Überschrift zu den jeweiligen Testverfahren ist der Altersbereich für die Berechnung der Leistungsnormen immer angegeben.
  
 ===== Berechnung von altersnormierten Werten ===== ===== Berechnung von altersnormierten Werten =====
  
-Für die klinische Beurteilung eines Testwerts ist vor allem bei älteren Patienten ein Vergleich mit den Leistungen der entsprechenden Altersgruppe notwendig. Nicht umsonst werden bei den meisten publizierten Tests die Rohwerte direkt in altersabhängige Standardwerte umgerechnet. Auch in TDB2Online werden zusätzlich zu den Leistungswerten altersabhängige Standardwerte (ASW, mit Mittelwert 100 und Standardabweichung 15) berechnet und im Testprofil numerisch angegeben. Die Werte werden mit den in TDB2Online agglutinierten Normdaten berechnet. Wie weiter oben dargestellt, beruhen diese auf einer möglichst breiten empirischen Basis und einer möglichst effizienten psychometrischen Aufarbeitung. Sie entsprechen deshalb nicht unbedingt den Normdaten, die sich in anderen Publikationen finden. Selbst bei publizierten Tests, bei denen es außer den publizierten Normdaten keine weiteren Normquellen gibt, sind Abweichungen wahrscheinlich, weil für die TDB2Online-Normen zum Beispiel immer zwischen den Rohwertstufen und zwischen benachbarten Altersgruppen Glättungen durchgeführt wurden. +Für die klinische Beurteilung eines Testwerts ist normalerweise ein Vergleich mit den Leistungen der entsprechenden Altersgruppe notwendig. Nicht umsonst werden bei den meisten publizierten Tests die Rohwerte direkt in altersabhängige Standardwerte umgerechnet. Auch in TDB2Online werden zusätzlich zu den Leistungswerten altersabhängige Standardwerte (ASW, mit Mittelwert 100 und Standardabweichung 15) berechnet und im Testprofil numerisch angegeben. Die Werte werden mit den in TDB2Online agglutinierten Normdaten berechnet. Wie weiter oben dargestellt, beruhen diese auf einer möglichst breiten empirischen Basis und einer möglichst effizienten psychometrischen Aufarbeitung. Sie entsprechen deshalb nicht unbedingt den Normdaten, die sich in anderen Publikationen finden. Selbst bei publizierten Tests, bei denen es außer den publizierten Normdaten keine weiteren Normquellen gibt, sind Abweichungen wahrscheinlich, weil für die TDB2Online-Normen zum Beispiel immer zwischen den Rohwertstufen und zwischen benachbarten Altersgruppen Glättungen durchgeführt wurden. 
    
 ===== Darstellung als einheitliches Testprofil ===== ===== Darstellung als einheitliches Testprofil =====
Zeile 347: Zeile 344:
 ===== Grenzen des Messbereichs ===== ===== Grenzen des Messbereichs =====
  
-Nicht alle Tests überspannen einen großen oder auch nur einen symmetrischen Leistungsbereich. Vorbildlich ist der Messbereich im Subtest Wortschatztest in der WAIS-IV, der ungefähr von den Leistungswerten 47 bis 143 reicht (siehe **Abbildung 6**). Mit den Subtests des VLMT lassen sich dagegen sehr hohe Leistungen nicht mehr adäquat messen. Bei allen Subtests ist 15 der höchst erreichbare Rohwert. Im Subtest //Verzögertes Wiedererkennen// (letzte Zeile in **Abbildung 6** entspricht ein Rohwert von 15 nur einem Leistungswert von etwa 112. Höhere Leistungen sind nicht mehr messbar.  +Nicht alle Tests überspannen einen großen oder auch nur einen symmetrischen Leistungsbereich. Vorbildlich ist der Messbereich im Subtest Wortschatztest in der WAIS-IV, der von den Leistungswerten 45 (Rohwert 0) bis 143 (Rohwert 57) reicht (siehe **Abbildung 6**). Mit den Subtests des VLMT lassen sich dagegen sehr hohe Leistungen nicht mehr adäquat messen. Bei allen Subtests ist 15 der höchst erreichbare Rohwert. Im Subtest //Verzögertes Wiedererkennen// (letzte Zeile in **Abbildung 6** entspricht ein Rohwert von 15 nur einem Leistungswert von etwa 112. Höhere Leistungen sind nicht mehr messbar.  
  
 Besonders häufig kommt dies bei Testverfahren vor, die gar nicht zur Quantifizierung von Fähigkeiten über einen breiten Normbereich hinweg konstruiert sind, sondern vornehmlich der Quantifizierung von Defiziten dienen. Im Besonderen trifft das für die Tests zur Quantifizierung von kognitiven Beeinträchtigungen von Demenzkranken zu. **Abbildung 7** zeigt ein Testprofil, das mit der [[tests:cerad-testbatterie|CERAD]] erhoben wurde.  Besonders häufig kommt dies bei Testverfahren vor, die gar nicht zur Quantifizierung von Fähigkeiten über einen breiten Normbereich hinweg konstruiert sind, sondern vornehmlich der Quantifizierung von Defiziten dienen. Im Besonderen trifft das für die Tests zur Quantifizierung von kognitiven Beeinträchtigungen von Demenzkranken zu. **Abbildung 7** zeigt ein Testprofil, das mit der [[tests:cerad-testbatterie|CERAD]] erhoben wurde. 
Zeile 361: Zeile 358:
 TDB2 und TDB2Online sind aus der diagnostischen Praxis in einer psychiatrischen Universitätsklinik entstanden. Ausgangspunkt war die Unzufriedenheit mit der Heterogenität der existierenden Verfahren, nicht ihrer Inhalte, sondern ihrer psychometrischen Aufbereitung. Es war kaum möglich, Studierenden der Psychologie im Verlauf eines Sechs-Wochen-Praktikums beizubringen, auf der Grundlage des Handbuchs jedes einzelnen Tests einen vernünftigen und konsistenten Testbefund zu schreiben.  TDB2 und TDB2Online sind aus der diagnostischen Praxis in einer psychiatrischen Universitätsklinik entstanden. Ausgangspunkt war die Unzufriedenheit mit der Heterogenität der existierenden Verfahren, nicht ihrer Inhalte, sondern ihrer psychometrischen Aufbereitung. Es war kaum möglich, Studierenden der Psychologie im Verlauf eines Sechs-Wochen-Praktikums beizubringen, auf der Grundlage des Handbuchs jedes einzelnen Tests einen vernünftigen und konsistenten Testbefund zu schreiben. 
  
-Mit der Einführung von TDB2 in der Klinik (2009) wurde das deutlich einfacher. Wenn eine Praktikantin oder ein Praktikant die Prinzipien der TDB2-Profildarstellung begriffen hatte (das ging nicht auf Anhieb, war aber in der zweiten Woche meistens abgeschlossen), wurde das Besprechen der Befunde mit den Betreuern viel leichter. Insofern verdanken wir unseren Praktikanten (etwa 10 pro Jahr) die Außenanregung, die notwendig war, um TDB2 voranzubringen!+Mit der Einführung von TDB2 in der Klinik (2009) wurde das deutlich einfacher. Wenn eine Praktikantin oder ein Praktikant die Prinzipien der TDB2-Profildarstellung begriffen hatte (das ging nicht auf Anhieb, war aber in der zweiten Woche meistens abgeschlossen), wurde das Besprechen der Befunde mit den Betreuern viel leichter. Insofern verdanken wir unseren Praktikanten (etwa 10 pro Jahr) die Außenanregung, die notwendig war, um TDB2 voranzubringen.
  
 TDB2 und TDB2Online sind keine abgeschlossenen Programme. An den Testverfahren werden sich Änderungen ergeben, wenn neue Normen verfügbar werden. Neue Verfahren können hinzukommen. Für Anregungen sind wir jederzeit dankbar.  TDB2 und TDB2Online sind keine abgeschlossenen Programme. An den Testverfahren werden sich Änderungen ergeben, wenn neue Normen verfügbar werden. Neue Verfahren können hinzukommen. Für Anregungen sind wir jederzeit dankbar. 
  • dokumentation.txt
  • Zuletzt geändert: 2022/03/07 14:05
  • von res