Raven Standard Progressive Matrices

Dies ist eine alte Version des Dokuments!

Abkürzung: SPM

Mitte der 30er Jahre des letzten Jahrhunderts konstruierte John C. Raven, ein Schüler von Spearman, im Rahmen seiner Master's Thesis die „Progressive Matrices„, die wir heute als Standard Progressive Matrices (SPM) kennen¹⁾. Ziel der Testkonstruktion war es, den gesamten Bereich der intellektuellen Entwicklung von der Kindheit bis ins Senium zu erfassen. Gleichzeitig sollte der Test von Sprache, Ausbildung, Nationalität oder Gesundheitszustand weitestgehend unabhängig sein.

Die Aufgaben bestehen aus unvollständigen geometrischen Figuren oder Mustern, die aus jeweils sechs bzw. acht dargebotenenen Antwortalternativen (multiple choice) so zu ergänzen sind, dass ein erkanntes Konstruktionsmuster logisch fortgesetzt wird. Abbildung 1 zeigt beispielhaft eine Aufgabe, die vom Konstruktionsprinzip den SPM-Aufgaben entspricht.

Abbildung 1: Beispiel einer Matrizen-Aufgabe. Das passende Teilstück muss ausgewählt werden.

Die SPM bestehen aus 5 Serien (benannt mit A bis E) von jeweils 12 solcher Aufgaben, deren Schwierigkeitsgrad ansteigt. Die Lösung der ersten Aufgabe jeder Serie ist, vor allem bei den ersten vier Serien A bis D, meist unmittelbar einsichtig. In den späteren Aufgaben jeder Serie werden dann schwierigere Problemstellungen präsentiert. Sie bauen stets auf dem auf, was bei der vorhergehenden Aufgaben zu leisten war.

Die SPM sind seit der Erstauflage 1938 praktisch nicht verändert worden. Dem noch aktuellen Manual for Raven's Progressive Matrices and Vocabulary Scales²⁾ lässt sich entnehmen, dass es lediglich zwei mal kleine Änderungen an den Items gab. 1947 wurde am achten Item der Serie B eine Korrektur vorgenommen und für die Ausgabe von 1956 wurden sowohl die Aufgaben selbst als auch die Antwortmöglichkeiten neu geordnet, nicht aber die Position der richtigen Antwort.

Im oberen Intelligenzbereich messen die SPM nicht mehr sehr genau. Im Zuge des interkulturellen Anstiegs der Intelligenz-Testwerte³⁾ war bei den SPM ein deutlicher Deckeneffekt für Jugendliche und jüngere Erwachsene festzustellen. Aus diesem Grund wurden, zeitgleich zu einer Parallelversion der SPM, die der klassischen Form von 1956 entsprach, die SPM-Plus entwickelt, die wieder eine verbesserte Differenzierung im oberen Intelligenzbereich ermöglichen. Bei den üblichen klinischen Anwendungszwecken ist eine Differenzierung im Normal- und Subnormalbereich wichtiger als im oberen Intelligenzbereich. Insofern reicht die Differenzierungsleistung der SPM für klinische Zwecke meistens aus.

Die SPM werden sowohl bei Kindern als auch bei Erwachsenen eingesetzt. Im Rahmen von TDB2Online wird nur die Anwendung bei Erwachsenen behandelt.

Eine recht ausführliche Rezension der Progressiven Matrizen hat Frank Gierschmann 2003 geschrieben.⁴⁾ Das Buch ist noch im Handel.

Lange Zeit erschienen die drei Versionen der Progressiven Matrizen im Selbstverlag. Nach J.C. Ravens Tod führten seine Söhne den Verlag (J. C. Raven Ltd.) unter der Leitung des ältesten Sohns, John Raven, zunächst weiter. Unter John Ravens Supervision fanden in den späten 80er Jahren die bis dahin ausführlichsten Normuntersuchungen bei Erwachsenen in Schottland und in USA statt. Mitte bis Ende der 90er erschien eine umfassende Dokumentation der Tests von Raven in 7 Teilbänden. Für die SPM sind davon Teil 1 (allgemeine Übersicht)⁵⁾, Teil 3 (Standard Progressive Matrices)⁶⁾ und Teil 7 (Forschungsdaten und Literaturangaben)⁷⁾ relevant. Anfang des Jahrhunderts übernahm die Psychological Corporation in Texas, die zu dieser Zeit schon zu Harcourt gehörte, den Familienverlag einschließlich aller Rechte an den Tests. Die Testabteilung von Harcourt wurde später von Pearson Assessment übernommen, das die englischen Manuale zur Zeit (Oktober 2012) ohne wesentliche Änderungen publiziert.

Auch in Deutschland haben die SPM mehrfach den Testverlag gewechselt. Eine erste Ausgabe mit einer deutschen Standardisierung für Kinder von Kratzmeier und Horn erschien 1979 bei Beltz Test, eine (leicht) erweiterte zweite Auflage 1988.⁸⁾ Eine weitere deutsche Ausgabe mit neuen Normen (aber ebenfalls vorwiegend für Kinder und Jugendliche) erschien 1998 unter der Bearbeiterautorenschaft von Heller, Kratzmeier und Lengfelder.⁹⁾ Das Manual dieser Ausgabe scheint noch erhältlich zu sein, bei der Schweizer Testzentrale ist es noch gelistet.

Fast gleichzeitig (seit 1998) begann Swets Test Service in Frankfurt damit, die kompletten englischen Manuale und die drei Matrizentests auf deutsch herauszugeben. Die SPM erschienen dort in der Bearbeitung von Bulheller und Häcker¹⁰⁾ auf der Basis der britischen Ausgabe von 1998.¹¹⁾ Die in dieser Ausgabe publizierten deutschen Normen wurden mit den SPM Plus erhoben, nicht mit den klassischen SPM. Allerdings gibt es eine Umrechnungstabelle, mit deren Hilfe SPM-Plus-Rohwerte in SPM-Rohwerte umgewandelt werden können (und umgekehrt). Es wurden vor allem Jugendliche zwischen 14 und 18 Jahren, nur wenige Studenten und keine nicht-studentische Erwachsenenstichprobe untersucht.

Aktuell werden die zuerst bei Swets Test Service erschienenen deutschen Versionen bzw. deren Neuauflagen vom Rechtsnachfolger, Pearson Assessment & Information GmbH, in Frankfurt verlegt. Sie sind direkt dort oder über die Testzentralen in Deutschland oder der Schweiz zu beziehen.

Zur Durchführung der klassischen SPM braucht man auf jeden Fall das (klassische) SPM-Testheft, das die fünf Testserien (A, B, C, D, E) von jeweils 12 Aufgaben enthält, und die (klassischen) SPM-Antwortbögen. In der aktuellen Version sind diese durchschreibend und erleichtern damit die Auszählung der Rohwerte. Eine zumindest kursorische Kenntnisnahme des Inhalts des deutschen SPM-Manuals¹²⁾ ist notwendig, auch wenn es etwas mühsam zu lesen ist. Zusätzlich empfehlen die Testautoren die Lektüre des Grundlagenmanuals zu den Matrizentests von Raven¹³⁾.

J. C. Ravens Rechte an seinem Test wurden von Verlag zu Verlag weitergereicht und liegen heute international bei Pearson Assessment, in Deutschland vertreten durch Pearson Assessment & Information GmbH in Frankfurt.

Die aktuellen Handbücher für die Matrizentests von Raven¹⁴⁾ ¹⁵⁾ empfehlen die Durchführung der SPM als zeitlich unbegrenzten Power-Test. Der Test kann sowohl als Individual- wie auch als Gruppentest durchgeführt werden (wobei die Gruppengröße, speziell bei klinischen Anwendungen, auf wenige Personen begrenzt bleiben sollte). Die Testdurchführung dauert im Durchschnitt ca. 45 Minuten.

Die Durchführung der SPM mit einem verbindlichen Zeitlimit, das es manchen Testpersonen nicht erlaubt, die Bearbeitung des Tests abzuschließen, würde zu einer ungleichmäßigen und nicht validen Testwertverteilung führen. Der Grund dafür ist, dass manche Testpersonen unter derartigen Testbedingungen viel Zeit darauf verwenden, die schwierigen Testaufgaben aus den ersten Serien zu lösen, während andere diese Aufgaben auslassen und ihre Testwerte deutlich erhöhen, indem sie die einfacheren Items aus den höheren Serien lösen.

Bei allen Versionen von Ravens Progressiven Matrizen gibt es nur einen Testrohwert, die Anzahl der richtigen Lösungen. Bei den SPM reicht diese Zahl von 0 bis 60.

Hier muss man noch mal drübergehen, wenn die vorhandenen Normuntersuchungen dargestellt sind.

Die SPM können über einen sehr großen Leistungsbereich hinweg messen. Der Test besteht immerhin aus 60 Items (das ist sehr viel im Vergleich mit anderen Leistungstests) und die Items weisen beträchtliche Unterschiede im Schwierigkeitsgrad auf. Eigentlich sollte das - wenn die Schwierigkeitskoeffizienten der Items gut gewählt sind - in einer Normalverteilung der Rohwerte resultieren. Trotzdem wird man mit Einschränkungen an den beiden Enden der Verteilung rechnen müssen: Bei sehr jungen Kindern, sicher auch bei sehr alten Personen, wird es Bodeneffekte geben. Aus der Literatur ist bekannt, dass es bei jungen Erwachsenen in den letzten Jahrzehnten Deckeneffekte gibt (Lit). Beide Faktoren müssten bei den betreffenden Teilpopulationen zu gestutzten Verteilungen führen.

In der Literatur gibt es keine genauen SPM-Verteilungsdaten von Zufallsstichproben Erwachsener. Allerdings kann man grobe Verteilungsformen rekonstruieren, weil die meisten SPM-Normdaten als Perzentilwerte vorliegen. Eine der größeren Erwachsenenstichproben (N=952) wurde von Deltour in Belgien gesammelt und 1993 publiziert. Diese Daten gehen über einen weiten Altersbereich und liegen - leider etwas grob gestaffelt - als Perzentilwerte für die Perzentile 5, 10, 25, 50, 75, 90 und 95 vor. Mit diesen Informationen lässt sich die Verteilungsform der Rohwerte grob darstellen. Abbildung 2 zeigt diese rückgerechneten Verteilungen für drei Altersgruppen.

Abbildung 2: Rückgerechnete Verteilungsform der SPM-Rohwerte in der belgischen Normierung von 1993 für drei ausgewählte Altersgruppen

Ähnliche Daten liegen für die britische Normierung vor, sie sind in Abbildung 3 dargestellt.

Abbildung 3: Rückgerechnete Verteilungsform der SPM-Rohwerte in der britischen Normierung von 1992 für drei ausgewählte Altersgruppen

Es lässt sich auf beiden Abbildung erkennen, dass es durchaus Deckeneffekte gibt, bei den Jungen mehr als bei den Alten und in den britischen Daten mehr als in den belgischen (Auf Eigenheiten und Unterschiede zwischen den Normierungen wird später im Abschnitt Normuntersuchungen eingegangen). Der Abstieg der Verteilungskurve ist steiler als der Anstieg, was ein schlechtere Differenzierungsfähigkeit im hohen Leistungsbereich bedeutet. Ein Bodeneffekt ist dagegen nicht zu erkennen.

Es fällt auf, dass die allermeisten Probanden - selbst in der Altersklasse der 70-79-Jährigen - mehr als 20 Aufgaben richtig lösen. Die Aufgaben der Testreihen A und B sind so leicht, dass über 95 Prozent aller Erwachsenen sie meistern. John C. Raven, der Testautor und sein ältester Sohn John Raven (Jr.) betonten immer, dass das Absicht ist: Die Eingangsserien dienten stets auch dem Erlernen von allgemeinen Lösungsstrategien für diese Art von Aufgaben. Sie sind also nicht überflüssig, sondern sind als eine Art von Vorbereitung auf den Test zu sehen, der Unterschiede in der Auffassungsgeschwindigkeit egalisieren soll.

Auch wenn es wohl keine empirischen Prüfungen dieses Konzepts gibt, klingt das für einen Kliniker plausibel. Besonders im klinischen Anwendungsbereich sind Leistungsängste und Hemmungen zu Beginn einer neuen Aufgabe besonders störend und es ist hilfreich, zu Beginn eines Tests eine größere Anzahl leichter Aufgaben zu haben, um keine unnötigen Ängste aufkommen zu lassen.

Von Beginn an wurden Normen für die Raven-Tests als Prozentränge angegeben. Dies trägt der Tatsache Rechnung, dass die Beziehung zwischen Rohwerten und IQ-Werten nicht linear ist. In den unteren Leistungsbereichen ist die Lösung eines weiteren Musters mit einem geringeren IQ-Zuwachs verbunden als in den oberen Leistungsbereichen. Auf Grund der vorliegenden Prozentrangnormen ist die Umrechnung in lineare Leistungswerte über die Beziehung zwischen Prozenträngen und Einheiten der Normalverteilung formal einfach.

Da in keinem der drei deutschen SPM-Manuale zufriedenstellende deutsche Normen für Erwachsene mitgeteilt wurden (Details siehe unten), wurden hier alle internationalen Normerhebungen zusammengestellt, die zumindest einen gewissen Anspruch an die Repräsentativität der Stichprobenziehung erfüllen. Diese Arbeit wurde durch das englische SPM-Manual¹⁶⁾ erleichtert, in dem alle relevanten Erhebungen bis etwa zum Jahr 1999 in Tabellenform abgedruckt sind.

Die drei deutschen Editionen der SPM haben vorwiegend¹⁷⁾¹⁸⁾ oder ausschließlich¹⁹⁾ Normdaten für Kinder und Jugendliche erhoben. Im Erwachsenenbereich haben Heller et al.²⁰⁾ 324 Studierende untersucht. 295 waren zwischen 20 und 27 Jahre alt, die restlichen 29 zwischen 30 und 44. Bulheller & Häcker²¹⁾ untersuchten 1998 und 1999 167 Personen über 19 Jahre, 99 davon zwischen 20 und 29, der Rest undifferenziert als „30+“ bezeichnet. Über die Zusammensetzung der Probanden ist wenig berichtet, über die angezielte Ursprungspopulation nichts. Für Normierungszwecke sind beide Untersuchungen nicht brauchbar, ihre Ergebnisse werden allerdings deskriptiv weiter unten berichtet.

Man muss also konstatieren, dass es leider keine deutschen SPM-Normen für Erwachsene gibt. Wir werden uns, wie bei vielen anderen neuropsychologischen Tests, fürs erste mit einer metaanalytischen Zusammenfassung von Normen aus anderen Ländern begnügen müssen.

Die ersten britischen Normen für Erwachsene wurden während des Zweiten Weltkrieges von J. C. Raven gesammelt und später durch Einzelstichproben ergänzt. Eine repräsentative Stichprobenerhebung (mit SPM und APM) fand erst 1992 in der Stadt Dumfries in Schottland statt. Sie ist im englischen SPM-Handbuch²²⁾ ausführlich dargestellt. Dumfries zählte zu der Zeit etwa 25.000 Einwohner. Im Hinblick auf die demographischen Eigenschaften entsprach Dumfries dem Gesamtbild von Großbritanien. Einer Zufallsstichprobe (jede 29. im Wahlregister eingetragene Person) wurde schriftlich der Besuch eines Forschungsmitarbeiters angekündigt. Beim Hausbesuch wurde dann das Ziel der Studie erklärt und Teil I der APM durchgeführt. Wenn die Testperson eine Mindestpunktzahl erreichte (der Cut-off wurde zunächst auf 8 Punkte gesetzt und später auf 10 Punkte erhöht), wurde Teil II der APM durchgeführt. Wenn die Testperson die Mindespunktzahl nicht erreichen konnte, wurden die SPM durchgeführt. 80% der kontaktierten Personen erklärten sich bereit, an der Studie teilzunehmen. Insgesamt vervollständigten 645 Personen die APM I und entweder die SPM oder die APM II. Für die Standardisierung wurde eine Umrechnung von SPM-Werten in APM-Werte (und umgekehrt) verwendet, die zuvor von Andrich & Dawes erhoben wurde, Details zur Prozedur fehlen im Manual, die Umrechnungstabelle ist abgedruckt. Die Normen liegen nur als relativ grobe Perzentilnormen für die Prozentränge 5, 10, 25, 50, 75, 90 und 95 vor.

Ein Jahr später wurden die SPM (ebenfalls zusammen mit den APM) an einer amerikanischen Stichprobe in Des Moines/Iowa standardisiert. Auch diese Untersuchung ist im SPM-Handbuch²³⁾ referiert. Analog zu Dumfries entsprachen die demographischen Eigenschaften der Einwohner von Des Moines ungefähr dem Gesamtbild der US-Population. Der Aufbau der Untersuchung entsprach im Wesentlichen den Bedingungen der Studie in Dumfries. Allerdings erwies sich die Zusammenstellung einer Zufallsstichprobe in den USA im Vergleich zu Großbritannien schwieriger, da in den USA keine Namenslisten und Adressenlisten vorlagen. Aus diesem Grund wurden Daten aus einer Volkszählung verwendet, um die unterschiedlichen Wohngebiete ausfindig zu machen, über die man ein repräsentatives Abbild der zu untersuchenden Population hinsichtlich Alter, ethnischer Zugehörigkeit und sozioökonomischem Staus gewinnen könnte. Aus 30 solcher Wohngebiete wurde eine für die Gesamtbevölkerung von Des Moines repräsentative Gruppe von 1000 Testpersonen ausgewählt. Praktisch konnten mit diesem Verfahren dann 972 Adressen ermittelt werden. Die Antwortquote der kontaktierten Personen betrug 70%. Die Untersuchung ergab insgesamt 625 verwendbare Datensätze. 8% der Testpersonen waren schwarz, 87% weiß und die restlichen asiatischer Herkunft oder Hispanoamerikaner. Die Testdurchführung und Analyse entsprach der von Dumfries. Die Normen wurden für jede Altersgruppe durch die Anpassung der Kurven an geglättete Gesamtnormen erstellt.

Die amerikanischen Normen von 1993 sind im englischen SPM-Manual sehr detailliert abgedruckt. Für jeden Rohwert sind dort die Perzentilwerte für jede Altersgruppe in Fünf-Jahres-Abständen tabelliert. Die Tabelle endet bei Perzentilwerten von 3, bei den höheren Altersgruppen auch bei 4 oder 5. McKinzey & Raven haben diese Angaben 2005 in einem Beitrag in der Internetzeitschrift WebPsychEmpiricist²⁴⁾ durch genauere Angaben im unteren Leistungsbereich ergänzt.

Der belgische Psychologe Deltour unternahm zwischen 1984 und 1990 eine Normierung der SPM in Belgien.²⁵⁾. Studierende der Psychologie untersuchten über mehrere Jahre jeweils 10 Probanden mit den SPM, wobei festgelegt war, wieviele Probanden aus jeweils einem von vier Schulbildungsniveaus zu untersuchen waren. Die Ergebnisse der Normierung sind in den deutschen²⁶⁾ und englischen²⁷⁾ SPM-Manualen in Tabellenform wiedergegeben, wenn auch etwas grob für die Perzentile 5, 10, 25, 50, 75, 90 und 95. Der Stichprobenumfang ist mit 952 Personen hoch, der Altersbereich geht von 25 bis 84 Jahre mit starken Zellbesetzungen in allen Altersgruppen.

Im englischen SPM-Manual sind die Ergebnisse von zwei weiteren Personengruppen im Erwachsenenalter abgedruckt, die - ähnlich wie die kleinen deutschen Stichproben - helfen können, die Gültigkeit der größeren Stichproben zu bewerten. Von beiden Gruppen gibt es grobe Prozentrangnormen.

Die erste Gruppe besteht aus französischen Arbeitern, die im Rahmen einer obligatorischen Sicherheitsprüfung für risikobehaftete Jobs (z. B. Bus- und Lokführer) unter anderem die SPM durchführen mussten. Die Untersuchung wurde erstmal 1987 berichtet und für den Abdruck im englischen SPM-Manual von J. Raven zusammengestellt und geglättet.

Die zweite Gruppe ist ähnlich zusammengesetzt. Sie besteht aus Jobsuchenden, die vom UK Employment Service getestet wurden. Es ist nicht berichtet, aus welchem Jahr die Daten stammen.

Von den vorliegenden Normuntersuchungen hatten nur drei überhaupt den Anspruch, repräsentative Stichproben einer Erwachsenenbevölkerung zu ziehen. Ravens Untersuchungen in Schottland und Iowa gehen davon aus, dass die gewählten Regionen repräsentativ für UK bzw. USA sind. Bei der belgischen Untersuchung fehlen solche Informationen hinsichtlich der regionalen Repräsentativität, außerdem war die Stichprobenziehung ausschließlich an der Schulbildung stratifiziert, immerhin dem wohl wichtigsten soziodemographischen Parameter für diese Art von Daten.

In allen drei Untersuchungen konnten die Probanden ohne Zeitbegrenzung arbeiten, dies entspricht den Empfehlungen im Testmanual. In der britischen und US-amerikanischen Studie gab es allerdings in zwei Punkten Abweichungen von dem üblichen Standardprozedere. Die Interviewer, die den Erstkontakt mit den Probanden herstellten, legten zunächst den Teil I der APM vor und werteten diesen aus. Erreichten die Probanden 8 (später auf 10 erhöht) oder mehr Punkte im Teil I der APM, ließen die Interviewer den Teil II der APM zum Ausfüllen bei den Probanden, lag die Punktzahl darunter, ließen sie den kompletten SPM da. Die Ergebnisse wurden später abgeholt, oft erst nach einer Woche. Damit war zum einen eigentlich nie die Standardprozedur zum Ausfüllen der SPM gegeben. Entweder gab es die zusätzlich Übungsperiode mit dem Teil I der APM oder es gab überhaupt nicht die SPM, sondern die APM, aus der mit Hilfe von zuvor erhobenen Äquivalenzdaten der vermutliche SPM-Rohwert errechnet wurde. Zum anderen war aber auch nicht mehr garantiert, dass die Probanden alleine arbeiteten, und es ist denkbar, dass die Normen durch zusätzliche Lösungsversuche anderer Personen nach oben verzerrt sind. Speziell dieses Verfahrensdetail wurde in der Literatur auch kontrovers diskutiert.²⁸⁾ ²⁹⁾ ³⁰⁾ Die Argumente, mit denen Raven in seiner Replik Gudjonssons Sicht kontert, sind indirekt und nicht sehr zielführend.

Man kann aus den Perzentilwerten der beiden Untersuchungen (für die britischen die Tabelle SPM8 im Handbuch, für die US-amerikanischen die Tabelle SPM13, detailliert durch Kenzie & Ravens spätere Ergänzung³¹⁾) näherungsweise die Rohwertverteilungen rekonstruieren. Für die britischen Daten wurde dies schon weiter oben in Abbildung 3 gezeigt, die folgende Abbildung 4 zeigt die rückgerechnete Verteilung für die wesentlich feiner darstellbaren US-amerikanischen Daten. Vergleicht man beide mit den weiter oben in Abbildung 2 schon gezeigten Daten der belgischen Untersuchung, dann fallen zunächst die deutlich höheren Mediane auf, aber auch eine abweichende Verteilungsform.

Abbildung 4: Rückgerechnete Verteilungsform der SPM-Rohwerte in der US-amerikanischen Normierung von 1993

Für die Beurteilung ist es sinnvoll, wenn man diese drei Normierungen mit den anderen oben dargestellten Datensätzen zusammenbringt, nämlich den beiden kleinen deutschen Erwachsenenstichproben und den beiden Studien mit Arbeitsamt-Daten aus Frankreich und Großbritannien, und sich die Altersverläufe der SPM-Mediane anschaut. Abbildung 5 zeigt diese Daten in der Synopse.

Abbildung 5: Mittlere SPM-Rohwerte im Altersverlauf für alle im Text besprochenen SPM-Untersuchungen

Die britischen und die US-amerikanischen Daten liegen tatsächlich sehr eng beieinander. Zumal die US-Daten sind offensichtlich auch sehr stark geglättet. Es wäre sonst extrem unwahrscheinlich, dass die Mediane pro Altersgruppe von 18 bis 47 Jahre exakt gleich sind. Erst danach zeigt sich der erwartete altersassoziierte Leistungsabfall. Bei den UK-Daten beginnt der Altersabfall bei rund 40 Jahren. Die belgischen Normen liegen um rund 5 Rohwerte niedriger. Die Altersverläufe sind ähnlich. Bei den belgischen Daten beginnt der Abfall etwas früher, was auch plausibel ist bei einem Problemlösetest.

Wo liegen nun die Mediane bzw. Mittelwerte der anderen vier Untersuchungen? Die deutsche Studierendenstichprobe liegt da, wo man sie vermuten muss: über den drei großen Normstichproben. Allerdings ist es schon erstaunlich, dass die UK-Probanden in zwei Altersgruppen an die deutsche Studierenden-Stichprobe heranreichen. Das könnte schon damit zu tun haben, dass die lange und unkontrollierte Bearbeitungszeit zu erhöhten Leistungen geführt hat. Die zweite deutsche (anfallende, nicht näher bezeichnete) Stichprobe liegt irgendwo zwischen den drei großen Normierungen. Das ist nicht unplausibel und wäre wohl so ähnlich zu erwarten. Die beiden Arbeitsamt-Stichproben differieren gewaltig. Während die britischen Employment-Service-Clients in der Nähe der belgischen Mittelwerte liegen (mit einem Einbruch in den ersten beiden Altersgruppen), liegen die französischen Daten weit darunter. Die Differenz ist beachtlich und nicht durch die 15 Jahre Differenz in der Erhebungszeit zu erklären. Hier spielt sicher eine Rolle, dass in Frankreich eher Bewerber für einfachere (wenn auch sicherheitsrelevante) Tätigkeiten untersucht wurden. Über die Durchführungsdetails wird leider nichts berichtet. Besonders der altersassoziierte Leistungsabbau würde einer Erklärung bedürfen.

Für eine metaanalytische Zusammenfassung kommen nur die UK-, US- und die belgische Stichprobe in Frage, weil nur diese einen gewissen Anspruch auf Repräsentativität erheben. Alle drei Stichproben umfassen einen relativ breiten Altersbereich, der sie als Normbasis interessant macht. Ein Manko der britischen Untersuchung ist die sehr grobe Perzentilangabe, die nur für die Prozentränge 5, 10, 25, 50, 75, 90 und 95 Rohwerte angibt. Die US-Normen sind deutlich feiner, sie geben für jeden Rohwert den Perzentilwert an, mit der Ergänzung von McKinzey & Raven hinunter bis zu einem Perzentilwert von 1. Problematisch ist bei beiden die lange und unsupervidierte Ausfülldauer, die künstlich erhöhte Normen ermöglicht haben könnte. Um diesem möglichen Manko nicht zu viel Gewicht zu geben, wurden für die tdb2-Normbasis nur die US-amerikanische und die belgische Untersuchung verwendet. Beide zusammen bestehen aus 1558 Personen im Altersbereich zwischen 20 und 84 Jahren.

Die belgischen Normen lagen in 10-Jahres-Intervallen (z. B. 50-59) vor, die US-amerikanischen in 5-Jahres-Intervallen, aber versetzt dazu (z. B. 48-52, 53-57, 58-62). Da die US-Normen ohnehin über die Altersklassen geglättet sind, wurden für eine Mittelung nur die Altersgruppen berücksichtigt, die genau in eine (belgische) 10-Jahres-Klasse fielen (also 50-59 der belgischen Normen mit 53-57 der US-amerikanischen zusammengebracht). Die Perzentile wurden in IQ-normierte Standardwerte (100;15) umgerechnet und auf dieser Ebene gemittelt.

Bei in dieser Weise flächentransformierten Verteilungen ergeben sich an den Rändern der Verteilung unschöne Effekte, weil empirisch gewonnene Prozentrangverteilungen bei üblichen Stichprobengrößen am Ende immer zensoriert sind. Dieses Problem wurde schon öfters – vor allem in Verbindung mit der Diagnostik von Minderbegabungen (Lit) – diskutiert und die US-Normen wurden mit der Ergänzung von McKinzey & Raven ja auch schon einmal nach unten erweitert. Allerdings war auch diese Erweiterung zur Darstellung von Leistungswerten leistungsschwacher älterer Personen unzureichend. Die Beziehungen zwischen Rohwerten und Leistungswerten wurden deshalb in den unteren Bereichen manuell korrigiert, wobei das pragmatische Lösungsprinzip darin bestand, die Differenz zwischen den IQ-Werten absolut leistungsgleicher aber unterschiedlich alter Probanden im Sinne einer Intervallskala gleich zu halten.

Abbildung 6 zeigt - wie Abbildung 5 - die SPM-Rohwerte für alle im Text besprochenen SPM-Untersuchungen in ihrem Altersverlauf. Zusätzlich wurden die Mediane der metaanalytischen Integration (dunkelblau und fett) sowie deren 16. und 84. Perzentil (hellblau und fett) darübergesetzt. Nur für diesen Zweck wurden sie in 5-Jahres-Gruppen interpoliert.

Abbildung 6: Mittlere SPM-Rohwerte im Altersverlauf für alle im Text besprochenen SPM-Untersuchungen und für die metaanalytische Zusammenfassung

Man sieht an der Abbildung, dass die mittlere Leistung der (jungen) deutschen Studenten etwa im Bereich von IQ 115 liegt (bei PR84 der metaanalytischen Integration, also eine Standardabweichung über deren Median), ein Wert, der nicht unplausibel ist.

Abbildung 7 zeigt die Leistungs- und Altersnormierung der SPM von Raven im graphischen Überblick. Auf dieser Abbildung markieren die senkrechten Striche die Leistungswerte von 40 bis 145, auf der schwarzen waagerechten Linie sind die Rohwerte (gelöste Aufgaben) eingetragen. Die abwechselnd rot und blau eingezeichneten Linien enthalten die Normgrenzen für alle Altersgruppen in der Übersicht. Die fünf Markierungen auf jeder Linie stehen für die Prozentränge 2.5, 16, 50, 84 und 97.5. Jeweils eine solche Linie, nämlich die, die der Altersgruppe des Probanden entspricht, wird (in anderer Form) im TDB2Online-Profilblatt eingezeichnet, um bei der individuellen Interpretation der Testergebnisse zu helfen.

Abbildung 7: Leistungswerte der SPM mit Rohwerten und Altersnormgrenzen (siehe Text)

Die aus den US-, UK- und den belgischen Normen erstellten mittleren Normwerte korrespondieren gut mit den Normen des Mosaiktests des HAWIE-R von 1991. Hier Linking-Ergebnisse zwischen MT und SPM als Abbildung bringen und erläutern. Interpretation: erleichtert zumindest die konsistente Interpretation von Befunden in Deutschland. Es könnte aber sein, dass beide (HAWIE-R und diese Summennorm des Raven) relativ leicht sind. Immerhin sind die UK- und US-Normen schwerer als der Mittelwert, den wir jetzt genommen haben…Hier gehört auch die entsprechende Abbildung hin.

¹⁾

Raven, J. C. (1938). Progressive Matrices. London: H. K. Lewis & Co., Ltd.

²⁾ , ⁶⁾ , ¹⁴⁾ , ¹⁶⁾ , ²²⁾ , ²³⁾ , ²⁷⁾

Raven, J., Raven, J. C. & Court, J. H. (2000). Manual for Raven's Progressive Matrices and Vocabulary Scales. Section 3: Standard Progressive Matrices (including the Parallel and Plus Versions). 2000 Edition. Oxford: Oxford Psychologists Press.

³⁾

vgl. Flynn, J. (1987). Massive IQ gains in 14 nations. What IQ tests really measure. Psychological Bulletin, 101, 171-191.

⁴⁾

Gierschmann, F. (2003) Raven's Progressive Matrices (RPM). In: Tests unter der Lupe 4. Hrsg. v. E. Fay, Göttingen: Vandenhoeck und Ruprecht, S. 105-123.

⁵⁾ , ¹⁵⁾

Raven, J., Raven, J. C. & Court, J. H. (1998). Manual for Raven's Progressive Matrices and Vocabulary Scales. Section 1. General Overview. 1998 Edition. Oxford: Oxford Psychologists Press.

⁷⁾

Court, J. H. & Raven, J. (1995). Manual for Raven's Progressive Matrices and Vocabulary Scales. Section 7: Research and References. Oxford: Oxford Psychologists Press.

⁸⁾ , ¹⁹⁾

Raven, J. C., Court, J. & Raven, J. (Jr.) (1988). Standard Progressive Matrices. Manual. Deutsche Bearbeitung von Heinrich Kratzmeier und Ralf Horn. Zweite Auflage. Weinheim: Beltz Test Gesellschaft.

⁹⁾ , ¹⁷⁾ , ²⁰⁾

Heller, K.A., Kratzmeier, H. & Lengfelder, A. (1998). Matrizen-Test-Manual, Band 1. Ein Handbuch mit deutschen Normen zu den Standard Progressive Matrices von J.C. Raven. Goettingen: Beltz Test.

¹⁰⁾ , ¹²⁾ , ¹⁸⁾ , ²¹⁾ , ²⁶⁾

Raven, J.C., Raven, J. & Court, J.H. (1999) Manual zu Raven's Progressive Matrices and Vocabulary Scales. Standard Progressive Matrices. Ausgabe 1999 mit der Parallelform und der SPM-Plus-Version. Deutsche Bearbeitung von Stephan Bulheller und Hartmut Häcker. Frankfurt: Swets Test Services.

¹¹⁾

Raven, J., Raven, J.C. & Court, J.H. (1998) Manual for Raven's Progressive Matrices and Vocabulary Scales. Section 3. Standard Progressive Matrices (including the Parallel and Plus versions). Oxford: Oxford Psychologists Press.

¹³⁾

Häcker, H. & Bulheller, S. (Hrsg.) (1998) Manual der Progressiven Matrizen- und Wortschatztests von John Raven. Teil 1: Grundlagen. Frankfurt: Swets Test Services

²⁴⁾ , ³¹⁾

McKinzey, R. K., & Raven, J. C. (4/25/05). Raven norms for the lower range of IQ. WebPsychEmpiricist. Retrieved Oct 30, 2012, from http://wpe.info/papers_table.html

²⁵⁾

Deltour, J. J. (1993). Echelle de Vocabulaire Mill Hill de J. C. Raven: Adaptation Francaise et normes comparees du Mill Hill et du Standard Progressive Matrices (PM38). Manuel et annexes. Braine le Chateau, Belgium: Editions L'Application des Techniques Modernes SPRL

²⁸⁾

Gudjonsson, G. H. (1995) The Standard Progressive Matrices: methodological problems associated with the administration of the 1992 adult standardisation sample. Personality and Individual Differences, 18, 441-442.

²⁹⁾

Raven, J. (1995) Methodological Problems with the 1992 standardisation of the SPM: a response. Personality and Individual Differences, 18, 443-445.

³⁰⁾

Gudjonsson, G. H. (1995) Raven's norms on the SPM revisited: a reply to Raven. Personality and Individual Differences, 18, 447.

Melden Sie sich an, um einen Kommentar zu erstellen.

Raven Standard Progressive Matrices

Hintergrund

Test- und Verlagsgeschichte

Testmaterial

Copyright

Testdurchführung

Testrohwerte

Verteilungseigenschaften der Rohwerte

Linearisierung der Messskala

Normuntersuchungen

Deutschland

Großbritannien 1992

USA 1993

Belgien 1993

Spezielle Stichproben

Beurteilung der Normuntersuchungen

Metaanalytische Zusammenfassung der Normen

Leistungs- und Altersnormen im Überblick

Diskussion

Linking mit Mosaiktest

Literatur

TDB2Online