dokumentation:mini_mental_state_examination

Dies ist eine alte Version des Dokuments!


Mini Mental State Examination

Abkürzung: MMSE

Die Mini Mental State Examination wurde von Folstein et al. 1975 in einem Zeitschriftenaufsatz vorgestellt.1) Ziel der Publikation war es, ein einfaches und praktisches Verfahren zur Abschätzung des geistigen Leistungsniveaus von kognitiv eingeschränkten Personen im höheren Alter vorzustellen. Der Messbereich des Verfahrens umfasst einen sehr breiten Bereich zwischen „extrem beeinträchtigt“ (0-5 Punkte) und „unauffällig“ (28-30 Punkte). Die Messwerte eignen sich damit für das angestrebte Ziel einer Stadieneinteilung der geistigen Leistungsfähigkeit über einen sehr weiten Bereich.

Am häufigsten wird die MMSE bei dementen Patienten eingesetzt. Hier reicht ihr Messbereich von „unauffällig“ bis zu schweren Demenzformen. In den ersten fünf der sieben Stadien, die die häufig verwendete Global Deteriorating Scale von Reisberg et al.2) umfasst, kann die MMSE messen, nämlich von Stadium 1 (keine Beeinträchtigung des Gedächtnisses im klinischen Interview) bis zum Stadium 5 (vergisst wichtige Daten des persönlichen Lebens, z. B. Namen der Kinder, ist zeitlich oder örtlich desorientiert). Die Stadien 6 (braucht Hilfe bei den Aktivitäten des täglichen Lebens) und 7 (Verlust aller verbalen Fähigkeiten, Inkontinenz) sind über Messungen der kognitiven Fähigkeiten nicht mehr erfassbar.

Die Aufgaben waren schon in der Originalpublikation3) so gut beschrieben, dass jeder sich das wenige notwendige Testmaterial selbst erstellen konnte.

Im deutschen Sprachraum sind viele verschiedene Versionen im Einsatz, einige auch mit modifizierten Aufgaben. Mit dem Original gut vergleichbar ist die vor langer Zeit von Kessler et al. im Beltz-Verlag erschienene deutsche Fassung4), die auch weiter erhältlich ist. Eine deutschsprachige MMSE ist ebenfalls als Bestandteil der CERAD-Testbatterie erhältlich. Fachkräfte können eine autorisierte Version der deutschen CERAD nach Anmeldung an der Webseite der Baseler Memory Clinic als Papierversion bestellen oder als pdf herunterladen.

Die MMSE wurde zuerst 1975 in einem Artikel im Journal of Psychiatric Research als eine einfache Methode für die Untersuchung geistiger Funktionen bei psychiatrischen Patienten von Folstein und Kollegen publiziert5). Im Anhang dieses Artikels befand sich ein ausfüllbereit abgedruckter Antwortbogen, der auch die Fragen und Anweisungen enthielt. Zwischen 1975 und 2000 war öffentlich nichts über Copyright-Fragen zur MMSE zu hören oder zu lesen. Der Test wurde von Klinikern wie Forschern in vielen Versionen, Varianten und Sprachen nachgedruckt oder kopiert. Verlage, die fremdsprachliche Versionen der MMSE publizierten, und Pharmafirmen, die den Test in Studien benutzten, haben die Copyright-Fragen hingegen vermutlich vorher geklärt.

Ab 2000 änderte sich die Lage. Es wurde auch öffentlich bekannt, dass das Copyright, das seit 1975 bei den Autoren lag, an eine gemeinsame Firma der Autoren und von dort ein Jahr später an Psychological Assessment Resources, einen großen Testverlag in Florida, übertragen wurde. Seitdem wird das Copyright - vor allem in USA und bei großen Organisationen - vom Verlag durchgesetzt und Verstöße sanktioniert. Es gibt dazu diverse Stellungnahmen von Autoren und Organisationen, einen Überblick gibt der oben schon zitierte Wikipedia-Artikel. Sucht man im Internet nach MMSE copyright, findet man viele weitere Stellungnahmen.

Anwender der deutschen MMSE dürften mit dem Kauf der oben genannten Testmaterialien wohl auf der sicheren Seite sein. Auch das Anwenden (aber nicht das Kopieren) von Originalformularen, die von der pharmazeutischen Industrie stammen, sollte ohne Copyright-Verstoß möglich sein, da man annehmen darf, dass die Industrie für den Nachdruck Lizenzgebühren bezahlt hat.

Die Durchführung ist schon in der Originalpublikation ausführlich erläutert. Die Arbeitsgedächtnisaufgabe war dort alternativ formuliert worden: entweder von 100 fünf mal nacheinander 7 subtrahieren oder „World“ rückwärts buchstabieren. Beide Aufgaben dürften ihren Zweck erfüllen, an Stelle von „World“ wird im deutschen Sprachraum häufig das Wort „Preis“ benutzt.

Die Zahl der richtigen Antworten ist der Testrohwert. Er reicht von 0 bis 30.

Die MMSE soll nicht eine normalverteilte kognitive Fähigkeit in einer Population messen, sondern gradiert einen Verlust der kognitiven Fähigkeiten vom „Normalzustand“ bis hin zu sehr niedrigen Werten. Das obere Ende des Messbereichs ist willkürlich an einem „gesunden, unbeeinträchtigten“ Niveau fixiert, das untere Ende beim Verlust aller kognitiven Fähigkeiten. Man wird also erwarten müssen, dass die Rohwertverteilungen sehr unterschiedlich sind, je nach dem, welche Personen untersucht werden: Gesunde drängeln sich definitionsgemäß alle am oberen Rand des Messbereichs und liefern stark rechtsgipflige Verteilungen, bei Stichproben dementer Personen ist eher mit einer symmetrischen Verteilung zu rechnen.

In TDB2Online werden die Leistungswerte für die meisten Verfahren, die im Zusammenhang mit Demenztestungen angewandt werden, nicht an jungen Erwachsenen normiert, sondern an Älteren. Dies ist eine schlichte Folge der Tatsache, dass es für die meisten derartigen Verfahren keine Daten von jüngeren Personen gibt. Bei der MMSE ist dies aber der Fall. Crum et al.6) haben 1993 in Verbindung mit einer epidemiologischen Studie des NIMH tatsächlich 18056 gesunde Erwachsene über 17 Jahre untersucht und die Ergebnisse so aufbereitet, dass man zumindest grobe Rohwertverteilungen gesunder Erwachsener darstellen kann. Abbildung 1 zeigt die aus der Abbildung 2 des Artikels exzerpierten und in Verteilungen rückgerechneten Daten. (Die Daten wurden aus Abbildung 2 und nicht aus der Tabelle entnommen, weil in der Tabelle nur die Perzentile 25, 50 und 75 berichtet werden).

Abbildung 1: Rückgerechnete Verteilungsform der MMSE-Rohwerte in der epidemiologischen Studie von Crum et al., 1993 für vier ausgewählte Altersgruppen

In der Abbildung, die der Übersicht halber nur vier von 14 Altersgruppen zeigt, lässt sich gut erkennen, dass in den meisten Altersgruppen sehr enge, rechtsgipflige Verteilungen resultieren. Erst bei den über 80-Jährigen nähert sich die Rohwertverteilung einer Normalverteilung, ist aber immer noch rechtsgipflig. Das Ganze ist natürlich Folge der absichtlichen Kappung der oberen Grenze des Messbereichs im durchschnittlichen oder knapp durchschnittlichen Bereich der kognitiven Fähigkeiten.

In einer weiteren Untersuchung7) an einer sehr großen Zufallsstichprobe von Personen über 65 Jahren (Gesamt-N: 13009) wurden für drei Altersgruppen Perzentilverteilungen berechnet und gezeichnet (Abbildung 1 auf Seite 325 der Arbeit), die viel feiner aufgelöst sind als die von Crum et al. (1993). Abbildung 2 zeigt die aus diesen Daten rückgerechneten Primärverteilungen der MMSE-Rohwerte für die drei Altersgruppen 65-69, 80-84 und für über 90-Jährige.

Abbildung 2: Rückgerechnete Verteilungsform der MMSE-Rohwerte in der MRC-Studie 1998 für drei ausgewählte Altersgruppen

Wegen der großen Stichproben und der detaillierten Darstellung der Perzentile lässt sich die Verteilungsform bis hin zu sehr niedrigen MMSE-Werten erkennen.

Mit den beiden oben genannten großen Studien ist eine Linearisierung auf der Grundlage von Flächentransformationen gut möglich. Dazu helfen uns die in Abbildung 3 zusammengestellten Daten.

Abbildung 3: Flächentransformationen von Perzentilwerten in IQ-skalierte Standardwerte für ausgewählte Stichproben (siehe Text)

Die ersten beiden Kurven zeigen die IQ-skalierten Standardwerte, wie sie sich aus der einfachen Flächentransformation der Perzentile für die Gruppe der 80-84-Jährigen aus den beiden großen Studien (Crum et al., 19938) und MRC, 19989)) ergeben würden. Die nächsten beiden Kurven zeigen das gleiche für die Gruppe der 65-69-Jährigen. Man sieht, dass die beiden Studien recht ähnliche Normwerte für diese beiden Altersgruppen liefern, was den Daten noch mehr Gewicht gibt, als sie es durch ihre schiere Größe ohnehin haben. Die fünfte Kurve von oben besteht aus zwei Teilen: einem dunkler gezeichneten Teil, der die Flächentransformation der Perzentile für die 25-29-Jährigen aus der Studie von Crum et al. (1993) zeigt, und einem helleren Teil, der die Extrapolation dieser Kurve zeigt. Die Extrapolation richtet sich in etwa nach dem tatsächlichen Verlauf bei den 65-69-Jährigen. Die beiden Teile der Kurve machen zusammen die Leistungswerttransformation für TDB2Online aus.

Abbildung 3 zeigt noch eine weitere (grün gezeichnete) Kurve. Sie stellt die Werte dar, die sich aus den Perzentilangaben in der Publikation von Welsh et al. (1994)10) ergeben. Dabei handelt es sich um die wohl am häufigsten benutzte Perzentilkurve für die komplette CERAD-Testbatterie, die die MMSE als Subtest enthält. Bis August 2019 wurde sie auch in TDB2 und TDB2Online verwendet. Welsh et al. (1994) haben damals eine Stichprobe von 413 gesunden Probanden untersucht, meist Angehörige von Patienten einer Gedächtnissprechstunde oder sonstige Freiwillige im Altersbereich zwischen 50 und 89 Jahren (Mittelwert 68,6 Jahre). Es ist bemerkenswert, dass diese Stichprobe mit einem Altersdurchschnitt von rund 69 Jahren erheblich besser abschneidet als die 65-69-Jährigen in den beiden randomisierten Studien, sogar etwas besser als die jungen Erwachsenen von Crum et al. (1993). Im nächsten Abschnitt werden wir näher darauf eingehen.

Für die MMSE gibt es viele Normuntersuchungen. In der Sammlung von Normen für oft verwendete Demenz-Screening-Instrumente, die Busch und Chapin 200811) zusammengestellt haben, sind zum Beispiel auch 13 Publikationen für die MMSE enthalten, allerdings beziehen sich nicht alle auf gesunde Probanden und nicht alle sind altersmäßig aufgeschlüsselt. Wir haben die Liste der dort angeführten Studien nach einer Literaturanalyse um weitere 5 Studien ergänzt. Als Normuntersuchungen wurden dabei nur Probandenstudien gewertet, bei denen definierte Altersgruppen untersucht wurden. Insgesamt wurden 9 solcher Studien gefunden, sie sind in Tabelle 1 mit den wichtigsten Merkmalen zusammengestellt.

Die ersten beiden Studien12) 13) wurden schon in den vorhergehenden Abschnitten besprochen, in beiden wurden riesige unselektierte Zufallsstichproben untersucht. Auch in der dritten Studie (Dufouil et al., 200014)) wurde unselektiert untersucht, nämlich alle Patienten von vier GP-Praxen in Cambridge. Die ADAMS-Studie15) zeichnet sich durch eine besonders sorgfältige Zufallsstichprobenerhebung aus. Die ersten vier Studien haben also die Gemeinsamkeit, dass keine Selektion der Patienten auf Grund kognitiv relevanter Variablen stattgefunden hat, zumindest keine außer der Fähigkeit, bei einer solchen Untersuchung mitzumachen. Auch bei den nächsten beiden Studien (Bravo & Hébert, 199716) und Tombaugh et al., 199617)) wurden zunächst Zufallsstichproben untersucht. Erst in einem zweiten Schritt wurden dann Personen, die auf Grund einer ausführlichen klinischen Untersuchung an einer Demenz oder einer sonstigen erworbenen kognitiven Störung litten, aus der Stichprobe entfernt.


Tabelle 1: Übersicht über die metaanalytisch verrechneten Normierungsstudien

Erstautor Jahr Altersbereich N Stichprobendefinition verwendete Statistiken Land
Crum 1993 18 und älter 18056 Zufall, Zensus Perzentile 90, 75, 50, 25, 10, 5; M, SD USA
MRC 1998 65 und älter 13009 Zufall, 5 Orte Abbildung mit Häufigkeiten pro Rohwert; M, SD UK
Dufouil 2000 75 und älter 2106 Alle Patienten aus vier GP-Praxen Abbildung mit Perzentilen 90, 75, 50, 25, 10 UK
ADAMS 2001 über 69 856 Zufallsstichprobe, repräsentativ für die US-Population über 69 Originaldaten auf Antrag erhältlich USA
Bravo 1997 65 und älter 7754 Kognitiv Gesunde aus einer vorherigen Zufallsauswahl Perzentile 50 ,25, 5; M, SD Kanada
Tombaugh 1996 65-89 406 Erst Zufall, dann Demenz ausgeschlossen Häufigkeiten pro Rohwert zwischen 16 und 30; M, SD Kanada
CERAD-Schweiz 2002 49-92 1100 Gesunde Angehörige und Freiwillige M, SD CH
Welsh 1994 50-89 413 Gesunde Angehörige Häufigkeiten pro Rohwert; M, SD USA
Beeri 2006 85 und älter 196 Gesunde, self-referred Perzentile 75, 50, 25, 10 als Anlage im Internet; M, SD USA
Bleecker 1988 40-89 194 Gesunde Perzentile 75, 50, 25; Häufigkeiten pro Rohwert USA


Bei den restlichen vier Studien bestand dagegen von Anfang an nicht die Absicht, eine Zufallsstichprobe zu ziehen. Bei diesen Stichproben wurden absichtlich möglichst nur gesunde Personen untersucht. Angestrebt waren also keine Zufalls-, sondern Idealstichproben. In zwei Studien (Schweizer CERAD-Normuntersuchung, 200218) und Welsh et al., 199419)) wurden vorwiegend die gesunden Angehörigen von Patienten einer Gedächtnisambulanz untersucht, in einer20) wurden Studienteilnehmer über Annoncen, über Vorträge in Seniorenzentren und durch weitere Mundpropaganda rekrutiert, und eine weitere21) gibt keine Auskunft über den Modus, außer, dass die Teilnehmer gesund waren.

Wie üblich finden wir unterschiedliche Statistiken zur Beschreibung von zentraler Tendenz und Dispersion in den Untersuchungen, manches auch nur über Grafiken. Bemerkenswert oft gibt es Perzentilwerte, was die Ableitung von Leistungswerten möglich machte (s.o.). In fast allen Untersuchungen wurden Mittelwerte und Standardabweichungen der MMSE-Rohwerte pro Altersgruppe berichtet, die Ausnahmen sind die Studien von Dufouil et al. (2000) und Bleecker et al., (1988). In beiden werden allerdings Mediane und Interquartildifferenzen angegeben. Die Frage war, in wie weit diese bei den gegebenen Verteilungen stellvertretend für Mittelwerte und Standardabweichungen eingesetzt werden können. Im vorliegenden Fall ließ sich das empirisch überprüfen. Bei vier Studien, darunter die beiden großen, lagen sowohl Mittelwerte und Standardabweichungen als auch Mediane und Interquartildifferenzen vor. In den folgenden Abbildungen sind die entsprechenden Statistiken jeweils vergleichend gegenübergestellt, in Abbildung 4 Mittelwerte und Mediane, in Abbildung 5 Standardabweichungen und die durch 1,35 dividierte Interquartildifferenz (Perzentil 75 minus Perzentil 25 dividiert durch 1,35). Das ist der Anteil der Interquartildifferenz, der bei einer Normalverteilung der Standardabweichung entspricht.


Abbildung 4: Verlauf von Mittelwerten und Medianen der MMSE-Rohwerte in vier Studien


Man sieht sehr schnell, dass sich die Statistiken erstaunlich gut entsprechen. Bei keiner der Studien gibt es größere Abweichungen zwischen Mittelwerten und Medianen, was angesichts der starken Schiefe der Verteilung nicht unbedingt zu erwarten war. (Bei der MRC-Studie liegen die Mediane nur für drei Altersgruppen vor, deshalb ist dort keine Linie durch die drei offenen Dreiecke gezogen.)


Abbildung 5: Verlauf von Standardabweichungen und entsprechenden Interquartildifferenzanteilen der MMSE-Rohwerte in vier Studien


Auch bei den Dispersionsmaßen ist die Übereinstimmung größer als man erwartet hätte. Lediglich bei der Studie von Crum et al. (1993) gibt es in den älteren Altersgruppen größere Abweichungen: Hier sind die Mediane höher als die entsprechenden Standardabweichungen. Das Ergebnis dürfte auf den verbreiterten Mittelbereich zurückzuführen sein, den die Perzentilkurve der Crum et al.-Daten (Abbildung 1) im Vergleich zu den MRC-Daten (Abbildung 2) aufweist (ohne dass ein Grund dafür zu finden wäre). Insgesamt ist jedoch auch hier die Entsprechung gut genug, dass wir für die Metaanalyse der Daten mit gutem Gewissen die Mediane und IQDs der zwei Studien einbeziehen können, die keine Mittelwerte und Standardabweichungen berichten.

Die nächsten beiden Abbildungen zeigen nun die Altersverläufe der zentralen Tendenzen und Dispersionen aus allen 9 Studien, die Abbildung 6 die Mittelwerte (bzw. die Mediane für zwei der Studien) und die Abbildung 7 die Standardabweichungen (bzw. die durch 1.35 dividierte Interquartildifferenz für zwei der Studien).


Abbildung 6: Altersverläufe der mittleren MMSE-Rohwerte in neun Normierungsuntersuchungen


In Abbildung 6 sind Studien mit Zufallsstichproben in Grün- und Blautönen gezeichnet, die von Studien mit ausgewählten Gesunden in Rot- und Gelbtönen. Man sieht auf den ersten Blick, dass die Zufallsstichproben erheblich niedrigere Rohwerte liefern als die selektierten Stichproben. Dies gilt über alle Altersgruppen hinweg, der Effekt wird in den höheren Altersgruppen aber viel stärker. Die durchschnittliche Rohwertdifferenz zwischen den Zufalls- und den selektierten Stichproben beträgt rund 1 Rohwert bei den jüngeren Probanden, 2 bis 3 Rohwerte bei den 70-80-Jährigen und 4 bis 7 Rohwerte bei den sehr alten Probanden. Selbst die beiden Studien, bei denen die klinisch demenzauffälligen Probanden aus der Zufallsstichprobe eliminiert wurden (Bravo et al., 1997 und Tombaugh et al. 1996), liefern immer noch niedrigere Rohwerte als die vier Stichproben mit Probanden, die von vornherein möglichst gesund sein sollten.


Abbildung 7: Altersverläufe der Streuungswerte der MMSE-Rohwerte in neun Normierungsuntersuchungen


Die Streuungsverläufe in Abbildung 7 zeigen ebenfalls den Einfluss der Stichprobenziehung, wenn auch nicht so deutlich. Die Streuungen der Zufallsstichproben verbreitern sich mit zunehmendem Alter und liefern damit einen plausiblen Verlauf. Die Streuungen der selektierten Stichproben sind dagegen alle niedriger und bleiben auch im hohen Alter auf einem niedrigen Niveau.

Die MMSE-Normuntersuchungen zeigen eindrücklich den Effekt der Stichprobenziehung auf die Normen psychologischer Testinstrumente. Anfallende Stichproben von Probanden, die sich freiwillig zu einer kognitiven Untersuchung melden, oder von Angehörigen, die ihre Verwandten in eine universitäre Demenzsprechstunde bringen, sind nicht repräsentativ für die breite Bevölkerung. Gleichzeitig kommt in diesen Grafiken aber auch noch ein anderer Effekt zum Tragen: Der Unterschied zwischen den beiden Stichprobentypen wird umso größer, je älter die Probanden sind. Dies hat mit dem zunehmenden Anteil dementer Probanden in den höheren Altersgruppen der Zufallsstichproben zu tun. In der Diskussion werden wir an Hand einer weiteren Studie diesen Sachverhalt und die unterschiedlichen Strategien, die dahinter stehen, weiter erörtern.

Weiter oben wurde schon dargelegt, dass die Transformation der Rohwerte in Leistungswerte vornehmlich auf den jungen Erwachsenen (25-29 Jahre) der Studie von Crum et al. (1993)22) basiert. Für die Altersnormen in TDB2Online wurde die MRC-Studie von 199823) hinzugenommen, um die Basis für die Altersnormen im relevanten Altersbereich ab 65 Jahre zu verbreitern. Die Studien mit den selektierten Stichproben Gesunder wurden nicht berücksichtigt, bei den kleineren Studien mit repräsentativen Stichproben lohnte sich die Mühe für die metaanalytische Berechnung nicht, weil die beiden großen Studien dabei ohnehin die Mittelwerte bestimmen. Die Perzentilwerte der MRC-Studie liegen nur für die Altersgruppen 65-69, 80-84 und >90 vor, weshalb die dazwischenliegenden Altersgruppen auf der Leistungswertebene linear interpoliert wurden. Danach wurden sie mit den entsprechenden Daten der Crum et al.- Studie gewichtet gemittelt. Als letzter Schritt erfolgte eine Glättung der Altersnormgrenzen über die Altersgruppen hinweg mit einer gleitenden Mittelwertsbildung fünfter Ordnung.

Aus diesen Berechnungen resultiert die in Abbildung 8 gezeigte Leistungs- und Altersnormierung des MMSE für TDB2Online. Wie gewohnt markieren auf dieser Abbildung die senkrechten Striche die Leistungswerte von 40 bis 145. Auf der schwarzen waagerechten Linie sind die Rohwerte eingetragen. Die abwechselnd rot und blau eingezeichneten Linien enthalten die Normgrenzen für alle Altersgruppen in der Übersicht. Die fünf Markierungen auf jeder Linie stehen für die Prozentränge 2.5, 16, 50, 84 und 97.5. Jeweils eine solche Linie, nämlich die, die der Altersgruppe des Probanden entspricht, wird (in anderer Form) im TDB2Online-Profilblatt eingezeichnet, um bei der individuellen Interpretation der Testergebnisse zu helfen.


Abbildung 8: MMSE-Leistungswerte mit Rohwerten und Altersnormgrenzen (siehe Text)


In den jungen Erwachsenenjahrgängen liegt der Median der Rohwerte bei rund 29 Rohpunkten. Der Messbereich des Verfahrens (30 Rohpunkte) endet bei einem Leistungswert von 110. Im oberen Messbereich (zwischen 27 und 30 Rohpunkten) misst die MMSE nur sehr grob, ein Rohpunkt mehr oder weniger entspricht rund 10 (IQ-skalierten) Leistungswerten. Unterhalb von 26 Rohpunkten ist die Messgenauigkeit deutlich feiner, hier entspricht ein Rohwert dann nur noch rund 3 Leistungswerten.

Die mittlere Leistung im MMSE variiert erwartungsgemäß stark mit dem Alter, wobei die Mediane progressiv mit zunehmendem Alter abfallen. Die mittlere Leistung von 80-Jährigen liegt um etwa eine Standardabweichung unter der mittleren Leistung von 60-Jährigen.

Man muss bei diesen Daten berücksichtigen, dass sie alle auf reinen auf Zufallsstichproben beruhen. In den höheren Altersgruppen enthalten diese einen zunehmend größeren Anteil von Personen, die an krankhaften Störungen der Kognition leiden. In der vorliegenden Normierung sind diese Personen nicht ausgeschlossen. Die Normierung bildet hier schlicht das Ergebnis einer Zufallsstichprobe ab. Die MMSE ist in TDB2Online noch ein zweites Mal als Subtest der CERAD mit einer anderen Normierung enthalten, bei der die dementen Personen aus den Normierungsstichproben ausgeschlossen wurden.

In einer früheren Version von TDB2 und TDB2Online, die bis zum 29. August 2018 im Gebrauch war, basierte die Leistungswerttransformation der MMSE auf der Untersuchung von Welsh (1994) und die Altersnormgrenzen (im Wesentlichen) auf den Daten der Baseler Normuntersuchung. Dies führte zu den Altersnormgrenzen, die in Abbildung 9 dargestellt sind.


Abbildung 9: Alte Version der MMSE-Leistungswerte mit Rohwerten und Altersnormgrenzen


Man kann erkennen, dass es bei der Leistungswerttransformation selbst keine großen Unterschiede gibt: Bei guten Leistungen (28 bis 30 Rohpunkte) sind die Leistungswerte in beiden Versionen fast gleich, nach unten hin unterscheiden sie sich zunehmend mehr. 15 Rohpunkte entsprachen in der alten Version einem Leistungswert von 41,1, in der neuen Version hingegen 48,5. Dabei muss man allerdings bedenken, dass die Leistungswerttransformation in der alten Version auf den Daten von älteren Erwachsenen (aus anfallenden Stichproben) beruhte.

Bei den Altersnormen sind die Unterschiede größer. Von 80-92-Jährigen (es gab keine feinere Altersauflösung in der alten Version) wurde eine mediane Leistung von etwa 27,5 Rohpunkten erwartet, während in der neuen Version nur 22 (90-94-Jährige) bis 25 (80-84-Jährige) erwartet werden. Niedrige Testwerte von alten und sehr alten Personen wurden nach den alten Normen also relativ schnell als „auffällig niedrig“ bewertet. Dies war die direkte Folge der verwendeten Normdaten, die nicht aus Zufallsstichproben stammten.

TDB2Online speichert keine Testwerte, TDB2 nur Rohwerte. Der erneute Ausdruck eines Testprofils in TDB2 wird automatisch mit den neuen Normen erstellt und kann im Einzelfall mit vorliegenden alten Ausdrucken verglichen werden.

Warum weichen die vorliegenden Normierungsstudien zur MMSE weiter voneinander ab als die zu anderen Testverfahren? Warum divergieren die Strategien zur Stichprobenziehung vor allem bei Instrumenten, die im hohen Alter Verwendung finden?

Die klassische Strategie zur Normierung psychologischer Tests sind Untersuchungen mit bevölkerungsrepräsentativen Stichproben. Dabei gehört es zum Standard, dass man auch Personen, bei denen es benennbare Ursachen einer kognitiven Störung gibt, nicht aus der Stichprobe ausschließt, solange sie den Test instruktionsgemäß durchführen können. Es ist normalerweise sogar als Standard akzeptiert (wenn auch keineswegs immer durchgeführt), dass minderbegabte und schwachsinnige Personen, die bei den üblichen Stichprobenziehungen (Kinder zum Beispiel in Schulen) nicht erfasst werden, speziell gesucht werden müssen, damit man die entsprechenden Quoten erfüllen kann 24) 25). Eine solche Strategie nimmt in Kauf, dass sich in der Stichprobe einige Personen befinden werden, die zum Zeitpunkt der Testung aus äußeren Gründen (vorranging Behinderungen, körperliche Krankheit, psychische Störungen) nicht im Vollbesitz ihrer kognitiven Leistungsfähigkeit sind. Es werden aber im Allgemeinen nicht viele sein und eine Missachtung dieser Leitschnur wird nicht allzu sehr auffallen.

Untersucht man Personen im höheren Alter, gilt dies allerdings nicht mehr. Krankheiten, die sich direkt auf die Kognition auswirken, nehmen im hohen Alter in einem Maß zu, das nicht mehr zu vernachlässigen ist. Je älter die untersuchte Gruppe desto stärker wird der Effekt. In reinen Zufallsstichproben von Personen im hohen Alter befinden sich zwangsläufig viele Personen, deren Leistung wegen benennbarer Gründe erniedrigt ist, insbesondere wegen krankhafter Störungen der kognitiven Fähigkeiten.

Manche der Studien, die Normdaten für die MMSE geliefert haben, sind nicht in erster Linie als bevölkerungsrepräsentative Studien geplant worden, sondern sollten gesunden Probanden untersuchen, die sich als Kontrollgruppe für Patientengruppen mit kognitiven Störungen eignen. Denkt man in einem medizinischen Modell, dann ist die adäquate Kontrollgruppe zu Patienten mit einer Demenz eine gesunde Gruppe ohne Demenz. Tests zur Erkennung von Demenzen (als solcher Test wird die MMSE in erster Linie eingesetzt) sollen Erkrankte möglichst gut von Nicht-Erkrankten trennen. Eine enge Auswahl der Nicht-Erkrankten und deren Selektion durch weitere Ausschlusskriterien begünstigt die statistische Trennung. Hier steht also nicht die adäquate Beschreibung der Leistungsfähigkeit im Vordergrund, sondern die möglichst effektive Trennung von Gruppen. Es gibt eine Anzahl von Studien, die sich damit beschäftigt haben, wie man die Stichproben noch „robuster“ machen kann 26) 27) 28). In den Studien von Sliwinski et al. (1996) und De Santi et al. (2008) wurden wie bei solchen Studien üblich zunächst nur Personen mit einer Demenz oder einer leichten kognitiven Störung (mild cognitive impairment, MCI) in der Ausgangsuntersuchung aus der Stichprobe ausgeschlossen. Zusätzlich wurden die Personen der Stichprobe im Längsschnitt über einige Jahre weiterverfolgt. Eliminierte man nun Personen, die zwar nicht in der Ausgangsmessung, aber in späteren Folgeuntersuchungen (vier und mehr Jahre) eine MCI oder eine Demenz entwickelten, rückwirkend aus den Ausgangsstichproben, dann erhöhte sich die kognitive Leistung dieser „robuster“ gemachten Ausgangsstichprobe. In der Studie von Hassenstab et al. (2016) wurden Personen aus der Ausgangsstichprobe entfernt, die in Biomarkern für eine Demenz vom Alzheimer Typ (PET-Untersuchung auf Amyloid-Ablagerungen, Liquor-Biomarker und Hippocampus-Dichte im MRT) auffällige Werte erreichten, ohne in Verhaltensmessungen auffällig zu sein. Auch hier zeigte sich die bereinigte Stichprobe als leistungsstärker und homogener, besonders in den höheren Altersgruppen. Im Vordergrund dieser Studien steht die Bereinigung der Kontrollstichprobe um Personen, die kognitive Störungen nicht nur auf Grund einer manifesten, sondern auch auf Grund einer sich entwickelnden Krankheit haben.

Eine so ausgewählte, möglichst gesunde Stichprobe ist als Kontrollstichprobe für Patienten mit einer Demenz für bestimmte Untersuchungszwecke sinnvoll. Allerdings kann man mit solchen Stichproben nicht das Ziel verfolgen, Instrumente zur bevölkerungsrepräsentativen Messung kognitiver Fähigkeiten zu entwickeln. Das geht nur mit Zufallsstichproben, auch wenn sich dort Gesunde und Kranke mischen, insbesondere im hohen Alter.

Welchen Effekt Selektionen nach Diagnosen oder auch späteren Diagnosen im Längsschnitt haben, kann man beispielhaft an den Daten einer US-amerikanischen Längsschnittstudie demonstrieren. Das Institute for Social Research der University of Michigan führt seit 1992 eine Health and Retirement Study (HRS) durch, die inzwischen mit über 30.000 Personen (davon 5000 nach Eintritt in die Studie gestorben) die gesamte US-Bevölkerung über 50 Jahre repräsentiert. Im Zusammenhang mit HRS wurde die Aging, Demographics, and Memory Study (ADAMS) durchgeführt, eine populationsbasierte Demenzstudie. Eine Übersicht über die Studie gibt die Arbeit von Langa et al. (2005)29). Eine Stichprobe von 856 Personen mit einem Alter von mindestens 70 Jahren wurde zwischen 2001 und 2003 (Welle A) zuhause durch Fachkräfte unter anderem mit MMSE, CERAD und TMT-A und B untersucht, dazu kamen noch weitere Demenzratings. In den Folgejahren wurden weitere Untersuchungswellen (B nach zwei Jahren, C nach 4 Jahren, D nach 6 Jahren) durchgeführt, die eine Betrachtung im Längsschnitt, auch retrospektiv, erlauben. Aus der HRS liegen außerdem viele weitere Daten vor, mit denen man die Ergebnisse für bestimmte Gruppen spezifizieren kann. Die Daten sind über die HRS-Website für Forscher auf Antrag zugänglich.

Um zu zeigen, welche Effekte gezielte Selektionen bei ursprünglich bevölkerungsrepräsentativen Stichproben haben, wurden mit den ADAMS-Daten vier Gruppen von Personen gebildet und deren MMSE-Rohwerte berechnet (Der ADAMS-Datensatz liefert Gewichtsfaktoren mit, auch solche für Verlaufsdaten):

  • Gruppe 1: die vollständige bevölkerungsrepräsentative (US-Population 2001) Ausgangsstichprobe bei Welle A
  • Gruppe 2: Ausgangsstichprobe ohne die aktuell Demenzkranken
  • Gruppe 3: Ausgangsstichprobe ohne die aktuell Demenzkranken und ohne die im Verlauf der nächsten 4 Jahren an einer Demenz Erkrankten
  • Gruppe 4: nur die zum Zeitpunkt A neurologisch und psychiatrisch komplett Gesunden

Die mittleren MMSE-Rohwerte dieser vier Gruppen wurden in die uns vertraute Abbildung mit den bisher untersuchten Stichproben eingezeichnet und das Ergebnis zeigt Abbildung 10.


Abbildung 10: Altersverläufe der mittleren MMSE-Rohwerte einschließlich der vier ADAMS-Gruppen (siehe Text)


Zusätzlich zu den Daten, die schon in Abbildung 6 zu sehen waren, ist in Abbildung 10 zunächst der mittlere Verlauf der MMSE-Rohwerte aus der Metaanalyse der Zufallsstichproben als durchgehende schwarze Linie eingezeichnet. Dazu kommen dann die gestrichelt gezeichneten Verläufe der vier ADAMS-Gruppen. Man sieht, dass die ADAMS-Zufallsstichprobe (in der Abbildung mit ADAMS_M1 bezeichnet, schwarz gestrichelt) gut den metaanalytisch errechneten TDB2-Normen entspricht (schwarze Linie). Jede weitere Selektion dieser Stichprobe hin zu möglichst gesunden Personen führt zu Stichproben mit besseren Leistungen. Die rot gestrichelte Kurve ergibt sich, wenn Personen mit einer aktuellen Demenz ausgesondert werden, die grün gestrichelte, wenn zusätzlich auch Personen mit einer zukünftig entstehenden Demenz ausgeschlossen werden und die blau gestrichelte, wenn nur noch Personen eingeschlossen werden, die in Welle A völlig gesund waren.

Allerdings fällt noch etwas auf: Selbst wenn die ADAMS-Zufallsstichprobe so kräftig selegiert wird, dass nur noch die rund zwei Drittel Gesunden übrigbleiben, so ist deren Leistung immer noch schlechter als die Leistung der in Rot-Gelb-Tönen gemalten selektierten Stichproben (Basel, Welsh, Bleecker und Beeri in der Abbildung). Dies ist nicht mehr durch den Ausschluss von Personen mit Demenz in diesen Stichproben zu erklären, sondern nur dadurch, dass von Anfang an eher intellektuell leistungsfähigere Personen in die Stichprobe gelangten.


1) , 3) , 5)
Folstein, M. F., Folstein, S. E., & McHoug, P. R. (1975) „Mini-Mental State“: A practical method for grading the cognitive state of patients for the clinician. Journal of Psychiatric Research, 12, 189-198
2)
Reisberg, B., Ferris, S.H., de Leon, M.J., et al. (1982) The global deterioration scale for assessment of primary degenerative dementia. American Journal of Psychiatry, 139, 1136-1139.
4)
Folstein, M. F., Folstein, S. E., & McHoug, P. R. (1990). Mini Mental Status Test (MMST). Deutsche Fassung von J. Kessler, H.-J. Markowitsch & P.E. Denzler. Weinheim: Beltz.
6) , 8) , 12) , 22)
Crum, R. M., Anthony, J. C., Bassett, S. S. & Folstein, M. F. (1993) Population-based norms for the Mini-Mental State Examination by age and educational level. Journal of the American Medical Association, 269, 2386-2391
7) , 9) , 13) , 23)
THE MEDICAL RESEARCH COUNCIL COGNITIVE FUNCTION AND AGEING STUDY (MRC CFAS) (1998). Cognitive function and dementia in six areas of England and Wales: the distribution of MMSE and prevalence of GMS organicity level in the MRC-CFA Study. Psychological Medicine, 28, 319-­335
10) , 19)
Welsh, K. A., Butters, N., Mohs, R. C., Beekly, D., Edland, S., Fillenbaum, G., & Heyman, A. (1994). The consortium to establish a registry for Alzheimers's disease (CERAD). Part V. A normative study of the neuropsychological battery. Neurology, 44, 609-614
11)
Busch, R.M. & Chapin, J.S. (2008) Review of Normative Data For Common Screening Measures Used to Evaluate Cognitive Functioning in Elderly Individuals. The Clinical Neuropsychologist, 22, 620-650
14)
Dufouil, C., Clayton, D., Brayne, C., Chi, L.Y., Dening, T.R., Paykel, E.S., O'Connor, D.W., Ahmed, A., McGee, M.A. & Huppert, F.A. (2000) Population norms for the MMSE in the very old. Estimates based on longitudinal data. Neurology, 55, 1609-1613.
15) , 29)
Langa, K. M., Plassman, B. L., Wallace, R. B., Herzog, A. R., Heeringa, S. G., et al., 2005., The Aging, Demographics, and Memory Study: Study design and methods, Neuroepidemiology, 25, 181-191
16)
Bravo, G. & Hébert, R. (1997) Age- and education-specific reference values for the Mini-Mental and Modified Mini-Mental State Examinations derived from a non-demented elderly population. International Journal of Geriatric Psychiatry, 12, 1008-1018.
17)
Tombaugh, T.N., McDowell, I., Kristjansson, B. & Hubley, A.M. (1996) Mini-Mental State Examination (MMSE) and the Modified MMSE (3MS): A psychometric comparison and normative data. Psychological Assessment, 8, 48-59.
18)
Stichprobenziehung beschrieben in Aebi, C. (2002) Validierung der neuropsychologischen Testbatterie CERAD-NP. Eine Multi-Center Studie. Dissertation, Universität Basel, verfügbar unter http://edoc.unibas.ch/46/1/DissB_6279.pdf. Daten auf N=1100 erweitert zusammengestellt im Bereich CERAD-Plus Online auf der Webseite der Baseler Memory Clinic unter http://www.memoryclinic.ch, Zugriff für Fachpersonen nach Registrierung
20)
Beeri, M.S., Schmeidler, J., Sano, M., Wang, J., Lally, R., Grossman, H. & Silverman, J.M. (2006) Age, gender, and education norms on the CERAD neuropsychological battery in the oldest old. Neurology, 67, 1006-1010
21)
Bleecker, M.L., Bolla-Wilson, K., Kawas, C. & Agnew, J. (1988) Age-specific norms for the Mini-Mental State Exam. Neurology, 38, 1565-1568
24)
Wechsler, D., 1956., Die Messung der Intelligenz Erwachsener. Bern: Huber. S. 123
25)
Wesman, A. G., 1955., Standardizing an individual intelligence test on adults: Some problems. Journal of Gerontology, 10, 216-219.
26)
Sliwinski, M., Lipton, R. B., Buschke, H. & Stewart, W., 1996., The effects of preclinical dementia on estimates of normal cognitive functioning in aging. Journal of Gerontology: Psychological Sciences, 51B, P217-P225.
27)
De Santi, S., Pirraglia, E., Barr, W., Babb, J., Williams, S. et al., 2008., Robust and conventional neuropsychological norms: Diagnosis and prediction of age-related cognitive decline. Neuropsychology, 22, 469-484.
28)
Hassenstab, J., Chasse, R., Grabow, P., Benzinger, T. L. S., Fagan, A. M., et al., 2016., Certified normal: Alzheimer’s disease biomarkers and normative estimates of cognitive functioning. Neurobiology of Aging, 43, 23-33
Melden Sie sich an, um einen Kommentar zu erstellen.
  • dokumentation/mini_mental_state_examination.1626704904.txt.gz
  • Zuletzt geändert: 2021/07/19 14:28
  • von res