Multidimensionale Skalierung
(MDS), [engl. multidimensional scaling], [FSE], ist eine Familie von Verfahren, die Objekte des Forschungsinteresses durch Punkte eines mehrdimensionalen (meist: zweidimensionalen) Raums so darstellen, dass die Distanz zw. je zwei Punkten in diesem Raum, , einer gegebenen Proximität (allg. für Nähe-, Abstands-, Ähnlichkeits- oder Unähnlichkeitswert) der durch die Punkte repräsentierten Objekte,
, optimal entspricht. Der «Raum» ist in der MDS meist der euklidische Raum, die Distanzen also euklidische Distanzen (d. h. «natürliche Abstände» zw. Punkten entspr. der Länge von geraden Verbindungssegmenten). Die Spezifikation der Abb.
hängt davon ab, welches Skalenniveau man den Proximitäten zuweisen will. Im populärsten MDS-Modell, der ordinalen MDS, ist
eine monotone Funktion. Hier soll demnach gelten, dass wenn
, dass dann
, für alle
und
, für die Datenwerte vorliegen (hier formuliert für den Fall, dass die
Ähnlichkeiten sind). Gibt es Rangplatzbindungen [engl. tie], also Fälle, wo
, dann kann man fordern, dass dann auch
gilt. Üblicher ist es aber, für Ties die Beziehung von
und
offen zu lassen (primärer Ansatz für Ties). In einem anderen MDS-Modell, der Intervall-MDS, liegen die Proximitäten bis auf lineare Transformationen fest, d. h., es gilt
, wobei die Konstanten
und
frei wählbar sind (außer natürlich
). In der Verhältnis-MDS wird
gesetzt.
MDS-Modelle postulieren also, dass es eine m-dimensionale Punktekonfiguration gibt, deren Distanzen den gegebenen Proximitäten bzw. den auf ihrem Skalenniveau zulässig transformierten Proximitäten entsprechen.
Für echte Daten findet man i. Allg. keine perfekte Lösung für die MDS-Hypothese. Man kann aber immer nach einer approximativen, bestmöglichen Lösung mithilfe eines MDS-Programms wie Proxscal in SPSS oder Smacof in R suchen. Diese Verfahren minimieren die folg. Verlustfunktion, , in der über alle
summiert wird, für die Daten vorliegen (Missings werden übersprungen). Die Grundargumente der Stressformel sind die Terme
. Diese Differenzen drücken aus, wie ungenau oder mit welchem Fehler die Distanzen der MDS-Lösung die entspr. Proximitäten darstellen. Der Nenner dient der Normierung des Index; die Quadratwurzel hat nur historische Bedeutung.
Passt das MDS-Modell perfekt auf die gegebenen Daten, dann ist Stress = 0; ansonsten ist Stress > 0. Ob ein Nicht-null-Stresswert noch akzeptabel klein ist, hängt von vielen technischen Parametern ab, insbes. von der Anzahl der Punkte, der Dimensionalität der MDS-Lösung und dem Skalenniveau des MDS-Modells, aber auch vom Fehleranteil in den Proximitäten und der Interpretierbarkeit der MDS-Lösung. Zur ersten Bewertung eines Stresswerts verwendet man meist Stresswerte aus Computersimulationen. Sie sind in der einschlägigen Literatur publiziert.
Als Daten lassen sich in der MDS außerordentlich viele Messwerte verwenden wie etwa Korrelationen der Objekte über ihre Ausprägungen auf versch. Variablen; direkt erhobene globale Ähnlichkeitsratings für Paare von Objekten; oder Co-Occurrence-Koeffizienten, die erfassen, wie oft ein Ereignis zus. mit einem anderen auftritt. Der Zweck der MDS liegt heute meist in der Visualisierung von Datenstrukturen, bereinigt um kleine Details und Fehlerrauschen [engl. data smoothing]. Bes. populär ist die MDS als Instrument für die Veranschaulichung von Korrelationsstrukturen. Die MDS kann oft die wesentlichen Zus.hänge vieler Variablen in einem Bild darstellen, das viel leichter interpretierbar ist als Korrelationsmatrizen und auch andere Strukturen (z. B. Nachbarschaften, Figuren, Cluster und Regionen) zeigt als z. B. die Faktorenanalyse, die nur auf die Identifikation von Dimensionen abzielt.
Ursprünglich war die MDS ein psychol. Modell für Urteile zur Ähnlichkeit multiattributaler Objekte. Die diesen Urteilen zugrunde liegenden psychol. Wahrnehmungs- oder Urteilsdimensionen sollten aus globalen Urteilen über die Ähnlichkeit der Objekte mittels der MDS aufgedeckt werden. Dabei wurde postuliert, dass die Urteilsbildung als Berechnung der Distanz zw. Punkten im mehrdimensionalen psychol. Raum verstanden werden kann. Die Person soll also demnach die interessierenden Objekte zunächst in einem durch ihre Eigenschaften aufgespannten Raum wahrnehmen. Dann soll sie die Unterschiede von je zwei Objekten für jede Eigenschaft bestimmen und schließlich diese «intradimensionalen» Unterschiede aggregieren zu einer Gesamtdistanz, die ihrem Unähnlichkeitsurteil zugrunde liegt. Dieses Modell wurde, in zahlreichen Varianten, in vielen Experimenten studiert und hat zu einem deutlichen Zuwachs an Wissen über psychol. Urteilsbildung geführt.
Ein Spezialfall der MDS ist das Unfolding, ein Modell und Verfahren zur Skalierung von Präferenzdaten, z. B. Rankings oder Ratings von Personen für die Attraktivität versch. politischer Parteien. Das Modell stellt die Personen und die Parteien als Punkte in einem m-dimensionalen Raum so dar, dass die Distanzen zw. jedem Personen-Punkt (Idealpunkt) und jedem Partei-Punkt den Präferenzdaten optimal entsprechen. Das Unfolding-Modell ist von zentraler Bedeutung in der Forschung zu persönlichen Werten.