Bei genauer Betrachtung der Segmentkarte fällt auf, dass die meisten Lieder, vor allem Pop-Musik, nicht allzu gut geclustert sind. Klassische Musik hingegen liegt meist sehr sauber geclustert. Dies gilt natürlich dann auch für die Musikkarte, da sie auf der Verteilung der Segmente auf der Segmentkarte beruht. Untersucht man den Grund, so stößt man bei Betrachtung der entsprechenden Teile der Segmentkarte sehr schnell auf Lösungen. Vor allem der Anfang und das Ende der Lieder seien hier erwähnt. Heutzutage ist es bei Pop-Musik üblich, eine Intro (so wird der Beginn eines Liedes genannt) zu schreiben, die sich völlig anders als der Rest des Liedes anhören kann. Beispielsweise ist See You When You Get There (Coolio)ein Rap-Song, in dem innerhalb der ersten 25 Sekunden ausschließlich Violinen spielen. Natürlich wurde somit das erste und das dritte Segment in den Klassikcluster gemapped, während sonst kein weiteres Segment in diesem Sektor liegt. Auch der Schluss eines Liedes klingt bei vielen Liedern anders als der Hauptteil des Liedes selbst, wodurch sich hier wieder ein Problem für die nachfolgende Musikstückkarte ergibt. Ist das Lied zusätzlich nur von kurzer Länge, so bleiben durch die Reduktion der Segmente nur mehr sehr wenige Segmente zur Klassifikation zurück.
Eine weitere Möglichkeit besteht darin, dass sich Refrain und Strophe unterscheiden. Ironic (Alanis Morissette)beispielsweise hat sowohl eine ruhige Intro, wie auch einen langsamen Ausgang; die Strophen sind eher ruhig gehalten, während der Refrain ziemlich rockig ist. Daraus resultiert, dass die Segmente des Liedes über die ganze Karte verstreut sind. Betrachtet man die Segmente allerdings einzeln für sich und jede fünfsekundige Passage getrennt, so bekommt man einen Einblick in den Aufbau des Liedes. Tabelle zeigt in der ersten Spalte den Index des betrachteten fünfsekundigen Segments. Anhang gibt eine kleine Umrechnungshilfe für die Indizes. Die Spalte "`Lied"' zeigt das, nach Meinung zweier Testpersonen, "`Genre"' des fünfsekundigen Liedes selbst an, während hingegen Spalte "`Segment"' das "`Genre"' nach seiner Lage auf der Segmentkarte angibt. Um die Tabelle einfach zu halten wurden nur vier Buchstaben zur Kodierung verwendet: U steht für eine ruhige, S für schnellere, R für rockige und M für Übergänge zwischen den Passagen.
Dass die SOM allerdings auch Verbindungen aufzeigt, die man sonst nicht sieht, zeigt folgendes Beispiel. Die zwei Lieder Mission Impossible (Adam Clayton, Larry Mullen)und Macarena (Los Del Rio)haben auf den ersten Blick wenig gemeinsam. Trotzdem sind auf der Segmentkarte zweimal Überkreuzungen zu finden. Bei genauem Hinhören fällt auf, dass das Bassmotiv, das die ganze Zeit im Hintergrund zu hören ist, dasselbe ist. An einer bestimmten Stelle ( Imf.9, macarena.23), kann man das Bassmotiv sehr deutlich erkennen. Zu diesem Zeitpunkt sind nur wenige andere Instrumente zu hören. Hier zeigen sich ganz klar die Stärken der SOM, da sie durch ihre Architektur diese Beziehung aufspürt und auf der Karte richtig abbilden kann.