Wenkerbögen neu kartiert

Die handge­zeich­ne­ten Karten des „Sprach­at­las des Deutschen Reichs“ (Wenker­kar­ten) sind ein eindrucks­vol­les Resultat einer enormen Daten­er­he­bung und eines detail­lier­ten manuellen Kartie­rungs­ver­fah­rens. Ich will hier einen Versuch einer zeitge­mä­ßen Visua­li­sie­rung vorstel­len, die genauso detail­ge­treu und zugleich intuitiv leichter verständ­lich ist als Wenkers Origi­nal­kar­ten. Das zentrale Problem besteht dabei darin, alle einzelnen Formen eines Erhebungs­phä­no­mens zu reprä­sen­tie­ren, ohne die Karte unüber­sicht­lich werden zu lassen. Vor allem bei der Kartie­rung der Vielfalt an vokali­schen Varianten ist das eine große Herausforderung.

Verschiedene Kartierungsversuche

Georg Wenker (s. Sprach­spu­ren 2021-11) hat seine Daten mittels Frage­bö­gen erfasst, die von lokalen Schul­leh­rern ausge­füllt wurden. In ihrem Versuch, die lokale Ausspra­che zu charak­te­ri­sie­ren, haben die Lehrer dabei die ihnen bekannten ortho­gra­phi­schen Mittel der deutschen Recht­schrei­bung benutzt (wie Dehnungs-h oder Umlaut). Dadurch liegen die Daten in einer jeweils indivi­du­el­len und damit unein­heit­li­chen Verschrift­li­chung vor. Eine der zentralen Ansichten Georg Wenkers war, dass sich aus diesen Laien-Transkriptionen dennoch sehr gute Raumbil­der der sprach­li­chen Vielfalt der deutschen Dialekte darstel­len lassen.

Wenkers Prinzip der Kartie­rung war, die Sprach­for­men genauso in den Karten abzubil­den wie sie von den Lehrern aufge­schrie­ben worden waren. Um die Bilder nicht mit Infor­ma­tio­nen zu überfrach­ten, hat er sog. Leitfor­men benutzt. Innerhalb der Grenzen einer farblich markier­ten Leitform wird ein Auftreten dieser Form nicht mehr explizit kartiert. Nur die Formen, die nicht zur Leitform gehören, werden einge­zeich­net. Die Entschei­dun­gen über den Grenz­ver­lauf dieser Leitfor­men und der sie umgeben­den Isoglos­sen sind dadurch natürlich von sehr großem Einfluss auf den visuellen Eindruck einer Karte. Graduelle Übergänge oder Gebiete mit einer Mischung verschie­de­ner Sprach­for­men sind nicht oder nur schwer visuell erkennbar.

Karte 1: Brot in der Origi­nal­dar­stel­lung von Georg Wenker (Inter­ak­ti­ve Karte).

Auch mehr als 100 Jahre nach Wenkers Erhebun­gen liegen noch immer nur Bruch­tei­le der Daten in trans­li­te­rier­ter und damit elektro­ni­scher Form vor. Für diesen Artikel verwende ich die Trans­li­te­ra­tio­nen der Wenker­bö­gen, die im Rahmen des „Kleinen Deutschen Sprach­at­las“ (KDSA) angefer­tigt worden sind. Für diesen Atlas wurden fast 6.000 Wenker­bö­gen ausge­wählt. Einzelne Formen aus diesen Bögen wurden trans­li­te­riert und elektro­nisch erfasst. Auf Basis dieser Daten ist der KDSA als ein klassi­scher gedruck­ter Atlas entstanden.

Die Darstel­lung im KDSA ist leider nicht sehr intuitiv erfassbar. Gemäß der Tradition des Ursprungs­ma­te­ri­als hat in diesem Atlas jede einzelne Sprach­form ein eigenes Symbol. Aber in Karten mit vielen verschie­de­nen Sprach­for­men werden dadurch viele Dutzend verschie­de­ne Symbole benutzt, was visuell ein eher konfuses Bild der geogra­phi­schen Vertei­lung ergibt. Vor allem fehlt das Wenker’sche Prinzip der Leitform als visuelle Vereinfachung.

Karte 2: Brot im KDSA.

In meinem Vorschlag zur Kartie­rung benutze ich Farben, um die verschie­de­nen Sprach­for­men darzu­stel­len. Dabei erhält jede Sprach­form eine eigene Farbe. Wenn nur ein paar Sprach­for­men vorkommen (wie bei den meisten Karten zu konso­nan­ti­schen Phäno­me­nen), dann können diese Formen einfach mit wenigen klar unter­scheid­ba­ren Farben wieder­ge­ge­ben werden. Grenzen sind dann nicht mehr notwendig und Übergänge oder Misch­ge­bie­te sind direkt zu erkennen.

Wenn aber mehrere Dutzend Sprach­for­men abgebil­det werden müssen (wie bei den meisten Karten zu vokali­schen Phäno­me­nen), dann braucht es eine zusätz­li­che Technik um die zahlrei­chen notwen­di­gen Farben zu wählen. Das Prinzip, das ich verwende, ist intuitiv und einfach: Ähnliche Vokale sollen mit ähnlichen Farben darge­stellt werden. Das farbliche Kontinuum wird so benutzt, um den konti­nu­ier­li­chen Vokalraum abzubil­den. Dadurch lassen sich plötz­li­che Farbüber­gän­ge im Raumbild als starke Sprach­gren­zen inter­pre­tie­ren, während gemischte Gebiete und konti­nu­ier­li­che Übergänge ebenso einfach zu erkennen sind.

Karte 3: Brot auf Basis der KDSA-Daten in neuer Darstellung.

Prinzipien der Kartierung

Bei der Gestal­tung der Karten habe ich folgende Prinzi­pi­en zu Grunde gelegt. Sie werden im Folgendem etwas ausführ­li­cher bespro­chen. Mehrere Beispiele stehen online zur Verfügung.

  • Jede geschrie­be­ne Origi­nal­form aus den Erhebungs­bo­gen wird direkt kartiert. Farben werden benutzt, um eine visuelle Inter­pre­ta­ti­on zu erleichtern.
  • Ähnliche Farben werden für ähnliche Sprach­for­men benutzt, wobei die Schreib­wei­se aus der Vorgabe (Wortlaut der hochdeut­schen Wenker­sät­ze in ortho­gra­phisch korrekter Schreib­wei­se) immer grau darge­stellt wird.
  • Die Darstel­lung füllt den gesamten geogra­phi­schen Raum: Die gesam­mel­ten Daten werden als eine Stich­pro­be inter­pre­tiert, die reprä­sen­ta­tiv sein sollte für den gesamten Raum.

Dem Prinzip von Wenker folgend werden die Daten nicht verein­facht oder umgedeu­tet, um eine Kartie­rung zu ermög­li­chen, sondern sie werden direkt so kartiert, wie sie in den handschrift­li­chen Bögen stehen. Jede einzelne Form ist in jeder Karte darge­stellt. Um die Karten nicht mit Infor­ma­tio­nen zu überfrach­ten, sind die Sprach­for­men elektro­nisch hinter­legt. Sie lassen sich durch einen Klick auf die Karte aufrufen (im Moment liegen leider noch keine Infor­ma­tio­nen zu den Orten und Bogen­num­mern elektro­nisch vor, aber sie sollen zukünftig auch hinzu­ge­fügt werden).

Jede Sprach­form hat eine eigene Farbe auf der Karte. Die Details der Farbge­bung in der jetzigen Fassung der Karten ist sicher nicht immer ideal, aber solche ästhe­ti­schen Einwände sind technisch leicht lösbar. Die Farbe Grau wird immer benutzt, um die Form der deutschen Ortho­gra­phie darzu­stel­len. Zum Beispiel in der vorhe­ri­gen Karte Brot ist deshalb das Vorkommen des <o> grau. Hellgrau wird benutzt für fehlende Daten und manchmal auch für Formen, die nur ein oder zweimal vorkommen (durch klicken kann die Origi­nal­form immer heraus­ge­fun­den werden). Bei bis zu maximal einem Dutzend verschie­de­nen Formen werden alle Varianten in der Legende aufge­lis­tet. Bei den Vokalen (mit oft bis zu 100 verschie­de­nen Formen) wird aber nur eine Auswahl der häufigs­ten Varianten in der Legende gezeigt.

Die Farben füllen den gesamten Raum des Erhebungs­ge­biets. Es gibt eine Lücke im tsche­chi­schen Sprach­raum sowie bei einigen Sprach­in­seln im Süden und Osten. Darüber hinaus gibt es keine weißen Flächen in den Karten. Obwohl natürlich nur einzelne Daten­punk­te erhoben worden sind, habe ich mich trotzdem dafür entschie­den den gesamten Raum zu füllen, anstatt vonein­an­der getrennte Symbole zu benutzen. Diese Entschei­dung habe ich einer­seits getroffen, um den visuellen Eindruck zu verbes­sern. Ander­seits hat dies auch einen theore­ti­schen Hinter­grund: Wenn die erhobenen Daten die wirkliche Sprach­viel­falt erfassen, dann sind die Daten eine reprä­sen­ta­ti­ve Stich­pro­be. Wenn sie das nicht wären, dann wäre gar keine dialek­to­lo­gi­sche Schluss­fol­ge­rung möglich und jegliches Kartieren überflüs­sig. Zwar steht jeder Farbtup­fer noch immer für einen Daten­punkt, aber die Gebiete zwischen zwei benach­bar­ten Daten­punk­te werden jetzt ausgefüllt.

Die Farbtup­fer auf der Karte sehen quadra­tisch aus und in vielen Fällen sind sie das auch. Das ist aber kein Grundsatz der Visua­li­sie­rung, sondern der Daten­samm­lung des KDSA geschul­det. In der Planung des KDSA sind die 6.000 Bogen anhand eines Koordi­na­ten­git­ters ausge­wählt worden. Die vorhan­de­nen Daten sind deshalb sehr regel­mä­ßig über den geogra­phi­schen Raum verteilt und das Ausfüllen des komplet­ten Raumes verur­sacht dadurch fast überall quadra­ti­sche Polygone. Bei genauer Betrach­tung der Karte lässt sich aber feststel­len, dass nicht alle Farbtup­fen quadra­tisch sind (z. B. in manchen Ecken des Sprach­rau­mes). Die Form der Polygone ist aber nicht bedeutungstragend.

Das Problem der Vokale

Die Kartie­rung von Konso­nan­ten stellt keine großen Probleme dar. Die Menge an Varianten ist relativ klein und es kommen nur eine Handvoll Varianten häufig vor. Ein paar wenige Farben reichen deshalb aus, um ein gutes Raumbild zu erstellen. Bei Vokalen ist die Situation aber komplett anders. Zum Beispiel der Vokal <o> in Brot hat 92 verschie­de­ne Verschrift­li­chun­gen in den KDSA-Daten, siehe (1). Hier braucht es also 92 verschie­de­ne Farben für die Karte.

(1)Verschie­de­ne Verschrift­li­chun­gen von <o> in Brot:
a, ä, aa, äa, aae, aao, aau, äau, ääu, ae, äeu, ah, ai, aie, ao, äo, aou, äou, ar, au, aü, äu, äü, auo, auu, e, ea, eao, eäu, ee, ei, eju, eo, eoa, eoo, eou, eroi, eruh, eu, eü, iäu, o, ö, oa, oä, öä, oaa, oao, oau, öau, oe, öe, oh, öh, oi, oo, öo, öö, ooa, ooä, ooe, ooi, ooo, oou, oouu, ou, oü, öu, oua, oue, ouu, ow, u, ü, ua, uä, uar, uau, ue, uee, uer, uh, uhe, ui, uo, uö, uoe, ur, uu, üü, uue, uui,

Um die Farben für alle 92 Formen auszu­wäh­len, habe ich eine Technik benutzt, die ursprüng­lich von Wilbert Heeringa (2004) in einem anderen Kontext vorschla­gen wurde. In einem ersten Schritt wird jeder Vokal als eine Reihe von 12 Zahlen charak­te­ri­siert. Die ersten fünf Zahlen beschrei­ben die Verän­de­rung der Vokalhöhe (in vier groben Stufen) und die nächsten fünf Zahlen beschrei­ben die Kontur der Vokal­po­si­ti­on (in 6 groben Stufen). Die letzten beiden Zahlen stehen für die Wieder­ga­be der Länge. All diese Zahlen basieren nur auf den Verschrift­li­chun­gen in den Bögen und sind deshalb phone­tisch sehr ungenau. Sie erfüllen aber den Zweck, die Farben für die Visua­li­sie­rung zu bestimmen.

Diese Zahlen­rei­hen lassen sich in einem zweiten Schritt mittels einer Metrik (z. B. eukli­di­sche Distanz) einfach mathe­ma­tisch verglei­chen. Daraus entsteht dann eine Distanz­ma­trix mit berech­ne­ten Distanzen für jedes Vokalpaar. Solch eine Distanz­ma­trix lässt sich mittels eines Verfah­rens der sog. Dimen­si­ons­re­duk­ti­on bearbei­ten, z. B. Multi­di­men­sio­na­le Skalie­rung. Das Resultat ist, dass jeder Vokal Koordi­na­ten im dreidi­men­sio­na­len Raum zugewie­sen bekommt. Dieser Raum ist nicht für die Kartie­rung gedacht, sondern die drei Koordi­na­ten werden benutzt, um eine RGB-Farbe (Rot-Grün-Blau) zu bestimmen. Diese Farbe wird dann in der Karte einge­tra­gen. Die Farben werden momentan für jede Karte neu bestimmt auf Basis des Vorkom­mens der Varianten. Deshalb sind die Farben (noch) nicht über die Karten hinweg vergleichbar.

Der Effekt dieser Technik ist erstaun­lich gut und das Resultat stimmt in vielen Facetten mit den origi­na­len Wenker­kar­ten überein. Im Vergleich zum Original sind aber noch bessere Einschät­zun­gen zur Klarheit der Grenzen und zu Übergangs- und Misch­ge­bie­ten möglich. Zum Beispiel kommt die Schrei­bung <au> in der Karte von Brot (hellgrün) in drei Arealen vor, aber jeweils auf ein andere Art (die Karte wird unten nochmal darge­stellt). Die Karte zeigt eine ganz klare Grenze zwischen der Ausbrei­tung von <u> (braun in der Mitte der Karte) und die Region mit <au> in Schlesien (hellgrün im Osten das braunen Gebietes). Ein Areal mit <au> im Westen (hellgrün) ist auch gut erkennbar, aber hier gibt es Übergangs­va­ri­an­ten mit ähnlichen Farben (Gelbtöne für ähnliche Diphthon­ge wie <äu>, <eo> und <äeu>, hellvio­lett für <a>). In Bayern ist eine Region mit einer Mischung von <au> (hellgrün) und <ou> (dunkel­grün) zu erkennen. Obwohl in allen drei Gebieten typisch <au> vorkommt, scheint der Kontext jeweils ein anderer zu sein.

Karte 4: Wieder­ho­lung der Karte Brot.

Webtechnologie

Technisch gesehen basieren die Karten in diesem Aufsatz auf weitver­brei­te­ten Webtech­no­lo­gien (HTML, CSS & Javascript). Obwohl die Karten dadurch online angeschaut werden können, ist es wichtig zu verstehen, dass das Internet für die Darstel­lung nicht notwendig ist. Eine Karte ist immer eine einzelne selbstän­di­ge Datei, die einfach gespei­chert und geteilt werden kann. Man kann sie zum Beispiel problem­los in einer E‑Mail oder in einer anderen elektro­ni­schen Kommu­ni­ka­ti­ons­form verschi­cken. Die Darstel­lung der Karte erfolgt immer über einen Webbrow­ser (Chrome, Firefox, Safari usw.), auch wenn die Datei lokal auf einem Rechner liegt und der Rechner nicht mit dem Internet verbunden ist.

Wenn Sie zum Beispiel diese Karte online aufrufen, dann können Sie über die Funktion des Webbrow­sers die Karte lokal auf Ihrem Rechner speichern („speichern unter …“) als HTML-Quellcode. Sie haben dann eine Datei mit der Endung „.html“, die Sie wie jede andere Datei benutzen können. Ein Doppel­klick auf die Datei öffnet die Karte im Webbrow­ser. Wenn Sie aber genau nach der Inter­net­adres­se im Browser schauen, dann werden Sie sehen, dass diese Webseite lokal auf Ihrem Rechner liegt (die Adresse fängt an mit „file://“).

Die Karten wurden erstellt in R https://www.r‑project.org und der Javascript-Bibliothek leaflet https://leafletjs.com. Die Fortschrit­te des Projektes zur neuen Internet-basierten Analyse und Darstel­lung der KDSA-Daten können Sie online verfolgen unter https://github.com/cysouw/KDSA.

Literatur

Heeringa, Wilbert. 2004. Measuring dialect pronun­cia­ti­on diffe­ren­ces using Levensht­ein distance. Rijks­uni­ver­sit­eit Groningen disser­ta­ti­on. https://research.rug.nl/en/publications/measuring-dialect-pronunciation-differences-using-levenshtein-dis

Kleiner Deutscher Sprach­at­las. 1984–1999. Dialek­to­lo­gisch bearbei­tet von Werner H. Veith, compu­ta­tiv bearbei­tet von Wolfgang Putschke und Lutz Hummel. 4 Bände. Tübingen: Max Niemeyer Verlag.

Diesen Beitrag zitieren als:

Cysouw, Michael. 2022. Wenker­bö­gen neu kartiert. Sprach­spu­ren: Berichte aus dem Deutschen Sprach­at­las 2(6). https://doi.org/10.57712/2022–06.

Michael Cysouw
Michael Cysouw arbeitet am Forschungszentrum Deutscher Sprachatlas zur weltweiten Sprachvielfalt und zu quantitativen Methoden mit denen sprachliche Vielfalt analysiert werden kann.