Open Data in der jiddischen Dialektologie

Der Mehrwert jedes (Atlas)Projekts ist es nicht, Selbst­zweck zu sein, sondern Grund­la­gen­for­schung zu leisten, die zum einen Anknüp­fung zu Nachbar­dis­zi­pli­nen ermög­licht und zum anderen sowohl spezi­fi­scher Forschung als auch allge­mei­nen Forschungs­fra­gen zuarbei­tet. Entspre­chend überra­schend ist es, dass die meisten Atlanten als publi­zier­tes Endpro­dukt ausschließ­lich Karten liefern. Dabei sind Karten ja bereits selbst eine Inter­pre­ta­ti­on der Daten und eine Analyse der im Projekt erhobenen Struk­tu­ren. Wichtig ist es daher, neben diesen Karten – die vor allem für Laien einen niedrig­schwel­li­gen Zugang zu dialek­ta­ler Variation liefern – auch die Kerndaten zur Verfügung zu stellen und der Fachge­mein­schaft offen zu legen.

Dieses Blank­zie­hen des Open Data Gedankens ist natürlich verbunden mit vielen Ängsten. Man macht sich damit angreif­bar und die Absolut­heit der finalen Inter­pre­ta­ti­on, wie sie etwa eine Karte sugge­riert, wird abgeschwächt und vielleicht sogar infrage gestellt. Auch die Angst, dass jemand anderes einem mit Analysen (für die man irgend­wann einmal Zeit zu finden hofft) zuvor­kom­men kann, wenn man die eigenen Daten veröf­fent­licht, ist ein nachvoll­zieh­ba­rer Grund, wieso viele Projekt­da­ten noch lange nach Projek­ten­de nicht (oder nur auf persön­li­che Nachfrage) zugäng­lich gemacht werden. Ein weiterer Punkt, der meist übersehen, aber nicht zu unter­schät­zen ist, ist der zeitliche Aufwand, den es kostet, die eigenen Daten für eine Veröf­fent­li­chung aufzu­be­rei­ten. Daten­sät­ze müssen bereinigt und vorzeig­bar gemacht werden. In den letzten Jahren hat dank techni­scher Innova­tio­nen ein Umschwung im Umgang mit Projekt­da­ten statt­ge­fun­den, der alle Diszi­pli­nen mehr oder weniger stark verändert und ganz neue Möglich­kei­ten eröffnet, denn bei allen indivi­du­el­len Ängsten überwiegt am Ende der unzwei­fel­haf­te Gewinn für den wissen­schaft­li­chen Fortschritt.

Ein recht kleines Fach, bei dem man diese Verän­de­run­gen gut nachver­fol­gen kann, ist die Jiddistik. Dieser Sprachspuren-Beitrag ist zum einen eine Art Sitten­ge­mäl­de dieser kleinen Fachkul­tur, die teilweise genera­li­sier­bar ist für die Germa­nis­tik und andere philo­lo­gi­sche Diszi­pli­nen. Anderer­seits ist dies hier eine Werbung für die Veröf­fent­li­chung von Projekt­da­ten und für die Möglich­kei­ten, die uns die Digita­li­sie­rung bietet, am Beispiel der jüngsten Veröf­fent­li­chung von Daten zu jiddi­schen Dialekten des 20. Jahrhun­derts. Zunächst aber möchte ich ältere Atlas­pro­jek­te über jiddische Varie­tä­ten und die Probleme, mit denen sie sich rumschla­gen mussten, vorstellen.

Schicksale von jiddistischen Atlasprojektdaten

In der Geschich­te der sehr jungen Disziplin der jiddi­schen Lingu­is­tik spiegelt sich im Kleinen wider, was wir auch bei größeren Diszi­pli­nen finden. Im 20. Jahrhun­dert gibt es eine Reihe Atlas­pro­jek­te zum Jiddi­schen, von denen ich im Folgenden die einschlä­gigs­ten näher vorstel­len möchte und anhand derer man gut den generel­len Wechsel von einer verschlos­se­nen Fachkul­tur hin zu einer offenen sehen kann.

Mit seiner am 24.01.1923 bei Ferdinand Wrede einge­reich­ten 609-seitigen Disser­ta­ti­ons­schrift Studien zur Geschich­te und dialek­ti­schen Gliede­rung der jiddi­schen Sprache begründet Max Weinreich (1894–1969) eine empirisch gestützte varia­ti­ons­lin­gu­is­ti­sche Beschäf­ti­gung mit dem Jiddi­schen als einer germa­ni­schen Sprache. Doch noch in seiner Disser­ta­ti­on äußert er sich skeptisch hinsicht­lich der Durch­führ­bar­keit eines jiddi­schen Atlasprojekts:

Ein S p r a c h a t l a s für das Jiddische wird sich wohl in absehbarer Zeit wegen der materiellen Schwierigkeiten und auch infolge der ungünstigen äusseren Verhältnisse im Siedlungsgebiet der jüdischen Massen nicht verwirklichen lassen. Daher ist es auch müssig, Betrachtungen darüber anzustellen, auf welcher Basis solch eine Arbeit durchgeführt werden solle [...]

(M. Weinreich 1923, Bd. 3: 153; Sperrung im Original)

Doch nur wenige Jahre später, nachdem er sich mit der Gründung des yidisher visns­haft­lek­her institut (YIVO) 1925 in Berlin quasi sein eigenes Forschungs­in­sti­tut schafft, führt er 1928/29 von Vilnius aus Umfragen durch, die zum Ziel haben, die lingu­is­ti­sche Variation der jiddi­schen Dialekte zu erheben. Die Daten dieser Umfragen liegen inzwi­schen im YIVO-Archiv in New York, welches eine baldige Digita­li­sie­rung bereits 2015 in Aussicht gestellt hat (https://vilnacollections.yivo.org/Questionnaires).

In etwa in der gleichen Zeit führt der sowje­ti­sche Philologe Mordkhe Veynger (1890–1929) zwischen 1925 und 1929 die ersten dialek­to­lo­gi­schen Erhebun­gen auf dem damaligen Gebiet der Sowjet­uni­on durch, ursprüng­lich mit dem Ziel eines Wörter­buchs. Sein früher, für Speku­la­tio­nen sorgender Tod 1929 setzt diesem Vorhaben jedoch ein jähes Ende. Leyzer Vilenkin (1894–1985) beschreibt in einem 2000 erschie­ne­nen Artikel die Situation der Daten unmit­tel­bar nach Veyngers Tod:

Veynger's spacious office: Along the walls—cabinets filled with cards. Raw material for the great Yiddish dictionary. The secretary says that there are already over a quarter of a million cards. Copied from modern Yiddish literature, partly from older, from specialized literature. Raw material, unprocessed.

(Vilenkin 2000: *3)

Chaim Holmshtok (1882–?1942) wird damit, betraut das Wörter­buch weiter­zu­füh­ren, und veröf­fent­licht 1935 in Minsk einen ersten Probeband. 1936 plant er in Birobidzhan, Haupt­stadt der vom Sowiet­re­gime gegrün­de­ten Jüdischen Autonomen Oblast, eine große jiddische Sprach­kon­fe­renz. Weder die Konferenz, noch sein Vortrag (Unifor­mat­sye fun di yidishe dialektn „Über die Verein­heit­li­chung der jiddi­schen Dialekte“) finden jedoch statt, da Holmshtok im Zuge des sogenann­ten Großen Terrors verhaftet wird. Er stirbt (vermut­lich) 1942 in einem Gulag. Die Materia­li­en des Wörter­buchs sind seither verschol­len (vgl. Burko 2019: 151).

1931 konnte aller­dings Vilenkin noch den yidisher sprak­h­at­les [sic!] fun sovetn-farband (Jiddi­scher Sprach­at­las der Sowjet­uni­on) heraus­brin­gen, welcher auf Veyngers Daten fußt und aus 74 Karten zu phono­lo­gi­schen Struk­tu­ren besteht (ein seltenes Exemplar des Atlas findet sich in der Biblio­thek des DSA und wurde erst durch die Digita­li­sie­rung der UB Marburg 2010 einer breiten Öffent­lich­keit zugäng­lich; http://archiv.ub.uni-marburg.de/eb/2010/0361/). Die Grund­kar­te dieses Atlas zeigt, dass Veynger ein dichtes Ortsnetz als Grundlage hatte. Die Isoglossen- und Leitfor­men­kar­tie­rung der einzelnen Struk­tu­ren bringt jedoch eine nicht zu leugnende Unschärfe in diesen verloren gegan­ge­nen Datenschatz.

Der deutsche und der sowje­ti­sche Faschismus und Antise­mi­tis­mus zerstören neben Menschen­le­ben auch die gesamte europäi­sche Forschungs­struk­tur der Jiddistik und lösen das ursprüng­li­che Sprach­ge­biet des Jiddi­schen auf. Für die Diskus­si­on pro/contra Open Data kann der Blick auf das tragische Schicksal jiddi­scher Atlas-Daten uns lehren, dass es nie eine gute Idee ist, wenn nur eine Version der Daten und Quellen existiert. Gerade mit dem Blick auf aktuelle Kriege und klima­wan­del­be­ding­te Katastro­phen generiert Open Data auch Sicherungskopien.

Außerhalb Europas lebt das Jiddische in der Emigra­ti­on fort und findet v.a. in der chassi­di­schen Ultra­or­tho­do­xie einen Raum, in dem in den letzten Jahrzehn­ten ganz neue jiddische Dialekte entstan­den sind. In der säkularen Welt ist man bereits seit dem ausge­hen­den 19. Jahrhun­dert entweder bemüht, die germa­ni­sche Sprache Jiddisch zugunsten der neuen Kontakt­spra­chen aufzu­ge­ben oder zumindest zu standar­di­sie­ren, um ihm den Status einer „vollwer­ti­gen“ Natio­nal­spra­che zu verleihen. Nach 1945 verstär­ken sich diese Tendenzen. Die Dialekte werden als „minder­wer­tig“ stigma­ti­siert; insbe­son­de­re die dem Deutschen naheste­hen­den Dialekte des Südens, die wiederum besonders prägend für die modernen chassi­di­schen Dialekte sind. Grundlage für die entste­hen­den Gramma­ti­ken des (Standard)Jiddischen sind v.a. Ideali­sie­run­gen der litera­ri­schen „Klassiker“ des späten 19. Jahrund­erts wie Mendele Moicher Sforim, Itzhok Lejb Perez und Scholem Alejchem.

Nach dem Holocaust gibt es aber auch eine Reihe von Unter­neh­mun­gen, die den Anspruch haben, die ehemalige Verbrei­tung und Variation der jiddi­schen Dialekte noch anhand der letzten Sprecher und Spreche­rin­nen, die überleb­ten, einzu­fan­gen. Die meisten dieser Projekte folgen den Prinzi­pi­en guter wissen­schaft­li­cher Praxis. Eines sticht aller­dings leider sehr negativ heraus; nicht zuletzt, weil es auch dazu diente, die braune Weste des Verfas­sers, Franz Beranek (1902–1967), weiß zu waschen (vgl. Weiser 2018).

Dieser Westjid­di­sche Sprach­at­las von Beranek – die 109 Karten zu lexika­li­schen und phono­lo­gi­schen Kontexten sind auf regionalsprache.de im SprachGIS einsehbar – sollte nicht ohne die Rezension von Florence Guggenheim-Grünberg (1966) als Gebrauchs­an­wei­sung verwendet werden. Zu diesem einer­seits karto­gra­fisch sehr fragwür­di­gem und groben Atlas fehlt es gänzlich an Quellen und entspre­chend ist auch kein Material erhalten, auf dem diese Karten basieren.

Laut Vorwort des Atlas wurden die Daten in direkten und indirek­ten Befra­gun­gen zwischen 1928 und 1961 in 243 Ortspunk­ten erhoben, doch es gibt keine näheren Ausfüh­run­gen zur Methode und Durch­füh­rung dieser Erhebun­gen. Insgesamt macht diese Publi­ka­ti­on den unguten Eindruck, dass „die Einfach­heit, Klarheit und mühelose Verständ­lich­keit der einzelnen Karten­bil­der“ (Beranek 1965: 1) über eine ungenaue und unklare Datenlage hinweg­täu­schen will. Der Westjid­di­sche Sprach­at­las ist ein trauriges Beispiel der Nachkriegs­ger­ma­nis­tik und zeigt ganz deutlich die Vorzüge einer Fachkul­tur, die ihre Quellen und Daten teilt und offenlegt.

Aufschluss­reich ist hier die Antwort Beraneks auf die bereits erwähnte Rezension von Florence Guggenheim-Grünberg (1966) in der Zeitschrift für Mundart­for­schung. Hier versucht sich Beranek für die grobe und z.T. fehler­haf­te Kartie­rung seines Atlas zu recht­fer­ti­gen, indem er Guggenheim-Grünberg vorwirft, ihm ihre Daten zum Westjid­di­schen vorent­hal­ten zu haben:

Vielleicht hätten sich manche Vakua in den Karten vermeiden lassen, wenn die Rezensentin mir die meinerseits erbetene Forschungshilfe nicht versagt hätte. Das nur nebenbei.

(Beranek 1968: 48)

Als direkte Reaktion darauf schreibt Guggenheim-Grünberg:

Forschungshilfe: Herr Beranek hat seinerzeit von mir verlangt, daß ich ihm die Resultate meiner Untersuchungen in der Schweiz zur Verfügung stelle, bevor ich dieselben selber publiziert hatte, was ich ablehnte. In welcher Art und Weise er sich derselben bedient hätte, geht aus seinem Atlas hervor; darin ist überhaupt nichts zu finden über die Quellen, die ihm von andern zeitgenössischen Kollegen in Europa bereitwillig zur Verfügung gestellt worden sind, so wenig wie über andere, geschriebene oder gedruckte, zeitgenössische oder historische Informationsquellen, die er benützt hat. Wie man ein solches Verfahren zu beurteilen hat, möchte ich der Einsicht des Lesers überlassen.

(Guggenheim-Grünberg 1968: 49)

Wie aus diesem öffent­lich ausge­tra­ge­nen Streit ersicht­lich, verfügte die promo­vier­te Apothe­ke­rin Florence Guggenheim-Grünberg (1898–1989) über wertvolle Daten zu westjid­di­schen Dialekten (nicht nur) der Schweiz. Unter anderem flossen diese in die 56 Karten ihres Atlas „Jiddisch auf aleman­ni­schem Sprach­ge­biet“ (Guggenheim-Grünbergs 1973). Diese Karten sind nun die ersten jiddi­schen Dialekt­kar­tie­run­gen, die Punkt­kar­tie­run­gen jeder genannten Variante liefern und keine Isoglossen- und Leitfor­men­kar­tie­rung verwenden.

Archi­viert sind ihre Quellen und Tonauf­nah­men, die die Grundlage für ihre Arbeiten zum Schweizer Jiddisch bilden, im Florence Guggen­heim Archiv zur Geschich­te, Sprache und Volks­kun­de der Juden in der Schweiz und zur Genea­lo­gie der Surbta­ler­ju­den der israe­li­ti­schen Cultus­ge­mein­de Zürich, welches 2013 von Zürich ins Staats­ar­chiv Aargau umzog.

Alle bisher genannten Atlas­pro­jek­te erheben keinen Anspruch, das gesamte ost- wie westjid­di­sche Sprach­ge­biet abzubil­den. Jean B. Jofen (1922–2005) legt 1953 mit ihrer Disser­ta­ti­on einen ersten, kleinen, das gesamte ostjid­di­sche Sprach­ge­biet abdecken­den Atlas vor, der auf Inter­views mit jüdischen Einwanderer:innen in New York basiert (Doktor­va­ter ist Uriel Weinreich, Sohn von Max Weinreich). Grundlage sind 67 frage­bo­gen­ge­lei­te­te Inter­views zu 191 Wörtern und Ausdrü­cken. Die Inter­views selbst sind m.W. nicht mehr erhalten oder zumindest nicht zugäng­lich. Ihre Karten mit handge­zeich­ne­ten Isoglos­sen sind äußerst grobschläch­tig (1964 bringt sie die Karten in etwas besserer Qualität als kleinen Atlas heraus). Dennoch ist der Wert dieser Arbeit nicht zu unter­schät­zen. Sie zeigt damit nämlich erstmals, dass Uriel Weinreichs „lingu­i­stic geography at a distance“ (U. Weinreich 1962: 9) möglich ist. Diese Distanz ist im Fall des Jiddi­schen nach der Shoah ein doppelter: zeitlich und räumlich. Die Dialekte ihrer Geburts­or­te im Gepäck können so in der Nachkriegs­zeit Migrant:innen wertvolle Gewährs­per­so­nen für Sprach­at­lan­ten sein (also eine ganz andere Infor­man­ten­grup­pe, als die üblichen NORMS und NORFS). Jofens Disser­ta­ti­on ist für Weinreich quasi ein Testlauf für sein Großpro­jekt: Ein jiddi­scher Sprach- und Kultur­at­las der alten europäi­schen Dialekte auf Basis von Inter­views mit Jiddisch sprechen­den Migrant:innen der Nachkriegs­zeit: der Language and Culture Atlas of Ashke­n­a­zic Jewry (LCAAJ).

Der LCAAJ knüpft an die vom Atlas lingu­is­tique de la France (ALF) einge­führ­ten Methoden der direkten Befragung von Sprecher:innen durch Inter­view­er an, wie sie auch für den Sprach­at­las der deutschen Schweiz (SDS) und den Atlante italo-svizzero/Sprach- und Sachatlas Italiens und der Südschweiz (AIS) verwendet wurde, mit denen Uriel Weinreich (1926–1967) und seine Frau, die Ethno­lo­gin Beatrice (Bina) Silverman Weinreich (1928–2008), spätes­tens während ihres Aufent­halts in Zürich 1949/50 in Kontakt gekommen sind (vgl. Schäfer 2020). Das Zürcher Erlebnis ist wohl der entschei­den­de Moment, der die Idee für den LCAAJ aufkeimen läßt. In einem Brief vom 19. Februar 1950 an Joshua Fishman schreibt U. Weinreich:

Our appetites for language and folklore have grown voraciously, and I am afraid that we will not get away with less than a Yiddish language and folklore atlas.

(Brief von U. Weinreich an J. Fishman 19.02.1950)

In den Jahren darauf entwi­ckel­te U. Weinreich ein umfang­rei­ches Fragebuch für direkte Erhebun­gen mit Migrant:innen in v.a. New York, aber u.a. auch in Mexiko, Kanada oder Israel. Nach einigen Vorun­ter­su­chun­gen (darunter die bereits genannte Disser­ta­ti­on von Jofen 1953) wurden zwischen 1959–1972 knapp 1.000 Informant:innen inter­viewt und damit das umfang­reichs­te Datenset der alten jiddi­schen Dialekte geschaffen.

Die trainier­ten Interviewer:innen fertigten parallel Fieldno­tes zu den Inter­views an, in denen die Antworten der Gewährs­per­so­nen in einer spezi­el­len phone­ti­schen Transkrip­ti­on auf Basis des Inter­na­tio­na­len Phone­ti­schen Alphabets (IPA) dokumen­tiert wurden. Die ungewöhn­li­che Form des Transkrip­ti­ons­sys­tems sollte die Übertra­gung der Daten in ein Compu­ter­sys­tem erleich­tern und war daher auf die 47 Symbole der IBM-Tastatur begrenzt (Burko 2019, 368). So sieht z.B. die Überset­zung von Frage 10 auf Seite 176 des Frage­buchs „he didn’t want to marry her“ bei einem im ukrai­ni­schen Bar geborenen Infor­man­ten (ID 49272) folgen­der­ma­ßen aus:

3ROD N1Z+ G81VOLT M1T IR XO,S1NUB+

Dies entspricht:

er=od niʒ givolt mit ir xosin=ubn
wörtl. „er hat nicht gewolt mit ihr Hochzeit haben“

Um die Fieldno­tes im Nachhin­ein überprü­fen zu können, wurden zeitgleich Tonauf­nah­men der Inter­views angefer­tigt; im eigent­li­chen Zentrum standen aber die für die compu­ta­tio­nel­le Weiter­ver­ar­bei­tung optimier­ten Mitschrif­ten (vgl. U. Weinreich 1964). Alles an dem Projekt war darauf angelegt, in digitaler Form archi­viert und analy­siert zu werden.

Das Schicksal dieses Großpro­jekts war leider gebunden an das Schicksal des Projekt­lei­ters. Nach Uriel Weinreichs frühen Tod 1967 übernahm die Projekt­ver­ant­wor­tung Marvin Herzog (1927–2013), der 1965 im LCAAJ-Projekt zum Jiddi­schen in Nordpolen promo­viert hatte.

Es dauerte bis in die 1990er Jahre, dass drei gedruckte Atlanten aus dem Projekt veröf­fent­licht wurden (Herzog et al. 1992, 1995, 2000); von denen aber nur der letzte Band Karten zu lingu­is­ti­schen Phäno­me­nen liefert. Diese Karten sind wieder grobschläch­tig und geben nur in seltenen Fällen Ortsva­ri­an­ten an. Digital einsehbar waren diese Karten kurzzei­tig im lizenz­pflich­ti­gen DeGruyter Treasury of Linguistic Maps Online.

1990 promo­vier­te Ulrike Kiefer bei Marvin Herzog mit einer Arbeit zum Wortgeo­gra­phi­schen Kontinuum zwischen Deutsch und Jiddisch. In 84 Karten zu Einzell­e­x­e­men stellt sie Daten des Wortatlas der Deutschen Umgangs­spra­chen (Eichhoff Bd. 1: 1977, Bd. 2: 1978), Wortgeo­gra­phie der hochdeut­schen Umgangs­spra­che (Kretschmer 1969) und des dtv-AtlasDeutsche Sprache (König 1978) in Vergleich mit Daten des LCAAJ. Auch wenn hier die hinter den Karten stehenden Daten fehlen und unklar ist, ob sie die Audio­auf­nah­men, die Fieldno­tes oder die Compu­ter­da­ten (s.u.) verwendet, nutzt sie zumindest Punktkartierungen.

Kiefer initi­ier­te mit der infor­ma­ti­schen Unter­stüt­zung von Robert Neumann in den frühen 2000er Jahren mit dem Projekt Evidence of Yiddish documen­ted in European societies (EYDES, siehe http://www.eydes.de) einen Versuch, die Tonauf­nah­men des Projekts digital zu veröf­fent­li­chen und in einem Crowdsourcing-Ansatz zu trans­li­te­rie­ren. Auch ein Online-Kartierungstool (WebGIS) wurde in diesem Rahmen entwi­ckelt. Dieses ambitio­nier­te digitale Vorrei­ter­pro­jekt, finan­ziert durch das Land NRW und den Förder­ver­ein für Jiddische Sprache und Kultur e.V. Düssel­dorf, ist zu einem Beispiel geworden, von dem spätere Digita­li­sie­rungs­pro­jek­te lernen konnten und können.

Insbe­son­de­re die fehlende insti­tu­tio­nel­le Anbindung und Grund­si­che­rung hat dazu geführt, dass die Seite inzwi­schen kaum mehr voll funkti­ons­fä­hig ist, da es keine Pflege und Aktua­li­sie­rung gab. Das Kartie­rungs­tool etwa funktio­niert bereits seit den 2010ern nicht mehr. Die Tonauf­nah­men sind in nur sehr geringer Audio­qua­li­tät verfügbar und nur ein Bruchteil davon ist sinnvoll durch­such­bar, weil die einzelnen Inter­views in Minuten­ab­schnit­te zerschnit­ten sind. Dies kann man natürlich niemandem zum Vorwurf machen, denn es reprä­sen­tiert einfach den Stand der Technik aus dieser Zeit.

Mein Kritik­punkt an diesem für damalige Verhält­nis­se überaus groß gedachten Projekts mit Online-GIS und einem Stream der Tonauf­nah­men im Browser mit parallel ablau­fen­den Trans­li­te­ra­tio­nen ist, dass dieser riesige techni­sche Aufwand die eigens für die digitale Verab­rei­tung angeleg­ten Fieldno­tes ignoriert. Es wäre technisch einfacher und langfris­tig stabiler gewesen eine Textda­ten­bank aufzu­bau­en, statt mit Audio und Weban­wen­dun­gen vielleicht innovativ, aber nicht nachhal­tig zu denken. 

Diese schrift­li­chen Projekt­da­ten des LCAAJ selbst blieben bis zu Marvin Herzogs Tod unter Verschluss. 2013 gingen sie an die Columbia Univer­si­ty, wo es der engagier­ten Biblio­the­ka­rin Michelle Chesner zu verdanken ist, dass sie in den vergan­ge­nen 5 Jahren zugäng­lich gemacht wurden. Zunächst wurden die schrift­li­chen Quellen einge­scannt und mit den IDs der Inter­views in eine kleine Datenbank einge­pflegt. Anschlie­ßend wurden auch die Tonauf­nah­men noch einmal neu und hochauf­lö­send digita­li­siert. Beides wurde auf Seiten der Columbia Univer­si­ty Libraries veröf­fent­licht (Fieldno­tes und Notiz­bü­cher von U. Weinreich: https://dlc.library.columbia.edu/lcaaj; die Tonauf­nah­men: https://dlc.library.columbia.edu/time_based_media/).

Die im Rahmen des frühen LCAAJ am IBM Watson Scientific Laboratory der Columbia Universität entstan­de­nen Lochkar­ten sind verschol­len. Aller­dings fanden sich im Nachlass des LCAAJ Ausdrucke der Compu­ter­da­ten, die inzwi­schen auch vom Team um Michelle Chessner einge­scannt und mittels OCR re-digitalisiert wurden (https://dlc.library.columbia.edu/lcaaj?f%5Blib_format_sim%5D%5B%5D=printouts).

Beispiel für einen Ausdruck der ursprüng­li­chen LCAAJ-Daten; Antworten auf Frage Nr. 109–100 oyf vos hot men bay aykh geribn khreyn? ‘Womit hat man bei euch Meerret­tich gerieben?’ (Quelle: https://dlc.library.columbia.edu/lcaaj?f%5Blib_format_sim%5D%5B%5D=printouts)

Von 2017 bis 2022 habe ich mit diesen Fieldno­tes im Rahmen des Projekts Syntax of Eastern Yiddish Dialects (SEYD) gearbei­tet. Da dieses von sowohl privaten (Thyssen Stiftung) als auch öffent­li­chen Geldern (BMBF) finan­zier­te Projekt ohne die Öffnung und Digita­li­sie­rung der Daten durch die Columbia Univer­si­ty unmöglich gewesen wäre, ist es eine Selbst­ver­städ­lich­keit, dass nun die Daten des SEYD-Projekts auf den Servern der Columbia Univer­si­ty frei verfügbar sind (Schäfer 2022 = https://academiccommons.columbia.edu/doi/10.7916/d8-nc5d-ep60).

Das Repositorium des SEYD-Projekts

Das Reposi­to­ri­um des SEYD Projekts (Schäfer 2022) bündelt die im Projekt generier­ten Kerndaten mit Trans­li­te­ra­tio­nen von 141 Überset­zungs­auf­ga­ben und Sugges­tiv­fra­gen auf Basis der LCAAJ-Fieldnotes. Darüber hinaus liefert es lingu­is­ti­schen Annota­tio­nen und 323 Kartie­run­gen dieser Annota­tio­nen zu ausge­wähl­ten lingu­is­ti­schen (nicht nur syntak­ti­schen) Phäno­me­nen. Die Daten sind sortiert nach den Kürzeln der einzelnen Frage­num­mern im Fragebuch. Die Trans­li­te­ra­tio­nen und Annota­tio­nen liegen als einfache komma­ge­trenn­te (.csv) Tabellen vor. Zu jedem Satz gibt es wiederum eine einfache Textdatei (.rtf), in der die Annota­tio­nen aufge­schlüs­selt sind. Die Kartie­run­gen sind sowohl als statische Bildda­tei­en (.png) als auch in geogra­phi­sche Infor­ma­ti­ons­sys­te­me einbind­ba­re Formate (shapefile, GeoJSON) verfügbar. Eine Erklärung des struk­tu­rel­len Aufbaus des Reposi­to­ri­um und alle Karten sind in einer Index­da­tei gebündelt, die in diversen Formaten vorliegt (.pdf, .epub, .tex, .md, .html).

Daneben gibt es einen Ordner mit einer Browser­an­wen­dung, in der sich alle Karten anzeigen und überblen­den lassen und die auch auf https://schaeferlea.github.io/SEYD-WEBMAPS/ nutzbar ist. In diesem WebGIS gibt es auch die Möglich­keit über einen Layer direkt in die Tonauf­nah­men der Columbia Libraries für die einzelnen Orte zu springen.

Das Reposi­to­ri­um beinhal­tet nur die Trans­li­te­ra­tio­nen und deren Annota­tio­nen (inkl. deren Kartie­run­gen). Die darüber hinaus­ge­hen­den Analysen des Materials sind in Zeitschrif­ten und Sammel­bän­den sowie der abschlie­ßen­den Monogra­phie (Schäfer vsl. 2023) veröf­fent­licht. Während also die Trans­li­te­ra­tio­nen die Arbeit mit den Daten der Fieldno­tes für zukünf­ti­ge Arbeiten erleich­tern, machen die Annota­tio­nen die publi­zier­ten Analysen trans­pa­rent, überprüf­bar und wider­leg­bar. Zugleich liefern die Karten einen einfachen, auch für lingu­is­ti­sche Laien niedrig­schwel­li­gen Zugang zu den Materia­li­en und der Arealität der histo­ri­schen ostjid­di­schen Dialekte des 20. Jahrhunderts. 

Eine sehr geschätz­te Kollegin meinte neulich zu mir, dass man irgend­wann an den Punkt kommt, wo ein Projekt erwachsen ist und man es getrost auch einmal alleine draußen spielen lassen kann. Das sich nun nach der Veröf­fent­li­chung der Daten einstel­len­de Gefühl kommt diesem Bild tatsäch­lich recht nahe und ich bin sehr gespannt, was aus diesen Daten nun wird, da sie jedem und jeder zur Verfügung stehen. Ein deutlich angeneh­me­res Gefühl, als alles auf einer Festplat­te verstau­ben zu lassen.

Fazit: Keine Angst vor Open Data!

Dieser kurze Ritt durch die Geschich­te jiddi­scher Atlas­pro­jek­te hat gezeigt, dass die Verfüg­bar­ma­chung von Daten aus ganz unter­schied­li­chen Aspekten zu befür­wor­ten ist. Man muss selbst­ver­ständ­lich die Schwie­rig­kei­ten in Rechnung stellen, die sich früher bei der Archi­vie­rung und Dokumen­ta­ti­on von Atlas-Projekten ergaben. Manche sind damit geschickter/sorgfältiger umgegan­gen als andere. Wir haben an verschie­de­nen sowohl Negativ- als auch Positiv­bei­spie­len implizit sehen können, was für Vorteile offene Daten bringen:

  • Open Data ist eine klare Sicherung und Demokra­ti­sie­rung von Wissensbeständen.
  • Offene Daten fördern den wissen­schaft­li­chen Diskurs und unter­stüt­zen ein nachhal­ti­ges wissen­schaft­li­ches Arbeiten.
  • Damit erhält Forschung eine klare Dynami­sie­rung; im Gegenzug blockie­ren verschlos­sen gehaltene Daten den Erkenntnisgewinn.
  • Nicht zuletzt ermög­licht die Verfüg­bar­keit von Daten die grund­le­gen­de Überprü­fung von Axiomen der modernen Wissen­schaft: Trans­pa­renz, Nachvoll­zieh­bar­keit, Relia­bi­li­tät und Objek­ti­vier­bar­keit von Forschungsergebnissen.

… oder wie es Leonard Nimoy – im übrigen Sohn jiddischsprachiger Migranten – sagte „the more we share, the more we have“.

Literatur

Beranek, Franz J. (1965). Westjid­di­scher Sprach­at­las. Marburg: N. G. Elwert’sche Verlagsbuchhandlung.

Beranek, Franz J. (1968). Reaktion Beraneks auf Guggenheim-Grünberg (1966). In: Zeitschrift für Mundart­for­schung 35.2, 146–148.

Burko, Alec Eliezer (2019). Saving Yiddish: Yiddish Studies and the Language Sciences in America, 1940–1970. Disser­ta­ti­on: The Jewish Theolo­gi­cal Seminary of America.

Guggenheim-Grünberg, Florence (1966). Rezension von Beranek (1965). In: Zeitschrift für Mundart­for­schung 33, 353–357.

Guggenheim-Grünberg, Florence (1968). Reaktion auf Beraneks Reaktion auf Guggenheim-Grünberg (1966). In: Zeitschrift für Mundart­for­schung 35.2, 148–149.

Guggenheim-Grünberg, Florence (1973). Jiddisch auf aleman­ni­schem Sprach­ge­biet. 56 Karten zur Sprach- und Sachgeo­gra­phie. (Beiträge zur Geschich­te und Volks­kun­de der Juden in der Schweiz 10.) Zürich: Juris Druck & Verlag.

Herzog, M., Baviskar, V., Kiefer, U., Neumann, R., Putschke, W., Sunshine, A., & Weinreich, U. (2000). Language and culture atlas of Ashke­n­a­zic Jewry [LCAAJ]: Vol. 3: The eastern Yiddish–western Yiddish continuum. Tübingen: Niemeyer.

Herzog, M., Kiefer, U., Neumann, R., Putschke, W., Sunshine, A., & Weinreich, U. (1992). Language and culture atlas of Ashke­n­a­zic Jewry [LCAAJ]: Vol. 1: Histo­ri­cal and theore­ti­cal founda­ti­ons. Tübingen: Niemeyer.

Herzog, M., Sunshine, A., Weinreich, U., Weinreich, B. S., & Neumann, R. (1995). Language and culture atlas of Ashke­n­a­zic Jewry [LCAAJ]: Vol. 2Research tools. Tübingen: Niemeyer.

Jofen, Jean B. (1953). The Dialec­to­lo­gi­cal Makeup of East European Yiddish. Phono­lo­gi­cal and Lexico­lo­gi­cal Criteria. Disser­ta­ti­on: Columbia University.

Jofen, Jean B. (1964). A Lingu­i­stic Atlas of Eastern European Yiddish. New York [Eigen­ver­lag].

Kiefer, Ulrike (1990). Inter­lin­gua­le Sprach­geo­gra­phie: Distri­bu­tio­na­le Struk­tu­ren im deutsch-jiddischen
Kontinuum (Distri­bu­tio­nal Patterns in the German-Yiddish Language Continuum: A NewAp­proach to Bilingual Dialec­to­lo­gy). Disser­ta­ti­on, Columbia Univer­si­ty (Nur erhalten als Microfilm des Ann Arbor Univer­si­ty Micro­films International).

Schäfer, Lea (2020). Die Erschlie­ßung des Language and Culture Atlas of Ashke­n­a­zic Jewry für die Dialekt­syn­tax. In: Regiolekt – Der neue Dialekt? Akten des 6. Kongres­ses der Inter­na­tio­na­len Gesell­schaft für Dialek­to­lo­gie des Deutschen (IGDD). Hg. Helen Christen, Brigitte Ganswindt, Joachim Herrgen, Jürgen Erich Schmidt. (Beihefte Zeitschrift für Dialek­to­lo­gie und Lingu­is­tik 182), 269–288.

Schäfer, Lea (2022). Trans­li­te­ra­ti­ons and mappings of LCAAJ field notes. (Columbia Academic Commons) doi: 10.7916/d8-nc5d-ep60.

Schäfer, Lea (vsl. 2023): Syntax and Morpho­lo­gy of Yiddish Dialects: Findings from the Language and Culture Archive of Ashke­n­a­zic Jewry. (Deutsche Dialekt­geo­gra­phie 132). Hildes­heim: Olms.

Weinreich, Max (1923). Geschich­te und gegen­wär­ti­ger Stand der jiddi­schen Sprach­for­schung. Disser­ta­ti­on: Univer­si­tät Marburg.

Weinreich, Uriel (1962). Multi­l­in­gu­al Dialec­to­lo­gy and the new Yiddish atlas. In: Anthro­po­lo­gi­cal Lingu­i­stics 4.1, 6–22.

Weinreich, Uriel (1964). Machine Aids in the Compi­la­ti­on of Lingu­i­stic Atlases, American Philo­so­phi­cal Society Yearbook 1963, 622–25.

Weiser, Kalman (2018). „One of Hitler’s Profes­sors“: Max Weinreich and Solomon Birnbaum confront Franz Beranek. In: Jewish Quarterly Review 108.1, 106–124.

Vilenkin, Leyzer (2000). mayn arbet iber dem yidishn shprak­h­at­las fun sovetn-farband. In: Language and Culture Atlas of Ashke­n­a­zic Jewry. The Eastern Yiddish – Western Yiddish continuum. Vol. 3. Hg. Marvin Herzog et al., *2–*4.

Vilenkin, Leyzer (1931). yidisher sprak­h­at­les fun sovetn-farband. afn grunt fun di dialek­to­lo­gis­he materialn, vos zaynen tzunoyfge­zamlt gevorn durch der sprakhko­mi­sie fun yidisn sektor fun der vaysru­sis­er visns­haft­aka­de­mie. Minsk: vaysru­sis­he visnshaft-akademie.

Diesen Beitrag zitieren als:

Schäfer, Lea. 2023. Open Data in der jiddi­schen Dialek­to­lo­gie. Sprach­spu­ren: Berichte aus dem Deutschen Sprach­at­las 3(2). https://doi.org/10.57712/2023-02

Lea Schäfer
Dr. habil. Lea Schäfer ist seit Mai 2022 mit dem DFG-Projekt "Adaptionen deutscher Varietäten in deutschsprachigen Dramen (16.–19. Jahrhundert) (AdViD)" am IGS.