Eine KI, die mich auch versteht, wenn ich frei heraus in meinem Heimatdialekt mit ihr spreche? Oder ein Chatbot, der die Erzählungen von Opa ins Hochdeutsche übersetzt, sodass auch die Pflegekraft sie verstehen kann? Wie wäre es mit einem KI-Tool, das einen bairischen Text ins Plattdeutsche übersetzt?
Nicht nur solche alltagsnahen Werkzeuge könnten bald schon Realität sein. Auch die Sprachwissenschaft profitiert in ihrer Forschung von dem großen Innovationspotenzial der rapiden Entwicklung Künstlicher Intelligenz. Welche Chancen, aber auch welche Risiken die neue KI-Technologie für die Dialektforschung mit sich bringt, beobachtet künftig das interdisziplinäre Netzwerk Regionale Sprache und Künstliche Intelligenz.
Vernetzung unterschiedlicher Disziplinen als Auftakt
Gefördert von der VolkswagenStiftung trafen sich 35 Wissenschaftler*innen im August 2025 auf Schloss Herrenhausen in Hannover. Bei der Zusammenkunft handelte es sich um einen dreitägigen Scoping Workshop, also ein Arbeitstreffen, bei dem Perspektiven und Aufgaben für die Weiterentwicklung einer Fachdisziplin ausgearbeitet werden. Im Fokus des Workshops stand das Thema „Künstliche Intelligenz und regionale Identität – Potenziale der Dialektologie im Zeitalter digitaler Transformation“.
Aus diesem Arbeitsprozess ist nun das Positionspapier „Regionale Sprache und Künstliche Intelligenz im Zeitalter der digitalen Transformation“ entstanden, das in der Zeitschrift für Dialektologie und Linguistik (ZDL) erschienen ist. Das Positionspapier beschäftigt sich damit, wie Künstliche Intelligenz und Dialektforschung Hand in Hand gehen können. Es zeigt den aktuellen Stand der Einbindung von KI-Verfahren in die Forschungspraxis auf, benennt notwendige Voraussetzungen und lotet die Potenziale der Weiterentwicklung aus. Betrachtet werden jedoch auch mögliche Risiken. Daraus werden schließlich Empfehlungen für unterschiedliche Akteure abgeleitet, wie etwa die Fachgesellschaften (z. B. Internationale Gesellschaft für Dialektologie des Deutschen) und Fördermittelgeber (z. B. Deutsche Forschungsgemeinschaft).

Teil der internationalen Runde waren nicht nur Forschende aus Deutschland, sondern auch aus der Schweiz, Österreich, Luxemburg, Belgien, Norwegen und den USA. Wichtig war den Organisator*innen Prof. Dr. Hanna Fischer und Prof. Dr. Alfred Lameli (vom Forschungszentrum Deutscher Sprachatlas an der Philipps-Universität Marburg), dass Expert*innen aus der Sprachwissenschaft, der Computerlinguistik und Informatik in einen intensiven, ergebnisoffenen Dialog treten. Dabei wurden sie durch die Moderatorin Maja Härri unterstützt.
Künstliche Intelligenz macht Regionalsprachenforschung effizienter
Zu Beginn fand eine Standortbestimmung statt: Wo gibt es bereits KI-Anwendungen, die die Sprachwissenschaftler*innen bei ihrer Arbeit unterstützen?
Zentral sind dabei vor allem die sogenannten Large Language Models (LLMs). Das sind Sprachmodelle, die auf maschinellem Lernen basieren und die natürliche Sprache in ihrer Bedeutung erschließen, übersetzen sowie auch selbst generieren können. Solche Modelle, wie GPT, Gemini und Claude, basieren auf neuronalen Netzen, die durch das Training an riesigen Datenmengen aus Textsammlungen Wahrscheinlichkeiten für Wortfolgen berechnen. Auf diese Weise werden kontextbezogenen Texte generiert.
Einige KI-Anwendungen sind in der Sprachwissenschaft bereits fester Bestandteil des Arbeitsalltags. So gibt es beispielsweise audiobasierte Programme, die gesprochene Sprache zu Text umwandeln und damit die manuelle Transkription ablösen (z. B. WebMAUS). Hinzu kommen Tools, die große Textmengen verarbeiten können und zum Beispiel für die grammatische Analyse eingesetzt werden (z. B. Sketch Engine). Diese KI-Tools funktionieren bisher jedoch nur für nicht-dialektale Sprachaufnahmen und Texte, da sie auf Basis von standardsprachlichen Trainingsdaten entwickelt wurden. Chatbots und Sprachmodelle zur Dialektsimulation sowie zur maschinellen Verarbeitung von dialektalen Sprachdaten gibt es kaum.
Insgesamt ermöglichen die KI-Tools in der Sprachwissenschaft eine bisher nie dagewesene Effizienz bei der Verarbeitung und Auswertung von Sprachdaten. Diese Produktivitätssteigerung wirkt bereits jetzt als Katalysator für Forschungsprozesse, da zeitintensive manuelle Arbeiten nun von KI-Tools ausgeführt werden können und nicht mehr durch studentische Hilfskräfte erfolgen müssen.

Vergessen von der KI? – Auf die Daten kommt es an!
Das Fach der Regionalsprachenforschung trägt die besondere Verantwortung, regionale Sprache im digitalen Raum präsent zu machen und dabei auch die kulturelle Vielfalt abzubilden. Denn leider werden Dialekte und Minderheitensprachen von KI-Tools oft ‚übersehen‘. Das liegt daran, dass eine Künstliche Intelligenz nur die Daten wiedergeben kann, mit denen sie trainiert wurde. Je weniger Sprachdaten zu einem Dialekt für das Training zur Verfügung stehen, desto weniger wird der entsprechende Dialekt abgebildet. Während für die Standardsprache, die in den Medien und den digitalen Textarchiven (z. B. Projekt Gutenberg) allgegenwärtig ist, große Datenmengen bestehen, gibt es nur wenige Sammlungen von digitalen Dialektaufnahmen oder Dialekttexten. Entsprechend sind für das Training von regionalen Sprachmodellen aktuell zu wenige Daten verfügbar. Daraus ergibt sich ein Ungleichgewicht zwischen der Alltagsrealität der Dialektsprecher*innen und der Repräsentation ihrer Muttersprache im digitalen Raum. Damit das nicht so bleibt, regen die Autor*innen des Positionspapiers Leitlinien für eine zukunftsorientierte Entwicklung der Fachkultur an.
Die Leitlinien des Positionspapiers bieten Orientierung für die Zukunft des Fachs
Eine zentrale Leitlinie bezieht sich auf die Bereitstellung hochqualitativer regionalsprachlicher Daten nach den FAIR-Prinzipien. Diese stellen Grundsätze der Datenbereitstellung dar, die im Sinne einer offenen Wissenschaft den Zugang zu Forschungsdaten gewährleisten.

Langfristiges Ziel ist der Ausbau der fachspezifischen Infrastruktur und die umfassende Vernetzung von Repositorien (zum Beispiel im NFDI-Konsortium Text+), also digitalen Speicherorten von Forschungsdaten. Insgesamt wird der Wandel der eigenen Fachkultur hin zu den Grundsätzen von Open Science initiiert.
Eine weitere Leitlinie ist die Verstärkung der Kooperation zwischen Regionalsprachenforschung, Computerlinguistik und KI-Forschung (wie zum Beispiel in der Workshop-Reihe VarDial). Durch systematischen Austausch und kontinuierlichen Wissenstransfer soll bei Studierenden und Forschenden der Regionalsprachenforschung auch ein Kompetenzerwerb im Bereich von KI-Verfahren forciert werden.
Regionalsprachliche Expertise sollte zudem in die öffentlichen Diskurse über KI aktiv eingebracht werden, um als Fach gesellschaftliche Verantwortung zu übernehmen. Außerdem besteht eine nicht zu vernachlässigende Verantwortung für die Umwelt, da die KI-Technologien äußerst energieintensiv sind.

Regionale Sprache: Ein Thema mitten aus der Gesellschaft
Auch in einem weiteren Punkt waren sich die in Hannover anwesenden Wissenschaftler*innen einig: Regionale Sprache ist ein Thema, das stark mit den Menschen verbunden ist. Dialektforschung erfolgt daher am besten in enger Zusammenarbeit mit den Dialektsprecher*innen selbst. Diese können zum Beispiel dazu beitragen, geeignete Trainingsdaten für dialektale KI-Vorhaben zu gewinnen oder die Sprachausgaben von KI-Bots zu bewerten.
Gute Erfahrungen gibt es bereits in Citizen Science-Projekten wie der WenkerbogenApp. In diesen Projekten werden die Bürger*innen direkt in die Forschungsprozesse einbezogen, indem sie zum Bespiel Dialektwörter übersetzen oder handschriftliche Dokumente transliterieren. Damit stärken die Bürger*innen nicht nur die digitale Forschungsinfrastruktur, sondern sie können auch helfen, Dialektkenntnisse zu erhalten oder auszubilden. Auf diesem Weg tragen sie dazu bei, das Bewusstsein für sprachliche Vielfalt in der Gesellschaft zu stärken.
Das Netzwerk Regionale Sprache und Künstliche Intelligenz
als Forschungsverbund

Die gemeinsame Arbeit im Rahmen des Scoping Workshops hat zur Gründung des Netzwerks Regionale Sprache und Künstliche Intelligenz geführt, das sich als offener Forschungsverbund an der Schnittstelle von Regionalsprachenforschung, Computerlinguistik und KI-Forschung versteht. Das Netzwerk ist über das Forschungszentrum Deutscher Sprachatlas erreichbar.
Diesen Beitrag zitieren als
Gerlach, Lisa. 2026. Vom Dorfplatz zum Chatbot – Regionale Sprache im Zeitalter Künstlicher Intelligenz. Sprachspuren: Berichte aus dem Deutschen Sprachatlas 6(3). In: Sprachspuren: Berichte aus dem Deutschen Sprachatlas 6(3). https://doi.org/10.57712/2026-03

