Zuletzt geändert am 25. June 2026
Ich habe keinen dienstlichen Blog, weshalb ich diesen Beitrag über KI einfach hier in den Klimablog poste. KI hat insofern etwas mit Klima zu tun, als dass die KI-Firmen einen extremen Ressourcenverbrauch haben (Geräte, Energie, Wasser). Die Frage, die man sich stellen muss, ist: Ist es das wert, dass man eine Suchanfrage in natürlicher Sprache stellen kann? Sind die Antworten brauchbar? Oder wäre es doch besser, einfach wie bisher Suchanfragen zu stellen und die Ergebnisse selbst einzuordnen? Wenn man klassisch sucht, kann man feststellen, dass die Seite XY einem nur Magnesium-Präparate verkaufen will, während auf der Seite AB eine Medizin-Professorin erklärt, dass ein selbst hergestelltes isotonisches Getränk (Fruchtsaft mit Salz) ausreicht, um Krämpfe nach Überanstrengung beim Sport zu verhindern.
Hier geht es aber nicht um solche Suchanfragen, sondern um komplexere Aufgaben. Aufgaben, die früher Wissenschaftler*innen oder deren Sekretär*innen erledigt haben. Konkret stelle ich eine Übersetzung eines Fachbuches und die Neubewertung eines Zitationsindexes vor.
Hintergrund
Ich bin promovierter Informatiker und habe zwischen 1997 und 2001 am Deutschen Forschungszenrtum für Künstliche Intelligenz (DFKI) in Saarbrücken gearbeitet. Ich war an der Entwicklung des Übersetzungssystems VerbMobil beteiligt und dort für die deutsche Grammatik zuständig (1997–2000). Ab 2000 habe ich für das Startup-Unternehmen Interprice weiter an der deutschen Grammatik gearbeitet und Arbeiten an anderen Sprachen koordiniert.
Ich habe mehrere Bücher geschrieben und in LaTeX gesetzt (1999, 2002, 2007, 2010, 2016, 2018, 2023, 2026). 2014 haben Martin Haspelmath und ich den Open Access-Verlag Language Science Press gegründet. Die Quelltexte aller Bücher sind auf github verfügbar und können also auch von KI-Firmen zum Training ihrer Modelle verwendet werden. Die rechtliche Situation ist unklar: Die Lizenz ist CC-BY. KI-Tools geben normalerweise nicht die Urheber*innen ihres Wissens an.
Übersetzung Fachbuch mit speziellen Layout-Elementen
Das Buch Germanic syntax habe ich auf Englisch geschrieben, um auch ein internationales Publikum zu erreichen. Ich nutze es seit einigen Jahren in der Lehre im BA Germanistische Linguistik. Ich denke, dass Studierende auch in der Lage sein müssen, englische Fachtexte zu lesen, aber bei Lehrevaluationen wird immer wieder die Sprache des Lehrbuchs angesprochen. Der Inhalt des Lehrbuchs ist komplex und wenn dann noch sprachliche Probleme dazukommen, kann sich Überforderung einstellen. Ich habe vor einiger Zeit mit meinem Bruder Claude AI für ein komplexes Projekt benutzt und dachte mir nun, dass es doch möglich sein müsste, das ganze Buch automatisch ins Deutsche übersetzen zu lassen. Ich habe ihn also gefragt, was er mir raten würde, welche Tools ich verwenden solle. Er hat mich nach der Größe des Buchprojekts gefragt und meinte dann, das sei für Claude AI wahrscheinlich zu groß. Dann meinte er, ich solle doch mal ein Kapitel schicken. Ich habe ihm das Kapitel zum Passiv geschickt. Er hat es an Claude AI weitergereicht und das war sein Prompt:
Kannst du das übersetzen, ohne es kaputt zu machen?
Das klingt, wie eine natürliche Anfrage an einen Menschen. Ganz viel ist implizit. Was ist in der Datei? Was darf nicht kaputt gehen? Claudia hat sich die Datei angesehen und hat festgestellt, dass es sich um eine LaTeX-Datei handelt, worum es in dem Text geht, und was nicht kaputt gehen darf:
🤖 Claude 2026-06-23T20:43:18.628Z
Ich habe die Datei gelesen. Das ist ein linguistischer Fachtext (offenbar ein Buchkapitel über das Passiv in den germanischen Sprachen, mit
\todostefan-Kommentaren — vermutlich aus Stefan Müllers Umfeld). Der Fließtext ist auf Englisch, und die Datei enthält jede Menge empfindliche LaTeX-Struktur:
- Interlinearglossen (
\gll… Quellzeile + Glossierungszeile)- Sprachmarker (
\german,\danish,\icelandic)- Index-/Sprachbefehle (
\is{},\ili{},\iw{}), Querverweise (\label/\ref/\mex), Zitate (\citet), Fußnoten- Objektsprachliche Beispielsätze (die deutschen/dänischen/isländischen Datensätze selbst)
„Ohne es kaputt zu machen“ heißt für so einen Text vor allem: die LaTeX-Struktur und vor allem die Sprachdaten in den Beispielen dürfen sich nicht ändern — sonst ist der Inhalt zerstört, auch wenn es noch kompiliert. Bevor ich an ~3300 Zeilen arbeite, brauche ich zwei Entscheidungen von dir, weil sie den Umfang grundlegend ändern und ein falsches Raten viel Arbeit zerstören würde.
Das komplette Protokoll kann heruntergeladen werden. Claudia hat dann gefragt, in welche Sprache übersetzt werden soll und ob nur der Haupttext oder auch die Glossierungen übertragen werden sollen. Damit das Buch nutzbar wird, muss natürlich alles übersetzt werden.
🤖 Claude 2026-06-23T21:00:42.215Z
Verstanden: Englisch → Deutsch, Volllokalisierung (Fließtext + freie Übersetzungen
\glt+ Wort-für-Wort-Glossen), während die objektsprachlichen Datenzeilen (die dt./dän./isl. Beispielsätze selbst) sowie alle LaTeX-Befehle, Labels, Makros (\NOM,\DAT,\AUX…) und Zitate unangetastet bleiben.Nützlich: die auskommentierte deutsche Passage (Zeilen 736–762) zeigt bereits deinen/den intendierten Glossierungsstil (z. B.
sie.\PL.\DAT{} wurde geholfen). Daran orientiere ich mich.Ich lese zuerst den Rest der Datei vollständig, um Terminologie konsistent zu halten und keine Struktur zu übersehen.
[…]
Ich habe die gesamte Datei gelesen (3318 Zeilen). Das ist klar ein Kapitel aus Stefan Müllers HPSG-Lehrbuch. Bevor ich anfange, muss ich eine zentrale Sache klären, die über „kaputt oder nicht” entscheidet: die Index-/Sprachmakros wie
\ili{Danish},\is{subject|(},\iw{}. Ob ich deren Argumente mitübersetzen darf (z. B.\ili{Danish}→\ili{Dänisch},\is{subject}→\is{Subjekt}), hängt davon ab, wie diese Makros definiert sind — ob sie ihr Argument nur ausgeben oder es als Index-/Sprachdatenbank-Schlüssel verwenden. Ändere ich einen Schlüssel falsch, bricht der Index. Ich suche deshalb die Stildefinitionen.
Das bedeutet: Claude AI hat die Datei eingelesen, hat die Dokumentstruktur verstanden, weiß, was glossierte (Wort für Wort übersetzte) Beispiele sind, weiß, dass die Kommandos \is{subject} für den Index sind1 und weiß auch, dass das ein Kapitel aus meinem Buch ist. Claudia hat festgestellt, dass es die Definition des \is{}-Kommandos nicht kennt, weil die Dateien nicht heruntergeladen wurden und beginnt dann aber dennoch die Übersetzung. Sie verspricht auf passende Bereichsdefinitionen für den Index zu achten, d.h. zu jeder öffnenden Klammer gehört auch eine schließende und die Index-Übersetzungen müssen zueinander passen. Claudia legt eine Backup-Datei an und beginnt.
In der Nacht um 4 ist sie fertig und überprüft das Ergebniss. Auskommentierte Textpassagen lässt sie unverändert. Die Überprüfung ist 4:30 abgeschlossen. Frank schickt mir am nächsten Morgen das Ergebnis. Das Ergebnis läuft ohne Probleme durch die LaTeX-Übersetzung. Falsch ist nur, dass deutsche Beispiele deutsch glossiert sind.

Das ist natürlich in einer deutschen Version des Textes unnötig. (German) wird von einem Makro erzeugt, dass ich ändern muss. Das ist in einer Minute erledigt.
Caludia schreibt:
Unangetastet geblieben (bewusst)
Die objektsprachlichen Beispielsätze (dt./dän./isl. und die englischen Datenbeispiele wie „The child was given a novel.”),forest/tikz-Abbildungen, AVMs, alle%-Kommentare, Zitate, URLs, Labels und die Feature-Makros (\NOM,\AUX,\spr…).
Claudia weist selbst darauf hin, dass Glossen in Bäumen nicht bearbeitet wurden und schlägt vor, dass in einem zweiten Pass zu machen.
Danach habe ich ein github-Repository erzeugt, das komplette Buch hochgeladen und Claudia um Folgendes gebeten:
Einzige Fehler, den ich jetzt sehen konnte, ist, dass die deutschen Beispiele geglosst und übersetzt werden. Das kann ganz weg. statt \gll Der Installateur kommt.\\ und dann glossen und \glt muss nur Der Installateur kommt. dort stehen. Englische Beispiele sollen auch geglosst werden und deutsche Beispiele in Bäumen brauchen keine Glossierung. In den Bäumen ist die Glossierung immer nach dem ;. Bei englischen Beispielen bitte auch glossen.
https://github.com/langsci/Syntax-der-germanischen-Sprachen Das Buch ist jetzt hier. Es wäre großartig, wenn alle Dateien in chapters übersetzt werden könnten und die deutschen Dateien dann auch einen deutschen Dateiname bekämen. Also germanic-overview.tex -> germanisch-ueberblick.tex
https://github.com/langsci/Syntax-der-germanischen-Sprachen du kannst dich mit gh damit verbinden C:\Users\cabot\Downloads\germanic-passive.tex war die Datei, die Du schon hast, vielleicht hilft das
Claudia hat dann alle Dateien heruntergeladen, diese übersetzt, den Dateinamen angepasst und auch in der übergeordneten Datei, in die die Kapitel eingebunden werden, die entsprechenden Änderungen eingepflegt. Sie hat alle Änderungen wieder nach github hochgeladen.
Danach habe ich sie gebeten, die deutschen Glossierungen für die deutschen Beispiele zu entfernen. Sie hat das getan, aber danach lief LaTeX nicht mehr durch. Das lag daran, dass es in den Beispielen eckige Klammern gab und die nummerierten Beispielumgebungen \item verwenden. Nachdem ich das rausgefunden hatte und Claudia gebeten hatte, das überall anzupassen, konnte ich das Buch kompilieren. Ich habe dann selbst noch die Überschriften für einige Buchteile angepasst, die zentral geregelt werden und dann hatte ich ein vorzeigbares Buch, dass ich den Studierenden zur Verfügung stellen konnte. Der Index hatte Probleme mit Groß-/Kleinschreibung, weil Sprachnamen in Adjektiven im Deutschen kleingeschrieben werden. Dazu habe ich eine github-Issue gemacht, die Claudia dann bearbeitet hat und das Ergebnis wieder hochgeladen hat.
Sortierung und Klassifizierung von Google Scholar-Profil und Berechnung des H-Indexes
Schlussfolgerungen
Das Buch selbst zu übersetzen hätte mich ein halbes oder ein ganzes Jahr gekostet, so war es mit wenigen Stunden Arbeit erledigt. Ich muss es noch einmal kontrolllesen, das wird mehrere Wochen dauern, aber dann ist es fertig. Ohne KI hätte ich es wohl nie ins Deutsche übertragen.
Das Sortieren des Google Scholar Profils hätte meine Sekretärin machen können. Dazu hätte ich ihr aber genau erklären müssen, was sie tun soll, was mich Zeit gekostet hätte und sie hätte dafür wirklich lange gebraucht. Dass Claudia aus diesen Daten den h-Faktor bestimmen kann, ist auch erstaunlich.
Die Konsequenz ist, dass in Zukunft Arbeitsplätze für Sekretariatsaufgaben wegfallen werden. Textbearbeitungsaufgaben, die früher studentische Hilfskräfte erledigt haben, werden wegfallen. Einfache bis mittelschwere Programmieraufgaben werden automatisch 24 h an 7 Tagen in der Woche erledigt. Man braucht also auch keine mittelmäßigen Programmierer*innen mehr. Man braucht nur noch top-ausgebildete Menschen, die konzeptuell denken können. Das ist bitter für viele von uns, aber es ist die Wahrheit.