Re: Übersetzungen mit KI

Mario Blättermann Sun, 11 Jan 2026 06:31:20 -0800

Hallo Helge,

Am So., 11. Jan. 2026 um 14:29 Uhr schrieb Helge Kreutzmann
<[email protected]>:
>
> Moin Mario,
> Am Tue, Jan 06, 2026 at 03:12:22PM +0100 schrieb Mario Blättermann:
> > Am Di., 6. Jan. 2026 um 14:37 Uhr schrieb Helge Kreutzmann
> > <[email protected]>:
> > >
> > > Hallo Mario,
> > > Am Tue, Jan 06, 2026 at 12:42:16PM +0100 schrieb Mario Blättermann:
> > > > -----
> > > >
> > > > Übersetzungen mit KI
> > > >
> > > > Mittlerweile ist es durchaus möglich, Übersetzungen zu automatisieren.
> > > > Dazu sollte  Folgendes beachtet werden:
> > > >
> > > > Die Ausgaben vollautomatischer Übersetzungswerkzeuge sind *nicht*
> > > > unbesehen verwendbar. Es ist unbedingt notwendig, alle übersetzten
> > > > Gettext-Meldungen selbst gegenzulesen, *noch bevor* die Datei zum
> > > > Gegenlesen auf unserer Mailingliste angeboten wird.
> > > >
> > > > Beachtet werden muss dabei vor allem die Konsistenz der Begriffswelt
> > > > mit unserer Wortliste sowie die Korrektheit von Weblinks und sonstigen
> > > > Querverweisen sowie Formatierungen. Außerdem verstecken sich in einem
> > > > durchaus plausibel klingenden Text oft logische Fehler und
> > > > Ungereimtheiten, die es zu finden und zu korrigieren gilt.
> > > >
> > > > Gelegentlich kommt es vor, dass Übersetzungen aus anderen Sprachen in
> > > > neue Formate importiert werden müssen (zum Beispiel in manpages-l10n).
> > > > Dabei ist unbedingt auszuschließen, dass von einer KI generierte
> > > > fremdsprachige Inhalte in die Übersetzung gelangen, es sei denn,
> > > > derjenige, der den Import vornimmt, ist Muttersprachler oder hat damit
> > > > vergleichbare Sprachkenntnisse (und kennt die Übersetzungsregeln für
> > > > die jeweilige Sprache und ist in der Lage, diese korrekt anzuwenden).
> > > >
> > > > -----
> > > >
> > > > Ich freue mich auf eure Meinungen dazu.
> > >
> > > Ich finde das Vorgehen gut und sinnvoll. Gibt es bei der rechtlichen
> > > Situation noch was zu beachten, d.h. darf die Ausgabe von
> > > Übersetzungs-KIs unbeschränkt (im Sinne der GPL oder Creative Commons)
> > > verbreitet werden?
> > >
> >
> > Konkret beziehe ich mich hier bei »KI« nicht auf kommerzielle
> > Software; damit habe ich keine Erfahrung. Speziell geht es um das, was
> > Google Translate ausgibt, und das ist schon recht ansehnlich. Ich habe
>
> Google Translate ist kommerzielle Software. Auch wenn Du ggf. momentan
> nicht in Euro dafür bezahlst.
>


Mag sein, und die Google-Translate-API ist zwar frei verfügbar, aber
ich habe nicht herausfinden können, unter welcher Lizenz die Nutzung
selbst steht oder gar wie die erzeugten Inhalte lizenzrechtlich zu
betrachten wären:
https://docs.cloud.google.com/translate/docs/reference/rest

> …
>
> > Die Frage wäre, inwieweit sich die Herkunft aus einer KI überhaupt
> > nachweisen ließe. Uns sowieso kann man praktisch nichts unverändert
>
> Das fände ich eine ziemlich schlechte Argumentation, dass der
> Rechteinhaber halt es nicht nachweisen kann.
>
> Ich bin hier aber bewusst der Advokati Diabolus, aber anscheinend
> liest das außer uns beiden keiner …
>
> Mir ist sehr wohl bewusst, dass die Ausgabe von diversen
> KI-Übersetzungswerkzeugen aktuell von vielen frei weiterverwandt wird.
> Ich habe mir aber halt auch nicht die Nutzungsbedingungen von Google
> Translate durchgelesen.  (Und von DeepL, was ich gelegentlich nutze,
> auch nicht).
>

Ich habe auch die Vermutung, dass die geradezu atemberaubende
Geschwindigkeit unseres rumänischen Kollegen ohne so etwas wie eine
geskriptete Cloud-Übersetzungsschnittstelle gar nicht möglich wäre.
Wir haben KI-Inhalte auf jeden Fall in manpages-l10n drin, da bin ich
mir sicher. Und wie ich schon schrieb, hab ich beim Import alter
Handbuchseitenübersetzungen gelegentlich die KI für eine Art Reverse
Engineering beim Wiederherstellen der damaligen englischen
Originalstrings benutzt.

> > Außerdem möchte ich hier mal auf manpages-l10n verweisen, wo wir Mdoc-
> > und Groff-Quelltexte aus den unterschiedlichsten Quellen mit
> > unterschiedlichsten Lizenzen verwenden und unsere Übersetzungen dann
> > doch über einen Kamm scheren und alles unter der GPL verbreiten. Wenn
>
> Meiner Kenntnis nach verwenden wir kompatible Lizenzen. Wenn Du eine
> bestimmte Kombination *konkret* als kritisch ansiehst, dann wäre ich
> um eine Information dankbar, dann könnte ich das auf z.B. debian-legal
> abklären lassen.
>

Kompatibel schon, aber wüsstest du jetzt auf Anhieb, ob Apache, Perl
Artistic oder was auch immer besondere Regelungen bei der Weitergabe
von Derivativen hat…? Bei BSD oder MIT ist es noch einfach, da kann
man praktisch alles draus machen, aber bei der Vielzahl der Lizenzen
unserer Originaldateien hab ich noch nicht mal ansatzweise einen
Überblick über mögliche Fallstricke. Zumindest laden wir bei
Upstream-Aktualisierungen nichts Paketquellen in rechtlichen
Grauzonen, wie Mageia Tainted oder RPMFusion für Fedora. Das sollte
man sich hinsichtlich Kompatibilität der Lizenzen halbwegs auf der
sicheren Seite fühlen können.

> > man das sehr genau nehmen würde, müssten alle Bestandteile, die nicht
> > übersetzt sind (also dem Original entsprechen, z.B. Codeschnipsel),
> > dann wieder unter der jeweiligen Lizenz des Ursprungsprojekts
> > verbreitet werden. Ich glaube nicht, dass eines Tages irgendein
>
> Nein, die Ursprungslizenzen erlauben eine Weiterverteilung unter einer
> neuen Lizenz, letztendlich handelt es sich, auch wenn es
> gemischtsprachig ist, um ein abgeleitetes Werk (der Werkbegriff greift
> hier explizit - es geht nicht um die Urheberschaft an einzelnen
> Sätzen, sondern an dem Gesamtwerk).
>

Siehe oben, dass würde ich für *alle* unsere Ursprungsdatei-Lizenzen
nicht so einfach unterschreiben.

> > schmieriger Abmahn-Advokat Interesse an so etwas zeigt. Schließlich
> > schlagen wir selber keinen Profit daraus und nehmen auch niemandem
> > sonst irgendwelche Einnahmen weg.
>
> Jetzt wird schwierig. Urheberschaft hat nichts mit erzielten Einnahmen
> zu tun - höchstens (und hier bin ich mir fürs deutsche Recht unsicher)
> auf die Höhe des Schadensersatzes. Du kannst ja mal nach
> Rechtsstreitigkeiten zu „Phototapeten“ schauen - da hat auch der eine
> oder andere Instagrammer etc. schon Euros von seinem Konto fließen
> sehen.
>

Schon möglich, aber das ist auch wieder von der Lizenz abhängig. So
mancher, der Bilder ins Netz stellt, weiß nicht, unter welcher Lizenz
er das eigentlich tut…

> > Vielleicht sollte das mal global irgendwo geklärt werden...? Hat
> > jemand schon mal irgendwo was gelesen, wie Debian generell zu
> > KI-Inhalten steht? Schließlich könnte man beim heutigen Stand der
> > KI-Software auch Dokumentationen damit schreiben. Kann man zwar
> > keinesfalls ohne Korrektur unters Volk werfen, aber wäre sicherlich
> > eine ähnlich brauchbare Grundlage wie bei den Übersetzungen.
>
> Gerade hier hatte ich gehofft, ein DD würde einspringen. Ich verfolge
> debian-devel nicht, d.h. falls dort Diskussionen (gerade zum Coden
> wird das ja interessant) laufen, kenne ich sie schlichtweg nicht.
>

Ich hab auch bislang wenig dazu gefunden. Es gibt seit ein paar
Monaten ein Ticket bei Fedora
(https://pagure.io/Fedora-Council/tickets/issue/542) dafür. Man will
zwar ein Regelwerk dafür auf die Beine stellen, aber das wird gerade
bei Fedora nicht ohne Absegnung durch Red Hat möglich sein. Und die
sind bekanntermaßen sehr vorsichtig in rechtlichen Dingen. Soweit ich
die letzten Beiträge aus dem verlinkten Ticket verstehe, sollten
KI-Tools sich »Gedanken« über die Lizenzen der verwendeten
Ausgangsmaterialien machen und diese dann mit der Ausgabe
durchreichen. Was aber, wenn die Lizenzen des Ausgangsmaterials gar
nicht sicher nachverfolgbar sind? Dann könnte Red Hat am Ende nur ein
eigenes KI-Werkzeug entwickeln, das den eigenen Ansprüchen genügt. Die
öffentliche API von Google Translate fällt dafür sicherlich aus.

Seitens des Fedora Council gibt es aber auch schon was:
https://docs.fedoraproject.org/en-US/council/policy/ai-contribution-policy/
Die Grundaussage ist aber vor allem die:
»Accountability: You MUST take the responsibility for your
contribution. Contributing to Fedora means vouching for the quality,
license compliance, and utility of your submission. All contributions,
whether from a human author or assisted by large language models
(LLMs) or other generative AI tools, must meet the project’s standards
for inclusion. The contributor is always the author and is fully
accountable for the entirety of these contributions.«

Heißt also, dass letztendlich *jedem* Beitragenden ein Strick aus
seinen Beiträgen gedreht werden kann – ist ja schließlich per »git
blame« zweifelsfrei nachverfolgbar. Fedora selbst (und hintenrum also
auch Red Hat) weist damit die Verantwortung von sich. Ich rechne zwar
nicht damit, dass nicht nachvollziehbare KI-Inhalte der freien
Software bald das Genick brechen, aber es wird wohl in Zukunft
häufiger vorkommen, dass Inhalte gelöscht werden (müssen), weil der
Ursprung unklar ist. Wir wollen nur mal hoffen, dass es nicht so weit
kommt wie in den Neunzigern bei BSD, wo so ein Lizenzstreit die
offenen Unix-Varianten für Jahre kampfunfähig gemacht hat.

Gruß Mario

Re: Übersetzungen mit KI

Antwort per Email an