AI 사용에 대한 데비안의 일반적인 입장 (Re: Debian release notes 한국어 번역)

Changwoo Ryu Fri, 31 Oct 2025 22:23:23 -0700

안녕하세요.

2025년 11월 1일 (토) 오후 12:48, sebul <[email protected]>님이 작성:
> 2025년. 제가 번역을 시작했습니다.
세벌님이 포스팅 안 한다고 하시고는 또 하셨는데요. 자랑은 참 참기 힘들죠?

여전합니다. 세벌님이 데비안 웹 번역을 할 때 처럼 작은 노력으로 짧은 시간 안에 푸시하려는 주요 패턴이 나타나는데요.
* 제목만 번역하고 자랑하기, 그리고 방치.
* 번역기 사용, 그리고 리뷰도 거의 없이 제출.

예전에 말했듯이 또다시 프로젝트에 피해를 끼치는 일은 용납하지 않을 것이므로, 머지페이지에 코멘트를 남겼습니다.
https://salsa.debian.org/ddp-team/release-notes/-/merge_requests/331#note_688136

----

특히 여기서 번역기 사용에 대해 좀 더 말씀드리려고 합니다.

물론 생성형 모델을 사용한 번역이 요즘 대세인 것은 알고 있고, 저도 개인적으로 정보 획득 목적으로는 쓰고 있습니다만, 데비안
멤버들의 대체적인 입장은 (즉 데비안에서 사용하기에는) 법적인 문제가 있다는 것입니다.

대부분의 생성형 모델 관련자들은 학습데이터가 공정사용 (fair use) 으로 저작권법의 2차 저작물 조항에 해당하지 않는다고
"주장하고 있지만", 실제로는 대한민국이든 세계 어디든 학습용 데이터로의 공정사용은 정의한 곳은 거의 없습니다. 특히 상업적
목적으로 할 경우에는 공정사용이 될 수 없다고 명시되어 있어서, 기업 위주의 현재 생성형 모델 사용은 저작권법 위반일 소지가
높습니다. (AI를 옹호하는 입장에서는 책 하나에 몇바이트 수준으로 줄어드는데 어떻게 2차 저작물이라고 할 수 있느냐 라든가,
여러가지 말은 있을 수 있습니다.)

물론 아시다시피 현실은 그 모든 데이터에 대해 대가를 지불할 수는 없으니 모두가 go를 외치고 있는 상황입니다. 메타나
OpenAI도 해적사이트에서 출판된 책을 학습했다고 밝혀지기도 했구요. huggingface에 지금도 올려져 있는 이른바
dataset이라고 하는 것들도 전공 교과서를 통째로 올려놓거나 유튜브 자막 스크립트를 무단으로 복사해 놓기도 하는 등, 연구
목적의 공정사용이라고 다들 자신들을 속이고 있는 실정이죠.

어쨌든 여러분이 동의할 수도 있고 아닐 수도 있지만, 적어도 데비안에서는 AI의 결과물은 데이터셋의 2차 저작물이라는 입장이
다수입니다. dataset의 완전 공개가 아니면 DFSG-free가 아니라는 관련 GR을 준비하기도 했구요. (
https://www.debian.org/vote/2025/vote_002 지금은 철회한 상태지만 ) 그러니 데비안 관련
번역 작업에 번역 사이트를 사용하는데 신중하시기 바랍니다. 사용하더라도 참고 목적 수준으로만 사용하셔야지, 그대로 복붙하는
경우 문제가 됩니다.

AI 사용에 대한 데비안의 일반적인 입장 (Re: Debian release notes 한국어 번역)

Reply via email to