첫 화면 메뉴 바로가기 본문 내용 바로가기

한국저작권위원회

인기검색어
폰트, 음악, PPT, 일러스트
전체 메뉴
닫기

저작권동향

저작권동향 상세보기
제목 2024년 제14호-[독일] AI 학습에 이용된 오픈 데이터셋을 둘러싼 사건(이일호)
담당부서 국제통상협력팀 손휘용(0557920089) 등록일 2024-08-30
첨부문서

2024년 제14호-[독일] AI 학습에 이용된 오픈 데이터셋을 둘러싼 사건(이일호).pdf 미리보기

[독일] AI 학습에 이용된 오픈 데이터셋을 둘러싼 사건

- Robert Kneschke v. LAION e.V.

연세대학교 법학연구원 연구교수

이일호

 

1. 사실관계

 

독일의 사진작가인 Robert Kneschke(원고)는 주로 스톡 이미지 사이트에 사진을 업로드하는 방식으로 활동하고 있음. 비영리 단체인 LAION e.V.(Large-scale Artificial Intelligence Open Network e.V.; 피고)는 오픈소스 기반의 AI 모델을 개발하는 한편 다른 AI 모델 학습을 위한 오픈데이터셋을 제작·공개하고 있음. 피고는 크롤링 방식으로 웹에 있는 데이터를 수집하고 이른바 ‘LAION 5B’ 데이터셋을 구성하는 과정에서 원고의 사진저작물을 수집한 것으로 의심받고 있음. 문제된 이미지는 bigstock.com이라는 사이트에서 어떤 비용지불 없이 다운받을 수 있었음. 이에 원고는 함부르크 지방법원(LG Hamburg)에 피고를 상대로 저작권 침해소송을 제기했음.

 

 

2. 재판의 경과

 

1) 개관

본 사건은 생성형 AI를 위한 모델의 학습이 저작권을 침해하는지에 관한 유럽 내 첫 사건으로 평가됨. 보통 재판이 종료되어야 주목받고 분석이 시작되는 여타의 사건들과 달리 이 사건은 단지 첫 번째 변론이 끝났을 뿐임에도 여러 분석 리포트가 나올 정도로 많은 관심을 받고 있는데, 개별 쟁점에 대한 법원의 태도는 다음과 같이 정리할 수 있음. , 이는 리포트를 제시한 사람의 개인 의견일 수 있고, 법원은 오직 최종 판결문의 이유를 통해서만 의견을 제시한다는 점에 주의할 필요는 있음.

 

2) 일시적 복제의 예외

원고의 저작권 침해 주장에 대한 피고의 첫 번째 항변은 일시적 복제임. , 피고의 복제 행위는 EU 정보사회 지침 제5조 제1과 이를 이행한 독일 저작권법 제44조의a에 의해 정당화된다는 것임. 법원은 기술적 과정에서 일시적이고 부수적인 복제를 허락하는 이 규정이 데이터가 기술의 핵심적이고 필수적인 부분을 구성하는 경우까지 정당화하지 않는다는 이유로 해당 주장을 배척한 것으로 알려졌음.

 

3) TDM 예외

다음으로 검토된 것은 텍스트 및 데이터 마이닝(Text and Data Mining: TDM) 예외인데, 법원은 우선 해당 데이터셋이 상업적 모델의 학습에도 활용될 수 있다는 이유에서 DSM 지침3조가 아닌 제4(독일 저작권법 제44조의b로 이행)가 적용되어야 한다는 입장이었던 것으로 보임. 이에 더해 법원은 생성형 AI 모델의 학습이 DSM 지침 제2조 제2항에 정의된 자동화된 분석기술(automated analytical technique)”에 해당한다는 입장을 취한 것으로 확인됨(이에 관한 논란에 대해서는 아래 3 참조).

다만 DSM 지침 제4조 제3항은 저작자에게 자신의 저작물을 TDM에서 제외할 수 있도록, 이른바 옵트아웃할 수 있는 기회를 부여하고 있음. 법원은 문제된 원고의 사진이 올라온 bigstock.com의 약관(Terms of Service)에 주목했는데, 그 내용은 다음과 같음.

 

YOU MAY NOT [] Use automated programs, applets, bots or the like to access the Bigstock.com website or any content thereon for any purpose, including, by way of example only, downloading Content, indexing, scraping or caching any content on the website.

귀하는 [...] 자동화 프로그램, 애플릿, 봇 등을 사용하여 콘텐츠 다운로드, 웹사이트의 콘텐츠 색인화, 스크래핑 또는 캐싱을 포함하여(이는 단지 예시에 해당함) 어떠한 목적으로도 Bigstock.com 웹사이트 또는 그 안의 콘텐츠에 액세스할 수 없습니다.

 

법원은 이 문구가 어떠한 목적으로든 다운로드 등을 금지하는 취지이므로 옵트아웃, TDM에 대한 거부 의사를 명확히 한 것이라 보았음.

 

4) 남은 쟁점 및 판결 예정일

다만 약관에 포함된 위 문구가 유효한 옵트아웃이 되기 위해서는 한 가지 허들을 더 넘어야 함.

옵트아웃 표시는 DSM 지침 제4조 제3항에서 요구하는 기계판독이 가능한 수단(machine-readable means)”에 해당되어야 하는데, 원고는 텍스트 형태로 의사가 표시되어 있다는 점에서 이는 기계판독이 가능한 경우라고 주장하지만, 피고는 크롤링 기술에 대한 보편적 대응방식은 robots.txt 파일을 저장해두는 것이라고 맞섰음. 아직 법원은 이 문제에 대해 입장을 밝히지 않았음.

법원은 올해 927일 판결을 예고한 바 있으나, 추가 변론기일이 설정될 수도 있음. 무엇보다 DSM 지침의 해석이 문제된 사건이라는 점에서 EU사법재판소로의 선결적 부탁이 이루어질 가능성도 배제할 수 없음.

 

 

3. 시사점

 

본 변론을 통해 우리는 몇 가지 시사점을 도출할 수 있음.

첫째, 그동안 EUDSM 지침 제3, 특히 제4조상 TDM 예외가 AI, 특히 생성형 AI를 위한 모델 학습에 적용될 수 있는지에 대해 논란이 있었음. 지침은 20195월 공포되고, 그다음 달 발효된 것으로서 AI, 그중에서도 ChatGPT 등 생성형 AI를 염두에 두고 만들어진 것으로 보기 어려움. 또 지침에서 TDM텍스트 및 데이터의 분석(analysing text and data)”을 통해 정보를 생성하는 것(to generate information)”을 목적으로 하는 행위를 정당화하고 있음. 생성형 AI를 위해 모델을 학습시키는 것이 분석(analysing)인지, 생성된 산출물이 정보(information)에 해당하는지에 대해서는 학계에서 논란이 있음. 적어도 현재까지의 상황을 보면 법원은 이 쟁점을 심각하게 받아들이지 않은 것으로 보이는데, 이는 유럽에서뿐 아니라 다른 국가에서도 향후 생성형 AI의 모델 학습과 산출물 생성에 TDM 예외가 적용될 수 있다는 암시가 될 수 있음.

둘째, 원고와 피고 모두 피고의 데이터셋에 원고의 저작물이 포함되어 있는지에 대해 다투지 않았고, 법원 역시 이 문제에 대해 원고에게 구체적인 입증을 요구하지 않은 것으로 확인됨. 최근 미국에서 제기되는 여러 소송에서 학습용 데이터에 어떤 저작물이 사용됐는지 밝히기 어렵다는 점이 줄곧 논란이 됐는데, 어떻게 보면 크롤링이라는 방식으로 자료를 수집한다는 것 자체가 곧 웹에 있는 정보를 빠짐없이 수집한다는 증거가 될 수 있음. 이는 그동안 AI 관련 소송에서 입증 문제가 커다란 난관이 될 것이라는 전망과는 배치되는 것인데, 입증 문제가 의외로 간단하게 처리될 가능성도 엿보임.

셋째, 법원은 옵트아웃이 가능한 경우를 명확하게 함은 물론, 그 범위를 넓게 인정하였음. 위 약관에서 어떠한 목적으로도(for any purpose)”라는 표현은 DSM 지침 제4조 제3항에서 요구하는 권리자에 의한 명시적 표현(expressly reserved by their rightholders)”이라는 요건에 부합하지 않을 가능성이 있음. 예를 들어 “all rights reserved”와 같은 문구로 웹페이지에 포함하는 것만으로 충분한지에 대해서는 논란이 제기될 수 있음. 다만 이는 향후의 논란으로까지 이어지지는 않을 것으로 보임. 현재 저작권법 제27(시사적인 기사 및 논설의 복제 등)를 배제하기 위한 표시(“무단전재 및 재배포 금지”)가 모든 인터넷 기사에 기계적으로 붙는다는 점을 고려한다면, 저작자는 이 문제에 따르게 대응할 것으로 예상됨.

넷째, 위 셋째와 마찬가지로 기계판독이 가능한 수단과 관련해서도, robots.txt를 통한 의사표시가 반드시 필요하다는 판결이 나오더라도 권리자들과 스톡 이미지 등 콘텐츠 플랫폼은 이 문제에 빠르게 대응할 것으로 보임.

, 이는 과거에 대한 논란일 뿐, 현재와 미래에 대한 논란일 수 없음. DSM 지침 제4조 제2항은 TDM을 위한 데이터는 목적 달성 이후 즉시 삭제해야 한다고 되어 있는데, 향후 크롤링이 이뤄지는 시점에서 robots.txt를 삽입해둔 경우에는 옵트아웃으로 인정될 것임.

다섯째, 끝으로 아무리 피고가 비영리 단체에 해당한다고 하고, 데이터셋을 개방한다고 하더라도 데이터셋이 상업적 목적으로 이용될 수 있다면, DSM 지침 제3조를 적용받기 어려울 수 있음. 현재 ChatGPT로 생성형 AI의 대명사가 된 OpenAI 역시 과거 비영리 단체였다는 점을 고려한다면, 이는 납득할 수 있는 논리임. 다만 이와 같은 논리를 적용한다면, 지침 제3조를 적용받는 비상업적 학술연구에 해당하는 TDM의 범위는 상당히 줄어들 것임.

 

 

참고자료

 

https://copyrightblog.kluweriplaw.com/2024/07/22/machine-readable-or-not-notes-on-the-hearing-in-laion-e-v-vs-kneschke/

https://www.linkedin.com/posts/mirko-br%C3%BC%C3%9F-8b659196_act-on-copyright-and-related-rights-urheberrechtsgesetz-activity-7217401651282804737-JyNI/

https://www.lto.de/recht/hintergruende/h/kuenstliche-intelligenz-ki-lg-hamburg-urheberrecht-text-datamining

  • 담당자 : 손휘용
  • 담당부서 : 국제통상협력팀
  • 전화번호 : 055-792-0089

본 페이지의 내용이나 사용 편의성에 대해 만족하십니까?

  • 만족도 총 5점 중 5점
  • 만족도 총 5점 중 4점
  • 만족도 총 5점 중 3점
  • 만족도 총 5점 중 2점
  • 만족도 총 5점 중 1점
평가하기