첫 화면 메뉴 바로가기 본문 내용 바로가기

한국저작권위원회

인기검색어
폰트, 음악, PPT, 일러스트
전체 메뉴
닫기

저작권동향

저작권동향 상세보기
제목 [이슈리포트] 2024-16-[미국] 생성형 AI 학습에 이용된 저작물의 공개에 관한 연방법안 발의(류시원)
담당부서 국제통상협력팀 손휘용(0557920089) 등록일 2024-04-19
첨부문서

[이슈리포트] 2024-16-[미국] 생성형 AI 학습에 이용된 저작물의 공개에 관한 연방법안 발의(류시원).pdf 미리보기

[미국] 생성형 AI 학습에 이용된 저작물의 공개에 관한

연방법안(H.R. 7913) 발의

전남대학교 법학전문대학원 교수

류시원

 

1. 개요

 

미국 캘리포니아주의 애덤 쉬프(Adam B. Schiff) 하원의원이 생성형 AI 학습에 이용된 저작물의 공개에 관한 연방법안을 202449일 하원의회에 상정했다. 법안의 명칭은 생성형 AI 저작권 공개법안(Generative AI Copyright Disclosure Act of 2024)이며, 의안번호 H.R. 7913호로 발의되었다.

쉬프 의원은 본 법안의 발의 소식을 전하면서 그 동기에 관하여 다음과 같이 언급했다. “AI는 우리의 경제, 정치체제 및 일상생활을 전복할 가능성을 잠재하고 있다. AI의 막대한 잠재력과, 윤리적 지침 및 보호에 대한 중대한 요구 사이의 균형이 추구되어야 한다. 생성형 AI 저작권 공개법은 이러한 방향성에 있어 중추적인 단계이다. 본 법안은 창작자들이 그들의 작품이 AI 학습 데이터셋에 기여한 경우 그 사실을 알 수 있도록 보장함으로써 창작자들의 권리와 기여를 보호하면서 혁신을 달성하게끔 한다. 이는 AI 시대의 창조성에 대한 존중, 그리고 기술적 진보와 공정성의 결합을 의미한다.”

 

 

2. 법안의 배경

 

미국 내에서 전개된 다음과 같은 몇 가지 상황이 본 법안의 발의 배경 이해하는 데에 참고가 된다.

 

(1) G7 히로시마 프로세스와 유럽연합 인공지능법

20234G7 디지털기술 장관회의에서 AI 거버넌스 프레임워크 간 상호운용성과 생성형 AI 관련 국제적 논의의 중요성이 강조되었다. 이를 바탕으로 동년 5월 개최된 G7 정상회담에서 미국을 비롯한 각국 정상은 표용적 방식으로 생성형 AI에 관한 논의를 지속하기로 하는 히로시마 AI 프로세스의 수립에 합의하였다. 이와 관련하여 OECD가 발간한 보고서에서는 생성형 AI 관련 쟁점 가운데 하나로, AI 모델 학습 과정에서 이용되는 데이터, 특히 개인정보와 저작권을 비롯한 지식재산권의 보호 문제가 언급되었다.

같은 보고서는 위 주제와 관련된 각국의 정책 상황 중 당시 유럽의회에 계류 중이던 인공지능법안을 여러 차례 언급하며 이에 주목했다. 2024313일 유럽의회에서 최종 승인된 인공지능법(이하 ‘AI’)은 범용 AI(general-purpose AI) 모델 제공자의 의무 가운데 하나로, 해당 범용 AI 모델의 학습에 이용된 콘텐츠에 대한 충분히 상세한 요약서(sufficiently detailed summary)”를 작성하여 공중에 제공해야 함을 규정한다. 미국의 생성형 AI 저작권 공개법안 발의에는 유럽연합 AI법의 통과가 중요한 계기가 되었고, 학습용 콘텐츠 공개에 관한 AI법의 내용이 본 법안의 작성에 크게 참고된 것으로 보인다.

 

(2) 대통령 행정명령 14110호 등 백악관의 조치

미국의 바이든 행정부는 20237월과 9월 두 차례에 걸쳐 15개 주요 기술기업들로부터 안전하고 책임있는 AI 기술 개발을 위한 자발적 서약을 이끌어내었다. 위 서약은 주로 AI 기술의 안전성 보장과 사회적 위험 방지에 관한 조치들을 담고 있지만, 백악관 보도자료에서는 이를 정부의 행정명령과 초당적인 입법적 조치로 나아가는 중요한 단계라고 설명했다.

20231030, 바이든 대통령은 안전하고 신뢰할 수 있는 AI 개발이용을 위한 행정명령 14110호를 발령했다. 본 행정명령에는 특허상표청장에게 저작권청장과 협의하여, 후술하는 저작권청의 최근 의견수렴에서 다루어진 AI 생성물의 보호범위, AI 학습 시 저작물 처리 등의 주제에 관한 저작권-AI 관련 행정적 조치에 관한 권고사항을 수립해 대통령에게 제출할 것을 명하는 내용이 포함되었다. 본 행정명령은 미국 연방 차원에서 발령된 최초의 인공지능 규제이나, 국민이나 사업자가 아닌 관계 정부기관에 대한 구속력 있는 명령으로서, 규제 효과의 실현을 위해서는 의회의 입법에 의한 보완이 요구되었다.

 

(3) 저작권청의 ‘AI와 저작권공개의견수렴

미국 저작권청은 저작권 연구 및 정책 권고활동의 일환으로 2023830‘AI와 저작권에 관한 공개 의견수렴 절차를 개시했다. 절차개시서에 수록된 방대한 질문 목록 중에는 투명성 및 기록보관(Transparency and Recordkeeping)”이라는 제목 하에 AI 모델 학습에 이용된 소재에 관한 기록을 수집, 유지 및 공개하도록 요구하는 것에 관해 그 구체성의 정도, 공개의 상대방, 의무 내용, 잠재적 영향 등을 묻는 질문이 포함되어 있었다. 2023126일까지 진행된 본 의견수렴절차에서 위 주제에 관해 제출된 의견들은 상대적으로 소수였지만, 대체로 권리자 측에서는 학습 데이터 공개의 법적 의무화에 찬성하는 의견을, AI 개발업체 측에서는 반대하는 의견을 제출하였다고 한다. 반대 의견의 주요 근거로는 영업비밀 보호, 이행의 현실적 어려움 등이 제시되었다.

 

(4) 미국 내 생성형 AI 저작권 소송들

다양한 생성형 AI 서비스들이 확산 됨에 따라, AI 학습 과정에서 저작물이 무단 이용되었음을 이유로 하는 저작권 분쟁이 잇따르고 있다. 미국에서도 다수의 소송이 제기되었는데, 프로그램 코드나 책, 뉴스 등 텍스트 콘텐츠의 이용이 문제가 된 사건들부터 사진이나 이미지의 이용이 문제가 된 사건들까지 다양하고 그 건수도 많다. 주된 피고는 Open AI, Microsoft, Stability AI, Meta, Anthropic, Alphabet 등 생성형 AI 기술을 선도하고 있는 기업들이다. 이와 같은 소송에서 침해를 주장하는 권리자는 자신의 저작물이 모델 학습에 이용(복제)되었다는 사실을 증명하여야 하는데, 원저작물상의 워터마크 이미지가 생성물에도 포함되어 있거나 산출 결과와 원저작물 간 유사도가 지나치게 높아 그 이용 사실을 증명하는 것이 가능한 경우도 있지만, 대부분은 AI 모델의 블랙박스적 성격에 따른 역추적의 기술적 어려움으로 인해 특정 모델 및 특정 결과물의 작성에 어떤 저작물이 이용되었는지, 만약 이용되었다면 얼마만큼 기여했는지를 특정, 증명하는 것이 현재의 기술로 사실상 불가능하거나 과도한 비용이 소요된다고 한다. 이이 따라 AI 개발자와 권리자 간 정보의 비대칭성 해소 및 이를 통한 실효적 저작권 보호를 위해 AI 개발자에게 AI 모델 학습에 이용된 저작물 등 데이터의 상세 내역을 공개하도록 의무화해야 한다는 목소리가 높아지고 있다.

이처럼 AI 모델 학습용 데이터 공개에 관한 요구는 AI 규제 원칙인 투명성과 책임성의 구현, 및 저작권자 보호를 위한 도구적 기능의 관점에서 논의되고 있다. 이 주제는 최근 유럽의회를 통과한 유럽연합 AI법에 학습용 데이터 공개에 관한 내용이 포함되어 있어 더 크게 주목받고 있다. 미국에서 최근 발의된 생성형 AI 저작권 공개법안은 위와 같은 배경에서 나온 것으로, 그 계기가 된 유럽연합 AI법을 상당 부분 참조하여 성안된 것으로 보인다. 법안의 주요 내용은 항을 나누어 살펴본다.

 

 

3. 법안의 내용

 

법안의 정식 명칭은 생성형 AI 시스템의 구축 및 기타 목적에 이용된 저작물에 관한 통지를 저작권청장(Register of Copyrights)에게 제출하도록 요구하는 법안이다. 그 명칭에서 알 수 있듯이 본 법안은 생성형 AI의 학습에 이용된 저작물에 관한 통지를 저작권청장에게 제출할 의무를 부과하는 것을 골자로 한다. 법안의 내용을 항목별로 살펴보면 다음과 같다.

 

(1) 적용 범위

본 법안은 법명의 약칭에 관한 제1조와, 실질적인 규율사항을 담은 제2조 단 두 개의 조문으로 구성되어 있다. 2(d)는 본 법안에 사용된 주요 용어인 인공지능(artificial intelligence), 저작물(copyrighted work), 생성형 AI 모델(generative AI model), 생성형 AI 시스템(generative AI system), 학습용 데이터셋(training dataset) 등을 정의한다. 이들 용어 중 특기할 만한 부분은, ‘생성형 AI 모델을 텍스트, 이미지, 오디오, 비디오 등의 표현 형식의 소재 결과물을 생성하는 AI에 사용하기 위해 설계된 컴퓨터 코드와 수치의 조합으로 정의하여, 생성되는 표현 형식에 특별한 제한을 두지 않고 LLM과 같은 텍스트 생성 AI 모델까지 포함한다는 점이다. 이러한 점은 학습용 데이터셋의 정의에서도 확인되는데, 학습용 데이터셋은 개별 소재의 집합 외에 그 소재에 대한 주석(annotation)까지 포함하는 것으로 정의된다.생성형 AI 시스템의 정의도 주목된다. 본 법안의 생성형 AI 시스템은 (A) 실질적으로 하나 이상의 생성형 AI 모델을 채용하고, (B) 소비자가 이용하도록 설계된 소프트웨어 제품 또는 서비스를 뜻한다. , 본 법안은 생성형 AI 모델을 채용한 시스템 중에서 소비자의 이용에 제공되는 종류의 시스템으로 그 적용 대상이 한정되어 있다.

본 법안에 따른 통지의무의 수범자는 생성형 AI 시스템의 구축에 사용되는 학습용 데이터셋의 작성자, 또는 학습용 데이터셋을 주요하게 변경한(데이터셋을 업데이트, 정제, 또는 재학습하는 것을 포함함) 자로 규정되어 있다. 데이터셋의 조성은 통상 원시데이터 수집(collection), 정제(refinement), 주석과 분할을 포함하는 라벨링(labeling) 단계로 이루어지며, 이에 더해 재분류(re-classification) 단계와, 데이터셋의 품질을 검증하기 위한 테스트 단계가 포함되기도 한다. 이러한 데이터셋 조성 과정에 비추어 볼 때 생성형 AI 시스템에 채용되는 생성형 AI 모델의 개발자가 해당 AI 모델에 맞추어 데이터셋을 직접 작성하거나 그에 대한 주요한 변경을 수행하는 경우가 많을 것이다. 따라서 본 법안의 수범자는 대개 생성형 AI 모델의 개발자가 될 것이지만, 데이터셋 조성 및 제공을 외부 전문업체 또는 계열회사에게 맡기는 경우에는 데이터셋 조성을 담당한 해당 업체가 수범자가 되는 경우도 배제할 수 없을 것으로 생각된다.

 

(2) 통지의무

생성형 AI 시스템의 구축에 사용되는 학습용 데이터셋의 작성자 또는 주요한 변경자는 저작권청장에게 다음의 사항을 통지해야 한다. 첫째, 학습용 데이터셋에(작성자의 경우) 이용된 또는 학습용 데이터셋을 변경하기 위해(주요한 변경자의 경우) 이용된 모든 저작물에 대한 충분히 상세한 요약서(sufficiently detailed summary)”를 통지해야 한다. 둘째, 만약 위 통지의 제출 당시 학습용 데이터셋이 인터넷상에 공개되어 있다면 그 데이터셋의 URL도 통지에 포함되어야 한다.

위의 통지를 제출하여야 하는 시기는 다음과 같이 구분된다. 학습용 데이터셋이 사용된 생성형 AI 시스템이 본 법 시행일 이후에 최초로 소비자에게 제공되는 경우에는 해당 생성형 AI 시스템이 소비자에게 제공되기 30일 전까지 제출하여야 한다. 한편, 학습용 데이터셋이 사용된 생성형 AI 시스템이 본 법 시행일 이전에 소비자에게 제공된 경우에는 본 법 시행일부터 30일 내에 제출하여야 한다.

저작권청장은 제출된 각 통지를 수록한 공개 온라인 데이터베이스를 설치 및 유지해야 한다. 따라서 본 법이 의회를 통과하여 시행되게 되면, 특정한 생성형 AI 시스템의 AI 모델 학습에 이용된 저작물의 내역이 충분히 상세한 요약서의 형태로 공중에 공개될 것이다. 이 점에서 범용 AI 모델 제공자가 충분히 상세한 요약서를 직접 공중에 공개하도록 하는 유럽연합 AI법과 다르지만, 공개라는 궁극적 효과 면에서는 크게 다르지 않다. 오히려 저작권청이 공개 온라인 데이터베이스의 운영을 담당하고, 공개되는 정보의 형식이 통일적으로 관리될 수 있다는 점에서 이용자의 편의성 및 투명성의 구현 측면에서 더 효율적이라고 볼 수도 있다.

 

(3) 위반 시의 제재

통지의무 위반에 대한 제재수단으로는 금전적 제재(civil penalty) 규정되어 있다. 2(a)(1)의 수범자가 동 조항의 통지의무를 위반한 경우에는 5천 달러 이상의 금전적 제재에 처한다. 저작권청장은 본 법 시행일부터 180일 내에 상기 요구사항의 실행을 위한 규칙을 공표해야 한다.

 

 

4. 반응 및 전망

 

(1) 법안에 대한 반응 및 기대 효과

본 법안에 대하여 권리자 단체들은 크게 환영하는 분위기이다. 법안 발표와 함께 쉬프 의원실에서 배포한 보도자료에 의하면, 미국 음반산업협회(RIAA), 미국 감독조합(DGA), 미국 전문사진가협회(PPA), 미국 영화배우조합과 텔레비전라디오방송인조합의 연합체인 SAG-AFTRA, 미국 작곡저술출판인협회(ASCAP), 미국 작가조합(Writers Guild of America), 연극무대직원국제연맹(IATSE) 등의 권리자 단체들이 각기 본 법안을 환영하는 성명을 발표했고, 그밖에도 수십 개의 단체들이 지지 의사를 밝혔다고 한다.

본 법안은 미국 연방법 차원에서 처음 시도되는 생성형 AI 학습용 데이터셋의 투명성 실현을 위한 입법이다. 서두에서 밝혔듯이 본 법안은 미국에서 다수의 생성형 AI 저작권 소송이 제기되고 있는 상황과, AI 기술의 사회적 수용을 위한 전제로서 투명성, 신뢰성 및 책임성에 대한 요구가 커지고 있는 국제적 인식의 변화를 배경으로 발의되었다. 쉬프 의원이 본 법안을 발표하면서 창작자들의 권리와 기여 보호를 언급한 점에서 시사되듯이, 본 법안은 단지 투명성의 증대만을 목적으로 하는 것이 아니라 생성형 AI 학습에 이용된 저작물의 권리자가 그 권리를 용이하게 행사하는 것을 지원하여 창작 성과의 실효적 보호를 구현하는 것을 궁극적으로 목표하는 입법 시도라고 이해된다.

 

(2) 실효성 확보를 위한 고려사항

본 법안이 초안 그대로 의회를 통과하여 시행될 것인지는 장담할 수 없지만, 성공적인 법집행 성과로 이어지기 위해서는 해결해야 할 과제들이 있다.

첫째로, 본 법안의 적용 범위는 모든 AI가 아닌 생성형 AI 시스템이며, 그중에서도 (최종)소비자가 이용하도록 설계된 생성형 AI 시스템에 국한된다. 반면, 수범자는 생성형 AI 모델 학습에 이용되는 데이터셋의 작성자 또는 주요한 변경자이다. 따라서 예컨대 소비자 서비스를 염두에 두지 않고 방대한 저작물을 학습용 데이터셋으로 이용하여 개발된 범용 기반모델(foundation model)을 토대로, 3자가 소비자에게 제공할 생성형 AI 시스템을 구축하기 위해 상대적으로 소량의 저작물을 포함하는 데이터셋으로 미세조정(fine tuning) 학습을 거쳤다면, 해당 제3자가 수범자가 되고 미세조정용 데이터셋 내의 저작물만이 통지의 대상이 될 수 있다. 범용 AI 기반모델 개발자에게 제3자의 미세조정에 의한 소비자 제공용 생성형 AI 시스템 구축이라는, 그의 통제범위 밖에 있는 사후의 사정을 이유로 통지의무를 부담시키는 것은 과도한 규제가 될 수 있기 때문이다. 이러한 규제 공백의 가능성 및 유럽연합 AI법이 투명성 의무의 수범자를 범용 AI 모델 제공자(providers of general-purpose AI models)”로 정하고 있는 점을 고려할 때, 본 법안이 적용 범위를 소비자가 이용하도록 설계된 생성형 AI 시스템으로 설정한 것이 규제 효과의 달성에 미칠 영향이 문제시될 수 있다.

둘째로, 본 법안이 의회를 통과하여 실효적으로 집행되기 위해서는 유럽연합 AI법상의 문구를 그대로 차용한 충분히 상세한 요약서의 요구 수준을 어떻게 정할 것인지가 관건이라 할 수 있다. 현재의 초안에서는 그 의미를 유추할 수 있는 단서를 찾을 수 없으나, 유럽연합 AI법의 전문(前文)에서 위와 동일한 문구의 의미에 대해 다음과 같이 해설한 부분을 참고할 수 있다. “영업비밀의 보호 필요성을 유념해야 하나, 본 요약서는 기술적으로 상세할 것이 아니라 일반적으로 포괄적인 범위의 것이어야 한다. 이는 저작권자를 비롯하여 적법한 이해를 가진 당사자들이 연합법에 따라 그들의 권리를 행사할 수 있도록 하기 위함이다. 예를 들어, 대규모 사설 혹은 공공 데이터베이스나 데이터 저장소와 같이 모델 학습에 투입된 주() 데이터집합/셋을 목록화하고, 기타 이용된 데이터소스에 관한 설명을 제공하는 것이다. AI 사무국(AI Office)이 본 요약서의 양식을 제공하는 것이 적절하며, 이는 단순하고 효과적이며 제공자가 필요한 요약서를 서술 형식으로 제공할 수 있도록 하는 것이어야 한다.” 만약 본 법안의 요약서가 유럽연합 AI법과 동일한 기능을 달성하려는 것이라면, AI법의 전문에서 밝힌 위 사항을 참고하여 권리자 보호와 혁신의 지원이라는 복합적 목적에 부합하도록 충분히 상세한 요약서의 요구 수준과 형식 및 영업비밀 보호를 위한 방책을 구체화하는 것이 바람직하겠다. 본 법안에서는 저작권청장에게 실행 규칙을 공표할 의무를 부과하고 있는데, 해당 규칙에서 충분히 상세한 요약서의 형식 등에 관한 사항을 정한다면 수범자의 의무 내용을 명확하게 하는 동시에, AI 학습용 저작물의 요약서가 표준적 형태로 수집공개됨에 따라 그 요약서를 수록한 공개 온라인 데이터베이스의 관리 및 공중 이용의 편의를 제고하는 데에도 도움이 될 것이다.

 

 

참고자료

 

Adam Schiff, “Rep. Schiff Introduces Groundbreaking Bill to Create AI Transparency Between Creators and Companies”, Apr. 9, 2024,
<https://schiff.house.gov/news/press-releases/rep-schiff-introduces-groundbreaking-bill-to-create-ai-transparency-between-creators-and-companies>.

Generative AI Copyright Disclosure Act of 2024 Bill (H.R. 7913),
<https://schiff.house.gov/imo/media/doc/the_generative_ai_copyright_disclosure_act.pdf>.

Artificial Intelligence Act, Text Adopted by European Parliament on Mar. 13, 2024,
<https://www.europarl.europa.eu/doceo/document/TA-9-2024-0138_EN.pdf>.

The White House, “Executive Order on the Safe, Secure, and Trustworthy Development and Use of Artificial Intelligence”, Oct. 30, 2023,
<https://www.whitehouse.gov/briefing-room/presidential-actions/2023/10/30/executive-order-on-the-safe-secure-and-trustworthy-development-and-use-of-artificial-intelligence/>.

U.S. Copyright Office, Notice of Inquiry and Requests for Comments on Artificial Intelligence and Copyright Study, 88(167) Fed. Reg. 59,942.

Samuelson, Pamela, “U.S. Copyright Office’s Questions about Generative AI”, Communications of the ACM, vol. 67, no. 3 (Mar. 2024).

  • 담당자 : 손휘용
  • 담당부서 : 국제통상협력팀
  • 전화번호 : 0557920089

본 페이지의 내용이나 사용 편의성에 대해 만족하십니까?

  • 만족도 총 5점 중 5점
  • 만족도 총 5점 중 4점
  • 만족도 총 5점 중 3점
  • 만족도 총 5점 중 2점
  • 만족도 총 5점 중 1점
평가하기