첫 화면 메뉴 바로가기 본문 내용 바로가기

한국저작권위원회

인기검색어
폰트, 음악, PPT, 일러스트
전체 메뉴
닫기

저작권 산업기술 동향

저작권 산업기술동향 상세보기
제목 [뉴스레터] 8월 2주 : 5. [저작권기술 R&D 프로젝트 소개] 비트토렌트 불완전체로부터의 저작물 식별 기술 개발
담당부서 저작권기술팀 이민선 등록일 2015-08-13

 

5. [저작권기술 R&D 프로젝트 소개] 비트토렌트 불완전체로부터의 저작물 식별 기술 개발

 

 

□ 개발 기술 개요

○ 개발내용

► 비트토렌트 불완전체의 다운로드 및 분석 복원 기술

► 비트토렌트 오디오 및 비디오 불완전체 식별 기술

► 비트토렌트 불완전체 해시, 복수, 인식, 분류 기술

○ 활용분야

► 저작권 모니터링 및 분석 서비스 활용

► 저작권 포렌식 분야에 활용

► 저작물의 불법유통 추적시스템 분야

○ 기대효과

► 토렌트 서비스를 이용한 불법 저작물 유포 방지 기술 확보

► 토렌트 저작물 불법 유통 조기 탐지기술 확보를 통해 온라인 저작권 보호 기반 마련

► 토렌트 수사에 필요한 포렌식 시스템 구축에 활용

   

 

□ 기술내용 1 (오디오 불완전체 복구 기술)

○ 비트토렌트 네트워크에서 유통되는 오디오 조각 파일로부터 오디오 데이터를 복구

► 비트토렌트 leecher들이 보유하고 있는 음악저작물에서 CD 음을 그대로 리핑한 PCM(Pulse Coded Modulation)의 조각으로부터 원본을 복원하는 기술로서 WAVE 파일의 채널수와 8bit 또는 16bit에 맞는 상관기를 설계하여 입력된 조각 파일을 복원함

► WAVE 파일에 존재 가능한 채널수 6개와 샘플당 비트수가 8bit와 16bit, 두 가지로서 총 12가지의 경우에 대해 고려함

► piece를 읽어서 동일한 데이터에 대해서 8bit와 16bit 배열로 순서를 만들고, 한 샘플 shift된 데이터를 생성하여 원 데이터와의 correlation 값을 기록하고 다시 한 샘플 shift 시켜서 원 데이터와의 correlation을 구함

► shift number에 대한 correlation을 다 구했으면 최대 correlation 값을 갖는 shift number를 이용하여 piece를 재배열하고 복구함

○ 비트토렌트 등에 의해 파일 포맷이 mp3인 오디오 조각 파일을 복원

► 오디오 조각 파일에서 프레임 헤더를 추적

► 프레임 헤더에서 버전 아이디, 레이어, 비트 레이트, 주파수, 패딩 비트, 채널 모드 등 6개 파라미터들을 추출하고 상기 파라미터들이 유효값의 범위 내에 있는가를 검증

► 파라미터들의 유효값이 검증된 압축 프레임의 완전성을 검증

► 완전성이 검증된 압축 프레임을 디코딩하여 오디오 데이터를 복구

○ 비트토렌트 등에 의해 파일 포맷이 flac, wma인 오디오 조각 파일을 복원

► 오디오 조각 파일에서 프레임 헤더를 추적하여 유효 프레임이 구비된 조각 파일을 확보

► 확보된 조각 파일에 메타데이터 블록의 존재 여부를 판단

► 확보된 조각 파일에 메타데이터 블록이 존재하면 상기 메타데이터 블록을 디코딩하여 오디오 데이터를 복구

► 확보된 조각 파일에 메타데이터 블록이 존재하지 않으면 기존의 통계자료에서 정보를 추출하여 임시헤더를 생성하고, 상기 임시헤더를 상기 유효 프레임에 결합시킨 후 디코딩하여 오디오 데이터를 복구

   

 

□ 기술의 특징 1 (오디오 불완전체 복구 기술)

○ 다양한 분야에 적용 가능한 검증된 알고리즘

► 2개의 채널종류와 3개의 샘플종류, 각각 100개의 piece를 이용하여 총 600개의 piece에 대해서 알고리즘을 검증함

► 채널 구분이 용이하여 낮은 해상도의 음악에 대해서도 효과적으로 구분하고 복원 가능함

► 비트토렌트뿐만 아니라 디지털 고고학, 디지털 포렌식 등 다양한 분야에 적용 가능함

   

 

□ 기술내용 2 (오디오 불완전체 식별기술)

○ 기존의 식별 알고리즘에서 개선된 3개의 식별 알고리즘을 개발

► 시프트 기법을 제거한 오디오 식별 방법으로 기존의 인식 알고리즘은 12개 chroma 특징점을 시프트 하면서 각각 cross-correlation을 구하였지만 개선된 알고리즘은 12개 chroma 특징점 행을 각각 한번만 cross-correlation 취하고 시프트 단계를 제거함

► 2D cross-correlation을 이용한 오디오 식별 방법으로 기존의 인식 알고리즘은 12개 chroma 특징점을 각각 1D cross-correlation을 구하였지만 개선된 알고리즘은 12개 chroma 특징점을 2D FFT를 이용한 고속 2D cross-correlation하여 구현함

► Local Maxima 선택 방법으로 랜덤하게 다운받은 piece의 특징점과 원본 오디오의 특징점을 2D cross correlation 하면 피크 위치는 piece가 원본 오디오 파일에서 잘린 위치와 대응되는 곳에서 나타나므로 제일 큰 피크가 piece가 잘린 위치에서 나타나지 않으면 식별되지 않은 것으로 처리하므로 오인식율이 많이 감소됨

   

 

□ 기술의 특징 2 (오디오 불완전체 복구 기술)

○ 인식률 및 식별속도를 증가시킨 오디오 불완전체 식별기술

► 시프트 기법을 제거한 오디오 식별방법은 기존의 알고리즘보다 인식율이 5.5% 높아졌고 piece 사이즈가 512KB 일 때 3.25% 높아졌을 뿐만 아니라 식별 속도도 증가함

► 2D cross-correlation을 이용한 오디오 식별 방법은 기존의 알고리즘보다 인식율이 25% 높아졌고 piece 사이즈가 512KB일 때 17.75% 높아졌을 뿐만 아니라 식별 속도도 증가함

► 2D cross-correlation을 이용한 오디오 식별 방법과 local maxima 선택 방법은 기존의 알고리즘보다 인식율이 31% 높아졌고 piece 사이즈가 512KB일 때 15.25% 높아졌을 뿐 아니라 식별 속도도 증가함