"이젠 거부한다. 노출 필요없다" AI 거부할 권리… '조용한 혁명' 온다

reporter-profile
Sejin Kim 2023.08.28 15:31 PDT
"이젠 거부한다. 노출 필요없다" AI 거부할 권리… '조용한 혁명' 온다
AI와 봇의 훈련에 콘텐츠가 무단 사용되는 것을 거부하는 흐름이 나타나고 있다. (출처 : Shutterstock)

[안티AI 데이터 주권] 콘텐츠 제작자, 언론사의 역습
플랫폼의 무단 콘텐츠 이용 막는 데이터 주권 되찾으려는 움직임
뉴욕타임스∙게티이미지 “AI, 우리 콘텐츠 갖다 쓰지 말라”
SNS ‘알고리즘’도 타격…유럽선 알고리즘 허락받아야

"내 기사를 허락없이 긁어가지 말라"

데이터 주권을 되찾으려는 움직임이 확산하고 있다. 챗GPT 등 생성AI 기업들과 소셜미디어 기업들은 자사 서비스를 개선하고 운영하는데, 사용자의 데이터를 활용한다.

생성AI 서비스의 기반인 대형언어모델(LLM)은 시스템을 훈련할 때 저작권이 있는 데이터를 훈련에 활용한다. 인간의 언어 패턴과 유사한 방식으로 사용자의 쿼리(질문)에 응답할 수 있으려면 실제 인간이 쓰는 데이터로 훈련하는 게 필수인 탓.

소셜미디어(SNS)는 사용자의 활동을 추적해 개인화된 서비스를 제공, 이를 구독과 광고 등으로 연결해 수익을 낸다.

이에 기술 기업들이 이 과정에서 사용하는 데이터 저작권에 대한 정당한 대가를 지급해야 한다는 지적이 커지고 있다. 이 일환에서 알고리즘과 인공지능(AI)의 추적을 제한하거나, 제재하려는 ‘조용한 혁명’이 시작되고 있다.

실제 언론사, 콘텐츠 보유 기업들은 AI에 자사 콘텐츠 공급을 제한했다. 유럽에서는 SNS의 알고리즘에 대한 규제가 시행됐다.

뉴욕타임스∙게티이미지 “AI, 콘텐츠 갖다 쓰지 말라”

24일(현지시각) 가디언즈 보도에 따르면 8월 뉴욕타임스, 씨엔엔(CNN), 로이터스, 호주브로드캐스팅코퍼레이션(ABC), 시카코 트리뷴, 캔버라타임스, 뉴캐슬헤럴드, 호주커뮤니티미디어(ACM) 등 미디어들은 자사 사이트에 챗GPT의 웹 크롤러인 GPTBot 접근을 금지했다.

웹 크롤러는 각종 웹사이트의 페이지를 모니터링, 스캔하는 소프트웨어다. 오픈AI는 크롤러를 차단하는 방법을 기술한 블로그 게시물에 따르면 GPTBot를 사이트에 접근하도록 허용하면 AI 모델이 더욱 정확해지고 일반적인 기능과 안전성을 향상시키는 데 사용된다.

뉴욕타임스(NYT)의 ‘AI 훈련과 개발을 위한 자사 콘텐츠 스크래핑’을 금지하기 위해 최근 서비스 약관을 업데이트했다. 8월 3일 기준 웹사이트는 ‘기계학습, AI 시스템 훈련 등을 포함한 소프트웨어 개발에 자사 콘텐츠를 동의 없이 사용하는 것을 엄격히 금지한다’라고 명시돼 있다.

지난 10일 유료 이미지 사이트인 게티이미지를 비롯해 AP통신, 유럽언론사진사협회, 유럽출판인협회, AFP(Agence France-Presse), 가넷, 전국언론사진기자협회, 전국작가연맹, 뉴스미디어연합, 작가조합 등도 ‘AI 모델을 만드는데 사용되는 모든 훈련 세트’에 대한 투명성을 높이고, 저작권 자료 사용에 대한 동의를 받는 내용의 AI 규제를 요구하는 공개서한에 서명했다.

크롤러를 금지하면 챗GPT 답변 결과에 이들 매체의 기사나 표시되지 않는 것을 의미한다. 접근성을 포기하면서까지 이들이 자사 콘텐츠 사용을 막는 이유에는 수익이 있다.

현재 AI기업들은 훈련 과정에서 저작권 사용료를 따로 내지 않는다. 여기에 더해 콘텐츠 기업 내부에서는 생성AI 가 훈련을 통해 차후에는 스스로 콘텐츠를 생산할 수 있다는 우려도 있다.

로이터 홍보담당자는 더버지에 “지적재산권(IP)은 우리 사업의 핵심이기 때문에 저작권 보호는 필수”라고 말했다. 공개서한 서명자들도 “미디어 콘텐츠를 사용하여 훈련된 기초 모델이 원작자에 대한 고려, 보상, 귀속 없이 정보를 전파한다”면서 “이러한 관행은 시청률, 구독, 라이선스, 광고를 기반으로 하는 미디어 산업의 핵심 비즈니스 모델을 해친다”고 강조했다.

(출처 : Rafael Henrique, Sopa Images, Lightrocket, Getty Images)

‘데이터 주권’ 보호 움직임…SNS ‘알고리즘’도 타격

데이터를 발생시킨 원작자, 사용자의 ‘데이터 주권’을 보호하자는 목소리가 커지면서 AI를 비롯한 기술 기업에 대한 규제 움직임이 커지는 추세다. 유럽연합(EU)에서는 최근 페이스북, 인스타그램, 틱톡, 스냅챗 등 관련성을 기반으로 개인화된 콘텐츠 피드를 거부할 수 있게 됐다.

25일부터 공식 시행된 EU 디지털서비스법(DSA)에 따르면 구글, 아마존, 페이스북 등 ‘대형 온라인 플랫폼’들은 이제 알고리즘을 마음대로 구성할 수 없게 됐다. 플랫폼은 사용자에게 콘텐츠 추천 시스템 및 데이터 수집을 거부할 권리를 부여하고, 주요 데이터를 당국과 공유하며, 국가적 위기 발생 시 당국과 협조하고, 외부에서 독립적인 감사를 받아야 한다.

핵심 비즈니스모델인 광고 사업도 제한한다. 또 개인의 성적지향, 종교, 민족, 정치적 신념을 대상으로 한 표적 광고를 금지하고, 어린이 대상 광고도 조건이 붙는다. 이와 함께 플랫폼은 불법 상품, 서비스 등이 포함된 콘텐츠를 관리하는 동시에 해당 유형의 콘텐츠를 신고할 수 있는 시스템을 마련해야 한다.

DSA는 지난해 7월 유럽의회에서 통과했다. EU 내 월간 활성이용자 수가 4500만명 이상인 플랫폼이 대상으로, 아직 소규모 기업에는 적용되지 않는다. 기업은 최소 6개월마다 사용자 수를 업데이트해야 한다.

현재까지 규제 대상으로 지정된 기업은 알리바바 알리익스프레스, 아마존 스토어, 애플 앱스토어, 부킹닷컴, 페이스북, 구글 플레이, 구글 지도, 구글 쇼핑, 인스타그램, 링크드인, 핀터레스트, 스냅챗, 틱톡, 트위터, 위키피디아, 유튜브, 잘란도, 빙, 구글 검색 등 19곳이다.

`세계 최초의 로봇 예술가'라는 별칭을 단 인공지능 미술 로봇 `아이다'(Ai-Da)의 자화상. 2019년 세상에 나온 아이다는 영국 로봇기업 엔지니어드아츠(Engineered Arts)의 로봇 제작 기술과 옥스포드대 과학자들이 개발한 알고리즘, 리즈대 인공지능 엔지니어가 개발한 로봇손의 합작품이다. (출처 : Gettyimages)

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.