Fun

AI모델 학습 위한 공개데이터 사용기준은 ‘정당한 이익’

2024-07-19 07:00 AM

오픈 AI ⓒ연합뉴스 자료사진

기업들이 챗GPT와 같은 생성형 인공지능(AI) 모델을 개발하는 과정에서 ‘공개 데이터’를 사용할 수 있는 기준으로 정부가 제시한 ‘정당한 이익’에 대한 정의와 그 범위에 대해 관심이 쏠리고 있다.

개인정보보호위원회는 17일 ‘AI 개발·서비스를 위한 공개된 개인정보 처리 안내서’를 발간했다. 공개 데이터는 인터넷에서 누구나 합법적으로 접근할 수 있는 데이터를 의미한다. 안내서에 따르면 AI 학습과 서비스를 위해 공개 데이터를 이용하려면 개인정보보호법에서 명시한 ‘정당한 이익’으로 인정돼야만 한다. 정당한 이익은 단순히 영리성 여부나, 수집된 개인정보의 규모나 항목 등을 의미하는 것은 아니다.

양청삼 개인정보위 개인정보정책국장은 이날 정부서울청사에서 열린 브리핑에서 “정당한 이익이란 영업상 이익뿐만 아니라 공공성 등 사회적 이익을 모두 포함한다”며 “정보주체의 권리 침해 요소를 최소화하고, 적법한 목적의 AI 개발에 필요한 정보 수집을 의미한다”고 설명했다. 예를 들어 AI 학습에 특정 개인정보가 배제되지 않도록 설정해 해당 프로그램의 공정성을 높이거나, 자본력이 부족한 중소기업을 위해 AI 모델을 자유롭게 사용할 수 있도록 배포하는 행위 등도 ‘정당한 이익’에 포함된다.

반면에 안면인식 데이터를 이용해 개인 감시 시스템을 개발하거나, 보이스피싱 목적의 프로그램 구축 등은 정당성이 인정되지 않는다.

양 국장은 “데이터 수집 목적을 구체화하고, 필요한 만큼의 정보를 수집한 뒤 목적을 달성하면 이를 파기하는 것이 ‘정당성’의 핵심”이라며 “이는 선진 개인정보 법제 체계를 갖춘 국가들의 교집합이기도 하다”라고 부연했다.

아직 정당한 이익에 대한 판례나 개인정보위의 결정 사례는 많지 않지만, 다양한 안전조치를 통해 사생활 침해 우려를 낮춘 경우 정당한 이익으로 인정된 사례가 존재한다고 했다. 다만 이번 안내서 발간의 취지가 공개된 개인정보 처리를 둘러싼 법 해석 기준을 제시한 것이므로 법적 구속력은 없다고 강조했다.

AI 산업이 빠르게 발전하는 상황에서 획일적인 규제를 도입하기보다는 혁신을 촉진하는 환경을 마련하고, 현 개인정보보호법의 기준을 구체화해 기업 등이 이를 효과적으로 따라갈 수 있도록 하는 데 중점을 뒀기 때문이다.

양 국장은 “AI 데이터 처리에 대한 기술 발전의 추세를 지켜보고, 관련 리스크도 구체화 됐을 때 법제화 방안을 검토할 예정”이라고 덧붙였다.

(6)