27일 서울 여의도 국회 의원회관 제1세미나실에서 열린 자율주행 산업 지원 국회 토론회에서는 '자율주행 인공지능(AI)학습 시 원본데이터 활용'을 쟁점으로 정부와 기업 관계자 및 자율주행업계 전문가들이 의견을 나눴다.
이날 개인정보보호위원회는 "딥시크의 국내 서비스 중단은 정보 보호에 대한 관심을 보여준다"며 "기업의 개인정보처리 과정이 불투명하고 신뢰를 주지 못하면 시장이 외면한다는 사실을 보여줬다는 의미가 있다"고 주장했다.
지난 5일 딥시크의 과도한 개인정보 수집과 유출로 논란이 일자 정부 부처와 국내 기관들은 앞다퉈 사용을 금지했으며 결국 개인정보 유출이 사실로 확인되자 개인정보위는 15일 국내 서비스를 잠정 중단했다.
현재 AI학습 데이터는 개인정보 비식별화 절차를 거쳐 사용하는 것이 원칙이다. 하지만 이날 토론회에서 업계 관계자들의 입장은 조금 달랐다. 비식별 데이터 활용 시 약 17% 이상 인식률이 떨어지고 실제 기술 적용에 제한이 많다며 원본 데이터 활용 필요성을 주장헸다.
이날 참석한 자율주행 개발 업계 종사자들은 "서울 일부 지역에서만 학습한 데이터로는 지방 지역이나 해외에 적용해 활용하기 어렵고 해외에서 요구하는 도로교통법 기준을 충족하기 어렵다"며 "규제 샌드박스가 굉장히 작은 영역에 적용돼있어 실제 기술 개발에 애로사항이 많다"고 말했다.
일례로 싱가폴의 도로교통법은 보행자가 차량을 향하고 있으면 1m, 차량을 등지고 다른 곳을 바라보고 있으면 1.5m 전에 정지해야 하는데 얼굴 정보가 비식별 처리된 학습 데이터로는 이러한 기준 충족이 어렵다는 것이다.
김선희 법무법인 율촌 변호사도 "테슬라는 주행 중에 학습이 필요한 엣지 데이터가 발생하면 원본 데이터를 본사 서버로 보내 개선하면서 안정성이 높아졌다"고 언급하며 데이터의 양과 질의 중요성을 강조했다. 테슬라는 이미 유통된 200만대 이상의 차량을 통해 현실데이터를 꾸준히 학습하고 있다.
하지만 개인정보위는 "자율주행산업 경쟁력 강화를 위해 제도적 변경이 필요하다는 점에 공감한다"면서도 "실증 특례 신청 시 원본 데이터 사용이 가능하니 우선 샌드박스 규제를 이용해달라"는 입장을 밝혔다.
개인정보위는 소비자들의 개인정보를 보호하면서도 국내 기업들의 기술 개발을 활성화할 수 있는 제도와 방안을 추가로 마련한다는 계획이다.
한편 염흥렬 순천향대 정보보호학과 교수는 28일 "기술 발전을 위한 유연한 규제 적용도 필요하지만 개인정보보호에 대한 최소한의 신뢰와 안전장치가 확보돼야 한다"며 "프라이버시에 대한 소비자 신뢰가 경쟁력으로도 이어진다"고 말했다.
염 교수는 "인간 개입 없이 기계가 직접 처리하는 온디바이스 방식 외에 제 3자에게 정보를 제공하는 클라우드 방식은 개인정보 침해 소지가 있다"며 "기술이 개인의 권리를 크게 침해하지 않는 방향으로 발전해야 한다"고 조언했다.
Copyright © 이코노믹데일리, 무단전재·재배포 금지