[이코노믹데일리] 정부가 대한민국 인공지능(AI) 산업의 체질을 근본적으로 바꾸기 위한 승부수를 던졌다. 기업의 연구·개발(R&D)과 AI 모델 학습에 '연료'가 될 15종의 고가치 공공데이터를 ‘국가중점데이터’로 지정하고 그 빗장을 활짝 열었다.
행정안전부는 29일, '2025년 국가중점데이터 개방 통합착수보고회' 개최를 시작으로 해당 사업에 본격 착수한다고 밝혔다. 이 사업은 새 정부의 핵심 공약인 '기업의 연구·개발 지원을 위한 공공데이터 개방 추진'을 이행하는 첫 단추로 그동안 접근이 어려웠던 양질의 데이터를 민간, 특히 AI 기업들이 자유롭게 활용할 수 있도록 하는 데 초점이 맞춰져 있다.
이번에 개방되는 15개 과제 중 가장 주목받는 분야는 단연 AI 학습용 데이터다. AI 기술의 성패가 양질의 학습 데이터 확보에 달려있다는 것은 이제 상식이다. 정부는 기업들이 데이터 부족으로 겪는 어려움을 해소하기 위해 전략적으로 데이터를 선별했다.
대표적으로 법제처의 '중앙부처 법령해석 및 특별행정심판기관 재결례'는 법률 AI, 즉 리걸테크(LegalTech) 스타트업에겐 가뭄의 단비와 같다. 방대한 법률 문서를 AI에 학습시켜 판례 분석, 법률 자문 등의 서비스를 고도화할 수 있는 길이 열린다.
한국서부발전의 '신재생에너지·발전소 운영 정보'와 국토안전관리원의 '특수교 통합관리계측 데이터' 역시 마찬가지다. 전력 수요 예측, 스마트 그리드 최적화, 교량 등 사회기반시설의 안전 진단 및 수명 예측 AI 개발에 필수적인 자료다.
또한 육아정책연구원 등의 '영유아·아동·청소년 패널데이터'는 사회과학 연구는 물론, 맞춤형 교육 콘텐츠나 복지 정책 시뮬레이션 AI 개발에 결정적인 역할을 할 수 있다. 정부는 이들 데이터를 AI가 직접 읽고 학습할 수 있는 '기계 판독 가능 형태(Machine-Readable Format)'로 가공해 제공, 기업들이 데이터 전처리 과정에 들이는 시간과 비용을 획기적으로 줄여줄 계획이다.
AI 학습용 데이터와 더불어 중소기업과 스타트업의 신규 서비스 개발을 직접적으로 지원할 데이터도 대거 포함됐다. 행정안전부의 '전국 업종별 인허가 정보 및 생활 편의 정보'는 특정 지역의 상권 분석이나 창업 컨설팅 서비스 개발에 곧바로 활용될 수 있다. 여성가족부의 '아이돌봄 지원사업 데이터'는 민간 보육 서비스 매칭 플랫폼이나 관련 상품 개발에 귀중한 기초 자료가 될 것이다.
특히 주목할 점은 개인정보보호와 데이터 활용이라는 두 마리 토끼를 잡기 위한 정부의 노력이다. 행정안전부는 개인정보나 민감정보를 포함한 데이터의 경우 실제 데이터의 통계적 특성은 유지하되 개인을 식별할 수 없도록 인위적으로 생성한 '합성데이터(Synthetic Data)' 방식이나 데이터 원본을 직접 제공하지 않고 진위 여부만 확인해주는 서비스를 통해 안전하게 개방할 방침이다. 이는 데이터 활용의 문턱은 낮추면서도 정보 주체의 권리를 보호하는 균형 잡힌 접근법으로 평가된다.
정부의 이번 조치는 일회성 개방에 그치지 않는다. 행안부는 AI 개발 수요나 기업의 지속적 수요가 큰 데이터를 'AI·고가치 공공데이터 Top 100'으로 선정해 역점 관리하고 순차적으로 개방을 확대해 나갈 계획임을 분명히 했다.
배일권 공공지능데이터국장은 "공공데이터를 중심으로 AI 신산업 성장과 기업 혁신을 견인해 나갈 필요가 있다"며 "정부는 앞으로도 공공데이터 개방을 확대해 기업의 연구·개발 활동과 AI 3대 강국 도약을 뒷받침하겠다"고 강조했다.
한편 정부가 국가 데이터를 단순 기록물이 아닌 미래 산업을 일구는 핵심 생산요소로 인식하고 있음을 보여준다. 이번 국가중점데이터 개방은 대한민국 'AI 고속도로' 구축의 중요한 시작점이 될 전망이다.
Copyright © 이코노믹데일리, 무단전재·재배포 금지