전체메뉴 검색
IT

'역대급' AI 학습용 데이터 개방에 IT업 '환호'

이석훈 기자 2023-05-02 17:48:19

지난해 구축한 인공지능 자료 310종 공개

IT업계 "실제 활용할 만한 데이터 확인"

과학기술정보통신부는 7월 말까지 'AI허브'에 인공지능 학습용 데이터를 순차적으로 공개할 예정이라고 밝혔다. 사진은 이종호 과기정통부 장관 [사진=연합뉴스]

[이코노믹데일리] 과학기술정보통신부(과기정통부)와 한국지능정보사회진흥원이 지난해 구축한 인공지능(AI) 학습용 데이터 세트 310종을 차례대로 개방한다고 밝힌 가운데, 해당 결정에 대한 업계의 관심이 증가하는 모양새다.

2일 과기정통부에 따르면 7월 말까지 'AI허브' 사이트에서 AI 학습용 데이터가 공개될 예정인 것으로 알려졌다. 데이터는 개인정보 비식별화를 거친 경우에만 개방한다는 게 당국 측 설명이다.

이번에 공개할 데이터는 총 15억 건에 달하며, 이는 역대 최대 규모다. 과기정통부는 데이터 구축 분야가 작년부터 제조·로보틱스·교육·금융·스포츠를 포함한 14개로 증가했기 때문이라고 분석했다.

이어 1차적으로 개방되는 데이터는 고서(古書) 속 한자와 한글의 광학 인식 데이터와 실내외 군중 특성 데이터, 소방대원 행동 모션 3차원(3D) 객체 데이터 등 자연어와 AI 비전 분야의 데이터 70종이라고 밝혔다.

정보통신업계는 과기정통부와 한국지능정보사회진흥원의 정보 공개가 AI 산업 성장에 긍정적인 영향을 미칠 것이라고 기대하고 있다. 

익명을 요청한 한 중소업체 관계자는 "AI 학습용으로 활용해 볼 만한 데이터가 있는 것으로 보인다"며 "내부적인 테스트를 진행해 도입 방안을 검토할 예정"이라고 전했다.

일각에서는 당국이 학습데이터의 중요성을 인식한 것에 큰 의미가 있다는 반응도 나왔다. 오정섭 테바소프트 대표는 "과기정통부에서 인공지능 학습데이터의 중요성을 인식하고 실질적으로 데이터를 만들어 공개하는 건 IT산업에서 굉장히 감사한 일"이라며 "심리상담과 관련한 데이터가 보완된다면 업계 발전에 큰 도움이 될 것이다"고 말했다.

한편, 과기정통부는 지난해 데이터 190종을 개방하면서 AI허브 연간 방문자 수가 최초로 100만명을 넘어섰다고 밝혔다.

엄열 인공지능정책관은 "기존의 라벨링 데이터 중심의 사업을 개편해 초거대 AI 학습에 필요한 대규모 비라벨링 데이터와 한 번에 여러 가지 유형을 학습시킬 수 있는 다중 임무형 라벨링 데이터 등 다양한 유형의 데이터를 확보할 예정"이라고 덧붙였다.

0개의 댓글
0 / 300
댓글을 삭제 하시겠습니까?
닫기
로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?
닫기
기사 이미지 확대 보기
닫기