추경 예산으로 확보한 4991억원 투입
AI 데이터 축적과 활용에 대규모 인력 투입
   


[미디어펜=권가림 기자] 정부가 디지털 뉴딜의 대표 과제인 ‘데이터 댐’ 프로젝트에 본격적으로 뛰어든다.

과학기술정보통신부는 ‘데이터 댐’ 프로젝트의 7대 핵심사업들을 수행할 주요기업 등의 선정 작업을 마무리하고 본 사업을 추진한다고 2일 밝혔다.

7대 핵심사업은 △인공지능(AI) 학습용 데이터 구축 △AI 바우처와 △AI데이터 가공바우처 사업 △AI융합 프로젝트(AI+X) △클라우드 플래그십 프로젝트 △클라우드 이용바우처 사업 △빅데이터 플랫폼 및 센터 구축 등이다.

민간기업을 중심으로 관계부처와 각 분야 공공기관이 함께 참여한 역대 최대 규모인 총 4739개 기업·기관(주관 2549개, 참여 2190개)의 지원 속에서 최종 총 2103개 수행기관(주관 1335개, 참여 768개)을 데이터 댐 사업의 첫 해 지원 대상으로 확정했다.

가장 많은 비용(2925억원) 투입하는 AI 학습용 데이터 구축사업은 시장수요가 높은 과제를 발굴하기 위해 민간수요, 공공수요, 해외 공개데이터 등 총 1250개 후보과제에 대해 제조사(삼성전자, LG전자), 통신사(SK텔레콤, KT), 포털사(네이버, 카카오) 등 활용기업 평가와 전문가로 구성된 과제기획위원회의 검증을 통해 10대 분야(자연어, 헬스케어, 자율주행, 농축수산, 국토환경, 안전, 미디어, 제조, 지역경제, 등) 150종의 데이터를 선정했다. 유사한 데이터를 그룹화해 72개 그룹과제를 최종 도출했다.

총 1920개 기업·기관이 신청해 평균 4.2대 1의 높은 경쟁률을 기록했고 총 584개 기업·기관(주관기관 72개, 참여기관 512개)을 최종 선정했다. 주요 AI 개발 전문기업, 크라우드소싱 기업 등은 물론 서울대학교, 한국과학기술연구원(KAIST) 등 37개 대학산학협력단과 서울대병원, 국립암센터 등 21개 주요병원 등 분야별 전문기업·기관이 대거 참여했다.

한국어 말뭉치, 농작물 병해충 이미지, 암질환 영상 등 텍스트 7억건, 음성 6만시간, 이미지 6000만건, 영상 1만5000시간 등 대규모 데이터를 구축한다.

상반기 모집에 325개 기업이 지원하며 24대 1의 높은 경쟁률을 보인 AI 바우처 사업은 폭발적인 시장수요에 대응하기 위해 하반기 560억원 규모로 추경사업을 통해 추가 모집을 진행했다.
총 475개 과제에 733개 기업이 지원 17개 분야에서 최종 209개 과제(209개 수요기업, 155개 공급기업)를 선정했다.

중소기업과 스타트업 등이 보유한 데이터를 AI학습용 데이터로 전환시켜 혁신적인 AI서비스 개발을 지원하는 AI데이터 가공바우처 지원사업은 489억원을 투입한다. 2020년은 2019년(471개)보다 AI가공바우처 신청기업이 2076개로 크게 늘었다.

   
▲ 데이터댐 7개 사업 연계 구상도. /사진=과기부 제공

또 2019년 AI가공바우처 신청 수요기업 중 ICT 분야 외 기업이 41%정도였지만 2020년 추경에서는 84.7%를 차지하며 AI개발 수요가 다양한 산업 분야로 빠르게 확산되는 모습을 보였다.

각 분야에서 수집·축적된 데이터의 안전한 학습과 AI 개발 및 활용을 지원하는 AI 융합 프로젝트(AI+X)는 2020년에는 의료·국방·에너지·시설물 관리 등 경제적 파급효과와 국민 체감도가 큰 8개 분야 프로젝트를 추진한다. 군 의료 지원, 감염병 대응, 불법 복제품 판독, 지하공동구 관리 등에 282억원을 투입한다.

클라우드 산업 발전전략의 핵심과제 중 하나인 ‘클라우드 플래그십 프로젝트'는 클라우드 인프라 기업을 중심으로 다수(10개 이상)의 클라우드 서비스 기업이 연합해 세계적인 수준의 클라우드 서비스를 협력·개발하는 것을 목표로 한다. 올해는 우선 제조, 물류, 헬스케어, 교육, 비대면 복지 등 5개 산업 분야를 지원하고 오는 2024년까지 매년 신규로 산업분야 5개를 지정해 지원한다.

이번 5개 분야의 과제 공모에는 헬스케어 37개, 교육 29개 등 총 120개 과제가 제안됐다. 중기부 사업과 연계해 추진하는 제조 플랫폼을 제외한 4개의 플랫폼 개발 과제와 63개 서비스 개발 과제를 선정했다. 이번 사업의 플랫폼 개발에는 KT, NBP, NHN 등의 국내 최고의 클라우드 기업이 참여하고 서비스 개발은 모두 중소기업이 주도한다.

클라우드이용바우처 사업도 기존의 기업당 지원금액을 연 300만원에서 2000만원으로 늘렸다. 346개 기업을 1차 지원 대상으로 선정했다. 1차 선정 기업에는 클라우드 기반 업무환경에 익숙하지 않은 제조업 73개, 도매 및 소매업 50개, 보건·사회복지업 15개 등도 포함했다. 9월 중에 수요기업을 추가로 선정하여, 연내 총 600개 이상 기업을 지원할 계획이다.

데이터 탬 핵심 사업중 하나인 빅데이터 플랫폼 및 센터 구축에 이번 추경에서 405억원을 투입한다. 핵심분야의 데이터를 수집·분석·유통하는 5개 플랫폼과 50개 센터를 추가 구축한다. 7월 공모를 통해 14개 컨소시엄이 동 사업에 신청해 2.8대 1의 경쟁률을 보였다. 현재 전문가의 평가와 적정성 검토 작업이 진행 중이다.

   
▲ /사진=과기부 제공

과기정통부는 데이터 간 상호호환성 확보를 위해 데이터의 표준화도 추진한다. 기존 ’데이터 구축 공통 가이드라인‘을 추경사업에 적용하고 자율주행과 의료 등 주요산업별 ’AI 학습용 데이터 표준안‘을 개발해 관계부처 협의를 거쳐 핵심분야를 국내 표준화한다.

품질관리도 강화한다. 양질의 데이터를 구축하기 위해 품질관리 가이드라인 적용, 정량적 품질평가지표 도입해 활용기업이 참여하는 품질평가자문단 운영, 품질평가 전문조직 활용(정보통신기술진흥협회) 등 품질관리 체계를 만들었다. 데이터 가격산정, 품질평가 방법 등을 담은 데이터 거래 원칙과 기준에 대한 가이드라인도 개발한다.

민간 클라우드를 포함한 디지털서비스의 공공부문 조달이 용이하도록 ‘사업공고-입찰-계약’ 방식에서 ‘서비스 검색-이용’ 방식으로 계약제도를 개선하는 ‘디지털서비스 전문계약제도’를 오는 10월 중 시행할 예정이다.

또 과기정통부에 ‘디지털서비스 전문위원회’를 신설해 수요기관이 전문계약 트랙에 따라 계약·이용할 수 있는 디지털서비스를 선정하고 선정한 디지털서비스의 등록부터 계약까지의 전과정을 지원할 수 있도록 전문 유통플랫폼을 구축·운영할 계획이다.

마지막으로 AI분야 법제도 개선 로드맵도 만든다. 아울러 2021년 12월 AI시대의 기본법제인 ‘지능정보화 기본법’이 시행됨에 따라 하위법령을 완비하고 주요국과 국제기구 등의 AI 윤리규범을 비교 분석해 우리나라의 AI 윤리 기준도 정립할 예정이다.

최기영 과기정통부 장관은 "정부의 노력뿐만 아니라 민간의 투자와 참여가 무엇보다 중요한 만큼 법·제도적 인프라 구축도 병행함과 동시에 디지털뉴딜반 운영을 통해 관계부처 등과도 긴밀히 협력해 데이터 댐 관련 프로젝트의 차질없는 시행에 만전을 기하겠다"고 말했다.

강도현 인공지능기반정책관은 "AI학습용데이터 표준화는 디지털 뉴딜반을 중심으로 해서 관계부처 참여해서 보다 세밀하게 내용을 정리할 계획이다"며 "10월 중부터 본격적으로 표준화 작업에 나설도록 하겠다"고 했다. 

[미디어펜=권가림 기자] ▶다른기사보기