하이거

판교핫뉴스1

'21년 인공지능 학습용 데이터 구축사업 공모

하이거 2021. 3. 11. 13:43

'21년 인공지능 학습용 데이터 구축사업 공모

 

작성일 2021-03-11 부서 인공지능데이터팀 2021-03-11

 


전 분야 지능화 혁신의 밑거름,
인공지능 학습용 데이터 구축 사업 공모
- 헬스케어, 재난·안전 등 6대 분야 130종 지정과제와 지역·자유과제 20종 공모
- 크라우드소싱 방식을 통해 국민 누구나 데이터 구축에 참여 가능

□ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 인공지능(AI) 개발에 필수적인 양질의 인공지능 학습용 데이터를 대규모로 구축·개방하는 ‘인공지능 학습용 데이터 사업’ 공모를 3월 12일(금)부터 시작한다고 밝혔다.

ㅇ 동 사업은 기업, 연구자, 개인 등이 시간 및 비용 문제*로 개별 구축하기 어려운 인공지능 학습용 데이터를 대규모로(’25년까지 1,300종) 구축하여 AI허브(www.aihub.or.kr)를 통해 개방하는 사업으로,

* 인공지능 학습용 데이터 구축 과정(수집·가공·검수)은 대부분 대규모의 반복 수작업이 수반되어, 인공지능 개발 프로젝트의 80%를 차지

ㅇ 그간(’17년~’20년) 한국어(음성·자연어), 헬스케어 등의 분야에서 총 191종의 데이터를 구축*하였고, ’21년에는 150종의 인공지능 학습용 데이터를 추가 구축할 예정이다.

* ’20년 구축 데이터 170종은 품질검증 후 ‘21년 상반기 중 순차적으로 개방할 예정
□ ’21년 구축되는 인공지능 학습용 데이터 150종은 6대 핵심분야* 지정 공모과제 130종과 자유 공모과제 20종(지역 과제 10종**, 자유 과제 10종***)으로 구성된다.

* ➀음성·자연어, ➁비전(영상·이미지), ➂헬스케어, ➃교통·물류, ➄농·축·수산, ➅ 재난·안전·환경
** 컨소시엄 구성 시 지자체 참여 필수
*** 6대 핵심분야별(각 1종) 자유과제 6종, 6대 핵심분야 外 4종

ㅇ 지정과제의 선정을 위해 분야별 산·학·연 전문가로 구성된 과제기획위원회에서 산업·기술 전망 분석을 토대로 6대 핵심 분야를 선정하고,

- 민간·공공을 아우르는 광범위한 수요조사를 실시(’20.10~11월)한 결과 발굴된 891개(민간 751개, 공공 140개)의 데이터 수요를 바탕으로 분야별 전문가 및 활용기업의 검토와 온라인 의견 수렴 등을 거쳐 130개의 지정 공모과제를 확정하였다.

ㅇ 이번 사업을 통해 구축되는 인공지능 학습용 데이터는 언어·시각지능 등 인공지능 선도 기술의 경쟁력을 확보하고, 자율주행자동차 등 산업 분야의 혁신과 국민 건강·안전 증진 등 국민의 삶에 밀접한 인공지능 서비스 개발을 뒷받침할 수 있을 것으로 보인다.

□ 과기정통부는 2,925억원의 대규모 예산이 투입되는 동 사업을 통해 인공지능 산업 발전의 기반을 구축함과 동시에, 지속되는 코로나발 일자리 위기의 충격을 완화하는 것을 목표로 하고 있다.

ㅇ 이를 위해 수행기관의 직접고용을 의무화(1억원당 2.4명 이상)하고, 데이터 구축 과정에 국민 누구나 참여할 수 있는 크라우드소싱 방식을 적극적으로 도입하도록 관련 예산비중을 선정평가에 반영한다.

- 또한, 수행기관의 크라우드소싱 참여인력 교육 등 성장지원 방안을 평가에 반영하여 참여인력의 경력개발 및 안정적 고용을 유도할 방침이다.

ㅇ 과기정통부는 동 사업 데이터 구축에 참여하고자 하는 국민들이 과제별 크라우드소싱 플랫폼의 일자리 정보를 한 곳에서 확인할 수 있도록 AI 허브 홈페이지(www.aihub.or.kr)에 제공할 예정이다.
□ 본 사업 공모와 관련된 상세한 안내는 과학기술정보통신부 홈페이지(www.msit.go.kr)와 한국지능정보사회진흥원 홈페이지(https://www.nia.or.kr)에 공지되며, 참여를 원하는 기관·기업은 과제별로 컨소시엄을 구성하여 지원하면 된다.




붙임 : ’21년 인공지능 학습용 데이터 지정 공모과제 데이터 목록

붙임 ‘21년도 인공지능 학습용 데이터 지정 공모과제 데이터 목록

□ 음성·자연어 분야(32종)

번호 데이터명 주요 내용
1 방송 콘텐츠 대화체 음성인식 데이터 방송 콘텐츠(예. TV방송, UCC 등)를 기반으로 실제 발화 환경(예. 노이즈, 다화자 발화 등)에서 다양한 주제의 자연스러운 음색의 대화 및 발화 음성 데이터
2 주요 영역별 회의 음성인식 데이터 다양한 도메인(예. 공공, 의료, ICT, 바이오 등)에서 실제 업무 회의 데이터를 기반으로 한 자연스러운 회의 상황 음성과 전문 분야별 전문 용어 데이터
3 화자 인식용 음성 데이터 화자 음성인식 고도화를 위한 다양한 화자의 음색 및 발화 패턴 데이터
4 한영 혼합 인식 다국어 혼합 음성인식 고도화를 위한 데이터로 일상 대화에서 한국어-외래어 혼합 문장표현, 발화 음성 데이터
데이터
5 저음질 전화망 음성인식 데이터 인공지능 고객센터 등에서 음성인식 고도화를 위한 8khz 이하의 저음질 전화망 통화 음성 데이터
6 소음 환경 음성인식 데이터 공사장, 전철, 키오스크 매장, 거리 등 소음환경에서 발성된 음성, 소음 정보 및 주변환경 데이터
7 립리딩(입모양) 음성인식 성능 향상을 위해 발화에 대응하는 립리딩(Lip reading) 영상과 음성을 쌍으로 구축하는 데이터
음성인식 데이터
8 한국어 아동 음성 데이터 아동의 실제 발화 및 대화 음성 데이터
9 학습용 아동 영어 음성 데이터 인공지능 영어 튜터 개발을 위한 아동의 영어교재 낭독 음성 발화 및 영어 대화 음성 데이터
10 구음장애 음성인식 데이터 구음장애 범주에 해당하는 증상을 가진 사람의 구어체 발화 음성 데이터
11 다화자 음성합성 데이터 동일 의미의 한,영,중 문장 셋 발화 음성 데이터
12 감성 및 발화 스타일별 음성합성 데이터 자연스러운 일상 대화 음성합성을 위해 다양한 발화 스타일과 감정을 포함한 음성 데이터
13 한-영 및 한-중 동일 의미의 한,영,중 문장 셋 발화 음성 데이터
음성발화 데이터
14 음성 및 모션 합성 데이터 발화 음성합성 뿐 아니라 발화 시 모션을 함께 합성할 수 있도록 발화 영상에서의 음성데이터와 발화자 모션을 가공한 데이터
15 다화자 가창 데이터 AI 작곡, AI가수(singer) 기술 개발을 위해 음의 높낮이, 장단 등을 표현한 다양한 장르의 가창 데이터
16 행정 문서 대상 다양한 분야의 문서에서 텍스트 정보뿐 아니라 비텍스트 정보(예. 테이블, 그래프, 이미지 등)도 질의-응답 형태로 가공하여 구축한 복합 정보 QA 데이터
기계독해 데이터
17 뉴스 기사 뉴스 기사 본문을 대상으로 Simple Facts, Explainable Facts로 구성된 질의-응답 데이터
기계독해 데이터
18 비디오 네러티브 질의응답 데이터 영상 이해 및 요약 서비스 개발을 위한 이미지 기반 질의-응답 데이터로 동영상 상황에 대한 설명(narrative) 및 질의-응답 데이터
19 법률 텍스트 분석 데이터 리걸테크(Legal-Tech) 기술 개발 및 산업 활성화를 위한 판례문, 법령, 공정거래약관 분석 데이터
20 주제별 텍스트 다양한 주제별 일상대화에 대해 주제, 화행, 의존성 등을 레이블링한 데이터
일상 대화 데이터
21 용도별 목적대화 데이터 박물관, 대형 쇼핑몰 등 현장 안내 자동화 및 고객 편의 향상을 위한 목적 대화 데이터로 업종, 용도, 안내 방법별 다양한 상황을 고려한 텍스트 및 음성 데이터
22 자연어 요약문 및 레포트 생성 데이터 실생활에서 많이 접하는 문서(예. 상품평, 자소서, 레포트, 이메일, 회의록, 초단편소설 등) 대상 추상적 요약문 생성 데이터
23 방송 콘텐츠 대본 요약 데이터 다양한 장르의 방송 콘텐츠(예. 드라마, 영화, 스포츠 중계, 예능 방송 등)를 대상으로 장면, 행동별 대본 기반의 요약 데이터
24 에세이 글 평가 데이터 논술, 에세이 등 글쓰기 품질과 수준을 평가하는 모델 구축을 위한 에세이 및 평가 데이터
25 일상생활 및 구어체 한-영 번역 병렬 말뭉치 은어, 약어 등이 포함된 비표준 텍스트의 영어-한국어 말뭉치 데이터
26 기술과학 분야 한-영 병렬 말뭉치 기술과학분야(인공지능, 빅데이터, ICT, 의학, 특허)의 외국어-한국어 말뭉치 데이터
27 구어체 번역 병렬 말뭉치 다수 화자의 대화 위주의 문장으로 구성된 말뭉치로, 기반 데이터를 한국어와 다국어로 설정한 말뭉치(예. 한국어, 중국어, 영어, 불어, 독어, 스페인어 등)
28 대규모 구매도서 기반 한국어 말뭉치 저작권 문제가 해결된 도서 내용을 활용한 말뭉치
29 대규모 웹데이터 기반 한국어 말뭉치 범용 용어 및 고유명사가 레이블링 된 정제된 대규모 웹 데이터
30 온라인 구어체 대중 상호교류 및 비대면 분야(예. 행정, 관광, 의료, K-Pop 대중문화, 금융, 스포츠 등) 위주의 다양한 한국어 구어체 말뭉치
말뭉치
31 문장에 표현된 사회적 편향성이 포함된 내용의 다양한 형식(게시글, 댓글, 대화체 등)의 텍스트 데이터
편향 정보 데이터
32 특허 분야 특허정보 분석을 위해 산업, 경제별 분류, 특허 문서에 기술된 전문 용어가 태깅된 특허 문서
자동분류 데이터
□ 비전 분야(30종)

번호 데이터명 주요 내용
1 일상생활 영상 데이터 사람의 일상생활 및 행동 라이프로그, 일일 활동 자동 요약, VR/AR/MR 기술에 활용 가능한 영상 데이터
2 안구 및 홍채 움직임 영상 데이터 AR, VR 기술 고도화 등을 위해 다양한 설정(거리, 응시방향, 깜빡임 등)에 기반하여 구축한 다양한 인구집단의 안구 및 홍채 움직임 영상 데이터
3 마스크 착용 한국인 안면 이미지 데이터 마스크 착용 등으로 가려진 안면 부위 추정 기술개발에 활용될 수 있는 RGB 및 IR 카메라로 촬영된 안면 이미지 데이터
4 눈, 비, 안개 등의 다양한 외부 환경 노이즈 제거 데이터 영상 품질 향상을 위해 다양한 외부 환경 요인(예. 기상변화, 조도 등)에서 촬영된 영상 데이터
5 스케치, 아이콘 인식용 다양한 AI 비전 인식이 어려운 다양한 형태의 추상적인 이미지(예. 픽토그램, 아이콘, 이모티콘, 에니메이션, 스케치 등 카메라로 촬영하지 않은 이미지) 데이터
추상이미지데이터
6 Small object detection을 위한 이미지 데이터 정밀한 객체 검출을 위해 이미지에서 작은 객체들을 가공하는 데이터로 원천데이터의 1/20 이하의 해상도로 촬영된 객체 데이터
7 장애물에 가려진 물체 형상 추정 데이터 물체 식별을 방해하는 장애물 이면의 물체의 모양을 유추하여 형상을 복원하는 기술 개발을 위한 객체 데이터
8 동영상 콘텐츠 하이라이트 편집 및 설명(요약) 데이터 자동 동영상 요약 기술 고도화를 위해 동영상 콘텐츠에서 추출된 하이라이트 클립, 전체 스토리라인, 추출된 하이라이트 영상에 대한 설명이 결합된 복합 데이터
9 스포츠 영상 데이터(야구) 야구 스포츠 영상 분석을 위한 영상 내 주요 객체 (사람 -움직임, 선수 식별, 도구-공, 배트-, 기타 환경) 및 행동 데이터
10 스포츠 영상 데이터(배구) 배구 스포츠 영상 분석을 위한 영상 내 주요 객체 (사람 -움직임, 선수 식별, 도구-공, 배트-, 기타 환경) 및 행동 데이터
11 스포츠 영상 데이터(격투스포츠) 격투 스포츠 영상 분석을 위한 영상 내 주요 행동
(타격 위주의 격투 스포츠: 태권도, 무에타이, 킥복싱 등) 및 행동 데이터
12 한국 도시 3차원 영상 데이터 도시 스케일에서 밀집도 높은 3차원 포인트 클라우드 데이터와 segmentation 데이터
13 차량 외관 영상 데이터 동일 차종에 대해 연식/컬러/트림 등이 다른 차량을 전체 차량 외관이 다 보이도록 다양한 시점에서 촬영한 영상 데이터
14 Inpainting 자동화를 위한 영상 데이터 배경과 객체 분리, 및 인페인팅 등의 영상· 이미지 전처리 기술 개발을 위한 픽셀 단위의 세그멘테이션 가공 데이터
15 가족 관계가 알려진 얼굴 영상 데이터 가족 구성원이 2인 이상 포함되어있는 안면 이미지와 가족 관계에 대한 정보 데이터
16 실생활 투명 객체 3D 데이터 객체 비전 인식 고도화를 위해 투명 및 불투명 이미지를 쌍으로 구축한 투명 객체 3D 이미지 데이터
17 대용랑 3D 객체 데이터 MS-COCO와 같은 대용량 이미지 데이터의 3D 버전으로 광범위한 카테고리의 이미지와 객체 정보 및 3D 라벨링 데이터
18 실내 공간 3D 종합 데이터 로봇 주행, 건축 조감도 렌더링, 게임 등 실내 공간 정보를 활용한 기술개발을 위해 다양한 한국의 실내 환경에 대한 특성을 반영한 3D 영상 데이터
19 언어 기반 이미지 편집 데이터 편집을 원하는 이미지와 명령어, 편집 완료 이미지 데이터
20 페르소나 기반 가상 인물 몽타주 데이터 몽타주 자동생성기술, 초상화 자동생성기술 개발 등을 위한 페르소나*, 몽타주 스케치, 실제인물사진을 함께 구축한 복합 데이터
21 다양한 장르의 춤사위 동작과 배경 음악 데이터 발레, 일반댄스, 현대 무용 등 춤사위 행동 패턴을 인식하는 기술 개발에 필요한 춤사위 행동 영상 데이터 및 음악 정보 데이터
22 대용량 손글씨 OCR 데이터 한글·한자·영어 등 다양한 카테고리의 대용량 손글씨 이미지 데이터
23 금융업 특화 문서 OCR 데이터 금융업에서 주로 사용하는 문서를 카테고리화(예. 송장, 세금계산서, 매매보고서, 유가증권 등)하고, 개인정보 비식별화를 한 다양한 금융업 특화 문서 OCR 데이터
24 고서 한자 인식 OCR 데이터 문서체, 손글씨 등 다양한 표현 포함한 고서 한자 인식을 위한 OCR 데이터
25 수식, 도형, 제스쳐 필기 OCR 데이터 문서체, 손글씨 등 다양한 표현 포함한 데이터로 수학, 과학 등에 사용되는 수식, 도형, 제스처 ( O,X, 돼지꼬리 등 ) OCR 데이터
26 의약품, 화장품 패키징 OCR 데이터 성분표, 제품명, 복용량, 유통기한, 사용법 등 의약품, 화장품 패키징에 도출된 정보 문자 OCR 데이터
27 Ego-Vision 관점의 2D, 3D 손 움직임 데이터 손의 자세, 객체 간 상호작용, 객체 인지 등 다양한 형태의 손 행동 분류 및 인지 데이터
28 반려동물 질병진단을 위한 영상 데이터 (복부) 동물 복부 질병진단 목적으로 촬영된 수의영상들을 판독을 도울 수 있는 주요 복부 촬영 DICOM 데이터
29 반려동물 질병진단을 위한 영상 데이터 (흉부) 동물 흉부 질병진단 목적으로 촬영된 수의영상들을 판독을 도울 수 있는 주요 흉부 촬영 DICOM 데이터
30 반려동물 질병진단을 위한 영상 데이터 (근골격계) 동물 근골격계 질병진단 목적으로 촬영된 수의영상들을 판독을 도울 수 있는 주요 근골격계 촬영 DICOM 데이터
□ 헬스케어 분야(21종)
번호 데이터명 주요 내용
1 심장질환 진단을 위한 심초음파 데이터 심장 질환 진단을 위한 심초음파 영상 및 임상정보 결합 데이터
2 심장질환 진단을 위한 심전도 데이터 심장 질환 진단을 위한 심전도 데이터(예. 2D 이미지, 디지털 signal 데이터 등) 및 임상정보 결합 데이터
3 파킨슨병 진단을 위한 멀티모달리티 데이터 퇴행성 뇌질환의 주요 질환인 파킨슨병의 진단 및 치료를 위한 멀티모달 데이터
4 소화기조직 병리검사 이미지 데이터 소화기 질환의 진단에 사용되는 내시경 조직검사 디지털 병리 이미지 데이터
5 후두질환 판독을 위한 후두 내시경 데이터 후두암의 선별 진단을 위한 후두 내시경 이미지
6 소아청소년 피부질환 이미지 데이터 소아 청소년의 대표적 피부질환(예. 여드름, 습진, 감염성 피부질환, 선천성 피부질환 등)이 레이블링된 이미지 데이터
7 뇌전이암 진단 및 치료 영상 데이터 뇌전이암 진단, 치료과정, 추적관찰 과정에서 획득한 영상 데이터
8 핵의학영상 (PET) 이미지 데이터 PET (Positron emission tomography) 핵의학 영상을 이용한 진단, 치료과정, 추적관찰 과정에서 획득한 영상 데이터
9 고해상도 분자조직 이미지 데이터 조직 내 개별 세포 단위로 정밀진단할 수 있게 하는 고해상도 세포 조직 이미지 데이터
10 근골격계 질환자 운동훈련 동영상 데이터 근골격계 환자 재활 운동 훈련의 처방과 수행도 및 정확도 측정을 위한 재활 운동 훈련 표준 동영상 데이터 및 센서 데이터
11 족부질환 및 재활경과 판단을 위한 보행 동영상 데이터 족부질환 진단 및 평가 치료에 활용 가능한 멀티모달리티 데이터
12 체액 내 세포검사 이미지 데이터 다양한 질환의 검진 또는 암 진단을 위해 시행하는 체액으로부터 검출된 세포 검사의 진단 정보 데이터
13 수면장애 진단을 위한 적외선 수면 동영상 데이터 수면 자세 및 움직임 등을 관찰하는 적외선 수면 영상 데이터
14 측면두부규격방사선 치열 및 악골의 부정교합질환 의료이미지 (두부규격방사선사진, 파노라마 등의 의료영상)의 분석, 판독 진단 등을 결합한 데이터
사진(cephalography) 데이터
15 당뇨병 및 합병증 추적관찰 임상 데이터 당뇨병을 포함한 만성 대사 질환의 환자 데이터로 당뇨병 초기(전당뇨 포함)부터 장기간의 관찰기간 중 다양한 의료정보를 포함한 주요 합병증 발생 여부 결합 데이터
16 음성질환 판별을 위한 음성 데이터 음성 질환별로 치료 경과에 따라 녹음된 WAV파일 형태의 음성 데이터
17 통증치료 및 경과관찰을 위한 멀티모달리티 데이터 임상적으로 널리 활용되는 통증 진단 및 평가에 사용되는 멀티 모달리티 데이터
18 소아 흉부 이미지 데이터 소아를 대상으로한 복수 의료기관의 대용량 흉부 영상 데이터
19 단계별 욕창 환부 이미지 데이터 욕창의 단계별, 신체 부위별로 촬영된 이미지(wide field image) 및 경과 결합 데이터
20 임신중 태아 초음파 영상 데이터 임신 주수별, 태아의 각 신체 부위가 어노테이션 된 초음파 영상 데이터
21 퇴행성 척추질환 진단 및 치료를 위한 멀티모달 데이터 각종 퇴행성 척추 질환 진단 및 치료에 대한 멀티 모달리티 이미지 데이터
□ 교통·물류 분야(13종)

번호 데이터명 주요 내용
1 강건한(Robust) 융합 센서 객체 인식 자율주행 데이터 자율 주행 객체 인식 모델 고도화를 위한 영상과 융합센서(라이다, 레이더, 근접 센서 등) 기반의 3D 데이터
2 특이 도로 환경 주행데이터 특이 도로 환경(예. 오르막길, 내리막길, 도로병합, 도로유실구간, 터널 등)에서 정적·동적 객체를 인식을 위한 주행 영상 과 다중 센서 데이터로 특이도로 정보와 객체 정보를 포함
3 다양한 기상 상황 주행 데이터 폭우, 폭설, 흐린 날씨 등 열악한 기상 상황에서 정적·동적 객체 인식성능 향상을 위한 주행 영상 데이터
4 주행 차량 관점의 특수 차량 형상 데이터 특수 목적용 차량(건설기계 차량 등) 인식 및 특수차량의 주행 데이터
5 도로 로드마크 인식 위한 주행 영상 데이터 자율 주행 차량의 도로 환경 인식고도화를 위한 차량 관점의 로드마크(예. 좌회전, 우회전, 유턴, 서행, 정지, 합류 안내선, 컬러 로드마크 등) 주행 영상 데이터
6 주차 공간 탐색을 위한 차량 관점 복합 데이터 주행 가능 영역(도로, 노면), 주차 공간 탐색과 주행 및 주차 환경 인식(주변 차량 인식 등) 모델 개발을 위한 차량 관점의 라이다·영상 복합 데이터
7 차량 내 탑승자 상황 인식 영상 데이터 운전자를 포함한 차량 내 탑승자(조수석, 뒷자석 탑승자 포함) 행동, 차량 내 상황 인식 등을 위한 센서 및 영상 데이터(예. 탑승자 이상행동, 건강상태, 좌석점유상황 등)
8 드론 자율항법을 위한 영상 및 센서 데이터(SLAM Data) 다양한 비행 환경(시간, 장소, 비행유형, 고도 등)에서 획득된 비행 영상 및 이착륙 영상 데이터
9 교차로 신호 체계, 보행자, 차량 이동 복합 데이터 스마트 교차로 기술 개발을 위한 다양한 형태의 교차로에의 신호 체계 데이터와 차량 이동 및 보행자 움직임 영상이 연동된 복합 데이터
10 교통 수(手)신호 패턴 영상 데이터 교통경찰의 제스처와 같은 수신호, 지시봉 등과 같은 수신호 체계를 이용한 운행 유무를 자율적으로 판단하기 위한 데이터
11 차량 과실비 평가를 위한 차량 사고 영상 및 이미지 데이터 차량 교통 사고 발생 시 촬영된 사고 상황, 차량 내외부, 차량 부품 파손 이미지 데이터
12 배송용 로봇 시각 환경 인식을 위한 주행 영상 데이터 배송용 로봇이 도입이 예상되는 공간(예. 아파트 단지 등)에서 측위 데이터 등 주행정보, 주변환경, 공간 내의 다양한 객체를 로봇 시각 관점에서 구축한 영상 데이터
13 커넥티드 항만을 위한 물류 인프라 데이터 항만과 항만 외부 물류자원들과의 연결성을 강화한 커넥티드(Connected) 스마트 항만 구축에 필요한 스마트 컨테이너, 뮬류 인프라 등의 데이터
□ 농·축·수산 분야(15종)

번호 데이터명 주요 내용
1 지능형 스마트팜 통합 데이터(토마토) 토마토 스마트팜 구축에 필요한 통합 데이터로 내외부 환경 정보, 시설정보, 작물의 생육 및 병해충 데이터 등을 포힘힌 센서, 영상 융합 데이터
2 지능형 스마트팜 통합 데이터(파프리카) 파프리카 스마트팜 구축에 필요한 통합 데이터로 내외부 환경 정보, 시설정보, 작물의 생육 및 병해충 데이터 등을 포힘힌 센서, 영상 융합 데이터
3 지능형 수직농장 통합 데이터(딸기류) 딸기류 완전인공광형 수직농장 작기 중 내외부환경, 작물 정보, 주요 생육지표, 설비정보, 수확량(품질등급), 에너지 사용량, 농작업-관리 정보 등 통합 데이터
4 지능형 수직농장 통합 데이터(엽채류) 엽채류 완전인공광형 수직농장 작기 중 내외부환경, 작물 정보, 주요 생육지표, 설비정보, 수확량(품질등급), 에너지 사용량, 농작업-관리 정보 등 통합 데이터
5 정밀농업 노지 작물 영상 및 IoT센서 데이터 온실 및 노지(논, 밭, 과수) 주요작물에 대한 재배환경, 생육 측정 지표 및 촬영 방식(드론, 트랙터 등)별 작물(예. RGB, Depth, Lidar 등) 데이터
6 정밀농업 농기계 잡초 인식 데이터 잡초 식별 방제를 통해 피해를 조기차단하는 정밀농업 구현을 위한 잡초 이미지 및 생리상태 진단 데이터
7 정밀농업 농기계 자율주행 데이터 트렉터 자율 주행을 위한 경작지 내 객체 인식 모델 고도화를 위한 영상과 융합센서(라이다, 레이더, 근접 센서 등) 데이터
8 주요 식물 병 유발환경 및 증상-처방 데이터 주요 식물 병의 발병을 통해 다양한 작기 중 재배 환경 하에서 발생되는 증상, 재배환경, 작물보호제 처리 후 반응조사를 통한 처방 데이터
9 주요 작물 디지털 피노타이핑 데이터 주요 작물 유전자원에 대한 작기 동안의 디지털 피노타이핑(예. 다각도 RGB 영상, 초분광, 엽록소형광, 재배환경, 다수성, 일시 수확형 등 농업 형질 등) 데이터
10 국가 식의약용 주요 작물 유전자원의 각기 다른 지역 재배테스트를 통한 작기 동안의 생육(영상), 재배환경, 농업형질 데이터
자생식물 분석 데이터
11 한우 스마트 축사 통합 데이터 한우 스마트 축사 구축에 필요한 통합 데이터로 축사 환경 및 사육 기자제, 한우 행동 및 질병 정보 등 센서, 영상 융합 데이터
12 양돈 축사환경, 출하 및 유통 통합 데이터 돼지 생태 데이터, 사육 환경 데이터 및 양돈 출하 유통 관리를 위해 사용되는 기기와 시스템 개발에 활용 가능한 데이터
13 수중 양식장 환경 및 뱀장어 개체 영상 데이터 뱀장어 개체의 성장 단계별 생물학적 변화 및 질병 자료, 양식 방법 및 환경정보 데이터
14 굴 개체 촬영 영상 데이터 굴 개체의 생육정보, 양식 방법 및 환경정보 데이터
15 가리비 개체 촬영 영상 데이터 가리비 개체의 생육정보, 양식 방법 및 환경정보 데이터
□ 재난·안전·환경 분야(19종)
번호 데이터명 주요 내용
1 자연재해로 인한 풍수해, 지진 등 자연재해로 인해 발생한 도심지 및 농촌 지역의 생활시설 위험 상태 인지를 위한 영상 데이터
생활시설 안전 데이터
2 태풍 및 홍수로 인한 피해 및 위험 데이터 태풍 및 홍수로 인한 침수지역 시간당 수위변화, 물 색깔 변화, 폐기물 부유, 침수, 오염 등 피해 및 위험 영상 데이터
3 재난안전 정보 재난 정보(재난 문자, 재난 방송 및 날씨 정보 등) 의 수어 변환을 위한 한국어-수어 데이터
접근성을 위한 데이터
4 다중밀집시설 및 주거시설 화재 안전데이터 다중밀집시설 및 주거 지역에 화재 발생 예측 및 피해규모 산정을 위한 영상 데이터
5 산업시설 열화상 산업시설 유형(예. 변전소, 보일러실, 폐열회수실, 엔진실 등)별, 설비 위치별 위험여부를 사전에 알려주기 위한 열화상 CCTV 복합 데이터
CCTV 데이터
6 도로 상태 도로 위 위험물(낙하물 포함), 과적차량에 의한 도로 위 위험사항 등 주행 상 위험 인지를 위한 영상 데이터
위험사항 데이터
7 보행 안전을 위한 도로 시설물(예. 도로, 중앙분리대, 보행로, 가로등, 맨홀 등) 유형별 위험 및 불량 상태 영상 데이터
도로 시설물 데이터
8 개인형 이동장치 안전 데이터 장소 유형별, 개인형 이동장치(예. 전동킥보드, 세그웨이, 자전거, 오토바이 등)별, 위반 및 위험상황별 영상 데이터
9 물류창고 내 작업 안전 데이터 물류창고 내 모든 객체(예. 사람, 지게차, 선반, 물품 등) 인지를 위한 이미지 데이터
10 고소작업 현장 실시간 영상 데이터 고소작업 작업자의 안전을 위한 주변환경 및 작업상황, 작업자의 행동 데이터
11 주거 및 공용 공간 내 이상행동 영상 데이터 공용 공간(엘리베이터, 현관 앞, 계단, 복도 등) 내 이상행동발생 위험 장지를 위한 이상행동 영상 데이터
12 해안 오염물질 데이터 발생 원인 및 쓰레기 유형별(예. 태풍으로 인한 쓰레기, 선박좌초로 인한 기름누출, 그물 등) 다양한 오염물질 영상 데이터
13 토지피복지도 항공위성 이미지 데이터(경상) 경상 지역 환경변화탐지 인공지능기술 개발을 위한 건물, 주차장, 도로, 가로수, 논, 밭, 산림, 나지 8종의 토지이용 항공 및 위성영상 데이터
14 토지피복지도 항공위성 이미지 데이터(전라) 전라 지역 환경변화탐지 인공지능기술 개발을 위한 건물, 주차장, 도로, 가로수, 논, 밭, 산림, 나지 8종의 토지이용 항공 및 위성영상 데이터
15 토지피복지도 항공위성 이미지 데이터(제주도) 제주도 지역 환경변화탐지 인공지능기술 개발을 위한 건물, 주차장, 도로, 가로수, 논, 밭, 산림, 나지 8종의 토지이용 항공 및 위성영상 데이터
16 산림수종 이미지 데이터(경상) 경상 지역의 항공 및 위성 이미지의 산림을 소나무, 낙엽송, 기타 침엽수, 활엽수 등으로 자동 분할된 이미지로 생성하는 인공지능기술 개발을 위한 데이터
17 산림수종 이미지 데이터(전라) 전라 지역의 항공 및 위성 이미지의 산림을 소나무, 낙엽송, 기타 침엽수, 활엽수 등으로 자동 분할된 이미지로 생성하는 인공지능기술 개발을 위한 데이터
18 산림수종 이미지 데이터(제주도) 제주도 지역의 항공 및 위성 이미지의 산림을 소나무, 낙엽송, 기타 침엽수, 활엽수 등으로 자동 분할된 이미지로 생성하는 인공지능기술 개발을 위한 데이터
19 도시 소리 데이터 소음 측정, 소음 발생 관리, 예방 시스템 개발을 위한 도시 소리 및 소음 데이터