ㅜ
누구나 쉽게 AI 데이터를 받아 활용할 수 있도록 공개
자연스러운 일상대화의 특징이 반영된 AI데이터 4종 구축
No 세부과제명 구축데이터 예산
1 자유대화(일반남여) 4000시간 이상
76억 이내2 자유대화(노인남여) 3000시간 이상
3 자유대화(소아남여, 유아 등 혼합) 3000시간 이상
4 한국인 외래어 발화 4000시간 이상
AI 음성비서 및 스피커 개발을 위한 AI데이터 4종 구축
No 세부과제명 구축데이터 예산
5명령어 데이터(일반남여/
정형‧비정형 포함)4000시간 이상
76억 이내6
명령어 데이터(노인남여/정형‧비정형 포함)
3000시간 이상
7명령어 데이터(소아남여,유아/
정형‧비정형 포함)3000시간 이상
8 차량 내 대화 및 명령어 데이터 3000시간 이상
영상/음성에 대한 자동 자막생성 기술개발을 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
9 한국어 강의 데이터 4000시간 이상
76억 이내10 회의 음성 데이터 3000시간 이상
11 고객 응대 데이터 3000시간 이상
12 상담 음성 데이터 3000시간 이상
비대면 및 열악한 환경의 다양한 소음을 반영한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
13 비대면 환경 대화 데이터 3000시간 이상
57억 이내14 열악한 환경 음성 데이터 4000시간 이상
15 다화자 음성 합성 데이터일반인 70시간,
전문성우 240시간
방언을 사용하는 일상대화 음성 AI데이터 5종 구축
No 세부과제명 구축데이터 예산
16 한국어 방언 발화 데이터(강원도) 3,000시간 이상
95억이내
17 한국어 방언 발화 데이터(경상도) 3,000시간 이상
18 한국어 방언 발화 데이터(전라도) 3,000시간 이상
19 한국어 방언 발화 데이터(제주도) 3,000시간 이상
20 한국어 방언 발화 데이터(충청도) 3,000시간 이상
논문 · 도서 · 대화 요약 텍스트 AI데이터 3종 구축
다양한 분야의 한국어 비정형 텍스트 데이터 AI데이터 4종 구축
No 세부과제명 구축데이터 예산
24 도서자료 기계독해 100만건 이상
76억 이내
25 민원(콜센터) 질의-응답 데이터 질의-응답 100만쌍
26전문분야 말뭉치 데이터(분야별
개체명 인식 포함)150만건 이상
27 한국어 SNS 데이터 200만건 이상
기술 · 사회과학 분야의 한-영 번역 말뭉치 AI데이터 2종 구축
No 세부과제명 구축데이터 예산
28 한국어-영어 1 번역 말뭉치 150만 문장38억 이내
29 한국어-영어 2 번역 말뭉치 150만 문장
No 세부과제명 구축데이터 예산
21 논문자료 요약 데이터 35만건 이상
57억이내22 도서자료 요약 데이터 20만건 이상
23 한국어 대화 요약 데이터 35만건 이상
기술·사회과학·문화 분야의 한-영 번역 말뭉치 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
30 한국어-중국어 번역 말뭉치 1 130만 문장 이상
57억 이내31 한국어-중국어 번역 말뭉치 2 130만 문장 이상
32 한국어-일본어 번역 말뭉치 150만 문장 이상
다양한 형태의 한글 이미지 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
33 야외 실제 촬영 한글 이미지 50만장 이상
57억 이내34다양한 형태의 한글 문자 이미지
인식 데이터50만장 이상
35 공공 행정 문서 OCR 90만장 이상
위암, 대장암 진단을 위한 의료영상 AI데이터 2종 구축
No 세부과제명 구축데이터 예산
36 위암 진단을 위한 의료영상 데이터 30,000건 이상38억 이내
37 대장암 진단을 위한 의료영상 데이터 30,000건 이상
신장암, 전립선암 진단을 위한 의료영상 AI데이터 2종 구축
No 세부과제명 구축데이터 예산
38 신장암 진단을 위한 의료영상 데이터 30,000건 이상38억 이내
39 전립선암 진단을 위한 의료영상 데이터 30,000건 이상
간암, 담낭암, 췌장암 진단을 위한 의료영상 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
40 소화기계 및 신장계암 30,000건 이상
57억 이내41 담낭암 진단을 위한 의료영상 데이터 30,000건 이상
42 췌장암 진단을 위한 의료영상 데이터 30,000건 이상
폐암, 갑상선암, 유방암 진단을 위한 의료영상 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
43 폐암 진단을 위한 의료영상 데이터 30,000건 이상
57억 이내44 갑상선암 진단을 위한 의료영상 데이터 30,000건 이상
45 유방암 진단을 위한 의료영상 데이터 30,000건 이상
뇌혈관 질환, 치매 등 신경계 질환 진단을 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
46 뇌혈관 질환 진단을 위한 의료영상 데이터 20,000건 이상
57억 이내47 치매 진단을 위한 의료영상 데이터 20,000건 이상
48인지기능 장애 진단을 위한 음성/대화
데이터500시간 이상
폐암, 갑상선암, 유방암 진단을 위한 의료영상 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
50피부 질환 진단을 위한 의료영상 데이
터40,000건 이상 19억이내
뇌혈관 질환, 치매 등 신경계질환 진단을 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
51 구강 질환 진단을 위한 의료영상 데이터 8,000건 이상38억이내
52 치과 질환 진단을 위한 의료영상 데이터 40,000건 이상
수면질 평가 및 수면장애 진단을 위한 AI데이터 1종 구축
No 세부과제명 구축데이터 예산
49수면질 평가 및 수면장애 진단을 위한
데이터700만건 이상 19억이내
혈액검사 식별 등 복합 의료 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
53의료영상 혈액검사 결과 식별을
위한 데이터5,000건 이상
57억 이내54 다기관 합성 의료영상 20,000건 이상
55환자 진단 muli-dimensional
데이터10,000건 이상
진료 및 건강 관리를 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
56신경계 질환 관련 임상 및 진료 데이
터15,000건 이상
57억 이내57재활 운동에 활용하기 위한
센서 모션데이터200시간 이상
58 건강관리를 위한 음식 이미지 데이터 300만장 이상
차선/횡단보도 및 신호등/도로표지판 인지영상 AI데이터 4종 구축
No 세부과제명 구축데이터 예산
59 차선/횡단보도 인지 영상(수도권) 300시간,100만장 이상
76억 이내
60차선/횡단보도 인지 영상(광역시,고속도로,국도등)
300시간,100만장 이상
61 신호등/도로표지판 인지 영상(수도권) 300시간,100만장 이상
62신호등/도로표지판 인지영상(광역시,고속도로, 국도 등)
300시간,100만장 이상
주차장애물, 차량, 사람등 동적객체 인지 영상 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
63 주차장애물 인지 영상 300시간,100만장 이상
57억 이내64 주차관련 이동체 인지 영상 300시간,100만장 이상
65 차량,사람 및 영상 인지 영상 300시간,100만장 이상
도로장애물/표면 인지 및 노선주행 이미지 등 AI데이터 4종 구축
No 세부과제명 구축데이터 예산
66 주행 중 건물 촬영 이미지 200만건 이상
76억 이내67 도로장애물/표면 인지 영상(수도권) 300시간, 100만장 이상
68도로장애물/표면 인지 영상(광역시,
고속도로,국도 등)300시간,100만장 이상
69자율주행버스 개발을 위한
노선 주행 이미지300시간,100만장 이상
No 세부과제명 구축데이터 예산
70 드론 이동체 인지 영상(도로고정) 300시간 이상38억 이내
71 드론 이동체 인지 영상(전방 고정) 300시간 이상
드론관점의 비행환경 영상기반의 AI데이터 2종 구축
항만 구조물 영상 AI데이터 1종 구축
No 세부과제명 구축데이터 예산
72 항만 구조물 영상 300만장 이상 19억 이내
농작물 작황 분석, 품질 관리 강화 등을 위한 농업영상 AI데이터4종 구축
No 세부과제명 구축데이터 예산
73 위성/드론 농경작지 촬영 영상 100만개 이상
76억 이내74 농산물 품질(QC)이미지 30만장 이상
75 시설 작물 개체 영상 100만장 이상
76 주요 농작물 생육 이미지 데이터 100만장 이상
시설,노지 작물 등 작물질병해충 진단을 위한 AI데이터 4종 구축
No 세부과제명 구축데이터 예산
77 시설 작물 질병 진단 30만장(원본) 이상
76억 이내78 노지 작물 해충 진단 30만장(원본) 이상
79 노지 작물 질병 진단 30만장(원본) 이상
80 과수화상병 촬영 영상 10만장 이상
No 세부과제명 구축데이터 예산
81 축산물 품질(QC) 이미지 16만장 이상38억 이내
82 가축 행동 영상 300시간 이상
어류 행동 분석, 개체 추척 등을 위한 AI 데이터 2종 구축
No 세부과제명 구축데이터 예산
83 어류 행동 영상 300시간 이상38억 이내
84 어류 개체 촬영 영상 100만장 이상
축산물 품질 관리 강화, 축산 행동 분석 등을 위한 AI데이터 2종 구축
수도권·강원·충청 지역의 환경변화 탐지 및 산림자동 분할 기술개발을 위한 이미지 AI데이터 4종 구축
No 세부과제명 구축데이터 예산
85토지 피복지도 항공위성이미지 데이터(수도권)
5만장 이상
76억 이내86
토지 피복지도 항공위성이미지 데이터(강원 및 충청)
10만장 이상
87 산림수종 이미지 데이터(수도권) 5만장 이상
88 산림수종 이미지 데이터(강원 및 충청) 10만장 이상
전국 단위 수질측정 및 5대 오염원과 산업·생활 폐기물 관리 기술을위한 측정·이미지 AI 데이터 3종 구축
지하공간 시설물 등 다양한 이상상황에 대한 감지 및 열화상·음성·음향 기술 개발을 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
92 상하수도관 공간 및 누수 데이터 50만장 이상
57억 이내93 열화상 카메라데이터(산업단지 등) 100만건 이상
94위급상황 음성.음향 데이터
1,000건 이상의 상황음성/음향 3,500시간
No 세부과제명 구축데이터 예산
89 수질측정 및 오염원 데이터 10만건 이상
57억 이내90 산업 폐기물 이미지 20만장 이상
91생활 폐기물 이미지 8만장 이상
영유아 교육 및 장면인식, 인물인식 등 영상콘텐츠를 활용한 서비스 개발을 위한 AI데이터 3종 구축
사람의 다양한 감정인식과 동영상 컨텐츠 자동요약 기술 개발을 위한 AI데이터 2종 구축
사람의 행동 및 동작과 영상·이미지를 통한 인식기술 개발을 위한AI데이터 3종 구축
No 세부과제명 구축데이터 예산
103 신체 말단 움직임 영상 데이터 150만장 이상
57억 이내104사람 동작 영상 데이터(3D, Multi-person)
2D 이미지 200만장3D 프레임 40만건 이상
105K-POP 안무 영상 데이터
40만 클립500시간 이상
No 세부과제명 구축데이터 예산
101한국인 감정인식을 위한 복합 영상
데이터70만장 이상
38억 이내
102 비디오 요약 영상 데이터 1,000시간 이상
No 세부과제명 구축데이터 예산
98 영유아 교육 영상콘텐츠 방송 데이터 500시간 이상
57억 이내99장면인식‧인물인식을 위한 방송 영상
콘텐츠 데이터500시간 이상
100 영상이해(맥락)기술을 위한 방송 영상콘텐츠 데이터
500시간 이상
야외·소음 등 다양한 환경에서의 영상내 음성 및 글자 인식 기술개발을 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
95야외‧소음 환경 STT를 위한 방송
영상 콘텐츠 데이터5,000시간 이상
(150만 문장 포함)
57억 이내96다중화자 STT를 위한 방송 영상
콘텐츠 데이터5,000시간 이상
(150만 문장 포함)
97 영상내 글자인식(OCR)용 방송 영상데이터
200시간 이상
스포츠 영상 분석을 위한 사람, 공, 심판 등의 행동 분류 기술 개발을 위한 영상 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
106 스포츠 사람 동작 데이터 (골프) 400시간 이상
57억 이내107 스포츠 사람동작 데이터(농구) 100시간 이상
108스포츠 사람동작 데이터(축구) 100시간 이상
산업안전(활주로, 공사현장, 화재) 영상분석 및 식별 기술 개발을위한 AI데이터 3종 구축
CCTV영상을 통한 이상행동 분석 및 예방과 차량 추적 기술 개발을위한 AI데이터 2종 구축
생활안전(도로보행, 이상행동 등) 영상 분석 및 사고 예방 서비스기술 개발을 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
118 1인칭 시점 보행영상 데이터영상 1,000건 이상(총 300시간 이상)
57억 이내119어린이 보호구역 내 어린이 도로보행
위험행동 영상 데이터300시간 이상
120시니어 이상행동 모니터링 데이터 500시간 이상
No 세부과제명 구축데이터 예산
116 CCTV 이상행동 영상 데이터 300시간 이상
38억 이내
117 CCTV 추적 영상 데이터 300시간 이상
No 세부과제명 구축데이터 예산
113항공 활주로 내 이상물체 감지를 위한
객체 데이터300시간 이상
(가공 500만개 이상 )
57억 이내114 공사현장 안전장비 인식 데이터200만장 이상
(가공 1,500만장)
115화재 발생 예측 데이터(연기 동영상) 영상 1500개 이상
교통안전(CCTV, 졸음운전 등) 영상분석 및 식별 기술 개발을 위한AI데이터 4종 구축
No 세부과제명 구축데이터 예산
109교통문제 해결을 위한 CCTV 교통
데이터(고속도로)500시간 이상
76억 이내110
교통문제 해결을 위한 CCTV 교통데이터(시내도로)
500시간 이상
111졸음운전 예방을 위한 운전자 상태
정보(운전자 심박수 등) 영상 데이터400시간 이상
112자동차 차종/연식/번호판 인식용
데이터500시간 이상
국내 시설물안전(건물균열, 노후화 등) 이미지 분석 및 식별 서비스개발을 위한 AI데이터 2종 구축
No 세부과제명 구축데이터 예산
121건물 균열 탐지드론 개발을 위한
이미지50만장 이상
38억
122 노후 시설물 이미지 데이터80만장 이상(2D, 3D)
다양한 종류의 안면인식에 대한 영상·이미지의 분석 및 식별 서비스개발을 위한 AI데이터 2종 구축
No 세부과제명 구축데이터 예산
123 안면인식 데이터(Face in the wild) 40,000개 이상
38억
124Liveness Detection을 위한 영상
데이터21,000개 이상
상품, 고객주문, 화재예측 등의 영상·이미지·텍스트 분석 및 식별을 통한 서비스 개발을 위한 AI데이터 3종 구축
국내 환경에 맞는 로봇 관점의 주행 환경 영상 기반 기술을 위한AI데이터 1종 구축
음식영상·이미지·텍스트를 활용한 맞춤형 서비스 개발을 위한 AI데이터 1종 구축
No 세부과제명 구축데이터 예산
131음식 분류를 위한 음식종류 및 양에
따른 칼로리 데이터셋(재료, 양념, 완제품 등)
80만장 이상 19억이내
No 세부과제명 구축데이터 예산
130 로봇 관점 주행 영상 데이터 500시간 이상 19억 이내
No 세부과제명 구축데이터 예산
128 상품 이미지 데이터24만장 이상
(10,000종류 이상)
38억 이내
129 소상공인 고객 주문 질의응답 데이터 500만건 이상
실내,의류,미디어 등의 영상·이미지 분석 및 식별을 통한 서비스개발을 위한 AI데이터 3종 구축
No 세부과제명 구축데이터 예산
125 실내 라이다 및 카메라 동기화 데이터 300시간 이상
57억 이내126의류 가상 착용 (AR Fitting) 3D
데이터400만장 이상
127 AR/VR 화면정확도 향상을 위한플렌옵틱 카메라 데이터
500시간 이상
반려동물의 영상·이미지·텍스트를 활용한 맞춤형 서비스 개발을위한 AI데이터 1종 구축
No 세부과제명 구축데이터 예산
132반려동물 구분을 위한 동물 영상데이터셋 (종류구분, 행동구분)
500시간 이상 19억 이내
지역(지자체) 수요를 반영한 자유주제 AI 학습용 데이터 총 6종 선정 및 구축
최신 시장 수요 등을 반영한 자유주제 AI 학습용 데이터 총 12종 선정 및 구축
(‘20.7)
(‘20.8)
(‘20.8)
(‘20.8)
(‘20.9~12)
(‘21.1~2)
(‘20.10)
(‘20.12)
한국정보화진흥원 AI데이터추진단
http://www.aihub.or.kr
□ AI 허브(www.aihub.or.kr)
인공지능 학습용 데이터 구축 사업 Q&A 게시판
□ 사업 담당자 연락처
☎ 053-230-4228, 4233, 4240, 4237
E-mail: [email protected]
※ 전화문의가 많아 Q&A 게시판 이용을 권장합니다.
①
②
③
□ 유튜브
유튜브에서 NIA AI HUB 검색
NIA AI HUB 로 검색하세요~ ^^
□ 페이스북 □ 인스타그램