공유마당 인공지능 원천데이터는 수집 비용과 저작권에 대한 걱정 없이 사용할 수 있는 인공지능 학습용 데이터로, 인공지능 산업계에서 다양하게 활용할 수 있습니다. 한국문화 데이터를 중심으로 현재 12종의 데이터셋을 구축하여 총 7,251,895건의 인공지능 원천데이터를 누구나 자유롭게 이용할 수 있는 공유저작물로 제공하고 있으며, 공유마당 누리집을 통해 손쉽게 다운로드 하실 수 있습니다.

구축성과
2022(6,775,866건 구축)
 : 자율주행 인공지능 원천데이터, 방송 음성 기반 말뭉치 원천데이터 1, 상황별 한국어-영어 대화문 데이터, 일상생활 및 전문용어 수어 영상 데이터

2023(233,007건 구축)
 : 한국형 이미지&텍스트 데이터, 방송 음성 기반 말뭉치 원천데이터 2, 유해 화학물질 영상 데이터, 생활용품 이미지 데이터

2024 (242,986건 구축)
 : 인공지능 원천데이터 태권도 이미지, 조선의 5대 궁궐 및 종묘 건축물의 이미지 데이터, 한국적 웹툰 이미지 데이터, 한국 전통 민화 이미지 데이터

2025(299,714건 구축 예정)
 : 종묘제례악 제례무 일무 동작 데이터, 한국 전통 무술 택견 데이터, K-POP 안무 디지털 혁신을 위한 2D⸱3D 모션 데이터, 한국문화예술(국악) 데이터