데이터셋 상세
AI 허브
커뮤니케이션북스(주) - 문학작품 낭송․낭독 음성 데이터(시, 소설, 희곡, 시나리오)
인간의 감정이 가장 풍부하게 드러난 문학 작품을 성우, 배우와 같은 감정 표현 전문가들이 낭독한 AI 합성용 음성 데이터이다. 시 장르가 131.5시간, 희곡/시나리오 166시간, 소설 159시간으로 총 456.6시간을 구축하였다.
연관 데이터
국립국어원 - 감성 분석 말뭉치 2020
공공데이터포털
(버전 1.0) 작성자의 주관성이 드러나는 감성 표현을 대상으로 감성 분석 정보를 부착한 말뭉치입니다.
국립국어원 - 비출판물 말뭉치
공공데이터포털
(버전 1.2) 개인적 글쓰기 자료(시, 일기, 편지, 감상문 등)로 구성된 말뭉치입니다.
국립국어원 - 구어 말뭉치
공공데이터포털
(버전 1.2) 방송, 강연 등의 공적 구어 자료, 드라마 대본 등의 준구어 자료로 구성된 말뭉치입니다.
국립국어원 - 메신저 말뭉치
공공데이터포털
(버전 2.0) 두 명 이상의 대화 참여자가 메신저로 나눈 대화 자료로 구성된 말뭉치입니다.
국립국어원 - 일상 대화 음성 말뭉치 2021
공공데이터포털
(버전 1.1) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
국립국어원 - 일상 대화 음성 말뭉치 2022
공공데이터포털
(버전 1.0) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
국립국어원 - 일상 대화 음성 말뭉치 2024
공공데이터포털
(버전 1.0) 일상 대화의 음성(PCM 파일)과 전사 자료로 구성된 말뭉치입니다.
국립국어원 - 구문 분석 말뭉치 2024
공공데이터포털
(버전 1.0) 문장의 구문 구조를 분석해 의존 관계 표지를 부착한 말뭉치입니다.
국립국어원 - 온라인 대화 말뭉치 2021
공공데이터포털
(버전 1.1) 두 명 이상의 대화 참여자가 온라인 공간에서 주고받은 대화 자료로 구성된 말뭉치입니다.
국립국어원 - 국어 역사 자료 말뭉치 2024
공공데이터포털
(버전 1.0) 17~19세기 쓰여진 언간(한글편지) 자료와 20세기 초 신소설, 판소리계 사설, 사전류 등 32종의 원시 말뭉치입니다.