데이터셋 상세
AI 허브
롯데정보통신 - 소상공인 고객 주문 질의-응답 텍스트
무인 상점에서 고객의 질의에 답변 가능한 고객 응대 학습용 AI 텍스트 데이터
연관 데이터
㈜웅진북센 - 대규모 구매도서 기반 한국어 말뭉치 데이터
공공데이터포털
인공지능 학습용 데이터를 수집하고 품질 평가 및 검증을 통하여 고품질의 학습용 데이터를 구축한다
솔트룩스 - 온라인 구어체 말뭉치 데이터
공공데이터포털
온라인 플랫폼(게시판, 댓글 등)에서 구어체 위주의 텍스트 데이터를 수집 후 전사 도구를 활용하여 구축된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
트위그팜 - AI 허브 데이터 활용을 위한 기계 번역앱 구축과 번역기 평가 및 신규 말뭉치 구축
공공데이터포털
• 번역 메모리(TM)로 활용할 AI 허브 공개 데이터의 정제·검수 데이터 • 기계 번역기 성능 향상을 위한 신규 말뭉치를 비롯한 비교 평가 데이터
㈜포티투마루 - 행정 문서 대상 기계독해 데이터
공공데이터포털
행정문서를 활용하여 기계독해 모델 생성을 위한 지문-질문-답변으로 구성된 인공지능 학습 데이터
심심이㈜ - AI응답 결과에 대한 품질 평가 데이터
공공데이터포털
- 요약, 질의 응답, 대화 시스템 평가 등 자연어 생성 테스크를 평가할 수 있는 체계적이고 신뢰할 만한 AI 응답 평가 지표 제시하는 데이터
비큐에이아이 - 문서요약 텍스트
공공데이터포털
AI가 텍스트를 이해하고 핵심내용을 자동으로 요약하는 기술개발을 위한 텍스트 및 요약내용을 생성하는 텍스트 데이터
㈜포티투마루 - 뉴스 기사 기계독해 데이터
공공데이터포털
국내 종합일간지 및 지역신문의 뉴스기사를 지문으로 활용, 자연어 질의 응답으로 이루어진 인공지능 학습 데이터
솔트룩스 - 한국어 방언 발화(제주도)
공공데이터포털
방언(제주도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터
커뮤니케이션북스(주) - 감성 및 발화스타일 동시 고려 음성합성 데이터
공공데이터포털
다양한 감성과 발화스타일을 동시 고려하는 인공지능 기술 개발을 위한 학습용 음성합성 데이터
솔트룩스 - 한국어 방언 발화(전라도)
공공데이터포털
방언(전라도)을 사용하는 일상 대화를 인식, 음성을 문자로 바꾸어주는 방언 발화 음성 데이터