데이터셋 상세
AI 허브
한국전자기술연구원 - 한국어 대화 데이터셋
주제에 맞는 동영상 (해외 포함)을 참조하여 한국어 및 황에 적절하도록 각색하여 구축 응급상황 데이터: 748개의 멀티턴 대화셋, 단발성으로 4,975 문장 존재, 대화셋 당 3 ~ 12개의 대화 턴으로 구성 오피스 데이터: 10,202개의 멀티턴 대화셋, 대화쌍으로 46,414 셋이 존재, 대화셋 당 1~31개의 대화 턴으로 구성
데이터 정보
연관 데이터
서강대학교 자연어처리 연구실 - 한국어 어체 변환 데이터셋
공공데이터포털
한국어 대화 시스템에서 활용도가 가장 높은 해요체, 합쇼체, 반말체를 대상으로 한국어 문장을 제작, 수집 체계를 마련하고 관련 정보를 레이블링 한국어 문법에 대한 지식을 보유하고 있는 대학원생이 문장을 분석하고 어체 문장을 작성하는 방식으로 수집 의료 도메인 대화 1,940 문장, 일상, 오피스 대화 672 문장을 수집 역-변환 (Back-transfer) 방법으로 어체 변환을 실험을 수행하는 방식으로 데이터 정확성 검증
포티투마루 - 한국어 SNS
공공데이터포털
한국어 구어체 텍스트 기반의 정보검색, 대화분석, 질의응답, 명령어 이해, 언어모델 학습 등의 자연어처리 AI 기술 개발을 위한 한국인의 일상대화 SNS 데이터 구축
경상북도 119신고 출동지령 현황
공공데이터포털
경상북도 내 119신고 출동지령 현황으로 출동소방서, 출동안전센터 지역대, 출동차수, 출동지령일시, 방송성공여부, 방송지령확인일시, 관계자ID, 출동지령서전송성공일시, 방송지령여부 등을 나타냅니다.
한국과학기술정보연구원 과학기술데이터 용어 정보
공공데이터포털
과학기술데이터(저널, 컨퍼런스 등의 논문)에서 추출한 한국어 및 한-영 동의어, 대역어에 대한 정보입니다. 해당 데이터가 보유한 컬럼은 다음과 같습니다. 컬럼명: 분류, 아이디, 용어, 출처, 용어변환, 값, 서브값, 언어
서울특별시 은평구 EBN 정보채널 게시판정보
공공데이터포털
서울시 은평구 인터넷방송에서 구민에게 유익한 생활정보를 제공하는 게시판의 정보입니다.제목, 내용, 조회수, 동영상 경로 등의 정보를 제공합니다.
한국서부발전(주) 재난대응 비상발령 현황
공공데이터포털
한국서부발전 재난대응 비상발령 현황 정보입니다.제공항목은 일자,제목,목적지명,수신지명 데이터를 제공합니다.
국립국어원 - 한국수어 주석 말뭉치 2024
공공데이터포털
(버전 1.0) 2명의 농인이 수어로 대화를 나눈 수어 영상을 한국어로 번역하고 수어 단어를 분절하여 기본 주석을 단 다중 번역 주석 말뭉치입니다.
한국도로교통공단 - 도로교통공단 TBN 한국교통방송 통신원 제보 통계 통신원 제보건수
공공데이터포털
-TBN 한국교통방송 통신원 제보건수 지역별(부산, 광주, 대구, 대전, 경인, 강원, 전북, 울산, 경남, 경북, 제주) 합계입니다.
서울특별시 은평구 EBN 은평뉴스 게시판 정보
공공데이터포털
서울시 은평구 인터넷방송에서 구민에게 다양한 은평의 소식을 제공하는 게시판의 정보입니다. 제목, 내용, 페이지 주소 등의 정보를 제공합니다.
한국도로교통공단 - 도로교통공단 TBN 한국교통방송 교통정보 제공 통계 방송요청
공공데이터포털
-방송요청 지역별(부산, 광주, 대구, 대전, 경인, 강원, 전북, 울산, 경남, 경북, 제주) 통계 현황에 대한 데이터입니다.