로그인
데이터검색
데이터맵
공모전
이용안내
통합검색
데이터셋 검색
교육분야 포털 모음
데이터맵
공모전 안내
공모전 공지사항
공모전 참여하기
공모전 수상작
공모전 문의하기
공지사항
자주묻는 질문
자료실
문의하기
데이터 검색
통합검색
데이터셋검색
교육분야 포털 모음
데이터맵
데이터맵
공모전
공모전 공지사항
공모전 참여하기
공모전 수상작
공모전 문의하기
이용안내
자료실
공지사항
문의하기
자주묻는 질문
공모전 수상작
공모전 공지사항
공모전 문의하기
홈
데이터검색
데이터셋 검색
데이터셋 상세
AI 허브
트위그팜 - 한국어-영어 번역 말뭉치(기술과학)
기술과학(인공지능, 빅데이터, IT, SNS, 의학, 특허 등) 분야 등 한-영 번역 정확도가 상대적으로 낮은 분야의 데이터 구축을 통해 AI 기반 번역 기술 개발에 활용할 수 있는 학습 데이터셋을 구축하여 보다 원활한 기술과학 분야 관련 정보 소통 도모
데이터 정보
데이터 포털
AI 허브
META URL
https://www.aihub.or.kr/aihubdata/data/view.do?pageIndex=40&currMenu=115&topMenu=100&srchOptnCnd=OPTNCND001&srchDetailCnd=DETAILCND001&srchOrder=ORDER001&srchPagePer=20&aihubDataSe=data&dataSetSn=124
라이선스
cc-zero
비용
무료
제공기관
수행기관(주관) : 트위그팜
관리부서
데이터
랜딩 페이지
25. [영어 번역 말뭉치 과제] 한국어-영어 번역 말뭉치(기술과학)_0.pdf
025.한국어-영어_번역_말뭉치(기술과학)_데이터 구축 가이드라인.pdf
연관 데이터
트위그팜 - 한국어-영어 번역 말뭉치(사회과학)
공공데이터포털
사회과학(정치, 경제, 금융, 행정, 교육, 법률 등) 분야 등 한-영 번역 정확도가 상대적으로 낮은 분야의 데이터 구축을 통해 AI 기반 번역 기술 개발에 활용할 수 있는 학습 데이터셋을 구축하여 보다 원활한 사회과학 분야 관련 정보 소통 도모
트위그팜 - AI 허브 데이터 활용을 위한 기계 번역앱 구축과 번역기 평가 및 신규 말뭉치 구축
공공데이터포털
• 번역 메모리(TM)로 활용할 AI 허브 공개 데이터의 정제·검수 데이터 • 기계 번역기 성능 향상을 위한 신규 말뭉치를 비롯한 비교 평가 데이터
㈜ 트위그팜 - 기술과학 분야 한-영 번역 병렬 말뭉치 데이터
공공데이터포털
• 신경망 기반 기계 번역기 학습 데이터로 활용하기 위한 한영, 영한 말뭉치 • 기술과학 번역기의 성능 향상을 위한 학습용 데이터
플리토 - 한국어-중국어 번역 말뭉치(기술과학)
공공데이터포털
기술과학(예: 인공지능, 빅데이터, IT, SNS, 의학, 특허 등) 등 한-중 번역 말뭉치
한국외국어대학교 - 한-영 및 한-중 음성발화 데이터
공공데이터포털
다국어 음성 합성을 위한 같은 의미의 한국어-영어/ 한국어-중국어 AI 학습용 데이터 구축
트위그팜 - AI허브 데이터 활용을 위한 기계 번역앱 구축과 번역기 평가 및 신규 말뭉치 구축 (2023)
공공데이터포털
- 번역 메모리(TM)로 활용할 AI허브 공개 데이터의 정제•검수 데이터 - 기계 번역기 성능 향상을 위한 신규 말뭉치를 비롯한 비교 평가 데이터
솔트룩스이노베이션 - 다국어 구어체 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
트위그팜 - 국제 학술대회용 전문분야 한영/영한 통번역 데이터
공공데이터포털
- 한국어와 영어 언어쌍에 대한 양방향 병렬 번역 말뭉치 데이터 - 국제 학술대회에서 활용할 수 있는 전문적 분야의 한영/영한 통번역 데이터
솔트룩스 - 대규모 웹데이터 기반 한국어 말뭉치 데이터
공공데이터포털
웹사이트 기반 (메가뉴스) 대용량의 텍스트 데이터를 수집 후 전사 도구를 활용하여 타이틀, 단락 제목, 본문 텍스트가 구조화된 10억 어절의 말뭉치 요소별(범용용어 및 고유명사) AI 학습 데이터셋
솔트룩스이노베이션 - 일상생활 및 구어체 한-중, 한-일 번역 병렬 말뭉치 데이터
공공데이터포털
범용성 높은 한국어-다국어 간 구어체 번역 말뭉치로써, 데이터 경쟁 시대에서 정부 주도의 인공지능 학습용 데이터로 활용 가능한 데이터로 제공
목록