통계청 뉴스기반통계검색 주제별이벤트분석지표
공공데이터포털
통계청에서는 경제, 사회 분야와 관련된 주요 뉴스 기사를 수집하여 뉴스기반 통계검색 서비스를 운영하고 있습니다. 주간·일간 단위로 키워드의 등장 빈도 및 관련 동향을 체계적으로 집계하고, 키워드 간 연관성, 뉴스량 추이 등을 시각화된 형태로 제공합니다.본 자료는 뉴스기반 통계검색 서비스 내에서 주제별 키워드 관련 기능을 제공하기 위해 수집된 데이터로, 다양한 뉴스 기사에 포함된 키워드를 주제별로 분류하여 일간 및 주간 단위로 집계·분석한 결과와 함께, 관련 시스템의 작동 이력을 확인할 수 있는 로그자료와 집계 처리 결과가 포함되어 있습니다.
텍스트분석용사전 산업별 분류 개체명 사전
공공데이터포털
소셜 분석 플랫폼을 활용하여 온라인/소셜 Data 수집/분석 후 추출한 명사형 키워드를 산업별 카테고리 및 속성으로 분류 - 수집 기간 : 2011.1~2019.9 - 수집 채널 : 뉴스(258개_우측 도표 참고), SNS(트위터), 카페(네이버,다음,이글루스,티스토리), 블로그(네이버,다음), 게시판(MLBPARK_BULLPAN, Youtube, 네이버 지식인, 네이트톡, 다음 TIP, 디스이즈게임-커뮤니티, 디시인사이드_갤러리, 루리웹_자유게시판, 보배드림, 뷰티쁠, 세티즌, 시코_미니기기게시판, 오늘의유머, 와이고수, 웃긴대학, 인벤_게시판) - 카테고리 및 속성 구분 : 대분류, <산업별> 구분 = 공공/경제·금융/문화·엔터테인먼트/물류·유통/서비스/스포츠/인물/정치/제조/상권/사회이슈/공통키워드 중분류, <분야별> 구분 = 공공 = <중앙행정기관>, <지방자치단체> .... / 경제·금융 = <은행>, <증권>, <카드>... 소분류, <속성별> 구분 = <지방자치단체> = [부산광역시청], [서울특별시청], [경기도청] ... 세부단위, 속성당 세부 키워드 리스트 = [부산광역시청] = 금정구청,기장군청,동래구청,부산강서구청... - 키워드 리스트 가공 방법 : ① 반자동화 *키워드 볼륨 분석 모듈을 활용하여 전체 분석 기간(월 또는 연단위) 대상 상위 1000위 키워드 리스트 추출 ② 상위 1000위 키워드 리스트에서 산업/분야와 연관도 높은 키워드 발췌, 일반 조사(격조사,접속조사,보조사) 또는 중복 발현된 특정 ID/URL 등 불필요 키워드 삭제 등 정제 작업 진행 ③ 유의미 키워드 발췌, 정제된 키워드 리스트에 포털사 분석 주제 검색 시 확인되는 연관어, 원문 내 주요 키워드 신규 추가 작업 *키워드 볼륨 분석 = [모듈명] keyword_vol_proc, 기간별(시,일,주,월)로 키워드를 추출하여 키워드 랭킹 및 빈도를 제공하는 모듈 * 코드표를 참조하여 구매승인 후 개별 화일 전송
통계청 통계분류포털 게시판 첨부파일 속성
공공데이터포털
통계분류포털은 통계청에서 국제표준분류를 기준으로 작성하는 산업, 직업 ,질병·사인분류 등 한국통계분류에 대하여 소개하고 분류코드 검색등의 관련 정보를 공유하는 사이트입니다. 경제, 사회, 보건분류 등 통계분류에 대한 정보를 검색하고 상담센터를 운영하여 분류 관련 민원을 효율적으로 처리할 수 있도록 지원하며, 통계분류 제·개정 업무처리 시 의견수렴 기능을 활용합니다. 통계분류포털에 업로드되는 첨부파일의 속성에 대한 데이터로 첨부파일ID, 생성일시, 사용여부 등의 항목을 제공합니다.