유통 빅데이터
텍스트분석용사전 산업별 분류 개체명 사전
소셜 분석 플랫폼을 활용하여 온라인/소셜 Data 수집/분석 후 추출한 명사형 키워드를 산업별 카테고리 및 속성으로 분류 - 수집 기간 : 2011.1~2019.9 - 수집 채널 : 뉴스(258개_우측 도표 참고), SNS(트위터), 카페(네이버,다음,이글루스,티스토리), 블로그(네이버,다음), 게시판(MLBPARK_BULLPAN, Youtube, 네이버 지식인, 네이트톡, 다음 TIP, 디스이즈게임-커뮤니티, 디시인사이드_갤러리, 루리웹_자유게시판, 보배드림, 뷰티쁠, 세티즌, 시코_미니기기게시판, 오늘의유머, 와이고수, 웃긴대학, 인벤_게시판) - 카테고리 및 속성 구분 : 대분류, <산업별> 구분 = 공공/경제·금융/문화·엔터테인먼트/물류·유통/서비스/스포츠/인물/정치/제조/상권/사회이슈/공통키워드 중분류, <분야별> 구분 = 공공 = <중앙행정기관>, <지방자치단체> .... / 경제·금융 = <은행>, <증권>, <카드>... 소분류, <속성별> 구분 = <지방자치단체> = [부산광역시청], [서울특별시청], [경기도청] ... 세부단위, 속성당 세부 키워드 리스트 = [부산광역시청] = 금정구청,기장군청,동래구청,부산강서구청... - 키워드 리스트 가공 방법 : ① 반자동화 *키워드 볼륨 분석 모듈을 활용하여 전체 분석 기간(월 또는 연단위) 대상 상위 1000위 키워드 리스트 추출 ② 상위 1000위 키워드 리스트에서 산업/분야와 연관도 높은 키워드 발췌, 일반 조사(격조사,접속조사,보조사) 또는 중복 발현된 특정 ID/URL 등 불필요 키워드 삭제 등 정제 작업 진행 ③ 유의미 키워드 발췌, 정제된 키워드 리스트에 포털사 분석 주제 검색 시 확인되는 연관어, 원문 내 주요 키워드 신규 추가 작업 *키워드 볼륨 분석 = [모듈명] keyword_vol_proc, 기간별(시,일,주,월)로 키워드를 추출하여 키워드 랭킹 및 빈도를 제공하는 모듈 * 코드표를 참조하여 구매승인 후 개별 화일 전송