ngram-heatmap2

텍스트 데이터 종류 대부분 텍스트 데이터, 기타 통계 데이터 ex) 홈페이지 분류체계, FAQ, Q&A, VOC, 콜센터 상담이력, 채팅 스크립트 등등 주택금융공사 데이터를 이용한 분석 케이스 (크롤링)– 홈페이지의 FAQ 데이터 홈페이지에서 쉽게 접근 가능 크롤링을 통해 수집이 가능, 외부에서 원하는 형태로 가공하고 Continue Reading …

ngram-heatmap

1-2. 변수 설정, 여기만 수정하고 계속 shift + enter 1. ngram 1,1 로 하면 단순 단어 워드카운트 2. 히트맵에 들어갈 단어 수 설정 3. 링크타고 들어가서 원하는 색상 옵션으로 변경 4. mecab, twitter 둘 중에 골라서 사용     https://nbviewer.jupyter.org/gist/wwwhihaho/6f336311672f9407a9614a038c128df7

Markov Chain 으로 랜덤 문장 생성

1. 패키지 설명 https://github.com/codebox/markov-text This is a Python implementation of a Markov Text Generator. A Markov Text Generator can be used to randomly generate (somewhat) realistic sentences, using words from a source text. Words are joined together in sequence, with each new Continue Reading …