본문 바로가기

개발/IR_ML_NLP17

검색개론 http://web.skhu.ac.kr/~mckim1/Lecture/IR/contents.htm https://www.google.co.kr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0ahUKEwi6-4bW0vDQAhUFNJQKHRLWAPMQFggeMAA&url=http%3A%2F%2Farchie.tistory.com%2Fattachment%2Fgk190000000000.pdf&usg=AFQjCNH53F--8eZaNLnym-KQJYpPLgy4Mg&sig2=JXqiKIrDLLrW-vigKrfzdA 2016. 12. 13.
elasticsearch vs solr https://sematext.com/blog/2015/01/30/solr-elasticsearch-comparison/ 엘라스틱서치가 좀더 modern 한 요구사항들을 구현하고, large volume 에 적합하고,돈없고 시간없고 쉽게 적용하는데 좋단다. 솔라는 뭔가 많이 개발되어있고, 커뮤니티도 크고 지금도 활발하게 발전하고 있는 중이지만, 텍스트 검색엔진에 맞춰 개발했고 ... 어쩌고 저쩌고 ... 시간내서 정독해바야겠다. 그런데, 대부분의 글들에서 일단 엘라스틱 서치의 손을 들어주는듯 ... 2016. 12. 2.
아리랑 형태소 분석기에서 형태소 정보 추출 형태소 분석결과 클래스 AnalysisOutput 에서 stem, pos 가져오기 public static class _MORPH { private String stem; private char pos; public _MORPH() { // TODO Auto-generated constructor stub } public _MORPH(String stem, char pos) { this.stem = stem; this.pos = pos; } public String getStem() { return stem; } public void setStem(String stem) { this.stem = stem; } public char getPos() { return pos; } public void setP.. 2016. 8. 2.
Penn treebank Tagset https://gist.github.com/nlothian/9240750 Clause LevelS - simple declarative clause, i.e. one that is not introduced by a (possible empty) subordinating conjunction or a wh-word and that does not exhibit subject-verb inversion. SBAR - Clause introduced by a (possibly empty) subordinating conjunction. SBARQ - Direct question introduced by a wh-word or a wh-phrase. Indirect questions and relative c.. 2016. 7. 28.