본문 바로가기

개발/IR_ML_NLP17

notebook tensorflow ModuleNotFoundError 문제 : tensor 깔고 notebook 에서 바로 사용하면 error 발생 ~ 짜증 and DEEP PPAK 원인 : tensor 가상환경의 jupyter 가 설치되어 있지 않으므로, 계속 기본 환경이 호출되므로 tensor 가 처리 안됨 해결 : 가상환경을 activate 시킨 후, 해당 가상환경에도 jupyter 를 설치해준다. (tensorflow) $ conda install jupyter 출처 : https://stackoverflow.com/questions/39604271/conda-environments-not-showing-up-in-jupyter-notebook The annoying thing is that in your tensorflow environment, you can r.. 2018. 2. 20.
Minimum Edit Distance 해당 동적 프로그래밍의 알고리즘을 정리하면 특정 위치에서의 값을 구하는 방법은 (i) 만약 행과 열에 해당하는 단어가 같다면 왼쪽 위에 해당하는 숫자를 그대로 가져오기(ii) 만약 행과 열에 해당하는 단어가 다르다면 왼쪽, 왼쪽 위, 위쪽에 해당하는 숫자 중 가장 작은 숫자에 1을 더해 가져오기 두 문자가 서로 다를 때 (i) 왼쪽에 1을 더한값을 현재 할당 : 단어 추가(Add)(i) 왼쪽 위에 1을 더한값을 현재 할당 : 단어 편집(Edit)(i) 위쪽에 1을 더한값을 현재 할당 : 단어 삭제(Delete) 가 되는 것입니다. 현재까지는 a와 ab를 비교할 때 a에 b를 더하면 간단하기 때문에 단어 추가(Add)에 해당하고 그렇기 때문에 거리가 1인 것을 이야기할 수 있습니다. 결과적으로 위 사진과 .. 2017. 6. 13.
LCS 알고리즘 [펌] 1. 개요 LCS란 Longest Common Subsequence의 약자로 최장 공통 부분 문자열이다. 우리가 알고 있는 substring과 비교하면 substring은 연속된 부분 문자열이고 subsequence는 연속적이지는 않은 부분 문자열이다. 예로 들어 Iamhungry라는 문자열에서 연속된 부분 문자열인 mhun은 substring이 되고 연속적으로 이어지지는 않았지만 순서는 맞는 mugy는 subsequence가 된다.그러면 LCS는 어디에 쓰일까? 대표적으로 LCS가 쓰이는 곳은 염기서열 유사성 분석이다. 이외에도 음파 단어 검색 및 교정 등에 사용된다. 2. 접근방법(1) - LCS의 길이 구하기 DP(Dynamic Programming)으로 특정 범위까지의 값을 구하고 다른 범위까지의.. 2017. 6. 13.
Stemming vs Lemmatization Stemming usually refers to a crude heuristic process that chops off the ends of words in the hope of achieving this goal correctly most of the time, and often includes the removal of derivational affixes.Lemmatization usually refers to doing things properly with the use of a vocabulary and morphological analysis of words, normally aiming to remove inflectional endings only and to return the base.. 2017. 4. 5.