nlp:NER

NER?

개체명 인식이 어려운 이유?

개체명 인식기 학습 및 분석 절차

( 참조 url : http://www.saltlux.com/bigdata/lea.do?menuNumber=1)

  1. 훈련 데이터 준비
    • 문서 수집
    • 대상 문서 분류
    • 개체명 태깅(수작업)
    • 학습 데이터 생성
  2. 학습 모델 생성
    • 학습 데이터 분석
    • 형태소 분석
    • 특성 추출
    • 학습 모델 생성
  3. 학습 모델 적용
    • 분석 문서 전처리
    • 형태소 분석
    • 특성 추출
    • 개체명 태깅
  4. 개체 인식
    • 학습 모델 기반 확률 계산

개체명 인식 지원 패키지

etc.

도메인/목적에 특화되도록 개체명 인식을 정확히 하는 방법

(url : https://wikidocs.net/34156)

해야할 것들

형태소

참고하기 좋은 논문