# ES 7은 프로덕션모드로 실행하기 위해서 discovery.seed_hosts와 cluster.initial_master_nodes를 지정해야해요.
오래된 글이긴한데, 검색을 하다 보았어요.
https://www.elastic.co/kr/blog/nori-the-official-elasticsearch-plugin-for-korean-language-analysis
왜 썸네일이 김이지...(베이비복스 팬인가...하하하)
관련된 다른 글들을 찾아보니, 일본어 형태소 분석기 엔진에 MeCab 사전을 바탕으로 만들었다고...
일단 ES 최신버전을 받아서 설치를 해봐야지
> wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.7.1.tar.gz
> tar -xvf elasticsearch-6.7.1.tar.gz
> chown -R search:search elasticsearch-6.7.1
> bin/elasticsearch-plugin install analysis-nori
너무 간단해...
추억의 아버지가방에들어갔다 테스트
> curl -X POST http://127.0.0.1:9200/_analyze?pretty -H 'Content-Type: application/json' -d '{
> "analyzer":"nori",
> "text":"아버지가방에들어갔다"
> }'
{
"tokens" : [
{
"token" : "아버지",
"start_offset" : 0,
"end_offset" : 3,
"type" : "word",
"position" : 0
},
{
"token" : "가방",
"start_offset" : 3,
"end_offset" : 5,
"type" : "word",
"position" : 1
},
{
"token" : "들어가",
"start_offset" : 6,
"end_offset" : 9,
"type" : "word",
"position" : 3
}
]
}
> curl -X POST http://127.0.0.1:9200/_analyze?pretty -H 'Content-Type: application/json' -d '{
> "analyzer":"nori",
> "text":"아버지가 방에 들어갔다"
> }'
{
"tokens" : [
{
"token" : "아버지",
"start_offset" : 0,
"end_offset" : 3,
"type" : "word",
"position" : 0
},
{
"token" : "방",
"start_offset" : 5,
"end_offset" : 6,
"type" : "word",
"position" : 2
},
{
"token" : "들어가",
"start_offset" : 8,
"end_offset" : 11,
"type" : "word",
"position" : 4
}
]
}
아버지가 방에 들어간건지 가방에 들어간건지..ㅎㅎ
한글은 띄어쓰기에 따라 뜻이 달라질수 있으니, 요래 복잡한가 봐요.
어쨋든 공식 플러그인 이다 보니, 설치가 너무 간편하네요.
개발모드와 운영모드에 대한건 뭐 동일할테고,
인덱스 생성시 사용자 단어 사전 추가하는건 다른 분들의 글을 찾아보세요.
'서버 > ES' 카테고리의 다른 글
[ElasticSearch] Nori - Index 생성 (0) | 2019.04.26 |
---|---|
[ELK] Tomcat Log 적재 ... 그리고 curator (0) | 2019.04.25 |
[ElasticSearch - Kibana] 설치 For Ubuntu (0) | 2019.04.12 |
[ElasticSearch] 초성 필터링에 대한 고찰 (0) | 2019.04.11 |
[ElasticSearch] 설치 및 은전한닢(ev 6.1.4, pv 6.1.1.1) for Ubuntu (0) | 2019.04.05 |