靚麗時尚館

位置:首頁 > 健康生活 > 心理

es倒排索引原理

心理5.66K
es倒排索引原理

l原理:建立倒排索引最關鍵的部分就是分詞器。分詞器會對文字內容進行一些特定處理,然後根據處理後的結果再建立倒排索引

主要的處理過程一般如下: 1、character filter:符號過濾,比如hello過濾成hello,I&you過濾成I and you 2、tokenizer:分詞,比如,將hello you and me切分成hello、you、and、me 3、token filter:比如,dogs替換為dog,liked替換為like,Tom 替換為 tom,small 替換為 little等等。 不同分詞器的行為是不同的,Elasticsearch主要內建了以下幾種分詞器:standard analyzer、simple analyzer、whitespace analyzer、language analyzer。

標籤:索引 倒排 es