Elasticsearch學習筆記(13) - 再論Term查詢和Full Text查詢

前言

有的時候,我們對查詢有一定的混淆,尤其是Term查詢和Full Text查詢。樓主希望通過這篇文章闡述清楚這兩者的區別。

Term查詢

在前面章節我們已經知道了Term這個單詞的含義,即:表達語意的最小單元,也叫詞項。Term查詢主要包括:Term Query、Range Query、Exists Query、Prefix Query、Wildcard Query。

Term查詢的特點在于,查詢本身對輸入不做分詞。Elasticsearch會將輸入作為一個整體,在倒排索引中查找準確的詞項,然后對查詢結果進行相關度算分。另外,我們還可以通過Constant Score,將查詢轉換成一個Filtering,從而避免算分,且利用緩存來提高性能。

下面,我們舉一個例子。

先創建一個products的索引。

DELETE products
PUT products
{
  "settings": {
    "number_of_shards": 1
  }
}

通過_bulk的api來插入3條記錄

POST /products/_bulk
{ "index": { "_id": 1 }}
{ "productID" : "XHDK-A-1293-#fJ3","desc":"iPhone" }
{ "index": { "_id": 2 }}
{ "productID" : "KDKE-B-9947-#kL5","desc":"iPad" }
{ "index": { "_id": 3 }}
{ "productID" : "JODL-X-1937-#pV7","desc":"MBP" }

對desc字段做term查詢,且iPhone的字母P為大寫。我們發現未查詢到任何結果。

POST /products/_search
{
  "query": {
    "term": {
      "desc": {
        "value": "iPhone"
        //"value":"iphone"
      }
    }
  }
}

我們在對desc字段做term查詢,只是這一次將iphone的字母p更改為小寫。我們發現已經能查詢出第一條結果了。通過這種方式,我們其實已經驗證了我們的定義。

POST /products/_search
{
  "query": {
    "term": {
      "desc": {
        //"value": "iPhone"
        "value":"iphone"
      }
    }
  }
}

另外,如果我們想對desc做精準匹配,有沒有辦法呢?也是有的,就是通過desc的子字段keyword來查詢即可。我們發現,keyword做term查詢的時候,如果傳入值為iPhone,那么可以查詢出結果。如果傳入值為iphone,那么查詢不出結果。

POST /products/_search
{
  "query": {
    "term": {
      "desc.keyword": {
        "value": "iPhone"
        //"value":"iphone"
      }
    }
  }
}

我們再來通過productID來查詢一下。

POST /products/_search
{
  "query": {
    "term": {
      "productID": {
        //"value": "XHDK-A-1293-#fJ3"
        "value": "xhdk-a-1293-#fJ3"
      }
    }
  }
}

我們發現,不管值為XHDK-A-1293-#fJ3,還是轉換為小寫的xhdk-a-1293-#fJ3,都查詢不出結果。這又是為什么呢?原因在于term查詢不會對輸入進行分詞處理。我們通過_analyze來分析看看。

POST /_analyze
{
  "analyzer": "standard",
  "text": "XHDK-A-1293-#fJ3"
}
_analyze結果

我們可以通過下面的方式查詢到結果。

POST /products/_search
{
  "query": {
    "term": {
      "productID": {
        "value": "xhdk"
      }
    }
  }
}

POST /products/_search
{
  "query": {
    "term": {
      "productID.keyword": {
        "value": "XHDK-A-1293-#fJ3"
      }
    }
  }
}

Full Text查詢

包括:Match Query / Match Phrase Query / Query String Query。

其特點如下:

  1. 索引和搜索時都會進行分詞,查詢字符串先傳遞到一個合適的分詞器,然后生成一個供查詢的詞項列表
  2. 查詢的時候,Elasticsearch會先對輸入的查詢進行分詞,然后對每個詞項逐個進行底層的查詢,最終將結果進行合并匯總。同時,Elasticsearch會對每個文檔生成一個相關性分數。例如查詢“Mr zhang”,會查到包括 Mr 或者 zhang 的所有結果。
DELETE groups
PUT groups
{
  "mappings": {
    "properties": {
      "names":{
        "type": "text",
        "position_increment_gap": 0
      }
    }
  }
}

GET groups/_mapping

POST groups/_doc
{
  "names": [ "John Water", "Water Smith"]
}

POST groups/_search
{
  "query": {
    "match_phrase": {
      "names": {
        "query": "Water Water",
        "slop": 100
      }
    }
  }
}

POST groups/_search
{
  "query": {
    "match_phrase": {
      "names": "Water Smith"
    }
  }
}

參考鏈接

總結

通過本文,我們了解了term查詢和Full Text查詢的區別及聯系。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,663評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,125評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,506評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,614評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,402評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,934評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,021評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,168評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,690評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,596評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,784評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,288評論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,027評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,404評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,662評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,398評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,743評論 2 370

推薦閱讀更多精彩內容