DSL查詢文檔

1.DSL查詢文檔

elasticsearch的查詢依然是基于JSON風(fēng)格的DSL來實(shí)現(xiàn)的。

1.1.DSL查詢分類

Elasticsearch提供了基于JSON的DSL（Domain Specific Language）來定義查詢。常見的查詢類型包括：

查詢所有：查詢出所有數(shù)據(jù)，一般測試用。例如：match_all
全文檢索（full text）查詢：利用分詞器對用戶輸入內(nèi)容分詞，然后去倒排索引庫中匹配。例如：
- match_query
- multi_match_query
精確查詢：根據(jù)精確詞條值查找數(shù)據(jù)，一般是查找keyword、數(shù)值、日期、boolean等類型字段。例如：
- ids
- range
- term
地理（geo）查詢：根據(jù)經(jīng)緯度查詢。例如：
- geo_distance
- geo_bounding_box
復(fù)合（compound）查詢：復(fù)合查詢可以將上述各種查詢條件組合起來，合并查詢條件。例如：
- bool
- function_score

查詢的語法基本一致：

GET /indexName/_search
{
  "query": {
    "查詢類型": {
      "查詢條件": "條件值"
    }
  }
}

我們以查詢所有為例，其中：

查詢類型為match_all
沒有查詢條件

// 查詢所有
GET /indexName/_search
{
  "query": {
    "match_all": {
    }
  }
}

其它查詢無非就是查詢類型、查詢條件的變化。

1.2.全文檢索查詢

1.2.1.使用場景

全文檢索查詢的基本流程如下：

對用戶搜索的內(nèi)容做分詞，得到詞條
根據(jù)詞條去倒排索引庫中匹配，得到文檔id
根據(jù)文檔id找到文檔，返回給用戶

比較常用的場景包括：

百度輸入框搜索
商城的輸入框搜索

例如百度搜索：

百度搜索場景

因?yàn)槭悄弥~條去匹配，因此參與搜索的字段也必須是可分詞的text類型的字段。

1.2.2.基本語法

常見的全文檢索查詢包括：

match查詢：單字段查詢
multi_match查詢：多字段查詢，任意一個(gè)字段符合條件就算符合查詢條件

match查詢語法如下：

GET /indexName/_search
{
  "query": {
    "match": {
      "FIELD": "TEXT"
    }
  }
}

mulit_match語法如下：

GET /indexName/_search
{
  "query": {
    "multi_match": {
      "query": "TEXT",
      "fields": ["FIELD1", " FIELD12"]
    }
  }
}

1.2.3.示例

match查詢示例：

image.png

multi_match查詢示例：

image.png

可以看到，兩種查詢結(jié)果是一樣的，為什么？

因?yàn)槲覀儗ame、remark值都利用copy_to復(fù)制到了all字段中。因此你根據(jù)三個(gè)字段搜索，和根據(jù)all字段搜索效果當(dāng)然一樣了。

但是，搜索字段越多，對查詢性能影響越大，因此建議采用copy_to，然后單字段查詢的方式。

1.2.4.總結(jié)

match和multi_match的區(qū)別是什么？

match：根據(jù)一個(gè)字段查詢
multi_match：根據(jù)多個(gè)字段查詢，參與查詢字段越多，查詢性能越差

1.3.精準(zhǔn)查詢

精確查詢一般是查找keyword、數(shù)值、日期、boolean等類型字段。所以不會(huì)對搜索條件分詞。常見的有：

term：根據(jù)詞條精確值查詢
range：根據(jù)值的范圍查詢

1.3.1.term查詢

因?yàn)榫_查詢的字段搜是不分詞的字段，因此查詢的條件也必須是不分詞的詞條。查詢時(shí)，用戶輸入的內(nèi)容跟自動(dòng)值完全匹配時(shí)才認(rèn)為符合條件。如果用戶輸入的內(nèi)容過多，反而搜索不到數(shù)據(jù)。

語法說明：

// term查詢
GET /indexName/_search
{
  "query": {
    "term": {
      "FIELD": {
        "value": "VALUE"
      }
    }
  }
}

示例：

當(dāng)我搜索的是精確詞條時(shí)，能正確查詢出結(jié)果：

image.png

但是，當(dāng)我搜索的內(nèi)容不是詞條，而是多個(gè)詞語形成的短語時(shí)，反而搜索不到：

image.png

1.3.2.range查詢

范圍查詢，一般應(yīng)用在對數(shù)值類型做范圍過濾的時(shí)候。比如做價(jià)格范圍過濾。

基本語法：

// range查詢
GET /indexName/_search
{
  "query": {
    "range": {
      "FIELD": {
        "gte": 10, // 這里的gte代表大于等于，gt則代表大于
        "lte": 20 // lte代表小于等于，lt則代表小于
      }
    }
  }
}

示例：

image.png

1.3.3.總結(jié)

精確查詢常見的有哪些？

term查詢：根據(jù)詞條精確匹配，一般搜索keyword類型、數(shù)值類型、布爾類型、日期類型字段
range查詢：根據(jù)數(shù)值范圍查詢，可以是數(shù)值、日期的范圍

1.4.地理坐標(biāo)查詢

所謂的地理坐標(biāo)查詢，其實(shí)就是根據(jù)經(jīng)緯度查詢，官方文檔進(jìn)入

常見的使用場景包括：

微信：發(fā)現(xiàn)選項(xiàng)里的附近
滴滴：搜索我附近的出租車
攜程：搜索我附近的酒店

1.4.1.矩形范圍查詢

矩形范圍查詢，也就是geo_bounding_box查詢，查詢坐標(biāo)落在某個(gè)矩形范圍的所有文檔：

DKV9HZbVS6.gif

查詢時(shí)，需要指定矩形的左上、右下兩個(gè)點(diǎn)的坐標(biāo)，然后畫出一個(gè)矩形，落在該矩形內(nèi)的都是符合條件的點(diǎn)。

語法如下：

// geo_bounding_box查詢
GET /indexName/_search
{
  "query": {
    "geo_bounding_box": {
      "FIELD": {
        "top_left": { // 左上點(diǎn)
          "lat": 31.1,
          "lon": 121.5
        },
        "bottom_right": { // 右下點(diǎn)
          "lat": 30.9,
          "lon": 121.7
        }
      }
    }
  }
}

這種并不符合“附近的人”這樣的需求，所以我們就不做了。

1.4.2.附近查詢

附近查詢，也叫做距離查詢（geo_distance）：查詢到指定中心點(diǎn)小于某個(gè)距離值的所有文檔。

換句話來說，在地圖上找一個(gè)點(diǎn)作為圓心，以指定距離為半徑，畫一個(gè)圓，落在圓內(nèi)的坐標(biāo)都算符合條件：

vZrdKAh19C.gif

語法說明：

// geo_distance 查詢
GET /indexName/_search
{
  "query": {
    "geo_distance": {
      "distance": "15km", // 半徑
      "FIELD": "31.21,121.5" // 圓心
    }
  }
}

1.5.復(fù)合查詢

復(fù)合（compound）查詢：復(fù)合查詢可以將其它簡單查詢組合起來，實(shí)現(xiàn)更復(fù)雜的搜索邏輯。常見的有兩種：

fuction score：算分函數(shù)查詢，可以控制文檔相關(guān)性算分，控制文檔排名
bool query：布爾查詢，利用邏輯關(guān)系組合多個(gè)其它的查詢，實(shí)現(xiàn)復(fù)雜搜索

1.5.1.布爾查詢

布爾查詢是一個(gè)或多個(gè)查詢子句的組合，每一個(gè)子句就是一個(gè)子查詢。子查詢的組合方式有：

must：必須匹配每個(gè)子查詢，類似“與”
should：選擇性匹配子查詢，類似“或”
must_not：必須不匹配，不參與算分，類似“非”
filter：必須匹配，不參與算分

每一個(gè)不同的字段，其查詢的條件、方式都不一樣，必須是多個(gè)不同的查詢，而要組合這些查詢，就必須用bool查詢了。

需要注意的是，搜索時(shí)，參與打分的字段越多，查詢的性能也越差。因此這種多條件查詢時(shí)，建議這樣做：

搜索框的關(guān)鍵字搜索，是全文檢索查詢，使用must查詢，參與算分
其它過濾條件，采用filter查詢。不參與算分

1）語法示例：

GET /haohong/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {"name": "leiyang" }}
      ],
      "should": [
        {"term": {"isMarriott": false}}
      ],
      "must_not": [
        { "range": { "age": { "lte": 18} }}
      ],
      "filter": [
        { "range": {"score": { "gte": 45 } }}
      ]
    }
  }
}

2）小結(jié)

bool查詢有幾種邏輯關(guān)系？

must：必須匹配的條件，可以理解為“與”
should：選擇性匹配的條件，可以理解為“或”
must_not：必須不匹配的條件，不參與打分
filter：必須匹配的條件，不參與打分

2.搜索結(jié)果處理

搜索的結(jié)果可以按照用戶指定的方式去處理或展示。

2.1.排序

elasticsearch默認(rèn)是根據(jù)相關(guān)度算分（_score）來排序，但是也支持自定義方式對搜索結(jié)果排序。可以排序字段類型有：keyword類型、數(shù)值類型、地理坐標(biāo)類型、日期類型等。

2.1.1.普通字段排序

keyword、數(shù)值、日期類型排序的語法基本一致。

語法：

GET /indexName/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "FIELD": "desc"  // 排序字段、排序方式ASC、DESC
    }
  ]
}

排序條件是一個(gè)數(shù)組，也就是可以寫多個(gè)排序條件。按照聲明的順序，當(dāng)?shù)谝粋€(gè)條件相等時(shí)，再按照第二個(gè)條件排序，以此類推

2.2.分頁

elasticsearch 默認(rèn)情況下只返回top10的數(shù)據(jù)。而如果要查詢更多數(shù)據(jù)就需要修改分頁參數(shù)了。elasticsearch中通過修改from、size參數(shù)來控制要返回的分頁結(jié)果：

from：從第幾個(gè)文檔開始
size：總共查詢幾個(gè)文檔

類似于mysql中的limit ?, ?

2.2.1.基本的分頁

分頁的基本語法如下：

GET /hotel/_search
{
  "query": {
    "match_all": {}
  },
  "from": 0, // 分頁開始的位置，默認(rèn)為0
  "size": 10, // 期望獲取的文檔總數(shù)
  "sort": [
    {"price": "asc"}
  ]
}

2.2.2.深度分頁問題

現(xiàn)在，我要查詢990~1000的數(shù)據(jù)，查詢邏輯要這么寫：

GET /hotel/_search
{
  "query": {
    "match_all": {}
  },
  "from": 990, // 分頁開始的位置，默認(rèn)為0
  "size": 10, // 期望獲取的文檔總數(shù)
  "sort": [
    {"price": "asc"}
  ]
}

這里是查詢990開始的數(shù)據(jù)，也就是第990~第1000條數(shù)據(jù)。

不過，elasticsearch內(nèi)部分頁時(shí)，必須先查詢 0~1000條，然后截取其中的990 ~ 1000的這10條：

image-20210721200643029.png

查詢TOP1000，如果es是單點(diǎn)模式，這并無太大影響。

但是elasticsearch將來一定是集群，例如我集群有5個(gè)節(jié)點(diǎn)，我要查詢TOP1000的數(shù)據(jù)，并不是每個(gè)節(jié)點(diǎn)查詢200條就可以了。

因?yàn)楣?jié)點(diǎn)A的TOP200，在另一個(gè)節(jié)點(diǎn)可能排到10000名以外了。

因此要想獲取整個(gè)集群的TOP1000，必須先查詢出每個(gè)節(jié)點(diǎn)的TOP1000，匯總結(jié)果后，重新排名，重新截取TOP1000。

image-20210721201003229.png

那如果我要查詢9900~10000的數(shù)據(jù)呢？是不是要先查詢TOP10000呢？那每個(gè)節(jié)點(diǎn)都要查詢10000條？匯總到內(nèi)存中？

當(dāng)查詢分頁深度較大時(shí)，匯總數(shù)據(jù)過多，對內(nèi)存和CPU會(huì)產(chǎn)生非常大的壓力，因此elasticsearch會(huì)禁止from+ size 超過10000的請求。

針對深度分頁，ES提供了兩種解決方案，官方文檔：

search after：分頁時(shí)需要排序，原理是從上一次的排序值開始，查詢下一頁數(shù)據(jù)。官方推薦使用的方式。
scroll：原理將排序后的文檔id形成快照，保存在內(nèi)存。官方已經(jīng)不推薦使用。

2.2.3.小結(jié)

分頁查詢的常見實(shí)現(xiàn)方案以及優(yōu)缺點(diǎn)：

from + size：
- 優(yōu)點(diǎn)：支持隨機(jī)翻頁
- 缺點(diǎn)：深度分頁問題，默認(rèn)查詢上限（from + size）是10000
- 場景：百度、京東、谷歌、淘寶這樣的隨機(jī)翻頁搜索
after search：
- 優(yōu)點(diǎn)：沒有查詢上限（單次查詢的size不超過10000）
- 缺點(diǎn)：只能向后逐頁查詢，不支持隨機(jī)翻頁
- 場景：沒有隨機(jī)翻頁需求的搜索，例如手機(jī)向下滾動(dòng)翻頁
scroll：
- 優(yōu)點(diǎn)：沒有查詢上限（單次查詢的size不超過10000）
- 缺點(diǎn)：會(huì)有額外內(nèi)存消耗，并且搜索結(jié)果是非實(shí)時(shí)的
- 場景：海量數(shù)據(jù)的獲取和遷移。從ES7.1開始不推薦，建議用 after search方案。

2.3.高亮

2.3.1.高亮原理

什么是高亮顯示呢？

我們在百度，京東搜索時(shí)，關(guān)鍵字會(huì)變成紅色，比較醒目，這叫高亮顯示：

image-20210721202705030.png

高亮顯示的實(shí)現(xiàn)分為兩步：

1）給文檔中的所有關(guān)鍵字都添加一個(gè)標(biāo)簽，例如<em>標(biāo)簽
2）頁面給<em>標(biāo)簽編寫CSS樣式

2.3.2.實(shí)現(xiàn)高亮

高亮的語法：

GET /hotel/_search
{
  "query": {
    "match": {
      "FIELD": "TEXT" // 查詢條件，高亮一定要使用全文檢索查詢
    }
  },
  "highlight": {
    "fields": { // 指定要高亮的字段
      "FIELD": {
        "pre_tags": "<em>",  // 用來標(biāo)記高亮字段的前置標(biāo)簽
        "post_tags": "</em>" // 用來標(biāo)記高亮字段的后置標(biāo)簽
      }
    }
  }
}

注意：

高亮是對關(guān)鍵字高亮，因此搜索條件必須帶有關(guān)鍵字，而不能是范圍這樣的查詢。
默認(rèn)情況下，高亮的字段，必須與搜索指定的字段一致，否則無法高亮
如果要對非搜索字段高亮，則需要添加一個(gè)屬性：required_field_match=false

2.4.總結(jié)

查詢的DSL是一個(gè)大的JSON對象，包含下列屬性：

query：查詢條件
from和size：分頁條件
sort：排序條件
highlight：高亮條件

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,488評論 6贊 531
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,034評論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,327評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,554評論 1贊 307
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 71,337評論 6贊 404
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 54,883評論 1贊 321
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 42,975評論 3贊 439
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,114評論 0贊 286
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 48,625評論 1贊 332
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 40,555評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 42,737評論 1贊 369
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,244評論 5贊 355
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 43,973評論 3贊 345
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,362評論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,615評論 1贊 280
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 51,343評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 47,699評論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

DSL查詢文檔

DSL查詢文檔

1.DSL查詢文檔

1.1.DSL查詢分類

1.2.全文檢索查詢

1.2.1.使用場景

1.2.2.基本語法

1.2.3.示例

1.2.4.總結(jié)

1.3.精準(zhǔn)查詢

1.3.1.term查詢

1.3.2.range查詢

1.3.3.總結(jié)

1.4.地理坐標(biāo)查詢

1.4.1.矩形范圍查詢

1.4.2.附近查詢

1.5.復(fù)合查詢

1.5.1.布爾查詢

1）語法示例：

2）小結(jié)

2.搜索結(jié)果處理

2.1.排序

2.1.1.普通字段排序

2.2.分頁

2.2.1.基本的分頁

2.2.2.深度分頁問題

2.2.3.小結(jié)

2.3.高亮

2.3.1.高亮原理

2.3.2.實(shí)現(xiàn)高亮

2.4.總結(jié)

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

DSL查詢文檔

1.DSL查詢文檔

1.1.DSL查詢分類

1.2.全文檢索查詢

1.2.1.使用場景

1.2.2.基本語法

1.2.3.示例

1.2.4.總結(jié)

1.3.精準(zhǔn)查詢

1.3.1.term查詢

1.3.2.range查詢

1.3.3.總結(jié)

1.4.地理坐標(biāo)查詢

1.4.1.矩形范圍查詢

1.4.2.附近查詢

1.5.復(fù)合查詢

1.5.1.布爾查詢

1）語法示例：

2）小結(jié)

2.搜索結(jié)果處理

2.1.排序

2.1.1.普通字段排序

2.2.分頁

2.2.1.基本的分頁

2.2.2.深度分頁問題

2.2.3.小結(jié)

2.3.高亮

2.3.1.高亮原理

2.3.2.實(shí)現(xiàn)高亮

2.4.總結(jié)

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频