全文檢索技術簡介
- 在一些大型門戶網站、電子商務網站等都需要站內搜索功能,使用傳統的數據庫查詢方式實現搜索無法滿足一些高級的搜索需求,比如:搜索速度要快、搜索結果按相關度排序、搜索內容格式不固定等,這里就需要使用全文檢索技術實現搜索功能。
為什么使用Solr?
- 單獨使用Lucene實現站內搜索需要開發的工作量較大,主要表現在:索引維護、索引性能優化、搜索性能優化等,因此不建議采用。
- 通過第三方搜索引擎提供的接口實現站內搜索,這樣和第三方引擎系統依賴緊密,不方便擴展,不建議采用。
- 基于Solr實現站內搜索擴展性較好并且可以減少程序員的工作量,因為Solr提供了較為完備的搜索引擎解決方案,因此在門戶、論壇等系統中常用此方案。
簡介
- Solr是Apache下的一個頂級開源項目,采用Java開發,它是基于Lucene的全文搜索服務器。Solr提供了比Lucene更為豐富的查詢語言,同時實現了可配置、可擴展,并對索引、搜索性能進行了優化。
- Solr可以獨立運行,運行在Jetty、Tomcat等這些Servlet容器中,Solr索引的實現方法很簡單,用 POST 方法向Solr服務器 發送一個描述
Field 及其內容的XML文檔,Solr根據xml文檔添加、刪除、更新索引。Solr搜索只需要發送HTTP GET 請求,然后對 Solr 返回Xml、Json等格式的查詢結果進行解析,組織頁面布局。Solr不提供構建UI的功能,Solr提供了一個管理界面,通過管理界面可以查詢Solr的配置和運行情況。