mongodb 深入學習筆記
mongodb基本知識
mongodb是介于關系型數據庫與非關系型數據庫之間的NoSQL,是最像關系型數據庫的產品。
- mongodb支持的查詢語言非常強大,幾乎可實現類似關系型數據庫單表的大部分功能查詢,且還可創建索引。
- mongodb是面向集合的(collection oriented),模式自由(schema free)的文檔型數據庫。
- 文件存儲格式BSON: Binary Serialized dOcument Notation.
- mongodb服務端默認端口是27107
- mongodb是一個可移植的數據庫,是一系列與磁盤有關系的物理文件所組成的。
- mongodb默認的數據目錄是/data/db,它負責存儲所有的MongoDB的數據文件。
mondodb的每個數據庫都包含一個.sn文件和一些數據文件,且這些數據文件會隨著數據量的增加越來越多,如有個foo數據庫,那么在這個數據庫中就會有 foo.sn, foo.1,foo.2等這些文件存在。
- 可以通過“show dbs” 命令顯出所有數據庫的列表,“db”命令顯示當前數據庫對象或集合;“use XXXX”表示連接到一個指定的數據庫(XXXX)。
mongodb的邏輯結構
mongodb是一種層次結構,由文檔(document),集合(collection),數據庫(database)組成。
- mongodb的文檔相當于關系型數據庫里的一行記錄;
- 多個文檔組合成一個集合相當于關系型數據庫里的表;
- 多個集合邏輯上組織在一起,就是數據庫。
- 一個mongodb實例可支持多個數據庫database。
mongodb與關系型數據庫對比:
MongoDB | 關系型數據庫 |
---|---|
文檔(document) | 行(row) |
集合(collection) | 表(table) |
數據庫(database) | 數據庫(database) |
mongodb內部有預分配空間的機制,保證在數據量激增的情況下磁盤壓力過大的問題。
mongodb文檔里的_id
- 存儲在集合中的每個文檔里都會有一默認生成的主鍵_id值,默認是ObjectID數據類型,我們也可以根據實際情況對其進行設置的,但在同個集合中_id值是必須保持唯一的
mongodb命令&操作
- 創建數據庫:use DATABASE_NAME,如果數據庫不存在, 剛創建數據庫, 否則切換到指定數據庫。
- 刪除數據庫, db.dropDatabase(),刪除當前數據庫。
- 查看所有集合,show collections,顯示當前數據庫中的集合。
- 刪除集合, db.collection.drop(), 刪除集合。
- 插入文檔,insert()方法向集合中插入文檔,db.COLLECTION_NAME.insert(document),。插入文檔也可以用db.collect_name.save(document)命令,如果不指定_id字段,save()方法類似于insert()方法;如果有指定_id字段,則會更新該_id的數據。
- 更新文檔,用update()與save(),
db.collection.update(<query>, <update>, {upsert: <boolean>, multi:<boolean>, writeConcern: <document>})
參數說明:
query : update的查詢條件,類似sql update查詢內where后面的。
update : update的對象和一些更新的操作符(如$,$inc...)等,也可以理解為sql update查詢內set后面的
upsert : 可選,這個參數的意思是,如果不存在update的記錄,是否插入objNew,true為插入,默認是false,不插入。
multi : 可選,mongodb 默認是false,只更新找到的第一條記錄,如果這個參數為true,就把按條件查出來多條記錄全部更新。
writeConcern :可選,拋出異常的級別。
db.collection.save(<document>, {writeConcern:<document>})
參數說明
document: 文檔數據
writeConcern:可選,拋出異常的級別
- 刪除文檔,db.collection.remove(<query>, {justOne: <boolean>, writeConcern:<document>})
參數說明
query:可選,刪除的文檔的條件
justOne : (可選)如果設為 true 或1,則只刪除一個文檔。
writeConcern :(可選)拋出異常的級別。
- 文檔查詢, db.collection.find(), 可以通過pretty()使得查詢出來的結果排版好看點;db.collection.findOne()只返回一條記錄。
MongoDB與關系型數據庫where語句對比
操作 | 格式 | 范例 | RDBMS句型 |
---|---|---|---|
等于 | {<key>:<value>} | db.col.find({"id":"wills"}).pretty() | where id="wills" |
不等于 | {<key>: {$ne:<value>}} | db.col.find({"id":{$ne:"wills"}}).pretty() | where id!="wills" |
大于 | {<key>:{$gt:<value>}} | db.col.find({"id":{$gt:"wills"}}) | where id > "wills" |
大于等于 | {<key>:{$gte:<value>}} | db.col.find({"id":{$gte:"wills"}}).pretty() | where id>="wills" |
小于 | {<key>: {$lt:<value>}} | db.col.find({"id":{$lt:"wills"}}).pretty() | where id<"wills" |
小等于 | {<key>:{$lte:<value>}} | db.col.find({"id":{$lte:"wills"}}) | where id <= "wills" |
大于且小于 | {<key>:{$lt:<value>,$gt:<value>}} | db.col.find({"id":{$lt:100,$gt:50}}) | where id>50 and id<100 |
MongoDB里的一些條件查詢
- AND
db.col.find({key1:value1, key2:value2}).pretty()
- OR
db.col.find({$or: [{key1: value1}, {key2:value2} ] } ).pretty()
- AND與OR一起用
db.col.find({key1: {$gt:value}, $or: [{key2: value},{key3:value}]}).pretty()
- limit(n)
db.col.find().pretty().limit(n) 返回n條查詢到的數據
- skip(n)
db.col.find().skip(n),跳過n條數據開始查詢返回
- sort();
db.col.find().sort({key1:1,key2:-1}) ,1表示升序,-1表示降序
- ensureIndex() 索引,索引是特殊的數據結構,索引存儲在一個易于遍歷讀取的數據集合中,索引是對數據庫表中一列或多列的值進行排序的一種結構。
db.col.ensureIndex({KEY:1}) Key 值為你要創建的索引字段,1為指定按升序創建索引,如果你想按降序來創建索引指定為-1即可。
參數 | 類型 | 描述 |
---|---|---|
backgrounp | boolean | 建索引過程會阻塞其它數據庫操作,默認值false |
unique | boolean | 建立的索引是否唯一,默認false |
name | string | 索引名字 |
dropDups | boolean | 建立唯一索引時是否刪除重復記錄,指定 true 創建唯一索引。默認值為 false |
sparse | boolean | 對文檔中不存在的字段數據不啟用索引;這個參數需要特別注意,如果設置為true的話,在索引字段中不會查詢出不包含對應字段的文檔.。默認值為 false. |
expireAfterSeconds | integer | 指定一個以秒為單位的數值,完成 TTL設定,設定集合的生存時間 |
v | index version | 索引版本號 |
weight | document | 索引權重值,數值在 1 到 99,999 之間,表示該索引相對于其他索引字段的得分權重 |
default_language | string | 對于文本索引,該參數決定了停用詞及詞干和詞器的規則的列表。 默認為英語 |
language_override | string | 對于文本索引,該參數指定了包含在文檔中的字段名,語言覆蓋默認的language,默認值為 language |
MongoDB 聚合
MongoDB中聚合(aggregate)主要用于處理數據(統計平均值,求和等),并返回計算后的數據結果,類似sql語句中的count(*)。
db.col.aggregate(options)
參數 | 描述 | 實例 |
---|---|---|
$sum | 求和 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) |
$avg | 平均值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}]) |
$min | 獲取集合中所有文檔對應值得最小值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}]) |
$max | 獲取集合中所有文檔對應值得最大值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}]) |
$push | 在結果文檔中插入值到一個數組中 | db.col.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) |
$addToSet | 在結果文檔中插入值到一個數組中,但不創建副本 | db.col.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) |
$first | 根據資源文檔的排序獲取第一個文檔數據 | db.col.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) |
$$last | 根據資源文檔的排序獲取最后一個文檔數據 | db.col.aggregate([{$group : {_id : "$by_user", first_url : {$last : "$url"}}}]) |
管道的概念
管道在Unix和Linux中一般用于將當前命令的輸出結果作為下一個命令的參數。
MongoDB的聚合管道將MongoDB文檔在一個管道處理完畢后將結果傳遞給下一個管道處理。管道操作是可以重復的。
表達式:處理輸入文檔并輸出。表達式是無狀態的,只能用于計算當前聚合管道的文檔,不能處理其它的文檔。
這里我們介紹一下聚合框架中常用的幾個操作:
- $project:修改輸入文檔的結構。可以用來重命名、增加或刪除域,也可以用于創建計算結果以及嵌套文檔。
- $match:用于過濾數據,只輸出符合條件的文檔。$match使用MongoDB的標準查詢操作。
- $limit:用來限制MongoDB聚合管道返回的文檔數。
- $skip:在聚合管道中跳過指定數量的文檔,并返回余下的文檔。
- $unwind:將文檔中的某一個數組類型字段拆分成多條,每條包含數組中的一個值。
- $group:將集合中的文檔分組,可用于統計結果。
- $sort:將輸入文檔排序后輸出。
- $geoNear:輸出接近某一地理位置的有序文檔。
db.articles.aggregate( [ { $match : { score : { $gt : 70, $lte : 90 } } },{ $group: { _id: null, count: { $sum: 1 } } }] ); $match用于獲取分數大于70小于或等于90記錄,然后將符合條件的記錄送到下一階段$group管道操作符進行處理