第六章(關系數據理論)

一、數據關系

關系數據庫可能存在的問題

1.數據冗余(必然存在,但應該盡量少)

2.更新冗余

3.插入冗余

4.刪除冗余


數據依賴(屬性之間以值是否相等體現出來的一種約束關系)

1)函數依賴(給定元組中的一些屬性,可確定另外的屬性必然的取值--一個)

--非平凡的函數依賴:Y依賴于X,Y不包含于X

--平凡函數依賴:Y依賴于X,且Y包含于X

--互相函數依賴:X依賴于Y,Y依賴于X

--完全函數依賴:Y依賴于X,但Y不依賴與X的任意真子集

--部分函數依賴:Y依賴于X,且Y不完全依賴于X

--傳遞函數依賴:Y非平凡依賴于X,且Y與X不是互相函數依賴,Z非平方依賴于Y,則Z對X傳遞依賴

2)多值依賴(給定元組中的一些屬性,可確定另外的屬性可能的取值--一組)

--含義:X, Y, Z三個屬性集之和是屬性集U,多值依賴X->->Y成立當且僅當對R(U)的任一個關系r,r在(X,Z)上的每個值對應一組Y的值,這組值僅決定于X值而與Z值無關。

--平凡的多值依賴(集合屬性中分為兩個真子集):Z=空集

--非平凡的多值依賴:Z≠空集

--對稱性:若Y多值依賴于X,則Z也多值依賴于X

--傳遞性:若Y多值依賴于X,Z多值依賴于Y,則X多值依賴于Z-Y

--若Y依賴于X,則Y也多值依賴于X

碼(一碼定一組)

--候選碼:屬性集合完全函數依賴于候選碼(候選碼是不可分割的主屬性集合,分了就不是候選碼了),主碼是候選碼,候選碼不一定是主碼

--超碼:屬性集合部分函數依賴于超碼

--主屬性:包含在候選碼中的屬性

--非主屬性:不包含在任何候選碼中的屬性

--全碼:整個屬性組都是主碼或者候選碼

--外碼:本關系模式中某個屬性或屬性組是非碼,但這個屬性或者屬性組是另一個關系模式的碼

二、范式(低一級范式關系模式可以通過模式分解轉換成多個高一級的關系模式的集合)

第一范式(1NF):每個分量都是不可分的基本數據項

--意義:關系數據庫的基本要求,防止出現表中表的情況,當然某些時候這也是可以做出讓步的,比如個人表的家庭住址╮(╯▽╰)╭

--設計:每列都是基本數據項,原子數據

第二范式(2NF):若R∈1NF,且每個非主屬性完全函數依賴于任何一個候選碼

--意義:在第一范式的基礎上消除了非主屬性對碼的部分函數依賴,從而減少了數據冗余、更新異常、插入異常和刪除異常

--設計:碼的真子集不是碼

第三范式(3NF):若R∈2NF,且R中不存在非主屬性對碼的傳遞依賴(一般走到這)

--意義:在第二范式的基礎上消除了非主屬性對碼的傳遞依賴,從而減少了數據冗余、更新異常、插入異常和刪除異常

--設計:表中主鍵是唯一碼(或者本表僅僅有兩個碼,且兩碼互為補集)、若外碼存在,則外碼應是其原表的主鍵

BCNF(擴充的第三范式):若R∈1NF,當Y非平凡函數依賴于X時,X必有碼

--意義:第三范式的基礎上消除主屬性對于碼的部分依賴與傳遞函數依賴,減少了刪除異常、插入異常和更新異常

--設計:不同主屬性相互無依賴關系

第四范式(4NF):若R∈1NF,當Y非平凡多值依賴于X時,X必有碼

--意義:屬性之間不允許有非平凡且非函數依賴的多值依賴,減少維護數據一致性的工作

--設計:兩個互補的屬性集合,且都是碼,即全碼,才允許有多對多的關系出現,否則本表只允許一對一的函數依賴關系

第五范式(5NF):將表切割成盡量小的塊,排除所有的冗余(一般不會走到這步)

三、數據依賴的公理系統(Armstrong公理系統)

設U為屬性集總體,F是U上的一組函數依賴,于是有關系模式R<U,F>,對R<U,F>有以下推理規則:

自反律

若Y?X?U,則X→Y為F所蘊含

增廣律

若X→Y為F所蘊含,且Z?U,則X∪Z→Y∪Z為F所蘊含

傳遞律

若X→Y為F所蘊含,且Y→Z為F所蘊含,則X→Z為F所蘊含

合并規則

若X→Y,X→Z,則 X→Y∪Z

分解規則

若X→Y, 且Z?Y,則X→Z

偽傳遞規則

若X→Y,WY→Z,則WX→Z

函數依賴集等價

--若F的函數依賴集閉包=G的函數依賴集閉包,則說F覆蓋G,反之亦可,也可以說F與G等價

閉包(函數依賴集,屬性集)

--函數依賴集的閉包:在關系模式<R,F>中為F所邏輯蘊含的函數依賴的全體稱為F的閉包

--屬性集的閉包:在關系模式<R,F>中,能由F根據Armstrong公理導出的對X函數依賴的所有屬性集的并集稱為X關于函數依賴集F的閉包

Armstrong公理是有效的,完備的:

--有效性:由F出發,根據Armstrong公理推導出來的每一個函數依賴一定在F的閉包中

--完備性:F的函數依賴集的閉包的每個函數依賴,必定可以由F出發根據Armstrong公理推導出來

極小依賴集

--F中任一函數依賴表達式的箭頭右邊只有一個屬性,即是說F中的每個函數依賴都只能決定一個屬性,沒有冗余的被決定屬性

--F中不存在函數依賴X→A使F等價F-{X→A},即是說F中的函數依賴都是不可缺少的,換句話說F中沒有冗余的函數依賴

--F中不存在函數依賴X→A,Z?X,使F-{X→A}∪{Z→A}與F等價,即是說函數依賴表達式的決定因素應該盡可能簡,沒有真子集與其等價,決定因素中無冗余屬性

--總結:對F而言,沒有冗余的函數依賴項,對函數依賴表達式而言,決定因素盡量精簡(有時候決定因素必須為多個屬性,所以只能盡量精簡),被決定因素只有一個屬性。

最小覆蓋(最小函數依賴集)

每個函數依賴集均等價于一個極小函數依賴集F',稱F'為F的最小依賴集

模式分解(屬性是分配的基本單位)

分解后函數關系講不明白,就跳過了,只講判定方法和分解方法

模式分解的意義:

--因為現有的模式可能會存在一些數據增刪改的弊端,需要尋找一種等價的關系模式,使得以上弊端得以解決

無損分解:

--對關系模式分解時,原關系模型下任一合法的關系值在分解之后應能通過自然聯接運算恢復起來,即未丟失信息的分解即無損分解。反之,則稱為有損分解

判定公式:對于R<U,F>的一個分解ρ={R[1]<U[1],F[1]>,R[2]<U[2],F[2]>},如果U[1]∩U[2]→U[1]-U[2]∈F的閉包

建議:對著實例調試一次就都知道了,官方說法太玄了

分解的限制:

1.要求保留函數依賴(數據間關系),一定可以達到3NF,但是不一定能達到BCNF,此時可以還做到無損連接

2.只要求分解具有無損連接性,則一定可以達到4NF

分解算法

(1)得到保留函數依賴的3NF(合成法):

--將R<U,F>中的F極小化處理,得到F"

--找出所有不在F"中出現的屬性,記為U",把這些屬性構成一個關系模式R"<U"',F"'>,把這些屬性從U中去掉,得到U"

①--若有X→A∈F",且XA=U",則ρ={R},結束

②--或者,對F按具有相同左部(決定因素)的原則分k組,每組函數依賴集涉及的全部屬性形成一個屬性集U[i]分別組成對應的R[i]關系模式,算法結束。此時的ρ={R[1]<U[1],F[1]>,...R[k]<U[k],F[k]>∪R"<U"',F"'>}是R<U,F>的保留函數依賴的一個分解,且對于每個R[i]都屬于3NF

(2)保留函數依賴和無損連接的3NF

--設X是R<U,F>的碼,R已由合成法分解為ρ,令t=ρ∪{R*<X,F[x]>(R*中只有碼)}

--若有某個U[i],X?U[i],將R*<X,F[x]>從t中去掉,或者U[i]?X,將R<X,F[x]>從t中去掉。這步得到t'

--t'就是所求的分解

--即是說:合成法的計算結果ρ與由原表的主屬性組成新表r取并,且用r與ρ中的子表U[i]進行對比,去除冗余的表(包含r時r冗余,被r包含時U[i]冗余)

(3)轉化為BCNF的無損連接分解(僅①適用)

--將分解ρ的子表中可以起決定因素作用的主屬性集(無法構成碼)與其被決定因素單獨提取成一個新表,原R[i]中刪除掉對應的被決定屬性

(4)U=X+Y+Z如果R<U,D>中X→→Y成立,則R的分解ρ={R[1]<X,Y>,R[2]<X,Z>}具有無損連接性

--即是說:將多值依賴的不符合4NF的表分解為多個函數依賴的表

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,837評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,196評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,688評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,654評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,456評論 6 406
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,955評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,044評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,195評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,725評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,608評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,802評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,318評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,048評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,422評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,673評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,424評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,762評論 2 372

推薦閱讀更多精彩內容

  • 關系:描述實體、屬性、實體間的關系關系模式:用來定義關系,描述關系的性質(邏輯結構與特征)關系數據庫:基于關系模型...
    Gopal閱讀 209評論 0 0
  • 一年級語文上冊生字表 生字表一(共400字) 啊(ā)愛(ài)安(ān)岸(àn)爸(bà)八(bā)巴(bā)...
    meychang閱讀 2,831評論 0 6
  • 迪麗熱巴:起床了,老公 鹿晗:老婆,今天是周6,好不容易放 假了,能讓我在睡一會兒嗎? 迪麗熱巴:我們...
    皮卡丘的baby閱讀 1,536評論 0 4
  • 1.針對最近的爆款文《就算老公一毛錢股份都沒拿到,在我心里,他依然是最牛逼的創業者》,用不超過三句,說說要不要抓熱...
    潔微內涵閱讀 472評論 0 1
  • 夏日的北京清晨,下起了不急不慢的雨。我走在上班的路上,聽到蘇打綠的《當我們一起走過》。 這首歌來自他們2011年的...
    嚀初閱讀 1,107評論 4 8