概念數(shù)據(jù)建模步驟
讓我們進一步仔細(xì)觀察應(yīng)在需求分析和概念設(shè)計階段定義的基本數(shù)據(jù)元素和關(guān)系。一般需求分析與概念設(shè)計是同步完成的。
使用ER模型進行概念設(shè)計的步驟包括:
辨識實體與屬性
識別泛化層次結(jié)構(gòu)
定義關(guān)系
下面我們對這三個步驟一一進行討論。
辨識實體與屬性
實體和屬性的概念及ER構(gòu)圖都很簡單,但要在需求中區(qū)分實體和屬性不是一件易事。例如:需求描述中有句話,“項目地址位于某個城市”。這句話中的城市是一個實體還是一個屬性呢?又如:每一名員工有一份簡歷。這里的簡歷是一個實體還是一個屬性呢?
辨別實體與屬性可參考如下準(zhǔn)則:
實體應(yīng)包含描述性信息
多值屬性應(yīng)作為實體來處理
屬性應(yīng)附著在其直接描述的實體上
這些準(zhǔn)則能引導(dǎo)開發(fā)人員得到符合范式的關(guān)系數(shù)據(jù)庫設(shè)計。
如何理解上述的三條準(zhǔn)則呢?
|
識別泛化層次
如果實體之間有泛化層次關(guān)系,則把標(biāo)識符和公共的描述符(屬性)放在超類實體中,把相同的標(biāo)識符和特有的描述符放在子類實體中。舉例來說,在ER模型中有5個實體,分別是Employee、Manager、Engineer、 Technician、Secretary。其中Employee可以作為Manager、Engineer、Technician、Secretary 的超類實體。我們可以把標(biāo)識符empno,公共描述符empname、address、date-of-birth放在超類實體中。子類實體 Manager中放empno,特有描述符jobtitle。Engineer實體中放empno,特有描述符jobtitle,highest- degree等。
定義關(guān)系
在識別實體和屬性之后我們可以處理代表實體之間聯(lián)系的數(shù)據(jù)元素即關(guān)系。關(guān)系在需求描述中一般是一些動詞如:works-in、works-for、purchases、drives,這些動詞聯(lián)系了不同的實體。
對于任何關(guān)系,需要明確以下幾個方面。
關(guān)系的度(二元、三元等);
關(guān)系的連通數(shù)(一對一、一對多等);
關(guān)系是強制的還是可選的;
關(guān)系本身有些什么屬性。
仔細(xì)分析冗余的關(guān)系。描述同一概念的兩個或多個關(guān)系被認(rèn)為是冗余的。當(dāng)把ER模型轉(zhuǎn)化為關(guān)系數(shù)據(jù)庫中的表時,冗余的關(guān)系可能造成非范式化的表。需要注意的是兩個實體間允許兩個或更多關(guān)系的存在,只要這些關(guān)系具有不同的含義。在這種情況下這些關(guān)系不是冗余的。
舉例來說,如下圖1中Employee生活的City與該Employee所屬的Professional-association的所在City可以不同(兩種含義),故關(guān)系lives-in非冗余。 (圖1 非冗余關(guān)系) 如下圖2中的Employee工作的City與該Employee參與的Project的所在City在任何情況下都一致(同種含義),故關(guān)系works-in冗余。 (圖2 傳遞性冗余關(guān)系) |
非常小心的定義三元關(guān)系,只有當(dāng)使用多個二元關(guān)系也無法充分描述多個實體間的語義時,我們才會定義三元關(guān)系。以Technician、Project、Notebook為例。
例1:如果 一個Technician只做一個Project,一個Project只有一個Technician,每個Project會被獨立記錄在一本Notebook中。 (圖3 例1二元關(guān)系圖) 例2:如果一個Technician能同時做多個Project,一個Project可以有多個Technician同時參與,每個Project有一本Notebook(多個做同一個Project的Technician共用一本Notebook)。 (圖4 例2二元關(guān)系圖) 例3:如果一個Technician能同時做多個Project,一個Project可以有多個Technician同時參與,一個Technician在一個Project中使用獨立的一本Notebook。 (圖5 例3三元關(guān)系圖) |
注:三元關(guān)系的語義分析可參看一步一步設(shè)計你的數(shù)據(jù)庫之縱覽高級ER模型,這里不再贅述。
我們假設(shè)要為一家工程項目公司設(shè)計一個數(shù)據(jù)庫來跟蹤所有的全職員工,包括員工被分配的項目,所擁有的技能,所在的部門和事業(yè)部,所屬于的專業(yè)協(xié)會,被分配的電腦。
通過需求收集與分析過程,我們獲得了數(shù)據(jù)庫的3個視圖。
第一個視圖是人力資源管理視圖。每一個員工屬于一個部門。事業(yè)部是公司的基本單元,每個事業(yè)部包含多個部門。每一個部門和事業(yè)部都有一個經(jīng)理,我們需要跟蹤每一個經(jīng)理。這一視圖的ER模型如圖6所示。
(圖6 人力資源關(guān)系視圖)
第二個視圖定義了每個員工的頭銜,如工程師、技術(shù)員、秘書、經(jīng)理等。工程師一般屬于某個專業(yè)協(xié)會,并可能被分配一臺工作站。秘書和經(jīng)理會被分配臺式 電腦。公司會儲備一些臺式電腦和工作站,以分配給新員工或當(dāng)員工的電腦送修時進行出借。員工之間可能有夫妻關(guān)系,這也需要在系統(tǒng)中進行跟蹤,以防止夫妻員 工之間有直接領(lǐng)導(dǎo)關(guān)系。這一視圖的ER模型如圖7所示。
(圖7 員工頭銜及電腦分配視圖)
第三個視圖如圖8所示,包含員工(工程師、技術(shù)員)分配項目的信息。員工可以同時參與多個項目,每一個項目可以在不同的地方(城市)設(shè)有總部。但一個員工在指定的地點只能做當(dāng)?shù)氐囊粋€項目。員工在不同的項目中可以選用不同的技能。
(圖8 項目分配及技能使用視圖)
對三個視圖的簡單集成可得到全局ER圖,如圖9所示,它是構(gòu)造范式化表的基礎(chǔ)。全局ER圖中的每一個關(guān)系都是基于企業(yè)中實際數(shù)據(jù)的一個可驗證斷言。對這些斷言進行分析導(dǎo)出了從ER圖到關(guān)系數(shù)據(jù)庫表的轉(zhuǎn)化。
(圖9 全局ER圖)
從全局ER圖中可以看到二元、三元和二元回歸關(guān)系;可選和強制存在性關(guān)系;泛化的分解約束。圖9中三元關(guān)系“skill-used”和“assigned-to”是必須的,因為使用二元關(guān)系無法描述相同的語義。
可選存在性的使用,Employee與Division或與Department之間是基于常識:大多數(shù)Employee不會是Division或 Department的經(jīng)理。另一個可選存在性的例子是desktop或workstation的分配,每一臺desktop或workstation未 必都會分配給一個人??偠灾?,在把ER模型轉(zhuǎn)化為SQL表之前,所有的關(guān)系、可選約束、泛化層次都需要與系統(tǒng)的最終用戶進行確認(rèn)。
總結(jié)來說,在關(guān)系數(shù)據(jù)庫設(shè)計中應(yīng)用ER模型會帶來如下好處
1. 使用ER模型可幫助項目成員專注在討論實體之間的重要關(guān)系上,而不受其他細(xì)節(jié)的干擾。
2. ER模型把大量復(fù)雜的語言描述轉(zhuǎn)化為精簡的、易理解的圖形化描述。
3. 對原始ER模型的擴展,如可選和強制存在性關(guān)系,泛化關(guān)系等加強了ER模型對現(xiàn)實語義的描述能力。
4. 從ER模型轉(zhuǎn)化為SQL表有完整的規(guī)則,且易于使用。
實體關(guān)系(ER)模型參考資料
1. 基本實體關(guān)系模型構(gòu)件——實體、關(guān)系、屬性、關(guān)系的度、關(guān)系的連通數(shù)、關(guān)系的屬性、關(guān)系中實體的存在性(http://www.cnblogs.com/DBFocus/archive/2011/04/24/2026142.html)
2. 高級實體關(guān)系模型構(gòu)件——泛化、聚合、三元關(guān)系(http://www.cnblogs.com/DBFocus/archive/2011/05/07/2039674.html)