在當今商業環境中,資料已成為企業最重要的資產之一。有效管理和利用資料對於企業的成功至關重要。本文探討如何構建分佈式概念模型和企業知識架構,以提升資料的價值,並支援企業的決策和營運。隨著資料產品的興起,概念模型在確保資料產品之間的互操作性和無縫資料消費方面扮演著關鍵角色。透過建立普遍語言和受控詞彙,企業可以消除溝通障礙,並確保所有利益相關者對資料的理解一致。更進一步,本體論和概念模型的應用,可以更有效地組織和管理知識,從而提升企業的決策效率和競爭力。此外,良好的資料架構對於最大化資料價值至關重要,它涵蓋了資料、資訊、知識和智慧四個層次,並需要有效的資料管理和知識管理策略來支援。
分佈式概念模型探索
在傳統方法中,概念模型通常在分析階段被鬆散定義,以指導物理模型的建構。然而,在資料產品為中心的架構中,概念模型在初始資料產品發布後仍發揮著至關重要的作用。它作為無縫資料消費和確保資料產品之間的互操作性的關鍵啟動器。在本文中,我們將探索如何故意設計概念模型和管理其在分佈式去中心化架構中的持續演化。
普遍語言
概念模型的主要目的是揭示核心概念及其之間的關係。所有參與解決問題的人都應該參與模型活動,通常與分析的早期階段相吻合,以確定支援特定商業案例所需的資料產品。尤其重要的是,具有深刻瞭解目標問題相關流程的商業利益相關者應該參與概念模型,因為他們掌握了構建此類別模型所需的大部分知識。
模型會話從深入探討與商業案例相關的商業流程開始。這個過程分析可以透過各種技術展開,例如事件風暴(見第4章,識別資料產品和優先級開發)。當您深入流程時,捕捉最常用的術語至關重要,特別是那些被強調的術語。這些術語體現了您所處的有界上下文所特有的語言。
對於每個與流程相關的重要術語,應該正式化一個明確且分享的定義。如果多個術語用於描述相同的概念,則應該跟蹤它們並選擇一個首選術語。這個首選術語將作為跨所有交付件使用的普遍語言的基礎,以實作所需的解決方案。
識別出的關鍵術語集,連同其定義和潛在的同義詞,被歸類別為知識組織系統(KOS)中的受控詞彙。建立分享的受控詞彙對於消除參與分析和實作所需解決方案的人員之間的誤解至關重要。例如,當提到“客戶”一詞時,利益相關者可以參考一個共同的定義,確保每個人都對訊息的含義和上下文保持一致。
受控詞彙在開發後仍發揮著至關重要的作用,服務於記錄物理模型和增強資料理解,以供潛在消費者使用。這是透過用受控詞彙中的術語標記物理模型(例如欄位、表格和其他資料結構)來實作的。當消費者透過產品的可發現連接埠與物理模型交互時,他們不僅獲得結構洞察,而且還獲得對資料的上下文理解。標籤作為連結到分享受控詞彙的連結,提供存取術語定義並闡明標籤資料的含義。
受控詞彙
受控詞彙旨在跨多個資料產品分享,特別是在相同的有界上下文或子域內。這種方法避免了術語定義的冗余,因為術語的含義在產品之間保持一致。受控詞彙隨著使用它的資料產品的開發而演化,但它獨立運作,不分享其生命周期。受控詞彙不被資料產品擁有或暴露。與物理模型不同,物理模型透過資料產品的可發現連接埠直接暴露,受控詞彙必須在外部管理——無論是由誰。
資料治理平台通常透過一個稱為商業詞匯表的組件來促進受控詞彙的管理。商業詞匯表作為一個集中式、使用者友好的存儲函式庫,詞彙術語在其中被編目、連結和隨時間維護。它作為理解和導航資料景觀的關鍵工具。
透過商業詞匯表,使用者不僅可以快速存取用於標記資料以便於理解的術語定義,還可以在受控詞彙中搜尋術語並追蹤它們到相關資料。事實上,商業詞匯表索引術語及其定義,啟用了對受控詞彙的根據文字的搜尋。此外,它跟蹤所有用特定術語標記的物理模型。這允許您找到所有與搜尋字串相關的術語,例如“客戶”。然後,透過這種術語(例如“活躍客戶”),使用者可以查看其定義並查看所有用此術語標記的物理模型,從而找出暴露這些模型和相關資料的資料產品。
從字串到事物
受控詞彙提供了一個帶有定義和關鍵同義詞的平面術語列表,但缺乏結構。它不區分概念及其屬性,也不定義概念之間的關係。這種更結構化的方法組織概念、屬性及其相互連接,被稱為本體論。本體論允許使用廣泛的關係來連結概念,使其成為分享知識最通用和最全面的一種明確表示形式。
在知識管理系統中,本體論相比之下更簡單的一種表示形式通常被使用,通常是從物件之間可能關係的一個有限集合中構建而成。最常見的是分類別學和辭典。分類別學使用“更廣泛”和“更狹窄”等關係建立概念或術語之間的分層關係,從而建立一個每個概念或術語都連結到父級術語的結構化分層結構。另一方面,辭典支援分層和聯想關係,使術語和概念可以跨不同分類別學連結起來,啟用了一種更靈活和相互連接的知識表示。
辭典可以被視為只使用分層和聯想關係的一種本體論。同樣,分類別學可以被視為只使用分層關係的一種特定辭典。最後,受控詞彙可以被視為一種特定的分類別學,其中術語不透過任何東西相互連接。一般來說,如下圖所示,本體論由辭典組成,這些辭典連結分類別學,而分類別學又連結受控詞彙中的術語。
概念模型型別
概念模型越複雜,就越富有表達力。在這些模型中,一個術語的含義不僅由其定義決定,也由其結構決定。在一個設計良好的概念模型中,一個概念的文字定義應該是多餘的,因為其含義已經嵌入在結構本身中。例如,“客戶”一詞可能在受控詞彙中被定義為“一個從企業購買產品或服務以換取貨幣價值的人或實體”。
管理概念模型生命週期
本體論是一個故意設計用於捕捉領域知識並解決特定問題的模型。本體論建模之旅始於明確識別目標問題、我們旨在實作的商業成果以及模型必須幫助回答的商業問題。概念模型永遠不應該被抽象地作為對所有組織知識進行全面映射來對待,這將是一個與價值創造無關的智力遊戲。相反,過程必須緊密地與真正的商業案例保持一致,以確保模型直接滿足可行需求。
當模型動機和範圍明確定義後,下一步就是聚集主題專家,他們對問題域和相關商業流程具有深刻理解。這標誌著概念模型第一階段的開始。這裡的重點是揭示形成模型基礎的核心概念。過程通常從識別關鍵術語開始。當這些術語出現時,評估它們是否代表概念、概念屬性或它們之間的關係至關重要,並將其記錄在分享詞彙中。
看圖說話:
graph LR A[普遍語言] --> B[受控詞彙] B --> C[本體論] C --> D[概念模型]
這個圖表展示了從普遍語言到受控詞彙,再到本體論,最後到概念模型的邏輯流程,每一步都建立在前一步的基礎上,以實作無縫資料消費和互操作性。
資料架構的重要性
在現代經濟中,資料已成為公司最有價值的資產之一。然而,僅僅擁有資料是不夠的,還需要一個良好的資料架構來最大化其價值並簡化其使用。資料架構是指組織和管理資料的方式,以便於存取、分享和使用。
資料的定義和價值
根據國際會計準則委員會(IASB)的定義,資產是指一個實體控制的資源,從中預期會流入未來的經濟效益。資料是一種資源,其價值主要來自於其使用價值。然而,並非所有資料都具有價值,只有具有潛在使用價值的資料才算是一種資產。
資料架構的層次
資料架構可以分為幾個層次,包括:
- 資料層: 資料的原始形式,例如數字、文字、圖像等。
- 資訊層: 對資料進行處理和分析後所得到的資訊。
- 知識層: 對資訊進行整合和分析後所得到的知識。
資料架構的目標
資料架構的目標是建立一個能夠有效管理和利用資料的系統,以支援企業的決策和營運。這需要一個良好的資料架構來確保資料的品質、安全性和可用性。
知識平面
知識平面是指一個組織中分享的概念模型,用於描述資料及其之間的關係。它是企業知識圖譜的基礎,能夠支援企業內部的資料分享和交流。
企業知識圖譜
企業知識圖譜是指一個企業內部的知識模型,用於描述企業的業務流程、資料及其之間的關係。它是企業資料架構的核心,能夠支援企業的決策和營運。
資料、資訊、知識與智慧:打造企業知識架構
在探索企業知識架構的世界中,我們首先需要了解資料、資訊、知識和智慧之間的差異。資料是指原始的資料,例如一串數字或文字,然而如果沒有適當的處理和解釋,這些資料幾乎毫無意義。當我們給予資料一個結構和背景時,它就變成了資訊。這個過程被稱為「賦予形式」或「塑造」,來自拉丁語「informare」。
資訊與知識的關係是非常重要的。知識是對某個領域的模型,透過過去的經驗和學習而發展。當我們擁有知識時,我們不僅能夠理解資訊的基本意義,也能夠揭示它對於組織的更深層次的意義。這種理解使我們能夠在組織的現實中上下文化資訊,並有效地使用它來推動積極的結果。
每個個人都有自己對領域的模型,這些模型是透過他們自己的經驗和視角而形成的。由於每個人都有不同的視角,因此這些模型是個人的和不同的。因此,不同的人可能會以不同的方式解釋相同的資訊,並根據他們自己的理解做出決定。
資料、資訊、知識與智慧的四個層次
資料、資訊、知識和智慧(或智慧)構成了企業知識架構的四個層次。每個層次都建立在前一個層次之上,豐富了圍繞著收集資料的背景。提供的背景越多,對資料意義的理解就越深入和細膩,最終指導著它在組織內的有效利用。
資料管理:從資料層到知識層
為了確保資料成為真正的資產而不是負擔,管理整個企業知識架構是非常重要的,而不僅僅是資料層。企業知識架構包括資料層、資訊層、知識層和智慧層。資料層關注原始資料的收集和儲存,資訊層則關注給予資料結構和背景使其變成可用的資訊。知識層是關於對領域的理解和模型,智慧層則是關於如何應用知識來創造價值。
知識管理:建立企業本體論
建立企業本體論是一種管理知識的方法,涉及建立一個分享的模型來描述組織的核心概念和關係。這個模型有助於標準化概念和語言,促進不同部門和團隊之間的溝通和合作。企業本體論是企業知識架構的一部分,有助於提供一個統一的框架來組織和管理知識。
企業知識管理
企業知識管理是指企業內部知識的建立、儲存、分享和應用的過程。企業知識管理的目的是提高企業的知識水平,增強企業的核心競爭力。
企業本體論
企業本體論(Enterprise Ontology)是指企業內部知識的概念和關係的集合。它是企業知識管理的基礎,提供了企業內部知識的框架和結構。
企業本體論可以分為三個層次:
- 上層本體論(Upper Ontology):定義了基本的概念和關係,例如物體、人、時間、事件和空間。
- 領域本體論(Domain Ontology):定義了特定領域的概念和關係,例如金融、保險、零售等。
- 子領域本體論(Subdomain Ontology):定義了子領域的概念和關係,例如市場、銷售、營運等。
知識域
知識域(Knowledge Domain)是指企業內部知識的子集,通常由一個模型團隊負責維護。知識域可以橫跨多個業務子域,提供了企業內部知識的分享和整合。
聯邦模型團隊
聯邦模型團隊(Federated Modeling Team)是指由多個業務子域的代表組成的團隊,負責維護企業本體論和知識域。聯邦模型團隊需要有業務知識和模型建構專業知識。
企業本體論治理
企業本體論治理(Enterprise Ontology Governance)是指企業內部知識的管理和協調框架。它提供了企業本體論的發展、維護和應用的規則和標準。
企業本體論治理可以透過以下方式實作:
- 聯邦模型團隊:由多個業務子域的代表組成的團隊,負責維護企業本體論和知識域。
- 委員會:由企業內部的代表組成的委員會,負責監督和協調企業本體論的發展和應用。
- 規則和標準:提供了企業本體論的發展、維護和應用的規則和標準。
深入剖析資料架構在現代企業中的關鍵作用後,我們可以發現,從分散式概念模型的建立到企業知識圖譜的建構,皆指向一個核心目標:將資料轉化為可行動的智慧。分析資料、資訊、知識和智慧的層級架構,以及概念模型的演變路徑(從普遍語言到受控詞彙,再到本體論),可以看出,挑戰在於如何有效地整合不同來源、不同格式的資料,並在一個分享的知識框架下進行詮釋。同時,如何平衡概念模型的靈活性與穩定性,以適應不斷變化的商業環境,也是一個關鍵的議題。
從管理角度來看,建立聯邦模型團隊、制定明確的治理規則和標準,並藉助商業詞彙表和知識組織系統等工具,對於有效管理和應用企業本體論至關重要。此外,跨部門的協作和溝通,以及持續的知識更新和維護,也是確保資料架構有效性的必要條件。
展望未來,隨著人工智慧和機器學習技術的發展,資料架構將朝向更智慧化、自動化的方向演進。預計未來的資料架構將能夠自動識別資料之間的關係,並自主學習和最佳化資料模型,從而更有效地支援企業決策。玄貓認為,對於重視資料價值的高階管理者而言,及早佈局並建構一個穩健、靈活且可持續發展的資料架構,將是提升企業核心競爭力的關鍵所在。