在建構 AI 系統時,選擇合適的模型至關重要。模型選擇取決於問題的特性、資料的可用性和預期的結果。符號 AI 適用於規則明確的場景,而機器學習則更適合處理複雜資料和預測任務。基礎模型作為一種新興的機器學習模型,則提供了更強大的泛化能力。選擇模型類別後,還需要進一步選擇具體的模型型別和演算法。

在機器學習領域,分類別模型是一類別重要的模型,用於將資料分類別到預定義的類別。根據類別的數量,可以分為二元分類別和多元分類別。分類別模型的工作原理通常根據計算輸入資料與各個類別之間的距離或相似度。常用的分類別模型包括 KNN 和 Logistic Regression,它們分別根據距離和機率進行分類別。這些模型廣泛應用於垃圾郵件過濾、影像識別、情感分析等領域,為解決實際問題提供了有效的工具。

選擇模型:AI 系統中的模型選擇

在人工智慧(AI)系統中,模型選擇是一個至關重要的步驟。不同的模型型別可以應用於同一個問題,每種模型都有其優點和缺點。在本章中,我們將探討 AI 系統中使用的不同型別的模型,以及如何為訓練準備這些模型。

3.1 術語

在機器學習(ML)中,有一些特定的術語需要了解。以下是這些術語及其定義:

  • 監督學習、無監督學習和自監督學習。在監督學習中,訓練過程使用標記資料,其中每個輸入都與對應的標籤配對,允許演算法學習輸入和目標變數之間的關係。在無監督學習中,資料不進行標記,演算法在資料中識別模式或結構,而不需要預先定義的標籤。自監督學習是一種變體,其中模型從資料中生成自己的標籤,例如預測輸入資料的遮罩部分,使其能夠學習有用的表示而無需手動標記的資料。
  • 用於訓練 ML 模型的資料通常分為三個子集:訓練集、驗證集和測試集。訓練集是用於訓練模型的主要資料。模型根據訓練集學習並設定其引數/權重。驗證集用於確保模型足夠普遍。一旦模型處理了訓練集並設定了其引數/權重,驗證集就用於確保模型對未見資料的效能良好。測試集用於評估已訓練的模型。
  • 過度適應(overfitting)意味著模型對訓練資料給出準確的預測,但對新資料則不準確。這可能是因為用於訓練模型的資料不足,或者用於訓練的資料沒有準確反映模型將要進行預測的真實世界資料的特徵。欠適應(underfitting)則是相反的情況。
  • 損失函式(loss function)衡量模型的預測與實際情況之間的差異。
  • F1 分數是一種衡量 ML 模型的精確度(準確率)和召回率(真正陽性率)的指標。

3.2 選擇模型

選擇模型的第一步涉及選擇適合的模型類別,這可能根據問題的性質或解決方案的特徵。不同的類別或型別的模型可以應用於同一個問題,每種都提供不同的優點和權衡。以下是三個主要類別:

  1. 符號和根據規則的模型
  2. 根據資料的機器學習(ML)模型
  3. 基礎模型(FMs),它們是一種特殊型別的 ML 模型,但由於其獨特的能力和規模,值得有一個獨立的類別。

在每個類別中,都存在各種型別的模型,我們將在討論完類別本身後探索這些型別。

3.2.1 選擇類別

何時使用符號 AI 模型:

符號 AI 根據預定義的規則做出決策,因此在具有明確規則的領域中高度可解釋且有效。但是,符號 AI 模型很難充分考慮真實世界場景中的資料,特別是考慮到真實世界的複雜性和變異性。在處理意外情況時,這些模型可能會遇到挑戰。

內容解密:

上述內容闡述了 AI 系統中選擇合適模型的重要性,並介紹了幾個關鍵術語,包括監督學習、無監督學習、過度適應和損失函式等。同時,提到了選擇模型類別的不同方法,包括符號 AI、根據資料的機器學習和基礎模型等。

AI 模型選擇流程活動圖

圖表描述 (Alt Text): 此活動圖展示了AI系統中選擇模型的流程,從問題定義開始,到根據問題特性選擇合適的模型類別(符號AI、機器學習或基礎模型),並最終應用於具體場景。

PlantUML 圖表

選擇適合的 AI 模型:符號 AI、機器學習和基礎模型

在人工智慧(AI)的世界中,選擇合適的模型來解決特定的問題是非常重要的。這裡,我們將探討三種主要的 AI 模型:符號 AI(Symbolic AI)、機器學習(Machine Learning,ML)和基礎模型(Foundational Models,FMs)。每種模型都有其優缺點和適用場景。

符號 AI

符號 AI 是根據規則的 AI 模型,它們透過預先定義的規則來進行推理和決策。這類別模型適合於以下情況:

  • 問題領域是明確的,並且有明確的規則。
  • 規則的範圍是明確定義的。
  • 可解釋性是高優先順序的品質,因為規則基礎的模型可以追蹤特定的輸出到生成該輸出的規則。
  • 需要嚴格遵守法規或。

然而,符號 AI 模型也有一些限制。當問題領域複雜,規則數量龐大時,維護知識函式庫和保證規則的一致性就變得困難。

機器學習

機器學習模型適合於另一類別問題,即那些不能被符號 AI 輕易解決的問題。這類別問題通常具有以下特徵:

  • 有大量可用的資料。
  • 資料結構複雜,人類無法單獨分析。
  • 任務是預測、分類別、異常檢測或聚類別等。

機器學習提供了多種演算法和技術來分析資料和進行預測或分類別。有許多平臺提供了機器學習模型的訓練和佈署功能,包括雲基服務、軟體平臺和開源平臺。

基礎模型

基礎模型是指初步訓練的基本模型,這些模型在大量多樣化的資料上進行訓練,以學習廣泛的語言模式和一般知識。基礎模型的特點是其規模(包括模型大小和訓練資料)和通用性,即它們不針對特定的任務或領域。

在大多數情況下,您可能想要改進現有的基礎模型,而不是從頭訓練一個新的。這可以透過使用特定任務的標記資料對基礎模型進行進一步的微調來實作。然而,這些微調後的模型通常不被視為基礎模型本身,而是被稱為“微調模型”、“改進模型”或“任務特定模型”。

分類別模型的應用與原理

分類別模型是一種機器學習演算法,用於將資料分類別為預先定義的類別。這些模型根據輸入資料的不同特徵(獨立變數),將其分配到相應的類別中。分類別模型的應用範圍廣泛,包括郵件垃圾郵件過濾、影像和語音辨識、人臉識別、情感分析、客戶分段、貸款審批等。

分類別模型的型別

根據類別的數量,分類別模型可以分為二元分類別和多元分類別。二元分類別是指將資料分為兩個類別,例如郵件是否為垃圾郵件。多元分類別是指將資料分為三個或以上的類別,例如將動物分為老虎、長頸鹿、斑馬等。

分類別模型的工作原理

分類別模型的工作原理是根據輸入資料的特徵,計算其與每個類別的距離或相似度,然後將其分配到距離最短或相似度最高的類別中。常用的距離度量包括歐幾裡得距離、餘弦距離等。

分類別模型的例子

  1. K-Nearest Neighbors (KNN):KNN 是一種簡單且有效的分類別演算法,它根據輸入資料與訓練資料集中 k 個最近鄰居的距離,將其分配到多數類別中。
  2. Logistic Regression:Logistic Regression 是一種廣泛使用的分類別演算法,它根據輸入資料的特徵,計算其屬於每個類別的機率,然後將其分配到機率最高的類別中。

分類別模型的應用

  1. 郵件垃圾郵件過濾:分類別模型可以根據郵件的內容、傳送者等特徵,將其分為垃圾郵件或正常郵件。
  2. 影像和語音辨識:分類別模型可以根據影像或語音的特徵,將其分為不同的類別,例如人臉識別、物體辨識等。
  3. 人臉識別:分類別模型可以根據人臉的特徵,將其分為不同的身份。
  4. 情感分析:分類別模型可以根據文字的內容,將其分為不同的情感類別,例如正面、負面等。
  5. 客戶分段:分類別模型可以根據客戶的特徵,將其分為不同的群體,例如年齡、性別等。

從技術架構視角來看,選擇正確的 AI 模型對於構建高效能的 AI 系統至關重要。本章深入探討了符號 AI、機器學習模型和基礎模型三大類別,並分析了它們各自的優缺點及適用場景。透過理解不同模型的特性,例如符號 AI 的規則基礎、機器學習的資料驅動以及基礎模型的規模和通用性,開發者能更有效地根據實際問題選擇合適的模型。然而,模型選擇並非一勞永逸,隨著資料量的增加和問題複雜性的變化,重新評估和調整模型選擇策略也至關重要。對於追求最佳效能的 AI 系統,持續關注新興模型架構和訓練技術,並將其整合至現有系統中,才能保持競爭優勢。玄貓認為,隨著 AI 技術的快速發展,模型選擇將成為 AI 系統開發流程中越來越關鍵的一環。