邊緣AI系統由於其分散式特性,在佈署後難以監控和調整,加劇了黑箱問題和偏見帶來的風險。這使得使用者難以理解系統的決策過程,也增加了開發者修復錯誤和偏差的難度。文章探討了這些問題的成因和潛在後果,並強調了負責任AI開發的重要性。同時也介紹了邊緣AI常用的感測器型別,例如影像感測器、運動感測器和力感測器,以及它們如何捕捉和表示不同型別的資料,例如時間序列、音訊和影像。這些感測器和資料型別構成了邊緣AI應用的基礎,對於理解和開發邊緣AI系統至關重要。

邊緣AI的隱憂:黑箱與偏見

邊緣AI(Edge AI)因其特殊的運作模式,容易在實際應用中引發意想不到的危害,主要體現在兩個方面:黑箱(Black Boxes)與偏見(Bias)。

黑箱問題

黑箱是一個比喻,用來形容那些內部運作過程不透明、難以理解的系統。資料輸入後,系統輸出決策,但內部的運作機制卻難以解析。現代AI,尤其是深度學習模型,因其複雜性而被批評為黑箱。某些演算法,如隨機森林(Random Forests),相對容易解釋,因為你可以存取模型的內部結構,瞭解其決策過程。然而,邊緣裝置上的AI模型則不同。

邊緣裝置的隱形特性

邊緣裝置通常被設計成不可見的,它們被嵌入到我們的建築、產品、車輛和玩具中,融入環境背景。它們是字面意義上的黑箱,內部結構不可見,通常受到多層安全保護,以避免詳細檢查。

黑箱的風險

一旦AI演算法被佈署到邊緣裝置上,無論其複雜度如何,它對使用者來說都變成了一個黑箱。如果裝置在與原開發者預期不同的真實環境中佈署,甚至開發者也可能難以理解其行為原因。這種情況對不同的人群有不同的風險。

對使用者的風險

裝置的使用者,即購買和安裝裝置的人,現在依賴於一個他們並不完全理解的系統。他們可能信任裝置能夠做出正確的決策,但這種信任是否合理卻沒有保證。

對無辜者的風險

以Uber的自動駕駛汽車為例,測試司機應該能夠在危險情況下進行干預。然而,事實證明,無論培訓如何,人類操作員都無法可靠地彌補有缺陷的自動化系統。對人類干預的依賴是一種不負責任的設計決定。

對開發者的風險

黑箱性質也對開發者構成風險。例如,假設一個邊緣AI相機陷阱被用來監測入侵物種的數量。如果相機存在假陰性問題(未能識別出每三隻入侵動物中的一隻),並且佈署在遙遠的位置,那麼可能無法將相機的輸出與現實進行驗證。研究人員將得到一個低估的動物數量,但由於原始資料可能不再存在,他們無法知道這一點。

黑箱與可解釋性

與黑箱系統相對的是可解釋的系統。某些AI演算法比其他演算法更具可解釋性,即使是使用相對不透明的演算法的系統,也可以透過設計使其更具可解釋性,儘管這可能會以降低效能或增加複雜性為代價。每個應用的正確權衡都是獨特的。可解釋性越來越成為某些專案的法律要求,值得探索在您的監管環境中是否屬於這種情況。

偏見的危險

黑箱的危險因偏見的存在而加劇。在邊緣AI系統中,偏見導致系統具備一個不能代表真實世界的應用領域模型。如果開發者不注意眾所周知的偏見來源,系統中很可能會出現偏見。最常見的偏見來源包括:

人類偏見

所有人類根據他們的經驗都對某種世界觀有偏見(例如,不考慮行人可能會無視交通規則)。

資料偏見

資料集反映了資料收集過程,而不是現實(例如,一個資料集可能只包含人們在人行橫道上過馬路的例子)。

演算法偏見

所有AI演算法都有固有的侷限性,它們的選擇和調優可能導致偏見(例如,所選演算法可能對小而模糊的物體,如遠處的行人,在夜間表現不佳)。

測試偏見

由於真實世界的測試困難且昂貴,通常只覆寫常見情況,導致測試覆寫範圍存在偏見(例如,在人工測試場上進行詳盡測試很昂貴,開發者希望降低成本,因此沒有測試某個關鍵場景)。

邊緣AI技術的倫理挑戰

在科技專案中,偏見(bias)往往因對應用情境的理解不足而產生,並因資源限制而被放大。為了減少偏見,開發團隊需要相關領域專家的協助、精心收集的資料集、適合任務的演算法,以及足夠的現實世界測試預算。許多開發團隊只有在因偏見而遭受昂貴失敗後才會關注這些問題。

當邊緣AI產品與「黑箱」特性結合時,會產生風險。使用者可能會假設系統運作正常,並信任其正確性、安全性和合理性。由於無法檢查其運作機制,使用者無法自行驗證這一假設。開發者必須完全承擔滿足和管理使用者期望的責任。

成功的AI專案必須意識到自身的侷限性,並提供必要的結構以保護使用者和公眾免受潛在的失敗。定義產品的功能引數,並確保使用者瞭解這些引數至關重要。

造成傷害而非幫助的技術

現代世界的監控系統無處不在,公眾被迫在未經同意的情況下適應它們的存在。將AI應用於監控是一個複雜的話題。雖然邊緣AI可能用於保護隱私,但也可能侵犯人權。

案例研究:海康威視的監控攝影機

2019年11月,發現一家主要的視訊監控攝影機供應商海康威視(Hikvision)正在銷售一種能夠根據人種(包括中國少數民族維吾爾人)進行分類別的監控攝影機。《紐約時報》報導稱,中國政府當局試圖利用邊緣AI技術透過外貌識別維吾爾人,「記錄他們的行蹤以供搜尋和審查」。

海康威視的種族分析技術與Uber的自動駕駛實驗不同,後者是由於工程設計不良而導致的悲劇,而前者從根本上就是錯誤的。該系統在完美運作時,被設計用來強化對某一群體的社會偏見。系統的偏見無法被限制;事實上,偏見是設計的一部分。

道德邊界的跨越

人類心理學因素(如天真、傲慢或貪婪)使聰明的人們在未考慮可能造成的傷害的情況下跨越道德界限。例如,HireVue公司開發了一項服務,用於分析求職者回答特定問題的錄影,並聲稱使用AI演算法評估求職者在特定職位上成功的可能性。

開發者天真地沒有考慮人類、資料、演算法和測試偏見對其工作的影響。他們的產品不可避免地在做出徵才決定時納入了候選人的聲音、口音和外貌,從而產生了明顯的歧視風險。這導致了一場訴訟和公眾反彈,最終HireVue不得不放棄其產品的部分功能並進行第三方演算法稽核。

疏忽的代價

使用人工智慧的技術往往被設計為深入我們的生活,塑造我們與家庭、工作場所、企業、政府和彼此之間的日常互動。這意味著這些系統的失敗可能會對人們產生深遠影響。

潛在風險

  • 醫療硬體可能誤診患者,影響治療。
  • 監控裝置可能針對某些群體,從而導致司法不公。
  • 教育玩具可能對某些兒童表現更好,從而減少學習機會。
  • 安全裝置可能因缺乏對不同使用者群體的測試而失效,導致身體傷害。
  • 不安全的裝置可能被罪犯利用,助長犯罪。

預防措施

為了避免這些風險,開發者必須考慮到潛在的「非預期用途」(off-label uses),並在設計應用程式時採取相應措施。此外,建立完善的測試和稽核機制對於減少偏見和確保系統的安全性和可靠性至關重要。

負責人工智慧的挑戰與對策

人工智慧的倫理問題

現代人工智慧(AI)技術的發展,特別是在邊緣運算(Edge AI)的領域,不僅帶來了技術上的革新,也引發了諸多倫理問題。這些問題包括對個人隱私的影響、技術被惡意使用的風險,以及對社會結構的潛在衝擊。

潛在的社會危害

  1. 普遍的AI監控: 擴散的AI監控技術可能侵犯個人隱私,影響人們的日常生活。
  2. 智慧感測器的濫用: 智慧感測器可能被盜獵者用來追蹤和獵殺瀕危野生動物。
  3. 武裝衝突升級: 搭載邊緣AI的武器可能增加衝突中的傷亡人數,並破壞全球權力平衡。

緩解社會危害的措施

為了應對這些挑戰,本文提供了一個框架,鼓勵開發者在開發過程中瞭解他們所建構系統的社會影響,並根據研究結果做出繼續或停止的決定。負責任的設計非常依賴具體的情境,因此緩解社會危害需要系統性且持續的努力。

多樣化的團隊組成

建立一個具有多元觀點的產品團隊是開發負責任AI應用的最佳實踐之一。這樣的團隊在技術專長和生活經驗上都具有多樣性,可以減少集體視野中的盲點。如果團隊規模較小,也應當預留時間和資金來引入多元化的觀點,並向更廣泛的社群尋求幫助,以評估想法並提供反饋。

心理安全與倫理AI

團隊成員的洞察力對於識別潛在危害至關重要,因此讓他們在開發過程中感到能夠暢所欲言是非常重要的。心理安全是指能夠暢所欲言和討論問題而不必擔心負面後果的感覺。這種安全感,加上強化AI倫理重要性的文化,是成功進行AI專案的必要條件。

負責任AI的工具與資源

有多家公司和服務機構提供幫助團隊以負責任的方式開發AI,或對現有應用進行潛在危害稽核的服務。此外,一些法律工具,如負責任AI許可證(RAIL),可以幫助開發者限制其AI產品被用於有害用途的可能性。

RAIL的應用

RAIL是一種技術許可證,開發者可以透過附加RAIL來建立法律依據,防止其產品被濫用於特定的應用範疇,例如監控、犯罪預測和生成假照片等。

線上資源與學習

有多種免費、高品質的線上資源可供學習更多關於倫理和負責任AI的知識。以下是一些推薦資源:

  • Berkeley Haas的《緩解人工智慧中的偏見》
  • Google推薦的負責任AI實踐
  • Microsoft的負責任AI資源
  • PwC的負責任AI工具包
  • Google Brain的《人+ AI研究(PAIR)》
內容解密:

本章節強調了在開發和應用邊緣AI技術時,需要考慮其對社會的影響和潛在倫理問題。開發者應該透過建立多元化的團隊、引入心理安全的開發環境,以及利用相關工具和資源,來確保其AI產品是負責任且有益於社會的。

邊緣AI的硬體基礎

現在是時候來認識那些驅動邊緣AI應用的裝置、演算法和最佳化技術。本章旨在對該領域最重要的技術元素進行全面概述。在本章結束時,你將具備開始進行邊緣AI產品高階規劃所需的基礎構件。

感測器、訊號和資料來源

感測器是電子元件,使裝置能夠測量其環境並檢測人類輸入。它們的範圍從極其簡單(可靠的老式開關和可變電阻器)到令人驚嘆的複雜(光偵測和測距[LIDAR]和熱成像相機)。感測器為我們的邊緣AI裝置提供了一系列用於做出決策的資料流。

除了感測器之外,還有其他資料來源可以被我們的裝置利用。這些包括數位裝置日誌、網路封包和無線電傳輸等。儘管它們的來源不同,但這些次要資料流可以成為AI演算法的資訊來源,就像感測器資料一樣令人興奮。

不同的感測器提供不同格式的資料。在邊緣AI應用中,常見的幾種資料格式可以概括如下:

時間序列

時間序列資料表示一個或多個值隨時間的變化。時間序列可能包含來自同一實體感測器的多個值——例如,單一感測器元件可能同時提供溫度和濕度的讀數。時間序列資料通常透過以特定速率輪詢感測器來收集,例如每秒一定次數,以產生訊號。輪詢的速率稱為取樣率或頻率。通常,個別讀數(稱為樣本)是在恆定的時間間隔內收集的,因此兩個樣本之間的時間間隔始終相同。

其他時間序列可能是非週期性的,這意味著樣本不是以恆定的速率收集的。例如,在檢測特定事件的感測器的情況下,可能會發生這種情況——例如,當某物進入一定距離範圍內時,觸發一個引腳的近接感測器。在這種情況下,通常會捕捉事件發生的確切時間以及感測器值本身。

時間序列可能代表摘要資訊。例如,時間序列可以由自上一個值以來某事件發生的次陣列成。

時間序列資料是邊緣AI中最常見的感測器資料形式。它特別有趣,因為除了感測器值之外,訊號還包含了有關值的時序資訊。這在嘗試瞭解情況如何變化時提供了有用的資訊。除了時序資訊的有用性之外,時間序列資料還很有價值,因為它包含了來自同一感測器的多個讀數,從而減少了瞬時異常讀數的影響。

時間序列的頻率沒有典型值——它可以從每天一個樣本到每秒數百萬個樣本不等。

音訊

音訊訊號是時間序列資料的一種特殊情況,它表示聲波在空氣中傳播時的振盪。它們通常以非常高的頻率被捕捉——每秒數千次。由於聽覺是人類的一種感官,因此大量的研究和開發投入到了使邊緣裝置更容易處理音訊資料的創新中。

這些技術包括特殊的訊號處理演算法,使處理音訊資料變得更加容易,而音訊資料在其原始形式中通常是以極高的頻率捕捉的。正如我們稍後將看到的那樣,音訊訊號處理非常普遍,以至於許多嵌入式硬體都具有內建功能,可以高效地執行音訊訊號處理。

邊緣AI音訊處理最廣泛的應用之一是語音檢測和分類別。也就是說,音訊甚至不必在人類聽覺的頻譜範圍內。邊緣AI裝置使用的感測器可以捕捉超聲波(高於人類聽覺範圍)和次聲波(低於人類聽覺範圍)的資料。

影像

影像是由捕捉整個場景的感測器所獲得的資料,與捕捉單一點的感測器相對應。一些感測器,如相機,使用一組微小的元素一次性捕捉整個場景的資料。其他感測器,如LIDAR,透過在一段時間內機械地掃描單一感測器元素來構建影像。

影像具有兩個或更多維度。在其典型形式中,它們可以被視為“畫素”的網格,其中每個畫素的值代表了場景在對應空間點上的某些屬性。一個基本的例子如圖3-1左側所示。

網格的大小(例如,96x96畫素)被稱為影像的解析度。

一個畫素可能有多個值或通道。例如,雖然灰階影像每個畫素只有一個值,表示畫素的亮度或暗度,但彩色影像每個畫素可能有三個值(在RGB模型中),分別代表紅、藍和綠三種顏色,可以混合成可見光譜中的任何其他顏色。這種結構如圖3-1右側所示。

圖表翻譯:

此圖示展示了一個基本的影像表示形式,其中左側顯示了一個簡單的網格結構,而右側則展示了一個具有多個顏色通道的畫素結構。

內容解密:

在理解影像資料時,需要注意其多維結構以及每個畫素的多個值或通道。這種結構使得影像能夠代表豐富的場景資訊。同時,瞭解不同型別的影像(如灰階或彩色影像)之間的差異對於正確處理和分析影像資料至關重要。

資料表示方式與感測器型別

在探討邊緣AI(Edge AI)應用時,瞭解不同型別的感測器及其訊號表示方式是至關重要的。感測器資料的表示方式直接影響到資料處理、儲存及運算的效率。

數值表示法

所有前述的資料類別都使用單一數值來表示個別的感測器讀數。例如,時間序列是一連串的個別讀數,而影像則是由個別讀陣列成的網格。每個讀數都是一個數字,可以在電腦上以多種不同的方式表示。

常見的數值型別

在C++中,用於表示感測器資料的典型數值型別包括:

  • 布林值(1位元):具有兩種可能值的數字
  • 8位元整數:具有256種可能值的非小數數字
  • 16位元整數:具有65,536種可能值的非小數數字
  • 32位元浮點數:可以表示範圍廣泛的數字,具有最多七位小數,最大值為3.4028235 × 10^38

透過改變用於表示值的數值型別,開發人員可以在數值精確度與減少記憶體使用量和計算複雜度之間進行權衡。

感測器型別與訊號模態

市場上有成千上萬種不同的感測器。根據卡內基梅隆大學的定義,模態指的是某件事情發生或被體驗的方式。從人類的角度來看,我們的視覺、聽覺或觸覺都具有不同的模態。

常見的感測器模態

從廣泛的邊緣AI角度來看,以下是一些有意義的感測器分類別:

  1. 聲學與振動
  2. 視覺與場景
  3. 運動與位置
  4. 力與觸覺
  5. 光學、電磁與輻射
  6. 環境、生化與化學

此外,還有許多非感測器資料來源可供邊緣裝置使用。

聲學與振動感測器

聲學感測器允許邊緣AI裝置檢測運動、振動以及人類和動物溝通的效果。這是透過測量振動在不同介質中的傳播來實作的,例如空氣(麥克風)、水(水下麥克風)或地面(地震儀)。

聲學訊號特性

聲學感測器通常提供一個時間序列,描述其介質中壓力的變化。聲學訊號包含跨越不同頻率的資訊,例如歌聲中的高低音。聲學感測器的頻率回應可能是非線性的,且其捕捉高頻訊號的能力取決於其取樣率。

視覺與場景理解

邊緣AI應用通常需要以被動方式瞭解周圍的場景,而無需直接接觸。最常用的感測器是影像感測器,從微小的低功耗相機到超高品質的多兆畫素感測器。

影像感測器的工作原理

影像感測器使用一格感測元件捕捉光線。在相機中,來自場景的光線透過鏡頭聚焦到感測器上。相機能夠成像的區域稱為視野,它取決於鏡頭和影像感測器的大小。

// 影像處理示例程式碼
int main() {
    // 載入影像
    cv::Mat image = cv::imread("image.jpg");
    
    // 檢查影像是否成功載入
    if (image.empty()) {
        std::cerr << "無法載入影像" << std::endl;
        return -1;
    }
    
    // 將影像轉換為灰階
    cv::Mat grayImage;
    cv::cvtColor(image, grayImage, cv::COLOR_BGR2GRAY);
    
    // 顯示原始影像與灰階影像
    cv::imshow("原始影像", image);
    cv::imshow("灰階影像", grayImage);
    cv::waitKey(0);
    
    return 0;
}

內容解密:

此程式碼示例展示瞭如何使用OpenCV函式庫載入一張影像,將其轉換為灰階,並顯示原始影像和灰階影像。首先,我們使用cv::imread函式載入影像,並檢查是否成功載入。接著,使用cv::cvtColor函式將影像從BGR色彩空間轉換為灰階色彩空間。最後,使用cv::imshow函式顯示兩張影像,並透過cv::waitKey(0)等待使用者按鍵。

影像感測器與運動感測技術

在邊緣AI(Edge AI)裝置中,感測器扮演著至關重要的角色,用於捕捉和分析環境中的各種資料。其中,影像感測器和運動感測器是兩類別常見的感測器,它們能夠提供豐富的資訊,幫助裝置理解周遭環境。

影像感測器

影像感測器能夠捕捉視覺資料,包括灰階或彩色(紅、綠、藍,即RGB)影像。它們的特性包括:

  • 光譜回應:影像感測器對不同波長的光線敏感,這些波長可能超出人類視覺範圍,甚至包括紅外線輻射。熱成像相機就是利用這一特性來「觀察」熱量。
  • 畫素大小:較大的感測器能夠在每個畫素上捕捉更多的光線,提高其靈敏度。
  • 感測器解析度:感測器上的元素越多,能夠捕捉的細節就越豐富。
  • 幀率:感測器捕捉影像的頻率,通常以每秒幀數(FPS)表示。

為了增強影像捕捉能力,通常會將影像感測器與光源結合使用,例如紅外線LED與紅外線敏感相機的組合,可以在不幹擾人類或動物的情況下照亮黑暗場景。

新型影像感測器

  • 事件相機(Event Cameras):與傳統相機不同,事件相機的每個畫素獨立回應亮度變化,只有在發生變化時才會產生訊號。這樣產生的資料是個別畫素變化的時間序列,更容易在邊緣AI裝置上處理。
  • 距離成像感測器(Range Imaging Sensors):能夠透過發射光線並測量其傳回時間(三維視覺技術)來捕捉三維環境資訊。常見的技術包括LIDAR(雷射雷達)。

LIDAR技術透過掃描周圍環境並測量反射回來的光線,實作三維視覺化,如圖3-4所示。

圖表翻譯:圖3-4展示了來自PandaSet開源LIDAR資料集的典型LIDAR「點雲」,每個點代表了雷射測量的距離;右上角的插圖顯示了同一場景從影像感測器的視角。

LIDAR等三維視覺技術通常比標準影像感測器更大、更複雜、更昂貴,且能耗更高。它們生成的龐大資料對邊緣裝置來說也是一個挑戰。

運動與位置感測

邊緣AI裝置瞭解自身位置和運動狀態對於許多應用至關重要。有多種感測器可以幫助實作這一點,從簡單的機械傾斜開關到複雜的衛星定位系統(GPS)。

常見的運動與位置感測器

  • 傾斜感測器(Tilt Sensor):根據方向的不同而開啟或關閉的機械開關,成本低廉,使用簡便。
  • 加速度計(Accelerometer):測量物體在一個或多個軸上的加速度,能夠感知重力方向。
  • 陀螺儀(Gyroscope):測量物體的旋轉速率,常與加速度計結合使用,以全面描述物體在三維空間中的運動。
  • 旋轉或線性編碼器(Rotary or Linear Encoder):精確測量軸或線性機制的確切位置。
  • 飛行時間(Time of Flight):透過發射電磁波(光或無線電波)來測量距離。
  • 即時定位系統(RTLS, Real-Time Locating Systems):利用多個固定位置的收發器來追蹤物體的位置。
  • 慣性測量單元(IMU, Inertial Measurement Unit):結合多個感測器來估計裝置的當前位置,根據內部參考系的運動測量。
  • 全球定位系統(GPS, Global Positioning System):被動系統,利用衛星訊號確定裝置位置,需要與多顆衛星保持視線通暢。

這些運動和位置資料通常以時間序列的形式表示。根據應用需求,可以選擇適合成本和能耗預算的感測器。通常,需要越高的絕對位置精確度,就意味著越高的成本和複雜度。

力與觸覺感測

力與觸覺感測器,如開關和負載單元,幫助邊緣AI裝置測量外界施加的力和接觸資訊。

內容解密:

  1. 影像感測器的基本原理:瞭解不同型別的影像感測器及其特性對於選擇合適的裝置至關重要。事件相機和距離成像感測器為新型技術,能夠提供更高效的資料處理和三維環境感知能力。
  2. 運動與位置感測的重要性:透過各種運動和位置感測器,邊緣AI裝置能夠更好地理解自身狀態和周圍環境,從而實作更精確的控制和導航。
  3. 力與觸覺感測的應用:力與觸覺感測器使裝置能夠感知外界的物理互動,對於機器人控制和互動式應用具有重要意義。