Worker模型與非同步程式設計模式詳解

Worker 模型模式是一種平行處理架構，適用於任務佇列和分散式運算。它由 Worker、任務佇列和分派器組成，Worker 從佇列提取任務並執行，分派器負責任務分配。Python 的 multiprocessing 模組可實作 Worker 模型，建立多個行程平行處理任務。Future 與 Promise 模式是非同步程式設計的重要概念，Future 代表尚未完成的運算結果，Promise 則提供結果或錯誤資訊。線上購物訂單追蹤、餐飲外送和客戶支援系統都是常見的應用場景。concurrent.futures 和 asyncio 函式庫提供簡便的 Future 與 Promise 實作方式，提升 I/O 密集型任務的效率。觀察者模式在反應式程式設計中扮演重要角色，例如機場航班資訊顯示系統和試算表應用程式。ReactiveX 函式庫提供 Observable 和 Observer，用於處理非同步資料流。在反應式程式設計中，觀察者模式可應用於集合管線，處理大規模資料集的對映、歸約和分組等操作。結合 Faker 函式庫可生成模擬資料，實作動態資料流處理。同時執行多個資料流可提升系統吞吐量。除了觀察者模式，Actor 模型也是一種平行計算模型，Actor 之間透過訊息傳遞進行通訊。

Worker 模型模式詳解與實作

Worker 模型模式是一種常見的平行處理架構，廣泛應用於任務佇列、分散式運算等領域。本文將深入探討該模式的核心元件、實作細節及其在實際場景中的應用。

Worker 模型模式的核心元件

Worker（工作單元）
Worker 是執行任務的基本單元，每個 Worker 可以獨立處理一個或多個任務。在實際應用中，Worker 可以是執行緒、行程或分散式節點。
Task Queue（任務佇列）
任務佇列是存放待執行任務的核心資料結構。Worker 從佇列中提取任務進行處理，實作任務分配與執行的解耦。
Dispatcher（分派器）
分派器負責根據 Worker 的可用性、負載或優先順序分配任務，最佳化資源利用率和任務分配效率。

Worker 模型模式實作範例

以下範例展示瞭如何使用 Python 的 multiprocessing 模組實作 Worker 模型：

from multiprocessing import Process, Queue
import time

def worker(task_queue):
    """Worker 處理任務佇列中的任務"""
    while not task_queue.empty():
        task = task_queue.get()
        print(f"Worker {task} 開始處理")
        time.sleep(1)  # 模擬任務處理時間
        print(f"Worker {task} 完成處理")

def main():
    # 建立任務佇列並新增任務
    task_queue = Queue()
    for i in range(10):
        task_queue.put(i)

    # 建立多個 Worker 行程
    processes = [
        Process(target=worker, args=(task_queue,))
        for _ in range(5)
    ]

    # 啟動所有 Worker 行程
    for p in processes:
        p.start()

    # 等待所有 Worker 行程完成
    for p in processes:
        p.join()

    print("所有任務已完成")

if __name__ == "__main__":
    main()

程式碼解析：

此範例展示了 Worker 模型的基本實作流程：

建立任務佇列並新增待處理任務。
建立多個 Worker 行程並啟動。
Worker 從任務佇列中提取任務並執行。
主程式等待所有 Worker 完成任務後結束。

輸出範例如下：

Worker 0 開始處理
Worker 1 開始處理
Worker 2 開始處理
Worker 3 開始處理
Worker 4 開始處理
Worker 0 完成處理
Worker 5 開始處理
Worker 1 完成處理
Worker 6 開始處理
...
所有任務已完成

Worker 模型流程圖

圖表解析：

此流程圖展示了 Worker 模型的運作機制：

首先建立任務佇列並新增任務。
建立並啟動多個 Worker 行程。
Worker 不斷從佇列中提取任務進行處理，直到佇列清空。
最終結束所有 Worker 行程。

Future 與 Promise 模式

Future 與 Promise 是非同步程式設計中的重要概念，用於處理延遲結果。

核心概念

Future：代表尚未完成的運算結果，可透過回呼、輪詢或阻塞方式取得結果。
Promise：與 Future 對應的寫入端，用於最終提供運算結果或錯誤資訊。

實際應用場景

線上購物訂單追蹤：訂單確認後立即提供追蹤號碼（Future），訂單處理過程逐步更新狀態（Promise 實作）。
餐飲外送服務：訂單成立後提供預估送達時間（Future），後臺持續更新訂單狀態直到完成。
客戶支援系統：提交工單後立即獲得工單號碼（Future），後續由支援團隊處理並回覆（Promise 實作）。

Future 與 Promise 模式的應用場景

資料處理管線：透過非同步處理多階段資料轉換，提升系統吞吐量。
任務排程系統：使用 Future 表示待執行任務，實作非阻塞任務管理。
複雜資料函式庫查詢：非同步執行資料函式庫操作，保持應用程式回應性。

Future 與 Promise 模式流程圖

圖表解析：

此序列圖展示了 Future 與 Promise 在非同步操作中的運作流程：

使用者端發起非同步請求。
伺服器建立 Future 物件並立即傳回。
資料函式庫查詢完成後更新 Future 狀態。
使用者端最終取得查詢結果。

同步與非同步模式的應用

在現代軟體開發中，為了提升應用程式的效能和回應速度，開發者經常需要處理非同步操作。非同步程式設計允許應用程式在執行耗時操作（如網路請求、檔案 I/O 或資料函式庫查詢）時，依然能夠回應使用者輸入並執行其他任務。

Future 與 Promise 模式的實作原理

Future 與 Promise 模式是一種常見的非同步程式設計模式，主要用於處理非同步操作。該模式的核心概念包括：

初始化：啟動非同步操作時，函式立即傳回一個 Future 物件，該物件作為非同步操作結果的佔位符。
執行：非同步操作在背景執行，不阻塞主執行緒。操作完成後，將結果傳遞給與 Future 相關聯的 Promise 物件。
解析：Promise 物件根據非同步操作的結果被履行（fulfilled）或拒絕（rejected），進而影響相關聯的 Future 物件狀態。開發者可以透過回呼函式或持續函式來處理 Future 的結果。

使用 `concurrent.futures` 實作 Future 與 Promise 模式

Python 的 concurrent.futures 模組提供了一種簡便的方式來實作 Future 與 Promise 模式。以下是一個範例：

from concurrent.futures import ThreadPoolExecutor, as_completed

def square(x):
    """計算數字的平方"""
    return x * x

# 使用 ThreadPoolExecutor 執行非同步任務
with ThreadPoolExecutor() as executor:
    future1 = executor.submit(square, 2)
    future2 = executor.submit(square, 3)
    future3 = executor.submit(square, 4)
    futures = [future1, future2, future3]
    
    # 迭代已完成的 Future 物件並取得結果
    for future in as_completed(futures):
        print(f"Result: {future.result()}")

程式碼解析：

此範例中，我們定義了一個 square 函式來計算數字的平方。透過 ThreadPoolExecutor，我們將 square 函式提交為非同步任務，並取得對應的 Future 物件。使用 as_completed 函式，我們可以迭代已完成的 Future 物件並列印其結果。

使用 `asyncio` 實作 Future 與 Promise 模式

Python 的 asyncio 函式庫是專為 I/O 密集型任務設計的非同步程式設計函式庫。以下是一個使用 asyncio 的範例：

import asyncio

async def square(x):
    """模擬 I/O 密集型操作並計算數字的平方"""
    await asyncio.sleep(1)  # 模擬 I/O 等待
    return x * x

async def main():
    """建立 Future 物件並等待其完成"""
    fut1 = asyncio.ensure_future(square(2))
    fut2 = asyncio.ensure_future(square(3))
    fut3 = asyncio.ensure_future(square(4))
    results = await asyncio.gather(fut1, fut2, fut3)
    
    # 列印結果
    for result in results:
        print(f"Result: {result}")

# 執行 asyncio 事件迴圈
if __name__ == "__main__":
    asyncio.run(main())

程式碼解析：

此範例展示瞭如何使用 asyncio 來執行非同步任務。我們定義了一個 square 協程來模擬 I/O 密集型操作並計算數字的平方。在 main 協程中，我們建立了多個 Future 物件並使用 asyncio.gather 來等待它們完成。最後，我們列印出所有任務的結果。

反應式程式設計中的 Observer 模式

Observer 模式在反應式程式設計中扮演重要角色。反應式程式設計是一種以資料流為中心的程式設計正規化，允許開發者以宣告式的方式處理非同步資料流。

實際案例：

機場航班資訊顯示系統：該系統不斷推播航班狀態更新（如到達、出發、延誤或取消），訂閱該資訊的觀察者（如旅客、航空公司工作人員）能夠即時接收更新並做出相應的反應。
試算表應用程式：當使用者修改某個儲存格的值時，試算表應用程式會自動重新計算所有依賴該儲存格的公式並更新顯示結果。這種行為展現了反應式程式設計的核心思想。

ReactiveX 與 Observable

ReactiveX 是一個跨語言的反應式程式設計函式庫，提供了一套強大的 API 來處理非同步資料流。其核心概念是 Observable（可觀察序列），代表一個非同步的資料流。Observer（觀察者）可以訂閱 Observable，以接收資料流中的專案並作出相應的處理。

圖表解析：

此圖示展示了 Observable 與 Observer 之間的關係。Observable 不斷推播資料給 Observer，Observer 接收資料並進行處理，最終產生結果。這種模式非常適合處理實時資料流或事件驅動的應用場景。

平行與非同步模式在反應式程式設計中的應用

在現代軟體開發中，處理平行與非同步操作的需求日益增加。反應式程式設計（Reactive Programming）提供了一種有效的解決方案，特別是在處理複雜的資料流和非同步事件時。本文將深入探討觀察者模式（Observer Pattern）在反應式程式設計中的應用，並透過實際範例展示其實作方式。

觀察者模式在反應式程式設計中的使用案例

觀察者模式是一種設計模式，允許物件之間建立一對多的依賴關係，當一個物件狀態發生變化時，所有依賴它的物件都會收到通知並自動更新。在反應式程式設計中，這種模式被廣泛應用於處理資料流和事件。

集合管線（Collection Pipeline）

一個典型的使用案例是集合管線的概念。透過使用可觀察物件（Observable），可以對資料序列進行諸如對映（map）、歸約（reduce）和分組（groupby）等操作。這種方法在處理大規模資料集時尤其有用。

from pathlib import Path
import reactivex as rx
from reactivex import operators as ops

def firstnames_from_db(path: Path):
    file = path.open()
    return rx.from_iterable(file).pipe(
        ops.flat_map(lambda content: rx.from_iterable(content.split(", "))),
        ops.filter(lambda name: name != ""),
        ops.map(lambda name: name.split()[0]),
        ops.group_by(lambda firstname: firstname),
        ops.flat_map(lambda grp: grp.pipe(ops.map(lambda ct: (grp.key, ct))))
    )

def main():
    db_path = Path(__file__).parent / Path("people.txt")
    rx.interval(5.0).pipe(
        ops.flat_map(lambda i: firstnames_from_db(db_path))
    ).subscribe(lambda val: print(str(val)))
    input("Starting... Press any key and ENTER, to quit\n")

程式碼解析

firstnames_from_db 函式：該函式從指設定檔案中讀取資料，並傳回一個可觀察物件。資料處理流程包括：
- 將檔案內容分割成個別的名字
- 過濾空字串
- 提取每個名字的首個單詞（姓氏）
- 按照姓氏進行分組
- 統計每個姓氏的出現次數
main 函式：建立一個每5秒觸發一次的可觀察物件，並與從檔案中讀取的資料合併。每當有新的資料到達時，列印預出處理後的結果。

動態資料流處理

上述範例展示瞭如何處理靜態資料。但在實際應用中，我們往往需要處理動態生成的資料。為此，我們可以結合第三方函式庫（如Faker）來生成模擬資料。

from faker import Faker
import sys

fake = Faker()
args = sys.argv[1:]

if len(args) == 1:
    output_filename = args[0]
    persons = [{"firstname": fake.first_name(), "lastname": fake.last_name()} for _ in range(20)]
    data = ", ".join([f"{p['firstname']} {p['lastname']}" for p in persons]) + ", "
    with open(output_filename, "a") as f:
        f.write(data)
else:
    print("You need to pass the output filepath!")

同時執行多個資料流

透過結合上述兩個指令碼，我們可以實作動態資料生成和即時處理：

在一個終端機視窗中執行資料生成指令碼，指定輸出檔案路徑。
在另一個終端機視窗中執行觀察者模式實作指令碼。

這樣，每當資料生成指令碼執行時，就會向檔案中追加新的模擬資料，而觀察者模式實作指令碼則會即時處理這些新資料。

其他平行與非同步模式

除了觀察者模式外，還有多種其他平行與非同步模式可供開發者選擇，例如：

Actor 模型：一種用於處理平行計算的概念模型。Actor 之間透過訊息傳遞進行通訊，每個 Actor 可以根據收到的訊息做出本地決策、建立新的 Actor 或決定如何回應下一個訊息。

Plantuml 資料處理流程

@startuml
skinparam backgroundColor #FEFEFE
skinparam componentStyle rectangle

title Worker模型與非同步程式設計模式詳解

package "機器學習流程" {
    package "資料處理" {
        component [資料收集] as collect
        component [資料清洗] as clean
        component [特徵工程] as feature
    }

    package "模型訓練" {
        component [模型選擇] as select
        component [超參數調優] as tune
        component [交叉驗證] as cv
    }

    package "評估部署" {
        component [模型評估] as eval
        component [模型部署] as deploy
        component [監控維護] as monitor
    }
}

collect --> clean : 原始資料
clean --> feature : 乾淨資料
feature --> select : 特徵向量
select --> tune : 基礎模型
tune --> cv : 最佳參數
cv --> eval : 訓練模型
eval --> deploy : 驗證模型
deploy --> monitor : 生產模型

note right of feature
  特徵工程包含：
  - 特徵選擇
  - 特徵轉換
  - 降維處理
end note

note right of eval
  評估指標：
  - 準確率/召回率
  - F1 Score
  - AUC-ROC
end note

@enduml

圖表翻譯

此圖示展示了一個基本的資料處理流程。流程始於「開始」階段，接著進行資料有效性檢查。若資料有效，系統會進入「處理資料」階段；若資料無效，則轉向「回報錯誤」階段。最後，無論資料處理成功與否，流程都會到達「完成處理」階段。此圖清晰地說明瞭程式中的條件分支邏輯以及不同處理路徑的銜接方式，幫助讀者理解整體處理邏輯。

隨著資料驅動應用的不斷增加，反應式程式設計和平行處理技術將在未來軟體開發中扮演越來越重要的角色。開發者需要掌握這些技術，以應對日益複雜的資料處理需求和效能挑戰。透過結合反應式程式設計和其他平行模式，我們可以建立更高效、更具可擴充套件性的系統，以滿足現代應用的需求。

玄貓 BlackCat

技術愛好者，專注於分享程式開發、雲端技術與 AI 應用的心得體會。

Worker模型與非同步程式設計模式詳解

Worker 模型模式詳解與實作

Worker 模型模式的核心元件

Worker 模型模式實作範例

程式碼解析：

Worker 模型流程圖

圖表解析：

Future 與 Promise 模式

核心概念

實際應用場景

Future 與 Promise 模式的應用場景

Future 與 Promise 模式流程圖

圖表解析：

同步與非同步模式的應用

Future 與 Promise 模式的實作原理

使用 concurrent.futures 實作 Future 與 Promise 模式

程式碼解析：

使用 asyncio 實作 Future 與 Promise 模式

程式碼解析：

反應式程式設計中的 Observer 模式

實際案例：

ReactiveX 與 Observable

圖表解析：

平行與非同步模式在反應式程式設計中的應用

觀察者模式在反應式程式設計中的使用案例

集合管線（Collection Pipeline）

程式碼解析

動態資料流處理

同時執行多個資料流

其他平行與非同步模式

Plantuml 資料處理流程

圖表翻譯

玄貓 BlackCat

使用 `concurrent.futures` 實作 Future 與 Promise 模式

使用 `asyncio` 實作 Future 與 Promise 模式