系統效能

2 Articles

深入解析 MapReduce 計數器以診斷作業效能瓶頸

2025年04月23日 – 10 分鐘閱讀

本文深度剖析 MapReduce 作業的細節與進階計數器，闡述如何運用這些數據指標洞察作業效能。內容涵蓋中間數據處理、數據溢寫、JVM 垃圾回收、虛擬與堆內存使用，以及關鍵的 Shuffle 階段錯誤計數。透過分析 Combine records、Spilled Records、GC time 與 Shuffle

本文深入探討 Apache Spark 的性能調優，重點闡述如何利用 Spark UI 作為核心診斷工具。文章詳細介紹 Jobs、Stages、Executors 與 SQL 等關鍵選項卡的功能，說明如何透過 DAG 可視化、Shuffle 資料分析、記憶體與 GC 監控及 SQL 執行計畫，精準識別資料傾斜、記憶體溢出等性能瓶頸。最終，本文提出基於分析結果的具體調優策略，涵蓋資源合理配置、減少資料 Shuffle 與優化查詢結構，旨在協助資料工程師系統性地提升 Spark 應用程式的執行效率與成本效益。

系統效能

深入解析 MapReduce 計數器以診斷作業效能瓶頸

深入解析 Spark UI 實現高效能應用程式調優