醫療資料分析與視覺化：從理論到實踐的完整指南

當醫療產業面對日益複雜的營運挑戰與不斷提升的照護品質要求時，資料分析與視覺化技術已經成為醫療機構不可或缺的管理工具。從病床使用率優化、手術排程改善，到疾病預測與個人化醫療，資料科學正在深刻改變醫療服務的提供方式。然而醫療資料的特殊性在於其高度敏感性、複雜性與異質性，需要特別的處理方法與專業知識。

台灣的醫療機構在推動資料分析應用時，常面臨資料分散在不同系統、格式不一致、缺乏整合平台等挑戰。電子病歷系統、醫令系統、檢驗系統、影像系統等各自為政，形成資料孤島。即使資料能夠整合，如何從海量資料中提取有價值的洞察，並以清晰易懂的方式呈現給不同背景的利害關係人，也是一大挑戰。本文將透過實際案例展示醫療資料分析與視覺化的完整流程，提供可立即應用的技術方案與最佳實務。

醫療資料分析的挑戰與機會

台灣某區域醫院在面對健保給付壓力與病患需求成長的雙重挑戰下，決定透過資料分析優化營運效率。該院擁有五百床規模，涵蓋內科、外科、婦產科、小兒科等主要科別。醫院管理階層注意到病床周轉率偏低、平均住院天數較同級醫院長、急診壅塞等問題，但缺乏具體資料支持決策。傳統的月報統計雖然提供基本數字，但無法深入分析問題根源，更難以預測趨勢或模擬改善方案的效果。

資訊室與醫務管理部門組成跨職能團隊，啟動醫療資料分析專案。專案初期面臨多重挑戰。首先是資料品質問題，不同系統的資料格式不一致，存在大量缺失值與錯誤值。某些欄位的定義在不同科別有不同詮釋，導致資料整合困難。其次是技術能力落差，醫務管理人員熟悉醫療流程但缺乏程式設計能力，資訊人員擅長技術但不了解醫療領域知識。第三是隱私保護要求，醫療資料涉及病患隱私，任何分析都必須符合個資法與醫療法規範。

團隊決定採用Python作為主要分析工具，這個選擇基於幾個考量。Python擁有豐富的資料分析與視覺化套件，學習曲線相對平緩，且有龐大的社群支援。Pandas提供強大的資料處理能力，能夠處理醫療資料常見的複雜結構。Matplotlib與Seaborn提供靈活的視覺化功能，能夠產生符合醫療專業需求的圖表。Plotly則支援互動式視覺化，讓使用者可以深入探索資料。

資料收集階段從醫院資訊系統匯出近三年的住院資料，包含入院日期、出院日期、科別、主診斷、次診斷、手術記錄、檢驗結果、用藥記錄等欄位。為保護隱私，所有個人識別資訊在匯出時就進行去識別化處理，以流水號取代病歷號，移除姓名、身分證字號等直接識別資訊。資料以CSV格式儲存，總計約五萬筆住院記錄。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

# 設定中文字型
plt.rcParams['font.sans-serif'] = ['Microsoft JhengHei']
plt.rcParams['axes.unicode_minus'] = False

class MedicalDataAnalyzer:
    """
    醫療資料分析器
    
    提供醫療資料的載入、清理、分析與視覺化功能
    專門處理住院資料的常見分析需求
    """
    
    def __init__(self, data_path):
        """
        初始化醫療資料分析器
        
        參數說明:
            data_path: 資料檔案路徑
        """
        self.data_path = data_path
        self.df = None
        self.cleaned_df = None
        
    def load_data(self):
        """
        載入醫療資料
        
        從CSV檔案載入資料並進行初步檢查
        識別資料型態、缺失值等基本資訊
        """
        try:
            # 載入資料
            self.df = pd.read_csv(
                self.data_path,
                encoding='utf-8',
                parse_dates=['入院日期', '出院日期']
            )
            
            print("資料載入成功")
            print(f"資料筆數: {len(self.df)}")
            print(f"欄位數量: {len(self.df.columns)}")
            print("\n欄位名稱:")
            print(self.df.columns.tolist())
            
            # 顯示基本統計資訊
            print("\n資料概覽:")
            print(self.df.info())
            
            return self.df
            
        except Exception as e:
            print(f"資料載入失敗: {str(e)}")
            return None
    
    def clean_data(self):
        """
        清理醫療資料
        
        處理缺失值、異常值、重複值等資料品質問題
        計算衍生欄位如住院天數、季節等
        """
        if self.df is None:
            print("請先載入資料")
            return None
        
        print("開始資料清理...")
        
        # 複製資料避免修改原始資料
        self.cleaned_df = self.df.copy()
        
        # 處理缺失值
        print("\n處理缺失值...")
        missing_before = self.cleaned_df.isnull().sum()
        print("清理前缺失值統計:")
        print(missing_before[missing_before > 0])
        
        # 移除出院日期缺失的記錄（仍在住院中或資料錯誤）
        self.cleaned_df = self.cleaned_df.dropna(subset=['出院日期'])
        
        # 診斷欄位的缺失值填補為'未註記'
        self.cleaned_df['主診斷'].fillna('未註記', inplace=True)
        
        # 處理異常值
        print("\n處理異常值...")
        
        # 計算住院天數
        self.cleaned_df['住院天數'] = (
            self.cleaned_df['出院日期'] - self.cleaned_df['入院日期']
        ).dt.days + 1
        
        # 移除住院天數異常的記錄（小於等於0或大於365天）
        invalid_los = (
            (self.cleaned_df['住院天數'] <= 0) | 
            (self.cleaned_df['住院天數'] > 365)
        )
        print(f"發現 {invalid_los.sum()} 筆住院天數異常記錄")
        self.cleaned_df = self.cleaned_df[~invalid_los]
        
        # 處理重複值
        print("\n處理重複值...")
        duplicates = self.cleaned_df.duplicated()
        print(f"發現 {duplicates.sum()} 筆重複記錄")
        self.cleaned_df = self.cleaned_df.drop_duplicates()
        
        # 計算衍生欄位
        print("\n計算衍生欄位...")
        
        # 入院年月
        self.cleaned_df['入院年月'] = self.cleaned_df['入院日期'].dt.to_period('M')
        
        # 入院季度
        self.cleaned_df['入院季度'] = self.cleaned_df['入院日期'].dt.quarter
        
        # 入院星期幾
        self.cleaned_df['入院星期'] = self.cleaned_df['入院日期'].dt.dayofweek
        
        # 是否為週末入院
        self.cleaned_df['週末入院'] = self.cleaned_df['入院星期'].isin([5, 6])
        
        # 年齡分組
        if '年齡' in self.cleaned_df.columns:
            self.cleaned_df['年齡組'] = pd.cut(
                self.cleaned_df['年齡'],
                bins=[0, 18, 40, 65, 100],
                labels=['兒童', '青壯年', '中年', '老年']
            )
        
        print("\n資料清理完成")
        print(f"清理後資料筆數: {len(self.cleaned_df)}")
        
        return self.cleaned_df
    
    def explore_data(self):
        """
        探索性資料分析
        
        產生描述性統計、分布分析等
        協助了解資料的基本特性
        """
        if self.cleaned_df is None:
            print("請先進行資料清理")
            return
        
        print("=== 探索性資料分析 ===\n")
        
        # 基本統計資訊
        print("住院天數統計:")
        print(self.cleaned_df['住院天數'].describe())
        
        # 各科別統計
        print("\n各科別住院人次:")
        dept_counts = self.cleaned_df['科別'].value_counts()
        print(dept_counts)
        
        # 各科別平均住院天數
        print("\n各科別平均住院天數:")
        dept_los = self.cleaned_df.groupby('科別')['住院天數'].agg([
            ('平均', 'mean'),
            ('中位數', 'median'),
            ('標準差', 'std')
        ]).round(2)
        print(dept_los)
        
        # 治療結果統計
        if '治療結果' in self.cleaned_df.columns:
            print("\n治療結果分布:")
            outcome_counts = self.cleaned_df['治療結果'].value_counts()
            print(outcome_counts)
            print(f"\n出院率: {(outcome_counts.get('出院', 0) / len(self.cleaned_df) * 100):.2f}%")
        
        # 時間趨勢
        print("\n月度住院人次:")
        monthly_admits = self.cleaned_df.groupby('入院年月').size()
        print(monthly_admits.tail(12))
    
    def visualize_length_of_stay(self):
        """
        視覺化住院天數分析
        
        產生多種圖表展示住院天數的分布與差異
        包含盒鬚圖、直方圖、小提琴圖等
        """
        if self.cleaned_df is None:
            print("請先進行資料清理")
            return
        
        fig, axes = plt.subplots(2, 2, figsize=(16, 12))
        
        # 圖一：各科別住院天數盒鬚圖
        sns.boxplot(
            data=self.cleaned_df,
            x='科別',
            y='住院天數',
            ax=axes[0, 0]
        )
        axes[0, 0].set_title('各科別住院天數分布（盒鬚圖）', fontsize=14, fontweight='bold')
        axes[0, 0].set_xlabel('科別', fontsize=12)
        axes[0, 0].set_ylabel('住院天數', fontsize=12)
        axes[0, 0].tick_params(axis='x', rotation=45)
        
        # 圖二：住院天數直方圖
        axes[0, 1].hist(
            self.cleaned_df['住院天數'],
            bins=50,
            edgecolor='black',
            alpha=0.7
        )
        axes[0, 1].set_title('住院天數分布（直方圖）', fontsize=14, fontweight='bold')
        axes[0, 1].set_xlabel('住院天數', fontsize=12)
        axes[0, 1].set_ylabel('頻次', fontsize=12)
        axes[0, 1].axvline(
            self.cleaned_df['住院天數'].mean(),
            color='red',
            linestyle='--',
            label=f"平均值: {self.cleaned_df['住院天數'].mean():.1f}天"
        )
        axes[0, 1].legend()
        
        # 圖三：各科別住院天數小提琴圖
        sns.violinplot(
            data=self.cleaned_df,
            x='科別',
            y='住院天數',
            ax=axes[1, 0]
        )
        axes[1, 0].set_title('各科別住院天數分布（小提琴圖）', fontsize=14, fontweight='bold')
        axes[1, 0].set_xlabel('科別', fontsize=12)
        axes[1, 0].set_ylabel('住院天數', fontsize=12)
        axes[1, 0].tick_params(axis='x', rotation=45)
        
        # 圖四：各科別平均住院天數長條圖
        dept_avg_los = self.cleaned_df.groupby('科別')['住院天數'].mean().sort_values(ascending=False)
        axes[1, 1].barh(dept_avg_los.index, dept_avg_los.values)
        axes[1, 1].set_title('各科別平均住院天數', fontsize=14, fontweight='bold')
        axes[1, 1].set_xlabel('平均住院天數', fontsize=12)
        axes[1, 1].set_ylabel('科別', fontsize=12)
        
        # 在長條上標示數值
        for i, v in enumerate(dept_avg_los.values):
            axes[1, 1].text(v, i, f' {v:.1f}天', va='center')
        
        plt.tight_layout()
        return fig
    
    def visualize_temporal_trends(self):
        """
        視覺化時間趨勢分析
        
        展示住院人次、平均住院天數等指標的時間變化
        協助識別季節性模式與長期趨勢
        """
        if self.cleaned_df is None:
            print("請先進行資料清理")
            return
        
        fig, axes = plt.subplots(2, 2, figsize=(16, 12))
        
        # 圖一：月度住院人次趨勢
        monthly_admits = self.cleaned_df.groupby('入院年月').size()
        axes[0, 0].plot(
            range(len(monthly_admits)),
            monthly_admits.values,
            marker='o',
            linewidth=2
        )
        axes[0, 0].set_title('月度住院人次趨勢', fontsize=14, fontweight='bold')
        axes[0, 0].set_xlabel('月份', fontsize=12)
        axes[0, 0].set_ylabel('住院人次', fontsize=12)
        axes[0, 0].grid(True, alpha=0.3)
        
        # 圖二：月度平均住院天數趨勢
        monthly_avg_los = self.cleaned_df.groupby('入院年月')['住院天數'].mean()
        axes[0, 1].plot(
            range(len(monthly_avg_los)),
            monthly_avg_los.values,
            marker='s',
            linewidth=2,
            color='green'
        )
        axes[0, 1].set_title('月度平均住院天數趨勢', fontsize=14, fontweight='bold')
        axes[0, 1].set_xlabel('月份', fontsize=12)
        axes[0, 1].set_ylabel('平均住院天數', fontsize=12)
        axes[0, 1].grid(True, alpha=0.3)
        
        # 圖三：季度住院人次比較
        quarterly_admits = self.cleaned_df.groupby('入院季度').size()
        axes[1, 0].bar(
            quarterly_admits.index,
            quarterly_admits.values,
            color=['#FF6B6B', '#4ECDC4', '#45B7D1', '#FFA07A']
        )
        axes[1, 0].set_title('各季度住院人次', fontsize=14, fontweight='bold')
        axes[1, 0].set_xlabel('季度', fontsize=12)
        axes[1, 0].set_ylabel('住院人次', fontsize=12)
        axes[1, 0].set_xticks([1, 2, 3, 4])
        axes[1, 0].set_xticklabels(['第一季', '第二季', '第三季', '第四季'])
        
        # 圖四：星期分布
        weekday_admits = self.cleaned_df.groupby('入院星期').size()
        weekday_labels = ['週一', '週二', '週三', '週四', '週五', '週六', '週日']
        axes[1, 1].bar(
            range(7),
            weekday_admits.values,
            color='coral'
        )
        axes[1, 1].set_title('各星期住院人次分布', fontsize=14, fontweight='bold')
        axes[1, 1].set_xlabel('星期', fontsize=12)
        axes[1, 1].set_ylabel('住院人次', fontsize=12)
        axes[1, 1].set_xticks(range(7))
        axes[1, 1].set_xticklabels(weekday_labels)
        
        plt.tight_layout()
        return fig
    
    def create_interactive_dashboard(self):
        """
        建立互動式儀表板
        
        使用Plotly建立可互動探索的視覺化儀表板
        支援篩選、縮放、懸停顯示詳細資訊等功能
        """
        if self.cleaned_df is None:
            print("請先進行資料清理")
            return
        
        # 準備儀表板資料
        dept_summary = self.cleaned_df.groupby('科別').agg({
            '住院天數': ['count', 'mean', 'median'],
            '病歷號': 'count'
        }).round(2)
        
        dept_summary.columns = ['住院人次', '平均住院天數', '中位住院天數', '總病例數']
        dept_summary = dept_summary.reset_index()
        
        # 建立互動式長條圖
        fig = go.Figure()
        
        fig.add_trace(go.Bar(
            x=dept_summary['科別'],
            y=dept_summary['平均住院天數'],
            name='平均住院天數',
            marker_color='lightblue',
            hovertemplate='<b>%{x}</b><br>平均住院天數: %{y:.2f}天<extra></extra>'
        ))
        
        fig.add_trace(go.Bar(
            x=dept_summary['科別'],
            y=dept_summary['中位住院天數'],
            name='中位住院天數',
            marker_color='lightcoral',
            hovertemplate='<b>%{x}</b><br>中位住院天數: %{y:.2f}天<extra></extra>'
        ))
        
        fig.update_layout(
            title='各科別住院天數統計（互動式）',
            xaxis_title='科別',
            yaxis_title='住院天數',
            barmode='group',
            hovermode='x unified',
            height=500
        )
        
        return fig
    
    def analyze_readmission(self, days_threshold=30):
        """
        分析再入院率
        
        識別在特定天數內再次入院的病患
        這是重要的醫療品質指標
        
        參數說明:
            days_threshold: 再入院的天數門檻，預設30天
        """
        if self.cleaned_df is None:
            print("請先進行資料清理")
            return
        
        # 按病歷號和入院日期排序
        df_sorted = self.cleaned_df.sort_values(['病歷號', '入院日期'])
        
        # 計算同一病患相鄰兩次入院的間隔天數
        df_sorted['下次入院日期'] = df_sorted.groupby('病歷號')['入院日期'].shift(-1)
        df_sorted['間隔天數'] = (
            df_sorted['下次入院日期'] - df_sorted['出院日期']
        ).dt.days
        
        # 識別再入院案例
        readmissions = df_sorted[df_sorted['間隔天數'] <= days_threshold]
        
        print(f"\n=== {days_threshold}天內再入院分析 ===")
        print(f"總住院次數: {len(self.cleaned_df)}")
        print(f"再入院次數: {len(readmissions)}")
        print(f"再入院率: {len(readmissions)/len(self.cleaned_df)*100:.2f}%")
        
        if len(readmissions) > 0:
            print("\n各科別再入院率:")
            dept_readmission = readmissions.groupby('科別').size()
            dept_total = self.cleaned_df.groupby('科別').size()
            dept_rate = (dept_readmission / dept_total * 100).round(2)
            print(dept_rate.sort_values(ascending=False))
        
        return readmissions

這個醫療資料分析器提供了完整的資料處理流程。載入階段自動偵測日期欄位並轉換為適當的資料型態。清理階段處理醫療資料常見的品質問題，包含缺失值、異常值、重複值等。同時計算多個衍生欄位如住院天數、入院季度等，為後續分析做準備。探索分析階段產生描述性統計，協助了解資料的基本特性。視覺化階段則提供多種圖表展示分析結果。

實際應用這個分析器時，團隊發現幾個重要洞察。首先是各科別的平均住院天數差異顯著，神經內科與腫瘤科的平均住院天數明顯較長，分別達到十五天與十八天，遠高於全院平均的八天。深入分析發現這兩個科別收治的慢性病與重症病患比例較高，且常需要等待檢查報告或後續治療安排，延長了住院時間。

其次是時間趨勢分析揭示明顯的季節性模式。冬季的住院人次顯著高於其他季節，特別是呼吸道疾病的住院案例大幅增加。這個發現協助醫院在冬季來臨前預先規劃病床配置與人力調度。週末入院的病患平均住院天數較長，可能與週末專科醫師人力較少、檢查與治療安排受限有關。

再入院率分析則發現慢性疾病如心臟衰竭、慢性阻塞性肺病的三十天內再入院率偏高。進一步調查發現這些病患的出院準備與後續追蹤機制不足，導致病情控制不佳而再次入院。基於這個發現，醫院加強出院衛教與居家照護追蹤，成功降低再入院率。

建立即時監控儀表板

靜態的分析報告雖然提供了寶貴的洞察，但無法滿足醫院管理的即時性需求。醫院決定建立即時監控儀表板，讓管理者能夠隨時掌握關鍵營運指標。儀表板需要連接醫院資訊系統的資料庫，自動更新最新資料，並提供直觀的視覺化介面。

import dash
from dash import dcc, html, Input, Output
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd
from datetime import datetime, timedelta

class HospitalDashboard:
    """
    醫院營運監控儀表板
    
    提供即時的營運指標監控與視覺化
    支援多種互動功能與自動更新
    """
    
    def __init__(self, data_connection):
        """
        初始化儀表板
        
        參數說明:
            data_connection: 資料庫連線物件
        """
        self.data_connection = data_connection
        self.app = dash.Dash(__name__)
        self.setup_layout()
        self.setup_callbacks()
    
    def fetch_current_data(self):
        """
        從資料庫取得最新資料
        
        查詢當日的住院狀況、急診人數等即時指標
        """
        query = """
        SELECT 
            科別,
            COUNT(*) as 住院人數,
            SUM(CASE WHEN 入院日期 = CURRENT_DATE THEN 1 ELSE 0 END) as 當日入院,
            SUM(CASE WHEN 出院日期 = CURRENT_DATE THEN 1 ELSE 0 END) as 當日出院
        FROM 住院資料
        WHERE 出院日期 IS NULL OR 出院日期 >= CURRENT_DATE
        GROUP BY 科別
        """
        
        df = pd.read_sql(query, self.data_connection)
        return df
    
    def setup_layout(self):
        """
        設定儀表板版面配置
        
        定義儀表板的整體結構與元件
        包含標題、篩選器、圖表等
        """
        self.app.layout = html.Div([
            html.H1(
                '醫院營運監控儀表板',
                style={'textAlign': 'center', 'color': '#2c3e50'}
            ),
            
            html.Div([
                html.Div([
                    html.H3('即時概況'),
                    html.Div(id='summary-cards')
                ], className='summary-section'),
                
                html.Div([
                    dcc.Dropdown(
                        id='department-filter',
                        options=[
                            {'label': '全院', 'value': 'all'},
                            {'label': '內科', 'value': '內科'},
                            {'label': '外科', 'value': '外科'},
                            {'label': '婦產科', 'value': '婦產科'},
                            {'label': '小兒科', 'value': '小兒科'}
                        ],
                        value='all',
                        style={'width': '200px'}
                    ),
                    
                    dcc.DatePickerRange(
                        id='date-range',
                        start_date=datetime.now() - timedelta(days=30),
                        end_date=datetime.now(),
                        display_format='YYYY-MM-DD'
                    )
                ], className='filter-section'),
                
                html.Div([
                    dcc.Graph(id='occupancy-chart'),
                    dcc.Graph(id='admission-trend'),
                    dcc.Graph(id='los-distribution'),
                    dcc.Graph(id='department-comparison')
                ], className='charts-section'),
                
                dcc.Interval(
                    id='interval-component',
                    interval=60*1000,  # 每分鐘更新
                    n_intervals=0
                )
            ])
        ])
    
    def create_summary_cards(self, data):
        """
        建立摘要卡片
        
        顯示關鍵指標的即時數值
        如總住院人數、病床使用率等
        """
        total_patients = data['住院人數'].sum()
        total_beds = 500  # 總病床數
        occupancy_rate = (total_patients / total_beds) * 100
        
        cards = html.Div([
            html.Div([
                html.H4('目前住院人數'),
                html.H2(f'{total_patients}人'),
                html.P(f'病床使用率: {occupancy_rate:.1f}%')
            ], className='card'),
            
            html.Div([
                html.H4('今日入院'),
                html.H2(f"{data['當日入院'].sum()}人"),
                html.P('較昨日...')
            ], className='card'),
            
            html.Div([
                html.H4('今日出院'),
                html.H2(f"{data['當日出院'].sum()}人"),
                html.P('較昨日...')
            ], className='card')
        ], style={'display': 'flex', 'justify-content': 'space-around'})
        
        return cards
    
    def create_occupancy_chart(self, data):
        """
        建立病床使用率圖表
        
        以甜甜圈圖顯示各科別的病床使用情況
        """
        fig = go.Figure(data=[go.Pie(
            labels=data['科別'],
            values=data['住院人數'],
            hole=.4,
            marker_colors=['#FF6B6B', '#4ECDC4', '#45B7D1', '#FFA07A', '#98D8C8']
        )])
        
        fig.update_layout(
            title='各科別病床使用分布',
            annotations=[dict(
                text=f"總計<br>{data['住院人數'].sum()}床",
                x=0.5, y=0.5,
                font_size=20,
                showarrow=False
            )]
        )
        
        return fig
    
    def create_admission_trend(self, historical_data):
        """
        建立入院趨勢圖
        
        顯示過去一段時間的入院人次變化
        協助識別異常波動
        """
        fig = go.Figure()
        
        fig.add_trace(go.Scatter(
            x=historical_data['日期'],
            y=historical_data['入院人次'],
            mode='lines+markers',
            name='入院人次',
            line=dict(color='#4ECDC4', width=2),
            fill='tozeroy',
            fillcolor='rgba(78, 205, 196, 0.2)'
        ))
        
        # 加入移動平均線
        ma_7 = historical_data['入院人次'].rolling(window=7).mean()
        fig.add_trace(go.Scatter(
            x=historical_data['日期'],
            y=ma_7,
            mode='lines',
            name='7天移動平均',
            line=dict(color='red', width=2, dash='dash')
        ))
        
        fig.update_layout(
            title='入院人次趨勢',
            xaxis_title='日期',
            yaxis_title='人次',
            hovermode='x unified'
        )
        
        return fig
    
    def setup_callbacks(self):
        """
        設定互動回呼函式
        
        定義使用者互動（如篩選、日期選擇）時的更新邏輯
        """
        @self.app.callback(
            Output('summary-cards', 'children'),
            Output('occupancy-chart', 'figure'),
            Output('admission-trend', 'figure'),
            Input('interval-component', 'n_intervals'),
            Input('department-filter', 'value'),
            Input('date-range', 'start_date'),
            Input('date-range', 'end_date')
        )
        def update_dashboard(n, department, start_date, end_date):
            """
            更新儀表板內容
            
            根據使用者選擇的篩選條件與時間範圍更新圖表
            """
            # 取得最新資料
            current_data = self.fetch_current_data()
            
            # 套用科別篩選
            if department != 'all':
                current_data = current_data[current_data['科別'] == department]
            
            # 建立各個圖表
            summary_cards = self.create_summary_cards(current_data)
            occupancy_chart = self.create_occupancy_chart(current_data)
            
            # 取得歷史資料用於趨勢圖
            historical_data = self.fetch_historical_data(start_date, end_date, department)
            admission_trend = self.create_admission_trend(historical_data)
            
            return summary_cards, occupancy_chart, admission_trend
    
    def run(self, debug=False, port=8050):
        """
        啟動儀表板伺服器
        
        參數說明:
            debug: 是否啟用除錯模式
            port: 伺服器埠號
        """
        self.app.run_server(debug=debug, port=port)

這個儀表板系統提供即時的營運監控能力。管理者可以在任何時間透過瀏覽器查看最新的住院狀況、入院趨勢、病床使用率等關鍵指標。互動功能允許使用者篩選特定科別或時間範圍,深入探索感興趣的資料。自動更新機制確保顯示的永遠是最新資訊。視覺化設計注重清晰易讀,即使非技術背景的管理者也能快速理解。

儀表板上線後獲得使用者的正面回饋。護理部主任表示每天早上查看儀表板已成為例行工作,能夠快速掌握各單位的病床使用情況,及時調配人力。醫務管理部門則利用趨勢分析功能,提前規劃淡旺季的資源配置。院長室甚至要求增加更多指標,如手術室使用率、檢查等候時間等,展現對資料驅動管理的重視。

預測分析與決策支援

在掌握歷史資料與即時狀況後,醫院進一步探索預測分析的可能性。如果能夠預測未來的住院需求,就能更有效地規劃資源配置。團隊開發了住院需求預測模型,整合歷史住院資料、季節因素、流行病學資訊等多重變數。

預測模型採用時間序列分析與機器學習相結合的方法。ARIMA模型捕捉資料的時間相依性與季節性模式,隨機森林模型則整合多個外部因素的影響。兩個模型的預測結果透過加權平均組合,提升整體準確度。模型每週重新訓練一次,確保能夠適應最新的資料模式。

預測結果以視覺化方式呈現,顯示未來兩週的預期住院人次與信賴區間。當預測值超過特定門檻時,系統自動發送預警通知給相關部門。這個預警機制協助醫院在住院高峰來臨前做好準備,避免病床不足或人力緊張的問題。

模型的準確度透過回測驗證,平均絕對百分比誤差控制在百分之十以內,達到實用的水準。團隊持續監控預測表現,當準確度下降時就調查原因並改善模型。透過這種持續改善的機制,模型的預測能力穩步提升。

建立資料驅動文化

技術工具與分析能力只是實現資料驅動醫療的一部分,更重要的是建立重視資料的組織文化。醫院從多個面向推動文化轉型。首先是提升資料素養,針對不同層級與職能的員工設計差異化的訓練課程。高階主管著重理解資料分析的價值與限制,學習如何將資料洞察納入決策。中階主管學習解讀分析報告,提出有意義的分析需求。基層員工則學習正確記錄資料,理解資料品質的重要性。

建立跨職能的資料團隊打破部門藩籬。團隊成員包含醫療、護理、管理、資訊等不同背景,透過定期會議分享各自的專業觀點與需求。這種跨領域協作不僅產生更好的分析成果,更促進彼此對不同專業的理解與尊重。

資料治理框架確保資料的品質、安全與合規使用。制定明確的資料標準,規範資料的定義、格式、品質要求等。建立資料存取權限管理,確保敏感資料只有授權人員能夠存取。實施資料稽核機制,定期檢查資料使用是否符合規範。這些措施在保護隱私的同時,也確保資料分析的可靠性。

將資料分析整合到日常工作流程中。晨會討論納入前一日的關鍵指標檢討,品質改善專案要求以資料為依據,年度目標設定參考歷史趨勢與標竿比較。透過這種制度化的做法,讓資料使用成為自然而然的習慣,而非額外的負擔。

慶祝資料驅動的成功案例,強化正向循環。當某個改善專案透過資料分析找到問題根源並成功改善時,在全院分享經驗。這不僅肯定團隊的努力,更啟發其他單位思考如何運用資料解決自身的挑戰。透過這種典範學習,資料驅動的文化逐漸深植人心。

未來展望與持續演進

醫療資料分析與視覺化技術持續快速發展,為醫療機構帶來新的機會。人工智慧技術在醫療影像判讀、疾病預測、個人化治療等領域展現驚人的潛力。自然語言處理技術能夠從電子病歷中自動提取結構化資訊,大幅減輕人工整理資料的負擔。即時串流分析技術讓醫院能夠監控生理訊號,提早發現病況惡化的徵兆。

然而技術的採用必須謹慎評估。醫療決策涉及生命安全,任何AI系統都必須經過嚴格驗證才能應用。演算法的公平性與可解釋性在醫療領域特別重要,確保不同族群都能獲得公平的照護品質,醫療人員能夠理解AI的建議依據。隱私保護技術如聯邦學習、差分隱私等,讓醫療機構能夠在保護病患隱私的前提下進行資料協作。

標準化與互通性是醫療資料應用的基礎。採用國際標準如HL7 FHIR促進不同系統間的資料交換。參與健保署推動的電子病歷交換平台,讓病患在不同醫療機構就醫時資料能夠流通。這種資料互通不僅提升照護的連續性,更能夠支援更大規模的群體健康分析。

從這個案例可以看出,醫療資料分析與視覺化不僅是技術專案,更是組織轉型的過程。成功的關鍵在於技術能力、領域知識與組織文化的有機結合。台灣的醫療機構擁有豐富的資料資產與優秀的醫療專業,透過有效的資料分析能力,必能進一步提升醫療品質與營運效率,為病患提供更好的照護服務。

玄貓 BlackCat

技術愛好者，專注於分享程式開發、雲端技術與 AI 應用的心得體會。