預測分析技術已逐漸應用於政治領域,透過分析大量的選民資料,包含個人資訊、投票紀錄和網路行為等,可以建立預測模型來預測選民的投票傾向和對政治訊息的反應。相較於傳統的目標方法,例如地理位置或人口統計,預測分析可以更精準地鎖定目標選民,並根據其特徵和行為模式,量身打造更有效的政治宣傳策略。這不僅能提升政治宣傳活動的效率,也能更有效地運用資源,避免資源浪費。

政治說服

政治說服是一種複雜的過程,涉及使用各種策略和技術來影響公眾對政治人物或政策的看法。在近年來,預測分析在政治說服中發揮了越來越重要的作用。

預測分析在政治說服中的應用

預測分析可以用來分析大量的資料,包括選民的個人資訊、投票記錄和其他相關資料,以預測哪些人最有可能受到政治訊息的影響。透過使用預測模型,政治人物和組織可以更有效地瞄準他們的訊息和資源,提高他們的競選活動的有效性。

個人化目標

傳統的政治目標方法包括地理目標、人口統計目標和個人目標。然而,這些方法都有其侷限性。地理目標可能會忽略個別選民的差異,人口統計目標可能會過於籠統,個人目標可能會因為調查成本太高而不可行。

預測分析可以提供一個更有效的個人化目標方法。透過分析大量的資料,預測模型可以預測個別選民的投票行為和對政治訊息的反應。這使得政治人物和組織可以更有效地瞄準他們的訊息和資源,提高他們的競選活動的有效性。

升級模型

升級模型是一種特殊的預測模型,用於估計政治訊息或郵件對選民行為的影響。透過比較有郵件和沒有郵件的選民群體,升級模型可以估計郵件對選民行為的影響。

案例研究

在這個案例研究中,我們使用了真實的選民資料和一項假設性的實驗來展示預測分析在政治說服中的應用。實驗包括以下步驟:

  1. 對選民進行預調查,以確定他們對民主黨候選人的態度。
  2. 對選民進行隨機分組,分為控制組和治療組。
  3. 向治療組傳送一份宣傳民主黨候選人的傳單。
  4. 對選民進行後調查,以確定他們對民主黨候選人的態度是否發生了變化。

資料顯示,接收傳單的選民中,對民主黨候選人的態度發生了正面的變化。這表明預測分析可以用來提高政治說服的有效性。

圖表翻譯:

以下是升級模型的Mermaid圖表:

  graph LR
    A[選民資料] --> B[預調查]
    B --> C[隨機分組]
    C --> D[治療組傳送傳單]
    D --> E[後調查]
    E --> F[升級模型]
    F --> G[估計郵件對選民行為的影響]

這個圖表展示了升級模型的流程,從選民資料到估計郵件對選民行為的影響。

內容解密:

升級模型是一種特殊的預測模型,用於估計政治訊息或郵件對選民行為的影響。它透過比較有郵件和沒有郵件的選民群體來估計郵件對選民行為的影響。這個模型可以用來提高政治說服的有效性,並使得政治人物和組織可以更有效地瞄準他們的訊息和資源。

政治黨派資料、商業消費者和人口統計資料、人口普查街區資料

政府選民檔案的維護和公開是為了確保投票過程的完整性。這些檔案包含了用於身份識別的基本資料,例如姓名、地址和出生日期。在這個案例中使用的檔案還包含了黨派識別(如果一個州限制黨內初選的參與者為該黨的選民)。黨派也會在選舉中安排自己的監票員,記錄個別選民是否在選舉中投票。這些資料(在案例資料中被稱為“衍生”資料)由玄貓維護和整理。人口普查提供的街區層面的人口統計資料可以被追加到選民資料中。消費者和額外的人口統計資料(購買習慣、教育)可以從行銷公司購買並追加到選民資料中(由玄貓匹配)。

任務

在這個案例中,任務是開發一個提升模型,以預測每個選民的提升度。提升度被定義為增加向民主黨方向移動其意見的傾向。首先,審查Voter-Persuasion.xlsx中的變數,並瞭解它們可能來自哪個資料來源。然後,回答以下問題並執行指示的任務:

  1. 總體而言,傳單在移動選民向民主黨方向方面表現如何?(檢視目標變數在收到傳單的選民中與未收到傳單的選民之間的比較。)

  2. 探索資料以瞭解更多關於預測變數和MOVED_AD之間的關係(視覺化可能有幫助)。哪些預測變數似乎具有良好的預測潛力?顯示支援的圖表和/或表格。

  3. 使用資料集中的分割變數對資料進行分割,對預測變數的包含進行決策,並根據此適應地擬合三個預測模型。對於每個模型,提供足夠的細節關於所使用的方法、其引數和所使用的預測變數,以便您的結果可以被複製。

  4. 在您的三個模型中,根據預測能力選擇最好的那一個。哪一個是最好的?您為什麼選擇它?

  5. 使用您選擇的模型,報告驗證集中的前三條記錄的傾向度。

  6. 建立一個與Flyer相反的衍生變數,稱為Flyer-reversed。使用您選擇的模型,使用Flyer-reversed變數作為預測變數而不是Flyer重新評分驗證資料。您可以透過玄貓“新資料”來評分。報告驗證集中的前三條記錄的傾向度。

  7. 對於每條記錄,提升度是根據以下差異計算的:

P(成功|Flyer = 1)− P(成功|Flyer = 0)

計算驗證集中的每個選民的提升度,並報告前三條記錄的提升度。

  1. 如果一個競選活動只有資源將傳單郵寄給10%的選民,應該使用什麼提升度截止值?

執行步驟

步驟1:總體提升度分析

首先,我們需要計算收到傳單和未收到傳單的選民之間的目標變數(MOVED_AD)的平均值差異,以瞭解傳單對移動選民向民主黨方向的總體影響。

步驟2:探索性資料分析

接下來,我們將探索資料以瞭解預測變數和MOVED_AD之間的關係。這可以透過視覺化和相關分析來完成,以找出哪些預測變數具有良好的預測潛力。

步驟3:模型建立和評估

我們將使用分割變數對資料進行分割,並根據此適應地擬合三個預測模型:邏輯迴歸、決策樹和隨機森林。對於每個模型,我們將提供足夠的細節關於所使用的方法、其引數和所使用的預測變數,以便結果可以被複製。

步驟4:模型選擇

根據每個模型在驗證集上的效能,我們將選擇最好的模型作為最終模型。

步驟5:傾向度報告

使用最終模型,我們將報告驗證集中的前三條記錄的傾向度。

步驟6:Flyer-reversed變數評分

我們將建立一個與Flyer相反的衍生變數,稱為Flyer-reversed,並使用最終模型重新評分驗證資料。

步驟7:提升度計算

對於每條記錄,我們將計算提升度根據以下差異:P(成功|Flyer = 1)− P(成功|Flyer = 0)。

步驟8:提升度截止值決定

最後,如果一個競選活動只有資源將傳單郵寄給10%的選民,我們將決定應該使用什麼提升度截止值,以最大化有限資源下的效果。

內容解密:

以上步驟描述瞭如何開發一個提升模型,以預測每個選民的提升度,並根據提升度進行有針對性的競選活動。這個過程涉及探索性資料分析、模型建立和評估、模型選擇、傾向度報告、Flyer-reversed變數評分、提升度計算和提升度截止值決定。每一步驟都旨在最大化競選活動的效果,並確保資源被有效地利用。

23.5 計程車取消案例

商業情境

計程車公司面臨著一個問題:並非所有司機都會出現在已經安排好的接單中。司機們可能會取消已經接受的接單,如果取消沒有在適當的時間內進行,客戶可能會被延遲或甚至被遺棄。為瞭解決這個問題,計程車公司發布了一個競賽,邀請參賽者分析計程車取消的原因。

資料集

Taxi-cancellation-case.xlsx 是本案例的資料集。資料集包含 10,000 筆記錄,每筆記錄代表一個接單。有 17 個輸入變數,包括使用者 ID、車輛型號、接單方式、旅行型別、套餐型別、地理位置、預定日期和時間等。目標變數是二元指標,表示是否取消了接單。整體取消率在 7% 至 8% 之間。

任務

  1. 如何建立一個模型來找出與取消相關的預測變數?
  2. 探索、準備和轉換資料以便進行預測模型。
  3. 適應多個預測模型,並評估其效能。
  4. 報告模型的預測效能,包括錯誤率和混淆矩陣。
  5. 評估模型的排名效能(提升度)。

23.6 浴室肥皂消費者分段案例

商業情境

CRISA 是一家亞洲市場研究機構,專門跟蹤消費品的購買行為。CRISA 憑藉其龐大的消費者購買行為資料函式庫,為廣告代理商和消費品製造商提供市場研究服務。在本案例中,CRISA 想要根據兩個關鍵變數集對市場進行分段:購買行為和品牌忠誠度。

資料集

BathSoap.xlsx 是本案例的資料集。資料集包含 600 筆記錄,每筆記錄代表一個家庭。CRISA 收集了家庭的基本資料、購買行為和品牌忠誠度等資訊。

任務

  1. 如何根據購買行為和品牌忠誠度對市場進行分段?
  2. 探索、準備和轉換資料以便進行分段分析。
  3. 適應多個分段模型,並評估其效能。
  4. 報告模型的分段效能,包括錯誤率和混淆矩陣。
  5. 評估模型的排名效能(提升度)。

內容解密:

在這兩個案例中,我們需要使用資料探索、資料準備和轉換、預測模型和分段模型等技術來解決商業問題。在計程車取消案例中,我們需要找出與取消相關的預測變數,並建立一個模型來預測取消的可能性。在浴室肥皂消費者分段案例中,我們需要根據購買行為和品牌忠誠度對市場進行分段,並建立一個模型來預測消費者的購買行為和品牌忠誠度。

圖表翻譯:

  graph LR
    A[資料探索] --> B[資料準備和轉換]
    B --> C[預測模型]
    C --> D[分段模型]
    D --> E[評估模型效能]

在這個圖表中,我們可以看到資料探索、資料準備和轉換、預測模型和分段模型等步驟之間的關係。首先,我們需要進行資料探索,以瞭解資料的結構和內容。然後,我們需要進行資料準備和轉換,以便進行預測模型和分段模型的建立。最後,我們需要評估模型的效能,以確保其準確性和有效性。

顧客忠誠度分析與市場細分

顧客忠誠度是企業長期成功的關鍵因素之一。透過分析顧客的購買行為和忠誠度,企業可以更有效地分配促銷預算,設計出更具針對性的促銷活動,從而提高市占率和客戶滿意度。

資料描述

表23.10中,每一行代表一個家庭的購買資料。這些資料包括了購買行為、品牌忠誠度等多個方面的資訊。

市場細分

市場細分是指根據顧客的不同需求和特徵,將其分成不同的群體,以便企業能夠更好地滿足每個群體的需求。透過使用k-means聚類別演算法,可以根據購買行為、購買基礎等變數將家庭分成不同的叢集。

k-means聚類別演算法

k-means聚類別演算法是一種常用的無監督學習演算法,主要用於資料分群。其基本思想是:根據資料的相似性,將其分成k個叢集,使得每個叢集內的資料點彼此相似,而不同叢集之間的資料點差異較大。

選擇k值

選擇k值是k-means聚類別演算法中的一個重要問題。一般來說,k值的選擇應該根據實際需求和資料特徵。在本例中,由於行銷努力可能支援兩到五種不同的促銷方法,因此k值可以選擇為2到5之間。

品牌忠誠度衡量

品牌忠誠度是指顧客對某一品牌的忠誠程度,可以透過以下幾個變數來衡量:

  • 購買的不同品牌數量
  • 顧客在不同品牌之間切換的頻率
  • 顧客在每個品牌上的購買比例

這些變數可以用來評估顧客的品牌忠誠度,並進一步用於市場細分。

資料預處理

在進行k-means聚類別之前,需要對資料進行預處理。例如,可以考慮使用單一匯出變數來表示品牌份額,以避免距離測量中的偏差。

分析任務

  1. 使用k-means聚類別演算法根據以下變數識別家庭叢集:
    • 描述購買行為的變數(包括品牌忠誠度)
    • 描述購買基礎的變數
    • 同時描述購買行為和購買基礎的變數
  2. 如何選擇k值?請考慮叢集將如何使用。行銷努力可能支援兩到五種不同的促銷方法。
  3. 如何處理品牌份額百分比?一位只購買品牌A的顧客是否和一位只購買品牌B的顧客一樣忠誠?使用品牌份額變數會對距離測量產生什麼影響?請考慮使用單一匯出變數。

透過完成上述任務,可以更好地瞭解顧客的購買行為和品牌忠誠度,從而為企業提供有力的支援,以設計出更有效的促銷活動和增強顧客滿意度。

家庭消費者資料分析

家庭基本資料

每個家庭成員都有一個獨特的識別碼,稱為「Member ID」。此外,還有其他幾個重要的家庭基本資料,包括:

  • SEC:社會經濟階級(1 = 高,5 = 低)
  • FEH:飲食習慣(1 = 素食,2 = 吃蛋的素食,3 = 非素食,0 = 未指定)
  • MT:母語(參考工作表中的表格)
  • SEX:家庭主婦的性別(1 = 男,2 = 女)
  • AGE:家庭主婦的年齡
  • EDU:家庭主婦的教育程度(1 = 最低,9 = 最高)
  • HS:家庭成員人數
  • CHILD:家庭中是否有孩子(4 個類別)
  • CS:電視是否可用(1 = 可用,2 = 不可用)

豐裕指數

豐裕指數(Affluence Index)是根據家庭所擁有的耐用消費品的加權值計算得出的。這個指數可以反映家庭的經濟狀況和消費能力。

購買摘要

購買摘要(Purchase summary)是對家庭購買行為的總結,包括了他們購買的產品型別、頻率和金額等資訊。這些資訊可以幫助企業瞭解家庭的購買偏好和消費習慣,從而制定有效的行銷策略。

內容解密:

上述家庭基本資料和豐裕指數可以用於分析家庭的消費行為和購買決策。例如,企業可以根據家庭的社會經濟階級、飲食習慣和教育程度等因素來推斷他們的購買偏好和消費能力。同時,企業也可以根據家庭的購買摘要來瞭解他們的購買頻率和金額等資訊,從而制定有效的行銷策略。

  flowchart TD
    A[家庭基本資料] --> B[豐裕指數]
    B --> C[購買摘要]
    C --> D[行銷策略]

圖表翻譯:

此圖表展示了家庭基本資料、豐裕指數和購買摘要之間的關係。首先,企業收集家庭的基本資料,包括社會經濟階級、飲食習慣和教育程度等。然後,企業根據這些資料計算出豐裕指數,從而評估家庭的經濟狀況和消費能力。最後,企業根據豐裕指數和購買摘要來制定有效的行銷策略。

程式碼範例:

# 定義家庭基本資料
class Household:
    def __init__(self, sec, feh, mt, sex, age, edu, hs, child, cs):
        self.sec = sec
        self.feh = feh
        self.mt = mt
        self.sex = sex
        self.age = age
        self.edu = edu
        self.hs = hs
        self.child = child
        self.cs = cs

# 定義豐裕指數
class AffluenceIndex:
    def __init__(self, weighted_value):
        self.weighted_value = weighted_value

# 定義購買摘要
class PurchaseSummary:
    def __init__(self, purchase_frequency, purchase_amount):
        self.purchase_frequency = purchase_frequency
        self.purchase_amount = purchase_amount

# 建立家庭基本資料例項
household = Household(1, 2, "中文", 2, 35, 6, 4, 1, 1)

# 建立豐裕指數例項
affluence_index = AffluenceIndex(0.8)

# 建立購買摘要例項
purchase_summary = PurchaseSummary(2, 1000)

# 輸出結果
print("家庭基本資料:")
print("社會經濟階級:", household.sec)
print("飲食習慣:", household.feh)
print("母語:", household.mt)
print("性別:", household.sex)
print("年齡:", household.age)
print("教育程度:", household.edu)
print("家庭成員人數:", household.hs)
print("是否有孩子:", household.child)
print("電視是否可用:", household.cs)

print("豐裕指數:")
print("加權值:", affluence_index.weighted_value)

print("購買摘要:")
print("購買頻率:", purchase_summary.purchase_frequency)
print("購買金額:", purchase_summary.purchase_amount)

圖表翻譯:

此圖表展示了程式碼中定義的家庭基本資料、豐裕指數和購買摘要之間的關係。首先,程式碼定義了家庭基本資料類別,包括社會經濟階級、飲食習慣和教育程度等屬性。然後,程式碼定義了豐裕指數類別,包括加權值屬性。最後,程式碼定義了購買摘要類別,包括購買頻率和購買金額屬性。

顧客購買行為分析

瞭解顧客的購買行為對於企業的行銷策略和客戶關係管理至關重要。以下是對顧客購買行為的詳細分析,涵蓋了品牌購買次數、連續購買次數、總購買量、交易次數、平均交易次數、平均交易量、平均價格等多個維度。

1. 品牌購買次數(No. of Brands)

這指的是顧客在一定期間內購買的不同品牌的數量。透過分析這個資料,可以瞭解顧客的品牌忠誠度和購買偏好。

2. 連續購買次數(Brand Runs)

這代表了顧客連續購買同一品牌的次數。這個指標可以幫助企業瞭解顧客的購買習慣和對品牌的忠誠度。

3. 總購買量(Total Volume)

這是指顧客在一定期間內購買的商品總量。透過分析這個資料,可以瞭解顧客的購買力和消費習慣。

4. 交易次數(No. of Trans)

這指的是顧客在一定期間內進行的交易次數,包括多個品牌在同一時間點的購買。這個指標可以幫助企業瞭解顧客的購買頻率和交易模式。

5. 平均交易次數(Trans/Brand Runs)

這是指在每一次連續購買中,顧客平均進行的交易次數。這個指標可以幫助企業瞭解顧客在連續購買過程中的購買行為。

6. 平均交易量(Vol/Trans)

這指的是每筆交易的平均商品量。透過分析這個資料,可以瞭解顧客的購買習慣和商品需求。

7. 平均價格(Avg. Price)

這是指顧客在每筆交易中支付的平均金額。這個指標可以幫助企業瞭解顧客的價格敏感度和支付能力。

8. 購買促銷比例(Purchase within promotion)

這指的是在促銷活動中購買的商品佔總購買量的比例。透過分析這個資料,可以瞭解顧客對促銷活動的反應和參與度。

9. 非促銷購買比例(No Promo - %)

這是指在沒有促銷活動的情況下購買的商品佔總購買量的比例。這個指標可以幫助企業瞭解顧客在非促銷情況下的購買行為。

10. 促銷碼6%購買比例(Pur Vol Promo 6%)

這指的是使用特定促銷碼(在本例中為6%折扣)購買的商品佔總購買量的比例。透過分析這個資料,可以瞭解顧客對特定促銷活動的反應和參與度。

內容解密:

以上分析為企業提供了對顧客購買行為的全面理解,包括品牌忠誠度、購買習慣、交易模式、價格敏感度等多個方面。透過這些資料,企業可以制定更有效的行銷策略,提高客戶忠誠度,提升銷售業績。

圖表翻譯:

  graph LR
    A[顧客資料] --> B[品牌購買分析]
    B --> C[連續購買分析]
    C --> D[總購買量分析]
    D --> E[交易次數分析]
    E --> F[平均交易次數分析]
    F --> G[平均交易量分析]
    G --> H[平均價格分析]
    H --> I[購買促銷分析]
    I --> J[非促銷購買分析]
    J --> K[促銷碼購買分析]
    K --> L[綜合分析與策略制定]

圖表翻譯:此圖示為顧客購買行為分析流程圖,展示了從收集顧客資料到進行綜合分析和制定行銷策略的整個過程。每一步驟都對應著上述的一個分析維度,最終目的是透過對顧客購買行為的深入理解來最佳化企業的行銷策略和提升業務績效。

從商業價值與使用者經驗的雙重角度來看,本文探討了預測分析和市場區隔在提升政治說服力、計程車服務最佳化和消費者產品行銷等不同商業場景中的應用。分析段落中,我們深入剖析了預測模型的建立、評估和應用,包括升級模型、顧客忠誠度分析和市場細分等技術。同時,也探討了資料預處理、變數選擇和模型解釋性等關鍵挑戰。技術限制深析顯示,模型的準確性高度依賴於資料品質和特徵工程。此外,模型的可解釋性也是一個重要的考量因素,特別是在政治說服等敏感領域。

展望未來,隨著機器學習和人工智慧技術的持續發展,預測分析和市場區隔將在商業決策中扮演更重要的角色。跨領域資料融合和更精細的模型將進一步提升預測的準確性和可操作性。預見未來,個人化行銷和精準政治說服將成為常態,而資料隱私和倫理問題也將面臨更大的挑戰。

玄貓認為,企業應積極擁抱這些新興技術,同時注重資料安全和倫理規範,才能在激烈的市場競爭中保持領先地位。對於重視資料驅動決策的企業而言,投資於預測分析和市場區隔技術將帶來顯著的商業價值和競爭優勢。