提升 AI 回答品質：Prompt 工程技巧解析

隨著大語言模型（LLM）的普及，Prompt 工程技巧的重要性日益凸顯。良好的 Prompt 設計能引導 LLM 產生更精確、更符合預期的結果，反之則可能導致冗長、模糊或錯誤的回答。本文將探討 Prompt 的組成要素、設計原則以及如何應用於程式碼最佳化、文字分析、翻譯等軟體開發場景。理解不同 LLM 的特性，並針對性地調整 Prompt，是提升 LLM 應用效益的關鍵。透過少量學習、鏈式思維提示等技巧，可以引導 LLM 進行更複雜的推理和問題解決。同時，避免使用引導性問題，並要求 LLM 提供範例和類別比，能有效提升理解和溝通效率。最後，針對 LLM 容易產生的幻覺現象，本文也提供了相應的解決方案，例如避免開放性問題、指定特定結論以及多步驟指引等，以確保 LLM 輸出的準確性和可靠性。

提升 AI 回答品質：理解與改進 Prompt 工程技巧

Prompt 工程是指利用特定的指令來引導大語言模型（LLM）產生所需的回應。由於 AI 世界變動迅速，沒有一個固定的技術可以完美解決所有問題。玄貓將探討 Prompt 工程的挑戰及其應對策略，並提供具體的案例和技術選型分析。

探討 Prompt 工程的挑戰

Prompt 工程看似簡單，但實際上充滿挑戰。即使是微小的陳述式改變，也可能顯著影響 LLM 的回應結果。以下是一些常見的挑戰：

1. 過度冗長

LLM 有時會提供過於冗長的回應，這些回應包含了大量相關但不必要的資訊。為了避免這種情況，可以在提示中明確要求 LLM 以「簡潔」的方式回答。

2. 模型間差異

不同的 LLM 在訓練資料和設計上有所不同，因此同一個提示在不同模型中的效果可能會有所差異。例如，從 ChatGPT 轉換到 Gemini 或 GitHub Copilot 時，可能需要調整提示以適應新模型的特性。

3. 長度敏感度

過長的提示可能會讓 LLM 分心，導致忽略或誤解部分內容。因此，應避免在提示中提供過多細節，保持提示簡短明瞭。

4. 模糊不清

如果提示不明確，LLM 可能會產生不準確或完全誤導的回應。因此，清晰表達需求是成功的關鍵。

Prompt 的四大主要組成部分

要有效地使用 Prompt 工程，我們需要了解 Prompt 的四大主要組成部分：上下文、指令、輸入內容和輸出格式。

上下文

上下文設定了 LLM 的角色或人格特徵。例如，如果你需要除錯 Java 應用程式，可以這樣設定上下文：

你是一位經驗豐富的軟體工程師，專精於除錯 Java 應用程式。

這樣的上下文設定能幫助 LLM 以更準確且相關的方式回答問題。

指令

指令告訴 LLM 應該如何處理你的提問。指令可以是總結、翻譯、分類別等多種形式。例如：

總結以下檔案的主要觀點。

然而，過多或過於複雜的指令可能會讓 LLM 忙不過來，因此應保持指令簡單明瞭。

輸入內容

輸入內容是你希望 LLM 處理的資訊。這些資訊可以是文字、程式碼或其他形式的資料。

輸出格式

輸出格式告訴 LLM 應該如何呈現回應結果。例如：

請用列表形式列出以下內容。

提升 Prompt 工程效果

為了提升 Prompt 工程的效果，玄貓建議以下幾個策略：

保持簡潔：避免過於冗長或模糊不清的提示。
針對性強：根據不同模型調整提示。
逐步細化：如果需要多個指令，可以將其分解成多個簡單的提示進行逐步處理。
提供明確上下文：幫助 LLM 以正確的人格特徵回應問題。
測試與反覆：根據實際結果不斷調整和最佳化提示。

輸入範例與輸出解說

以下範例展示如何利用上述策略來改進 Prompt 工程：


### 問題描述：除錯 Java 應用程式
**上下文：** 你是一位經驗豐富的軟體工程師，專精於除錯 Java 應用程式。
**指令：** 分析以下程式碼並指出潛在問題。
**輸入內容：**
```java
public class Example {
    public static void main(String[] args) {
        int[] numbers = {1, 2, 3};
        System.out.println(numbers[3]);
    }
}

輸出格式： 列出所有錯誤並提供修正建議。

內容解密：

上下文設定： 「你是一位經驗豐富的軟體工程師，專精於除錯 Java 應用程式。」這段話明確告訴 LLM 應該以專業除錯者身份進行回答。
指令明確： 「分析以下程式碼並指出潛在問題。」這個指令簡單明瞭，避免了模糊不清。
輸入內容清晰： 提供了一段簡短但完整的 Java 程式碼片段。
輸出格式要求： 「列出所有錯誤並提供修正建議。」這樣設計能夠確保回應結果具有實際價值。

根據以上策略和案例分析，玄貓認為Prompt 工程雖然具有挑戰性，但透過合理設計和最佳化提示，我們可以顯著提升LLM 的回答品質。未來隨著技術的進步和新模型的出現，Prompt 工程將會成為 AI 領域中不可或缺的一環。

精準提取與文字分析

提取電子郵件主題

在開發過程中，經常會遇到長篇電子郵件串，這些串內包含了大量討論和決策。如何快速提取出其中的重點，是一項非常重要的技術。以下是一些常見的提取方式：

主要討論點提取

範例提示：「總結以下電子郵件串中的主要討論點。」這樣的提示可以幫助LLM（大語言模型）快速分析並提取出關鍵討論內容。

話題建模

話題建模是一種統計模型，用於從文字集合中發現抽象的「話題」。這在處理大量檔案時非常有用。以下是一些話題建模的範例提示：

範例提示：「識別以下文字中討論的主要話題：{文字}」
範例提示：「從以下文字中提取關鍵字以推斷主要話題：{文字}」
範例提示：「根據以下文字內容建議標籤：{文字}」

文字分類別與情感分析

文字分類別是指將文字標記為特定標籤，這在情感分析中尤為常見。例如，從社交媒體文章中分析其情感傾向，這對於開發者來說，可以幫助瞭解應用程式的使用者反饋。

情感分析範例

範例提示：「你能分析這些客戶評價，告訴我情感傾向是正面、負面還是中立嗎？{文字}」
範例提示：「這是我們使用者論壇中有關最新更新的討論串。你能總結一下整體情感嗎？{文字}」
範例提示：「我整理了一些來自應用程式商店頁面的回饋。你能按情感分類別這些評論嗎？{文字}」
範例提示：「評估這些有關我們產品公告的部落格文章評論的情感。大家的共識是什麼？{文字}」

本地化與翻譯

本地化重要性

本地化是將軟體調整為符合特定地區的語言和文化習慣。這不僅能讓軟體更適應當地市場，還能與使用者建立更緊密的連結。

本地化挑戰

雖然本地化有其優勢，但也存在挑戰。例如，它可能會增加成本和時間投入，並且需要嚴格的品質保證以確保軟體在不同語言中的完整性。

LLM 在本地化中的應用

LLM可以成為開發者工具箱中的強大工具，特別是在多語言翻譯方面。以下是一些常見的翻譯提示：

UI 文字翻譯：「將以下UI文字翻譯成法語：儲存、離開、檔案、編輯、幫助。」
使用手冊翻譯：「將以下使用手冊段落翻譯成西班牙語。」
錯誤訊息翻譯：「將以下錯誤訊息翻譯成德語：檔案未找到、存取被拒絕、網路連線失效。」
工具提示翻譯：「將以下工具提示翻譯成日語：點選以儲存、點選以開啟新檔案、點選以列印。」

然而，LLM並非完美無缺。它們可能會錯過某些語言中的細微差異、俚語和文化背景。因此，最好由語言專家來檢查輸出結果。

提示內容輸入

在撰寫提示時，使用特殊符號如###或"""來清楚區分指令與需要處理的內容非常重要。這些符號作為邊界標記，使LLM更清晰地瞭解需要完成的任務。

實務案例

考慮一個軟體開發者需要從新API的詳細說明中摘要出主要實施步驟的情境。以下是如何結構化此類別提示：

Prompt: 從下列文字中摘要API的主要實施步驟：
Documentation:"""
{API 說明文字在此}
"""

內容解密：

此段程式碼展示瞭如何使用"""來作為邊界標記來區隔指令與API說明文字。這樣做可以讓LLM更清楚地瞭解需要完成的任務內容。

利用"""作為標記符號來區隔指令與API說明文字具有多重好處：

提高了LLM理解任務內容的準確性。
增加了摘要結果的準確性。
清晰且易讀，特別是在處理長或複雜文字輸入時。

總結來說，這些技術可以顯著增強開發者在處理長篇電子郵件串、話題建模、情感分析和推薦系統等任務中的效率和準確性。同時，透過合理使用LLM進行多語言翻譯和推薦系統也能解決許多複雜問題，但也需要注意其潛在缺陷並進行適當調整與校正。

提升Prompt設計的實用技巧

Prompt格式與輸出控制

在設計Prompt時，我們可以明確告知大語言模型（LLM）如何格式化輸出。以下是一個範例：

範例： Prompt: 開發一個Python函式，該函式接受一個包含使用者ID及名稱的使用者物件列表，並傳回一個將使用者ID對映至名稱的JSON物件。將輸出格式化為JSON。

ChatGPT:

{
  "code": "def map_user_ids_to_names(users):\n    user_map = {user['id']: user['name'] for user in users}\n    return user_map",
  "example_usage": {
    "input": [
      {"id": 1, "name": "Alice"},
      {"id": 2, "name": "Bob"},
      {"id": 3, "name": "Charlie"}
    ],
    "output": {
      "1": "Alice",
      "2": "Bob",
      "3": "Charlie"
    }
  }
}

我們還可以使用其他方式來格式化輸出，以下是一些選項：

表格：「建立一個比較Python、Java及C++語法、效能及應用案例的表格。」
清單：「列出排除網頁載入緩慢問題的步驟。」
Markdown/HTML：「以Markdown說明GET與POST HTTP方法的差異。」
文字階層：「提供軟體開發生命週期（SDLC）的結構化概述，包括每個階段及主要活動。」
LaTeX格式：「以LaTeX符號表示二元搜尋演算法的時間複雜度。」

在Prompt中，我們也可以指定回應的長度，例如「提供簡短摘要」或「詳細說明」。若指定字數上限，LLM可能會略微超過，但仍會保持在大致範圍內。

設計高效Prompt的最佳實踐

設計高效的Prompt需要具體且清晰的指示，避免模糊不清或誤解。以下是一些設計高效Prompt的最佳實踐：

舉例說明

模糊的Prompt範例：

「開發一個增強資料安全性的功能。」
「可以建立一個自動化處理流程的工具嗎？」
「最佳化這段程式碼。」
「我們需要一個處理交易的函式。」

具體且清晰的Prompt範例：

「開發一個Python函式來解析字串中的日期。該函式應能處理YYYY-MM-DD、MM/DD/YYYY及Month DD, YYYY等格式，並傳回datetime物件。提供至少三個每種格式的範例，並附上說明依賴性、函式邏輯及執行指示的檔案。」

技術術語與縮寫

在撰寫Prompt時，對技術術語與縮寫必須明確。例如：

模糊Prompt：「遇到DB連線問題。如何修復？」
清晰Prompt：「使用JDBC連線PostgreSQL資料函式庫時遇到連線超時問題。如何解決？」

這樣可以確保LLM理解正確的技術背景及問題。

零次與少量學習

零次學習（Zero-Shot Learning）是指單次提問即可獲得想要答案。少量學習（Few-Shot Learning）則利用少量範例或訓練資料幫助LLM理解並完成任務。這對於處理複雜程式語言與框架特別有幫助。

零次學習範例

直接告知LLM所需任務即可。

少量學習範例

假設我們需要生成將列表中的數字標準化至[0,1]區間的函式：

Prompt： 根據以下將列表中的數字標準化至[0,1]區間的範例：

輸入: [2, 4, 6, 8] 輸出: [0, 0.3333, 0.6667, 1]
輸入: [5, 10, 15] 輸出: [0, 0.5, 1]
輸入: [1, 3, 2] 輸出: [0, 1, 0.5]

生成一個Python函式，接受數字列表作為輸入並傳回標準化後的數字列表。

def normalize(numbers):
    min_value = min(numbers)
    max_value = max(numbers)
    if min_value == max_value:
        return [0] * len(numbers) # 假如所有數字相同
    else:
        return [(x - min_value) / (max_value - min_value) for x in numbers]
# 測試函式
print(normalize([2, 4, 6, 8])) # 輸出: [0.0, 0.3333333333333333,
#                             0.6666666666666666, 1.0]

引導詞選擇

透過精心設計引導詞來引導LLM產生所需結果。例如使用「開發」、「建立」、「生成」等動詞，並且結合具體細節來提升效果。

總結來說，設計高效Prompt需要具體且清晰的描述、正確使用技術術語及縮寫、理解零次與少量學習、以及適當選擇引導詞。隨著經驗累積，玄貓將逐漸掌握適合自己的提問方式。

使用引導詞來指導LLM產生特定輸出

在與大語言模型（LLM）互動時，使用引導詞可以幫助指引模型產生特定的輸出。這些引導詞通常是特定的關鍵字或短語，能夠引導模型朝著預期的方向生成內容。有時候，使用一個關鍵字就足以達成這個效果。

引導詞的實際應用

以下是一個簡單的例子，說明如何使用引導詞來指導LLM生成特定的Python函式：

# 建立一個簡單的Python函式
# 1. 提示我輸入華氏溫度
# 2. 將華氏溫度轉換為攝氏溫度
def

在這個例子中，使用「def」作為引導詞，告訴模型開始編寫Python函式。以下是更多引導詞的例子：

JavaScript函式：Function
HTML元素：<button>
CSS樣式：P {
SQL插入查詢：INSERT INTO
Java方法建立：public

鏈式思維（Chain of Thought）提示

2022年，Google研究人員在論文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》中介紹了鏈式思維（CoT）提示技術。這種方法透過將複雜問題分解為多個步驟來增強LLM的推理能力，類別似於少樣本學習（few-shot learning），能夠引導模型逐步解決問題。

假設你想使用Flask框架建立一個包含使用者註冊和登入功能的網頁應用。以下是使用CoT提示技術的步驟：

理解需求：

我需要建立一個使用Flask的網頁應用。這個應用應該有使用者註冊和登入功能。我該從哪裡開始？

設定Flask應用：

我們從設定基本的Flask應用開始。如何做到這一點？

建立使用者模型：

現在Flask應用已經設定好了，我需要建立一個使用者模型來處理註冊和登入。這個模型該如何結構化？

實作註冊功能：

使用者模型已經就位，如何實作包含必要欄位的註冊頁面？

實作登入功能：

接下來，如何建立一個登入頁面並確保安全登入？

會話管理：

使用者登入後，如何管理使用者會話以保持他在應用中的登入狀態？

離開功能：

最終，如何實作離開功能以安全地讓使用者離開應用？

引導性問題

在提示中使用引導性問題可能會導致LLM產生不準確或偏頗的回答。因此，保持中立和不帶偏見是更好的做法。以下是一個例子：

引導性問題：

是不是說遷移到微服務架構總是會提升系統的可擴充套件性？

更平衡的提示：

遷移到微服務架構在系統可擴充套件性方面有哪些優勢和潛在挑戰？

要求範例和類別比

當你不熟悉某些概念時，可以透過要求LLM提供類別比來幫助理解。例如，如果你想了解導向物件程式設計中的繼承概念，可以這樣提問：

提示：

透過類別比來解釋導向物件程式設計中的繼承。

回答：

可以把繼承想像成家族樹，孩子們從父母那裡繼承了一些特徵和屬性，甚至可能從祖父母那裡繼承。

減少幻覺現象

幻覺現象是指LLM生成虛假或誤導性內容但表述得像真實一樣。這對於需要高精確度的軟體開發來說尤為挑戰。

幻覺現象產生的原因包括：

缺乏真實性驗證
模型可能記住訓練資料中的錯誤或誤導資訊
訓練資料中的偏見、不準確或虛假資訊會反映在模型的輸出中
模型可能從訓練資料中推斷出超出範圍的資訊
模型可能缺乏足夠的上下文來正確解釋某些提示

減少幻覺現象的方法

避免開放性問題：
- 不佳提示：「最佳化資料函式庫有哪些不同方法？」
- 改進後的提示：「以下哪項是最佳化資料函式庫的方法：索引、碎片整理還是壓縮？」
指定特定結論：
- 有效提示：「以下Java語法初始化陣列正確嗎？請回答“正確”或“不正確”。」
多步驟指引：將提示分解為多個步驟以更好地引導模型避免偏離主題。

透過這些方法，可以有效減少LLM生成幻覺內容的風險，提升其在軟體開發中的可靠性。

玄貓

技術愛好者，專注於分享程式開發、雲端技術與 AI 應用的心得體會。

提升 AI 回答品質：Prompt 工程技巧解析

提升 AI 回答品質：理解與改進 Prompt 工程技巧

探討 Prompt 工程的挑戰

1. 過度冗長

2. 模型間差異

3. 長度敏感度

4. 模糊不清

Prompt 的四大主要組成部分

上下文

指令

輸入內容

輸出格式

提升 Prompt 工程效果

輸入範例與輸出解說

內容解密：

精準提取與文字分析

提取電子郵件主題

主要討論點提取

話題建模

文字分類別與情感分析

情感分析範例

推薦系統

程式碼最佳化推薦

本地化與翻譯

本地化重要性

本地化挑戰

LLM 在本地化中的應用

提示內容輸入

實務案例

內容解密：

提升Prompt設計的實用技巧

Prompt格式與輸出控制

設計高效Prompt的最佳實踐

舉例說明

技術術語與縮寫

零次與少量學習

零次學習範例

少量學習範例

引導詞選擇

使用引導詞來指導LLM產生特定輸出

引導詞的實際應用

鏈式思維（Chain of Thought）提示

引導性問題

要求範例和類別比

減少幻覺現象

減少幻覺現象的方法

玄貓