什麼是 AI 幻覺？你的 AI 為何「無中生有」以及如何應對

2026-05-13

thumbnail

下午三點，一名員工把 AI 生成的段落直接貼進客戶提案。數字看起來精確，引用的資料來源聽起來權威，建議也顯得合理。問題只有一個：這份報告根本不存在。那個統計數字從未被任何機構發布。你的提案剛剛帶着虛構數據送到了客戶手上。

這不是假設的情境。它正在香港的中小企業中發生，後果從令人難堪到涉及法律責任不等。這篇文章解釋 AI 幻覺是什麼、為何會發生、已經對真實企業造成了什麼代價，以及你應如何保護自己的業務。

什麼是 AI 幻覺？

簡單答案：AI 幻覺是指 AI 系統生成的內容聽起來自信而具說服力，但在事實上是錯誤的、憑空捏造的，或者根本沒有任何真實來源支撐。這個詞借用自心理學：就像幻覺患者感知到並不存在的事物，幻覺中的 AI 會生成現實中並不存在的內容。

AI 並不知道自己說的是錯的。它沒有在撒謊，也沒有刻意欺騙你。它只是根據在訓練數據中學到的語言模式，生成統計上最合理的下一個詞。而有時候，這個「聽起來合理」的輸出內容，在事實上是完全虛假的。

這是大型語言模型運作方式的結構性特點，而不是一個終有一天會被徹底修復的技術漏洞。市場上所有主流 AI 模型，包括 ChatGPT、Claude、Gemini 和 Copilot，都具有產生幻覺的可能性。發生率因模型和任務類型而異，但這種可能性是你在規劃 AI 應用時必須面對的固有現實。

AI 幻覺為何會發生？

簡單答案：AI 模型通過預測統計上最可能出現的下一個詞或句子來生成文字——它優化的是流暢性和相關性，而非事實準確性。當模型遇到知識空白時，它會用一個聽起來合理的回答來填補這個空白，而不是承認自己不知道。

可以這樣理解：一個 AI 模型讀過海量文本，包括數十億份文件、文章、書籍和網頁。它深刻理解語言的運作規律，以及哪些類型的表述在不同情境下聽起來具有權威性。但「聽起來有權威」和「事實準確」並不是同一回事。

當你要求 AI 引用某份特定研究、提及某項法規，或提供某個精確的統計數字時，它並不是在搜索一個經過驗證的數據庫。它生成的是一個符合此類信息通常呈現方式的回應。如果確切信息在其訓練數據中沒有清晰呈現，它可能會構建一個聽起來合理的替代品：一個虛構的引用、一個聽起來真實的作者名字，以及一個合理的期刊標題——但這些都不存在。

AI 幻覺有多普遍？

簡單答案：比大多數用戶預期的更普遍。根據 Suprmind 2026 年 AI 幻覺統計報告，AI 幻覺去年在全球造成的企業損失達 674 億美元，47% 的企業承認曾根據 AI 生成的幻覺內容做出至少一項重大業務決策。

同一份報告發現，一般知識型工作者每週平均花 4.3 小時核實 AI 輸出的信息。這意味着每週有超過半個工作日被用於核查那個你採用來「節省時間」的工具。

幻覺率因模型和任務類型而有顯著差異。在要求 AI 回憶具體事實、引用來源、描述近期事件，或提供高度專業的法律、財務信息時，幻覺率最高。在對用戶直接提供的內容進行生成、摘要或格式重排時，幻覺率最低。

實際上：要求 AI 摘要你提供的文件，相對安全。要求它從記憶中回憶《僱傭條例》的具體條款編號，則未經核實不可信賴。

AI 幻覺已對真實企業造成了哪些代價？

簡單答案：後果涵蓋聲譽損失、客戶時間浪費，直至直接的法律責任。加拿大航空案例是最清晰的先例：法院裁定航空公司對其 AI 客服機器人虛構的退款政策承擔法律責任，即使沒有任何人工員工審核或授權這則虛假信息。

加拿大航空案例確立了一個對所有在客戶接觸環節部署 AI 的香港企業而言都至關重要的原則：你的 AI 代理是公司的發言延伸。它說的話，你的公司就要負責。「是機器生成的」並非法律上的免責理由。

除法律責任外，AI 幻覺的商業代價還包括：夾帶錯誤數據的提案、引用了並不存在的法規的合約、含有虛構產品規格的行銷材料，以及提及公司實際上並沒有的政策的客服回覆。

任何一個都足以損害客戶信任，甚至引發糾紛，而且這些都不需要什麼戲劇性的 AI 失敗才能發生。

哪類內容風險最高？

簡單答案：最高風險類別包括具體事實（統計數字、日期）、法律引用（條例條款、法規編號）、來源引用（期刊文章、報告、命名研究），以及任何需要了解 AI 模型訓練截止日期之後事件的內容。

對香港企業而言，需要特別謹慎的具體領域包括：《僱傭條例》條款、稅務局規則、證監會法規以及大廈管理條例。AI 模型可能了解一般框架，但在具體條款編號、門檻數值或生效日期方面可能出錯。

同樣，過去 12 至 18 個月的市場數據可能超出模型的訓練數據範圍，導致它要麼返回過時數字，要麼捏造聽起來像近期的數據。對於任何 AI 生成的、涉及當前市場狀況、近期調查或新頒布法規的統計信息，在核實之前都應保持高度懷疑。

五個管理 AI 幻覺風險的實際步驟

簡單答案：最有效的五項做法是：用具體情境收緊提示詞、核實所有事實再對外使用、明確審批權責、培訓員工分辨哪些內容可信，以及選擇內置核實機制的 AI 工具，而非把 AI 輸出視為最終成品。

第一步：收緊提示詞

含糊的提示詞會招致幻覺。「告訴我關於香港僱傭法的事」，是在邀請 AI 用似是而非的內容填補空白。「摘要我在下方貼出的《僱傭條例》重點」，則讓 AI 立足於你提供的具體文本，而非依賴其不確定的記憶。

第二步：對所有外發內容設立核實規則

任何發送給客戶、公開發布或納入合約的內容，在離開公司前都應由人工核實。對法律引用、統計數字、財務數據和產品規格，這是不可妥協的要求。把 AI 視為有能力的初稿撰寫人，而非最終的事實核查員。

第三步：明確簽核權責

建立一條簡單的內部規則：AI 生成的外發內容，必須經過指名的人工審批才能發出。這不是不信任 AI，而是在最容易造成損失的環節建立問責機制。

第四步：培訓團隊了解何時可以信任 AI

AI 在生成結構、起草語言、摘要用戶提供的文件，以及產出創意選項方面是可靠的。在回憶具體事實、引用來源和描述近期事件方面則可靠性較低。培訓員工了解這種差異，是你能做的性價比最高的 AI 管治投資之一。

第五步：選擇內置檢索功能的 AI 工具

部分 AI 工具採用「檢索增強生成」（RAG）技術，讓 AI 從你的公司文件庫中提取信息，例如你的政策、價目表、產品規格和合規指引，而非單純依賴其訓練數據。這大幅降低了幻覺風險，因為 AI 引用的是你的實際業務文件，而非從記憶中生成。

UD 相伴 28 年，懂 AI 的冷，更懂你的難。UD AI Staff Solution 採用 RAG 架構，讓你的 AI 員工以你的公司資料為基礎工作，大幅減少幻覺對業務的影響。正確使用 AI，比完全信任 AI 或完全不信任 AI 都重要得多。

想知道你的業務現在使用 AI 是否安全？UD AI Ready Check 是一個免費評估工具，評核你目前的 AI 使用方式，找出幻覺風險最高的環節，並提供清晰的改善起點。UD 團隊手把手教你，全程陪你走每一步。

立即免費進行 AI Ready Check