購物車

什麼是 AI 幻覺?你的 AI 為何「無中生有」以及如何應對

2026-05-13

thumbnail

下午三點,一名員工把 AI 生成的段落直接貼進客戶提案。數字看起來精確,引用的資料來源聽起來權威,建議也顯得合理。問題只有一個:這份報告根本不存在。那個統計數字從未被任何機構發布。你的提案剛剛帶着虛構數據送到了客戶手上。

這不是假設的情境。它正在香港的中小企業中發生,後果從令人難堪到涉及法律責任不等。這篇文章解釋 AI 幻覺是什麼、為何會發生、已經對真實企業造成了什麼代價,以及你應如何保護自己的業務。

什麼是 AI 幻覺?

簡單答案:AI 幻覺是指 AI 系統生成的內容聽起來自信而具說服力,但在事實上是錯誤的、憑空捏造的,或者根本沒有任何真實來源支撐。這個詞借用自心理學:就像幻覺患者感知到並不存在的事物,幻覺中的 AI 會生成現實中並不存在的內容。

AI 並不知道自己說的是錯的。它沒有在撒謊,也沒有刻意欺騙你。它只是根據在訓練數據中學到的語言模式,生成統計上最合理的下一個詞。而有時候,這個「聽起來合理」的輸出內容,在事實上是完全虛假的。

這是大型語言模型運作方式的結構性特點,而不是一個終有一天會被徹底修復的技術漏洞。市場上所有主流 AI 模型,包括 ChatGPT、Claude、Gemini 和 Copilot,都具有產生幻覺的可能性。發生率因模型和任務類型而異,但這種可能性是你在規劃 AI 應用時必須面對的固有現實。

AI 幻覺為何會發生?

簡單答案:AI 模型通過預測統計上最可能出現的下一個詞或句子來生成文字——它優化的是流暢性和相關性,而非事實準確性。當模型遇到知識空白時,它會用一個聽起來合理的回答來填補這個空白,而不是承認自己不知道。

可以這樣理解:一個 AI 模型讀過海量文本,包括數十億份文件、文章、書籍和網頁。它深刻理解語言的運作規律,以及哪些類型的表述在不同情境下聽起來具有權威性。但「聽起來有權威」和「事實準確」並不是同一回事。

當你要求 AI 引用某份特定研究、提及某項法規,或提供某個精確的統計數字時,它並不是在搜索一個經過驗證的數據庫。它生成的是一個符合此類信息通常呈現方式的回應。如果確切信息在其訓練數據中沒有清晰呈現,它可能會構建一個聽起來合理的替代品:一個虛構的引用、一個聽起來真實的作者名字,以及一個合理的期刊標題——但這些都不存在。

AI 幻覺有多普遍?

簡單答案:比大多數用戶預期的更普遍。根據 Suprmind 2026 年 AI 幻覺統計報告,AI 幻覺去年在全球造成的企業損失達 674 億美元,47% 的企業承認曾根據 AI 生成的幻覺內容做出至少一項重大業務決策。

同一份報告發現,一般知識型工作者每週平均花 4.3 小時核實 AI 輸出的信息。這意味着每週有超過半個工作日被用於核查那個你採用來「節省時間」的工具。

幻覺率因模型和任務類型而有顯著差異。在要求 AI 回憶具體事實、引用來源、描述近期事件,或提供高度專業的法律、財務信息時,幻覺率最高。在對用戶直接提供的內容進行生成、摘要或格式重排時,幻覺率最低。

實際上:要求 AI 摘要你提供的文件,相對安全。要求它從記憶中回憶《僱傭條例》的具體條款編號,則未經核實不可信賴。

AI 幻覺已對真實企業造成了哪些代價?

簡單答案:後果涵蓋聲譽損失、客戶時間浪費,直至直接的法律責任。加拿大航空案例是最清晰的先例:法院裁定航空公司對其 AI 客服機器人虛構的退款政策承擔法律責任,即使沒有任何人工員工審核或授權這則虛假信息。

加拿大航空案例確立了一個對所有在客戶接觸環節部署 AI 的香港企業而言都至關重要的原則:你的 AI 代理是公司的發言延伸。它說的話,你的公司就要負責。「是機器生成的」並非法律上的免責理由。

除法律責任外,AI 幻覺的商業代價還包括:夾帶錯誤數據的提案、引用了並不存在的法規的合約、含有虛構產品規格的行銷材料,以及提及公司實際上並沒有的政策的客服回覆。

任何一個都足以損害客戶信任,甚至引發糾紛,而且這些都不需要什麼戲劇性的 AI 失敗才能發生。

哪類內容風險最高?

簡單答案:最高風險類別包括具體事實(統計數字、日期)、法律引用(條例條款、法規編號)、來源引用(期刊文章、報告、命名研究),以及任何需要了解 AI 模型訓練截止日期之後事件的內容。

對香港企業而言,需要特別謹慎的具體領域包括:《僱傭條例》條款、稅務局規則、證監會法規以及大廈管理條例。AI 模型可能了解一般框架,但在具體條款編號、門檻數值或生效日期方面可能出錯。

同樣,過去 12 至 18 個月的市場數據可能超出模型的訓練數據範圍,導致它要麼返回過時數字,要麼捏造聽起來像近期的數據。對於任何 AI 生成的、涉及當前市場狀況、近期調查或新頒布法規的統計信息,在核實之前都應保持高度懷疑。

五個管理 AI 幻覺風險的實際步驟

簡單答案:最有效的五項做法是:用具體情境收緊提示詞、核實所有事實再對外使用、明確審批權責、培訓員工分辨哪些內容可信,以及選擇內置核實機制的 AI 工具,而非把 AI 輸出視為最終成品。

第一步:收緊提示詞

含糊的提示詞會招致幻覺。「告訴我關於香港僱傭法的事」,是在邀請 AI 用似是而非的內容填補空白。「摘要我在下方貼出的《僱傭條例》重點」,則讓 AI 立足於你提供的具體文本,而非依賴其不確定的記憶。

第二步:對所有外發內容設立核實規則

任何發送給客戶、公開發布或納入合約的內容,在離開公司前都應由人工核實。對法律引用、統計數字、財務數據和產品規格,這是不可妥協的要求。把 AI 視為有能力的初稿撰寫人,而非最終的事實核查員。

第三步:明確簽核權責

建立一條簡單的內部規則:AI 生成的外發內容,必須經過指名的人工審批才能發出。這不是不信任 AI,而是在最容易造成損失的環節建立問責機制。

第四步:培訓團隊了解何時可以信任 AI

AI 在生成結構、起草語言、摘要用戶提供的文件,以及產出創意選項方面是可靠的。在回憶具體事實、引用來源和描述近期事件方面則可靠性較低。培訓員工了解這種差異,是你能做的性價比最高的 AI 管治投資之一。

第五步:選擇內置檢索功能的 AI 工具

部分 AI 工具採用「檢索增強生成」(RAG)技術,讓 AI 從你的公司文件庫中提取信息,例如你的政策、價目表、產品規格和合規指引,而非單純依賴其訓練數據。這大幅降低了幻覺風險,因為 AI 引用的是你的實際業務文件,而非從記憶中生成。

UD 相伴 28 年,懂 AI 的冷,更懂你的難。UD AI Staff Solution 採用 RAG 架構,讓你的 AI 員工以你的公司資料為基礎工作,大幅減少幻覺對業務的影響。正確使用 AI,比完全信任 AI 或完全不信任 AI 都重要得多。

想知道你的業務現在使用 AI 是否安全?UD AI Ready Check 是一個免費評估工具,評核你目前的 AI 使用方式,找出幻覺風險最高的環節,並提供清晰的改善起點。UD 團隊手把手教你,全程陪你走每一步。