什麼是 AI 幻覺?香港老闆必須了解的 AI 基礎常識
2026-05-11一個關於 AI 出錯的反直覺真相
大多數人以為 AI 給出錯誤答案,是因為它知道得不夠多。現實幾乎相反:AI 最容易出現幻覺,往往是在它最自信的時候,而非最困惑的時候。理解這一點,將根本改變你使用每一個 AI 工具的方式。
2026 年 5 月,OpenAI 公布數據顯示,GPT-5.5 Instant 在涉及醫療、法律和財務的高風險提示中,產生幻覺的比率比上一版本減少了 52.5%。這是一個進步,但同時也證實了 AI 幻覺問題並未解決,只是被管理了。對於依賴 AI 處理客戶溝通、財務摘要或合約草稿的香港中小企老闆而言,這個差距至關重要。
什麼是 AI 幻覺?
AI 幻覺是指 AI 系統生成了在事實上錯誤、捏造或無法核實的資訊,但卻以與準確內容相同的自信語氣呈現出來。這個詞來自心理學,幻覺是一種沒有現實依據的感知;在 AI 中,幻覺則是一種沒有事實依據的回應。
典型例子:你請 AI 摘要某間公司的財務業績,它自信地列出了一個從未被任何地方報告過的收入數字。或者你請它引用來源,它編造了一篇聽起來真實的學術論文,但這篇論文根本不存在。
關鍵在於:AI 不知道自己在產生幻覺。這種模型透過預測「最合理的下一個詞」來生成文字。當它對某個主題的數據不足或模糊時,它不會停下來說「我不確定」,而是以聽起來合理的內容填補空白,並以核實過的事實般的方式呈現。
AI 為何會產生幻覺?
AI 幻覺的根源在於大型語言模型透過模式補全而非從已核實的事實推理來生成文字。模型在海量文本上接受訓練,遇到提示時,它生成的是統計上最可能的延續,而不論這個延續是否在事實上正確。
在幾種情況下問題尤為突出:當某個主題在訓練數據中代表性不足時,模型可依賴的可靠模式較少,更容易錯誤外推;當用戶的問題含糊時,模型可能以看似合理但事實錯誤的方向解讀;當模型被要求生成特定格式(如編號來源清單或數字表格)時,它有時會捏造合理的條目來填充預期結構。
較新的模型世代通過更好的訓練數據和針對高風險領域的精調來減少幻覺,但無法消除它。幻覺是這類模型工作方式的結構性特質,不是能被完全修復的技術漏洞。
AI 幻覺最常見的四種類型
對業主而言最重要的四種幻覺類型:事實錯誤、來源捏造、數字編造、實體誤歸屬。
事實錯誤是最常見的。AI 以錯誤的日期、公司名稱或法規陳述某些內容為真,這類錯誤往往細微到足以通過初步審閱,但在到達客戶或監管機構前卻足以造成問題。
來源捏造是 AI 編造了一個看起來真實但並不存在的引用。它可能引用一本真實的期刊、一位真實的作者和一個聽起來合理的論文標題,但這些全部不對應任何實際出版物。在需要核實引用的專業情境中,這尤其危險。
數字編造是 AI 生成一個具體數字(百分比、價格、數量)聽起來具有權威性,但並非來自任何實際數據。例如詢問「香港餐飲業的平均毛利率」卻不提供來源,AI 可能給出一個看起來合理但本質上是模型估算的數字。
實體誤歸屬是 AI 將某個陳述、行動或特徵歸屬於錯誤的人、公司或組織,從「弄錯行政總裁姓名」的小錯誤,到「錯誤陳述某公司涉及法律案件」的重大聲譽風險,皆有可能。
AI 幻覺發生的頻率有多高?
幻覺率因任務類型、模型世代和提示結構的不同而有顯著差異。根據 OpenAI 於 2026 年 5 月發布的基準測試,GPT-5.5 Instant 在高風險提示上的幻覺聲明比 GPT-5.3 Instant 減少了 52.5%,即錯誤率幾乎減半,但並未消除。Gartner 2025 年的研究估計,當時的 AI 系統在企業環境的事實查詢中,有 15 至 20% 的機率產生不可靠的輸出。
實際意義:如果你使用 AI 處理需要事實準確性的任務(引用法規、摘要合約條款、引用統計數據),應假設大約每 5 至 10 個回應中可能有 1 個含有需要核實的錯誤。這不代表 AI 無用,而是說明 AI 在事實聲明上需要人工檢查,就像初級員工的初稿需要審閱一樣。
哪些業務工作風險最高?
高風險工作是那些幻覺事實在被發現之前便可能造成傷害的情況:法律文件草擬、合規聲明、將出現在客戶報告中的財務數字、醫療或健康資訊、影響安全的產品規格,以及任何包含引用或具名統計數據的內容。
對香港中小企老闆而言,具體的高風險場景包括:用 AI 回答客戶關於產品規格或合規認證的查詢;讓 AI 起草條款及細則或私隱政策;請 AI 摘要合約或租約;以及使用 AI 生成將與投資者、銀行或政府機構共享的財務報告。
低風險工作(幻覺要麼不適用,要麼錯誤即時顯而易見)包括:撰寫聲明不依賴第三方來源的市場推廣文案、將你自己的數據重新整理成不同格式、生成供你選擇的創意選項,以及翻譯你可以核實的內容。
香港中小企如何降低幻覺風險?
降低幻覺風險最有效的策略是結構性的,不是技術性的。你不需要對 AI 有更深入的理解,只需要養成一個一致的習慣:把 AI 輸出當作新員工的初稿來對待。
提供來源,而非要求 AI 提供。與其問「香港餐飲業的消費稅稅率是多少?」,不如貼上相關法規文本並問「根據這段文字,適用稅率是多少?」。當你提供源材料,AI 不需要回憶事實,只需閱讀和提取,這可靠得多。
要求推理過程,而非只要結論。「告訴我答案,並逐步解釋你如何得出這個結論」這類提示迫使 AI 暴露其邏輯,使錯誤在輸出前更容易被發現。
在使用任何具體數字前先核實。百分比、年份、姓名、法規編號,任何由 AI 生成的具體數據,在出現於客戶文件、簡報或公開聲明前,均應對照原始來源確認。
AI 負責結構,人工負責事實。AI 擅長建立文件框架,包括標題、段落流程和專業語言。讓它撰寫結構,再由你填入已核實的事實。這個做法既獲得 AI 的效率優勢,又避免了在最重要的資訊上承擔幻覺風險。
AI 會捏造事實,還值得使用嗎?
對於絕大多數業務工作而言,答案是肯定的,前提是你理解你在要求它做什麼。幻覺是一個真實的限制,但它是可以管理的。不使用 AI 的替代方案意味著:一個已學會在適當核實下有效使用 AI 的競爭對手,將在每一項受益於自動化的工作上超過你。
這樣想:每一位新員工也會犯事實錯誤,尤其在最初幾週。你不會因此停止招聘,你會建立審閱流程。AI 需要同樣的調整:把它的輸出視為需要在事實聲明上進行人工核實的高質量初稿,它便成為真正的生產力倍增器,而非風險來源。
懂 AI,更懂你。了解 AI 的能力界限,是真正用好 AI 的起點。
不確定你的業務 AI 就緒程度?
了解幻覺問題只是安全使用 AI 的一部分。更大的問題是,你現有的 AI 工具設定、自動化的工作流程及審閱機制,是否真正保護了你和你的客戶。UD 團隊手把手教你評估 AI 就緒程度,識別最高風險的工作流程,並為你的具體業務建立合適的防護機制。