你的知識庫決定 AI 客服的智商——怎麼餵資料才不會養出白痴

你花了錢做 AI 客服，結果它最常說的一句話是「很抱歉，我無法回答」

這是我聽過最多的抱怨。老闆花了十幾萬做 AI 客服系統，上線第一週，客戶問「你們的 A 方案跟 B 方案差在哪」，AI 回答「很抱歉，我目前無法提供這方面的資訊，建議您聯繫客服人員」。

客戶的反應：「所以這個機器人到底有什麼用？」

老闆的反應：「AI 果然還不行。」

兩個人都搞錯重點了。問題不在 AI 模型笨，在你餵進去的資料根本沒有答案。

這就像你請了一個記憶力超強的實習生，但只給他一份過期的產品目錄和一堆格式混亂的 Word 檔，然後期望他能回答客戶的任何問題。他當然答不出來——不是他笨，是你沒給他東西。

我做過一個實驗：同一個 AI 模型（Claude Sonnet），接上兩套不同品質的知識庫，回答同樣 50 個客戶問題。

結果：

同一個模型，差距是 2.4 倍的正確率、3.2 倍的成本。模型沒換，唯一的變數是知識庫怎麼整理。

更恐怖的是「幻覺」那一行——亂餵的版本有四分之一的回答看起來很有自信，但內容是錯的。AI 不會說「我不確定」，它會很流暢地編一個聽起來合理但完全錯誤的答案。你的客戶信了，然後你就有客訴了。

大部分公司丟進知識庫的是什麼？PDF、Word、PPT、網頁截圖、甚至掃描的紙本文件。

AI 確實能「讀」這些格式，但讀的品質天差地遠：

一家餐廳把菜單的 PDF 丟進知識庫，結果 AI 把「招牌牛肉麵 $180」讀成「招牌牛肉麵 $18 0」，客戶問價格，AI 回答 18 元。

不是 AI 的錯。是你給它的格式讓它讀錯了。

最低成本的改善：把核心資料轉成純文字或 Markdown。不用全部轉，先轉最常被問到的前 20 個問題涵蓋的內容就好。這一步通常花半天到一天，但可以讓正確率從 40% 跳到 75%。

這是最反直覺的一點。

很多公司的做法：把整本產品手冊（200 頁）丟進知識庫，覺得「反正 AI 會自己找」。

問題是 AI 找答案的方式叫 RAG（Retrieval-Augmented Generation）——它不是讀完整本書再回答你，而是先搜尋最相關的幾個段落，只把這幾段送進 AI 模型。

搜尋的單位越大，精準度越低。想像你在圖書館找一個食譜：

知識庫的理想粒度：一個段落回答一個具體問題。

實務上怎麼做：

一家保險公司把 80 頁的保單條款拆成 150 個「一問一答」段落後，AI 的正確回答率從 38% 跳到 79%。工作量大概是兩個人花三天。

這是最多人忽略的。

知識庫建好那天，內容是對的。三個月後呢？價格改了、方案調了、新產品上了、舊功能下架了。

AI 不知道資料過期了。它會用過期的資訊，很有自信地回答客戶。

一個真實場景：某公司去年底調了價格，但知識庫裡還是舊價格。AI 告訴客戶「這個方案每月 $990」，客戶下單後發現實際收費 $1,290。客訴、退款、信任崩塌——全部因為一個沒更新的數字。

最低限度的防護：

在花錢升級模型或換廠商之前，先跑這五題：