你的知識庫決定 AI 客服的智商——怎麼餵資料才不會養出白痴
你花了錢做 AI 客服,結果它最常說的一句話是「很抱歉,我無法回答」
這是我聽過最多的抱怨。老闆花了十幾萬做 AI 客服系統,上線第一週,客戶問「你們的 A 方案跟 B 方案差在哪」,AI 回答「很抱歉,我目前無法提供這方面的資訊,建議您聯繫客服人員」。
客戶的反應:「所以這個機器人到底有什麼用?」
老闆的反應:「AI 果然還不行。」
兩個人都搞錯重點了。問題不在 AI 模型笨,在你餵進去的資料根本沒有答案。
這就像你請了一個記憶力超強的實習生,但只給他一份過期的產品目錄和一堆格式混亂的 Word 檔,然後期望他能回答客戶的任何問題。他當然答不出來——不是他笨,是你沒給他東西。
同一個模型,知識庫品質差五倍
我做過一個實驗:同一個 AI 模型(Claude Sonnet),接上兩套不同品質的知識庫,回答同樣 50 個客戶問題。
結果:
| 指標 | 亂餵的知識庫 | 整理過的知識庫 |
|---|---|---|
| 正確回答率 | 34% | 82% |
| 「無法回答」比例 | 41% | 8% |
| 答案含幻覺(編造資訊) | 25% | 10% |
| 平均回應成本 | 每則 8 元 | 每則 2.5 元 |
同一個模型,差距是 2.4 倍的正確率、3.2 倍的成本。模型沒換,唯一的變數是知識庫怎麼整理。
更恐怖的是「幻覺」那一行——亂餵的版本有四分之一的回答看起來很有自信,但內容是錯的。AI 不會說「我不確定」,它會很流暢地編一個聽起來合理但完全錯誤的答案。你的客戶信了,然後你就有客訴了。
三個決定 AI 客服智商的維度
維度一:格式——AI 讀得懂,不代表讀得準
大部分公司丟進知識庫的是什麼?PDF、Word、PPT、網頁截圖、甚至掃描的紙本文件。
AI 確實能「讀」這些格式,但讀的品質天差地遠:
| 格式 | AI 理解度 | 常見問題 |
|---|---|---|
| 結構化 Markdown / 純文字 | 95%+ | 幾乎沒有 |
| 乾淨的網頁 HTML | 85-90% | 導航列、頁尾被當成內容 |
| 排版簡單的 PDF | 70-80% | 表格錯亂、分頁斷句 |
| 複雜排版的 PDF / PPT | 40-60% | 欄位混淆、圖文分離 |
| 掃描圖片 / 截圖 | 20-50% | OCR 錯字、完全丟失結構 |
一家餐廳把菜單的 PDF 丟進知識庫,結果 AI 把「招牌牛肉麵 $180」讀成「招牌牛肉 麵 $18 0」,客戶問價格,AI 回答 18 元。
不是 AI 的錯。是你給它的格式讓它讀錯了。
最低成本的改善:把核心資料轉成純文字或 Markdown。不用全部轉,先轉最常被問到的前 20 個問題涵蓋的內容就好。這一步通常花半天到一天,但可以讓正確率從 40% 跳到 75%。
維度二:粒度——一份文件回答一個問題
這是最反直覺的一點。
很多公司的做法:把整本產品手冊(200 頁)丟進知識庫,覺得「反正 AI 會自己找」。
問題是 AI 找答案的方式叫 RAG(Retrieval-Augmented Generation)——它不是讀完整本書再回答你,而是先搜尋最相關的幾個段落,只把這幾段送進 AI 模型。
搜尋的單位越大,精準度越低。想像你在圖書館找一個食譜:
- 搜尋單位是「整本書」→ 找到《中華料理大全》,但你要的「番茄炒蛋」在第 387 頁,AI 可能沒看到那頁
- 搜尋單位是「一個章節」→ 找到「家常菜」章節,範圍小多了
- 搜尋單位是「一道菜的食譜」→ 直接命中
知識庫的理想粒度:一個段落回答一個具體問題。
實務上怎麼做:
- 把大文件拆成小段落。每段 200-500 字,圍繞一個具體主題。
- 每段加上標題。標題要像客戶會問的問題:「A 方案和 B 方案的差別」比「產品比較表」好。
- 重複的背景資訊不要刪。每段都應該能獨立被理解,不能假設讀者看過前面的內容。
一家保險公司把 80 頁的保單條款拆成 150 個「一問一答」段落後,AI 的正確回答率從 38% 跳到 79%。工作量大概是兩個人花三天。
維度三:更新頻率——過期的答案比沒有答案更危險
這是最多人忽略的。
知識庫建好那天,內容是對的。三個月後呢?價格改了、方案調了、新產品上了、舊功能下架了。
AI 不知道資料過期了。它會用過期的資訊,很有自信地回答客戶。
一個真實場景:某公司去年底調了價格,但知識庫裡還是舊價格。AI 告訴客戶「這個方案每月 $990」,客戶下單後發現實際收費 $1,290。客訴、退款、信任崩塌——全部因為一個沒更新的數字。
最低限度的防護:
- 設定更新週期。核心資料(價格、方案、政策)至少每月檢查一次。
- 加上時效標記。在知識庫段落裡寫「此價格更新於 2026 年 4 月」,AI 被問到時至少可以提醒客戶「這是 X 月的資訊,建議確認最新價格」。
- 有人負責。不是 IT 部門的事,是最了解業務變動的那個人的事。通常是業務主管或客服主管。
快速自檢清單:你的知識庫及格嗎?
在花錢升級模型或換廠商之前,先跑這五題:
| # | 問題 | 及格標準 |
|---|---|---|
| 1 | 你的核心資料是什麼格式? | 至少前 20 個常見問題的答案是純文字或 Markdown |
| 2 | 知識庫的最小單位是什麼? | 段落級(200-500 字),不是整份文件 |
| 3 | 每個段落有標題嗎? | 有,而且像客戶會問的問題 |
| 4 | 上次更新是什麼時候? | 三個月內 |
| 5 | 誰負責更新? | 有具體的人名,不是「IT 部門」 |
五題裡如果有三題不及格,你的 AI 客服問題八成不在模型,在知識庫。換更貴的模型不會變好,整理資料才會。
我怎麼幫客戶做這件事
通常分三步:
第一步:盤點(免費,聊 LINE 就行)
你把現有的資料丟給我看——可能是一堆 PDF、一個 Google Drive、或者你的官網。我幫你快速評估:哪些可以直接用、哪些要轉格式、哪些要拆段、哪些根本不該放進知識庫。
這一步不用花錢,通常十分鐘就有初步結論。
第二步:整理(最花時間,但最值得)
根據盤點結果,把核心資料轉成 AI 能精準讀取的格式。這步可以你自己做(我教你方法),也可以我來做。
通常 20-30 個核心主題的整理,工期大概 2-5 天。
第三步:接上 AI 並持續校準
整理好的知識庫接上 LINE Bot,跑一週的真實對話,看哪些問題還是答不好,再針對性補資料。
大部分客戶在第二步就會感受到巨大差異——同一個 AI 系統,換了知識庫,突然變聰明了。不是魔法,是你終於給了它正確的原料。
你的 AI 客服「笨」,可能只是餓了
AI 模型是引擎,知識庫是燃料。你不會因為車跑不動就換引擎——先看油箱裡裝的是不是對的油。
如果你已經有 AI 客服但效果不好,或者正在評估要不要做——加 LINE 跟我聊,把你目前的資料狀況大概描述一下。我可以幫你判斷問題在哪一層,以及最小成本的改善方案是什麼。
大部分情況下,花三天整理資料,效果比花三萬換模型好。
有技術問題?先跟 AI 助手聊聊
掃碼加 LINE,AI 助手 24 小時在線。問技術、問報價、問可行性都行——真的需要我本人判斷的,它會通知我接手。
覺得有幫助?分享給需要的人
