← 返回文章列表

你的知識庫決定 AI 客服的智商——怎麼餵資料才不會養出白痴

你花了錢做 AI 客服,結果它最常說的一句話是「很抱歉,我無法回答」

這是我聽過最多的抱怨。老闆花了十幾萬做 AI 客服系統,上線第一週,客戶問「你們的 A 方案跟 B 方案差在哪」,AI 回答「很抱歉,我目前無法提供這方面的資訊,建議您聯繫客服人員」。

客戶的反應:「所以這個機器人到底有什麼用?」

老闆的反應:「AI 果然還不行。」

兩個人都搞錯重點了。問題不在 AI 模型笨,在你餵進去的資料根本沒有答案

這就像你請了一個記憶力超強的實習生,但只給他一份過期的產品目錄和一堆格式混亂的 Word 檔,然後期望他能回答客戶的任何問題。他當然答不出來——不是他笨,是你沒給他東西。

同一個模型,知識庫品質差五倍

我做過一個實驗:同一個 AI 模型(Claude Sonnet),接上兩套不同品質的知識庫,回答同樣 50 個客戶問題。

結果:

指標亂餵的知識庫整理過的知識庫
正確回答率34%82%
「無法回答」比例41%8%
答案含幻覺(編造資訊)25%10%
平均回應成本每則 8 元每則 2.5 元

同一個模型,差距是 2.4 倍的正確率、3.2 倍的成本。模型沒換,唯一的變數是知識庫怎麼整理。

更恐怖的是「幻覺」那一行——亂餵的版本有四分之一的回答看起來很有自信,但內容是錯的。AI 不會說「我不確定」,它會很流暢地編一個聽起來合理但完全錯誤的答案。你的客戶信了,然後你就有客訴了。

三個決定 AI 客服智商的維度

維度一:格式——AI 讀得懂,不代表讀得準

大部分公司丟進知識庫的是什麼?PDF、Word、PPT、網頁截圖、甚至掃描的紙本文件。

AI 確實能「讀」這些格式,但讀的品質天差地遠:

格式AI 理解度常見問題
結構化 Markdown / 純文字95%+幾乎沒有
乾淨的網頁 HTML85-90%導航列、頁尾被當成內容
排版簡單的 PDF70-80%表格錯亂、分頁斷句
複雜排版的 PDF / PPT40-60%欄位混淆、圖文分離
掃描圖片 / 截圖20-50%OCR 錯字、完全丟失結構

一家餐廳把菜單的 PDF 丟進知識庫,結果 AI 把「招牌牛肉麵 $180」讀成「招牌牛肉 麵 $18 0」,客戶問價格,AI 回答 18 元。

不是 AI 的錯。是你給它的格式讓它讀錯了。

最低成本的改善:把核心資料轉成純文字或 Markdown。不用全部轉,先轉最常被問到的前 20 個問題涵蓋的內容就好。這一步通常花半天到一天,但可以讓正確率從 40% 跳到 75%。

維度二:粒度——一份文件回答一個問題

這是最反直覺的一點。

很多公司的做法:把整本產品手冊(200 頁)丟進知識庫,覺得「反正 AI 會自己找」。

問題是 AI 找答案的方式叫 RAG(Retrieval-Augmented Generation)——它不是讀完整本書再回答你,而是先搜尋最相關的幾個段落,只把這幾段送進 AI 模型

搜尋的單位越大,精準度越低。想像你在圖書館找一個食譜:

  • 搜尋單位是「整本書」→ 找到《中華料理大全》,但你要的「番茄炒蛋」在第 387 頁,AI 可能沒看到那頁
  • 搜尋單位是「一個章節」→ 找到「家常菜」章節,範圍小多了
  • 搜尋單位是「一道菜的食譜」→ 直接命中

知識庫的理想粒度:一個段落回答一個具體問題。

實務上怎麼做:

  1. 把大文件拆成小段落。每段 200-500 字,圍繞一個具體主題。
  2. 每段加上標題。標題要像客戶會問的問題:「A 方案和 B 方案的差別」比「產品比較表」好。
  3. 重複的背景資訊不要刪。每段都應該能獨立被理解,不能假設讀者看過前面的內容。

一家保險公司把 80 頁的保單條款拆成 150 個「一問一答」段落後,AI 的正確回答率從 38% 跳到 79%。工作量大概是兩個人花三天

維度三:更新頻率——過期的答案比沒有答案更危險

這是最多人忽略的。

知識庫建好那天,內容是對的。三個月後呢?價格改了、方案調了、新產品上了、舊功能下架了。

AI 不知道資料過期了。它會用過期的資訊,很有自信地回答客戶。

一個真實場景:某公司去年底調了價格,但知識庫裡還是舊價格。AI 告訴客戶「這個方案每月 $990」,客戶下單後發現實際收費 $1,290。客訴、退款、信任崩塌——全部因為一個沒更新的數字。

最低限度的防護

  1. 設定更新週期。核心資料(價格、方案、政策)至少每月檢查一次。
  2. 加上時效標記。在知識庫段落裡寫「此價格更新於 2026 年 4 月」,AI 被問到時至少可以提醒客戶「這是 X 月的資訊,建議確認最新價格」。
  3. 有人負責。不是 IT 部門的事,是最了解業務變動的那個人的事。通常是業務主管或客服主管。

快速自檢清單:你的知識庫及格嗎?

在花錢升級模型或換廠商之前,先跑這五題:

#問題及格標準
1你的核心資料是什麼格式?至少前 20 個常見問題的答案是純文字或 Markdown
2知識庫的最小單位是什麼?段落級(200-500 字),不是整份文件
3每個段落有標題嗎?有,而且像客戶會問的問題
4上次更新是什麼時候?三個月內
5誰負責更新?有具體的人名,不是「IT 部門」

五題裡如果有三題不及格,你的 AI 客服問題八成不在模型,在知識庫。換更貴的模型不會變好,整理資料才會。

我怎麼幫客戶做這件事

通常分三步:

第一步:盤點(免費,聊 LINE 就行)

你把現有的資料丟給我看——可能是一堆 PDF、一個 Google Drive、或者你的官網。我幫你快速評估:哪些可以直接用、哪些要轉格式、哪些要拆段、哪些根本不該放進知識庫。

這一步不用花錢,通常十分鐘就有初步結論。

第二步:整理(最花時間,但最值得)

根據盤點結果,把核心資料轉成 AI 能精準讀取的格式。這步可以你自己做(我教你方法),也可以我來做。

通常 20-30 個核心主題的整理,工期大概 2-5 天。

第三步:接上 AI 並持續校準

整理好的知識庫接上 LINE Bot,跑一週的真實對話,看哪些問題還是答不好,再針對性補資料。

大部分客戶在第二步就會感受到巨大差異——同一個 AI 系統,換了知識庫,突然變聰明了。不是魔法,是你終於給了它正確的原料。

你的 AI 客服「笨」,可能只是餓了

AI 模型是引擎,知識庫是燃料。你不會因為車跑不動就換引擎——先看油箱裡裝的是不是對的油。

如果你已經有 AI 客服但效果不好,或者正在評估要不要做——加 LINE 跟我聊,把你目前的資料狀況大概描述一下。我可以幫你判斷問題在哪一層,以及最小成本的改善方案是什麼。

大部分情況下,花三天整理資料,效果比花三萬換模型好

加 LINE 好友 QR Code

有技術問題?先跟 AI 助手聊聊

掃碼加 LINE,AI 助手 24 小時在線。問技術、問報價、問可行性都行——真的需要我本人判斷的,它會通知我接手。

加 LINE 免費諮詢每週限 3 組深度諮詢
完全免費 不推銷 聊完不需要就不需要

覺得有幫助?分享給需要的人

© 2026 Matt Chang. All rights reserved.