企業導入 AI 到底多少錢?一個 LINE Bot、一套知識庫、一個客服的真實成本拆解
你被報過三種價,每種差一個零?
如果你最近有在評估 AI 導入,很可能遇過這種情況:
- 問第一家,報 3 萬塊,「用 API 接一下就好」。
- 問第二家,報 30 萬,「要建向量資料庫、做 RAG、搞 fine-tuning」。
- 問第三家,報 300 萬,「企業級部署、on-premise、專屬模型」。
你聽完三家的提案,有一種很熟悉的感覺——他們講的好像是同一件事,但報價差一百倍,你完全不知道差在哪。
這不是你的問題。這是因為「AI 導入」這四個字實在太寬,可以指很多完全不同規模的東西。
這篇文章不教你怎麼選廠商,而是把 AI 的成本結構拆開,讓你下次聽到任何報價時,知道對方在算什麼、漏算什麼、哪些數字會騙你。
先分清楚:AI 成本不是一個數字,是四層
我看過太多中小企業老闆,把 AI 成本理解成「買一套系統要多少錢」。這個直覺對了一半——真正會讓你意外的,是另一半。
AI 系統的成本有四層,任何報價單只算前一層就是不負責任:
第一層:一次性建置成本
這是最直觀的那一層。開發工程師的工時、系統整合、上線測試、教育訓練。
小規模的 LINE Bot 客服從幾萬到十幾萬不等,一套完整的企業知識庫(RAG)大概二十到八十萬,看資料量和客製程度。
這層很好比價,但也最不重要。因為它是一次性的——重點在後面三層。
第二層:持續運行成本(最容易被漏算)
AI 不是買回來就結束。每一次它回答問題、查資料、生成內容,都在燒錢。
燒的是什麼?主要是 LLM 的 API 費用。每次你問它一個問題,都要把「歷史對話 + 你的問題 + 知識庫片段」打包送到 OpenAI 或 Anthropic,他們按 token 計費(token 大概是「字」的概念)。
這層的數字會讓你冷汗直流:
- 一個設計不好的 RAG 系統,每次問答可能花 5-30 元台幣
- 一個設計好的,0.3-3 元
- 兩者差 10 倍不是誇張,是常態
如果你的客服系統每天有 500 則對話——設計好的版本一個月 5,000 元,設計不好的一個月 50,000 元。光這一層的差距,三個月就買下一次整套系統了。
第三層:維護成本(長尾但真實)
AI 不是裝好就永遠對。資料會過期、客戶會問你沒教過的問題、prompt 需要微調、API 廠商會改價、新版模型會換介面。
持續有人盯這件事 = 成本。沒人盯 = AI 變蠢,然後你覺得被騙了。
中小企業常見的做法是「請原廠商按月維護」,一個月大概 5,000-30,000 元。這筆錢看起來不多,但三年累積下來常常比一次性建置費還高。
第四層:失控風險(最容易被忽略的地雷)
這層不在報價單裡,但會炸最大。
最有名的案例:一個工程師設定 AI agent 幫他安裝 Python 套件,結果一個步驟失敗了,agent 連續重試了 6 小時,工程師在睡覺沒察覺。隔天起床發現 $120 美金的帳單(約 3,800 台幣)——全部燒在一個永遠不會成功的錯誤迴圈上。
這不是極端案例,是任何沒設上限的 AI 系統都可能發生的事。對企業來說風險更大:如果是你的 LINE Bot 系統,可能一個奇怪的訊息就觸發無限迴圈,一個晚上燒掉半個月預算。
報價單裡有沒有寫這個風險的防護機制(失敗三次停止、每日預算上限、異常警報),是判斷廠商專業度最快的方式。沒寫 = 沒做。
為什麼同一個功能,成本可以差 10 倍
前面提到 RAG 問答成本可以差 10 倍——這不是誇張。差別不在模型貴不貴,在架構怎麼設計。
關鍵一:多模型路由
現在主流的 LLM 廠商(Anthropic、OpenAI)都有三層模型:便宜快、中等、旗艦。差距是多少?旗艦模型的 token 價格大約是便宜模型的 12-15 倍。
笨的做法:所有任務都用旗艦模型,「這樣品質最好」。
聰明的做法:把一次大任務拆成多個小任務。例如「判斷客戶在問什麼分類」用便宜模型(幾毛錢),「生成回答」用中等模型(幾塊錢),「處理很刁鑽的客訴」才升級旗艦模型(幾十塊錢)。
同樣一個客服系統,這個拆法可以讓 90% 的對話跑便宜模型,只有 10% 用中等、1% 用旗艦。總成本壓到原本的 1/10。
關鍵二:Prompt Caching(重複 prompt 的折扣機制)
LLM 廠商現在普遍提供 prompt caching——如果你的 prompt 開頭有一大段重複內容(例如系統設定、公司背景、SOP),這段可以被快取,第二次之後只收 10% 的費用。
這不是小事。一個客服 bot 的系統 prompt 常常有 5,000 字,如果沒用 caching,每次對話都在付這 5,000 字的錢。用了 caching,同一個 prompt 的第二次到第 N 次對話只付 10%。
做跟不做,差一個零。很多廠商的報價沒把這算進去,因為他們的工程師根本沒實作。
關鍵三:Context 瘦身
一個常見的誤區:「既然 AI 有大 context window,那就把整個資料庫都丟進去,讓它自己找答案」。
這是最貴的蠢做法。你每次問問題都在付「整個資料庫」的 token 費用。
正確做法是用 RAG——先用搜尋技術找出「可能相關的 5-10 段內容」,只把這幾段送進 LLM。一樣的功能,token 用量可以壓到 1/50 以下。
我自己的 LINE Bot 每則回覆多少錢?
你現在正在看的這個網站,底下那個「加 LINE 諮詢」的 AI 助手,就是我自己做的。每一則 AI 回覆,實際成本大約 0.3 到 15 元台幣之間。
差距這麼大是因為:
- 短問題 + 簡單回答:約 0.3-1 元。例如「你會做 LINE Bot 嗎」。
- 複雜諮詢 + 要去查多篇筆記:約 3-8 元。例如「幫我比較 Notion、Confluence、RAG」。
- 深度技術討論 + 多輪對話:約 8-15 元。例如「我想導入 RAG 到公司,從哪裡開始」。
每則對話我都設了上限(maxBudgetUsd),超過就自動停止,避免意外燒錢。
這不是對話本身貴,是這個設計讓我能睡得安穩。沒有上限的系統,我不敢真的讓它跑在 24 小時在線的客服上。
中小企業最常被誤導的三件事
第一:訂閱制跟 API 計費混淆
Claude、ChatGPT 等個人版是訂閱制(一個月多少錢吃到飽),但企業導入用的是 API,按每次請求計費。兩個是完全不同的計費邏輯。
很多廠商跟你說「我們用的是 ChatGPT」,但給你的報價是按次數算的——那就是在跑 API,不是訂閱版。如果你的日對話量很大,API 計費可能比訂閱貴幾十倍。
第二:「旗艦模型才有效果」的迷思
不一定。大部分客服問題、知識庫查詢、內容分類,中等模型的品質已經足夠,使用者感受不到差別。
旗艦模型真正有效果的場景是:複雜的邏輯推理、長文創作、多步驟規劃。這些在中小企業 AI 應用裡,佔比其實不到 10%。
廠商如果跟你強調「我們用最強的模型」當賣點,先問:為什麼需要?能不能拆解成多模型路由?
第三:沒算進維護成本
建置報價 30 萬聽起來很合理,但每月維護 2 萬,三年下來就是 72 萬,總成本超過建置費的 3 倍。
簽約前一定要問:「三年 TCO(總體擁有成本)大概多少?」如果對方答不出來或拒絕估算,代表他們自己也沒想清楚。
決策框架:四個問題
在接受任何 AI 導入報價前,強迫對方回答這四題:
- 每次 AI 回應的 API 成本大概多少?算過嗎? 答不出來或說「很便宜啦」→ 沒算過。
- 你有做 prompt caching 和多模型路由嗎? 答不出來 → 你會付冤枉錢。
- 如果 AI 進入無限迴圈或異常重試,有什麼保護機制? 沒有 → 你有機會看到 $120 帳單,只是不知道哪天。
- 三年 TCO 預估是多少? 答不出來 → 他們只想賣你建置費,後面不關他們的事。
一個專業的 AI 導入報價,這四題都該有答案。如果對方含糊帶過,換一家。
想知道你那個案子大概多少錢?
AI 導入沒有標準價,但一定有合理價。合理價的前提是先把你要解決的問題講清楚——不是「我要導入 AI」這種太大的題目,而是「我想讓客戶在 LINE 上能自助查詢訂單狀態」這種具體場景。
題目越具體,估算越準。
如果你正在評估要不要導入,或手上已經有幾份廠商報價想對照一下——加這個網站的 LINE 跟我聊聊。描述你的場景和目前聽到的報價,我可以幫你算個大概合理範圍,告訴你廠商是不是漏算了哪一層。
通常聊十分鐘,你就知道這個案子該花 3 萬、30 萬、還是根本不用花錢先用現成工具測試看看。
有技術問題?先跟 AI 助手聊聊
掃碼加 LINE,AI 助手 24 小時在線。問技術、問報價、問可行性都行——真的需要我本人判斷的,它會通知我接手。
覺得有幫助?分享給需要的人
