AI 日報 002

什麼是大模型？先懂 AI 背後的引擎

發布日期：2026 年 5 月 23 日

上一篇我們講 Codex、Hermas、OpenClaw 的恩怨情仇。這一篇要補上更底層的一塊：它們為什麼能聽懂你？為什麼能寫字、看圖、整理資料、甚至幫你操作工具？答案通常離不開「大模型」。

先講結論

對小白來說，大模型可以先理解成 AI 工具背後的引擎。你看到的是 ChatGPT、Claude、Gemini、DeepSeek、Codex 這些名字；但真正讓它們能理解文字、圖片、語音、程式和任務的，是背後被訓練出來的模型能力。

如果 AI 工具是一台車，那大模型就是引擎。你平常開車不一定會打開引擎蓋，但車跑得快不快、能不能爬坡、耗不耗油、適不適合長途，都跟引擎有關。

所以當我們說 Codex、Hermas、OpenClaw 是不同工具時，不代表它們背後一定是完全不同的東西。很多工具其實是把某個大模型包裝成不同用途：有人包成聊天工具，有人包成寫作工具，有人包成寫程式工具，有人包成可以操作電腦的代理。

它們可以先當成不同公司或團隊做出來的模型家族。每個家族都有不同強項，也會分成快一點、便宜一點、聰明一點、適合寫程式、適合多媒體、適合長文章的版本。

名字	小白可以怎麼理解	常見感覺
GPT	OpenAI 的模型家族，常出現在 ChatGPT、API、Codex 等工具背後。	通用、推理、寫作、程式和工具使用都常見。
Claude	Anthropic 的模型家族，官方文件把 Claude 描述成大型語言模型家族。	長文、對話、寫作、分析、程式任務常被拿來比較。
Gemini	Google 的模型家族，官方文件強調文字、圖片、音訊、影片等多模態能力。	和 Google 生態、搜尋、影音、多媒體任務關聯很深。
DeepSeek	DeepSeek 發布的模型家族，官方透明中心列出已發布模型、技術報告和模型卡。	常被拿來討論開源、推理、程式和性價比。

小白可以先這樣分：Codex 比較像工具和工作台，大模型比較像它背後使用的引擎。Codex 的重點不是只會聊天，而是能把任務放到電腦檔案、程式碼、網站、檢查流程裡。

這就像同一種引擎可以裝在不同車上：有的車拿來載人，有的車拿來送貨，有的車拿來越野。模型能力是底層，工具設計決定它怎麼幫你做事。

因為除了模型本身，還有三個東西會影響結果：

所以你不要只問「哪個 AI 最強」。更好的問題是：「我要做這件事，哪個工具最適合？背後模型夠不夠？它能不能真的幫我完成？」

工具是入口，模型是引擎，溝通是方向盤。

你不一定要懂引擎怎麼製造，但你要知道自己想去哪裡，並學會把需求講清楚。這就是未來普通人進入 AI 世界最重要的基本能力。

以前手機和電腦有很多功能，但普通人用不到，因為找功能、學介面、記步驟都太麻煩。大模型讓 AI 開始能理解你的自然語言，於是你可以用一句人話，把很多工具叫醒。

例如你可以說：「幫我把這段錄音整理成文章大綱」、「幫我把這篇文章變成短影音腳本」、「幫我檢查網站有沒有舊連結」。你不一定知道背後按了哪些按鈕，但 AI 可以幫你拆成步驟。

不用先背所有模型名字。小白可以照這個順序：

第一步

知道 Codex、Hermas、OpenClaw 這種工具各自適合做什麼。

第二步

知道 GPT、Claude、Gemini、DeepSeek 是背後的引擎家族。

第三步

學會把任務講清楚，讓 AI 幫你把手機和電腦真正用起來。

第四步

文章、影片、網站、日報，都是讓 AI 能力落地的成果。

資料來源：OpenAI 模型文件、Anthropic Claude 模型文件、Google Gemini API 模型文件、DeepSeek Transparency Center。這篇文章用小白角度解釋概念，不做模型排名。