小白 AI Hub

AI 日報 002

什麼是大模型?先懂 AI 背後的引擎

上一篇我們講 Codex、Hermas、OpenClaw 的恩怨情仇。這一篇要補上更底層的一塊:它們為什麼能聽懂你?為什麼能寫字、看圖、整理資料、甚至幫你操作工具?答案通常離不開「大模型」。

先講結論

對小白來說,大模型可以先理解成 AI 工具背後的引擎。你看到的是 ChatGPT、Claude、Gemini、DeepSeek、Codex 這些名字;但真正讓它們能理解文字、圖片、語音、程式和任務的,是背後被訓練出來的模型能力。

先用車子來比喻

如果 AI 工具是一台車,那大模型就是引擎。你平常開車不一定會打開引擎蓋,但車跑得快不快、能不能爬坡、耗不耗油、適不適合長途,都跟引擎有關。

所以當我們說 Codex、Hermas、OpenClaw 是不同工具時,不代表它們背後一定是完全不同的東西。很多工具其實是把某個大模型包裝成不同用途:有人包成聊天工具,有人包成寫作工具,有人包成寫程式工具,有人包成可以操作電腦的代理。

GPT、Claude、Gemini、DeepSeek 是什麼位置?

它們可以先當成不同公司或團隊做出來的模型家族。每個家族都有不同強項,也會分成快一點、便宜一點、聰明一點、適合寫程式、適合多媒體、適合長文章的版本。

名字小白可以怎麼理解常見感覺
GPTOpenAI 的模型家族,常出現在 ChatGPT、API、Codex 等工具背後。通用、推理、寫作、程式和工具使用都常見。
ClaudeAnthropic 的模型家族,官方文件把 Claude 描述成大型語言模型家族。長文、對話、寫作、分析、程式任務常被拿來比較。
GeminiGoogle 的模型家族,官方文件強調文字、圖片、音訊、影片等多模態能力。和 Google 生態、搜尋、影音、多媒體任務關聯很深。
DeepSeekDeepSeek 發布的模型家族,官方透明中心列出已發布模型、技術報告和模型卡。常被拿來討論開源、推理、程式和性價比。

那 Codex 算大模型嗎?

小白可以先這樣分:Codex 比較像工具和工作台,大模型比較像它背後使用的引擎。Codex 的重點不是只會聊天,而是能把任務放到電腦檔案、程式碼、網站、檢查流程裡。

這就像同一種引擎可以裝在不同車上:有的車拿來載人,有的車拿來送貨,有的車拿來越野。模型能力是底層,工具設計決定它怎麼幫你做事。

為什麼同樣是 AI,感覺差很多?

因為除了模型本身,還有三個東西會影響結果:

  1. 工具給模型的任務方式:是聊天、寫程式、做圖,還是操作瀏覽器。
  2. 工具能使用的資料:有沒有讀到你的檔案、網頁、圖片、影片或上下文。
  3. 工具能使用的能力:能不能搜尋、能不能改檔案、能不能執行指令、能不能連接外部服務。

所以你不要只問「哪個 AI 最強」。更好的問題是:「我要做這件事,哪個工具最適合?背後模型夠不夠?它能不能真的幫我完成?」

小白最該記住的一句話

工具是入口,模型是引擎,溝通是方向盤。

你不一定要懂引擎怎麼製造,但你要知道自己想去哪裡,並學會把需求講清楚。這就是未來普通人進入 AI 世界最重要的基本能力。

大模型和手機、電腦有什麼關係?

以前手機和電腦有很多功能,但普通人用不到,因為找功能、學介面、記步驟都太麻煩。大模型讓 AI 開始能理解你的自然語言,於是你可以用一句人話,把很多工具叫醒。

例如你可以說:「幫我把這段錄音整理成文章大綱」、「幫我把這篇文章變成短影音腳本」、「幫我檢查網站有沒有舊連結」。你不一定知道背後按了哪些按鈕,但 AI 可以幫你拆成步驟。

下一步怎麼學?

不用先背所有模型名字。小白可以照這個順序:

第一步

先懂工具

知道 Codex、Hermas、OpenClaw 這種工具各自適合做什麼。

第二步

再懂模型

知道 GPT、Claude、Gemini、DeepSeek 是背後的引擎家族。

第三步

最後練溝通

學會把任務講清楚,讓 AI 幫你把手機和電腦真正用起來。

第四步

開始做作品

文章、影片、網站、日報,都是讓 AI 能力落地的成果。

本章小結

資料來源:OpenAI 模型文件、Anthropic Claude 模型文件、Google Gemini API 模型文件、DeepSeek Transparency Center。這篇文章用小白角度解釋概念,不做模型排名。