把 Claude 當包工頭、Gemini 當小工,居然真的有用

你有沒有過那種,明明手上有一把刀,卻硬要拿榔頭去切牛排的時刻?

先講一句:之前說好今天要測地端模型,抱歉啦,先 hold 一下——手上這幾條協作流程的工作跑完再回頭弄。今天的主角不是地端,是雲端兩隻模型的分工。

昨天我就是那個拿榔頭的人。前天為了想在地端跑模型沒搞成,我退而求其次——拿了一把 Vertex AI 的 key,靠 LiteLLM 在中間偽裝成 Anthropic 的 endpoint,把 Gemini 包成「Opus」餵給 Claude Code 用。理論上很美:superpowers 那套 skill 還能照跑,agent 流程不用動,模型直接抽換。

實際上呢?滿慘的。

跑是能跑啦,但體感像在跟一個喝醉的同事 pair programming——他會回應你,但每次回應品質都掉一截,而且很慢。我下一個指令,他想很久,然後給我一個「方向對但細節錯」的東西,我得再追問一輪、再修一輪、再 review 一輪。superpowers 那套設計本來是讓 Claude 自己跟自己對話、自己 plan、自己驗證,結果換了模型之後變成我得介入每一步——等於 superpowers 沒在 work,只是有在跑

跑了一個下午,我大概產出了零點五個能用的東西。


今天起床洗完臉,我換了個策略。既然「讓 Gemini 假裝 Claude」效果這麼差,那不如讓他們各做各的拿手事

Claude 我留著,只做兩件事:跟我討論、寫 plan。

superpowers 開著,我把今天想動的範圍丟給他,請他開 brainstorming 模式跟我來回幾輪。這部分 Claude 真的很穩——他會反問「你這個情境下其實 X 跟 Y 是兩件事,要不要拆開?」、會主動指出我沒想到的 edge case。討論完,我請他直接把每個結論寫成可執行的 plan:要動哪些檔案、預期的行為改變、怎麼驗證、跟誰相依。

然後重點來了——我把這些 plan 用 glab 一個一個開成 issue,plan 的內文整坨貼進 issue description。一個下午下來,Claude 幫我產出了 12 個 issue,每個都有完整的實作描述、驗收條件、跟相關 file path。

接著我開 Gemini,把 issue 丟給他。

「照這個 issue 做。」

就這樣。


Gemini 的角色從「假裝是 Claude」降級成「就是 Gemini」之後,反而做得比較好。他不用揣摩 superpowers 的 prompt 結構、不用模仿 Claude 的工作節奏、不用扛 plan 的策略決策——他只要看著一個寫得清清楚楚的 issue,把 code 改出來。

像是去工地給師傅一張畫好的施工圖,跟給他一句「啊你看著辦」的差別。

到下班前,Gemini 修好了 2 個 issue——其中一個是新功能的小切片,另一個是設定面的調整。還有 1 個比較大的 feature 正在改,估計明天能收尾。剩下的 9 個排在 backlog 等著被處理。

聽起來不多對吧?12 個開出來只完成 2 個。但對比昨天用 LiteLLM 那條路——一整天連一個有信心 merge 的 commit 都生不出來——這個數字其實滿感人的。


寫到這裡我才意識到,這件事的教訓不是「Gemini 比較爛」或「Claude 比較強」,而是**「不要讓模型去演他不會演的角色」**。

LiteLLM 偽裝那條路的問題不在於工具本身——LiteLLM 做為 proxy 沒什麼好挑剔的——而在於我預設「換 endpoint 就好,行為應該一致」。但 superpowers 的 prompt 是針對 Claude 的長 context、針對 Anthropic 的 tool use 行為、針對特定的 reasoning 風格寫的。把另一個模型塞進去,等於拿著錯的劇本上台。

換成今天這個分工——Claude 當包工頭(discuss + plan),Gemini 當小工(implement single issue),各自做擅長的事——速度跟品質都立刻上來。中間用 glab issue 當交接介面,順便還拿到了一個免費的 audit log,之後想知道「這段 code 為什麼長這樣」直接翻 issue 就好。

我猜這個 pattern 之後會變我的預設。模型協作的關鍵不是「找一個最強的模型用到底」,而是**「想清楚每個模型的 sweet spot,然後拿介面把他們黏起來」**。介面可以是 issue、可以是 markdown、可以是 spec file——重點是它得能被另一個模型沒有歧義地讀懂。


雖然講得很順,但老實說今天還是有點慢慢地啦。Claude 寫 plan 我等了不少時間、Gemini 跑 issue 也不是秒回——這套流程我是晚上 9 點開始跑的,弄到快 12 點才收工,三個小時換 2 個 issue 收尾、1 個還在路上,比直接讓人類寫還久。但至少真的有東西被修好,而不是像昨天那樣一整晚在跟模型對抗。能修好東西這件事,最近真的變成一種小確幸了。

先不說了,我得回去看 Gemini 那個大 feature 改到哪了——希望他沒有又跑去重構不相關的檔案。

這些實驗進行於 2026 年 5 月 29 日晚上,文章也是當晚順手整理的。