我把 Gemini 偽裝成 Opus,然後被 Cloudflare 524 打趴在地——一個還沒驗收的地端模型實驗
你有沒有過那種,明明只是想「換一個便宜一點的引擎」,結果整個禮拜都在跟一堆中間人搏鬥的經驗?我這幾天就是。我沒在改產品、沒在修 bug,我在做一件聽起來很單純的事——讓我的 coding agent 不要每次都燒 Claude 的錢。然後我發現,難的從來不是模型本身,是模型外面那一圈東西。
先講最天真的版本。
第一站:空身的 Gemini CLI,笨到我想關機
我先試了 Gemini 2.5,用官方的 gemini CLI,什麼都沒搭。我給它一個任務——改一個抽屜(drawer)介面的 bug。聽起來很基本對吧?
結果它笨到一個境界,讓我懷疑是不是我哪裡裝錯了。它會看不到上下文、會自信地改錯地方、改完還跟我說「好了」——然後 bug 原封不動站在那裡看著我。我來來回回幾次,最後放棄治療。
但這裡有個我事後才想通的點:笨的不是模型,是它的穿著。空身的 CLI 沒有我平常那一整套 skill 在旁邊撐著——沒有人幫它讀 spec、沒有人幫它定位檔案、沒有人在它要亂改的時候攔一下。我等於是把一個很聰明的人丟到一個沒有任何工具的房間,然後怪他做事很慢。
教訓先放這:你以為你在評測模型,其實你在評測「模型 + 它的鷹架」。把鷹架拿掉再來嫌笨,不太公平。
第二站:用 litellm 把 Gemini 偽裝成 Opus
既然鷹架才是關鍵,那我能不能留著鷹架、換掉引擎?
於是我做了一件有點壞壞的事:用 litellm 架一層 proxy,把 Gemini 偽裝成 claude-opus,讓 Claude Code 以為自己在跟 Opus 講話,實際上後面接的是 Gemini。
這招最大的好處是——我原本那整套 skill 無痛繼續用。Claude Code 不知道、也不在乎引擎被換了,它照樣讀 spec、照樣定位檔案、照樣按流程走。據說這樣套會「打折」(畢竟 prompt 是為 Claude 調的,餵給 Gemini 多少會水土不服),但至少還能動,不是嗎?
體驗確實往上跳了一階。從「空身笨蛋」變成「穿了西裝的代打」。
但我得很誠實地說一句:到底有沒有真的把那個 drawer bug 改好,我還沒驗收。 現在說它行或不行,都是我在嘴。所以這一站的結論只能是「看起來有救」,不能再多了。
第三站:真.地端模型,gemma / qwen / deepseek 三件套
前兩站都還在用雲端 API。真正讓我興奮的是這一站——完全地端。
我把 gemma、qwen、deepseek 三件套部署在地端,前面一樣掛一層地端的 litellm,再讓 Claude Code 透過它連進去。搞了大半天——光是把 model routing、API 格式對齊、讓 Claude Code 願意握手,就耗掉一個下午——總算把這條線接起來了。
然後……
就沒有然後了。
第四站:Cloudflare 524,整面牆打下來
接上去的瞬間我就開始被 524 連續打臉。對,就是那個 Cloudflare 的 timeout。
根因其實一點都不複雜,蠢到我自己都笑出來:我用 Claude 的習慣,是整坨 codebase 丟來丟去。 一個 request 動不動就 30 萬 token。雲端的 Claude 吃得下,因為它後面是工業級的基礎設施。但我這條地端的路上站了一個 Cloudflare,而它的耐心——大約 100 秒——遠遠撐不到我那台地端機器把 30 萬 token 嚼完。
於是每一次 request 都是同一齣戲:丟過去、地端慢慢算、Cloudflare 等不下去、524、我罵一句。
這裡有條可遷移的教訓,比這個 timeout 本身重要:當你把一個為「快速雲端」設計的使用習慣,原封不動搬到「慢速地端」上,瓶頸往往不在兩端,而在你忘了它存在的那層中間人。 Cloudflare 平常隱形,因為雲端從來沒讓它等過。是我把它逼到現形的。
而且更討厭的是——這個錯誤訊息長得像網路問題,但它其實是架構問題。524 不會告訴你「你 context 餵太多了」,它只會冷冷地說 timeout,讓你第一直覺往連線、往防火牆去查。降級得太安靜,有時候反而害人。
所以呢?還沒有所以
我知道怎麼修——明天的事。把那層 timeout 限制打開(或者更聰明一點,根本不要一次餵 30 萬 token,學著把 context 切小、只丟相關的檔案),再來試一次。
但我今天不想假裝這篇有個漂亮的結局。事實就是:第二站的 bug 我還沒驗收,第三站的地端模型我連一個完整 request 都還沒跑完。整件事還卡在「快要通了」的那一格。
先不說了,我得去把 Cloudflare 那 100 秒的耐心調長一點——順便戒掉我那個「整坨 codebase 丟過去」的壞習慣,雖然我知道明天我大概還是會手癢。
這些實驗進行於 2026 年 5 月下旬,文章整理於 5 月 28 日——一個還沒驗收的進行式。