Voice Mode(語音模式)
Claude Code 內建語音輸入——
/voice啟動,用講的而非打字下指令、提問、討論。
啟動方式
/voice
→ 進入語音模式 → 麥克風開啟 → 講完 Claude 接收。
為什麼要 Voice Mode?
文章作者列舉的場景:
- 複雜需求說明 — 用講的比打字快 5-10x
- 手忙腳亂時 — 同時看程式碼、查文件,不想離開鍵盤
- 長段思考發想 — 像對白板「自言自語」幫梳理
比鍵盤快在哪
| 動作 | 打字(中文) | 語音 |
|---|---|---|
| 「修這個 bug」 | 5 秒 | 1 秒 |
| 「給我看一下 GradingService 的所有方法」 | 12 秒 | 3 秒 |
| 描述一個複雜重構需求 | 60 秒+ | 15 秒 |
語音 vs 文字 — 適合場景
| 情境 | 偏好 |
|---|---|
| 快速一句話指令 | 語音 |
| 詳細規格說明 | 語音(口述更自然) |
| 程式碼粘貼 | 文字 |
| 精確用詞(檔名、變數名) | 文字 |
| 開會 / 公共場合 | 文字 |
語音識別品質
文章描述:
- 中英混雜 → 識別準確
- 程式碼變數名 → 不準確(建議手打)
- 連續長段語音 → 推薦每 30 秒停一下,讓 Claude 確認
跟 Remote Control 的搭配
通勤路上:
1. 開手機 [[Remote Control]] → 連桌機 Claude Code
2. 啟動 /voice
3. 對手機講話 → 桌機 Claude 接收 → 執行
4. [[Channels]] 推結果回手機
→ 完全不用打字。
跟 Cowork 的差異
Cowork 也有語音輸入(透過 OS 原生):
| Claude Code Voice | Cowork 語音 | |
|---|---|---|
| 介面 | CLI /voice | 桌面 app 麥克風按鈕 |
| 適用 | 開發任務 | 一般工作 |
| 連續性 | 對話模式 | 單次 |
限制
- 中文識別比英文略差(程式術語混語言時)
- 噪音敏感(咖啡廳、開放辦公室)
- 不適合機密話題在公共場合用
對 Vincent 工作場景
Use Case 1:早晨咖啡時 PAM 規劃
泡咖啡時 → 對著電腦講:
「今天有三件事:
1. 修 ExcelService 漏 catch 的 bug
2. 加面談 PDF 缺的欄位
3. 重構 SettlementService
先從 1 開始,找出漏 catch 的地方給我看」
→ Claude 邊聽邊開始 grep
→ 你回坐打開螢幕,已經有結果
Use Case 2:開車回家時想到的需求
(停紅燈)按手機 [[Remote Control]] + voice:
「明天加一個年度結算的 dry-run 模式,不要寫 DB
寫個 spec 草稿先放 Docs/dev/SETTLEMENT_DRYRUN.md」
到家 → 桌機已寫好草稿等 review
Use Case 3:解釋複雜邏輯
講:「我要描述一個複雜場景,你聽完整理:
員工 A 在 7/1 任職但 9/30 離職
年中考核 8/15 有評
年終考核 11/15 沒有
那年度結算該不該包含?
...
我覺得應該排除,但要怎麼判定離職時點..."
→ Claude 整理成決策樹
→ 你看 → 補充 → 開始 implement
安全 / 隱私
- 語音資料用於即時識別,不長期儲存(依文章描述)
- 開Incognito 時建議關掉語音避免誤錄
相關概念
強連結(原文明確提及)
- Remote Control — 配合手機遠端
- Channels — 結果通知
- Cowork — 同樣有語音能力
- AskUserQuestion 工作流 — 文字版的雙向結構化提問
← 回到 wiki