Voice Mode(語音模式)

Claude Code 內建語音輸入——/voice 啟動,用講的而非打字下指令、提問、討論。

啟動方式

/voice

→ 進入語音模式 → 麥克風開啟 → 講完 Claude 接收。

為什麼要 Voice Mode?

文章作者列舉的場景:

  1. 複雜需求說明 — 用講的比打字快 5-10x
  2. 手忙腳亂時 — 同時看程式碼、查文件,不想離開鍵盤
  3. 長段思考發想 — 像對白板「自言自語」幫梳理

比鍵盤快在哪

動作打字(中文)語音
「修這個 bug」5 秒1 秒
「給我看一下 GradingService 的所有方法」12 秒3 秒
描述一個複雜重構需求60 秒+15 秒

語音 vs 文字 — 適合場景

情境偏好
快速一句話指令語音
詳細規格說明語音(口述更自然)
程式碼粘貼文字
精確用詞(檔名、變數名)文字
開會 / 公共場合文字

語音識別品質

文章描述:

  • 中英混雜 → 識別準確
  • 程式碼變數名 → 不準確(建議手打)
  • 連續長段語音 → 推薦每 30 秒停一下,讓 Claude 確認

Remote Control 的搭配

通勤路上:

1. 開手機 [[Remote Control]] → 連桌機 Claude Code
2. 啟動 /voice
3. 對手機講話 → 桌機 Claude 接收 → 執行
4. [[Channels]] 推結果回手機

→ 完全不用打字。

Cowork 的差異

Cowork 也有語音輸入(透過 OS 原生):

Claude Code VoiceCowork 語音
介面CLI /voice桌面 app 麥克風按鈕
適用開發任務一般工作
連續性對話模式單次

限制

  • 中文識別比英文略差(程式術語混語言時)
  • 噪音敏感(咖啡廳、開放辦公室)
  • 不適合機密話題在公共場合用

對 Vincent 工作場景

Use Case 1:早晨咖啡時 PAM 規劃

泡咖啡時 → 對著電腦講:
「今天有三件事:
 1. 修 ExcelService 漏 catch 的 bug
 2. 加面談 PDF 缺的欄位
 3. 重構 SettlementService

 先從 1 開始,找出漏 catch 的地方給我看」

→ Claude 邊聽邊開始 grep
→ 你回坐打開螢幕,已經有結果

Use Case 2:開車回家時想到的需求

(停紅燈)按手機 [[Remote Control]] + voice:
「明天加一個年度結算的 dry-run 模式,不要寫 DB
 寫個 spec 草稿先放 Docs/dev/SETTLEMENT_DRYRUN.md」

到家 → 桌機已寫好草稿等 review

Use Case 3:解釋複雜邏輯

講:「我要描述一個複雜場景,你聽完整理:
 員工 A 在 7/1 任職但 9/30 離職
 年中考核 8/15 有評
 年終考核 11/15 沒有
 那年度結算該不該包含?
 ...
 我覺得應該排除,但要怎麼判定離職時點..."

→ Claude 整理成決策樹
→ 你看 → 補充 → 開始 implement

安全 / 隱私

  • 語音資料用於即時識別,不長期儲存(依文章描述)
  • Incognito 時建議關掉語音避免誤錄

相關概念

強連結(原文明確提及)

← 回到 wiki