Gemini CLI 朗读 —— 听 Google 的 AI 编码 Agent

在 Terminal.app 里 Gemini CLI 运行的窗口中选中任意文字 —— 计划、推理轨迹、代码解释、diff 摘要。选区旁浮出 ▶。一键点击 —— 自然人声朗读,逐字高亮跟在真实终端上。

macOS 原生 · 完全免费 · 无需登录 · 40+ 种语言 · 原生终端 AX,无 OCR

gemini — Terminal — 80×24

~/project $ gemini

我扫描了仓库,发现旧 API client 有五处使用。推荐的迁移路径是逐个切到新的重试感知 client,保留原有 timeout 设置。我会分小批次应用,这样你可以独立 review 每一批。

高亮跟在语音每一个词,落在 Terminal.app 窗口里。

Reading selection…1.0×

一个 App 覆盖 Mac 上每款 AI 编码工具

同样的手势、同样的逐字高亮 —— 覆盖开发者真正在用的每个 IDE 和 CLI。

VS Code

微软编辑器

Cursor

AI 原生 IDE

Xcode

苹果 IDE

Windsurf

Codeium AI IDE

Claude Code

Anthropic CLI

Gemini CLI

Google AI CLI

Codex

OpenAI 编码 CLI

Copilot CLI

GitHub gh copilot

Aider

AI 结对编程

三步搞定 · 干净终端 AX

Gemini CLI 在 Terminal.app 里跑。Terminal.app 是原生 AppKit App,CastReader 通过辅助功能 API 读输出。

1

安装

下载 CastReader for Mac (.dmg)。一次性授权辅助功能权限。Terminal.app 不需要屏幕录制。

2

选中

在 Terminal.app 里 Gemini CLI 运行时拖选任意文字 —— 计划、推理轨迹、工具调用解释、错误。

3

点击 ▶

播放按钮浮出。点一下 —— 音频响起,高亮在终端里滑动。

Gemini CLI 用户怎么加上朗读

Gemini 2.5 产出啰嗦的推理 —— 长计划、多步原理、详细解释。听读卸载掉,眼睛就能留在 diff 上。

应用前先听 Gemini 的计划

编辑前 Gemini CLI 会列计划。听读比阅读更快抓出「框架假设错误」或「目标文件错误」。

听推理轨迹

Gemini 的扩展推理经常十几段。音频让你吸收逻辑,同时伸懒腰或啜咖啡。

用耳朵扫 diff 摘要

应用编辑后 Gemini 会总结 diff。选中按 ▶,在另一面板对照实际 diff 核验。

审调试解释

测试挂了 Gemini 解释为什么时,音频帮你处理根因链,不用重读 stack trace。

学 Gemini 的编码风格

Gemini 用散文论证设计选择。回放听读比单次读更能记住习语。

长 agent 会话的无障碍

4 小时 Gemini 会话产出上千字散文。听读时眼睛专注看代码表面。

为什么 CastReader 比 `say` 更适合 Gemini CLI

macOS 内置 `say` 读粘贴字符串,没有高亮、没有词级同步、是 1990 年代人声。CastReader 读你真实的终端选区,用现代人声。

Terminal.app 上的逐字高亮

透明叠加层在真实终端表面跟每一个发音的词 —— 不是克隆窗或侧边栏。

40+ Kokoro 级别人声

英文、中文、日文,40+ 种 —— 按选区自动挑。现代 TTS,不是 2000 年代系统人声。

可变速 · 点击跳转

啰嗦的计划用 1.5×,难的原理用 0.8×。点任意段落跳转 —— `say` 不行。

零成本 · 零注册

无账号、无日限额。Google Gemini 订阅不变 —— CastReader 是免费的声音层。

常见问题

Mac 上怎么朗读 Gemini CLI 输出?

装 CastReader for Mac,授权辅助功能权限,在 Terminal.app 里跑 Gemini CLI,然后选中任意文字 —— 计划、推理、错误 —— 点浮出的 ▶。逐字高亮落在终端上。

iTerm2 / WezTerm / Warp 能用吗?

Terminal.app 最干净。iTerm2 能走 AX 但有小瑕疵。WezTerm 用自定义渲染器不暴露 AX(不支持)。Warp 用自己的文本系统(部分支持)。

会读 Gemini 输出里的 markdown 吗?

Gemini CLI 把 markdown 渲染为 ANSI 样式文字。CastReader 读底层字符并跳过 ANSI 转义序列 —— 散文干净传出。

能听中文 Gemini prompt 吗?

能。CastReader 自动识别 CJK,切换到原生普通话、日语或韩语人声。混合语言 Gemini 回复在句子边界切换人声。

会打扰 Gemini CLI 的输入吗?

不会。CastReader 只在选中 + 点 ▶ 时触发。终端输入、Ctrl-C、Gemini CLI 的 prompt 处理都不受影响。

在 VS Code 集成终端里跑 Gemini CLI 呢?

VS Code 集成终端走不同 AX 路径 —— CastReader 用 Electron OCR 路径。能用但需要屏幕录制。想要最干净体验,在 Terminal.app 里跑 Gemini CLI。

我的 prompt 会离开机器吗?

只有你的选区会被发送到 TTS 服务合成。播放会话之外不保留。想要完全本地,v2 将带设备端 Kokoro。

真的完全免费?

是。100% 免费 —— 无账号、信用卡、高级人声门槛、日词数限制。下载 .dmg 永久用。

准备好让 Gemini CLI 开口说话了吗?

装一次。在 Terminal 里跑 Gemini CLI。选中任意输出。点 ▶。听。