Vibe Coding,现在有了声音
AI 一口气吐出 200 行解释,你不想停下来读。划选一下,CastReader 朗读给你听,你的手不用离开键盘。
下载 Mac 版 — 免费macOS 13+ · 完全免费 · 适配所有终端、IDE、浏览器
当下 vibe coding 的真痛点
AI agent 输出越来越长,你只有一双眼睛。
回复越来越长
Claude Code 和 Cursor 每轮经常输出 100-300 行 — 推理、diff、告警、引用。
眼睛在代码上
逐字读每段解释会把你从 diff 里拉出来。心流打断,上下文重置。
滚屏也很慢
你最后只能快速扫一眼,漏掉关键信息,再让 agent 重新说一遍。
三步搞定,零配置
划选 AI 回复
在 Claude Code、Cursor、Gemini CLI 或任意终端里,直接拖选文字。
点橙色气泡
选区旁出现一颗小方块按钮,点一下开始播放。
继续写代码
眼睛留在 diff 上。AI 解释在耳边播放,附带逐词高亮。
演示:划选任意 AI 回复 → 橙色气泡 → 边编码边听
适配所有 vibe coding 工具
无需集成。只要你能划选文字,CastReader 就能读。
Claude Code
听长解释、diff 说明和 plan-mode 输出
Cursor
听 Composer 和 chat 回复,同时看 diff
Gemini CLI
听 Google 终端 agent 的完整输出
Aider
听 aider REPL 里的代码变更和解释
Codex CLI
OpenAI 的 agent CLI — 同款工作流,解放双手
Warp
Warp AI 的建议在终端内朗读
Windsurf
边写代码边听 Cascade 的思考和总结
Chat 网页 & 浏览器
ChatGPT、Claude.ai、Gemini 网页 — 同款气泡,同款操作
为开发者设计,不为读者设计
零配置划选
无需安装插件,无 API key,无需在每个 app 里配置。macOS 任意位置划选文字,气泡自动出现。
语速可调
默认 1.5× 适合快速扫读。想看 TL;DR 就 2×,复杂推理降到 1×。
逐词高亮
当前读到的词实时高亮。你随时扫一眼就知道读到哪儿了。
自然人声
Kokoro TTS — 英文 Heart 女声 + 中文多音色。不是 macOS Say 的机器音。
不打扰
菜单栏常驻 app,没有 Dock 图标,没有通知。只在你划选文字时出现。
永久免费
无需注册,无配额,无付费墙。TTS 服务器我们买单,你安心 vibe coding。
常见问题
能在 Claude Code / Cursor / Gemini CLI 里用吗?
可以。CastReader 监听 macOS 整个系统的文字划选,无论你在 iTerm、Ghostty、Warp、VS Code、Cursor 还是 Claude.ai 网页里,拖选文字就会出现橙色气泡,点一下开始朗读。
比 macOS 自带的 Say / VoiceOver 好在哪?
读代码和长 AI 回复时显著更好。macOS Say 是机器音、没情感。CastReader 用 Kokoro TTS,自然人声 + 逐词高亮,听的同时还能看代码。VoiceOver 是无障碍工具,设计目的是朗读每个 UI 元素;CastReader 是为你划选的那段文字而设计。
ChatGPT 语音模式或 Claude 的音频功能不是已经有了吗?
那些只在自家 app 内生效,只读自己会话里生成的内容。CastReader 跨所有 AI 工具、所有终端、所有浏览器、所有 PDF、所有 Notion 文档 — 一个工具解决全部划选朗读需求。
会拖慢终端或 IDE 吗?
不会。CastReader 是独立的菜单栏 app,只在你划选文字时激活。终端和 IDE 的性能完全不受影响。
能在 Windows / Linux 上用吗?
桌面版暂时只有 macOS(Apple Silicon + Intel)。如果你在 Linux/Windows,可以用 CastReader 的 Chrome / Edge / Firefox 扩展 — 覆盖你在网页端的 AI 对话(Claude.ai、ChatGPT、Gemini 网页)。
我的 AI 对话会被上传到服务器吗?
只有你划选的那段文字会发到我们的 TTS 服务器(api.castreader.ai)合成音频。我们不记录、不存储、不用于训练。如果你需要完全离线的 TTS,可以在设置里把 CastReader 指向自托管的 Kokoro 服务。
Vibe Coding 有个音频问题
Vibe coding — Andrej Karpathy 在 2025 年造的词,指的是靠感觉写软件的新方式,大部分按键交给 AI agent。这个工作流彻底改变了开发者在一轮会话里实际做的事:不再是自己敲每一行,而是在编排 — 提问、阅读、引导、再提问。瓶颈从键盘转到了阅读队列。每一轮 agent 吐出长篇解释、diff 理由、权衡对比、下一步计划,这些你都不能不读 — 可一旦去读,眼睛就离开了你真正要交付的代码。
这正是音频能派上用场的地方。如果 AI 那 200 行回复在你耳边播放的同时,眼睛在扫 diff,你的吞吐量会翻倍。你没跳过解释,你在并行吸收。工作记忆里计划保持激活,手指继续停在键盘上。这和卡车司机听有声书、外科医生听音乐是同一个道理 — 当眼睛被占用,耳朵就是那个空闲通道。
CastReader 就是为这个场景打造的。在任意位置划选文字 — Claude Code 里、Cursor Composer 面板里、Gemini CLI 输出里、ChatGPT 标签页里、Markdown 预览里 — 选区旁都会出现一个小橙色气泡。点它,或按快捷键,朗读即开始。逐词高亮同步跟随,如果某句话吸引了你的注意,扫一眼就能定位到具体位置。语速可调 0.8× 到 2.5×,大多数开发者处理 AI 输出时停在 1.5×。
它之所以能跑通所有工具,是因为它根本没去集成任何工具。没有 Claude Code 插件,没有 Cursor 扩展,没有 Gemini 的 API wrapper。它在 macOS 系统层监听文字划选事件 — 这意味着只要划选能用的地方它就能用,而这意味着任何地方。下个月新出的 AI 工具?CastReader 已经支持了。你用的终端太小众没人给它做插件?CastReader 不在乎。你划选,它朗读。