如果你试过 Chrome 自带的 Read Aloud、Speechify、NaturalReader 来读 read.amazon.com,结果要么没反应,要么读出来是一堆乱码——你已经知道了:不是浏览器的问题,是 Amazon 渲染书页的方式。本文讲清技术原因,告诉你怎么真正在浏览器里朗读任意一本 Kindle 书。
2 分钟装好。无需账号,无需信用卡。
打开 read.amazon.com 上的任一本书,右键某段文字选 "Read Aloud"——毫无反应。试着选中复制——得到空字符串,或者一堆错位的字母。为什么所有 TTS 工具都在这里失败:
在 read.amazon.com 用标准电子书 + Chrome 140 测试(2026 年 4 月)
读出混淆后的字形映射。你听到随机音节或静默。常整页跳过。
页面上显示高亮,但播放出来是 'xgpz qhr zpm' 之类的乱码串。其官方论坛自 2022 年起承认此问题,至今未修复。
在 read.amazon.com 上拒绝启动播放——扩展检测到选中文字不可读,直接静默退出。
同根因。读的是混淆层。只在你能复制文字出来时才工作,而 Kindle 恰好禁止复制。
在任意 Kindle Cloud Reader 书页上朗读成功,带单词级高亮。方法是对渲染后的图像做 OCR,不依赖 HTML 文字——完全绕过混淆字形层。
我们不再尝试读 HTML,而是:
Kindle Cloud Reader 显示前会先把每页构建成位图。我们 hook Amazon 的渲染流水线,在位图产出时直接捕获。
位图送入 Tesseract OCR(Google 同款 OCR 引擎的 WebAssembly 版)。OCR 输出的是真实可读的文字——你眼睛看到的字母——不碰加密字体查找表。
OCR 输出的文字进入我们的 TTS 管线,音频播放时段落高亮跟随、单词级对齐——和读普通网页一样。整个流程在浏览器本地完成,你的书从不离开设备。
Chrome、Edge、Firefox 全免费。无需账号,无需信用卡。
用你平时的 Amazon 账号登录,打开任意一本你买的书。
首次 OCR 约 3 秒,随后开始播放。翻页自动跟随朗读进度。
因为 Amazon 把 Kindle Cloud Reader 的每页渲染成带加密字形表的图像,不是 HTML 文字。Chrome、Edge 自带的朗读和所有基于 HTML 的 TTS 工具读的都是混淆串,播出来是乱码。只有对渲染后的图像做 OCR 才能拿到真实文字——这是 CastReader 的做法。
不能。Speechify 读的是 HTML 文字层,而 read.amazon.com 的 HTML 用 DRM 字体查找表编码过。它看起来在工作——有高亮——但音频是胡说。这在 Speechify 论坛已是未解决的 2022 老问题。
合法。你拥有这本书,是在自己电脑的浏览器里为个人用途朗读。CastReader 全程本地运行——不上传、不走云端 OCR,所有数据在你的浏览器内完成。Amazon 的 DRM 防的是盗版提取和再分发,不是你听自己的书。
浏览器扩展只覆盖 read.amazon.com。CastReader for Mac 桌面版(即将上线)用 macOS 辅助功能 API 朗读 Kindle 桌面客户端、Apple Books 等应用。
首页约 3 秒。之后的页在你听的同时后台预处理,几乎察觉不到。OCR 引擎跑在本地 WebAssembly,不走网络。
40+ 自然 AI 语音,覆盖英语、西语、法语、德语、日语、中文等。扩展从 OCR 输出自动识别书籍语言。
Chrome 里开始播放后,点"发送到手机",音频通过 Telegram 流到你的手机——不用装 App,不用配置同步。
完全免费,无每日限额,无需注册,所有语音全开放。不像 Speechify 每年 139 美元或 NaturalReader 的付费墙。