Chrome 的 Read Aloud 拒绝读 PDF。Speechify 读数字化 PDF 没问题,但扫描件读不出。NaturalReader 要求你上传文件。本文讲清每种 PDF 阅读工具在某类 PDF 上失败的技术原因——以及 CastReader 怎么在 Chrome 里同时搞定数字 PDF、扫描 PDF 和加密字体 PDF。
2 分钟装好。无需账号,无需信用卡。
在 Chrome 打开一个 PDF,右键选 Read Aloud——毫无反应。换 Speechify——它能读数字化 PDF,但你那份扫描版学术论文就静默。NaturalReader 要求你先上传文件。原因如下:
用数字 PDF、扫描 PDF、加密字体 PDF 在 Chrome 140 上测试(2026 年 4 月)
在 PDF 上完全不工作。Chrome 集成的 Read Aloud 只针对网页;PDF 查看器不在支持范围。
数字化 PDF 能用。扫描 PDF 失败(没 OCR)。加密字体 PDF 读出乱码。文本层缺失或混淆时没有兜底。
要求你先把 PDF 上传到它的服务器,不能直接读 Chrome 里打开的 PDF。上传流程打断阅读节奏。
只在 Acrobat 桌面版能用,不在 Chrome 里。机械音色。扫描件没 OCR 就搞不定。
数字化 PDF 走文本层读。扫描 PDF 和加密字体 PDF 自动退回到本地 Tesseract OCR。直接在 Chrome PDF 查看器里工作——不用上传,不用切换 App。
三种策略,按页自动选。
对数字化 PDF,我们从 Chrome 查看器已经构建好的 PDF.js 文本层提取文字。最快路径,亚秒级。
如果提取出的文字不可读(用词典命中率 + 字符熵检测),说明是 CID 编码或混淆字体 PDF。我们把页面交给本地 Tesseract OCR——Google 同款 OCR 引擎的 WebAssembly 版,在你的浏览器里跑。
对纯扫描件,我们 OCR 每页位图。你听当前页时后台预处理下一页,体验流畅。全程本地——OCR 100% 不上网。
Chrome、Edge、Firefox 全免费。无需账号,无需信用卡。
拖进 Chrome,或点任何 PDF 链接。CastReader 自动检测 PDF 查看器页面。
数字化 PDF 1 秒内开始播放。扫描 PDF 首页 OCR 约 3 秒后开始。
Chrome 自带 Read Aloud 只作用于网页。PDF 查看器跑在单独的沙箱 frame 里,Chrome 团队显式把它排除在 Read Aloud 支持之外。扩展可以补上这个缺口,但大多数扩展(包括 Speechify 和 NaturalReader)只处理最容易的情况——文本层干净的数字 PDF。
不能。Speechify 读的是 PDF 文本层,扫描 PDF 根本没文本层——它们是图片。Speechify 会静默。CastReader 自动检测这种情况并回退到 Tesseract OCR。
通常是出版社导出的、带 CID 编码字体的 PDF——文本层把 'Cat' 映射到内部字形 ID 如 'J$*',用来阻止复制粘贴。Speechify 等工具读的是内部 ID,产生胡言乱语。CastReader 检测到乱码模式后用 OCR 重新提取。
对现代印刷品的干净扫描,Tesseract 精度 98%+。对历史文档、多栏排版、手写件,精度下降。CastReader 用基于 LSTM 的 Tesseract 5 取得拉丁文最佳效果,通过语言包支持中文、日文、韩文。
只要 Chrome 的 PDF 查看器能显示(即你已经输入密码),CastReader 就能读。我们不绕过 DRM——只读你已经能看到的内容。
支持——只要 PDF 在 Chrome 的查看器里打开(Google Drive 默认、Gmail 内嵌附件、多数网页链接都是),CastReader 自动挂接。
Tesseract 跑在 WebAssembly 的后台线程里。扫描 PDF 首页约 3 秒,后续页在你听的时候预处理,几乎察觉不到。每页 CPU 短暂升高,然后闲置。不需要 GPU。
40+ 自然 AI 语音,覆盖英语、西语、法语、德语、日语、中文、韩语、葡萄牙语等。语言从提取出的文字自动识别——数字 PDF 和 OCR 输出都一样。
Chrome 里开始播放后点"发送到手机",音频通过 Telegram 流到手机——不用装 App,不用配置同步。
完全免费——PDF 无限,无需注册,所有语音全开放。不像 Speechify 每年 139 美元或 NaturalReader 的 OCR 付费墙。