排错指南

为什么 PDF 朗读不工作——以及唯一能读任意 PDF 的扩展

Chrome 的 Read Aloud 拒绝读 PDF。Speechify 读数字化 PDF 没问题,但扫描件读不出。NaturalReader 要求你上传文件。本文讲清每种 PDF 阅读工具在某类 PDF 上失败的技术原因——以及 CastReader 怎么在 Chrome 里同时搞定数字 PDF、扫描 PDF 和加密字体 PDF。

2 分钟装好。无需账号,无需信用卡。

问题:PDF 有三种形态,每个工具只搞定一种

在 Chrome 打开一个 PDF,右键选 Read Aloud——毫无反应。换 Speechify——它能读数字化 PDF,但你那份扫描版学术论文就静默。NaturalReader 要求你先上传文件。原因如下:

PDF 不是一种格式,它有三种

  • 数字化 PDF(从 Word、LaTeX 导出的)——有真正的文本层。Speechify 和 NaturalReader 能提取。但 Chrome 自带 Read Aloud 依旧读不了,因为 Chrome 的 PDF 查看器跑在沙箱 frame 里,Read Aloud 集成触不到。
  • 扫描 PDF(扫书、老文档、签字合同)——完全没有文本层,每页都是图片。基于 HTML 的 TTS 工具读不出任何东西。必须 OCR。
  • 加密字体 PDF(很多出版社导出的文件)——有文本层,但用了自定义 CID 编码,把 'Cat' 映射成 'J$*'。复制粘贴看起来是乱码;TTS 也读乱码,你听到随机音节。学术期刊、出版社电子书、注重隐私的文档常见。
  • Chrome 查看器自身就在挡路:扩展不能随意向 chrome-extension:// 的 PDF 查看器页面注入 content script,除非显式请求了大部分工具都没申请的权限。

各工具实际表现

用数字 PDF、扫描 PDF、加密字体 PDF 在 Chrome 140 上测试(2026 年 4 月)

✗ Fails

Chrome 自带 Read Aloud

在 PDF 上完全不工作。Chrome 集成的 Read Aloud 只针对网页;PDF 查看器不在支持范围。

✗ Fails

Speechify Chrome 扩展

数字化 PDF 能用。扫描 PDF 失败(没 OCR)。加密字体 PDF 读出乱码。文本层缺失或混淆时没有兜底。

✗ Fails

NaturalReader Chrome 扩展

要求你先把 PDF 上传到它的服务器,不能直接读 Chrome 里打开的 PDF。上传流程打断阅读节奏。

✗ Fails

Adobe Acrobat Read Out Loud

只在 Acrobat 桌面版能用,不在 Chrome 里。机械音色。扫描件没 OCR 就搞不定。

✓ Works

CastReader

数字化 PDF 走文本层读。扫描 PDF 和加密字体 PDF 自动退回到本地 Tesseract OCR。直接在 Chrome PDF 查看器里工作——不用上传,不用切换 App。

CastReader 怎么搞定任意 PDF

三种策略,按页自动选。

1

先试文本层

对数字化 PDF,我们从 Chrome 查看器已经构建好的 PDF.js 文本层提取文字。最快路径,亚秒级。

2

检测到乱码就退回 OCR

如果提取出的文字不可读(用词典命中率 + 字符熵检测),说明是 CID 编码或混淆字体 PDF。我们把页面交给本地 Tesseract OCR——Google 同款 OCR 引擎的 WebAssembly 版,在你的浏览器里跑。

3

没文本层?整页 OCR

对纯扫描件,我们 OCR 每页位图。你听当前页时后台预处理下一页,体验流畅。全程本地——OCR 100% 不上网。

如何在 Chrome 里朗读任意 PDF

1

装 CastReader

Chrome、Edge、Firefox 全免费。无需账号,无需信用卡。

2

打开 PDF

拖进 Chrome,或点任何 PDF 链接。CastReader 自动检测 PDF 查看器页面。

3

点 CastReader 图标

数字化 PDF 1 秒内开始播放。扫描 PDF 首页 OCR 约 3 秒后开始。

PDF 朗读常见问题

为什么 Chrome 自带 Read Aloud 在 PDF 上不工作?

Chrome 自带 Read Aloud 只作用于网页。PDF 查看器跑在单独的沙箱 frame 里,Chrome 团队显式把它排除在 Read Aloud 支持之外。扩展可以补上这个缺口,但大多数扩展(包括 Speechify 和 NaturalReader)只处理最容易的情况——文本层干净的数字 PDF。

Speechify 能读扫描 PDF 吗?

不能。Speechify 读的是 PDF 文本层,扫描 PDF 根本没文本层——它们是图片。Speechify 会静默。CastReader 自动检测这种情况并回退到 Tesseract OCR。

其他工具读出乱码的 PDF 是怎么回事?

通常是出版社导出的、带 CID 编码字体的 PDF——文本层把 'Cat' 映射到内部字形 ID 如 'J$*',用来阻止复制粘贴。Speechify 等工具读的是内部 ID,产生胡言乱语。CastReader 检测到乱码模式后用 OCR 重新提取。

OCR 的精度够朗读吗?

对现代印刷品的干净扫描,Tesseract 精度 98%+。对历史文档、多栏排版、手写件,精度下降。CastReader 用基于 LSTM 的 Tesseract 5 取得拉丁文最佳效果,通过语言包支持中文、日文、韩文。

加密保护的 PDF 能用吗?

只要 Chrome 的 PDF 查看器能显示(即你已经输入密码),CastReader 就能读。我们不绕过 DRM——只读你已经能看到的内容。

在 Dropbox、云盘、邮件附件里的 PDF 呢?

支持——只要 PDF 在 Chrome 的查看器里打开(Google Drive 默认、Gmail 内嵌附件、多数网页链接都是),CastReader 自动挂接。

OCR 会让电脑变慢吗?

Tesseract 跑在 WebAssembly 的后台线程里。扫描 PDF 首页约 3 秒,后续页在你听的时候预处理,几乎察觉不到。每页 CPU 短暂升高,然后闲置。不需要 GPU。

支持什么语音和语言?

40+ 自然 AI 语音,覆盖英语、西语、法语、德语、日语、中文、韩语、葡萄牙语等。语言从提取出的文字自动识别——数字 PDF 和 OCR 输出都一样。

想在手机上听怎么办?

Chrome 里开始播放后点"发送到手机",音频通过 Telegram 流到手机——不用装 App,不用配置同步。

有试用期或每日限额吗?

完全免费——PDF 无限,无需注册,所有语音全开放。不像 Speechify 每年 139 美元或 NaturalReader 的 OCR 付费墙。

别再到处切换 PDF 工具。装那个全能的。

装一次。打开任意 PDF。点 ▶。听。