2026 年怎么听 Kobo 上的电子书(每种设备实测,什么真的能用)

如果你买了一台 Kobo,理由大概率和大多数人一样。它支持 EPUB,不把你绑死在亚马逊生态里,高端型号有蓝牙,Pocket 集成把你保存的文章和书放在同一个书架。Kobo Libra Colour、Clara Colour、Sage、Elipsa——这些设备做得不错,是给那些在意「拥有」自己的书而不是「租用」的人准备的。

但你买 Kobo 的理由里,大概率没有「文字转语音」这一项。这是好事——因为它根本就没有这个功能。

这篇是 2026 年关于 Kobo 听书的诚实文章。哪些能用,哪些不能,Kobo 论坛上反复出现的问题,以及那条让你真正能把已经买过的书在通勤路上听出来的路径。这条路径要走 readnow.kobo.com 的 Kobo Web Reader,需要 CastReader。其他方案要么不存在,要么不工作。

Kobo 硬件到底能干什么

先把设备这一层讲清楚。Kobo 现役阅读器——Libra Colour、Libra 2、Clara Colour、Clara BW、Sage、Elipsa 2E、Forma——电子书层面的 TTS 是零。不是「有限的 TTS」,不是「部分书支持 TTS」,是完全没有。没有菜单、没有设置、没有固件开关、没有越狱方案。硬件里压根没有 TTS 引擎。Kobo 从来没有出过这个功能。

带蓝牙的型号(Sage、Libra 2 起步、Elipsa)确实可以通过无线耳机播放音频,但只能播放本来就存在的音频。具体来说:你在 Kobo 商店额外购买的有声书,或者 Kobo Plus Listen 订阅里包含的有声书。把一台 Kobo Sage 接到蓝牙音箱上、对着一本电子书按播放——什么都不会发生。

新 Kobo 用户经常被这个绊倒。设备上有蓝牙图标,让人觉得有音频能力——确实有,但那是有声书播放,不是把你正在读的电子书转成语音。两种功能、同一套硬件、经常被混淆。

如果你正用 Kobo 阅读器读这篇文章并怀疑自己漏掉了某个设置:你没漏。这个设置不存在。硬件就是设计成沉默的。

Kobo 为什么没有 TTS

跟亚马逊为什么没有,基本是一回事。有声书的版权是单独付费授权的,出版商把对电子书做 TTS 视为竞品。亚马逊 2009 年在 Kindle 2 上发布 TTS 时,美国作家协会(Authors Guild)公开威胁起诉,亚马逊几周之内就退让了。后续每一代 Kindle 要么彻底放弃 TTS,要么允许出版商按书禁用。到 2016 年这个功能基本上消失了。

Kobo 从 2012 年起被日本乐天(Rakuten)收购,从旁边看了这场仗,然后做了一个务实的选择:从一开始就不上这个功能。没有新闻、没有争议、没有作家协会的官司。直接没有 TTS。再单独做一个有声书业务——Kobo Plus Listen,2024 年作为订阅服务上线——把客户引导到那边去。

这不是 Kobo 一家的失败。是整个电子书阅读器行业(通过相互精疲力尽的方式默契地)把 TTS 排除在阅读器之外,因为有声书出版商不接受。

Kobo 能做、也确实做得不错的,是开放格式的阅读体验。无 DRM 的 EPUB 在 Kobo 上是真实可用的。Adobe Digital Editions 转书可以走通。OverDrive 图书馆借阅原生支持。Pocket 文章同步进来。这些没有一项帮你听书,但每一项都让 Kobo 平台在其他维度上比 Kindle 更好。让 Kobo 做它擅长的事;听书走别的路径。

Kobo 手机 App 的故事

一样的答案。Kobo 的 iOS 和 Android 客户端把书排版得很漂亮、所有标准调整都支持——字体、行距、页边距、深浅色模式——但没有内置朗读。

系统级别的迂回方案两个平台都有,但都不完美。

iOS 上可以开启朗读屏幕(设置 → 辅助使用 → 朗读内容 → 朗读屏幕)。然后在 Kobo App 里,从屏幕顶部双指向下滑动,iOS 会用 Siri 的声音读出当前可见页面。能用。两个问题:它不会自动翻页,所以一本 12 小时的小说你要读完一页等声音念完再手动翻、再重复;它会读所有可见内容,包括每页的页码和章节标题,听一会就烦了。

Android 上 TalkBack 大致同理。在设置 → 辅助使用 → TalkBack 里开启,然后在 Kobo App 里长按段落开始朗读。同样的缺点:不会自动翻页、机械音、辅助工具特有的怪异行为(比如不小心碰到某个 UI 元素它会读出来)。

偶尔用一下还行。要听完一整本书的通勤场景,两者都不是你真正想要的。

Kobo Plus Listen 是另一回事

Kobo Plus Listen 是有声书订阅服务。和更广义的 Kobo Plus 订阅一起推出(Kobo Plus 还有 Kobo Plus Read 电子书订阅)。Listen 这一档让你按月付费访问一个精选的、专业演员录制的有声书目录。

它本身是不错的有声书服务。目录比 Audible 小,但价格便宜不少,目录里的书是真正录制的、不是 TTS 生成的。

但 Kobo Plus Listen 不是这篇博客要讨论的对象,因为它对你已经拥有的书帮不上忙。如果你三年前在 Kobo 上买了《金翅雀》的电子书,现在想在上班路上听——你需要查 Kobo Plus Listen 目录里有没有这本书的有声版(可能有),并订阅那个能访问到这本书的套餐(大概率要订)。或者你完全跳过 Kobo Plus Listen,直接去 Audible 单独买这本书的有声版(很多人也是这么做的)。

不管哪条路,你都在为同一本书付两次钱——一次是电子书,一次是音频。如果你就是想要这样,没问题。但这跟「我想听我已经拥有的那本书」不是同一件事。

唯一真正能走通的路:Kobo Web Reader + CastReader

这是真正的答案。如果你想听 Kobo 上已经拥有的书,路径是:

  1. 在桌面或笔记本电脑上打开 readnow.kobo.com 上的 Kobo Web Reader
  2. 用 Kobo 或 Rakuten 账号登录
  3. 打开你想听的书(任意一本——付费、免费试读、或图书馆借阅)
  4. 装好 CastReader 然后点扩展图标

就这样。书会朗读出来,段落同步高亮,页面自动翻,你可以调倍速、换声音、或者把音频通过 Telegram 发到手机上免提通勤听。Kobo 书库里每一本书都能用,包括 OverDrive 图书馆借阅,不限语种、不限出版商。

为什么只有 Web Reader 能用,桌面客户端不行?因为 Kobo 的桌面客户端用的是嵌入式 WebKit / Chromium webview 渲染书页,浏览器扩展没办法注入进去。同样的内容,但扩展层够不到。readnow.kobo.com 是唯一对扩展开放的表面。

为什么是 CastReader 而不是其他 TTS 扩展?因为 Kobo 的网页阅读器结构非常特殊。每一章用 srcdoc HTML 加载到独立的 iframe 里——真正的书本文字活在 iframe.contentDocument 树里,普通扩展够不到。大部分 TTS 扩展只读 document.body,发现里面是空的就静默放弃。CastReader 在 2026 年初专门为这套 iframe 结构重写过。

Kobo Web Reader 为什么对 TTS 扩展这么难

如果你想看技术细节(不感兴趣可以跳过这一节),这里讲讲底层发生了什么。

Kobo 的网页阅读器是一个铺开式(spread)阅读器。打开 readnow.kobo.com 上的一本书,页面会把多达约 13 章加载成同源 iframe,横向并排。每个 iframe 装着完整一章的 HTML,内部又被 CSS 横向列分成多页。翻页是通过给 iframe 队列加 CSS transform: translateX(...) 实现的,把下一页滑进视口。

要让 TTS 扩展正确读这种结构,必须做到:

  1. 遍历所有同源可访问 iframe 并按阅读顺序拼接。DOM 顺序未必等于阅读顺序,要看视觉位置。
  2. 识别用户当前正在看的那个 iframe。「第一个」iframe 可能是三章前的内容。当前可见的 iframe 是与外层视口相交面积最大的那个,这个值会随翻页移动。
  3. 在那个 iframe 里找出真正显示在视口里的第一段。不是「在 iframe 某处」——是此刻、当前视口里、考虑分栏布局之后真正可见的那一段。
  4. 跨 iframe 边界连续朗读,音频不断、段落级高亮无缝跨越 iframe 边界。
  5. 在被高亮的段落最后一个 fragment 即将离开视口时,按下 Kobo 的下一页按钮
  6. 绝不把视口往回拉,因为 Kobo 的 transform 动画过程中段落会短暂横跨两页、出现负坐标,朴素的回滚翻页器会去追陈旧的高亮、把用户拉回上一页。

普通 TTS 扩展这六件事一件都做不到。它们是为正常网页设计的——document.body 里就是文章的那种。Kobo 的阅读器是完全不同的形状。

CastReader 的 Kobo extractor 把这六件事全做了。结果是:你点播放,书在耳朵里响起,高亮在屏幕上跟随,读到页底 CastReader 自动按下一页按钮。整个体验更接近真正的有声书,而不是粗糙的 TTS hack。

图书馆借的书也能听

这一点值得专门讲,因为很多人不知道。如果你通过 OverDrive(也叫 Libby)借了一本书,在 Kobo 上读,那本书也会出现在 Kobo Web Reader 里。CastReader 对它和对其他书完全一样地朗读。借阅来源不影响——CastReader 只看 iframe 里渲染出来的文字。

所以「公共图书馆 + Kobo + CastReader」等于:免费访问 OverDrive 整个图书馆的有声版。借一本书,在 Kobo Web Reader 里打开,点 CastReader,通勤路上听。听完用 Libby 还书。不用任何订阅。

这一招同时绕过了两道平行的付费墙——有声书出版商付费墙(Kobo 没 TTS 的根本原因)和有声版可用性付费墙(Kobo Plus Listen 也不是每本都有)。对图书馆党来说,这是听书工具箱里最实用的一件单品。

多语种目录怎么样

Kobo 的母公司是日本乐天,是几大平台里非英语电子书目录最强的一家。法语(在法国和 FNAC 合作)、德语、意大利语、荷兰语、日语、巴西葡语等市场,Kobo 的目录都比 Kindle 大很多。

CastReader 支持 40+ 语种的自然 AI 真人音,从 EPUB 元数据的 <html lang> 自动检测书的语言。所以法语 Kobo 书听起来就是法语、德语 Kobo 书听起来就是德语、日语 Kobo 书听起来就是日语——你不用切换任何东西。

这恰好是 Kobo 目录里最受益于 CastReader 的部分。有声书目录严重偏向英语。如果你日常用其他语种阅读,你的有声书选择比电子书选择少得多。CastReader 把这个差距填上——你 Kobo 书库里每一本,任意语种,都变得可听。

通勤时发到手机

CastReader 有一个 Send to Phone 功能值得专门提,因为它和 Kobo 的配合特别好。这个功能把桌面浏览器里的音频流推送到一个私有 Telegram 机器人,你在手机上听。桌面继续自动翻页。你坐在车里,戴上耳机,听 Kobo 的书——什么都不用碰。

通勤场景下这意味着:你不用把 Kobo 书库搬到手机上(搬不了,反正 Kobo App 也没有 TTS),不用单独再买一份有声版(也买不到,反正不是每本都有),就是让你家的笔记本一直自动翻页,你在手机上听就行。

设置过程是一次性的——把 CastReader 扩展和 Telegram 机器人关联一下,之后就一直能用。不消耗流量套餐、除了 Telegram(大部分人本来就有)以外不用额外 App、没有按月费用。

务实的建议

把 Kobo 阅读器留给纯粹专注的阅读。它就擅长这个。墨水屏、长续航、没通知打扰的环境——晚饭后坐下来读一本书的完美载体。

把 Kobo Web Reader + CastReader 的组合留给笔记本上的听书场景。在笔记本上打开书,按播放,用音箱或耳机听,或者发到手机上通勤听。笔记本自动翻页。你什么都不用碰。

这是「分设备阅读」,听起来别扭,但实际比试图让任何一个 Kobo 表面同时承担「读 + 听」两份工作都更顺。阅读器服务晚饭后那专注的 30 分钟。Web Reader + CastReader 服务那 45 分钟通勤、洗碗时间、走路去邮局的路上。

我希望 Kobo 做的事

值得说一句:这整套方案之所以存在,是因为 Kobo 没办法在不和有声书出版商开战的前提下加 TTS。这不怪 Kobo。这场仗赢不了——亚马逊已经输过了。

Kobo 真正可以做、也不会引发战争的事,是在 Web Reader 里官方支持 TTS 扩展。把 iframe API 文档化。给需要读取渲染内容的辅助工具提供钩子。别让第三方为了让用户听已经买过的书去逆向工程他们的 iframe 结构。

其中一部分已经被动地发生了——Web Reader 比桌面客户端可访问性更好,OverDrive 集成把图书馆党拉了进来。但正式拥抱辅助扩展生态是 Kobo 可以做的、对自己零成本的小好事。

在那一天到来之前:CastReader、Kobo Web Reader、你已有的书库、一台笔记本。免费听完你拥有的每一本书,不订阅 Kobo Plus Listen、不订阅 Audible、不单独购买、不绕过 DRM。这就是那个解法。用上吧。

去 Chrome 应用商店装 CastReader →

完整的 Kobo 朗读落地页 →

Kobo Web Reader 朗读不工作?故障排查页 →