学术论文太难啃?用 AI 语音边听边读
读论文是研究生的日常。也是研究生最痛苦的日常之一。
一篇 20 页的论文,我的阅读轨迹通常是这样的:读完 Abstract 感觉还行 → Introduction 读了两段开始走神 → 拿起手机刷了十分钟 → 回来发现忘了读到哪了 → 从头开始 → 再次走神。
后来我试了一个方法:边听边看。效果出奇地好。
为什么边听边看更有效
纯视觉阅读的时候,你的眼睛随时可以停下来。停下来就走神。走神了就拿手机。
有了语音引导,阅读节奏被外部控制了。AI 语音一直在往前走,你的注意力被拉着走。走神的窗口变小了。
这不是什么新发现。很多人用 YouTube 上的论文讲解视频辅助阅读,但讲解视频不是每篇论文都有。CastReader 可以朗读任何论文。
arXiv HTML 论文
arXiv 现在大部分论文都有 HTML 版本了。在论文页面点 "HTML" 链接,打开 HTML 版。
然后点 CastReader 图标。它会提取论文正文,跳过页面的导航栏和侧边工具栏,开始朗读。段落高亮跟随——你的眼睛跟着高亮走,耳朵听着内容,两个通道同时输入。
我的论文阅读流程
第一遍:全文听。 1.2x 速度,不暂停,从 Abstract 听到 Conclusion。目的是抓大意。哪些段落听不懂没关系,心里有个印象。
第二遍:重点段看。 根据第一遍的印象,回到关键段落仔细看。公式、图表、实验设置这些需要视觉的部分。
第三遍(如果需要):再听一遍。 理解加深之后,第三遍听起来会顺畅很多。
比从头到尾逐字逐句看快得多,理解效果也不差。
PDF 论文
有些论文只有 PDF 版。CastReader 的 PDF 朗读功能 可以处理,但体验不如 HTML 版流畅——PDF 的文字提取有时候会遇到排版问题(双栏、脚注、参考文献混在一起)。
建议优先用 HTML 版。arXiv 的大部分论文都有了。
限制
数学公式不会读。 LaTeX 渲染的公式是图片或 MathML,CastReader 会跳过。正文中内联的简单公式(如 "当 n > 100 时")可以读。
图表不会读。 图表的说明文字(caption)会读,图表本身不会。
参考文献列表会跳过。 "[1] Smith et al., 2024..." 这种纯引用列表没有朗读价值。
这些限制其实是合理的——公式和图表本来就需要用眼睛看,听文字部分已经足够建立对论文的整体理解。
试试看
下次读论文之前,装上 CastReader。打开 arXiv 论文的 HTML 版。点图标。
戴上耳机,边听边看。你可能会发现论文没有那么难啃了。