Kindleで63冊の本を買った。Audibleで同じ本をもう一度買えと言われた。断った。
通勤時間は片道42分。山手線で新宿から品川まで。満員電車でスマホを見るのはしんどい。本を読むのはもっとしんどい。でも毎日84分、何もしないのはもったいない。
Audibleを試した。月額1,500円。1冊無料で聴ける。悪くない。でも問題がある。Kindleで既に買った本をAudibleでもう一度買わないといけない。Kindleで1,200円払った本に、さらに2,500円。同じ本に二重課金。一年で3万円以上飛ぶ計算だ。
僕のKindleライブラリには63冊ある。ビジネス書、技術書、小説、新書。5年かけて少しずつ買い集めた。これを全部Audibleで買い直したら、10万円じゃ済まない。
「Kindleの本をそのまま読み上げてくれるツールはないのか」と思って探し始めた。Speechify、Read Aloud、Natural Reader——片っ端から試した。全部ダメだった。Kindle Cloud Readerを開いて拡張機能のボタンを押しても、何も起きない。沈黙。
理由は技術的なもので、理解すれば納得できる。Kindle Cloud Reader(read.amazon.co.jp)でページを開くと、画面には文字が表示される。でもHTMLのソースコードを見ると、テキストがどこにもない。Amazonは暗号化フォントと画像レンダリングを使って、文字を「絵」として描画している。DRM保護だ。普通のTTSツールはHTMLからテキストを抽出して音声にする。テキストがHTMLに存在しないのだから、何もできない。
CastReaderはこの問題を別のアプローチで解決した。
テキストがHTMLにないなら、画面を「見て」読めばいい。人間の目がページを見て文字を認識するのと同じように、OCR(光学文字認識)でページの描画内容からテキストを抽出する。CastReaderはブラウザ内でtesseract-wasm——WebAssemblyで動くOCRエンジン——を実行して、Kindleのページ画像からすべての文字とその座標を読み取る。
使い方はシンプルだ。Kindle Cloud Readerを開いて、読みたい本のページを表示して、CastReaderのアイコンをクリック。2秒ほどでOCRが完了して、AI音声が読み上げを始める。段落ごとにページ上でハイライトが追従する。ハイライトの位置はピクセル単位で正確だ。OCRが各単語の座標を返しているから。1ページ読み終わると自動でページをめくり、次のページのOCRを実行して、読み上げを続ける。
音声はKokoro AIエンジンが生成する。日本語の読み上げは自然で、文章のリズムやイントネーションがちゃんとある。「彼は静かに部屋を出た」という文を、一文字ずつ区切って読むのではなく、自然な日本語のリズムで読む。長時間聴いても疲れない品質だ。
初めてCastReaderでKindleの本を聴いたとき、選んだのは『嫌われる勇気』だった。ずっとKindleライブラリに入っていたけど、50ページで止まっていた本。通勤電車でイヤホンをつけて、CastReaderを再生した。品川に着くまでの42分で4章分聴けた。翌朝も続きを聴いた。3日で読了——いや、聴了した。50ページで半年放置していた本が、通勤3回で終わった。
Audibleとの違いを正直に言う。Audibleのプロのナレーターには、AI音声はまだ追いつけない。感情表現、キャラクターの声の使い分け、ドラマチックな間——これはプロの領域だ。でもビジネス書や技術書を「内容を理解する」目的で聴くなら、AI音声で十分すぎる。小説は好みによる。僕は気にならなかった。
CastReaderは完全無料だ。冊数制限なし、時間制限なし、アカウント登録不要。僕の63冊のKindle本が、全部オーディオブックになった。Audibleで同じことをしたら年間何万円かかるか、計算したくもない。
インストール:ChromeウェブストアでCastReaderを検索して追加。次にread.amazon.co.jpを開いて、ライブラリから一冊選んで、アイコンをクリック。Kindleで買った本を、明日の通勤から聴ける。もう一度お金を払う必要はない。