« 買った本~日本爬虫両棲類学会第57回相模原大会・SCAPARA(爬虫類と両生類の臨床と病理のための研究会)第17回ワークショップ共催にて | トップページ | スマートスピーカー Google Home 単体で聖書番組を聴く »

2018年12月 8日 (土)

TXTテキストファイル・EPUB電子書籍ファイル等の音声合成(機械音声)朗読版MP3ファイルを作成するには

TXTテキストファイル・EPUB電子書籍ファイル等の音声合成(機械音声)朗読版MP3ファイルを作成するには

【要約】
 balabolka( http://www.cross-plus-a.com/jp/balabolka.htm ,無料)を使えば,TXT,EPUB,PDF,DOC等のファイルを,Windows10のMicrosoft Speech API (SAPI)の音声合成(朗読)機能を使ってオーディオファイル(MP3,他)として出力できる。「ファイルリストをオーディオファイルに変換する」で複数の(テキスト)ファイルを指定でき,また,変換中に機械音声が流れることなく短時間で出力される。たとえば,JW.ORG( https://www.jw.org/ja/ )で,朗読版の無い書籍「神権宣教学校の教育から益を得る」の朗読版を作成するのに使える。この書籍は,プレゼンテーション技術指南としても優れているように思う。balabolkaでの変換ファイル(MP3)は14時間43分で808MBになったが(128kbps),iTunesでさらに変換をかけることで(48kbpsモノラルで)303MBに減った。balabolkaでのTXTからMP3への一括変換時,文字コードを誤認識することがあり(76ファイル中2ファイル),変換後に念の為聴いてみることが必要。文字化けしたものは,通常のエディタ等で開いた上で,クリップボード経由で貼り付けてから個別変換すればOK。

2018-12-08 懶道人(monogusadoujin)

【詳細】
 JW.ORG( https://www.jw.org/ja/ )で,出版物→本や雑誌 に「読むことと教えることに励む」の音声ファイルMP3版(朗読版,48kbps)が登録されている(2018年6月印刷版)。これはこれで素晴らしい内容なのだが,全24ページ 33分(48kbpsモノラルで16MB)はいかにも短い。以前の「神権宣教学校の教育から益を得る」はインターネットが普及する前(2002年)に書かれたとはいえ,全288ページでかなり詳しい。しかし,惜しいかな,音声ファイル版が用意されていない。

 とはいえ,PDF・EPUB・JWPUB(JW Library専用形式)・スクリーンリーダー(TXT)・点字ディスプレイ(BES)版があり,EPUB版・テキスト版は,スマートフォン(Android)なら,天下一読高級版(Moon+ Reader Pro, https://play.google.com/store/apps/details?id=com.flyersoft.moonreaderp )等のツールで読上げさせることも簡単ではある。(実際,そういったやり方で通勤中に聴いたものだ。)

 しかしまぁ,どうせなら,朗読をMP3化しておくと便利ではある。「Googleテキスト読み上げ」( https://play.google.com/store/apps/details?id=com.google.android.tts )は,KDDI Research, Inc.の「N2 TTS」( https://play.google.com/store/apps/details?id=jp.kddilabs.n2tts )より賢いものの,長文の途中で読上げが変なところがある。声が裏返るというか,妙な間が空くというか,文章の解析中に,昔のBASICのガベージコレクションみたいな処理が入ってしまうような感じ? もっともWindowsの「Microsoft Haruka」も賢いとはいえないが。

 MP3化しておくと,Google Play Musicにアップロードしておいて,スマートスピーカーで聴けるし,Play Musicで通勤中にストリーミング再生することもできる。また,SoundSeeder( https://play.google.com/store/apps/details?id=com.kattwinkel.android.soundseeder.playerhttps://play.google.com/store/apps/details?id=com.kattwinkel.android.soundseeder.speaker )で,各部屋に置いた中古スマートフォンやタブレットで同期再生ができる。まぁ,Google Homeを複数台買って,マルチルームミュージック/オーディオグループMP3再生してもよいのだが。台所やトイレに行く際も音が途切れないのは便利。以前は,スマートフォンを服に入れてスピーカ鳴らしたり,バッテリ式のBluetoothスピーカを使ったこともあったが,バッテリの減りを気にする手間を考えると面倒だった。

 「神権宣教学校の教育から益を得る」のEPUB版を,balabolkaに読ませてみたところ,注釈もすべて表示され,詳しすぎるので,スクリーンリーダー(TXT)版のファイルを使った。コンパクトだが,全76ファイルと数が多い。フォルダごとに再生中の曲とその位置を覚えていて次回から続きを再生可能な「音楽フォルダプレーヤー」( https://play.google.com/store/apps/details?id=de.zorillasoft.musicfolderplayerhttps://play.google.com/store/apps/details?id=de.zorillasoft.musicfolderplayer.donate )なら巨大ファイルでも問題ないのだが,特定の章に戻りたい場合は,ファイルが章ごとにわかれていた方が便利だ。balabolkaにも特定文字列でファイルを分ける機能があるようだが,最初から分割されているものを使った方が楽ではある。

 Google Play MusicのMP3アップロードは,有料版でなくても可能な点がありがたい。とはいえ,ファイルサイズが無駄に大きいと,当方ADSLでは遅いし,ストリーミング再生を考えればファイルサイズは小さい方がよいから,balabolka変換後にiTunesで,[編集]-[環境設定]の「インポート設定」で「カスタム」を選び「96kbps」にして,[ファイル]-[変換]-[MP3バージョンを作成]でファイルサイズ小さいものを出力(変換)した。モノラルだと「48kbps」になる。「読むことと教えることに励む」の音声ファイルMP3版に合わせた。

 ID3タグの編集は,「Super Tag Editor」( https://www.vector.co.jp/soft/win95/art/se139061.html )を使った。あらためて探してみると,別の作者による新版も出ているらしい( https://forest.watch.impress.co.jp/docs/review/1009244.html )。新しい方が便利だったか。

 秀丸エディタのGREP機能やキーボードマクロを使って,76ファイルの表題部分を一気抽出した。「記事の主題」を含む行とか,「\n\n」(改行2つ)で抽出した行をさらに「txt(2): 」(2行目)を含む行に絞ったり,とか。「第XX課」の直後に改行入っているのが意外に処理面倒だった。

 ところで最初,TXTやEPUBを朗読版のMP3に変換してくれるというWEBサービス「Zamzar」( https://www.zamzar.com/ )を試してみたのだが,日本語部分は読上げてくれなかった。無料版ではさらにファイル容量にも制限があるようで,断念した。

【参考資料】
http://djoo.hatenablog.com/entry/2017/06/27/142247
Kindle本を聞こう! Audibleを使わずにお手軽に本を読み上げてもらう。 - djoo’s diary
2017-06-27

http://www.cross-plus-a.com/jp/balabolka.htm
Balabolka
ライセンスのタイプ:Freeware
オペレーティングシステム:Microsoft Windows XP/Vista/7/8/10
バージョン:2.14.0.680
ファイルのサイズ:16.5 MB

https://lightpdf.com/jp/solutions-convert-pdf-mp3.html
超便利!PDFをMP3に変換する・読み上げる方法
更新日:2018/10/25

以上

【関連記事一覧】
http://midorigame-ferret.cocolog-nifty.com/blog/2018/01/google-play-kin.html
20180122 : Google Play ブックスの読上機能に驚く(Kindle+TalkBackより上だ)

http://midorigame-ferret.cocolog-nifty.com/blog/2018/02/android50242240.html
20180214 : Android5.0.2/4.2.2/4.0.4での電子書籍対応状況を確認(Google Playブックス・朗読対応/Kobo/Kindle)

http://midorigame-ferret.cocolog-nifty.com/blog/2018/04/post-7306.html
20180430 : 電子化されない本・朗読されない本

http://midorigame-ferret.cocolog-nifty.com/blog/2018/05/post-3cfe.html
20180507 : 読み上げ可能な解説本・目録本

http://midorigame-ferret.cocolog-nifty.com/blog/2018/06/kindle-for-the-.html
20180602 : 「Kindle for the Web」の無料サンプルを,Pocketアプリで読み上げる

http://midorigame-ferret.cocolog-nifty.com/blog/2018/06/kindle-for-pc-3.html
20180605 : Kindle for PC で読み上げ対応(洋書)

http://midorigame-ferret.cocolog-nifty.com/blog/2018/07/androidkindleal.html
20180714 : Androidスマートフォン上でKindle本をAlexaで読み上げ可能になった(課題あり)

http://midorigame-ferret.cocolog-nifty.com/blog/2018/07/amazon-echo-dot.html
20180722 : Amazon Echo Dot購入。スマートフォンAlexaアプリとで別々のKindle本を同時読み上げ可能

http://midorigame-ferret.cocolog-nifty.com/blog/2018/09/google-home-min.html
20180913 : Google Home Miniを試してみた:Google Playブックスの読み上げはできない。オーディオブックは再生できる。

http://midorigame-ferret.cocolog-nifty.com/blog/2018/10/google-home-min.html
20181007 : Google Home Miniでオーディオブックでない普通の本を読み上げ&スリープタイマー

http://midorigame-ferret.cocolog-nifty.com/blog/2018/10/google-home-m-1.html
20181008 : Google Home MiniでKindle本を読み上げ&スリープタイマー

http://midorigame-ferret.cocolog-nifty.com/blog/2018/12/txtepubmp3-7e05.html
20181208 : TXTテキストファイル・EPUB電子書籍ファイル等の音声合成(機械音声)朗読版MP3ファイルを作成するには

|

« 買った本~日本爬虫両棲類学会第57回相模原大会・SCAPARA(爬虫類と両生類の臨床と病理のための研究会)第17回ワークショップ共催にて | トップページ | スマートスピーカー Google Home 単体で聖書番組を聴く »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: TXTテキストファイル・EPUB電子書籍ファイル等の音声合成(機械音声)朗読版MP3ファイルを作成するには:

« 買った本~日本爬虫両棲類学会第57回相模原大会・SCAPARA(爬虫類と両生類の臨床と病理のための研究会)第17回ワークショップ共催にて | トップページ | スマートスピーカー Google Home 単体で聖書番組を聴く »