音声読み上げソフト「テキストーク」(2019年9月)
極暑の8月が過ぎたと言っても残暑なお厳しい9月、勉強会を再開しました。
9月7日(土)13:00-14:00(於 パソコンコーナー)
テーマ:音声読み上げフリーソフト「テキストーク」担当:Mさん(17名参加)
テキストークは“Open JTalk”という音声合成エンジンを使って、テキストを読み上げるソフトです。無料であること、日本語を読み上げることが今回のポイントですが、読み上げ対象を新聞記事にしたため、まずこれをテキストデータにしなければなりません。この勉強会が目指すのは
1 イメージをテキストに変換する
2 テキストを読み上げる
の2点になります。
まず1の段階ですが、Mさんは『読売新聞』6月27日夕刊の「おまいり日和」という記事を取り上げました。鳥取県三朝町の三徳山三仏寺投入堂の案内で、固有名詞や漢字が多用されており、ルビや括弧も使われています。この記事をスキャンして画像データを作り、Googleドライブにアップロードします。
GoogleドライブにはOCR(光学式文字認識)機能があり、Googleドキュメントで開くだけでテキストデータが得られるのです。
段組、縦書きの設定にはなりませんが、文字に関して言えば間違いはわずかで、無料で使えるものとしては驚くほどの精度です。修正してダウンロードすればテキストは一応完成です。
一応というのは、ここからが本番だからです。テキストークは一般的な文章であればそこそこ読み上げてくれるのですが、この投入堂記事をはたして読めるのでしょうか。
テキストークの使い方自体は簡単で、音声の種類と読み上げスピードと音量を選択し、画面に読みあげるテキストを書き込むか、テキストファイルを開いて再生するだけです。しかしこの記事には苦戦したようです。以下の赤字修正箇所をご覧になればおわかりでしょうが、漢字固有名称は読めないものが多そうです。テキストークには「読み仮名辞書」「読み飛ばし辞書」に特殊な読みを設定する機能がありますが、今回の記事のような場合はテキスト自体を修正することになるでしょう。
⇓ クリックで拡大します ⇓
とは言え、一般的なテキスト文であればこのような手間はかからないし、無料で使い方も簡単です。その上再生された音声をMP3かWAVで保存することができます。この機能に着目して、Mさんは勉強会のプレゼンテーションを「ぱそぼらチコちゃん」に担当してもらうことを思いつきました。パワーポイントで作成したスライドのナレーションにテキストークの合成音声を使ったのです。動画にちょっと説明を入れてアップロードしたい時など、参考になる手法ですね。
文書を音声にする試みはいろいろなされています。「ぱそぼらニュース」でも2018年5月に 「本を聴いてみよう」という記事が出ていますが、音声対応のデジタル書籍もどんどん増えています。しかしながら有料となると、では早速、ともいかないかもしれません。勉強会の最後にはテキスト読み上げソフトの今後の利用について意見が交わされましたが、本のように容量の大きいものはさておき、手軽に試せるテキストークは最初の一歩としてお薦めかもしれません。
by pepper