音声合成ソフトとは、入力されたテキストや任意のテキストファイルを合成音声で読み上げるソフトウェアのことです。
以前の記事「音声読み上げソフトの便利な使い方」では音声合成ソフトの一般的な使い方とメジャーな音声合成ソフトについて簡単に紹介しましたが、今回は実際にソフトを使用し、どのような音声ファイルができるのか調べてみました。
ソフトによってはメーカーサイトに記載されている対応OSがWindows VistaやWindows 7などの古いOSになっているものもありますが、今回検証に使用したパソコン(Windows 10 Home エディション)で、問題なく使用できました。
Softalk(ソフトーク)
ソフトークは日本語や漢字や英語を含む文章を様々な声で読み上げるフリーウェアです。
対応している音声合成エンジンはAquesTalk、AquesTalk2、SAPI、Microsoft Speech Platformに対応しています。
特徴
- 音声合成エンジン:AquesTalk、AquesTalk2、SAPI、Microsoft Speech Platform
- 対応言語:日本語、英語
- 録音ファイル形式:wav
- フリーウェア
- ダウンロード:SofTalk
合成音声サンプル
女性01(日本語)
男性01(日本語)
Microsoft Haruka Desktop(日本語)
Microsoft Zira Desktop(英語)
シンプルでわかりやすい無料の音声合成ソフト「テキストーク」
テキストークは音声合成ソフトを初めて使う方でも簡単に操作できる、シンプルでわかりやすいユーザーインターフェースが特徴のフリーウェアです。予めセットした記号などを無視する読み飛ばし機能や、テキストファイルをドロップして起動できるなど、細かい機能も充実しています。今回紹介するソフトの中で唯一mp3形式での書き出しに対応しています。
特徴
- 音声合成エンジン:OpenJTalk、Microsoft Haruka Desktop(SAPI5)
- 対応言語:日本語、英語
- 録音ファイル形式:mp3 / wav
- フリーウェア
- ダウンロード:無料のテキスト読み上げソフト – テキストーク
合成音声サンプル
女性(普通のメイ)
男性(※なぜかホラー映画の音声のようになってしまいました)
棒読みちゃん
棒読みちゃんは日本語の文章を音声合成で読み上げるフリーウェアです。
ソフト名の通り、基本的に棒読みなので、お世辞にも人間らしい声とはいえませんが、あえて機械的な音声を作りたいときには非常に役立ちます。また、Twitterのタイムラインに流れてくるツイートを読み上げたり、ニコニコ動画のコメントを読み上げる機能も搭載されています。
特徴
- 音声合成エンジン:AquesTalk、SAPI5、Speech Platform
- 対応言語:日本語(8種類の声質を選べる)
- 録音ファイル形式:wav
- フリーウェア
- ダウンロード:棒読みちゃん
合成音声サンプル
haruka
ロボット
女性1
男性1
マルチリンガル・スピーキング2
マルチリンガルスピーキングはMicrosoftの音声技術に加えてGoogleの音声合成技術も利用することで、OSのバージョンに依存せずに多言語の音声合成に対応しているのが特徴です。話者の種類は全部で19種類もあり、全ての言語で速度やピッチの調節が可能です。Microsoftの音声合成はやはりどこか機械っぽさを感じますが、Googleの音声合成エンジンは人間の会話に近いイントネーションで音声を作ることが可能です。
特徴
- 音声合成エンジン:SAPI5、Google TTS
- 対応言語:日本語、英語、他(全19種類)
- 録音ファイル形式:wav
- 有料ソフト:3,980円
- ダウンロード:マルチリンガル・スピーキング2
合成音声サンプル
Google TTS(日本語)
Microsoft Haruka Desktop(日本語)
Microsoft Zira Desktop(英語)
まとめ
今回は無料ソフトを中心にレビューしましたが、有料の音声合成ソフトの中には、まるで実際に人間が話しているように声に抑揚や感情をつけたりできるものもあります。
本記事を読んで音声合成ソフトに興味が湧いた方は是非、有料ソフトのハイクオリティな音声も試してみて下さい。