株式会社ドワンゴは、NTTと共同で、2016年3月5日(土)に、1日限定でAppBank Store 新宿に「むらい神社」をオープンし、神社内に設置したマックスむらいの等身大人形が話しかけられたら合成音声で返答する実験を行うことを発表。また、ニコニコ生放送にて、その様子が生中継されます。
以下、プレスリリースより。
■NTTと共同で音声合成実験を実施
ドワンゴはNTTと共に2013年7月より映像&ソーシャルサービスの高度化に関する技術開発を推進しており、今回、その一環として音声合成の実験を行います。本実験では、マックスむらい本人の音声から生成した合成音声を用いて参拝者と直接インタラクションを行い、その様子をニコニコ生放送にて中継します。これにより、 あたかもマックスむらい本人と対話しているかのような疑似体験をする面白さや新たなユーザ体験についての検証、音声合成の新たな可能性の検証を行います。
本実験での合成音声は、NTTメディアインテリジェンス研究所が開発した「ユーザデザイン音声合成」技術を用いて生成しており、低コストかつ短期間でマックスむらい本人らしさのある表現豊かな合成音声を実現しています。ユーザデザイン音声合成技術はNTTアイティ社のサービスである「FutureVoice Crayon」に搭載されており、本実験のシステムでは「FutureVoice Crayon」を利用して合成音声を作成しています。
■実施概要
■音声合成技術について
人の音声を特徴付ける要素として、話をする人の声質である「話者」と、声の出し方や言葉の使い方などの「口調」があります。ユーザデザイン音声合成技術では、特定人物の音声から「話者」と「口調」の特徴を別々に抽出し、合成音声に反映する技術を業界で初めて実用化しました。これにより、さまざまな「話者」と「口調」を組み合わせて、バリエーション豊かな合成音声を実現できます。
特定人物の「話者」と「口調」をユーザデザイン音声合成に追加して、合成音声に反映することができます。「話者」の特徴を簡易に抽出する技術を用いることで、従来技術と比較して大幅に低コストかつ短期間で作成することが可能になりました。「話者」の特徴を抽出すると同時に、「話し方」の特徴を抽出します。これにより、1つのカスタムボイスを作成・提供します。
以下、プレスリリースより。
■NTTと共同で音声合成実験を実施
ドワンゴはNTTと共に2013年7月より映像&ソーシャルサービスの高度化に関する技術開発を推進しており、今回、その一環として音声合成の実験を行います。本実験では、マックスむらい本人の音声から生成した合成音声を用いて参拝者と直接インタラクションを行い、その様子をニコニコ生放送にて中継します。これにより、 あたかもマックスむらい本人と対話しているかのような疑似体験をする面白さや新たなユーザ体験についての検証、音声合成の新たな可能性の検証を行います。
本実験での合成音声は、NTTメディアインテリジェンス研究所が開発した「ユーザデザイン音声合成」技術を用いて生成しており、低コストかつ短期間でマックスむらい本人らしさのある表現豊かな合成音声を実現しています。ユーザデザイン音声合成技術はNTTアイティ社のサービスである「FutureVoice Crayon」に搭載されており、本実験のシステムでは「FutureVoice Crayon」を利用して合成音声を作成しています。
■実施概要
日時 | 2016年3月5日(土) 13時~21時まで |
生放送 | http://live.nicovideo.jp/watch/lv253802917 |
設置場所 | AppBank Store 新宿 2階イベントスペース |
住所 | 東京都新宿区新宿3-28-10 ヒューマックスパビリオン新宿東口 |
概要 | 参拝者が願い事や決意表明などをマックスむらい等身大人形に話しかけ、視聴者のコメントを基にスタッフが入力した内容を人形が合成音声で返答します。 |
■音声合成技術について
1.合成音声バリエーションの豊富さ(プリセットボイス) |
人の音声を特徴付ける要素として、話をする人の声質である「話者」と、声の出し方や言葉の使い方などの「口調」があります。ユーザデザイン音声合成技術では、特定人物の音声から「話者」と「口調」の特徴を別々に抽出し、合成音声に反映する技術を業界で初めて実用化しました。これにより、さまざまな「話者」と「口調」を組み合わせて、バリエーション豊かな合成音声を実現できます。
2.低コストかつ短期間で特定人物の合成音声を作成(カスタムボイス) |
特定人物の「話者」と「口調」をユーザデザイン音声合成に追加して、合成音声に反映することができます。「話者」の特徴を簡易に抽出する技術を用いることで、従来技術と比較して大幅に低コストかつ短期間で作成することが可能になりました。「話者」の特徴を抽出すると同時に、「話し方」の特徴を抽出します。これにより、1つのカスタムボイスを作成・提供します。