「音声合成技術」が随分進んでいるようです。この技術は、コンピュータ“で”音声を作って、人間を相手に、コンピュータ“に”しゃべらせることを目的にしていると思います。場合によっては、コンピュータ“で”しゃべることが目的の事もあるでしょう。この後の場合には、合成音声はどれだけでも人の声に似て欲しくなると思います。
ロボット技術に革新が起きて、ヒューマノイド(人間型ロボット)やペットロボット“に”、人間を相手にしゃべらせることが試みられております。ヒューマノイドを本当に自分の分身とするのなら、ロボット“で”しゃべる試みも現れるでしょう。この場合も、合成音声は人の声に似て欲しいでしょう。
ところで、「声は聞こえである」という、客観的にとらえ難い主張があります。 声の聞こえの中には聴覚的なものだけではなく、視覚のイメージや触覚的印象にかかわるものも含まれます。つまり、声は全身的なものだという説だと解釈してみます。この説を支持する立場なら、主語としてのコンピュータ、ロボットという言葉が指示する「実体」と、“人間”の「声」という主観的イメージとの間に、なにかザラザラした違和感が感じ取られることに気づくと思います。
ロボット技術と音声合成技術は、この違和感をなくすように進化するのでしょうか。つまり、ヒューマノイドの身体はあくまでも人間のそれに近づき、合成音声の音色はどれだけでも人声に迫るのでしょうか。ペットロボットに言語を使わせる試みは、どう評価されるのでしょうか。
ユビキタスコンピュータという技術が進んでいます。この技術が普及すると、超々小型コンピュータが地球上に浜の真砂のように存在して、冷蔵庫はおろか、そのなかのカップラーメンや牛乳パックにも仕込まれるようになるかもしれません。コンピュータはいくら小型でも、論理の世界では万能だから声が作れます。人々はカップラーメンの声の中に、何か“隠れ話者”のようなものをイメージするのでしょうか。
それにしてもラーメンの声とは?
自然には人の声、動物の声、虫の声など色々な声が存在します。これらの声は、自然環境の中でどのようにしてリアリティを獲得したのでしょうか。人工の音でも、夕暮れ時にお寺の鐘の音を聞いて不自然に思う人は少ないでしょう。街頭騒音でも慣れてしまえば生活音になります。楽器は各自固有の音を出します。一方シンセサイザーの音色は自在に変化しつつもアート性を持ち、時には身体性をも感じさせます。
「物体」にコンピュータが入り込むと身体性と知性を具現して、声を介して人間に近づいてきます。それらが人間にとって何者になるかには、声の作りようが大きく関係するでしょう。
以上のようなことを話題にして、自由討論形式のフォーラムにしたいと考えております。そのことによって、ロボット文化、アートの音声文化、その他あらゆる音声を使う文化等の振興に寄与することを目的とします。