一本調子
先日、日本橋にいたら、ちょっと変わった街宣車がやってきたのだ。
かつての世界経済共同体党の又吉イエスのような。
で、案の定というかなんというか、「核融合党」の車だった。
何がおかしいかっていうと、流している音声が全く抑揚のない一本調子で、それが逆に怖いんだよね。
独特の平板なイントネーションに耳には残るのだけど。
どうも、この抑揚というのはコミュニケーションにおいて大事で、だからこそ、AIがこれだけ発達しても、機械音声には違和感があるんだよね。
AIであれば、アニメや映画の吹き替えの声優さんを模倣して抑揚のある音声も再現できるだろうけど、それはセリフ込々で生成する場合であって、打ち込んだ文章をそのまま読み上げるのは抑揚のない一本調子だよね。
初音ミクに代表されるボーカロイドがそれに比べると自然に聞こえるのはメロディに載せているからであって、音階の上下で自然と抑揚がつくのだ。
なので、機械音声であっても、和歌や都都逸、義太夫節のように「節」にのせて読み上げるようなものであれば自然に聞こえるはず。
おそらく、読経も大丈夫なのだ。
中国語は声調というイントネーションで言葉の意味が変わるから、もう少し自然に聞こえるのかも。
普段意識していることはまずないけど、コミュニケーションをとっているとき、情報の発信側(話者)は受信側(対話の相手)の反応を見ながら、聞きながら、感じながら、フィードバックをかけて微妙に抑揚をつけているようなのだ。
それを参考に、話の内容を聞きながら微妙に表情を変えるロボットなんてのも開発されていて、先般の関西万博でも展示されていたようだけど、いかんせん、「不気味の谷」を越えていないので気持ち悪いんだよね(笑)
何が「自然さ」に貢献しているのよくわからないけど、タイムラグであったり、パターン化された動きだったり、何かあるはずなのだ。
なので、サンプリングした音声データから生成するなら自然に話しているような音声が再現できると思うのだけど、相手の反応に合わせて抑揚をつけながら機械で音声を出すのはまだまだ難しいんじゃないかと思うのだよね。
だったら、いっそのこと人には寄せずに、機械・ロボットのまま、或いは、何か人外のキャラクターとしてしゃべらせた方がよいように思うのだ。
調べてみると、自閉症スペクトラムのよくある特徴として、抑揚のない話し方をする、というのがあるみたい。
基本的に自分以外の人との関係、距離感が苦手な人たちなので、相手の反応を見ながらフィードバックをかけるというのは難しいよね。
なので、自分のペースでほぼ一方的に話すので、どうしてもそんな感じになるんじゃないかな。
結婚式のスピーチを頼まれたりしてがちがちに緊張して、自分がスピーチをする、ということ以外に気が回らなくなったようなイメージが近いのかも。
緊張すればするほど棒読みになるよね。
思い返してみると、はなしだけながくってたいしておもしろいことを言わない校長先生はたいがい一方的に話すだけなんだよね。
その逆で、この講演おもしろいな、って感じるような演者さんだと、どこまで見えているかは別として、聴衆を見渡しながら、その反応をフィードバックさせて話しているような気がするんだよね。
でも、過剰に反応しすぎると「芝居がかって」見えるわけだよね。
その辺の塩梅は事情に蒸す化しそうなのだ。
そういう微調整の結果が抑揚として表れているんじゃないか。
で、その高度なことをほぼ無意識にしていて人間のコミュニケーションを成り立っているのではないか。
街宣車のお経のような主張を聞きながら、そんなことを考えたよ。
では、街宣車のように一方的に垂れ流す場合はどういうのがよいのか?
難しい問題だけど、最初に出てきたように、なかば節にのせるようにして短い文章を連呼するのがよさそうなのだ。
確かに選挙の時に耳に残っているのはそういうリズムのあるやつで、きちんとした政治的主張をしているのかもしれないけど、ただただ話している者は騒音・雑音としかとらえていないような気がするよ。
0 件のコメント:
コメントを投稿