• HANASU用連続音に求められる音素とは何か

    2017-06-21 21:071
    めっっちゃお久しぶりです、おふとんPです。
    最近全く考えてなかったので、自分の頭の中を整理がてら、まとめてみようかと思います。

    ●普通の連続音との差は?
    昨今では「VCVC音源」や「CCV音源」なども飛び出してきておりますが、結局HANASUを自然に創り上げる上で、一体何が必要なのでしょう。
    それはつまり、「喋り」と「歌」とで、発音の何処に差が出ているか、ということになります。
    例を挙げると
    ・1モーラの長さ
     歌は1モーラあたりの母音の長さが長くなり、喋りでは短くなる。

    ・音素が遷移するまでの時間
     喋りではそれぞれのモーラにおける母音の持続時間が短くなっていくため、速さにもよるが、母音の欠落(無声化)(例:あた、くえ等)や、本来連母音であるものの二重母音化(例:やさい、ろい、にぎわう等)が発生することがある。歌における発音でも、曲のテンポが上がることや短い音が連続することにより、同様の現象が発生する場合がある。

    ・発声時の声量、口の開き具合
    個人差はあるが、一般的な対話において用いられる声量と、歌を歌うときの声量では、後者のほうが大きくなることが多々ある。

    などがあげられるかと思います。

    私が思うに、通常の連続音を使用してHANASUを制作した際に出る違和感の正体は上記の差によるものが大きいのではないかと。「やたらハキハキしている」「二重母音の再現が出来ない」「母音が長く聞きづらい」などの問題は、「歌のために作られたもの」であることが大きいように思います。

    ●HANASUに必要な音素とは
    HANASU用連続音、すなわち「喋り特化型連続音」を考えるのであれば、それらを克服した音素を用意することになります。
    その解決策として、「実際の喋りから音素を切り出す」という試みが有効となります。
    VCVC音源はまさにその試みの1つです。
    この音源の利点は、通常の連続音では録音が難しい「二重母音」「無声化」「多様な撥音(鼻音)」が録音できることにあるかと思います。(鼻音については、普通の連続音でも収録、切り出しが可能ですが、遷移速度などを考慮すると実際の喋りからの切り出しのほうがよいかと思われます)
    また、喋ることによるデメリットとして、「歌のように1モーラあたりの母音が長い場合にストレッチノイズが出やすくなる」「リズムが不規則なため、原音設定時に自動推定ができない」「音素の完全網羅が非常に難しい」「各音素が特殊エイリアス」という点があります。
    なおエイリアスについては、手軽に使うためのプラグインが公開されています。

    ●今後の課題は
    前述したVCVC音源における利点をクリアできるのであれば、別の録音方式でも同様の結果が望めるのではないかと思います。
    今後の録音方法や、補助ソフトなどによって、収録方式や音源整備方法も変わってきますので、今後に注目です。

  • 広告
  • UTAU界隈で一番強いのは誰か?

    2015-04-11 17:532
    ちょっと深い記事を。おふとんPです。

    僕がこの界隈に足を踏み入れて5年、UTAU界隈もずいぶん広く、大きくなったものです。
    録音する人もいれば、音源を取らず開発する人もいます。昔はプラグインなんてそうそう出回るものじゃなかったのになぁ、とか。
    UTAUで伸びる人も増えたなぁ、昔は散々「ロボロボしい」などと言われていたのが、今では神調教タグ、魂実装済みタグまで付いてくる。「強くなった」なぁ。

    ん?「強い」ってなんだ?

    …というわけで、この記事における「強い」とは何か、定めておきます。

    日進月歩、成長を続けるこの界隈を「引っ張っていける強さ」を持つのは誰なのか、ということです。

    ところで、この界隈の人間をいくつかの種類に分けるとなったら、どれだけに分かれるでしょう。
    僕は
    ●(開発)技術者勢
    ●録音(中の人)勢
    ●調声勢
    ●絵描き勢
    ●聞き専勢
    の5つにわかれると思っています。
    また、この5種類には「普及の順番」が存在すると思っています。
    リトマス紙の端に水を垂らせばじわりと反対側まで染み渡っていくように、上から順に界隈へ新しい技術が浸透していくのです。(絵師は音源に直接的に関わらない人もいるので例外的であるが)

    開発「作った」
    録音「録った」
    調声「調声した」
    絵師「描いた」
    聞き専「すげー」

    基本この順番だと思うのです。もちろん、この中間から出ることもあります。

    録音a「表情音源つくった」
    録音b「aさんの真似して作った」
    録音c「aさんの真似して作った」

    といった具合に。この場合は横に広がってから下に落ちていく構図になりますね。

    ■結局誰が強いのか
    僕は「作る人」が一番強いと考えています。それは、開発勢であったり、録音勢であったり、あるいは調声勢かもしれません。リストを作った、新しい音源の構造を作った、プラグインを作った、エンジンを作った…。いろいろな可能性がありますが、その人の出したものが「流行」の兆しを見せた時、それを取り巻く渦が出来上がる。その目にいる人こそが「強い人」なのではないか、と思います。

  • 演歌風音源についての考察 その2

    2015-04-06 17:30
    どうもー。おふとんPですよー。
    先日のリストを元に録音してみた感想とか色々言おうと思います。


    ●おふとん式演歌風音源の構造
    僕のリストは、まず巽式8モーラCVVCリストの改造版で基本の音素を収録し、追加リストで特殊語頭音素(こぶし音素)を収録、最後に特殊ロングトーン(口の開きを変えつつのロングトーン)を収録して終わり、という形です。

    ●基本音素について
    ほとんどただのCVVCです。ただ、最初に特殊母音を録音します。これは、「『かんぁ』ぜにふかれて…」のような間に「ん」を挟むような連続音です。某V系風音源さんの発音にも似ていますね。演歌の場合、「ん」がもっと鼻にかかるイメージですが。
    それ以外は演歌「っぽく」録音すればなんとかなると思います。

    ●こぶし音素ってなんぞ?
    お恥ずかしながら、自分もこの「こぶし」の定義をよくわからず言っておりまして、「演歌特有のがなりのあるアクセント」だと思っていたのですが、調べた所「一音の中での音程の細やかな揺れ」を差すようです。これからは「こぶし音素」ではなく「がなり音素」と呼ぶべきですね。ちなみに、濁音までは録りますが、拗音は省略しています。「に"ゃ」とかほぼ使わなさそうですし。

    ●特殊ロングトーンってなんぞ?
    前述の通り、口の開き方を変化させつつ録音するロングトーンです。響かせ方を変える、とも言えるでしょうか。サビの最後などで「あぁ~~~~~…(「あ」の音だけど口が閉じていく、鼻にかかっていく)」のような表現をできるようになります。

    ●動画にないが、録るべき音素
    まず「巻き舌音素」が欲しいですね。氷川きよしはズンドコ節で多用してましたが、ドスの効いた発音を再現するときにあるとかなりいいです。

    ●そのリストはどこにありますか?
    こちらになります。→ おふとん式演歌風音源リストproto3

    ●この音源使ってみたいです
    原音設定全部出来てないものしかありませんが、興味のある方はお使いください。
    薪宮風季 開発コード「enka_proto2」
    もしこの音源で動画を上げる際は、上の動画を親作品登録していただけると嬉しいです。twitterより確実なので。

    ご意見ご感想などありましたら、記事のコメント欄にどうぞ。では。