• HANASU用 おふとん式リズムVCVCリスト Ver1.0【リスト+BGM配布】

    2017-07-08 00:01
    どうも、おふとんPでございます。
    ここのところブツブツとTwitterに垂れ流していたものを、なんとか公開可能レベルまでまとめられたので、リスト+BGM+oto.iniたたき台付きで配布してみようと思います。

    「おふとん式リズムVCVCリスト」をダウンロード

    以下、解説とか諸々です。

    ●リズムVCVCとは
    利点のみ箇条書きにすると、主には以下の要素が挙げられます。
    ・一定のリズムに乗って、従来の連続音に近い形で録音できる
    ・リズムに乗せているので、従来の連続音のように原音の自動推定が使える
    ・非常に短い時間で録音できる
    ・従来のVCVCと同様に通常の喋りにかなり近いかたちで録音できる

    今までのVCVC音源は、散文を読み上げ原音設定で切り出す、という方式を採用していましたが、前述の通り原音設定の手間などの問題がありました。
    そこで、「自然な喋りで、なおかつリズムに乗せて喋ることが出来ないか」を考え、以下のような方法に落ち着きました。

    まず、この収録サンプルをお聞き下さい。

    従来通りBGMに乗せている形ですが、自然言語を「4モーラ、4モーラ、5モーラ」で組み合わせることで、自然なリズムを作っています。この現象は自分たちのよく知る所で見られ、
    「あめんぼあかいなあいうえお」「中華人民共和国」「墾田永年私財法」「エッチスケッチワンタッチ」等、モーラ数が偶数で合致した場合に発生することがあります。(モーラが足りない場合は、空白が挿入されるものと考えて下さい)

    この方法で録音した場合、BGMの1拍につき4モーラの割当になります。
    例:「あめんぼあかいなあいうえお」
       ●・・・●・・・●・・・●・・・

    なお、収録テンポ80の場合、すべてのリストをひとつづきに録音すると、おおよそ6分で録音が完了します。
    もちろん、噛まなければ、のお話です。自然言語でのリストですので、さほど難読はありませんが、リスト網羅の都合上、多少無理やりな文章も存在しますので、予めご了承下さい。


    ●Q&A
    ・VCVCって原音設定難しいの?
    原音設定の構造自体は、通常の連続音と変わりません。ただし、エイリアスのみ特殊エイリアスになっています。今回の配布ファイルにはエイリアス設定済みのoto.iniのベースがついていますので、そちらをご利用頂ければ、今まで通りsetparamなどで原音設定が可能です。なお、部分的なエイリアスの修正にはHaruqa様が配布している「HANASU用VCVC音源マニュアル」がございますので、参考資料としてお使い下さい。(リズム式VCVCでない前提で書かれていますので、一部実際と違う場合があります。)

    ・自動推定は絶対ずれないの?
    従来の連続音と同じくらいのズレは発生します。自然言語でも、特定のモーラ数でリズムが発生することは前述しましたが、この時、モーラ単位では微妙な長さの調整が成される場合があります。
    例:「これは(korewa)」
    想定しているもの→| こ | れ | わ |
    実際の発音すると→|こ|れ | わ |(最初が少し短い時間で発声される結果、自動推定がずれる)

    ・実際に録音したものがみたいです
    私がリスト作成時にテストとして作ったものでよければ、こちらからダウンロードできます。
    エイリアス、原音設定、全体的に不完全です。

    ・作った音源を使用するには?
    エイリアスはHaruqa様制作のVCVCリストと互換のものになっています。
    作者様のHPより、プラグイン等をダウンロードの上、ご利用頂くのが良いかと思います。
    HANASU用VCVC音源紹介ページ

    ・作った音源を公開したい!
    ご自由にどうぞ。公開の際、もしよろしければ私のTwitter(@joumonsugi)にご一報いただけると小躍りして喜びます。

    ・リストは改変していいの?
    改変OKです。改変したものを再配布する場合は、改変元のリスト名とバージョンを明記して下さい。(例:「おふとん式リズムVCVCリストVer1.0より改変」等)

    ・私もリストを作ってみたい!
    どうぞ作ってみて下さい。先程解説しました通り、基本は「4モーラ、4モーラ、5モーラ」の組み合わせです。網羅率の確認については、Haruqa様のHPに御座います「HANASU用VCVC音源用原音設定チェッカー」等をご利用下さい。


    おまけ
    ●なぜ作るに至ったのか

     そもそも、数年前から「HANASU用連続音」という名目でもっちゃもっちゃと作っていた私ですが、そんな中登場してきたのがVCVC音源というものでした。どちらもHANASUに向けて作られているものですが、私はあくまで「機械的なリスト」として作っていたのに対して、VCVCでは「自然言語の文章を読み上げる」という方法にて制作されていました。
    実際の喋りから切り出すのは、リアリティを求める上で非常に有効であることは昔から示唆されていましたが、リズムに乗せない(音素が一定の間隔にならない)故の原音設定の難しさ、難読文章の発声、収録方法(OREMOの利用の有無等)の違いやリスト完全網羅が非常に難しいなど、数々の問題があり、私は避けていた部分でした。
     しかしながら、いざ切り出しされたものはやはり完成度として高かったため、自分の制作していたリストを放り投げ、「VCVCをもっと簡単に録れて、簡単に設定できるものにしてみよう」という方向に踏み切りました。
    一部手動でエイリアスの変更は必要ですが、録音した状態のものに自動推定を当てるだけで、従来の連続音程度のズレに抑えることが出来ているかと思いますので、是非気軽に挑戦して頂ければと思います。

  • 広告
  • HANASU用連続音に求められる音素とは何か(発展編)

    2017-06-24 22:50
    思うことがあったので、走り書きですがまとめます。

    ●末尾の音について
    文章末のモーラの母音は、直前の子音の調音場所や開放度合いによって変化するのではないか、という仮説です。
    例えば、「~である」の「る」についてですが、語頭、語中の音よりも母音が短く、なおかつ「r」を発音後の舌の位置がほぼ維持された状態で発音されている場合があります。これは基本の「う」の母音と異なる響きを持っています。
    それ以外にも、「~なのか」の「か」の発音において、母音が短く、なおかつ子音が帯気化された場合、母音にも同様の掠れが付与される場合があります。
    もちろん、上記の例はいずれも丁寧に発音されれば解消されるものですが、音源の再現性を高めるにあたって非常に有用ではないかと考えています。

    さらに、「る」「く」や「か」「な」など、同じ母音をもつものでも、子音によって調音が変化するのであれば、語尾音は1パターンではすまないのではないか、ということです。

    ●現実的な対処
    現状、これに近いことは現行の音源でも起こることであり、「語尾息音源が上手くつながらない」「同じ母音なのに響きが違うせいで上手くなじまない」といったものがそれに当ります。
    これはつまり、鼻音化などにより母音の調音場所が微妙に変化することにより起こるものではないかと考えています。
    しかしながら、クロスフェードや音素の差し替えなどで、ある程度の対処が可能なため、さほど大きな問題にはならない事が多いように思います。「より厳密に」音源を制作したいのであれば、それぞれの響きに合わせて音素を用意すればよいのではないかと思います。

    ●まとめ
    語尾の母音は普通のよりちょっと違う気がする
    沼っぽいことしたいなら別音素にしたらいいんじゃないかな

    以上です。
  • HANASU用連続音に求められる音素とは何か

    2017-06-21 21:071
    めっっちゃお久しぶりです、おふとんPです。
    最近全く考えてなかったので、自分の頭の中を整理がてら、まとめてみようかと思います。

    ●普通の連続音との差は?
    昨今では「VCVC音源」や「CCV音源」なども飛び出してきておりますが、結局HANASUを自然に創り上げる上で、一体何が必要なのでしょう。
    それはつまり、「喋り」と「歌」とで、発音の何処に差が出ているか、ということになります。
    例を挙げると
    ・1モーラの長さ
     歌は1モーラあたりの母音の長さが長くなり、喋りでは短くなる。

    ・音素が遷移するまでの時間
     喋りではそれぞれのモーラにおける母音の持続時間が短くなっていくため、速さにもよるが、母音の欠落(無声化)(例:あた、くえ等)や、本来連母音であるものの二重母音化(例:やさい、ろい、にぎわう等)が発生することがある。歌における発音でも、曲のテンポが上がることや短い音が連続することにより、同様の現象が発生する場合がある。

    ・発声時の声量、口の開き具合
    個人差はあるが、一般的な対話において用いられる声量と、歌を歌うときの声量では、後者のほうが大きくなることが多々ある。

    などがあげられるかと思います。

    私が思うに、通常の連続音を使用してHANASUを制作した際に出る違和感の正体は上記の差によるものが大きいのではないかと。「やたらハキハキしている」「二重母音の再現が出来ない」「母音が長く聞きづらい」などの問題は、「歌のために作られたもの」であることが大きいように思います。

    ●HANASUに必要な音素とは
    HANASU用連続音、すなわち「喋り特化型連続音」を考えるのであれば、それらを克服した音素を用意することになります。
    その解決策として、「実際の喋りから音素を切り出す」という試みが有効となります。
    VCVC音源はまさにその試みの1つです。
    この音源の利点は、通常の連続音では録音が難しい「二重母音」「無声化」「多様な撥音(鼻音)」が録音できることにあるかと思います。(鼻音については、普通の連続音でも収録、切り出しが可能ですが、遷移速度などを考慮すると実際の喋りからの切り出しのほうがよいかと思われます)
    また、喋ることによるデメリットとして、「歌のように1モーラあたりの母音が長い場合にストレッチノイズが出やすくなる」「リズムが不規則なため、原音設定時に自動推定ができない」「音素の完全網羅が非常に難しい」「各音素が特殊エイリアス」という点があります。
    なおエイリアスについては、手軽に使うためのプラグインが公開されています。

    ●今後の課題は
    前述したVCVC音源における利点をクリアできるのであれば、別の録音方式でも同様の結果が望めるのではないかと思います。
    今後の録音方法や、補助ソフトなどによって、収録方式や音源整備方法も変わってきますので、今後に注目です。