• 音MAD視点の読書記録 2020年4月編

    2020-04-17 19:02
    こんにちは、R.M.です。

     先日 音MAD雑アダン#3 をやった際に、文化論の諸概念にとても詳しいリスナーさんがいました。
     恥ずかしいことに、私はその方が提示してくれた概念をほとんど知りませんでした。自分の知識の浅さと勉強不足を反省し、これを機会に本を読んで少しでも勉強しておこうと思い立ち、何冊か本を読みました。
     この記事は、そうして読んだ本についてまとめるとともに、諸概念と音MADについてR.M.がどう考えたかを記録しておくものです。
     間違ってるぞ! ということがもしあれば、ぜひコメント欄で指摘してください。後学のためにも、よろしくお願いします。


     1. カルチュラル・スタディーズ入門 上野俊哉・毛利嘉孝 ちくま新書 2000年 
     大学在学中に音楽文化論について興味を持ち、人間と音楽の関わりや社会と音楽の関わりについて考えていたときに先輩からおすすめしてもらった本で、それから2年たってようやく読むことにした。もっと早く読んでおけば良かった。
     私はカルチュラル・スタディーズの専門家になるつもりはないし、カルチュラル・スタディーズの考え方のみによって音MADの全てに説明がつくとも思っていないが、それでもいくつか参考になるトピックがあった。カルチュラル・スタディーズの表面をなぞるだけだが、それらをかんたんに紹介したい。

     本の内容 
     本書は三章構成である。
     第一章では、カルチュラル・スタディーズとはなにか、どのような歴史で発達してきた分野なのか、どういった人間がどのような考え方をしてきたかが紹介される。
     第二章では、一章での歴史を踏まえて、カルチュラル・スタディーズとはどのような内容を取り扱う学問であるかを具体的な例をあげつつ説明される。
     第三章では、カルチュラル・スタディーズの現在と題して日本におけるカルチュラル・スタディーズの受容と展開について書かれている。
     書名のとおり、この本が書かれた2000年までのカルチュラル・スタディーズについて俯瞰できる本であり、カルチュラル・スタディーズが成立するまでの諸概念にかんたんに触れることができる内容になっている。

     音MAD的に注目したい概念の紹介 その1 コード化と脱コード化 
     前述のとおり、この本の第二章ではカルチュラル・スタディーズの取り扱う内容について記されており、その第二章の最も最初に触れられるのがメディアについてである。第二章の書き出しで、「メディア研究はカルチュラル・スタディーズの中でも最も重要な領域のひとつである」(p.39)と書かれている。
     音MADを芸術の一分野とみなす(注1)とき、それがメディア・アートのなかに位置づけられるのは間違いないだろう。また、素材の出どころや発表方法や加工の手法を考えた際、音MADとメディアの間には強い関係性がある。したがって、メディアに関する議論は音MADにとって切り離せない。

    *

     カルチュラル・スタディーズの代表的理論家であるスチュアート・ホールは、メディアにおける情報のやりとりにエンコーディング・デコーディングという概念を導入した。エンコードとデコードは音MAD作者には馴染みのある単語かもしれない。直訳すれば符号化・復号化という意味だが、ここでは本文での書き方に倣って、コード化・脱コード化と表現することにする。
     コード化とは、情報を発信する側が、情報にメッセージを含ませるために行う加工のことである。たとえばテレビのニュース番組を例に取ると、事件の起きた現場にスタッフが赴いて撮影をし、リポーターが状況を言葉に起こし、テロップやBGMをつけて番組としての形が成立する。そしてようやく、素材がメッセージを持った情報として自立する。
     テロップも解説もなしにただ映像を編集するだけでは、視聴者は何が起こったのか理解できないだろうし、BGMの選択を間違えただけでニュースはパロディになってしまう。つまり、素材はあくまでも意味をもたない素材にすぎず、それを編集することによって素材はある構造に組み込まれ意味を与えられるのである。(p.96)
     ホールによれば、コード化には3つの条件が必要であるという。
    1. 知識の枠組み
    2. 生産関係
    3. 技術的インフラストラクチャー
     知識の枠組みというのは「お約束」「暗黙の了解」のことである。例えば、我々はテレビ番組と全く無関係なコマーシャルが突然放送されても番組内容の理解に支障を来さない。それは私達視聴者がコマーシャルがどういう存在であるかを「お約束」として、知識として持っているからである。
     生産関係とは、平たく言えば誰がなんのために制作したかということである。とくにマスメディアの場合、労働力を用いて商品として生産されたものであるということを前提におく。経済的な価値をもとめて作られた製品であって、情報の流れる向きが決まっており、そこには思想や信条(イデオロギー)が含まれる。
     技術的インフラストラクチャーは言うまでもなく、これらの加工を可能にする技術のことである。

     さて、そうしてコード化された情報を受け取った視聴者は、脱コード化をしてそのメッセージを読み解く。ここで重要なのが、脱コード化は消費ではなく、また別の生産であるというホールの考え方である。
     あるニュースに触れたとき、それに対する人々の反応は様々だ。ニュースに特定のイデオロギーが含まれていたからといって、全員が全員そのイデオロギーを受け入れるとは限らない。ホールはこの反応、つまり脱コード化のやり方を、3種類に分類した。
    1. 優先的読み
    2. 対抗的読み
    3. 交渉的読み
     優先的読みとは、込められたメッセージや支配的イデオロギーに迎合する読み方である。一方、対抗的読みでは支配的イデオロギーに反してことごとく逆に読み替えていく。
     本書では鉄道ストライキに関する例が挙げられている。「連日の鉄道ストライキで国民は困っています」というニュースに対して、全くそのとおりだ、迷惑をかけるストは許せない、という素直な解釈が優先的読みにあたる。一方同じニュースに触れたとき、労働者には権利がある、本当に問題があるのは国や会社の方だ、と読み替えるのが対抗的読みである。私の所感では、今日ではどちらの読みもTwitterでたくさん見ることができる。
     交渉的読みは、このふたつの読み方を媒介する。メディアのメッセージを切り取ったり別の文脈に置いたりすることで、優先的読みによる脱コード化の結果と対抗的読みによる脱コード化の結果をぶつけて政治を生む。この本が書かれたのは2000年だが、今風にいうなら炎上の原理でもあるかもしれない。
     ホールはこのように分析して、ひとつのメッセージからいくつもの解釈が生まれる様子を、消費ではなく生産であるとした。

    *

     この考え方に基づくと、私が以前から抱えていた音MADに関する課題をいくつか解くことができた。
     課題の一つは、音MADと音MAD風の商業作品との違いは何か、ということである。音MADはコード化されたメディアの一つだが、現状では個人またはそれに準ずる小規模な制作集団が無償で作っているため、国や社会を由来に持つ強いイデオロギーを持たない。強いイデオロギーを持たないので、3種類あるはずの脱コード化も大きく分化せず、音MADが炎上するということもない。かたや商業作品の場合には、商品やキャラクターの宣伝という大目標があって、これにそぐわない要素は排除する必要がある。もし音MADを商業的に成功させようと思うなら、望まれる支配的なイデオロギーを音MADに純粋な形で乗せるための努力が必要になるだろう。一方でそれは、面白い音MADにはならないだろうなという予感がある。
     もう一つの課題は、視聴者に音MADがどのように受容されているのか、ということである。前の段落で「音MADはコード化されたメディアの一つ」と書いたが、音MADは脱コード化の結果でもあると私は考えている。メディアの一部を恣意的に切り取って別の文脈に置く、というプロセスを見ると、音MADは「交渉的読みによる脱コード化」に他ならない。ただ前述の通り、交渉的読みとはいっても、多くの場合そこにイデオロギーの対立が持ち込まれることはあまりなく、メディアについて作者個人がどんな解釈をしたのか、その結果どんなものが生まれたのか、ということだけが純粋に見られているように思う。素材ソースについて自分がどう解釈したかという脱コード化の結果と、出来た音MADをどう見てほしいかというコード化の結果が絡み合っているところが、音MADを含む二次創作物全般の面白さのひとつかもしれない。

     音MAD的に注目したい概念の紹介 その2 サブカルチャーと"儀礼" 
     この本の第二章では、メディアに続いてサブカルチャーについて論じている。この本ではサブカルチャーを厳密に定義づけることはしていない(注2)が、音MADがサブカルチャーの一部に含まれることは私達当事者にとって明白であるので、この部分も短く取り上げる。

    *

     カルチュラル・スタディーズを含め、若者文化を扱う社会学や文化研究では、"儀礼慣習行為(ritual)"という言葉を使う。ここでの"儀礼"は、「一定のスタイルや型によってかたち作られた身振りや慣習行為を指」(p.111)す。日本でいうと、平成初頭のギャルの嗜みになっていたルーズソックスや厚底ブーツが儀礼慣習行為の代表例である。
     こうした儀礼行為を共有する集団を"部族(tribe)"と呼ぶ。部族は儀礼行為だけでなく階級や人種など他の要因とも関係性をもち、その関係を追うのがカルチュラル・スタディーズでも重要な論点である。
     本文中では一例として、ヨーロッパのパンクや若者たちが象徴的に用いるナチスの鉤十字について触れている。鉤十字はナチスのファシズムを象徴するものであり、忌み嫌われていた。一方パンク文化はナチズム・ネオナチ・保守主義には反対する立場であって、彼らが鉤十字を掲げるのは一見矛盾しているように思える。実際にはかれらは、鉤十字というマークの「社会や体制から嫌われるもの」という意味だけを引き剥がし、シンボルとして使っていた。カルチュラル・スタディーズのみならず社会学では、儀礼行為のなかにこのような社会や制度に対する「抵抗」を見出す。

    *

     音MADの周囲では、内輪ネタの範囲を超えて慣習行為として根付いたものが多くある(膳サムネ統一やテンプレ化したコメントなど)。これは音MADに関わる人間がそれらの儀礼を通じて一つの部族として無意識的に行動していることの現れであると思う。サムネイルもタイトルも統一してしまうことは、ニコニコ動画の動画検索システムに対する「抵抗」とも取れる。
     内輪ネタの範疇を超えた儀礼化といえば、RED ZONE界隈のことにも触れる必要があるだろう。RED ZONEは、その楽曲としての出典からは意味が剥がされ、そしてRED ZONEをもちいた最初期の音MADでの意味も剥がされて「テクニック」だけが形式として残り、界隈内でシンボルとして使われ続けている。山田航平はRED ZONE界隈について「RED_ZONE界隈の動画は知人(既知の人)に向けて制作されている」と分析しており、これはまさに儀礼慣習行為と言えるだろう。RED ZONE界隈とその他の音MAD作者の間に溝を感じるのは、彼らがこういった儀礼慣習行為によって既存の音MADの部族との世代の差異に無意識的な「抵抗」をしているのを嗅ぎ取っているからかもしれない。部外者であること、部族の外にいることをよしとする文化については、北川純子の「音のうち・そと(勁草書房、1993年)」が詳しい。

    (注1) 音MADを芸術の一分野とみなすことについては賛否両論あると思うが、これはおそらく、芸術の定義が各人で揺らいでいることに依る。芸術というと高尚なもので、ある種低俗な音MADとは相反するものであると感じる人もいるかもしれないが、ここでいう芸術とは「表現物を通じて、鑑賞者に感情の変化をもたらそうとするもの」程度の認識でよい。くだらない音MADを見て笑ってしまったら、感情が動かされているのでそれは立派に芸術なのである。

    (注2) 本文によれば、「強いて言えばサブカルチャーは高級文化でも大衆文化でもない、またしかし同時にそうなることもありうるような、幅の広さとあいまいさをもった文化の領域だということになる」「カルチュラル・スタディーズはまさに特定の文化がもつこうした動的かつ不安定なあり方に繊細な注意を払う」「ある文化の定義が問題だからではなく、ある文化が特定の社会的文脈においてどのような意味とはたらきを担っているかを問題にする」(p.109)とある。定義を問題にせず、音MADがどのような意味とはたらきを担うかを考えていくことは、今後の進歩に一役買うかもしれない。



     2. 動物化するポストモダン オタクからみた日本社会 東 浩紀 講談社現代新書 2001年 
     音MAD雑アダン3のコメントの中に、「データベース消費」という言葉が出てきた。この本はデータベース消費という概念を最初に導入した本であり、また我々の親しむオタクの文化について分析を試みたものである。本書はどうやら賛否両論あるようだが、「データベース消費」を提案した功績は大きく、この概念に基づいた書籍もいくつか刊行されている。
     個人的には、データベース消費はオタク文化のいろいろな側面をよく説明できる優れたモデルであると感じるが、それのみによって全てが説明できているわけでもなく、東がこの本で論じるような「ポストモダンの本格的な到来」には2020年現在でも至っていないのではないかと思っている。また、本の中でいくつかの言葉の意味があいまいなまま議論が進行しており、それが厳密な検証を難しくしている部分がある。
     とはいえ、私には結論の真偽を論じられるほど周辺知識への理解がなく、ポストモダンというものについて問われてもはっきりと答えられないので、本書の構成は取り上げずに、注目したい概念の紹介に留める。

     音MAD的に注目したい概念の紹介 その1 シミュラークルと二次創作 
     広義には、音MADは二次創作であると言えるだろう。オタクの文化において二次創作が無視できない要素になっていることは、ポストモダンの到来の証拠の一つであるという。

    *

     フランスの社会学者ジャン・ボードリヤールは、ポストモダン到来後の社会においては作品や商品のオリジナルとコピーの区別が弱くなり、それらの中間形態であるシミュラークルが支配的になると予想していた。実際、アニメやゲーム周辺の文化を見てみると、オリジナルとコピーの区別は弱まっている。例えば「お疲れ様本」はアニメの制作に携わったスタッフたちが出す同人誌だが、その存在は限りなくアニメ公式の資料集に近い。MOD導入の余地を最初から設けているゲームなどの例を見ても、オリジナルと模倣品の区別はとても弱まっていると言えるだろう。
     日本ではいつごろからその傾向にあるのだろうか? 東によれば、アニメ制作会社が同人・二次創作的な振る舞いを自らするようになったのは「新世紀エヴァンゲリオン(1995年)」以降であるという。キャラクターだけを流用して世界観を参照しないような関連商品を出すようになったのはエヴァ以降なのだ。

    *

     シミュラークルはオリジナルとコピーの中間の形態であって、同人誌や音MADはこの特徴を多分に含む。しかし同人誌と音MADではそのあり方が大きく違うのもまた事実だ。
     例えばあるアニメを題材にした二次創作の同人誌を例に取って考えてみよう。同人誌では原作からキャラクターやその関係性という深層を"コピー"し、絵やストーリー、場合によっては世界観などの表面的な部分において"オリジナル"な表現を行う。
     音MADではどうか。古典的な音MADを例に取れば、"コピー"されているのは絵そのもの、音そのものである。音MADの中で"オリジナル"な表現といえるのは、その加工の手段の選び方であったり、配置であったり、組み合わせであったりする。その結果、深層であったはずの原作のキャラクター性がないがしろにされることも少なくない。
     同人誌と音MADでは、仮に同じ原作を引いていても加工の対象が異なっている。同人誌が原作の深層をそのままに表層だけを書き換えているのに対して、音MADでは深層に切り込んで編集を行っているように見える
     深層と表層とは何か? それに答えを与えるのが「データベース」を導入した捉え方である。

     音MAD的に注目したい概念の紹介 その2 萌え要素とデータベース 
     萌えアニメをはじめとするキャラクタービジネスでは、原作と全く無関係なシチュエーションによるイラストやフィギュアが発売されることが少なくない。水着や寝間着といった「単に描写されなかっただけ」の服装・シチュエーションから、バニーガールやメイド服や魔法少女などの、ともすれば「それは世界観的におかしい」と言われそうなコスチュームまで存在する。それらは、二次創作で描かれるキャラクターのイラストと本質的に差はない。
     世界観的におかしな破天荒な組み合わせは、音MADの作品中においても頻出する。ツッコミどころの一種として使われることもあるが、一方で妙な納得感を与えることもある。荒唐無稽にも思えるキャラクターとコスチューム・シチュエーションの組み合わせはなぜオタクに許容されるのだろうか?

    *

     東は、「デ・ジ・キャラット」を例に上げ、オタクによるメディアの消費形態が70年代から90年代にかけて変化しつつあることを指摘している。デ・ジ・キャラット、通称でじこは、1998年にマスコットキャラクターとして生まれた。マスコットキャラクターとして「萌え要素」を散りばめられてデザインされた彼女は、後に設定を与えられ、アニメやゲームに登場することになる。今でこそキャラクター先行のメディアミックスは珍しくないが、東はこれを大きな転換点と見ているようである。
     『デ・ジ・キャラット』を消費するとは、単純に作品(小さな物語)を消費することでも、その背後にある世界観(大きな物語)を消費することでも、さらには設定やキャラクター(大きな非物語)を消費することでもなく、そのさらに奥にある、より広大なオタク系文化全体のデータベースを消費することへと繋がっている。筆者は以下、このような消費行動を、大塚の「物語消費」と対比する意味で「データベース消費」と呼びたいと思う。(p.77 - 78)
     東はこの節で、消費の対象を4つに分類している。
    1. 作品とストーリー - 小さな物語
    2. 世界観 - 大きな物語
    3. 設定やキャラクター - 大きな物語
    4. オタク系文化全体のデータベース


    *

     私の解釈では、オタクにとって、作品(ストーリー)から世界観と設定・キャラクターは分離可能だ。分離可能であるから、キャラクターがストーリーや世界観を無視した(あるいは、入れ替えた)コスチュームを着ていても受け入れることができる。
     ストーリーのある作品を作るにあたっては、世界観や設定やキャラクターを必要とする。一方で、世界観や設定やキャラクターは必ずしもストーリーを必要としない。また、設定やキャラクターはオタク同士で共有されたデータベースから紡がれるが、データベースそのものは設定の一部でありこそすれ、キャラクターではない。この一方通行の関係に気づくことができたのが、この本を読んだ最大のメリットのひとつである。前の節で触れた表層と深層とは、作品とデータベースのことであった。
     
     90年代以降のオタクは、データベースそのものから消費を生むことができる。「金髪縦ロールの高飛車なお嬢様」(注3)だとか「銀髪で狐耳のついたクールで小柄な和服の女の子」(注4)などという要素の列挙だけで萌えられるのは、データベースを元に設定やキャラクターを脳内で補って消費できるからである。もちろん、私達は作品や世界観を消費することもできるが、それと同時にデータベースを消費することもしているのである(注5)
     東は2000年に書いたこの本で90年代までを議論の対象としているが、2010年代までのうちに、作品とキャラが分離可能であることを前提とした作品がアニメやゲームにものすごく増えているように感じられる。単なるクロスオーバーにとどまらない世界観とストーリーの交差と交換は、00年代から10年代での一つのトレンドだったように感じられる。

     では音MADではどうか? 音MADでは、素材に元から存在していたキャラクターとはかけ離れたキャラクター設定が音MADのためだけに自然発生する例がある(注6)が、これは当然、素材本来のデータベースからは発生し得なかったはずのものである。そういった設定が継承されて他の動画でも使われ、コモンセンスを得ていく。そういった設定の継承は、音MAD専用のデータベースから、音MAD専用のキャラクターを紡いでいる状態にある。今の音MADは素材と同じデータベースを参照するだけでなく、音MAD独自のデータベースを参照して制作される。そして音MAD専用のデータベースからキャラクターを紡ぐことができるなら、当然世界観やストーリーも紡ぐことができる。それが「音MADユニバース」なのだろう。

    (注3)(注4) 単に私の趣味である。
    (注5) 当然のことだが、全員が全員データベースの消費をできるわけではない。ストーリーしか消化しないタイプの人間や、逆にキャラクターしか消化できない人間もいるが、ここではアニメのストーリーを楽しみつつキャラクターにも萌えられるようなオタクを指して議論している。
    (注6) モーニングレスキューのCM出てくるオッサンは「セルニモン」ではないし、真島茂樹は男性器も女性器も出さない。クンナ・ダッシュは最悪インド人ではないし、松岡修造は食べすぎてデブにならない。



    以上、2冊を読んでのざっくりとした考察でした!
    他にも何冊か読んだんですが、音MADに直結して書けそうなのはこの2冊だけでした。
    もし間違ってるところがあったら教えて下さいね。

    おわり!


  • 広告
  • 備忘録 2020/2/16

    2020-02-16 19:25
    音MADをつくっていたりするときの備忘録です。誰かの役に立つかもしれない。

    ***

     REAPER で動画を編集できるようにする 
    新しいPCを買ったらどうやるか忘れてたので。
    REAPER は、そのままだと mp4(h.264)の読み書きができない。
    ちょっとファイルを足してやる必要がある。

    1. 必要なファイルをダウンロード
    REAPER のフォーラムに ffmpeg が置いてある。
    https://forum.cockos.com/showthread.php?t=82459
    (2020/2/17 リンク修正)
    自分の環境にあったものをダウンロード。
    ウチの場合は Windows 64bit。

    2. zipを解凍してファイルを移動
    bin フォルダのなかの dll 全部を REAPER と同じフォルダに突っ込む。
    大抵の人は C:\Program Files\REAPER になると思う。

    3. 起動して試す
    mp4 をドラッグアンドドロップしてみたり、
    File > Render... > Output Format のなかに Video (ffmpeg/libav encoder) があるのをみたり。
    映像はメニューの View から Video Window を表示しておけば見られる。

    参考
    http://positiveallergy.blog50.fc2.com/blog-entry-542.html

    備考
    Mute にしたトラックの動画は表示されない。
    Solo にしたトラックの動画だけが表示されるわけではない。
    動画の表示は上のトラックが上のレイヤーになる。
    編集は原則として音声と同様にできる。ピッチも変えられるしVSTもかかるしどこでもカットできるし引き伸ばして再生速度も変えられる。
    ただし、Glue items や Reverse items など、アイテムをレンダリングすると動画が失われる

    おまけ①
    動画アイテム上で右クリック、Item Properties > (Take media source 内の) Properties から画面を開くと、動画ファイルの情報が見られる。
    Transform のプルダウンメニューから Horizontal Flip を選ぶと動画が左右反転する。
    この機能を使うと音に合わせての左右反転くらいなら簡単にできる。
    ほか、AddFX の画面を開くと All Plugins のなかに Video Processer というのがある。
    これも結構いろんな編集ができるのでわりとこれだけで完結させられる。

    おまけ②
    たとえばYTPMV系の音声を作ってて、音に合わせて小窓とかいっぱい左右反転させたいとき。
    1トラック1小窓、と思って作業しておいて、トラック別に動画を書き出してからAviutlに持っていけば作業が楽になる。
    ただ、動画は一番上のトラックがレンダリングされてしまうので、不必要な動画はミュートして書き出してやる必要がある。

    ***
     Spleeter でアニメのBGMとセリフを分離する 
    Spleeter https://github.com/deezer/spleeter
    機械学習でボーカルを分離するやつ。
    アニメの音声に掛けるといい感じにセリフを分離してくれる。
    Python で動いている。Anaconda をインストールして README.md の Quick Start にしたがいコマンド実行すればすぐに使える。
    が、そのコマンドでちょっと引っかかる部分があるのでそれを補う。

    Quick Start に書いてあるコマンドは次の通り:
    spleeter separate -i spleeter/audio_example.mp3 -p spleeter:2stems -o output
    • spleeter を呼び出す
    • separate モードで実行する
    • -i の後ろにインプットソースの場所を指定する
    • -p の後ろに分離方法を指定する
    • -o の後ろにアウトプットの場所を指定する
    って感じ。
    ところが、この設定のまま分離をかけても最大で10分しか処理してくれない。アニメの音声は30分くらいあるので全然足りない!
    最大時間の延長については公式の文書にも記述がなく、Forum の該当記事を読んでようやく解決した。
    次のようなコマンドを追加してやるとよい。
    -d 1800
    -d の後ろに秒数を指定すると、その時間まで処理してくれる。今回は30分なので1800秒。OVAとか映画とかやるなら3600にしたり7200にしたりすればよい。
    注意点として、音声をメモリ上に展開しているので長い音声ほど大きいメモリ領域を要求される。
    30分の処理なら、たぶん16GBくらい積んでおいて仮想メモリに余裕を持たせておけば大丈夫。
    ほか、-p の後ろで分離方法を変えることで、音声分離のモデルを11kHzから16kHzにしたりできる。
    現時点では、自分は結局こういう形に落ち着いた。
    spleeter separate -i \path\01.wav -p spleeter:2stems-16khz -o output -d 1800

    以上。

    新曲宣伝しとこ
    https://redmuffler.bandcamp.com/track/the-glaive-to-the-riot



  • 動画紹介生放送向け! VoiceMeeter Bananaの使い方

    2020-01-04 01:37
    こんにちは、R.M.です。
    先日は音MAD作者が選ぶ今年の音MAD2019の生放送に参加させていただきました。
    放送開始早々にグダグダになってしまったことの反省も含めて、この記事を書きます。

    今回は生放送や通話のときに便利な仮想オーディオミキサー、
    VoiceMeeter Banana の紹介をします。Windows向けです。
    (2020/1/4 一部修正しました。大意に変更はありません。)


     1. 生放送での悩み 


    以前のニコニコ生放送の仕様では、動画引用での生放送をしたときに、生主のトークの音量と引用中の動画の音量バランスを、視聴者が自由に決めることができました。
    現在はその仕様がなくなり、動画を紹介する生放送の場合は、生主が自分で音量をコントロールする必要があります。
    経験者の方はおわかりの通り、自分の声がどれくらいの音量なのかを客観的に判断するのは結構難しいですよね。

    また、Discordなどを活用して複数人でトークしながら生放送しつつ動画を見たい場合、色々と面倒なことが起こります。
    ・自分の声は、通話先と生放送の両方に送りたい。
    ・動画の音声と映像は、通話先と生放送と自分のヘッドホンに送りたい。
    ・通話先からくるトークは、生放送と自分のヘッドホンに送りたい。
    左が入力元、上が出力先

    しかし、これをハードウェアに頼って行おうとすると、数チャンネルの入出力を備えたオーディオインターフェースに、まあまあの規模のミキサーと配線が必要になるでしょう。

    これをソフトウェアでなんとかしちゃおう、というのがVoiceMeeter Bananaです。

     2. 導入方法とデメリット 

    ここからダウンロードできます。

    赤枠のところからダウンロード。zipの中身もexeファイルなので好みの方で

    VoiceMeeter はBananaの他にもいくつかシリーズがあるので、好みのものを選んでください。
    基本的には入出力の数が異なるだけです。大抵の環境ではBananaで十分だと思います。
    ドネーションウェアなので、もし気に入ったら寄付しましょう。
    インストールは難しくありません。exeファイルを実行して指示に従ってください。インストール完了後に再起動を求められます。

    さて、導入時のデメリットを確認しておきます。
    このソフトは、ハードウェアで行うべき処理をソフトウェアで代行するというものです。
    この手のソフトの宿命として、処理の遅延(レイテンシー)が発生します。
    また、設定によっては、オーディオ品質の劣化を生じることもあります。
    さらに、常駐させるソフトなので、マシンパワーを若干消費します。

    私自身はマジのレコーディングとかでもない限りあんまり気にしてません。
    若干の遅延も感じるものの、電子ピアノくらいなら問題なく演奏できます。
    マシンパワーについても、CPUもメモリもそんなに食わないので、よほど貧弱なPCでなければ大丈夫だと思います。
    ほか、設定を間違えるとハウリングしてしまうということもありますが、これはちゃんと管理してやれば回避できますので心配いりません。

     3. 画面の解説と実際の設定 

    それでは、通話と動画再生と生放送を両立することを目標に解説を進めていきます。
    最終的に完成させたい経路(ルーティングといいます)は次のようなものです。
    さっきの図と同じです

    今からどんな作業をしていくかザックリ俯瞰してみます。
    1. WindowsのデフォルトのオーディオをVoiceMeeter Bananaに設定する
    2. オーディオインターフェースとVoiceMeeter Bananaを接続する
    3. Discord等通話用アプリケーションのオーディオを設定する
    4. 生放送用アプリケーションのオーディオを設定する
    5. VoiceMeeter Banana上でルーティング(配線)する
    では、順番にやっていきましょう!

     3. 1. WindowsのデフォルトのオーディオをVoiceMeeter Bananaに設定する 

    インストールして再起動したら、まずはWindowsのオーディオ設定を決めます。
    設定の中のサウンドから、出力デバイスの設定を変えましょう。

    出力なのにInput?

    出力なのにInput? と思うかもしれませんが、Windowsからの出力がVoiceMeeter BananaのInputへ入ってくる、と考えてください。
    Aux Inputと何もついてないInputがありますが、ここは何もついてないInputにしておきましょう。
    入力も同じように何もついてないOutputにしておきます。
    RealtekからVoiceMeeter Outputに変更する様子

     3. 2. オーディオインターフェースとVoiceMeeter Bananaを接続する 

    VoiceMeeter Bananaの画面を出し、右上にあるA1と書いてある部分をクリックします。

    クリックするとこんなふうにプルダウンが出ます。

    筆者のサブマシンでの環境。Bluetooth機器も表示される

    これはVoiceMeeter BananaのA1と名付けたアウトプットの次の行き先をどのデバイスにするか、という設定です。
    オーディオインターフェースを使っている方はそのデバイスを、あるいはBluetoothのオーディオ機器を使っている方はそのデバイスを選んでください。
    なんにもつないでない方は多分Realtekでしょう。WDMかWASAPIかMMEを選びましょう。

    ※ WDMとかWASAPIとかMMEって何? って方はググってください。
    WASAPIがあるならそれでいいと思います。

    さてここで、VoiceMeeter Bananaの画面の見方を少し説明しておきます。
    ちょっと混乱しがちな部分ですが、頑張って説明します!


    画面は左側のインプット部分右側のアウトプット部分に別れており、
    さらに、インプットアウトプットはそれぞれハードウェアバーチャルに区分されています。
    この画面では、どこからの入力どの出力に送ってやるか決める、つまりオーディオ信号の経路を設定することになります。

    3.1.で、Windowsの出力、すなわちデスクトップの音声すべては、バーチャルインプットのVoiceMeeter VAIOに入るよう設定しました。
    さきほどA1という出口にデバイスを設定したので、VoiceMeeter VAIOの欄にあるA1と書かれたボタンを点灯させると(デフォルトで点灯してますが)、Windowsから出た音声がそのままA1出口の先にあるデバイスへ流れていきます!
    さて、デフォルトではバーチャルインプットのVoiceMeeter VAIOB1ボタンも点灯しています。B1出口は、ほかのソフトにVoiceMeeter Outputという名前で認識されています。これはさっき、Windowsの入力デバイスとして設定したのでした。つまり今、Windowsくんは自分のデスクトップ上の音声をそのままマイク入力として受け取っています! このまま生放送を始めれば、デスクトップ上の音声がマイク入力の代わりに出ていってぜーんぶ放送されちゃうんですね。


    さて、「ハードウェア」と「バーチャル」についてもう少し整理しておきましょう。
    「ハードウェア」はオーディオインターフェースやマイク・ヘッドホン等の入出力、「バーチャル」はソフトウェアからの入出力に対応しています。これはつまりこういうことです……
    • PCにつないだマイクはHARDWARE INPUT 1~3のどこかへ入力できます。
    • PC上のソフトウェアから鳴っている音声はVIRTUAL INPUTのどちらかに入力できます。さっきはAuxじゃないほうに設定しました。
    • PCにつないだヘッドホンには、A1~A3のどこかから送出することになります。
    • PC上で音声を受け取るソフトウェア、すなわちDiscordやReaperはバーチャルアウトプットB1~B2のどちらかからシグナルを受け取ります。
    これを念頭におきつつ、目標の表を整理するとこんな感じになります。
    外のソフトからは、B1がVoiceMeeter Output、B2がVoiceMeeter Aux Outputという名前で認識される

    全体像が見えてきましたよね。では、サクサクと設定していきましょう!

     3. 3. Discord等通話用アプリケーションのオーディオを設定する 

    通話用のアプリケーションでは、通話先からの声をVoiceMeeterのどこへ受け取るかVoiceMeeterの出力のどれを相手へ送るかを設定することになります。
    ここではDiscordを例にとって説明しますが、基本的な部分はSkype等ほかのアプリでも同じです。
    まずはDiscordのオーディオ設定を開きましょう。

    両方ともAuxを選択

    先程の表によると、通話相手の声はVIRTUAL INPUT AUXへ入れることに決めてありました。また、通話相手への出力はB2出口にまとめることにしてあります。

    VoiceMeeter Bananaでの表記と、他ソフトでの表記にはズレがあることに注意してください。他のソフトから見たとき、VIRTUAL INPUT AUXVoiceMeeter Aux Inputとして、B2VoiceMeeter Aux Outputとして表示されています。今回は操作のわかりやすさのため、両方ともAuxがついている方に揃えられるようにしてみました。

     3. 4. 生放送用アプリケーションのオーディオを設定する 

    普通、生放送用のアプリケーションは、それ自身から音を出すことはありません。
    なので、設定するべきはVoiceMeeterの出力のうち、どれを放送するかです。

    ここでは、N Airを例にとって説明します。

    デスクトップ音声デバイス1が無効になっていることに注意

    N Airでは、デスクトップ音声とマイク音声を混ぜて出してくれる機能があります。
    が、その機能はVoiceMeeter Bananaで完全に代用できるので、一切無視します。デスクトップ音声デバイス1の設定は無効にしておきましょう。
    N Airに渡すべきはVoiceMeeter Bananaでミックスした一本の出力で、その出力はB1に集約すると決めたのでした。B1は、他のソフトからみるとVoiceMeeter Outputという名前で表示されます。

     3. 5. VoiceMeeter Banana上でルーティング(配線)する 

    作業もいよいよ大詰めです。表に従って、ルーティングをしていきます。
    ルーティングの前に、いくつか設定を見ておきましょう。
    まず、PCにつながっている物理的なマイクとの接続です。



    HARDWARE INPUT 1の下に小さく表示されているSelect Input Deviceをクリックすると、PCに接続されている物理的なインプットデバイスの名前が表示されます。PCに備え付けのマイクやオーディオインターフェースのチャンネルなどが表示されるので、これを選んでおきましょう。これにより、HARDWARE INPUT 1マイクからの入力を司るようになりました。入力チャンネルの複数あるオーディオインターフェースを使っている方は、同様の手順でHARDWARE INPUT 2、HARDWARE INPUT 3にも入力を設定できます。

    そのままだと名前が分かりづらいので、名前を変えましょう。HARDWARE INPUT 1と書いてあるところを右クリックすると……



    名前を変えられます。ここではMic Inとしました。
    同様に、VIRTUAL INPUTの方も名前を変えられます。AUXのほうにDiscordからの音声、そうでないほうにデスクトップの音声が来ているので……


    こんなふうに名前を変えておきましょう。

    そして、結線をします。といってもインプット側のスイッチを入れるだけですね。
    これが目標なので……

    こうなります。


    表の方とタテヨコが逆になってしまってゴメンナサイなのですが、これで配線が完了です。
    もちろんフェーダーを触って音量調整ができますし、なんならパンを振ったりEQかけたりできます。
    もし、Mic In(HARDWARE INPUT 1)からの音がPCから鳴ってハウリングしちゃってる! という場合、慌てずにレベルメーターを見て、大きくなっているところをMuteしましょう。結線に問題がなさそうな場合、右上のMenuからReset Audio Engineすると治るかもしれません。このResetは何か変だなと思ったときにまず試してみるコマンドとして覚えておくと良いです。

    最後に!! この組み上げたルーティングを保存します。
    右上のMenuを開き、Save Settings...を選びます。


    ファイルダイアログが出るので、お好きな場所にお好きな名前で保管しておいてください。
    次回以降の起動時は、この設定を自動で呼び出してくれます。



    長文になってしまった上に、ちょっとごちゃごちゃした説明になってしまいました。
    でもすごく便利なので、みなさん是非つかってみてください。
    たとえば生放送以外にもこういうときに使えます:
    • 通話相手にデスクトップの音を聴かせたいとき(普通にやると相手の声がハウリングする)
    • ゲームとボイスチャットをやりながら生放送し、ボイスチャット相手にはゲームの音声を送りたくないとき
    • DAWで作曲しながらの生放送で、PCのシステム音声は放送したくないとき
    紹介しきれなかった便利機能もたくさんありますし、是非いろいろ試して、つかいこなしてみてくださいね!

    以上です。おまけで新曲の宣伝しておきます。是非聴いてね。

    The Glaive to the Riot / RedMuffleR
    https://redmuffler.bandcamp.com/track/the-glaive-to-the-riot