心理学のお勉強

知覚心理学

聴覚


音は聴覚器官、つまり、耳から入って、中で加工されたり、補償されたりして、脳に送られます。知覚心理学で考える聴覚は、その間をちょっと垣間見る感じ。

なお、物理の時間ではありませんが、音は波です。JISによる「音の定義」でも、1) 弾性波で、正常な聴力を持つ人に聴覚的感覚を起こす周波数範囲のもの、2) 上の弾性波によって起こされる聴覚的感覚、とされています。ちなみに心理学的に言えば1番が刺激、2番は感覚のこと。

だから、耳の中ではその波がいじられているわけで、本当ならそこを説明するところからはじめないといけないのですが、なにしろ耳の絵は描きにくいし、大事なのはここではないので、バッサリ省かさせていただきます。ここをまさに知りたいって人は本を読んでね。

ということで、いきなり本題に入りますが、音の感覚にはいくつかの属性があります。その中でも有名なのが「高さ pitch」と「大きさ loudness」で、実は聴覚研究でも、このあたりは[精神物理学的測定法]でずいぶん行われてきました。

物理的に考えれば高さは周波数のことですし、大きさは音の持つエネルギー、あとひとつ「音色 tone」ってもありますが、これは音のもつスペクトル構造のことだから、この測定法でいけるわけですね。ちなみに音色の話は後でします。

このような研究によれば、聴覚の感度は周波数に対して等しくありません。つまり、高い音と低い音では感度が異なる。ここで言う「感度」というのは音圧のレベルで、身近ならところで言えば、音が小さくても聞こえるかどうか。

学校とかでやる聴覚検査みたいな形で「音の刺激閾を調べる実験」をするとわかるのですが、低域ではかなり感度が悪くて、上がるにつれてよくなります。それで、3〜4KHzあたりが最も良い感度で、あんまり高くなりすぎると、また聞こえなくなります(一応、その聞こえなくなったあたりからを「超音波 supersonic wave」って言う)。また、音の大きさも周波数によって異なって、低域の音は高域の音に比べて、音圧が上がると急激に大きくなる性質があります。

これをそこらへんのスピーカーに置き換えて考えてみると、高い音は小さなボリュームでも聞こえるけれど、低い音はかなりボリュームを出さないと聞こえない。で、大きな音にすると、低い音は体に当たるかのように感じる(これが音圧の威力)。

これを一言で「低域はダイナミック・レンジが狭い」といいます(簡単、即決)。音楽が好きな人で、オーディオにこだわるような人、特に、スピーカーを買うときは気にしたいですね。

また、CDよりアナログのほうが温かみを感じる、なんていいますが、人間に聞こえない周波数帯域をCDは端折っているので、音圧を体で感じるとか、そういうところの違いかもしれないと考えると、ありえない話ではないです。

続いて、音がどのくらい聞き分けられるか、つまり「弁別能力」について考えてみましょう。まずは音の高さ。

ここで簡単な実験を考えてみます。標準刺激を440Hz(時報の「ぽーん」という音の周波数)として、弁別閾(ここでは違う音と感じられる周波数の値)を極限法で求めてみましょう。これは再現できないので(無理にReal Audioとかでやればできなくもないが)、頭で想像するか、実際に体験してみてください。

やってみればわかりますが、440+10、つまり、450Hzの音と440Hzの音は、確実に聞き分けられます。しかし、これを440+2、つまり、442Hzと440Hzでやると、ほとんどわかりません。もし聞き分けられたら、ここが弁別閾です。

一般に周波数が高くなればなるほど、それに伴って弁別閾も大きくなります。

とはいえ、周波数が近似した2つの音を同時に出すとすると、そこには「うなり hauling」が生じますので、1Hz単位で違いがわかるようになります。うなりってなんだって思うかもしれませんが、スピーカーが出した音をマイクで拾ったりなんかすると起きますよね(キ〜ン…っていうあの現象のこと)。

音の大きさの弁別は周波数が変わってもあまり変わりません。ただ「感覚レベル sensational level」が高くなると小さくなる、つまり、音が大きくなると、閾値が小さくなります。

このとき使う単位が「デシベル dB」です。dBを式で表すと、dB=10log I/I0となりまして、これを言葉に直すと、10dB音が小さくなってはじめて、大きさが半分になったと感じるということ。見ての通り、フェヒナーの法則に従います。

ちなみに音源のエネルギーが倍になると3dB上がり、音を反射しない空間では音源からの距離が2倍になると6dB下がります。前者は騒音を考えるとき大事だし、後者を形にしてちゃんと録りたい音だけ録るのが「スタジオ studio」です。

次に音色について考えてみましょう。音色は音のもつスペクトルや波形、音圧、時間的変化などが絡んでいて、簡単に言えば、音の大きさとか高さが同じでも、違った感じに聞こえれば、音色が異なります(ギターのCと、ピアノのCでは全然違う)。

この音色には音源がどこにあるかを知る手がかりの側面と、もう1つ、音の印象に関わる面があります。

1つ目の「音源の定位」という側面は認知的な話として研究されます。それによると刺激条件を限定して、スペクトルの組み合わせのみが変数だとしたら、このスペクトルの組み合わせと心理量の間によい対応関係がみられます。でも具体的な説明は多次元尺度法の話をしないと出来ないので、ここまで。

あと後者は、たとえば「澄んだ音」だの「柔らかい音」なんていう言い方がありますが、このように音色を形容詞で書けるということで、言葉を使って分析する、たとえば、因子分析で音色の基本因子を求めて、これを軸として多次元空間内に形容詞を当てはめる、なんていう研究をやります。このような研究は結構されていて、まだこれからもいっぱい行われることでしょう。

んでもって、「音階 musical scale」というものもありますね。日本は本土と沖縄で音階が異なりますが、このようなことは世界中で見られます。それにたとえば、ピアノは「1オクターブ12音」を21/12で等比配列していますが、純正調だとそうではなかったりします。これは純正調が滑らかな印象を与えるように、協和音を作ってもうなりが起きない構造になっているから(代わりに転調が難しい)。

あと、人間の声、つまり、「音声 voice」というものもあります。言語学じゃないのでさらっと触れて終わりますが、音声は「音節 syllable」が時系列的につながっていて、その音節は母音と子音、つまり「音素 phonene」からなります。

一番大事なのは母音。これの音の違いは規則的なスペクトル構造の違いによります。このうち特に低いスペクトルが母音を印象付けるので、これを「フォルマント formant」と呼んでいます。第1、第2、第3の3つのフォルマントでほぼ決まっちゃいます。

これに比べれば子音は、無声音か有声音か(=波形の周期性の有無)、スペクトル構造はどうか、継続時間は、時間的変化は、といったこれらすべてが各音素に反映されていますし、特に、母音とくっついたりすると、物理的特性自体が変わっちゃうので、複雑です。簡単に言えば、kがaとくっつくと、「カ」(ちから、じゃないよ)になるでしょう?

音の動的特性ってのも考えてみましょう。こう書くと難しそうですが、ようは音が出たり出なかったり、ということです。これは必ずしも音の物理的変化には従いません。もう音は鳴ってないのに耳に残るとか、ありますよね。

Fastelの動的特性モデルによれば、音は時間的に前にも後にも影響を与えるので、鳴っている時間の3倍くらい間隔を開けないと、断続して鳴っているように聞こえてしまいます(倍がちょうど踏み切りの「カン、カン」という警報音。確かに断続して鳴っているように聞こえる)。

それに音は波なのでぶつかり合って重なったり、打ち消しあいます。これを心理学では「マスキング masking」といいます。やかましいところで会話していると相手の話が聞こえないのがいい例え。

マスキングとは「ある音の刺激閾が他のマスキング音(マスカー masker)の存在によって上昇する過程」のことで、その上昇した閾値のことを「マスキング閾 masked threshold in dB」といいます。ちなみにマスカーはかぶせる音に近ければ近いほど効果があります。また、マスカーが出てくる時間的タイミングも重要。日常ではマスキングが起きたり、音同士が加算されたりして、かなり複雑なことになっています。

かなり駆け足で聴覚を見てきましたが、いかがでしょうか。とりあえず、概略だけ触れてみました。