Главная страница

Алдошина. Основы психоакустики. Ирина Алдошина Основы психоакустики


Скачать 6,63 Mb.
НазваниеИрина Алдошина Основы психоакустики
АнкорАлдошина. Основы психоакустики.pdf
Дата08.04.2018
Размер6,63 Mb.
Формат файлаpdf
Имя файлаAldoshina_Osnovy_psikhoakustiki.pdf
оригинальный pdf просмотр
ТипДокументы
#31647
страница6 из 22
Каталогid32618330

С этим файлом связано 79 файл(ов). Среди них: Aldoshina_Osnovy_psikhoakustiki.pdf, Straus.pdf, Zvukorezhissyor_7_2010.pdf, Zvukorezhissyor_6_2010.pdf, Proizvodstvo_svezhevyzhatykh_sokov_Juice.pdf, Proizvodstvo_derevyannykh_mini-domikov_i_bytovo.pdf, Скачать квитанцию для оплаты.doc, Инструкция по посадке Сосна горная.doc и ещё 69 файл(а).
Показать все связанные файлы
1   2   3   4   5   6   7   8   9   ...   22

Часть 9.
Слуховые пороги, часть 2
Ограниченные возможности слуховой системы определяются не только наличием абсолютных порогов слышимости, о которых было сказано в первой части статьи о слуховых порогах, но и ограниченной разрешающей способностью слуха.
Под разрешающей способностью слуха подразумеваются минимальные изменения звукового давления, частоты, временных интервалов (и соответствующих им громкости, высоты, длительности), которые могут быть замечены слухом. Разрешающую способность называют еще дифференциальным порогом восприятия
(в англоязычной литературе JND just noticeable difference).
Современные компьютерные технологии открыли возможность вносить очень тонкие изменения в параметры звука, однако использование этих изменений должно опираться на знание разрешающей способности слуховой системы, иначе они останутся незамеченными (если только не ставится задача вносить какие-то специальные изменения, например, удалять короткие щелчки при реставрации и др.). Поэтому изучению дифференциальных порогов уделяется очень большое внимание и за последнее время получен ряд интересных результатов.
Амплитудные дифференциальные слуховые пороги
Вопрос о минимальных изменениях амплитуды давления, которые улавливаются нашим слухом, был исследован рядом авторов (Олсон, Цвиккер,
Редерер и др.).
Постановка экспериментов по определению слышимых амплитудных различий сигналов у разных авторов различалась, однако полученные результаты позволили получить очень близкие значения JND.
Первая группа экспериментов использовала два синусоидальных сигнала одинаковой частоты, но разного уровня. Например, у входа в ушной канал подавался сигнал с частотой 1000 Гц с уровнем звукового давления 40 дБ, и второй сигнал той же частоты с изменяющимся уровнем. При поочередном прослушивании пары таких сигналов слушатель отмечал, какой из сигналов звучит громче. Естественно, что если разница в уровнях между сигналами достаточно большая (например, 40 и 60 дБ), то все 100% слушателей отметят эту разницу, но если разница в уровнях будет уменьшаться, то замечать разницу между сигналами будет все меньшее количество слушателей.
Разница в уровнях, которую замечает 75% слушателей, принимается за дифференциальный слуховой порог по уровню звукового давления (по амплитуде). Эти измерения, повторенные для разных частот и разных уровней звукового сигнала, позволили получить характеристики зависимости дифференциальных порогов слышимости JND от частоты и общей интенсивности звукового сигнала (рис.1). Как видно из рисунка, эти пороги (т.е. едва замечаемая разница в уровне громкости) зависят от частоты сигнала: наименьшие значения
42
получаются на средних частотах(500…4000 Гц), на низких и высоких частотах они возрастают. Например, при общем уровне 60 дБ JND для частоты 1000 Гц составляет 0,8 дБ, а для частоты 200 Гц 1,3 дБ. Кроме того, они сильно зависят от общего уровня сигнала чем громче сигнал, тем меньшую разницу между сигналами можно услышать. JND на частоте 1000 Гц при общем уровне 40 дБ составляет1,25 дБ, при уровне 80 дБ 0,6 дБ.
При другой постановке экспериментов использовался амплитудно-модулированный синусоидальный сигнал
(пример такого сигнала показан на рис.2). Амплитудная модуляция сигнала достаточно широко используется в музыке (тремоло и амплитудное вибрато), она воспринимается на слух как небольшое изменение громкости сигнала.
Предварительно был исследован вопрос о влиянии частоты модулирующего тона на заметность изменения амплитуды несущего сигнала. Наибольшая чувствительность слуха отмечена при частотах модуляции около 4 Гц, в связи с чем дальнейшие измерения производились при этой частоте.
Опыты сводились к определению уровня звукового давления, при котором становились заметными колебания громкости, обусловленные модуляцией.
Результаты представлены на рис.3 в виде семейства кривых, которые можно назвать кривыми равной заметности амплитудной модуляции звука. Они почти повторяют рисунок кривой порога слышимости. Цифры, которыми обозначены кривые, выражают соответствующую каждой кривой глубину амплитудной модуляции в процентах. Из этих результатов также следует, что чем громче сигнал, тем меньшее изменение амплитуды модулирующего сигнала можно заметить. Например, при общем уровне сигнала около 90 дБ можно заметить изменение амплитуды всего 1,5%.При уровне сигнала 30…40 дБ, чтобы услышать изменение громкости, нужно менять амплитуду модулирующего сигнала приблизительно на 10% (это нужно иметь в виду при создании электронных композиций с введением эффектов модуляции).
На основе этих кривых можно получить зависимость амплитудной разрешающей способности слуха от частоты при постоянной громкости. На рис. 4 приведены такие кривые для уровней громкости 40, 60 и 80 фон (фон единица громкости, равная уровню звукового давления в дБ на частоте 1000 Гц, например,40 фон = 40 дБ на 1000 Гц). По оси ординат отложено пороговое изменение звукового давления в процентах к уровню основного тона.
Например, изменение р/р100%=3% при уровне
80 фон,т.е. 80 дБ (что соответствует значению р=0,2 Па), дает величину р = 0,06 Па.
Амплитудная разрешающая способность слуха также сильно зависит от уровня громкости звука. Например, при частоте 1000 Гц для громких звуков (с уровнем громкости 80 фон) заметно изменение давления на 3%, в то время как колебания давления тихих звуков (40 фон) становятся заметными лишь при изменении на 10%. С
43
уменьшением громкости звука резче становится и частотная зависимость порога чувствительности слуха от изменения громкости. Таким образом, для чистых тонов с уровнем звукового давления, обычно используемым в музыке, замечаемая разница составляет от 0,5 дБ до 1 дБ в области средних частот.
Следует отметить, что для сложных музыкальных сигналов дифференциальные пороги существенно зависят от вида музыкальных программ (эстрадных, классических и др.), от опыта слушателя, свойств помещения и др.
Многочисленные эксперименты по определению чувствительности слуха к изменениям уровня звукового давления (т.е. неравномерности АЧХ) при воспроизведении через акустическую аппаратуру
(громкоговорители, микрофоны и др.) показали, что пороговая величина воспринимаемых неравномерностей составляет в среднем 2 дБ, причем чувствительность слуха к пикам на АЧХ выше, чем к провалам. Кроме того, она зависит от ширины (добротности пика/провала) и его частотного расположения в области средних частот чувствительность максимальная.
Учитывая, что динамический диапазон слуховой системы около 120 дБ, то при такой тонкой чувствительности слуха к изменению уровней можно применять гораздо больше градаций по громкости (современные звуковые технологии позволяют это сделать), чем это используется в классической музыке, где указывается только шесть градаций от fff до ррр, что позволило бы существенно расширить таким образом средства музыкальной выразительности. (Классическая динамическая шкала предусматривает восемь динамических указаний: ppp- pp-p-mp-mf-f-ff-fff. В произведениях композиторов-романтиков Берлиоза, Вагнера, Чайковского встречаются и такие экстремальные обозначения, как pppp и ffff, однако эти ремарки носят больше эмоциональный, чем реальный акустический смысл. Подробнее об этом см. 3/1999, стр. 30-31 - прим. ред.)
Частотные дифференциальные слуховые пороги
Частотная разрешающая способность слуха может быть определена путем прямых экспериментов: слушателю предъявляются два синусоидальных сигнала одинаковой интенсивности, и его просят менять частоту сигнала относительного опорного, пока он не услышит разницу по высоте. Эксперименты, выполненные для разных частот и разных уровней интенсивностей, позволили построить зависимости JND
(дифференциальных порогов) от частоты.
Частотная разрешающая способность может быть также оценена по минимальным изменениям частоты, замечаемым слухом при частотной модуляции. Область повышенной чувствительности наблюдается при частотах модуляции около 4%.
На рис.5 приведена зависимость от частоты дифференциальных частотных порогов f ( f/f 100%) для разных уровней громкости. Анализ кривых показывает, что пороги слышимости колебаний высоты тона зависят от частоты и интенсивности сигнала. В области частот до 1000 Гц при общем уровне звука 80 дБ f примерно составляет 3 Гц (в некоторых работах получены результаты до 1 Гц). Затем пороги начинают расти на 4000 Гц примерно до 10 Гц, выше определение различий по высоте резко уменьшается. Следует отметить, что слух замечает различие по высоте двух тонов при 3 Гц, но при этом при разнице частот до 15 Гц в суммарном звуке отчетливо слышны биения.
Как уже было отмечено в первой статье этого цикла (см. 6/1999), всего слуховая система различает 620 градаций высоты тона (140 градаций в диапазоне до 500 Гц и 480 градаций в диапазоне от500 Гц до 16 кГц), что открывает большие возможности для развития микротоновой и спектральной музыки.
Временное различение звука
44

Способность слуховой системы различать тонкие временные различия в структуре сигнала является в настоящее время основным предметом многочисленных исследований.
Причина этого заключается в том, что слуховой аппарат является принципиально нелинейной системой (как при больших, так и при малых уровнях сигнала), поэтому способность воспринимать различия параметров сигнала в частотной области не связана однозначно с восприятием временной структуры сигнала
(механизм преобразования звука в слуховом аппарате не определяется преобразованием
Фурье).
Именно этим можно объяснить тот факт, что акустические преобразователи
(громкоговорители, микрофоны, акустические системы и др.), даже имеющие частотные искажения на уровне порогов слышимости, не обеспечивают качества звучания, идентичного с живым звуком (что, вообще говоря, и является главным критерием для аппаратуры Hi-Fi).
По-видимому, какие-то различия во временной структуре сигнала, которые до настоящего времени еще четко не определены, являются значимыми для слуховой системы, и именно по ним она определяет живое звучание или отличает одну акустическую систему от другой. Способность различать тонкую, быстро изменяющуюся временную структуру звукового сигнала подтверждается удивительно точным анализом и распознаванием речи, когда в непрерывном временном потоке распознается специфическая структура различных фонем.
Исследования разрешающей способности слуховой системы во временной области проводятся в нескольких направлениях:
Прежде всего, необходимо было выяснить, каково минимальное время, в течение которого ухо способно различать два сигнала. Это время можно измерить, предложив обследуемому различить два сигнала, одинаковые во всех отношениях, за исключением времени поступления. Это означает, что наибольшая чувствительность к временному различению является оценкой наикратчайшего периода времени, в котором слух способен интегрировать энергию звука. Можно оценивать этот период времени как низший предел шкалы временной интеграции.
В экспериментах по исследованию остроты слуха использовались щелчки или тональные импульсы.
Оказалось, что характер задачи, поставленной перед обследуемым, крайне важен при измерении временных различий с помощью разных методов получают несколько различающиеся значения величин.
Допустим, что слушателю в быстрой последовательности подают два сигнала (высокий и низкий). Он способен ответить, поступает один или два следующих друг за другом сигнала, обнаружив разницу между началом сигналов в 2 мс. Эта величина не сильно зависит от частоты (временное различение даже обостряется для частот выше 1000 Гц), а также от интенсивности звука.
С другой стороны, ему необходимо время в 20 мс, чтобы определить, какой из сигналов поступает первым.
Если необходимо оценить смысловое значение звука (речи, например), то это время увеличивается еще до 35 мс. Как уже было отмечено в первой статье, для определения высоты тона также требуется определенное время: для низких частот

60 мс, для высоких15 мс.
Достаточно обученные слушатели способны идентифицировать быстрый ряд трехтональных раздражений, действующий в течение очень короткого периода 2…7 мс. При этом установлено, что на остроту временного слухового различения существенно влияют следующие факторы: число стимулов в ряду, каждый из которых должен быть обнаружен; способ подачи последовательных стимулов (раздельно или слитно); тип задачи, которую должен выполнить слушатель; степень его тренированности.
Следующей задачей было исследование дифференциальной чувствительности при воздействии звука с разницей в длительности dT.
Обследуемому предлагали два сигнала, один сигнал имел длительность Тмс, а другой несколько большую длительность (Т+dT)мс. Интервалы поступали в случайном порядке, а обследуемый должен был указывать на
45
интервал с большей длительностью сигнала. Наименьшую разницу, правильно определяемую в 75% случаев, принимали за JND (дифференциальный порог) для длительности dT.
Основной вывод заключается в том, что dT начинает уменьшаться по мере уменьшения общей длительности воздействия сигнала (т.е. чем короче сигналы, тем меньшее различие по времени между ними слух может заметить).
Как можно видеть на рис. 6, dT уменьшается от 50 мс при длительности сигнала 960 мс, приблизительно до
0,5 мс при длительности сигнала меньше 0,5 мс. Дифференциальная чувствительность, dT/T (которая называется дробью Вебера) не представляет собой константу, а изменяется по мере изменения длительности так, что она равна d T/T= 1 при Т= 0,5…1 мс, приблизительно 0,3 при Т=10 мc и 0,1 при Т=50…500 мс (Т длительность звукового сигнала). Результаты почти не зависят от ширины полосы и интенсивности звука.
Следующей важной проблемой было исследование чувствительности слуха к изменению времени установления (атаки) или спада сигнала. Время установления и спада звука является характерной особенностью различных музыкальных инструментов. Известно, что, меняя время атаки или спада сигнала, можно существенно изменить его тембр. У большинства музыкальных инструментов время атаки или спада лежит в пределах 5…360 мс.
Исследования дифференциальных порогов слуха для времени установления мс были выполнены для различных типов сигналов, и результаты, полученные для сигналов типа тональных посылок (прямоугольный импульс с синусоидальным заполнением) позволили установить, что дифференциальный порог для времени установления (как и для времени спада) для частот ниже 1000 Гц оказывается равным =1мс, для частот 1…10 кГц =0,5мс. Таким образом, изменения времени атаки и спада звукового сигнала, меньшие этих пределов, оказываются незаметными для слуха. Для реальных музыкальных сигналов эти пороги могут несколько отличаться в большую сторону за счет маскировки соседними звуками.
Разумеется, главной задачей современных исследований является установление слуховой чувствительности к тонкой временной структуре сигнала, в связи с чем особое внимание было уделено исследованиям дифференциальной слуховой чувствительности к фазовым искажениям. Изменения фазовых соотношений между спектральными составляющими сигнала существенно меняют его временную структуру. Однако на протяжении долгого времени, со времен Гельмгольца, считалось, что слух не чувствителен к фазовым соотношениям. Исследования последних лет показали, что это не соответствует действительности: изменения фазовых соотношений влияют на изменение тембра, четкость определения высоты музыкального сигнала и др.
В 80-е годы эти исследования привели к тому, что многие фирмы-производители Hi-Fi техники начали создавать аппаратуру с линейно-фазовыми характеристиками (в которых сигнал практически не претерпевал фазовых искажений), однако исследования Блауерта показали, что слух наиболее чувствителен к скорости изменения фазы, т.е. к групповому времени задержки (ГВЗ): гр=-d ( )/ .
В этих же исследованиях были установлены дифференциальные слуховые пороги для искажений ГВЗ (рис.7), которые для частоты 2000 Гц имеют минимальное значение 1 мс. Эти данные используются в настоящее время при проектировании высококачественной акустической аппаратуры искажения ГВЗ в них должны быть ниже установленных порогов.
Разумеется, полученные результаты не исчерпывают сложной проблемы установления порогов слуховой чувствительности к изменению временной структуры сигнала, и исследования в этом направлении продолжаются.
В заключение хотелось бы сказать о слуховой чувствительности к нелинейным искажениям, под которыми понимается появление в спектре звукового сигнала дополнительных спектральных составляющих. Это может явиться результатом компьютерной обработки или прохождения сигнала через электроакустический тракт.
Пороги слуховой чувствительности существенно зависят от характера нелинейности: при появлении низших
(второй, третьей) гармоник пороги слуха для тональных сигналов составляют 0,1%, для фортепианной музыки
1…2%, для эстрадной музыки до 7%. Чувствительность слуха зависит от порядка гармоник: заметность гармонических искажений третьего порядка вдвое выше, чем искажений второго порядка, заметность искажений от пятого порядка и выше в 6…10 раз выше, чем второго. Именно этим объясняется странное явление, что в акустических системах, имеющих в основном нелинейные искажения изших порядков, пороговые значения составляют 1…2%, в то же время в транзисторных усилителях и цифровой аппаратуре, где возникают нелинейные искажения высоких порядков, уровни нелинейных искажений должны составлять сотые и тысячные процента, чтобы они были незаметны для слуховой системы.
Как уже было отмечено выше, современные компьютерные технологии открывают очень широкие возможности при обработке звука, однако при всех видах обработки следует учитывать возможности слуховой системы, для чего и необходимы данные как по абсолютным, так и по дифференциальным слуховым порогам.
46

Часть 11. Аурализация - виртуальный звуковой мир
В статье "Научные результаты 108 конвенции AES" ("Звукорежиссер" №3/2000) мною было обещано сделать три вещи:
- передать CD-ROM c докладами конвенции в редакцию (что было выполнено);
- подробнее рассказать о принципиально новом направлении в создании пространственных звуковых полей компьютерной технологии аурализации (об этом в данной статье);
- познакомить с направлениями исследований в мировом центре компьютерной музыки и акустики IRCAM (а об этом в следующих номерах).
Итак, начнем с самого "горячего" направления в современной звукотехнике - "аурализации".
В одной из статей фирмы "Брюэль и Кьер" была высказана любопытная мысль, что отношения человека со звуком можно разбить на три крупных этапа:
I. От начала эпохи "человека разумного" до начала XX когда звук прошел эволюцию от средства чисто сигнального, необходимого для выживания, через средство коммуникации (речь) к средству эмоционального и эстетического воздействия, то есть к музыке.
К началу ХХ века музыка достигла невиданных высот, стала мощным средством передачи величайших глубин человеческой мысли и эмоций. Гениальные композиторы (Бах, Бетховен, Моцарт и др.)подняли музыкальное творчество на небыкновенную высоту, разработали особый язык (код), способный передавать не меньшее богатство мыслей и нюансов, чем письменная и устная речь (литература).
Человечество создало широкую палитру музыкальных инструментов, отработало вокальную технику, построило великолепные концертные залы, театры, соборы и др. Однако,эти величайшие достижения искусства были доступны очень ограниченному кругу людей лишь доли процента населения могли слушать хорошую "естественную" музыку в хороших "естественных" залах);
II. от начала ХХ века до 80-х годов с момента изобретения радио и телевидения музыкальное и вокальное искусство стало доступно миллионам, но, как всегда, при массовом тиражировании качество звука резко упало отставали технические средства. Главной задачей в тот период было передача смысловой (семантической) вербальной информации.
К середине века техника звукозаписи, воспроизведения и звукопередачи значительно выросла, и это позволило поднять проблему передачи эмоциональной и эстетической информации на новый уровень родилось движение Hi-Fi (high-fidelity, высокая верность воспроизведения), идеология которого состояла в том, чтобы акустическая аппаратура могла воспроизводить звук максимально похоже на натуральный "живой" источник. Постановка проблемы достоверной передачи звука в записи дала мощный толчок к развитию акустики и созданию крупной индустрии, производящей звукотехническую аппаратуру.
Современная акустика представляет мощное и развитое направление науки во всех странах мира, и имеет огромную промышленную базу: сотни научных институтов, тысячи фирм, разрабатывающих и производящих огромное разнообразие звукотехники:
- студийное оборудование микшеры, микрофоны, усилители, мониторы и т.д.;
- передающее оборудование радио- и телепередатчики;
- воспроизводящее оборудование акустические системы, проигрыватели, магнитофоны и др.
Объемы мирового производства например, громкоговорителей, достигают более 500 млн в год; акустические системы только на рынке США представлены З00 фирмами, выпускающими более3000 моделей) и т.д.
III. от 80 лет до настоящего времени. В начале 80-х известным акустиком проф.Олсоном (Olson) были сформулированы проблемы третьего этапа развития акустики "перенос атмосферы первичного поля в любое вторичное помещение прослушивания"
Сама постановка такой проблемы была бы в принципе невозможна без создания новой научной и технической базы развития цифровых компьютерных технологий обработки звука и соответствующих технических средств: звуковых процессоров, цифровых станций обработки, монтажа, редактирования, архивирования и т.д., цифровых магнитофонов и лазерных проигрывателей и т.д.
Разработка этой проблемы уже привела к развитию пространственных систем звукопередачи (Dolby, бинауральная стереофония и т.д.), появлению адаптивных цифровых процессоров, систем пространственного звуковоспроизведения Dolby Stereo, Dolby surround и др. Однако она потребовала решения целого ряда новых задач в области психоакустики, и привела к появлению новых направлений в цифровой акустике.
Одним из принципиальных этапов в решении этой проблемы было создание технологии аурализации.
Термин "аурализация" (auralization) появился несколько лет тому назад и еще не определился окончательно.
Его определение дал Мендель Клейнер (Mendel Kleiner) по аналогии с термином "визуализация" на конгрессе
AES в 1989году. Он звучит так:
47

"Аурализация процесс превращения звукового поля источника в пространстве в "слышимый звук" путем
физического или математического моделирования таким образом, чтобы смоделировать бинауральное
слуховое ощущение на заданной позиции моделируемого пространства".
Сейчас этой проблеме уделяется очень большое внимание в специальной литературе: появляется много научных статей и докладов, в том числе и на последнем конгрессе AES; разработаны специальные пакеты программ для реализации этой идеи; появились фирмы, которые специализируются на создании и внедрении таких программных продуктов, например, фирма Одеон, которая предложила свое определение:
"Аурализация искусство создания цифровых моделей бинауральных записей в несуществующих
помещениях".
Иначе говоря, аурализация - это способ воссоздать трехмерное звуковое поле, пытаясь с помощью
компьютерных программ повторить способы обработки звука, которые слуховая система применяет к
звуковому сигналу в помещении, чтобы создать ощущение пространства.
Необходимо отметить, что точное определение этого процесса пока еще не принято окончательно, а в русской технической литературе его вообще еще нет.
Нужно сказать, что трехмерное визуальное пространство удалось создать раньше, что нашло уже широкое применение в компьютерных играх, видеоклипах, системах обнаружения и др., поэтому моделирование трехмерного звукового пространства стало необходимым этапом, поскольку вместе они могут полностью воссоздать "пространственный виртуальный мир". К чему это приведет в ХХI веке сказать трудно…
Попробуем рассмотреть, что надо сделать с музыкальным сигналом, чтобы после его компьютерной обработки слушатель, находящийся при воспроизведении в любом помещении, воспринимал звуковое пространство таким же, как если бы он слушал музыку в реальном концертном зале.
По существу, задача ставится таким образом: как надо "обмануть" мозг, чтобы создать у слушателя ощущение трехмерного звукового пространства концертного зала вот для чего нужна психоакустика. Рис.1.
Рис.1. Общая структура системы
аурализации
Как уже было рассмотрено в предыдущих статьях по психоакустике (и еще будет рассмотрено в следующих), только два физических параметра сигнала воспринимаются нашей слуховой системой: интенсивность (т.е. энергия или звуковое давление), и время начало и конец сигнала, и его повторяемость во времени (периодичность или частота).
Человек "слышит" звук, воспринимая изменения величины звукового давления, воздействующие на его барабанную перепонку, во времени. Вся информация, которую мы получаем о звуке, содержится в звуковых волнах, являющихся сжатием-разрежением воздуха. Все остальное, что мы оцениваем в звуке: его громкость, высота, тембр, звуковое пространство, тонкие музыкальные нюансы и др. - это результат обработки его нашим слуховым аппаратом и мозгом.
Рассмотрим, что происходит, когда слушатель воспринимает звук в помещении.
Музыкальный инструмент (голос, оркестр и т.п.) создают определенный акустический сигнал, который представляет собой некоторую звуковую волну, с определенной зависимостью звукового давления от времени p1(t). Например, осциллограмма звучания мужского голоса при произнесении слова "sound" (записанная в заглушенной камере) показана на рис.2. Затем этот сигнал определенным образом изменяется помещением за счет отражений звуковых волн, процессов затухания, дифракции и т.д. Если рассматривать помещение как линейный фильтр, который имеет свои характеристики р.пом(t), то в каждой точке пространства суммарный сигнал получается как "свертка" сигнала источника и характеристик помещения (термином "свертка" называется результат обработки одного сигнала другим, например, в данном случае
48

Рис.2. Спектрограмма звука sound, записанная в
заглушенной камере
Наконец, голова и ушные раковины производят свою обработку звукового сигнала (см. "Звукорежиссер",
№10/1999). Пример осциллограммы того же самого звука после обработки его помещением и слуховой системой в левом и правом ушах показан на рис.3.
Рис.3. Спектрограмма звука sound, снятая на двух
входах в ушной канал в помещении
Таким образом, чтобы вызвать такие же ощущения у слушателя, надо сделать следующее: записать оригинальный звуковой источник, изменить программно его импульсную характеристику (или спектр) так, как это делает заданное помещение
(концертный зал, собор или подвал), а затем произвести его фильтрацию аналогично тому, как это происходит в ушных раковинах и голове. После того как это сделано, можно воспроизвести эти сигналы, например, через головные телефоны, и получить ощущение того, что слушатель находится в реальном трехмерном акустическом пространстве вместе с источником звука (певцом, музыкантом, оркестром) см. рис.4 .
Рис.4. Схема обработки сигнала
Процесс формирования звуковых сигналов при аурализации проходит следующие последовательные стадии:
- моноуральная запись источника звука обычно записи делают в заглушенной камере,но допустимо и в полузаглушенных помещениях,если запись делается там, где отражения не являются определяющими.
Расстояние для записи выбирается обычно 1 м на оси. Уровень записи должен соответствовать среднему уровню данного источника звука при естественном звучании. Допускается использование синтезированных музыкальных записей, а также различных банков семплов.Это дает возможность прослушать, как в данном помещении, существующем или желаемом, будут звучать различные виды музыки.
- создание компьютерных моделей звукового поля в помещении как известно из архитектурной акустики, при прослушивании любого звукового источника в помещении к слушателю поступает прямой звук и его многочисленные отражения от стен, потолка, пола и др. (рис.5). Для расчета структуры этих отражений в помещениях различной формы и размеров, с различными поглощающими или отражающими материалами и конструкциями, мебелью, элементами декораций и др., используются пакеты программ, построенные как на приближенных методах геометрической акустики (лучевой метод или метод мнимых источников),так и на более точных методах волновой акустики (МКЭ, МГЭ и др.).
Рис.5. Структура отражений в помещении
49

Если записать микрофоном звуковой сигнал, например, короткий импульс, воспроизведенный через акустическую систему установленную в помещении, то сигнал в любой точке помещения будет иметь вид ,показанный на рис.6, т.е. наряду с прямым сигналом в данную точку приходят ранние дискретные отражения, затем число их увеличивается, и процесс приобретает сплошной характер. Важнейшей характеристикой этого реверберационного процесса является время реверберации Тс, т.е. время, в течение которого сигнал затухает на 60 дБ.
Рис.6. Структура реверберационного
процесса в помещении
Время реверберации, структура ранних отражений, характер затухания их на последнем этапе и др. вызывают у слушателя субьективное ощущение размеров пространства, полноты звука, ясности, тембра и др. параметров, по которым отличается акустически хороший зал от плохого. (О связях обьективных параметров реверберационного процесса и субьективных ощущениях акустики залов получено за последнее время много новых результатов ).
Таким образом для определения импульсных характеристик помещения (под импульсной характеристикой понимается реакция системы на воздействие в виде короткого импульса) можно произвести измерения микрофоном в разных точках пространства, а можно, задав геометрические размеры помещения, поглощающие свойства его стен, потолков и др., рассчитать его для любой точки помещения, что и делается в программах аурализации.
- определение бинауральных импульсных характеристик помещения(BRIR) после того как звуковой сигнал, созданный источником звука, изменен помещением (т.е. к прямому сигналу добавлены его отражения), он обрабатывается двумя слуховыми приемниками, и только после этого он поступает на барабанную перепонку и проходит дальнейшие стадии обработки в периферической слуховой системе и в высших отделах мозга.
Импульсные характеристики, которые получаются на входе левого и правого слуховых каналов, называются бинауральными импульсными характеристиками помещения BRIR (binaural room impulse response).
Эти функции BRIR несут в себе всю необходимую информацию: о положении и свойствах источника звука, о свойствах помещения и свойствах приемника звука, то есть обо всех процессах обработки звука, которые происходят в голове, ушных раковинах и др.
Для того чтобы описать эти свойства приемника (т.е. головы и ушных раковин), используются передаточные
HRTF (АЧХ и ФЧХ) или импульсные функции слуховой системы - HRIR.
Для определения этих передаточных функций обычно используют библиотеки уже выполненных измерений
АЧХ и ФЧХ внутри слухового канала на моделях "искусственной головы" в заглушенной камере при разном расположении источника вокруг головы (Рис.7). Вид передаточных функций существенно меняется (особенно в области частот 5…16 кГц) в зависимости от положения источника в вертикальной и горизонтальной плоскости и по глубине по отношению ко входу в левый и правый слуховые каналы головы. Иначе говоря, ушные раковины, голова и торс действуют как частотно-зависимые дифракционные фильтры. Физические причины этого были рассмотрены в статье о бинауральном слухе (№10/1999).
50

Рис.7. Схема записи передаточных функций слуховой системы при разных положениях источника
В результате для воссоздания пространственного звукового образа необходимо ввести в компьютер следующую информацию:
- выбор источника сигнала: музыка, речь, пение и т.п. Это может быть запись в полузаглушенном или заглушенном помещении или синтезированный сигнал;
- выбор помещения, в которое "помещается" этот источник звука. Могут быть заданы параметры известного помещения или помещения, которое еще предстоит построить;
- положение источника звука в помещении на сцене, на полу, в любой другой точке;
- положение слушателя в каком-либо месте помещения в партере, на балконе и т.д.
Для реализации "виртуального звукового образа" созданы пакеты компьютерных программ. Наиболее известны программы фирм Оdeon и САТТ, которые последовательно выполняют следующие операции (Рис.8):
- вводят свойства источника звука из библиотеки записанных или синтезированных звуков в моноварианте;
- производят расчет структуры звукового поля в заданном помещении и вычисляют импульсную характеристику в заданных точках расположения правого и левого ушей слушателя;
- используют из заранее составленной библиотеки значения передаточных функций головы, соответствующих данному положению источника и слушателя;
- производят "свертку", т.е. последовательную обработку фильтрацию сигнала источника с помощью импульсных характеристик помещения и импульсных (передаточных) характеристик головы.
Рис.8. Структура алгоритма
Полученные стереосигналы подают на головные телефоны это дает возможность слушателю почувствовать, что он находится на определенном месте внутри зала, и звук окружает его со всех сторон. При смене положения слушателя или источника производится пересчет передаточных функций.
Как уже было показано в статье, посвященной бинауральному слуху, для нашей слуховой системы существует несколько наиболее важных признаков, по которым она определяет пространственное положение источника.
Для локализации в горизонтальной плоскости основное значение имеет разница по времени прибытия сигнала в правое и левое уши, и разница по интенсивности за счет дифракции на голове. Для определения глубины важна разница в уровне звукового давления и разница в спектральном составе, а для локализации в вертикальной плоскости разница в форме АЧХ и ФЧХ за счет дифракции на ушной раковине. Измеренные
51
значения передаточных функций несут в себе всю необходимую для слуховой системы информацию о локализации источника. Разумеется эти значения передаточных функций сделаны для некоторых усредненных параметров головы и ушных раковин это вносит определенную погрешность, т.к. каждый человек имеет некоторые индивидуальные особенности. Но, во-первых, исследования показали, что погрешности не слишком велики, а, во-вторых, уже созданы компьютерные модели ушной раковины, в которых можно учесть индивидуальные параметры слушателя. Таким образом, компьютерная модель обработки звука, аналогичная работе бинауральных слуховых приемников, должна включать последовательный ряд следующих моделей:
Моноуральная запись => расчет структуры реверберационного процесса (в т.ч. ранние отражения) => модель локализации в вертикальной плоскости (эхо на ушной раковине) => модель локализации глубины
(реверберация, громкость) => азимутальная модель локализации (временная и интенсивностная) => выход на левый и правый канал стереотелефонов.
Техника аурализации стремительно развивается - на последней 108-й конвенции AES в Париже было несколько докладов и демонстраций, посвященных программам аурализации с учетом движения головы
(система BRS), которая позволяет при поворотах или подъеме головы пересчитать соответствующие параметры звукового поля и дает возможность услышать в наушниках, как соответственно перемещается источник звука в пространстве. Для этого нужен постоянный мониторинг (система обратной связи), которая отслеживает движение головы и пересчитывает соответствующие бинауральные импульсные характеристики.
Существуют разные системы обратной связи, с помощью которых это можно делать: от простейших инфракрасных датчиков, с использованием которых уже давно выпускаются стереотелефоны, до сложных и дорогостоящих систем обратного контроля. Когда эта технология окончательно созреет, качество систем пространственного звуковоспроизведения перейдет на новый уровень.
На 108-й конвенции AES были представлены специальные демонстрационные системы фирмы Studer, когда слушатель мог через мониторы сначала прослушать пространственный звук, который при этом перемещался от одной акустической системы к другой (в комнате были установлены передние, задние, боковые и центральные системы). Затем с помощью компьютерной системы аурализации производилось прослушивание записей через головные телефоны с системой обратной связи.
При этом можно было услышать полную пространственную картину внешнего окружающего звукового поля, которое перемещалось при повороте головы это действительно впечатляет!
Конечно, хотелось бы использовать в системах аурализации не только головные телефоны, но и иметь возможность прослушивать обработанные записи через акустические системы. Однако для этого надо решить еще несколько дополнительных проблем: во-первых, вторичное помещение накладывает свое реверберационное поле, что в данном случае является помехой, ведь вся необходимая информация о помещении уже закодирована в сигнале. Во-вторых, сигналы от левого канала попадают не только на левое ухо, но и на правое, т.е. возникают перекрестные связи, которые разрушают звуковой образ.
В настоящее время активно развивается техника бинауральной стереофонии, в которой необходимо решение тех же проблем. За последние годы разработаны различные методы проектирования бифонических процессоров, которые реализуют подавление перекрестных связей в реверберирующих помещениях; и адаптивных процессоров, которые могут подавлять отражения во вторичном помещении. Правда, осталась проблема расширения зоны прослушивания, так как пока удается это сделать для фиксированной позиции слушателя. (О бинауральной стереофонии постараюсь рассказать в дальнейшем). Когда будет достигнут прогресс и этих направлениях, можно ожидать, что появится возможность прослушивания через акустические системы. Следует отметить, что достаточно будет двух акустических систем для левого и правого каналов для воссоздания пространственного звучания это-то и заманчиво!
Новую технологию компьютерного создания пространственных звуковых полей "аурализацию" несомненно, ожидает много применений:
- в архитектурной акустике-для оценки акустических свойств различных существующих залов и моделирования еще не построенных помещений, для оценки влияния различных элементов звукопоглощающих конструкции на качество звучания, в том числе и студий звукозаписи, для проектирования систем звукоусиления и др.;
- в технике звукозаписи открывается много новых возможностей для звукорежиссеров в создании пространственных эффектов, совершенствовании систем пространственной звукопередачи;
- в системах мультимедиа для создания "виртуальных реальностей" как видео-, так и звуковых и не только в компьютерных играх;
- для обучения музыкантов, певцов, артистов для получения возможности предварительного прослушивания различных видов исполнения в залах с разной акустикой;
- для тренировки слепых в распознавании и локализации источников звука;
- в постановке научных экспериментов, в частности, в психоакустике;
- в системах обнаружения и распознавания различных источников сигнала в пространстве (в авиации и др.)
По мере развития этой технологии, несомненно, появятся новые применения. Хотелось бы пожелать, чтобы она нашла себе широкое применение и в отечественной звукотехнике.
52

1   2   3   4   5   6   7   8   9   ...   22

перейти в каталог файлов
связь с админом