Мультимедиа

19.06.2020

Звук является наиболее выразительным элементом мультимедиа. Мир звуков окружает человека постоянно. Мы слышим шум прибоя, шелест листвы, грохот водопадов, пение птиц, крики зверей, голоса людей. Всё это – звуки нашего мира.

История этого элемента информации для человека такая же древняя, как и предыдущие (текст, изображение). Первоначально человек создал устройства, с помощью которых он пытался воспроизвести природные звуки для своих практических целей, в частности для охоты. Потом звуки в его голове стали складываться в некую последовательность, которую захотелось сохранить. Появились первые музыкальные инструменты (один из древнейших – китайский крин). Постепенно шел процесс формирования языка, на котором можно было бы записать и тем самым надолго сохранить рожденные мелодии. Первые попытки разработки такого «музыкального алфавита» были предприняты ещё в Древнем Египте и Месопотамии. А в том виде, в котором мы знаем её сейчас (в виде нотной записи), система фиксации музыки сложилась к XVII веку. Её основы были заложены Гвидо д’Ареццо.

Одновременно шло совершенствование систем записи и хранения звука. Человек научился сохранять и воспроизводить не только музыку, но и любые окружающие звуки. Впервые звук был записан в 1877 году на фонографе, изобретенном Томасом Эдисоном. Запись имела вид углублений на бумажном листе, закрепленном на вращающемся цилиндре. Эдисон первым научил свою машину громко отвечать «алло» в микрофон. Это слово раздавалось, когда игла, соединенная с микрофоном, повторяла сделанную на бумаге запись. Механико-акустический метод звукозаписи просуществовал вплоть до 1920-х годов, пока не были изобретены электрические системы. Практическому применению звукозаписи способствовало также два революционных изобретения:

· изобретение пластмассовой магнитной ленты в 1935 году;

· бурное развитие микроэлектроники в 60-е годы.

Бурное развитие вычислительной техники придало этому процессу новый импульс для развития. Мир звуков постепенно соединялся с цифровым миром.

В звуковых платах существует два основных метода синтеза звука:

таблично-волновой синтез (WaveTable, WT), основанный на воспроизведении сэмплов – заранее записанных в цифровом виде звучаний реальных инструментов. Большинство звуковых плат содержит встроенный набор звучаний инструментов, записанных в ПЗУ, некоторые платы допускают использование записей, дополнительно загружаемых в ОЗУ. Для получения звука нужной высоты применяют изменение скорости воспроизведения записи, сложные синтезаторы применяют для воспроизведения каждой ноты параллельное проигрывание разных сэмплов и дополнительную обработку звука (модуляцию, фильтрацию).

Достоинства : реалистичность звучания классических инструментов, простота получения звука.

Недостатки : жесткий набор заранее подготовленных тембров, многие параметры которых нельзя изменить в реальном времени, большие объёмы памяти для сэмплов (иногда до сотен Кб на инструмент), неодинаковое звучание разных моделей синтезаторов из-за различающихся наборов стандартных инструментов.

частотная модуляция (Frequency Modulation, FM) – синтез, основанный на использовании нескольких генераторов сигнала с взаимной модуляцией. Каждый генератор управляется схемой, регулирующей частоту и амплитуду сигнала и представляющей собой базовую единицу синтеза – оператор. В звуковых платах применяется двухоператорный (OPL2) и четырехоператорный (OPL3) синтез. Схема соединения операторов (алгоритм) и параметры каждого оператора (частота, амплитуда и закон их изменения во времени) определяют тембр звучания. Число операторов и схема управления ими задают максимальное количество синтезируемых тембров.

Достоинства : не надо заранее записывать звуки инструментов и хранить их в ПЗУ, велико разнообразие получаемых звучаний, легко повторить тембр на различных платах с совместимыми синтезаторами.

Недостатки : трудно обеспечить достаточно благозвучный тембр во всем диапазоне звучания, имитация звучания реальных инструментов крайне грубая, сложно организовать тонкое управление операторами, из-за чего в звуковых платах используется упрощенная схема с небольшим диапазоном возможных звучаний.

Если в композиции нужен звук реальных инструментов, лучше подходит метод волнового синтеза, для создания же новых тембров более удобен метод частотной модуляции, хотя возможности FM-синтезаторов звуковых плат достаточно ограничены.

Нередко понятие «мультимедиа» (вообще, весьма противоречиво трактуемый термин) описывают как представление информации в виде комбинации текста, графики, видео, анимации и звука. Анализируя этот список, можно сказать, что первые четыре компонента (текст, графика, видео и анимация) - это различные варианты отображения информации графическими средствами, которые принадлежат к одной среде (а не ко «многим средам», или multimedia), а именно - к среде визуального восприятия.

Так что по большому счету говорить о мультимедиа можно только в том случае, когда к средствам воздействия на органы зрения добавляется аудиосоставляющая. Конечно, в настоящее время известны компьютерные системы, которые способны воздействовать также и на тактильное восприятие человека и даже создавать запахи, присущие тем или иным визуальным объектам, однако пока эти приложения либо имеют узкоспециализированное применение, либо находятся в зачаточной стадии. Поэтому можно утверждать, что сегодняшние мультимедиа-технологии - это технологии, которые нацелены на передачу информации, воздействуя в основном на два канала восприятия - зрение и слух.

Поскольку в описаниях мультимедийных технологий на страницах печати аудиосоставляющей несправедливо уделяется значительно меньшее внимание, чем технологиям передачи графических объектов, мы решили восполнить этот пробел и попросили рассказать о том, как создается аудиоряд для мультимедийного контента, одного из ведущих российских специалистов в области цифровой звукозаписи - Сергея Титова .

КомпьютерПресс: Итак, можно сказать, что понятия «мультимедиа» не существует без звуковой составляющей. Сергей, не могли бы вы рассказать, как создается именно эта часть мультимедийного контента?

Сергей Титов: В принципе, около 80% всей информации о внешнем мире мы воспринимаем с помощью зрения и менее 20% - с помощью слуха. Однако без этих 20% обойтись невозможно. Существует достаточно много мультимедийных приложений, где звук стоит на первом месте и именно он задает тон всему произведению. Например, чаще всего видеоклип делают под конкретную песню, а не пишут песню под видео. Поэтому в выражении «аудиовизуальный ряд» именно слово «аудио» стоит на первом месте.

Если говорить о звуковой составляющей мультимедиа, то здесь есть два аспекта: с точки зрения потребителя и с точки зрения создателя. По всей видимости, для компьютерного журнала интересен именно аспект создания мультимедиа-контента, поскольку он как раз и создается с помощью компьютерной техники.

Говоря о средствах создания аудиоконтента, следует отметить, что процесс производства требует принципиально более высокого разрешения при записи файлов, чем для стадии потребления, и соответственно необходима техника более высокого качества.

Тут можно провести аналогию с графикой: дизайнер может впоследствии представить картинку в низком разрешении, например для публикации в Интернете и при этом отбросить часть информации, но процесс разработки и редакции неминуемо ведется с учетом всей доступной информации, причем разложенной по слоям. То же самое происходит и при работе со звуком. Поэтому даже если мы говорим о любительской студии, то, как минимум, должны говорить о технике полупрофессионального уровня.

Говоря о разрешающей способности системы, мы на самом деле имеем в виду два параметра: точность измерения амплитуды сигнала и частоту квантования, или Sampling Rate. Иначе говоря, мы можем измерять амплитуду выходного сигнала очень точно, но делать это очень редко и в результате потерять большую часть информации.

КП: Как же происходит процесс создания звукоряда?

С.Т.: Любая звуковая картина создается из некоторых составляющих элементов. Как диджей на дискотеке оперирует неким набором исходных составляющих, из которых он выстраивает непрерывную программу, так и человек, занимающийся озвучиванием чего-либо, имеет некие исходные материалы, которые он редактирует и сводит в готовую картину. Если речь идет о музыке в чистом виде, то вначале стоит задача зафиксировать эти элементы, а потом собрать их в единую картину. Это, в общем, и называется сведением.

Если речь идет об озвучивании некоторого видеоряда (собственно, здесь и можно говорить о мультимедийном контенте), то вам необходимо собрать элементы, из которых состоит звуковое сопровождение, а затем уже «привязать» их к картинке, отредактировать эти элементы и привести во взаимное соответствие; при этом отдельные элементы, о которых идет речь, необходимо расположить в виде, удобном для работы.

Компьютерные программы создают интерфейс, где имеются те же дорожки и микшер с линеечкой. Под каждой из этих линеечек находится свой элемент, который подвергается тем или иным модификациям. Таким образом, мы создаем некоторое синтезированное звуковое поле, оперируя имеющимися элементами, а поскольку задача эта в принципе творческая, то мы должны иметь возможность модифицировать эти элементы с помощью тех или иных видов обработки - от простой редакции (порезать, отсортировать, поклеить) до сложной, когда отдельные элементы могут удлиняться или укорачиваться, когда можно поменять характер звучания каждого сигнала.

КП: Какое же программное обеспечение нужно, чтобы выполнить эту работу, и какое необходимо специальное компьютерное оборудование?

С.Т.: Специальное компьютерное оборудование - это, по сути дела, лишь плата ввода-вывода, хотя определенные требования, конечно, предъявляются и к другим системам рабочей станции. Программное обеспечение для организации процесса звукозаписи и монтажа существует в огромном количестве: от дешевых любительских до полупрофессиональных и высокопрофессиональных систем. Большинство из этих программ имеют plug-in-архитектуру, требуют высокой производительности от компьютера и достаточно мощных подсистем дисковой памяти. Дело в том, что для решения мультимедийных задач в целях производства, а не воспроизводства контента требуются машины с большим объемом RAM и мощным процессором. Наиболее значимым параметром здесь является не столько высокая мощность процессора, сколько хорошая сбалансированность машины с точки зрения работы дисковых подсистем. Последние, как правило, являются SCSI-устройствами, которые предпочтительны в том случае, когда приходится оперировать потоками данных, которые не должны прерываться. Поэтому IDE-интерфейсы практически не применяются. У IDE может быть очень высокая скорость пакетной передачи данных (burst transfer rate) и при этом низкая скорость потоковой передачи данных (sustain transfer rate).

При этом IDE-интерфейс предусматривает, что диск может отдавать данные, накапливая их в буфер, а потом уже выкачивать из буфера. SCSI устроен по-другому, и если даже скорость пакетной передачи невысока, то скорость потоковой передачи все равно будет высокой.

Необходимо также отметить, что для вышеупомянутых задач требуются весьма большие объемы дискового пространства. Я приведу простой пример - 24-разрядный монофайл даже при низких значениях sampling rate, например 44,1 кГц, занимает 7,5 Мбайт на трек в минуту.

КП: Нет ли какой-то технологии, чтобы хранить эти данные более компактно?

С.Т.: Это линейный PCM (Pulse Code Modulation), который никак не сожмешь. Он может потом ужаться в MP3, например, но не на этапе производства, а на этапе распространения. На этапе производства мы обязаны работать с линейными, некомпрессированными сигналами. Вновь приведу аналогию с Photoshop. Для того чтобы выстроить графическую композицию, дизайнер обязан иметь полное представление о том, что у него хранится в каждом слое, иметь доступ к каждому слою и корректировать его отдельно. Все это приводит к тому, что формат PSD Photoshop занимает приличный объем, но позволяет в любой момент вернуться и внести исправления в каждый слой, не затронув при этом все остальные. В тот момент, когда картинка полностью выстроена, ее можно представлять в другом формате, сжимать с потерями или без потерь, но, я повторяю, только тогда, когда этап производства полностью завершен. То же происходит и со звуком - свести звуковую композицию можно, только имея полную информацию обо всех составляющих сигнала.

Как я уже говорил, для создания звуковой картины нужна исходная библиотека, соответствующая той задаче, над которой вы работаете. Следовательно, видеопродюсеру в большей мере нужны предзаписанные разнообразные шумы и эффекты, а диджею - так называемые петли (повторяющиеся элементы, характерные для танцевальной музыки). Весь этот материал должен храниться в виде файлов, понятных для соответствующей программы, которая с ними работает. Далее необходима акустическая система, для того чтобы все это контролировать, а программа соответственно должна давать возможность манипулировать этим исходным материалом, в чем, собственно, и заключается креативная часть процесса. Пользуясь компьютерной системой как средством ввода-вывода и программой как инструментом, пользователь в соответствии со своим внутренним чутьем редактирует исходный материал: увеличивает или уменьшает громкость отдельных элементов, изменяет тембральную окраску. В результате процесса микширования звукорежиссер должен получить сбалансированную звуковую картину, которая бы имела определенную эстетическую ценность. Как вы видите, аналогия с графикой заметна даже на терминологическом уровне. И будет ли эта картина чего-то стоить, целиком зависит от опыта, вкуса, таланта этого звукорежиссера (конечно, при условии наличия качественной техники).

КП: До сих пор мы имели в виду чисто звуковую картину, однако, говоря о мультимедиа, необходимо рассмотреть, какие существуют средства, чтобы свести воедино звук и изображение. Что для этого нужно?

С.Т.: Разумеется, нужна плата ввода-вывода видео, например имеющая выходной формат MPEG или Quick time (если говорить о мультимедиа, то Quick time будет удобнее).

КП: Я полагаю, было бы интересно рассмотреть ряд практических задач по озвучиванию видеоряда и на конкретных примерах выяснить, какое оборудование и какое программное обеспечение требуется для задач различного уровня сложности. Начать можно было бы с анализа вариантов создания недорого презентационного фильма…

Например, давайте рассмотрим такой случай: имеется видеофильм, снятый любительской камерой, и на микрофон этой камеры уже записаны реплики и диалоги. Теперь нам нужно на основе этого сделать привлекательный презентационный фильм с полупрофессиональным озвучиванием. Что для этого понадобится?

С.Т.: Если перед нами стоит задача добиться определенного восприятия звукового материала (будь то даже любительский фильм), к исходному материалу нужно добавить многое: необходимы звуковые эффекты, фоновая музыка, так называемые бэкграундные шумы (от англ. background - фон, задний план) и прочее. Поэтому в любом случае возникает необходимость иметь одновременно звучащими несколько дорожек, то есть читать одновременно несколько файлов. При этом у нас должна быть возможность регулировать в процессе производства характер тембра этих файлов и редактировать их (удлинять, укорачивать и т.п.).

Важно отметить, что система должна обеспечивать возможность эксперимента, так чтобы пользователь мог посмотреть, подходит ли данный эффект по звучанию к данному месту. Система также должна позволять точно совмещать звуковые эффекты со звуковым контекстом, регулировать панораму (если речь идет о стереозвуке) и так далее…

КП: Ну что же, задача ясна, и требования к оборудованию понятны… Теперь хотелось бы получить представление о том, какое конкретно оборудование и какое программное обеспечение можно порекомендовать для решения подобной задачи и в какую примерно сумму это обойдется пользователю.

С.Т.: В принципе, нам нужен какой-то видеоредактор, но это, как я понимаю, отдельная тема, а сегодня мы должны сконцентрироваться именно на звуковой составляющей. В любом случае в той задаче, которую вы описали выше, звуковой ряд подчинен видеоряду. Поэтому будем считать, что видеоряд у нас имеется, и не станем анализировать, каким образом он отредактирован. Рассматриваем исходный вариант, когда есть чистовой видеоряд и черновой аудиоряд. В этом черновом аудиоряде нужно какие-то реплики вычеркивать, какие-то заменять новыми и так далее. Неважно, идет ли речь о презентационном фильме или об игровом любительском, - нам будет необходимо вставлять в него некоторые искусственные аудиоэффекты. Это связано с тем, что звук от многих событий в кадре, записанный с помощью микрофона видеокамеры, будет звучать, как говорится, неубедительно.

КП: А где же еще взять эти звуки, как не с реально снятых событий?

С.Т.: Это - целое направление, называемое sound design, которое заключается в создании таких звуков, которые, будучи воспроизведены, давали бы убедительную звуковую картину с учетом особенностей восприятия звуков зрителем. Кроме того, есть так называемое драматургическое подчеркивание в картине тех или иных звуков, которые на самом деле звучат по-другому. Конечно, если мы говорим о любительском кино и о полупрофессиональном озвучивании, то некоторые возможности оказываются урезанными, но задачи перед нами и в этом случае стоят те же, что и перед профессионалами.

В любом случае, помимо редакции черновика, необходимо добавлять какие-то спецэффекты.

КП: Итак, какое же оборудование нам нужно для решения этой задачи?

С.Т.: Еще раз подчеркиваю, что мы говорим о полупрофессиональном уровне, то есть о производстве любительского фильма в домашних условиях или производстве фильмов для студий кабельного телевидения, что, в общем, близкие задачи. Для того чтобы решить большинство задач такого постпродакшна, нужна машина Pentium III - 500 МГц, желательно 256 RAM, дисковая подсистема SCSI; видеоподсистема особой роли не играет, но желательно, чтобы там были установлены какие-то аппаратные декодеры компрессированного видео; соответственно нужна плата ввода-вывода, для самых простейших любительских работ это может быть SoundBlaster. Как сравнительно дешевый комплекс можно рассмотреть программный продукт Nuendo, который будет работать практически с любой платой и, например, дешевый SoundBlaster за 150 долларов. Конечно, здесь сразу нужно сказать, что такая система будет иметь весьма ограниченные возможности вследствие низкого качества платы SoundBlaster, которая имеет очень невысокого качества микрофонные усилители и весьма плохого качества АЦП/ЦАП.

КП: Хотелось бы услышать, что же позволяет делать Nuendo?

С.Т.: Nuendo - это программный комплекс, который имеет plug-in-архитектуру и предназначен для решения задач аудиопроизводства, причем ориентирован именно на задачи создания «аудио для видео», то есть, можно сказать, предназначен как раз для решения мультимедийных задач. Программа работает со звуком и с изображением одновременно, при этом изображение для нее является вторичной составляющей. Nuendo работает и под Windows NT, и под Windows 98, и под BE OS. Стоит эта программа 887 долл.

Программа предоставляет возможность просмотра видеоизображения, разложенного во времени, и многодорожечную систему для редактирования и сведения звуковой картины.

Особенностью программного комплекса является его гибкость, и работать можно на широком спектре недорогого железа. Распространено мнение, что серьезные системы работают только на оборудовании со специализированными DSP-сопроцессорами. Программное обеспечение Nuendo доказывает обратное, поскольку не только предоставляет инструменты для профессионального аудиопродакшна, но и не требует для своих нужд специализированного железа и специальных сопроцессоров.

Nuendo предоставляет 200 дорожек для микширования , поддерживает surround-звук таким образом, что многие системы по сравнению с Nuendo выглядят весьма бледно.

Nuendo предоставляет качественный процессинг в режиме реального времени на том же процессоре, на котором работает сама рабочая станция. Конечно, скорость процессинга будет зависеть от выбранной рабочей станции, но достоинство программы именно в том, что она адаптируется к разным мощностям процессора. Еще несколько лет назад серьезный аудиопроцессинг был немыслим без DSP. Но сегодня настольные компьютеры обладают достаточно мощными собственными процессорами для решения задач процессинга в режиме реального времени. Очевидно, что возможность использовать обычный компьютер для решения специфических задач, обходясь без DSP-сопроцессоров, добавляет системе гибкость.

Nuendo - это объектно-ориентированная система (то есть система, которая оперирует объектами-метафорами: пульт, индикатор, дорожка и т.д.), которая позволяет легко и в полной мере осуществлять редактирование аудиофайлов в проектах различной сложности, предоставляя очень удобный и продуманный интерфейс. Средства drag-and-drop доступны при решении различных задач и особенно интенсивно используются при обработке кроссфейдов.

Важной особенностью программы является практически неограниченная система Undo & Redo функций редактирования. Nuendo предоставляет не просто операции Undo & Redo: каждый из аудиосегментов имеет свою собственную историю редактирования, причем система организована таким образом, что после нескольких сотен изменений Undo & Redo максимальный объем файла, требуемый для хранения сегмента, никогда не увеличивается более чем вдвое по сравнению с первоначальным объемом.

Одной из самых сильных сторон программы является возможность поддержки surround-звука . Система имеет не только совершенный инструмент для редактирования положения источника звука, но и поддерживает многоканальные surround-эффекты.

КП: К чему сводятся действия пользователя этой программы в процессе озвучивания?

С.Т.: Мы прослушиваем тот саундтрек, который у нас уже есть, и смотрим, какую информацию нам нужно удалить, а какую - отредактировать.

КП: Если мы говорим о любительском фильме, то сколько дорожек нам может понадобиться?

С.Т.: По моему опыту, это 16-24 дорожки.

КП: Что же можно разместить на таком огромном количестве дорожек?

С.Т.: Считайте сами: одну дорожку занимают черновики, вторую - спецэффекты, третью - закадровая музыка, причем это не только музыка, но и диалоги, комментарии и прочее. Когда все это собирается вместе, то получается как раз такое количество дорожек.

К тому же 16 или даже 24 дорожки - это относительно небольшое число. В профессиональных фильмах их количество может перевалить далеко за сотню.

КП: Какие еще варианты вы могли бы порекомендовать для полупрофессионального применения, скажем, для того же озвучивания презентационного фильма в домашних условиях?

С.Т.: Доступный по цене вариант, который я бы предложил рассмотреть, - это комбинация платы DIGI-001 и программы Pro Tools 5 LE. Данный вариант существенно лучше по качеству платы ввода-вывода и несколько беднее по софту.

В настоящее время существует версия под Mac OS и буквально на днях выходит версия под Windows NT (надеюсь, что к моменту выпуска этого журнала Windows-версия данной программы появится и в России). Аппаратная часть для Windows и для Mac OS абсолютно одинакова.

КП: Можно ли сказать, что после появления версии под Windows это будет более дешевым решением в силу того, что сама рабочая станция будет стоить дешевле?

С.Т.: Заблуждение, что PC-станция для озвучивания стоит дешевле, чем решение на базе Macintosh, весьма распространено. Но и мнение о том, что есть дешевые станции на базе PC и дорогие на базе Macintosh, неверно. Есть конкретные системы для решения конкретных задач, и дело в том, что подчас построить систему на базе PC для решения вопросов, связанных с созданием мультимедийного контента, весьма непросто, поскольку из случайного набора дешевых IBM-совместимых частей очень трудно собрать машину, которая бы давала оптимальную производительность…

Вне зависимости от типа рабочей станции, которая будет работать в системе, DIGI 001 будет предоставлять гораздо более широкие возможности, чем SoundBlaster, а стоит плата вместе с «математикой» Pro Tools 5.0 LE всего 995 долл., то есть в сумме примерно столько же, сколько и предыдущее решение с самым дешевым SoundBlaster’oм.

При этом если решение Nuendo плюс SoundBlaster - это вариант, в котором возможности ограничены дешевой платой, а софт имеет весьма широкие возможности, то решение на базе DIGI 001 плюс Pro Tools 5.0 LE - это гораздо более мощная плата, а софт - несколько более скромный по своим возможностям, чем Nuendo. Чтобы было понятно, о чем идет речь, перечислим преимущества данного решения с точки зрения платы ввода-вывода. DIGI 001 - это 24-разрядный АЦП-ЦАП, возможность одновременно прослушивать 24 дорожки, наличие на плате восьми вместо двух входов и т.д. Так что если, например, по ходу записи презентации нужно записывать сцену, в которой участвуют шесть человек, говорящих в шесть микрофонов, то DIGI 001 с такой задачей вполне справится. Прибавьте к этому независимый выход на мониторы плюс работу с 24-разрядными файлами, в то время как с Nuendo и дешевым SaundBlaster’ом вы сможете работать только с 16-разрядными файлами…

Pro Tools 5 LE позволяет делать практически то же, что и Nuendo, - осуществлять нелинейный монтаж, такие же манипуляции с аудиофайлами, плюс к этому имеется мини-секвенсор, который позволяет еще и музыку записывать, используя MIDI-инструменты.

КП: Так чем же отличаются профессиональные задачи от полупрофессиональных и какое для них требуется оборудование?

С.Т.: Прежде всего я мог бы рассказать о системе Pro Tools. Для того чтобы предупредить возможные вопросы, хочу еще раз подчеркнуть: необходимо различать Digidesign Pro Tools как торговую марку и Pro Tools как оборудование. Под торговой маркой Pro Tools скрывается целый спектр продуктов. Самая простая система из этого набора как раз и есть DIGI 001, о которой мы говорили при описании полупрофессиональных задач. Это самый простой вариант из целой линейки продуктов, которая заканчивается системами, работающими на базе десятков рабочих станций, завязанных в единую сеть.

КП: Давайте выберем такой вариант, который может быть применен для озвучивания несложных профессиональных фильмов, сериалов и так далее.

С.Т.: Следующая система, которую мы могли бы рассмотреть, - это Pro Tools 24 . Чтобы было понятно, какие задачи решает данная система, отметим, что последний сериал «Зена» был озвучен именно с помощью этой техники.

Имеются версии как для Mac OS, так и для Windows NT. Если говорить о требованиях к NT-станциям, то это должна быть серьезная машина, например IBM Intelli Station M PRO, 512 RAM. В документации утверждается, что минимальные требования к процессору - Pentium II 233, однако реально для работы нужно не меньше Pentium II 450 и, естественно, дисковая система SCSI, причем необходим двухпортовый акселератор, чтобы тянуть 64 дорожки одновременно.

Pro Tools 24 представляет собой набор специализированных плат сигнальных процессоров на базе Motorola. Важно отметить, что эта система базируется на сопроцессорах, то есть процессор машины выполняет работу, связанную с вводом-выводом и отображением графики на экране, а весь процессинг сигнала выполняется на специализированных сопроцессорах DSP (Digital Signal Processing). Это позволяет решать достаточно сложные задачи сведения. Именно такая технология применяется для озвучивания так называемых блокбастеров. Так, например, для озвучивания «Титаника» (только эффекты!) использовалась система из 18 рабочих станций, объединенных в сеть.

Звуковое сопровождение в фильмах, подобных «Титанику», - это потрясающе сложная, изменяющаяся во времени звуковая картина. Если проанализировать насыщенный звуками пяти-десятиминутный отрывок из подобного фильма и выписать все звуки, которые там использованы, получится список из сотни наименований. Конечно, все эти звуки не слышны с кассеты уровня VHS, и многие даже не подозревают, насколько сложная звуковая картина создается в фильме. (Причем большинство из этих звуков созданы синтетически и в природе не существуют.)

КП: Вы затронули вопрос о замене естественных звуков на более убедительные. Где можно приобрести такие библиотеки звуков и сколько они стоят?

С.Т.: Стоимость таких библиотек - от пятидесяти долларов и выше, вплоть до нескольких тысяч долларов. При этом все эти звуки в основном применяются именно для несложного продакшна на уровне кабельных сетей. Для профессиональных же фильмов, даже малобюджетных (не говоря уже о дорогих), все звуки записываются самостоятельно.

КП: А чем не подходят звуки из стандартной библиотеки для профессионального фильма?

С.Т.: В принципе, я говорю о том, как это делается на Западе или как это должно делаться, поскольку у нас по бедности очень часто экономят на том, на чем нельзя экономить. Дело в том, что художественный фильм отражает некий индивидуальный замысел режиссера, и найти в библиотеках звук, полностью соответствующий этому замыслу, часто практически невозможно.

КП: Но ведь звук можно редактировать, причем возможности для этого, как вы говорите, весьма широкие?

С.Т.: Есть такое понятие, как тембр звука. Можно подчеркнуть или ослабить некие составляющие этого тембра, но радикально изменить его нельзя. Именно поэтому все шумы для профессионального фильма записываются «с нуля», и занимаются этим профессионалы. Приведу такой пример: в известном фильме «Бэтмен возвращается» присутствовал звук машины Бэтмена. Скажите, пожалуйста, в какой библиотеке можно найти этот звук? Более того, если мы говорим о стереозвуке и о технологии Surround, то каждая звуковая картина просто уникальна. Например, если вертолет летит на зрителя и улетает назад, очевидно, что подобная звуковая картина привязана к сюжету. При этом необязательно записывать реальные звуки - чаще всего они создаются синтетически.

КП: Почему же нельзя записать звуки с реальных физических процессов и представить их именно такими, какими они встречаются в жизни? Почему вместо них нужно использовать какие-то другие, синтетические?

С.Т.: Нам совсем не нужно в точности воссоздавать звук реальных физических, как вы выразились, процессов. Если в трех метрах от переднего плана взрывается бомба, то зрителю нужно передать вовсе не тот звук, который в реальности слышит солдат, оказавшийся рядом с местом взрыва! Мы должны передать некую условную картину, которая позволит зрителю представить реальность; при этом мы ориентируемся на особенности его восприятия, на необходимые нам художественные акценты и так далее.

Мультимедиа представляет собой совокупность аппаратных и программных средств, обеспечивающих создание звуковых и визуальных эффектов, а также влияние человека на ход выполнения программы, предусматривающей их создание.

Первоначально компьютеры умели "работать" только с числами. Немного позднее они "научились" работать с текстами и графикой. И лишь в последнем десятилетии XX века компьютер "освоил" звук и движущееся изображение. Новые возможности компьютера получили название мультимедиа (multimedia - множественная среда, то есть среда, состоящая из нескольких компонентов различной природы).

Ярким примером применения мультимедийных возможностей являются различные энциклопедии, в которых вывод текста той или иной статьи сопровождается показом связанных с текстом изображений, фрагментов кинофильмов, синхронным озвучиванием выводимого текста и т.д. Мультимедиа широко применяется в обучающих, познавательных, игровых программах. Эксперименты, проводившиеся над большими группами обучаемых, показали, что в памяти остается 25% услышанного материала. Если материал воспринимается зрительно, то запоминается 1/3 увиденного. В случае комбинированного воздействия на зрение и слух доля усвоенного материала повышается до 50%. А если обучение организовано при диалоговом, интерактивном (interaction - взаимодействие) общении обучаемого и мультимедийных обучающих программ, усваивается до 75% материала. Эти наблюдения свидетельствуют об огромных перспективах применения мультимедийных технологий в области обучения и во многих других аналогичных областях применения.

Одной из разновидностей мультимедиа считается так называемое кибернетическое пространство .

Развитием гипертекстовых и мультимедийных систем являются

Компоненты мультимедиа

Что такое мультимедиа? Multi – много, Media – среда. Это человеко-машинный интерфейс, в котором используются различные, естественные для человека каналы коммуникации: текст, графика, анимация (видео), аудиоинформация. А также более специализированные виртуальные каналы, обращающиеся, к различным органам чувств. Рассмотрим подробнее основные составляющие мультимедиа.

1. Текст . Представляет собой знаковую или вербальную информацию. Символами текста могут быть буквы, математические, логические и другие знаки. Текст может быть не только литературным, текстом являются компьютерная программа, нотная запись и пр. В любом случае это последовательность символов, написанная на каком-то языке.

Слова текста не имеют никакого видимого сходства с тем, что они обозначают. То есть они адресованы к абстрактному мышлению, а в голове мы их перекодируем в те или иные предметы и явления.

При этом текст всегда обладает точностью и конкретностью, он надежен как средство коммуникации. Без текста информация перестает быть конкретной, однозначной. Такимобразом, текст является абстрактным по форме, но конкретным по содержанию.

На текстовой информации основаны научная статья, рекламное объявление, газета или журнал, Web-страница глобальной сети Интернет, интерфейс компьютерной программы и многое другое. Убрав текст из любого из указанных информационных продуктов, мы этот продукт фактически уничтожим. Даже в рекламном объявлении, не говоря уже о проспектах, периодике, книгах главное – текст. Главная цель подавляющего числа печатных материалов – это донести до человека определенную информацию в виде текста.

Текст может быть не только визуальным. Речь – это тоже текст, понятия, закодированные в виде звуков. И этот текст намного древнее, чем письменный. Человек научился говорить раньше, чем писать.

2. Визуальная или графическая информация. Эта вся остальная поступающая через зрение, статичная и не закодированная в текст информация. Как средство коммуникации изображение более многозначно и неопределенно, оно не обладает конкретностью текста. Но обладает другими достоинствами.

а) Богатство информации. При активном просмотре адресат одновременно воспринимает множество значений, смыслов, нюансов. Например, на фотографии много могут сказать выражения лиц людей, из позы, окружающий фон и т.д. И каждый может воспринять одно и то же изображение по-разному.

б) Простота восприятия. На просмотр иллюстрации затрачивается намного меньше усилий, чем на чтение текста. Нужный эмоциональный эффект может быть достигнут намного легче.

Графику можно разделить на два вида: фотографию и рисунок. Фотографически точное отображение реального мира придает материалу достоверность и реалистичность и в этом его ценность. Рисунок – это уже преломление реальности в человеческом сознании в виде символов: кривых, фигур, их окраски, композиции и прочего. Функции у рисунка могут быть две:

а) наглядное уточнение и дополнение информации: в виде чертежа, схемы или в виде иллюстрации в книге – цель одинакова;

б) создание определенного стиля, эстетического облика публикации.

3. Анимация или видео , то есть движение.Компьютерная анимация чаще всего используется для решения двух задач.

а) Привлечение внимания. Любой движущийся объект сразу же привлекает внимание зрителя. Это инстинктивное свойство, т.к. движущийся объект может быть опасен. Поэтому анимация важна как фактор привлечения внимания к самому главному.

При этом достаточно бывает простых средств привлечения внимания. Так, для баннеров в Интернете обычно используют элементарные, циклически повторяемые движения. Сложная анимация даже противопоказана, поскольку Веб-сайты часто и так бывают перегружены графикой. А это раздражает и утомляет посетителя.

б) Создание различных информационных материалов: роликов, презентаций и пр. Здесь монотонность не годится. Необходимо управлять вниманием зрителя. А для этого требуются такие вещи, как сценарий, сюжет, драматургия, пусть даже и в упрощенной форме. У развития действия во времени существуют свои стадии и свои законы (о чем будет сказано далее).

4. Звук. Звуковая информация обращена к другому органу чувств – не к зрению, а к слуху. Естественно, что там имеется своя специфика, свой дизайн и технические особенности. Хотя в восприятии информации можно заметить много сходного. Аналогом письма служит речь, изобразительное искусство до некоторой степени можно сопоставить с музыкой, используются также природные, необработанные звуки.

Существенная разница состоит в том, что статического звука не существует. Звук – это всегда динамичные колебания среды, обладающие определенными частотой, амплитудой, тембровыми характеристиками.

Человеческое ухо обладает высокой чувствительностью к гармоническому спектру звуковых колебаний, к диссонансу обертонов. Поэтому получение высококачественного оцифрованного компьютерного звука до сих пор является технически сложной задачей. И многие специалисты считают аналоговый звук более «живым», естественным по сравнению с цифровым звуком.

5. Виртуальные каналы , которые обращаются к другим органам чувств.

Так, виброзвонок в мобильном телефоне обращается не к зрению и слуху, а к осязанию. И это не экзотика, а распространённый канал информации. О том, что кто-то хочет поговорить с абонентом. Тактильные (осязательные) ощущения применяются и для других целей: имеются различные тренажёры, специальные перчатки для компьютерных игр и для хирургов и пр.

В появившихся в последнее время 4D кинотеатрах эффекта присутствия зрителя в фильме добиваются разными, не применяемыми раньше средствами: подвижные кресла, брызги в лицо, порывы ветра, запахи.

Есть даже каналы связи и управления, в которых задействованы непосредственно нервные клетки, мозг человека. Они разрабатываются для инвалидов, людей с ограниченными возможностями. Человек после тренировки способен силой мысли управлять движением точек на экране. А также (что важнее) мысленно отдавать команды, приводящие в движение специальную инвалидную коляску.

Таким образом, виртуальная реальность из фантастики постепенно превращается в часть повседневной жизни.