Кодирование и обработка звуковой информации

Подписи к слайдам:

Слайд 1

Звуковая информация: кодирование, ввод, обработка Горохова Анастасия, 9а класс МБОУ «СОШ №2»

Слайд 2

Звук, который мы слышим,- это звуковая волна (аналоговый сигнал). Чтобы записать такой звук на компьютер, нужно преобразовать его в цифровую форму, что и делает аналого-цифровой преобразователь (АЦП). Для воспроизведения используется цифроаналоговый преобразователь

Слайд 3

Преобразование звука из цифрового вида в аналоговый

Слайд 4

Дискретизация звука Непрерывная звуковая волна разбивается на отдельные участки по времени, для каждого устанавливается своя величина амплитуды. Каждой ступеньке присваивается свой уровень громкости звука, который можно рассматривать как набор возможных состояний

Слайд 5

Характеристики качества звука: «Глубина» кодирования звука — количество бит на один звуковой сигнал. Частота дискретизации – это количество измерений уровней сигнала за 1 секунду. Чем больше частота дискретизации, тем качественнее звук.

Слайд 6

Основные форматы звуковых файлов WAV Простое хранилище дискретных данных. Состоит из последовательности отсчётов (дискретных выборок амплитуды сигнала). MID Файл, хранящий в себе последовательность MIDI-сообщений. МР3 Формат,позволяющий сжимать звуковые файлы без заметной потери качества

Слайд 7

Ввод музыки в компьютер. Способы ввода звука в компьютер: Оцифровка аналогового сигнала(виниловая пластинка или музыкальный инструмент) аналого-цифровым преобразователем . Через MIDI-интерфейс звуковой карты.

Слайд 8

Обработка звука Амплитудные преобразования. Частотные преобразования. Фазовые преобразования. Временные преобразования.

Слайд 9

Типы программного обеспечения для работы со звуком. Редакторы цифрового звука. Секвенсоры. Трекеры.

Слайд 10

Редакторы цифрового звука. Они обеспечивают запись(оцифровку) звука и сохранение на диск. Другие возможности: многоканальное сведение аудио; обработка специальными эффектами; очистка от шумов.

Слайд 11

Секвенсоры. Это программы для написания музыки, использующие MIDI-синтезатор. Основные возможности: создание и редактирование музыки; совмещение MIDI-дорожек с цифровыми сигналами; осуществление мастеринга.

Слайд 12

Трекеры. Это программы, похожие на секвенсоры, но отличающиеся от них тем, что проигрываемые в трекерных модулях инструменты(сэмплы) хранятся внутри файлов.

Видео

Уровни громкости звука

Громкость, дБ

Характеристика

Абсолютная тишина

5

Почти идеальная тишина

10

Почти идеальная тишина

Шорох листьев

15

Едва слышно

Качание веток деревьев

20

Едва слышно

Шепот человека

25

Очень тихо

Шепот человека

30

Тихо

Тиканье часов на стене

35

Ниже среднего

Речь человека на расстоянии 10 метров

40

Ниже среднего

Обыкновенная речь человека

45

Ниже среднего

Обыкновенная речь человека

50

Средне

Печатная машинка

55

Выше среднего

Офисное помещение

60

Шумно

Отдел продаж

65-75

Шумно

Громкий разговор, крики, смех

80

Очень громко

Крик человека

85

Очень громко

Громкий крик человека

90

Очень шумно

Движение поезда на расстоянии в 1 метр

95

Очень шумно

Движение метро снаружи

100

Крайне шумно

Оркестр

120

Невыносимо громко

Отбойный молоток

130

Болевой порог

Самолет при взлете

150

Контузия

Старт ракеты

160

Шок, тяжелые травмы слухового аппарата

Ударная волна при взрыве ядерной бомбы

200

Смерть

Шумовое оружие

Громкость звука необходимо учитывать при кодировании звуковой информации, так как ее величина влияет на разрядность кодирования звуковых волн, а следовательно, и на информационный вес закодированного в двоичном коде звукового файла.

Кодирование цифровой информации

Для работы с числовой информацией мы используем десятизначную систему счисления: 0 1 2 3 4 5 5 6 7 8 9 Эта система называется десятичной.

Кроме чисел, биты также важны в десятичной системе. Если мы посчитаем количество чего-то и достигнем наибольшего доступного нам числа (до 9), мы введем вторую цифру, а затем каждое последующее число будет состоять из двух цифр. Когда мы достигнем 99, мы должны ввести третью цифру. В пределах трех цифр мы уже можем считать до 999 и так далее.

Таким образом, если мы используем только десять цифр и вводим дополнительные цифры, мы можем захватить и выполнить математические операции с любым числом, даже самым большим.

Компьютер считает одинаково, но имеет только две цифры — логический ноль (бит не имеет свойства) и логическую единицу (бит имеет это свойство).

Система счисления, использующая только две цифры, называется двоичной.

При подсчете в двоичной системе вы должны добавлять каждую следующую цифру намного чаще, чем в десятичной системе.

Человеческий мозг, привыкший к десятичной системе, плохо воспринимает двоичную систему. Хотя оба принципа основаны на одних и тех же принципах и различаются только количеством используемых цифр. В двоичной системе все арифметические операции с любым числом могут выполняться одинаково. Его главный недостаток — необходимость иметь дело с большим количеством битов.

Таким образом, наибольшее десятичное число, которое можно отобразить в 8-ми разрядной двоичной системе, составляет 255, в 16-ти разрядной — 65535, в 24-ти разрядной — 16777215.

Компьютер, который кодирует числа в двоичный код, основан на двоичной системе счисления. Но он может использовать различные алгоритмы в зависимости от особенностей чисел.

Как правило, для хранения каждого из этих номеров на запоминающем устройстве выделяется 1 байт (8 бит). Запись производится по полной аналогии с двоичной системой счисления.

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).


Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.


Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Кодирование сигнала

Кодирование сигнала — это его представление в определенной форме, подходящей для последующего использования сигнала, т.е. это правило, описывающее представление набора символов в другом наборе символов. Затем отображаемый набор символов называется исходным алфавитом, а набор символов, который будет использоваться для отображения, называется алфавитом кода или алфавитом для кодирования. В этом случае кодированию подлежат как отдельные символы исходного алфавита, так и их комбинации. Аналогичным образом, для формирования кодов используются как отдельные символы алфавита кода, так и их комбинации. Например, существует таблица соответствия между натуральными числами трех вычислительных систем.

Эту таблицу можно рассматривать как правило, описывающую представление набора символов десятичной системы счисления в двоичной и шестнадцатеричной системах. Затем начальный алфавит — десятичные цифры от 0 до 9, а алфавиты кодов — 0 и 1 для двоичной системы; цифры от 0 до 9 и символы {A, B, C, D, E, F} для шестнадцатеричной системы. Кодовая комбинация (код) — это набор символов кода, используемый для кодирования символа (или комбинации символов) исходного алфавита. В этом случае кодовая комбинация может содержать один символ алфавита кода. Исходный символ — это символ (или комбинация символов) исходного алфавита, которому соответствует кодовая комбинация. Например, поскольку 8 = 10002 и 8 — исходный символ, 1000 — кодовая комбинация или код для числа 8.

В то же время, 8 — исходный символ. Комбинация кодовых комбинаций называется кодом. Соотношение символов (или комбинаций символов, если отдельные символы не закодированы) исходного алфавита и их кодовых комбинаций представляет собой таблицу соответствия (кодовую таблицу). Обратный метод получения исходных символов с помощью символьных кодов называется декодированием. Чтобы иметь возможность корректно декодировать, код, конечно, должен быть уникальным, т.е. исходный символ должен соответствовать ровно одному коду и наоборот.

В зависимости от назначения кодирования различают следующие типы кодов: — кодирование по образцу — используется всякий раз, когда информация вводится в компьютер для ее внутреннего представления; — криптографическое кодирование или шифрование — используется, когда необходимо защитить информацию от несанкционированного доступа; — эффективное или оптимальное кодирование — используется для устранения избыточности информации, т.е. для того, чтобы информация была доступна пользователю таким образом, чтобы она могла быть прочитана и понята им .т.е. уменьшение его объема, например, в архивах; — шумозащищенное или помехоустойчивое кодирование — используется для обеспечения заданной надежности при помехах сигналу, например, при передаче информации по каналам связи.

Объем звуковой информации

Чем больше по объему аудио файл, тем лучше будет качество его воспроизведения. Объем более качественного файла всегда меньше объема файла с низким качеством, при равной их продолжительности.

Для расчета объема информации, занимаемого аудио файлом с одной звуковой дорожкой, используют нижеприведенную формулу:

\(V = N * f * k\),

где \(N \) — общее время звучания аудио файла, сек,

\(f\) — частота дискретизации аудио файла, Гц,

\(k\) — глубина кодирования аудио файла, бит.

Рассмотрим пример, когда время звучания аудио файла 5 минут с высоким качеством воспроизведения с частотой дискретизации 48000 Гц и глубиной кодирования 64 бит, то объем такого файла будет составлять:

\(V = 5 * 60 * 48000 * 64 = 921600000 бит,\)

что составляет 115200000 байт, или 115200 Кбайт, или 115,2 Мбайт.

Для стереозвука расчет объема производится по той же формуле, лишь только с той разницей, что нужно еще умножить на два, так как файл со стереозвуком обычно занимает в два раза больше места из-за того, что процесс дискретизации во время кодирования стереозвука проводится для каждой дорожки отдельно.

Частота дискретизации звука

Необходимо знать, что процессор персонального компьютера взаимодействует с любыми данными на уровне двоичного кода. Двоичный или бинарный код – цепочки битов, которые принимают только одно из двух предопределенных значений, – 0 или 1.

Под кодированием звуковой информации следует понимать преобразование аналогового звукового сигнала в формат, понятный процессору персонального компьютера, то есть в двоичный код. Аналоговый или непрерывный звуковой сигнал у нас представлен в виде графика функций, как зависимость амплитуды от времени.

Чтобы оцифровать аналоговый звуковой сигнал разобьем ось, выражающую время, на некоторое количество равных отрезков и произведем замеры амплитуды/громкости в каждом отрезке. Предлагаю произвести разбивку с шагом 0.1 секунды.

Дискретизация – процесс преобразования непрерывного сигнала в дискретный, то есть прерывный сигнал. Под частотой дискретизации следует понимать частоту взятия отсчетов непрерывного во времени сигнала при его дискретизации. В нашем случае дискретизация – операция, связанная с разбивкой оси абсцисс, отвечающей за время, на отдельные одинаковые участки. А частотой дискретизации является значение, равное 10 Гц. То есть мы производим 10 замеров амплитуды звуковой волны за 1 секунду.

Дискретизация неидеальной звуковой волны

Дискретизация неидеальной звуковой волны

Таблица значений громкости звуковой волны при частоте дискретизации 10 Гц:

Время, сек

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Громкость, дБ

90

20

80

30

90

10

40

20

90

20

60

Представление и кодирование звуковой информации в компьютере

Для представления и кодирования звука используются специальное оборудование и программы. Рассмотрим весь процесс более подробно.

  1. Аудиоинформация, поступая из окружающей среды (например, по воздуху), преобразуется в электрический сигнал. Для этого используется такое устройство, как микрофон.
  2. После этого звук поступает на АЦП (аналого-цифровой преобразователь), где подвергается оцифровке.
  3. На последнем этапе информация (уже в двоичном виде) кодируется при помощи специальной программы – аудиокодека. На выходе получается файл в специальном формате (например, mp3), который можно хранить, воспроизводить и передавать.

Наибольший интерес представляет процесс оцифровки, также называемым аналого-цифровым преобразованием. В результате него аналоговый сигнал заменяется на цифровой.

Основной принцип аналогово-цифрового преобразования заключается в том, что через равные промежутки времени измеряется амплитуда волны. Также этот процесс называется дискретизация.

Дискретизация – это процесс в результате, которого непрерывная функция представляется в виде дискретной последовательности её значений. Схематично дискретизацию можно представить так:

Дискретизация характеризуется двумя такими величинами, как:

  • Частота шага по времени;
  • Шаг квантования.

и измеряется в Герцах (количество измерений за одну секунду). Частота шага по времени находится по теореме Котельникова.

\[ F_{дискр.}=2F_{аналог.сигн.} \]

, до которых округляются величины амплитуды волны.

Количество уровней (ступенек) до которых округляются значения сигнала, зависит от аналого-цифрового преобразователя. На данный момент используются 16, 32 и 64 битные устройства.

Количество бит, затрачиваемое для номеров уровней, называется глубиной кодирования звуковой информации.

Глубина кодирования связано с количеством уровней по формуле:

\[ N=2^i \]

Где i разрядность АЦП в битах.

Чем чаще берутся дискреты за единицу времени и больше глубина кодирования, тем выше качество звуковых данных на выходе и дороже АЦП.

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

  • одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
  • $1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .
Определение 2

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая — качеству звучания музыкальных носителей.

Замечание 1

Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук. Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, которое соответствует качеству аудио-CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).

Готовые работы на аналогичную тему

Курсовая работа Кодирование звуковой информации 470 ₽ Реферат Кодирование звуковой информации 250 ₽ Контрольная работа Кодирование звуковой информации 190 ₽

Получить выполненную работу или консультацию специалиста по вашему учебному проекту Узнать стоимость

Распространенные форматы аудио файлов

Аудио файлы бывают различных форматов. Рассмотрим самые распространенные из них:

  • MP3 — цифровой формат, позволяющий записывать и хранить аудио информацию, а также обеспечивающий довольно высокое качество ее воспроизведения.
  • MIDI — этот формат поначалу использовался лишь в процессе управления музыкальными инструментами. На сегодняшний день его используют для электронных музыкальных инструментов и компьютерных модульных систем.
  • WAV — этот формат произвольного звука, представленного в виде колебания или аудио волны. Он используется во всех стандартных звуках в системе Windows.

Теги

Adblock
detector