...

Чтобы обрабатывать звук на компьютере его надо дискретизировать

Кодирование и обработка звуковой информации

Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука (рис. 1.1).

Рис. 1.1. Зависимость громкости и высоты тона звука от интенсивности и частоты звуковой волны

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 10 14 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица “децибел” (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Таблица 5.1. Громкость звука

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность “ступенек” (рис. 1.2).

Рис. 1.2. Временная дискретизация звука

Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее “лесенка” цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука – это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой “ступеньке” присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука – это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 I . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 I = 2 16 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему – 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим “моно”). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим “стерео”).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3.

При сохранении звука в форматах со сжатием отбрасываются “избыточные” для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

Контрольные вопросы

1. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?

Задания для самостоятельного выполнения

1. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней интенсивности сигнала?

1) 16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.

2. Задание с развернутым ответом. Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:

а) моно, 8 битов, 8000 измерений в секунду;

б) стерео, 16 битов, 48 000 измерений в секунду.

3. Задание с развернутым ответом. Определить длительность звукового файла, который уместится на дискете 3,5″ (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый):

а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду;

б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду.

Презентация, доклад на тему Кодирование звуковой информации

Звуковая информация 1. ЗВУК представляет собой распространяющуюся волну в воздухе, воде или другой среде с непрерывно меняющейся амплитудой и частотой .

  • Главная
  • Информатика
  • Кодирование звуковой информации

Слайд 1Кодирование и обработка звуковой информации в компьютере

Кодирование и обработка звуковой информации в компьютере © И.В.Муравьева, 2012-2014

Слайд 2Звуковая информация
1. ЗВУК представляет собой распространяющуюся волну в воздухе, воде

или другой среде с непрерывно меняющейся амплитудой и частотой .

Звуковая информация 1. ЗВУК представляет собой распространяющуюся волну в воздухе, воде или другой среде с непрерывно меняющейся

Слайд 3Примеры непрерывного звука

Примеры непрерывного звука

Слайд 4Человек воспринимает звуковые волны в форме звука различной громкости и тона.
Чем

больше частота колебаний, тем выше тон звука

Чем больше амплитуда звуковой волны,
тем громче звук.

Высокий громкий звук

Человек воспринимает звуковые волны в форме звука различной громкости и тона. Чем больше частота колебаний, тем выше

Слайд 5
Чтобы обрабатывать звук на компьютере, его надо дискретизировать
Это значит, что

звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенный уровень громкости.

Чтобы обрабатывать звук на компьютере, его надо дискретизировать Это значит, что звуковая волна разбивается на отдельные маленькие

Слайд 6
Дискретный сигнал в компьютере с помощью звуковой карты превращается в последовательность

нулей и единиц

Дискретный сигнал в компьютере с помощью звуковой карты превращается в последовательность нулей и единиц

Слайд 7Примеры дискретного звука:

Примеры дискретного звука:

Слайд 8. Звуковой файл – это файл, хранящий звуковую информацию в числовой

двоичной форме.

. Звуковой файл – это файл, хранящий звуковую информацию в числовой двоичной форме.

Слайд 9Схема 1: Процесс преобразования звуковых волн в двоичный код

в памяти компьютера:

Схема 1: Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

Слайд 10Процесс воспроизведения звуковой информации, сохраненной в памяти компьютера

Процесс воспроизведения звуковой информации, сохраненной в памяти компьютера

Слайд 11АУДИОадаптер (звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное: для преобразования

электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении непрерывного звука

АУДИОадаптер (звуковая плата) – специальное устройство, подключаемое к компьютеру, предназначенное: для преобразования электрических колебаний звуковой частоты в

Слайд 12ЧАСТОТА ДИСКРЕТИЗАЦИИ ( h ) – это количество измерений входного сигнала

(громкости звука) за 1 секунду. Частота измеряется в герцах ( Гц). Одно измерение за 1 секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров: 11 кГц; 22 кГц и 44,1 кГц.

ЧАСТОТА ДИСКРЕТИЗАЦИИ ( h ) – это количество измерений входного сигнала (громкости звука) за 1 секунду. Частота

Слайд 13Глубина кодирования звука (i) ( или разрядность регистра адаптера) – это количество

бит, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Глубина кодирования звука (i) ( или разрядность регистра адаптера) – это количество бит, которое необходимо для кодирования

Слайд 14Самое низкое качество оцифрованного звука равно частоте = 11кГц и

глубине кодирования 8 битов.

Самое низкое качество оцифрованного звука равно частоте = 11кГц и глубине кодирования 8 битов.

Слайд 15Высокое качество соответствует частоте 44,1 кГц и глубине кодирования 16 битов.

Высокое качество соответствует частоте 44,1 кГц и глубине кодирования 16 битов.

Слайд 16Если известна глубина кодирования звука (i), то количество уровней громкости (N)

цифрового звука можно рассчитать по формуле: N = 2i (1)

Если известна глубина кодирования звука (i), то количество уровней громкости (N) цифрового звука можно рассчитать по формуле:

Слайд 17При глубине кодирования звука i = 8 бит количество уровней громкости N =

При глубине кодирования звука i = 8 бит количество уровней громкости N = 28 = 256;

Слайд 18При глубине кодирования звука i = 16 бит количество уровней громкости N =

216 = 65 536.

При глубине кодирования звука i = 16 бит количество уровней громкости N = 216 = 65 536.

Слайд 19Форматы сохранения звуковых файлов (расширение)
Оцифрованный звук можно сохранять без сжатия

в звуковых файлах в универсальном формате WAF, а также в формате со сжатием МР3.

Форматы сохранения звуковых файлов (расширение) Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате

Слайд 20Определение объема звукового файла (V) – (бит, байт, Кб, Мб…)
Объем

звукового файла определяется по формуле:
V = t · h · I (2)
Где t – время звучания файла, (сек, мин.)
h – частота дискретизации, (Гц, кГц);
i – глубина кодирования звука, бит.

Определение объема звукового файла (V) – (бит, байт, Кб, Мб…) Объем звукового файла определяется по формуле: V descrip

Слайд 21Из формулы (2) можно определить время, частоту и глубину кодирования звука: t

= V/( h · i ) (3) h = V/( t · i ) (4) i = V/( t · h) (5)

Из формулы (2) можно определить время, частоту и глубину кодирования звука: t = V/( h ·

Слайд 22
Размер цифрового моноаудиофайла (V) измеряется по формуле: V = t ·

Размер цифрового стереоаудиофайла, сигнал которого записан для 2-х колонок (раздельно кодируются левый и правый каналы звучания), определяется по формуле:
V = 2 · t · h · I (бит)

Размер цифрового моноаудиофайла (V) измеряется по формуле: V = t · h · I (бит)Размер цифрового

Слайд 23
Пример задачи
Определить размер в байтах цифрового аудиофайла, время звучания которого составляет

10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит.

Решение: Формула для расчета размера в байтах :
V = t · h · I /8, (для перевода в байты полученную величину надо разделить на 8 бит).
22,05кГц = 22,05 * 1000 Гц = 22050 Гц.
V = t · h · I /8 = 22050 * 10 * 8/8=220500 байт.
Ответ: размер файла 220500 байт.

Урок 17. Кодирование графической и звуковой информации

Большую часть информации человек получает с помощью зрения и слуха. Важность этих органов чувств обусловлена развитием человека как биологического вида, поэтому человеческий мозг с большой скоростью способен обрабатывать огромное количество графической и звуковой информации.

С появлением компьютеров возникла огромная потребность научить их обрабатывать такую информацию. Как же такую информацию может обработать компьютер?

Итак, кодирование графической информации осуществляется двумя различными способами: векторным и растровым

Программы, работающие с векторной графикой, хранят информацию об объектах, составляющих изображение в виде графических примитивов: прямых линий, дуг окружностей, прямоугольников, закрасок и т.д.

Достоинства векторной графики:

— Преобразования без искажений.

— Маленький графический файл.

— Рисовать быстро и просто.

— Независимое редактирование частей рисунка.

— Высокая точность прорисовки.

— Редактор быстро выполняет операции.

Недостатки векторной графики:

— Векторные изображения выглядят искусственно.

— Ограниченность в живописных средствах.

Программы растровой графики работают с точками экрана (пикселями). Это называется пространственной дискретизацией.

КОДИРОВАНИЕ РАСТРОВОЙ ГРАФИКИ

Давайте более подробно рассмотрим растровое кодирование информации.

Компьютер запоминает цвет каждой точки, а пользователь из таких точек собирает рисунок.

При этом зная количество пикселей по вертикале и горизонтали, мы сможем найти — разрешающую способность изображения.

Разрешающая способность находится по формуле:

где n, m — количество пикселей в изображении по вертикали и горизонтали.

В процессе дискретизации каждый пиксель может принимать различные цвета из палитры цветов. При этом зная количество цветов, которые можно использовать в палитре и воспользовавшись формулой Хартли, мы сможем найти количество информации, которое используется для кодирования цвета точки, что мы будем называть глубиной цвета.

где N — количество цветов в палитре;

i — глубина цвета.

Таким образом, чтобы найти вес изображения достаточно перемножить разрешающую способность изображения на глубину цвета: L=P*i.

Каким именно образом возможно закодировать пиксель? Для этого используются кодировочные палитры.

КОДИРОВОЧНАЯ ПАЛИТРА RGB

Когда художник рисует картину, цвета он выбирает по своему вкусу. Но цвет в компьютере надо стандартизировать, чтобы его можно было распознать. Поэтому надо определить, что такое каждый цвет.

В экспериментах по производству цветных стекол М. В. Ломоносов показал, что получить любой цвет возможно, используя три различных цвета.

Этот факт был обобщен Германом Грассманом в виде законов аддитивного синтеза цвета.

Давайте рассмотрим два из этих законов:

— Закон трехмерности. С помощью трех независимых цветов можно, смешивая их в однозначно определенной пропорции, выразить любой цвет.

— Закон непрерывности. При непрерывном изменении пропорции, в которой взяты компоненты цветовой смеси, получаемый цвет также меняется непрерывно.

Из биологии вы знаете, что рецепторы человеческого глаза делятся на две группы: палочки и колбочки. Палочки более чувствительны к интенсивности поступаемого света, а колбочки — к длине волны.

Если посмотреть, как распределяется количество колбочек по тому, на какую длину волны они «настроены», то количество колбочек «настроенных» на синий, красный и зеленый цвета окажется больше.

Поэтому такие цвета были взяты основными для построения цветовой модели, которая получила название RGB (Red, Green, Blue). То есть задавая количество любого из этих трех цветов, можно получить любой другой. Для кодирования каждого цвета было выделено 8 бит (режим True-Color). Таким образом, количество каждого цвета может изменяться от 0 до 255, часто это количество выражается в шестнадцатеричной системе счисления (от 0 до FF).

Так как описание цвета происходит определением трех величин, то это наводит на мысль считать их координатами точки в пространстве. Получается, что координаты цветов заполняют куб.

При этом яркость цвета определяется тем насколько близка к максимальному значению хотя бы одна координата из трех.

Поскольку именно модель RGB соответствовала основному механизму формирования цветного изображения на экране, большинство графических файлов хранят изображение именно в этой кодировке. Если же используется другая модель, например в JPEG , то приходится при выводе информации на экран преобразовывать данные.

КОДИРОВАНИЕ ЗВУКОВОЙ ИНФОРМАЦИИ

Давайте перейдем к кодированию звуковой информации.

Из курса физики вам всем известно, что звук — это непрерывная волна с изменяющейся амплитудой и частотой.

Для того, чтобы компьютер мог обрабатывать непрерывный звуковой сигнал, он должен быть дискретизирован, т. е. превращен в последовательность электрических импульсов (двоичных нулей и единиц).

Для этого звуковая волна разбивается на отдельные временные участки.

Гладкая кривая заменяется последовательностью «ступенек». Каждой «ступеньке» присваивается значение громкости звука. Чем больше количество уровней громкости, тем больше количество информации будет нести значение каждого уровня и более качественным будет звучание. Причем, чем больше будет количество измерений уровня звукового сигнала в единицу времени, тем качественнее будет звучание. Эта характеристика называется частотой дискретизации Данная характеристика измеряется в Гц.

При этом на каждое измерение выделяется одинаковое количество бит. Такая характеристика называется — глубина кодирования.

Таким образом, чтобы подсчитать вес звуковой волны достаточно перемножить частоту дискретизации, глубины кодирования и времени звучания такого звука. При этом, рассматривая современное звучание, количество звуковых волн может быть различное, например, для стереозвука — это 2, а для квадрозвука — 4.

При подготовке материала использовались источники:
https://sites.google.com/site/informatika430/home/kodirovanie-i-obrabotka-zvukovoj-informacii
https://shareslide.ru/informatika/kodirovanie-zvukovoy-informatsii-1
https://resh.edu.ru/subject/lesson/5556/conspect/