Файл pcm что это
Цифровой звук: DSD vs PCM
Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.
Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?
Аналоговый сигнал
Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).
Рис. 1. Аналоговый сигнал
Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.
Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.
Рис. 2. АЧХ MP3 файла 256 kbps
Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.
Искажения – не что иное, как отклонение сигнала от оригинала.
Принципы представления звука в цифровом виде
Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).
Рис. 3. Преобразование аналогового сигнала в PCM
Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.
Рис. 4. Преобразование аналогового сигнала в DSD
Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.
Восстановление аналогового сигнала из «цифры»
Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20. 22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.
Рис. 5. Восстановление аналогового сигнала из DSD
Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.
Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».
Рис. 6. Восстановление аналогового сигнала из PCM
Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.
Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.
Применение PCM и DSD, достоинства/недостатки
Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?
В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.
Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM
Русские Блоги
PCM и WAV структура данных
PCM и WAV структура данных
Частота выборки
В моем другом сообщении в блогеАудио кодирование Понятия дискретизации и квантования были введены в, здесь частота дискретизации.
Частота выборкиУказывает количество цифровых снимков в секунду звукового сигнала. Эта скорость определяет частотный диапазон аудиофайла. Чем выше частота дискретизации, тем ближе форма цифрового сигнала к исходному аналоговому сигналу. Низкая частота дискретизации ограничивает диапазон частот, который может быть записан, что может привести к плохой работе записи с оригинальным звуком.
В соответствии сТеорема выборки НайквистаЧтобы воспроизвести данную частоту, частота дискретизации должна быть как минимум вдвое больше этой частоты. Например, частота дискретизации CD составляет 44 100 выборок в секунду, поэтому частота может воспроизводиться до 22 050 Гц, что чуть выше предела человеческого слуха в 20 000 Гц.
AНизкая частота дискретизации, которая искажает исходную звуковую волну.
BВысокая частота дискретизации для полного воспроизведения оригинальной звуковой волны.
Общие частоты дискретизации для цифрового аудио
Частота выборки | Уровень качества | Частотный диапазон |
---|---|---|
11,025 Hz | Плохое радио AM (бюджетные мультимедиа) | 0–5,512 Hz |
22,050 Hz | Рядом с FM-радио (высококачественные мультимедиа) | 0–11,025 Hz |
32,000 Hz | Лучше, чем FM-радио (стандартная частота дискретизации) | 0–16,000 Hz |
44,100 Hz | CD | 0–22,050 Hz |
48,000 Hz | Стандартный DVD | 0–24,000 Hz |
96,000 Hz | Blu-ray DVD | 0–48,000 Hz |
Бит глубина
Битовая глубина определяет динамический диапазон. При дискретизации звуковых волн укажите значение амплитуды, наиболее близкое к исходной амплитуде звуковой волны для каждого сэмпла. Более высокая битовая глубина может обеспечить более возможные значения амплитуды, в результате чего в более широком диапазоне динамического, нижний опорный шумовой и более высокую точность.
Бит глубина | Уровень качества | Значение амплитуды | Динамический диапазон |
---|---|---|---|
8 бит | Телефон | 256 | 48 dB |
16 бит | Аудио CD | 65,536 | 96 dB |
24 бита | Аудио DVD | 16,777,216 | 144 dB |
32 бит | оптимальный | 4,294,967,296 | 192 dB |
Чем выше битовая глубина, тем больше обеспечен динамический диапазон.
PCM аудио данные
Хранение аудиоданных PCM
Параметры аудиоданных ИКМ
Как правило, когда мы описываем параметры аудиоданных PCM, существуют следующие способы описания:
44100 Гц относится к частоте дискретизации, что означает 44100 выборок в секунду. Чем больше частота дискретизации, тем больше места занято для хранения цифрового звука.
16 бит относится к точности выборки, что означает, что после дискретизации исходного аналогового сигнала каждая точка выборки представляется в компьютере 16 битами (два байта). Чем выше точность выборки, тем точнее могут быть представлены различия в аналоговых сигналах.
Стерео означает количество каналов, то есть количество микрофонов, используемых во время семплирования. Чем больше микрофонов, тем больше он может восстановить реальную среду семплирования (конечно, также указывается размещение микрофона).
Вообще говоря, чем больше амплитуда сигнала в данных PCM, тем больше объем.
Обработка аудиоданных PCM
Уменьшить громкость канала 1
Из исходного кода видно, что после считывания 2-байтового значения выборки левого канала эта программа преобразует его в переменную короткого типа на языке Си. Значение делится на 2 и записывается обратно в файл PCM. На следующем рисунке показана диаграмма формы входных двухканальных аудиосэмплов PCM.
На следующем рисунке показана форма сигнала выходного левого канала после обработки. Видно, что амплитуда сигнала левого канала уменьшается вдвое.
PCM → WAV
Определение формата WAV
Суть этого формата заключается в добавлении заголовка файла перед файлом PCM. Значение каждого поля следующее:
Разбор заголовка файла WAV
Вот первые 72 байта файла WAVE, байты отображаются в виде шестнадцатеричных чисел:
Полевой анализ выглядит следующим образом:
PCM → WAV код 1
– EOF –
Неизвестное расширение файла может быть источником различных проблем. Однако выявление причин проблем с файлами PCM и их устранение не являются сложным процессом. Эта статья опишет 5 простых шагов, которые позволят вам решить проблемы с файлами PCM.
PCM расширение файла
Как открыть файл PCM?
Шаг 1. Найдите и скачайте и установите соответствующее программное обеспечение
Обычно для открытия файлов. PCM достаточно выполнить следующие простые шаги: найти, загрузить и установить соответствующее программное обеспечение. Затем, дважды щелкнув значок файла, откройте файл. Система должна автоматически связать PCM файл с соответствующим программным обеспечением. Ниже приведен список программ, необходимых для открытия файлов с расширением PCM:
Программы, поддерживающие PCM файлы
Шаг 2. Убедитесь, что файл PCM не заражен вредоносным ПО
Если данный файл с расширением PCM не заражен, возможно, антивирусная программа блокирует доступ к файлу. Пользователь должен принять необходимые меры предосторожности и выполнить действия, предложенные системой. После восстановления или удаления зараженного файла рекомендуется проверить всю систему на наличие вирусов. Вам нужно будет приобрести новую, чистую версию файла PCM.
Подсказка!
Имейте в виду, что вы всегда можете обратиться за помощью к ИТ-специалисту. Некоторые проблемы с файлами PCM могут быть трудно решить для менее опытных пользователей. Также вы можете обратиться за помощью к одному из разработчиков программного обеспечения, которое поддерживает файлы с расширением PCM. Для этого перейдите на подстраницу программного обеспечения и найдите адрес веб-сайта разработчика программного обеспечения.
Шаг 3. Убедитесь, что файлы PCM завершены, то есть были ли они загружены правильно
Если файл PCM не был загружен должным образом, программное обеспечение не сможет открыть такой файл. Проверьте размер файла в том месте, откуда вы скачали нужный файл. Если размер исходного файла отличается от размера загруженного файла PCM, вам придется загрузить файл снова.
Шаг 4. Убедитесь, что файлы PCM связаны с соответствующим программным обеспечением
Шаг 5. Убедитесь, что носитель, на котором хранятся файлы PCM, не поврежден или не поврежден
Возможно, что носитель, на котором находится файл, поврежден или поврежден. Попробуйте сканировать носитель на наличие ошибок.
Объяснение PCM и Bitstream: Какой из них следует использовать?
Настроить звук довольно просто, но для получения наилучшего звучания необходимо знать несколько вещей. В частности, вы должны понимать, какой формат входного аудиосигнала HDMI выбрать, чтобы получить наилучшие результаты.
Как я уже говорил, здесь нет ничего сложного, и это руководство поможет вам выбрать правильный формат ввода.
По умолчанию обычно используется PCM, и в большинстве случаев вам следует использовать эту настройку. Однако в некоторых случаях Bitstream будет лучше.
Что такое входной аудиоформат PCM HDMI
Сначала давайте разберемся с PCM, поскольку он является стандартным форматом входного аудиосигнала HDMI. Итак, PCM — это аббревиатура от Pulse-code modulation.
Первоначально этот термин использовался в аналоговую эпоху и сначала означал преобразование аналогового звука в цифровой формат в телефонии. По мере развития телевидения он стал использоваться в телевизорах, оснащенных цифровыми процессорами.
Сейчас PCM немного изменился (потому что в современных телевизорах нет аналогового звука). Теперь PCM HDMI Input Audio Format означает, что будет использоваться аудиопроцессор и звук будет преобразован в формат 2.0 (два динамика) или 2.1 (два динамика + сабвуфер). Независимо от того, устанавливаете ли вы внешние колонки или используете встроенные динамики телевизора.
Однако, что если вы используете более продвинутую аудиосистему? В таком случае PCM — это не то, что вам нужно, потому что даже многоканальный звук будет преобразован в формат 2.0 или 2.1.
Поэтому если вы используете аудиосистему высокого класса, вам необходимо использовать Bitstream.
Что такое формат входного аудиосигнала HDMI Bitstream?
Bitstream — это более сложный аудиоформат, который следует использовать, если вы используете аудиосистему высокого класса. В этом случае аудио должен быть аудиопроцессор внешней акустической системы, поэтому аудиопроцессор телевизора не участвует в этом процессе.
Если вы используете высококлассный саундбар или внешние колонки 7.1 или 5.1, для получения наилучшего качества звука следует использовать Bitstream.
Если вы не используете высококлассные аудиоустройства, вам следует использовать PCM.
Как изменить формат аудиовхода на телевизоре
Русские Блоги
Что такое PCM
1. Что такое PCM
Рисунок 1.1. Выборка и квантование аналогового звука.
2. Средний уровень PCM в драйвере alsa
ALSA реализовала для нас мощный промежуточный уровень PCM, и ему нужно реализовать только некоторые низкоуровневые функции, которым необходим доступ к оборудованию в вашем собственном драйвере.
Каждая звуковая карта может содержать до 4 экземпляров ПКМ, и каждый экземпляр ПКМ соответствует файлу устройства ПКМ. Это ограничение на количество экземпляров pcm связано с размером бит, занимаемым номером устройства Linux.Если в будущем мы будем использовать 64-битные номера устройств, мы сможем создать больше экземпляров pcm. Однако в большинстве случаев во встроенных устройствах достаточно одного экземпляра ПКМ.
Экземпляр pcm состоит из потока воспроизведения и потока захвата, и эти два потока состоят из одного или нескольких подпотоков соответственно.
Рис. 2.1. Структура пиктограмм в звуковой карте.
На следующем рисунке перечислены несколько важных структур среднего уровня ПКМ. Это позволяет нам взглянуть на отношения между этими структурами с точки зрения UML и прояснить отношения между ними, чтобы мы могли понять реализация среднего слоя ПКМ.
Рис. 2.2. Диаграмма взаимосвязи нескольких важных структур в среднем слое ПКМ.
3. Создайте новый ПКМ.
Средний уровень драйвера alsa предоставил нам api нового ПКМ:
int snd_pcm_new(struct snd_card *card, const char *id, int device,int playback_count, int capture_count,
struct snd_pcm ** rpcm);
Параметр play_countУказывает, что у ПКМ будет несколько субпотоков воспроизведения.
Параметр capture_countУказывает, что у ПКМ будет несколько подпотоков захвата.
Другой API, используемый для установки интерфейса функции работы ПКМ:
void snd_pcm_set_ops(struct snd_pcm *pcm, int direction, struct snd_pcm_ops *ops);
Создание нового ПКМ можно описать с помощью следующей диаграммы последовательности вызова нового ПКМ:
Рис. 3.1. Последовательная диаграмма нового ПКМ