Файл dsd что это такое
Что такое DSD-аудио? Как это работает и где взять файлы?
Сохранить и прочитать потом —
Похоже, формат DSD вновь входит в моду. Большинство новых цифровых устройств обеспечивают его поддержку, а каталог доступных альбомов внушает уважение – особенно у любителей джаза и классики.
Что же это такое и чем отличается от других систем записи цифровых сигналов, применяющихся в компакт-дисках и других форматов Hi-Res-аудио? Давайте узнаем.
Подробнее о PCM
Цифровые потоки записываются в виде комбинации двух состояний, 0 и 1; но для того, чтобы эту информацию можно было использовать, она должна быть организована особым образом. Почти во всех случаях используется система под названием PCM (Pulse Code Modulation, импульсно-кодовая модуляция).
Давайте вначале вспомним, как именно работает PCM.
При использовании PCM исходная форма аналогового аудиосигнала описывается при помощи двух параметров. Первый – это величина. На компакт-диске она представлена 16-разрядными цифровыми данными, что дает возможность задавать 65 536 различных уровней сигнала.
Для адекватного представления исходной формы сигнала ее необходимо измерять с точно отмеренными регулярными интервалами. Эти отсчеты выполняются 44 100 раз в секунду. Число выглядит случайным, однако его выбор был очень продуманным – оно обеспечивает покрытие полного диапазона слышимых человеком частот (от 20 Гц до 20 кГц).
DSD and SACD
Технология DSD (Direct Stream Digital) использует другой подход. Она была разработана в середине 90-х как способ архивирования старых аналоговых записей.
Предполагалось, что это будет более простой и экономичный с точки зрения занимаемой памяти способ хранения цифровых музыкальных данных по сравнению с PCM. Что особенно важно, DSD также изначально разрабатывался с учетом возможности преобразования в файлы формата PCM с частотой дискретизации, кратной 44,1 кГц.
Примерно в то же время компании Sony и Philips работали над заменой CD, который в конечном итоге принял форму SACD. Система DSD представлялась идеальной основой для создания нового формата – в частности, благодаря превосходной защите от копирования.
Основным достоинством DSD была простота и вытекающая из нее дешевизна реализации. Эта технология требовала меньшего уровня обработки, чем PCM, благодаря чему можно было применять более простые и намного менее дорогие ЦАП.
Как работает DSD?
DSD использует один бит информации, который говорит только о том, больше или меньше предыдущего фрагмента аналогового сигнала оказывается текущий. По сравнению с 65 тысячами разных значений, которые может принимать сигнал PCM, всего лишь два (0 в случае, если уровень сигнала нового отсчета ниже, и 1 – если он выше) у сигнала DSD кажутся категорически недостаточными для передачи нужной информации.
Однако нехватка информации компенсируется очень высокой частотой дискретизации – более 2,8 миллиона раз в секунду, что в 64 раза превышает соответствующий параметр для CD. Из-за этого DSD-формат стандартного разрешения нередко обозначают как DSD64, а его версии с удвоенной и учетверенной частотой дискретизации – как DSD128 и DSD256, соответственно. Существует даже спецификация DSD512, хотя нам не доводилось слышать, чтобы с ее применением был записан какой-то материал.
Записи в стандартном формате DSD по-прежнему достаточно редки по сравнению с альтернативными вариантами в PCM, а с повышенным разрешением встречаются еще намного реже. Однако поклонники DSD утверждают, что этот формат обеспечивает максимальную близость к аналоговому звучанию.
Если бы можно было увидеть цифровой поток формата DSD, нарисовать соответствующий аналоговый сигнал стало бы возможно, просто взглянув на распределение нулей и единиц. Чем больше нулей, тем меньше его величина; чем больше единиц, тем она больше. Если два значения встречаются примерно поровну, уровень сигнала близок к нулевому.
В чем недостатки формата DSD?
Плеер Astell & Kern AK70 mkII перед воспроизведением преобразует файлы формата DSD в PCM
Все это прекрасно, но у формата DSD есть и минусы. В частности, в нем сложно работать с записями.
Для выполнения любых обработок записи – например, эквализации, редактирования, управления динамическим диапазоном и добавления реверберации – обычно приходится преобразовывать DSD в PCM, выполнять необходимые преобразования и затем конвертировать обратно в DSD.
Этот способ сложно назвать простым и прямолинейным, однако он применяется практически для каждой студийной записи, выполненной по технологии DSD. Все дело в отсутствии подходящего оборудования и соответствующего программного обеспечения.
В описании диска может встретиться обозначение DXD. Это означает, что исходный сигнал в DSD был преобразован в PCM с параметрами 24 бит/352 кГц и обрабатывался в этом виде. Несмотря на то, что название, намеренно или нет, звучит похоже на DSD, по сути, это просто PCM с очень высоким разрешением.
Кроме того, аналоговому сигналу, полученному из DSD, присущ высокий по сравнению с PCM уровень шума. Продуманные технологии позволяют инженерам вывести эти шумы за границу слышимого диапазона частот и оптимизировать качество звука и шкалу динамики в пределах слышимого спектра. Высокочастотный шум обычно отфильтровывается.
Относится ли формат DSD к Hi-Res-аудио?
Насколько высокое разрешение имеют записи в DSD? Точно установить соотношение между PCM и DSD невозможно, но базовый формат примерно соответствует PCM с параметрами дискретизации 24 бит/88,2 кГц.
Заявленный динамический диапазон DSD составляет около 120 дБ в пределах слышимости. Для сравнения, у обычных CD он равен 96 дБ, а теоретический максимум записей в 24/192 достигает 144 дБ.
Большие числа смотрятся впечатляюще, но на деле даже диапазона CD более чем достаточно для любой записи.
Как воспроизводить DSD-файлы?
Chord Hugo 2 способен воспроизводить файлы вплоть до DSD512
В последние годы цифровые компоненты все чаще поддерживают воспроизведение DSD; это связано с повышением доступности скачиваемых аудиозаписей. Проверьте, поддерживают ли этот формат ваши портативный музыкальный, сетевой плеер и/или ЦАП.
Самые современные цифровые устройства среднего и высшего класса, как правило, обладают такой поддержкой; если ваши компоненты относятся к их числу, обязательно добавьте этот формат к уже привычным FLAC и WAV. Некоторые флагманские смартфоны также совместимы с DSD. И даже пользователи Apple iPhone могут воспроизводить DSD-файлы при помощи дополнительного оборудования.
На сайтах для скачивания музыки время от времени можно встретить обозначения DSF и DFF. Это две разновидности DSD-файлов; все, что реально нужно о них знать – всегда выбирайте версию DSF, если ваш плеер ее поддерживает, поскольку она лучше работает с метаданными (такими как имя исполнителя, название песни, обложка альбома и тому подобные).
Где купить аудиофайлы в формате DSD?
Альбомы в DSD можно приобрести на сайте HDtracks
Большинство крупных сайтов для аудиофилов предлагают возможность покупки DSD-файлов для скачивания. Можно начать с таких источников, как HDtracks, Highresaudio и Primephonic.
Если же вы предпочитаете физические форматы и являетесь обладателем совместимого проигрывателя, SACD можно найти почти повсюду.
Подготовлено по материалам портала «What Hi-Fi?», май 2020 г.
Цифровой звук: DSD vs PCM
Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.
Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?
Аналоговый сигнал
Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).
Рис. 1. Аналоговый сигнал
Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.
Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.
Рис. 2. АЧХ MP3 файла 256 kbps
Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.
Искажения – не что иное, как отклонение сигнала от оригинала.
Принципы представления звука в цифровом виде
Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).
Рис. 3. Преобразование аналогового сигнала в PCM
Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.
Рис. 4. Преобразование аналогового сигнала в DSD
Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.
Восстановление аналогового сигнала из «цифры»
Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20. 22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.
Рис. 5. Восстановление аналогового сигнала из DSD
Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.
Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».
Рис. 6. Восстановление аналогового сигнала из PCM
Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.
Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.
Применение PCM и DSD, достоинства/недостатки
Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?
В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.
Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM
DSD формат аудио | Простое объяснение | Прочтите это сейчас >
Конвертация HD аудио файлов
1. Параметры DSD
Аббревиатура | Direct Stream Digital |
---|---|
Метод кодирования аудио данных | сигма-дельта модуляция (читайте подробности и смотрите видео) |
Битовая разрядность | 1 бит или выше (читайте подробности о качестве звука) |
Частота дискретизации | DSD 64 (2.8 МГц), DSD 128 (5.6 МГц, double), DSD 256 (11.2 МГц, quad), etc. (читайте подробности) |
Количество каналов | Стерео и многоканальный |
Носители | SACD оптический диск, включая hybrid SACD (с CD-аудио слоем), компьютерные файлы [SACD ISO (риппинг альбомов с SACD) и DSF, DFF, CUE+DSF/DFF] (читайте подробности) |
Спецификация | «Scarlet book» (1999) |
Использование | Производство музыки, домашнее hifi/hiend аудио |
Direct Stream Digital является обним из аудиофильских форматов высокого разрешения (high resolution audio). Он был создан для улучшения динамического диапазона CD-аудио в слышимой частотной области звука.
Читайте далее о вопросах качества звука (шум, битовая глубина, полоса, частота дискретизации DSD audio по сравнению с PCM).
2. 1-бит и шум
Как правило, этот формат имеет битовую глубину 1 бит. Поэтому уровнень шума значителен из-за ошибок квантования.
Нойз-шейпинг (НШ) спектра 1-битного сигнала.
Сигма-дельта модуляция
Когда такая 1-битная запись проигрывается, низко-частотный фильтр вырезает «усиленный» высокочастотный шум.
Таким образом, уровень шума 1-битного сигнала после нойз-шейпинга (сигма-дельта модуляции) становится сравнимым с уровнем шума мультибитного сигнала PCM (импульсно-кодовая модуляция).
То есть 1-битная сигма-дельта модуляция может иметь разрешение аудио одинаковое с мультибитным сигналом. Читайте подробности и смотрите видео здесь
3. Частоты дискретизации
Также в качестве основы может быть использовано 48000 кГц. С технической точки зрения не существует ограничения на частоту дискретизации сигма-дельта модулированного сигнала. Но возможно возникновение проблем с совместимостью.
4. Перегрузка и устойчивость
Когда разрабатывается сигма-дельта модулятор, инженеры обращают особое внимание на:
Для решения этих проблем разработчики могут варьировать:
Эти параметры должны рассматриваться в связи друг с другом.
Битовая глубина
Увеличение битового разрешения уменьшает шумы квантования (шумы ошибки квантования).
Нойз-шейпинг
Нойз-шейпинг «выталкивает» энергию ошибки квантования из слышимого диапазона.
Для «выталкивания» большего количества энергии нужно более крутой нойз-шейпинг.
Более крутой нойз-шейпинг увеличивает вероятность срыва стабильности работы сигма-дельта модулятора при перегрузке на входе.
Когда модулятор в нестабильном состоянии, на его выходе отсутствует сигнал или генерируются колебания.
После срыва стабильности модулятор должен быть принудительно перезапущен.
Устойчивость сигма-дельта модулятора к перегрузке
Частота дискретизации
Более высокая частота дискретизации уменьшает уровень спектра ошибки квантования. Потому, что энергия шума распределяется в более широкой полосе. Это позволяет использовать более пологий нойз-шейпинг.
Частота дискретизации и уровень шума квантования
В правой и левой частях изображения площади фигур шума одинаковы. Но фигура, более растянутая по горизонтальной оси, дает более низкий уровень шума.
Увеличение частоты дискретизации позволяет снизить уровень шума в полосе слышимого звука. Это позволяет уменьшить крутизну нойз-шейпинга и увеличить устойчивость модулятора к перегрузке.
Resume
Мы можем видеть, что более низкий уровень шума и более высокая устойчивость модулятора к перегрузке на входе могут быть достигнуты разными путями.
5. DSD в цифрах
Профессиональные аудио модуляторы имеют уровень шума в слышимом звуковом диапазоне для частот дискретизации:
Уровень шума в слышимом диапазоне почти не зависит от демодулятора. Но уровень шума должен быть максимально подавлен вне этой полосы. Так как ультразвуковой шум может привести к интермодуляционным искажениям.
Читайте о DSD vs DSF vs DFF >
6. DSD vs PCM
Direct Stream Digital (сигма-дельта модуляция) очень похожа на импульсно-кодовую модуляцию (PCM), но форма спектра уровня шумов квантования изменена для уменьшения уровня шума в звуковом диапазоне.
Также возможно применение нойз-шейпинга для обычной PCM. Но разница заключена в запасе полосы для «выталкивания» энергии шума из звукового диапазона.
DSD против PCM
PCM имеет меньший резерв полосы (выше звукового диапазона), чем сигма-дельта модуляция, и это обусловлено более высокой битовой глубиной и переходной полосой выходного фильтра ЦАП (цифрово-аналогового преобразователя).
Нойз-шейпинг также может быть использован и для импульсно-кодовой модуляции.
Таким образом, формат сам по себе не имеет преимуществ. Но его реализация может иметь различия в качестве звука.
Читайте подробности здесь >
Посмотрите статью с инфографикой DSD против FLAC >
Читайте статью о ЦАП >
7. Форматы сжатия DSD
SACD диск может быть конвертирован без потерь (losslessly) в SACD ISO файл [1], [2], [3].
SACD ISO файл может быть распакован без потерь в DSF или DFF файлы.
Читайте подробности о файлах DSF и DFF.
1-битные аудио файлы (DSF, DFF, SACD ISO) и диски могут быть сжаты по размеру с помощью метода DST (Direct Stream Transfer).
Также 1-битное аудио может вещаться через сеть.
Несжатое DSD64 требует пропускную способность 2.7 Мбит/с = 44100 Гц * 64 / 1024 / 1024.
Источники, носители Direct Stream Digital
Также связка индексного файла CUE и DSF/DFF аудио файла может содержать 1-битный альбом.
8. DSD проигрыватели
Для вопроизведения DSD на компьютере используются программные аудио плееры. Они могут проигрывать один или несколько 1-битных форматов файлов. Аппаратные DSD проигрыватели могут проигрывать как оптические SACD диски, так и файлы DSF, DFF.
1-битные файлы могут быть воспроизведены непосредственно через DSD ЦАП/проигрыватель или конвертированы в PCM «на лету» для проигрывания с помощью PCM ЦАП. О конвертировании SACD читайте здесь
1-битное проигрывание может быть реализовано через специальный ASIO-драйвер (программные) под Windows, включая DoP (DSD over PCM) формат упаковки аудио (пример).
Оптический SACD диск может быть проигран на аппаратном плеере. Автор не располагает информацией о доступных SACD-приводах для обычных компьютеров, чтобы воспроизводить SACD оптические диски.
Стерео проигрыватель может на лету конвертировать (downmix) многоканальный звук в стерео. Как альтернатива, многоканальные файлы могут быть предварительно конвертированы в стерео. Это позволяет сэкономить ограниченное место на жестком диска портативного проигрывателя аудио (DAP). Даунмикс является обработкой с потерями. Его качество зависит от конкретной реализации.
Читайте еще об аудио плеерах здесь > и здесь >
9. DSD конвертеры
DSD конвертеры предназначены для:
Прочитайте как работают DSD аудио конвертеры здесь >
Список конвертеров (конвертируют все или некоторые виды DSD файлов [DSF, DFF, SACD ISO])
10. Редактирование DSD
Читайте основную статью о редактировании DSD >
DSD редактирование достаточно сложный процесс по причине модулирующего шума в области высоких частот. Нелинейные обработки могут привести к слышимым продуктам интермодуляционных искажений ультразвукового шума.
В настоящее время автор не располагает информацией о «естественной» (native) обработке аудио 1-бит (например: изменение уровня, ресемплинг и пр.) без конвертации 1-бит в мильтибитный формат и обратно. Кроме слияния/разрезания аудио файлов.
Редактирование DSD
PCM в данном контексте может быть рассмотрено, как «мультибитное DSD». Импульсно-кодовая модуляция не обязательно обозначает «24 бит / 352 кГц» и т.п. Автор рекоммендует использовать 32- or 64-bit float (с плавающей запятой) форматы. Рассматриваемый PCM содержит высокочастотный модуляционный шум. Но, для конвертирования этого «мультибитного DSD» в 1-бит необходима модуляция с нойз шейпингом.
Потери при редактировании с 1-бит/мультибит преобразованием примерно сравнимы с ресемплингом.
Звукозаписывающие студии могут распространять DSD записи без редактирования.
Также существует DXD формат. Это PCM (как правило, «24 bit / 352 kHz» и т.п.) с высокими частотами дискретизации, битовыми разрешениями и «наследственным» высокочастотным шумом DSD. К сожалению, этот шум может привести к слышимым продуктам нелинейных искажений. рекомендуется вырезать (фильтровать) этот шум перед нелинейными обработками.