Детектор подлинности аудиозаписей (Aucdtect)
Aucdtect (CD authenticity detector) это алгоритм, разработанный для определения подлинности музыкальных компакт-дисков (CD) и записей, распространяемых в цифровом формате без потерь, например True Audio (TTA). Оценивая характер аудиоданных, содержащихся на компакт-диске, Aucdtect может различать оригинальные студийные записи и те, которые были «реконструированы» с использованием источника звука с потерями, например MP3.
Описание алгоритма Aucdtect
Алгоритм работы программы состоит в анализе Фурье-спектров временных отрезков сигнала на протяжении всей звукозаписи и вычислении характерной граничной частоты на каждом временном отрезке. На основе анализа их статистических характеристик и базируясь на наборе критериев определяется источник звукозаписи – оригинал или сжатый с потерей качества звуковой файл. Тестирование, проведенное как на современных, так и на менее качественных старых записях показало хорошую точность алгоритма, устойчиво отличающего оригинальные записи от восстановленных из сжатых с потерей информации данных.
Не секрет, что интернет и файлообменные сети сейчас буквально наводнены музыкой. Форматы с потерями, такие как MP3, предлагают самую высокую степень сжатия и, несомненно, являются самыми популярными средствами обмена файлами. При воспроизведении через относительно низкокачественные аудиосистемы звук, предлагаемый такими файлами, часто неотличим от звука CD-качества для обычного человеческого уха. Однако аудиодорожки с потерями плохо воспроизводятся на Hi-Fi-системах или при прослушивании через пару качественных стереонаушников.
Поэтому, при приобретении музыкальных компакт-дисков всегда встает вопрос: а действительно-ли этот диск не является подделкой? Для определения этого можно использовать спектральные характеристики сигнала, поскольку потерьные (lossy) алгоритмы существенно искажают эти характеристики сигнала, в отличие от оригинальной записи.
Алгоритм определения подлинности записи заключается в следующем:
1. Последовательно считывается каждый канал музыкальной записи. 2. На некотором отрезке вычисляется логарифм спектральной мощности с небольшой аддитивной добавкой для исключения ошибки вычисления логарифма [1]:
2. Определяется разброс значений логарифма спектра. Максимальная частота сигнала, на которой разброс резко возрастает считается граничной, соответствующей некоей максимальной характерной частоте в спектре звукового сигнала, не связанной с числовыми статистическими шумами σ [3].
,где || s(f,T,Δf) || разброс значений s(f,T) в интервале частот [f,f + Δf].
3. По статистическому распределению граничных частот определяются две характерных частоты – средняя граничная частота и максимально вероятная граничная частота.
4. Фазовые характеристики спектров сигналов подвергаются статистической обработке для получения фазового распределения высокочастотной части сигнала.
5. Aucdtect алгоритм использует рассчитанные характеристики сигнала в качестве входных данных для специально созданной и обученной (по методике генетического алгоритма) оригинальной нейронной сети с многоуровневой обработкой, и использует результаты на выходе этой сети для статистического заключения о наличии или отсутствии MPEG-артефактов.
6. Вывод об источнике для всего аудиодиска делется методом максимального правдоподобия (дает наиболее точное решение), используя выходы нейронной сети для всех аудиодорожек и статистические распределения, полученные в режиме обучения алгоритма.
Проведенное тестирование показало устойчивость работы алгоритма Aucdtect как на современных записях, так и на копиях старых записей, для различных музыкальных направлений от классической до поп — музыки и одинаково устойчиво определяло их как подлинные. Тестируемые диски, которые были изначально определены, как восстановленные из сжатых с потерей информации данных, устойчиво определялись, как не подлинные.
Литература
- R.E.Blahut, Fast algorithms for Digital Signal Processing, (1985), 446.
- G.A.Korn, T.M.Korn, Mathematical handbook for scientists and engineers (1968) 832.