FLAC: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Дополнение модификации формата. С 09.2020
Метки: с мобильного устройства через мобильное приложение через приложение для Android App section source
(не показано 10 промежуточных версий 7 участников)
Строка 1: Строка 1:
{{Карточка программы
{{Карточка программы
| name = Free Lossless Audio Codec
| name = Free Lossless Audio Codec
| logo = FLAC logo inverted.png
| logo = FLAC logo vector.svg
| screenshot =
| screenshot =
| caption =
| caption =
| developer = Josh Coalson, [[Xiph.Org Foundation]]
| developer = Josh Coalson, Tim Miller [[Xiph.Org Foundation]]
| released = [[20 июля]] [[2001]]
| released = [[20 июля]] [[2001]]
| operating_system = [[Кроссплатформенное программное обеспечение|кроссплатформенный]]
| operating_system = [[Кроссплатформенное программное обеспечение|кроссплатформенный]]
| genre = [[аудиокодек]], [[Список аудиоформатов файлов|формат аудиофайлов]]
| genre = [[аудиокодек]], [[Список аудиоформатов файлов|формат аудиофайлов]]
| license = [[GNU GPL]]; [[лицензия BSD|BSD]] (Parts)
| license = [[GNU GPL]]; [[лицензия BSD|BSD]] (Некоторые части)
| website = https://xiph.org/flac
| website = https://xiph.org/flac
}}
}}
'''FLAC''' ({{lang-en|Free Lossless Audio Codec}}) — [[Свободное программное обеспечение|свободный]] [[кодек]], предназначенный для [[Сжатие данных|сжатия]] [[Цифровая звукозапись|аудиоданных]] [[Сжатие без потерь|без потерь]].
{{Файловый формат
| name = FLAC
| icon =
| logo = FLAC logo inverted.png
| type code =
| uniform type =
| magic =
| owner =
| genre = аудио
| container for =
| contained by =
| extended from =
| extended to =
| standard = [http://flac.sourceforge.net/format.html Спецификация]
}}
'''FLAC''' ({{lang-en|Free Lossless Audio Codec}}) — [[Свободное программное обеспечение|свободный]] [[кодек]], предназначенный для [[Сжатие данных|сжатия]] аудиоданных [[Сжатие без потерь|без потерь]].


В отличие от аудиокодеков, обеспечивающих [[сжатие с потерями]] ([[MP3]], [[AAC]], [[WMA]], [[Ogg Vorbis]], [[Opus (кодек)|Opus]]), FLAC, как и любой другой [[lossless]]-кодек, не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высококачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции.
В отличие от [[Аудиокодек|аудиокодеков]], обеспечивающих [[сжатие с потерями]] ([[MP3]], [[AAC]], [[WMA]], [[Ogg Vorbis]], [[Opus (кодек)|Opus]]), FLAC, как и любой другой [[lossless]]-кодек, не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высококачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции.


Сегодня формат FLAC поддерживается множеством аудиоприложений, портативных аудиоплееров и специализированных аудиосистем и имеет большое число разнообразных аппаратных реализаций<ref name="hardware">{{cite web |url=https://xiph.org/flac/links.html#hardware |title=Links |publisher=FLAC |accessdate=2015-10-06 |archive-date=2017-01-28 |archive-url=https://web.archive.org/web/20170128193920/https://xiph.org/flac/links.html#hardware |deadlink=no }}</ref>. Формат FLAC5D поддерживается более продвинутыми системами.
Сегодня формат FLAC поддерживается множеством аудиоприложений, портативных [[Медиапроигрыватель|аудиоплееров]] и специализированных [[Акустическая система|аудиосистем]] и имеет большое число разнообразных аппаратных реализаций<ref name="hardware">{{cite web |url=https://xiph.org/flac/links.html#hardware |title=Links |publisher=FLAC |accessdate=2015-10-06 |archive-date=2017-01-28 |archive-url=https://web.archive.org/web/20170128193920/https://xiph.org/flac/links.html#hardware |deadlink=no }}</ref>. Формат FLAC 5D поддерживается более продвинутыми системами.


== Сведения о формате ==
== Сведения о формате ==
Строка 40: Строка 25:
* Другие необязательные блоки метаданных
* Другие необязательные блоки метаданных
* [[Фрейм|Аудиофреймы]]
* [[Фрейм|Аудиофреймы]]
Первые четыре байта идентифицируют поток FLAC. Следующие за ними [[метаданные]] содержат информацию о потоке, затем идут сжатые аудиоданные.
Первые четыре байта идентифицируют поток FLAC. Следующие за ними [[метаданные]] содержат информацию о потоке, затем идут сжатые аудиоданные{{Нет АИ|06|06|2023}}.


=== Метаданные ===
=== Метаданные ===
По состоянию на 10.03.2010 в libflac-1.2.1 определены следующие типы блоков: StreamInfo, Padding, Application, SeekTable, VorbisComment, CueSheet, Picture, Unknown. Блоки метаданных могут быть любого размера, не представляет большого труда добавление новых блоков. Неизвестные блоки метаданных декодер пропускает.
По состоянию на 10.03.2010 в libflac-1.2.1 определены следующие типы блоков: StreamInfo, Padding, Application, SeekTable, VorbisComment, CueSheet, Picture, Unknown. Блоки метаданных могут быть любого размера, не представляет большого труда добавление новых блоков. Неизвестные блоки метаданных декодер пропускает.


Блок STREAMINFO — обязательный. В нём содержатся данные, позволяющие декодеру настроить [[Буфер (информатика)|буферы]], [[Частота дискретизации|частоту дискретизации]], количество каналов, количество бит на семпл и количество семплов. Также в блок записывается подпись [[MD5]] несжатых аудиоданных. Это полезно для проверки всего потока после его передачи.
Блок STREAMINFO — обязательный. В нём содержатся данные, позволяющие декодеру настроить [[Буфер (информатика)|буфера]], [[Частота дискретизации|частоту дискретизации]], количество каналов, количество бит на семпл и количество [[Семпл|семплов]]. Также в блок записывается подпись [[MD5]] несжатых аудиоданных. Это полезно для проверки всего потока после его передачи.


Другие блоки предназначены для резервирования места, хранения таблиц точек поиска, [[Тег (метаданные)|тегов]], список разметки аудиодисков, а также данных для конкретных приложений. Опции для добавления блоков PADDING или точек поиска приведены ниже. FLAC не нуждается в точках поиска, однако они позволяют значительно увеличить скорость доступа, а также могут быть использованы для расстановки меток в аудиоредакторах.
Другие блоки предназначены для резервирования места, хранения таблиц точек поиска, [[Тег (метаданные)|тегов]], список разметки аудиодисков, а также данных для конкретных приложений. Опции для добавления блоков PADDING или точек поиска приведены ниже. FLAC не нуждается в точках поиска, однако они позволяют значительно увеличить скорость доступа, а также могут быть использованы для расстановки меток в [[Аудиоредактор|аудиоредакторах]].


Точное описание структур стандартных блоков можно найти в файле format.h библиотеки libflac, доступной на сайте формата.
Точное описание структур стандартных блоков можно найти в файле format.h библиотеки libflac, доступной на сайте формата.
Строка 55: Строка 40:


=== Разбиение на блоки ===
=== Разбиение на блоки ===
Размер блока — очень важный параметр для кодирования. Если он слишком мал, то в потоке будет чересчур много заголовков фреймов, что уменьшит уровень сжатия. Если же размер большой, то кодер не сможет подобрать эффективную модель сжатия. Понимание процесса моделирования помогает увеличить уровень сжатия для некоторых типов входных данных. Обычно при использовании линейного прогнозирования на аудиоданных с частотой дискретизации 44,1 кГц оптимальный размер блока лежит в диапазоне 2-6 тыс. семплов.
Размер блока — очень важный параметр для кодирования. Если он слишком мал, то в потоке будет чересчур много заголовков фреймов, что уменьшит уровень сжатия. Если же размер большой, то кодер не сможет подобрать эффективную модель сжатия. Понимание процесса моделирования помогает увеличить уровень сжатия для некоторых типов входных данных. Обычно при использовании линейного прогнозирования на аудиоданных с частотой дискретизации 44,1 кГц оптимальный размер блока лежит в диапазоне 2-6 тыс. семплов{{Нет АИ|06|06|2023}}.


=== Межканальная декорреляция ===
=== Межканальная декорреляция ===
Строка 61: Строка 46:


=== Моделирование ===
=== Моделирование ===
На следующем этапе кодер пытается [[Аппроксимация|аппроксимировать]] сигнал такой функцией, чтобы полученный после её вычитания из оригинала результат (называемый разностью, остатком, ошибкой) можно было закодировать минимальным количеством битов. Параметры функций тоже должны записываться, поэтому они не должны занимать много места. FLAC и FLAC5D используют два метода формирования аппроксимаций:
На следующем этапе кодер пытается [[Аппроксимация|аппроксимировать]] сигнал такой функцией, чтобы полученный после её вычитания из оригинала результат (называемый разностью, остатком, ошибкой) можно было закодировать минимальным количеством [[Бит|битов]]. Параметры функций тоже должны записываться, поэтому они не должны занимать много места. FLAC и FLAC 5D используют два метода формирования [[Аппроксимация|аппроксимаций]]:


* подгонка простого полинома к сигналу
* подгонка простого [[Многочлен|полинома]] к сигналу
* общее кодирование с линейными предикторами (LPC).
* общее кодирование с линейными предикторами (LPC).


Строка 76: Строка 61:


=== Составление фреймов ===
=== Составление фреймов ===
Аудиофрейму предшествует заголовок, который начинается с кода синхронизации и содержит минимум информации, необходимой декодеру для воспроизведения потока. Сюда также записывается номер блока или семпла и восьмибитная контрольная сумма самого заголовка. Код синхронизации, [[Циклический избыточный код|CRC]] заголовка фрейма и номер блока/семпла позволяют выполнять пересинхронизацию и поиск даже в отсутствие точек поиска. В конце фрейма записывается его шестнадцатибитная контрольная сумма. Если базовый декодер обнаружит ошибку, то будет сгенерирован блок тишины.
Аудиофрейму предшествует заголовок, который начинается с кода синхронизации и содержит минимум информации, необходимой декодеру для воспроизведения потока. Сюда также записывается номер блока или семпла и восьмибитная контрольная сумма самого заголовка. Код синхронизации, [[Циклический избыточный код|CRC]] заголовка фрейма и номер блока/семпла позволяют выполнять пересинхронизацию и поиск даже в отсутствие точек поиска. В конце фрейма записывается его шестнадцатибитная [[контрольная сумма]]. Если базовый декодер обнаружит ошибку, то будет сгенерирован блок тишины.


=== Разное ===
=== Разное ===
Строка 82: Строка 67:
Чтобы поддерживать основные типы метаданных, базовый декодер умеет пропускать [[ID3 (метаданные)|теги ID3v1 и ID3v2]], поэтому их можно свободно добавлять. Теги ID3v2 должны располагаться перед маркером «fLaC», а теги ID3v1 — в конце файла.
Чтобы поддерживать основные типы метаданных, базовый декодер умеет пропускать [[ID3 (метаданные)|теги ID3v1 и ID3v2]], поэтому их можно свободно добавлять. Теги ID3v2 должны располагаться перед маркером «fLaC», а теги ID3v1 — в конце файла.


Существуют модификации FLAC кодера: [[Improved FLAC encoder]], [[Flake]], FLAC5D и FLACCL.
Существуют модификации FLAC кодера: [[Improved FLAC encoder]], [[Flake]], FLAC 5D и FLACCL.


29 января 2003 г. Xiphophorus (сейчас называется [[Xiph.Org]] Foundation) анонсировали включение формата FLAC в линейку своих продуктов: [[Ogg]] [[Vorbis]], [[Theora]] и [[Speex]]<ref name="xiph">{{cite web|url=http://xiph.org/ogg/flac.html |title=FLAC Joins Xiph! |lang=en |accessdate=2008-10-30 |deadlink=404 |archiveurl=https://web.archive.org/web/20070630155035/http://xiph.org/ogg/flac.html |archivedate=2007-06-30 }}</ref>.
29 января 2003 г. Xiphophorus (сейчас называется [[Xiph.Org]] Foundation) анонсировали включение формата FLAC в линейку своих продуктов: [[Ogg]] [[Vorbis]], [[Theora]] и [[Speex]]<ref name="xiph">{{cite web|url=http://xiph.org/ogg/flac.html |title=FLAC Joins Xiph! |lang=en |accessdate=2008-10-30 |deadlink=404 |archiveurl=https://web.archive.org/web/20070630155035/http://xiph.org/ogg/flac.html |archivedate=2007-06-30 }}</ref>.

Версия от 14:40, 18 декабря 2024

Free Lossless Audio Codec
Логотип программы Free Lossless Audio Codec
Скриншот программы Free Lossless Audio Codec
Тип аудиокодек, формат аудиофайлов
Разработчики Josh Coalson, Tim Miller Xiph.Org Foundation
Написана на Си[3]
Операционная система кроссплатформенный
Первый выпуск 20 июля 2001
Последняя версия
Репозиторий gitlab.xiph.org/xiph/flac
Лицензия GNU GPL; BSD (Некоторые части)
Сайт xiph.org/flac
Логотип Викисклада Медиафайлы на Викискладе

FLAC (англ. Free Lossless Audio Codec) — свободный кодек, предназначенный для сжатия аудиоданных без потерь.

В отличие от аудиокодеков, обеспечивающих сжатие с потерями (MP3, AAC, WMA, Ogg Vorbis, Opus), FLAC, как и любой другой lossless-кодек, не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высококачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции.

Сегодня формат FLAC поддерживается множеством аудиоприложений, портативных аудиоплееров и специализированных аудиосистем и имеет большое число разнообразных аппаратных реализаций[4]. Формат FLAC 5D поддерживается более продвинутыми системами.

Сведения о формате

Аудиопоток

Основными частями потока являются:

Первые четыре байта идентифицируют поток FLAC. Следующие за ними метаданные содержат информацию о потоке, затем идут сжатые аудиоданные[источник не указан 586 дней].

Метаданные

По состоянию на 10.03.2010 в libflac-1.2.1 определены следующие типы блоков: StreamInfo, Padding, Application, SeekTable, VorbisComment, CueSheet, Picture, Unknown. Блоки метаданных могут быть любого размера, не представляет большого труда добавление новых блоков. Неизвестные блоки метаданных декодер пропускает.

Блок STREAMINFO — обязательный. В нём содержатся данные, позволяющие декодеру настроить буфера, частоту дискретизации, количество каналов, количество бит на семпл и количество семплов. Также в блок записывается подпись MD5 несжатых аудиоданных. Это полезно для проверки всего потока после его передачи.

Другие блоки предназначены для резервирования места, хранения таблиц точек поиска, тегов, список разметки аудиодисков, а также данных для конкретных приложений. Опции для добавления блоков PADDING или точек поиска приведены ниже. FLAC не нуждается в точках поиска, однако они позволяют значительно увеличить скорость доступа, а также могут быть использованы для расстановки меток в аудиоредакторах.

Точное описание структур стандартных блоков можно найти в файле format.h библиотеки libflac, доступной на сайте формата.

Аудиоданные

За метаданными следуют сжатые аудиоданные. Метаданные и аудиоданные не чередуются. Как и большинство кодеков, FLAC делит входной поток на блоки и кодирует их независимо друг от друга. Блок упаковывается во фрейм и добавляется к потоку. Базовый кодер использует блоки постоянного размера для всего потока, однако формат предусматривает наличие блоков разной длины в потоке.

Разбиение на блоки

Размер блока — очень важный параметр для кодирования. Если он слишком мал, то в потоке будет чересчур много заголовков фреймов, что уменьшит уровень сжатия. Если же размер большой, то кодер не сможет подобрать эффективную модель сжатия. Понимание процесса моделирования помогает увеличить уровень сжатия для некоторых типов входных данных. Обычно при использовании линейного прогнозирования на аудиоданных с частотой дискретизации 44,1 кГц оптимальный размер блока лежит в диапазоне 2-6 тыс. семплов[источник не указан 586 дней].

Межканальная декорреляция

Если на вход поступают стереоаудиоданные, они могут пройти через стадию межканальной декорреляции. Правый и левый канал преобразуются к среднему и разностному по формулам: средний = (левый + правый)/2, разностный = левый — правый. В отличие от joint stereo, используемом в lossy-кодерах, в lossless-кодировании этот процесс не приводит к потерям. Для данных с аудиодисков это обычно приводит к значительному увеличению уровня сжатия.

Моделирование

На следующем этапе кодер пытается аппроксимировать сигнал такой функцией, чтобы полученный после её вычитания из оригинала результат (называемый разностью, остатком, ошибкой) можно было закодировать минимальным количеством битов. Параметры функций тоже должны записываться, поэтому они не должны занимать много места. FLAC и FLAC 5D используют два метода формирования аппроксимаций:

  • подгонка простого полинома к сигналу
  • общее кодирование с линейными предикторами (LPC).

Во-первых, постоянное полиномиальное предсказание (-l 0) работает значительно быстрее, но менее точно, чем LPC. Чем выше порядок LPC, тем медленнее, но лучше будет модель. Однако с увеличением порядка выигрыш будет всё менее значительным. В некоторой точке (обычно около 9) процедура кодера, определяющая наилучший порядок, начинает ошибаться и размер получаемых фреймов возрастает. Чтобы преодолеть это, можно использовать полный перебор, что приведёт к значительному увеличению времени кодирования.

Во-вторых, параметры для постоянных предикторов могут быть описаны тремя битами, а параметры для модели LPC зависят от количества бит на семпл и порядка LPC. Это значит, что размер заголовка фрейма зависит от выбранного метода и порядка и может повлиять на оптимальный размер блока.

Остаточное кодирование

Когда модель подобрана, кодер вычитает приближение из оригинала, чтобы получить остаточный (ошибочный) сигнал, который затем кодируется без потерь. Для этого используется то обстоятельство, что разностный сигнал обычно имеет распределение Лапласа и есть набор энтропийных кодов, называемый кодами Райса, позволяющий эффективно и быстро кодировать эти сигналы без использования словаря.

Кодирование Райса состоит из нахождения одного параметра, отвечающего распределению сигнала, а затем использования его для составления кодов. При изменении распределения меняется и оптимальный параметр, поэтому имеется метод, позволяющий пересчитывать его по необходимости. Остаток может быть разбит на контексты или разделы, у каждого из которых будет свой параметр Райса. FLAC позволяет указать, как нужно производить разбиение. Остаток может быть разбит на 2n разделов.

Составление фреймов

Аудиофрейму предшествует заголовок, который начинается с кода синхронизации и содержит минимум информации, необходимой декодеру для воспроизведения потока. Сюда также записывается номер блока или семпла и восьмибитная контрольная сумма самого заголовка. Код синхронизации, CRC заголовка фрейма и номер блока/семпла позволяют выполнять пересинхронизацию и поиск даже в отсутствие точек поиска. В конце фрейма записывается его шестнадцатибитная контрольная сумма. Если базовый декодер обнаружит ошибку, то будет сгенерирован блок тишины.

Разное

Чтобы поддерживать основные типы метаданных, базовый декодер умеет пропускать теги ID3v1 и ID3v2, поэтому их можно свободно добавлять. Теги ID3v2 должны располагаться перед маркером «fLaC», а теги ID3v1 — в конце файла.

Существуют модификации FLAC кодера: Improved FLAC encoder, Flake, FLAC 5D и FLACCL.

29 января 2003 г. Xiphophorus (сейчас называется Xiph.Org Foundation) анонсировали включение формата FLAC в линейку своих продуктов: Ogg Vorbis, Theora и Speex[5].

Примечания

  1. FLAC 1.4.3 Released With More Optimizations, Drops PowerPC-Specific Code — 2023.
  2. 1 2 3 4 5 6 7 8 9 10 https://xiph.org/flac/documentation_tools_flac.html
  3. The flac Open Source Project on Open Hub: Languages Page — 2006.
  4. Links. FLAC. Дата обращения: 6 октября 2015. Архивировано 28 января 2017 года.
  5. FLAC Joins Xiph! (англ.). Дата обращения: 30 октября 2008. Архивировано 30 июня 2007 года.

Ссылки