SpeexSpeex - поддержка в приложениях. Speex это формат сжатия аудио, разработанный специально для голоса.
Speex поддерживает большое количество приложений, от потоковых приложений (телеконференции) до видеоигр и программ обработки звука.
Если звуковой файл с записью голоса имеет слишком большой объем, то его надо подвергнуть жесткой компрессии. Правильно выбранная программа поможет сделать это без заметных потерь в качестве, однако размер файла может сократиться весьма и весьма значительно. Если перед вами часто встает подобная задача, то попробуйте использовать Speex.
Эта программа предназначена специально для компрессии файлов с записью человеческого голоса при низком битрейте (потоке данных за секунду). Speex представляет собой кодек, разработанный для работы именно с голосом, и, как утверждают его создатели, показывает весьма неплохие характеристики - как в широком, так и в узком диапазоне частот. Обработанный при помощи Speex файл уже можно запросто отправлять через Интернет друзьям или родственникам, не опасаясь, что передача затянется на час или два.
Основные характеристики кодека:
- Свободное и открытое программное обеспечение, не имеет патентных ограничений
- Интеграция широко- и узкополосного канала в одном потоке данных
- Динамическое переключение битрейта и переменный битрейт (англ. Variable bit-rate, VBR)
- Детектор речевой активности (англ. Voice Activity Detection, VAD, интегрирован с VBR)
- Variable complexity
- Опция энкодера - интенсивное стерео (англ. Intensity stereo)
Частота дискретизации
Основными для Speex являются три частоты дискретизации (сэмплирования): 8 КГц (та же частота используеся для передачи телефонных звонков), 16 КГц и 32 КГц. Допускается использование и других частот, но Speex не оптимизирован для использования с ними.
Качество
Процесс кодирования речи контролизуется специальным параметром, представляющим собой число в диапазоне от 0 до 10. В режиме с постоянным битрейтом (англ. Constant bit-rate, CBR) параметр качества — целое число, а в режиме с переменным битрейтом — число с плавающей запятой.
Сложность (изменяемая)
Speex позволяет изменять сложность работы кодировщика. Процесс управления поиском осуществляется с помощью целого числа от 1 до 10, аналогично использованию опций от -1 до -9 в утилитах сжатия семейства gzip. В обычных условия, уровень шума при сложности 1 на 1-2 дБ выше чем при сложности 10, но загрузка процессора при сложности 10 выше приблизительно в 5 раз. На практике лучшим выбором вероятно будет диапазон чисел от 2 до 4, но для кодирования неречевых сигналов (например DTMF — двухтональный многочастотный набор телефонного номера), могут оказаться полезными и более высокие значения.
|