JPEG2000 - Новая волна в сжатии изображений
Потребность в обмене файлами изображений и видео между пользователями из различных отраслей была всегда. Реально это достигалось посредством различных утилит преобразования форматов.
Быстрая конвергенция телекоммуникационной, компьютерной и телевизионной индустрий и необходимость "бесшовного" взаимодействия между продуктами этих индустрий делает настоятельной стандартизацию компрессии изображения и файлового формата.
На настоящее время нет нехватки в форматах изображений и сжатия изображений. Чего недостает - так это некоторой объединенной структуры, которая способствовала бы функциональным возможностям, которые требуются новым моделям пользования, созданными новыми технологиями типа Internet и беспроводных коммуникаций. Более того, быстрое развитие цифровых технологий изображений и возможность недорогой цифровой обработки изображения поощряет необходимость интегрированного стандарта изображения, который будет обеспечивать высокое качество компрессии изображений от различных источников и манипуляцию компрессированным битовым потоком.
В создании JPEG2000 (ISO15444 на языке ISO) приняли участие многие представители академических и промышленных кругов, таких как Motorola, Kodak, Canon, Texas Instruments, HP, Sharp, Sony, Nokia и Ericsson . Несколько членов комитета JPEG2000, включая Motorola Australian Research Centre, представили технологии, пригодные для компрессии изображений и на конференции комитета JPEG2000 в Сиднее в 1977г. было выбрано базовое решение по вейвлет-преобразованию.
С этого момента участники работали вместе по улучшению системы компрессии, которая сейчас входит в JPEG2000. Он разработан для обслуживания различных типов неподвижных изображений, включая полутоновые, цветные, двухуровненные и многокомпонентные. Пространственное разрешение (в пикселях) изображений, которые могут быть сжаты, изменяется от иконок до гигантских размеров, пригодных для спутниковых применений.
При низких скоростях передачи, характеристики JPEG2000 превосходят параметры текущего JPEG. Цель этой статьи заключается в том, чтобы дать некоторую базовую информацию о технологиях, лежащих в основе JPEG2000 и о параметрах, которые отличают его от JPEG - текущего стандарта неподвижных изображений.
Базовое введение в общую технологию сжатия изображений будет, по-видимому, хорошим началом.
Важно отметить различие между системой компрессии изображений и файловым форматом, который позволяет обмениваться сжатыми данными. Для примера, формат изображения JFIF - это контейнер для JPEG-кодированного изображения. В общем, система сжатия изображения состоит из трех подсистем, как показано на рис. 1. Система декомпрессии обратна процессу компрессии. В системе компрессии пиксели входного изображения проходят тщательно выбранное математическое преобразование, которое переупорядочивает информационное содержание оригинальных пикселей так, что они располагаются более компактно в новом информационном пространстве. Этим способом, если это возможно, в течении процесса квантования отбрасываются визуально менее значимые преобразованные коэффициенты. Для примера, текущий стандарт JPEG использует дискретное косинусное преобразование (DCT) на этой стадии процесса компрессии. В JPEG2000 преобразование достигается через дискретное вейвлет-преобразование (DWT).
У каждого преобразования свои преимущества, но DWT предлагает большую гибкость в смысле сжатия изображения и манипуляции преобразованными коэффициентами для достижения разнообразных желательных характеристик, таких как масштабируемость разрешения и масштабируемость качества. Далее, когда желательно достигнуть высокой степени компрессии, DWT предлагает лучшую начальную позицию по сравнению с DCT.
Как указывалось ранее, процесс преобразования обеспечивает более полезное представление пикселей изображения и прокладывает дорогу для эффективной стратегии квантования. Сам по себе процесс трансформации не приводит к компрессии изображения. В пределах ограничений арифметической точности, возможной для данного компьютера, этот процесс полностью обратим.
Одним из преимуществ DWT над DCT является возможность целочисленного вейвлет-преобразования, которое отображает целое число, скажем, значение пикселя изображения, в другое целое число. DCT, между тем, работает с числами с плавающей точкой и подвержено, поэтому, ошибкам округления. Итак, система компрессии, основанная на DWT, такая как JPEG2000, действительно может не иметь потерь.
В стандарте JPEG2000 это возможно внутри интегрированной системы кодирования изображения без каких-либо потерь. Более того, в DWT имеется набор парных цифровых фильтров, которые могут использоваться для осуществления преобразования. Это вносит возможность выбора фильтровых пар, зависящих от характеристик изображения. В случае с DCT ассоциированная фильтровая система фиксирована.
Процесс квантования проверяет трансформированные пиксели и, используя "человеческую" стратегию восприятия изображения, отбрасывает трансформированные пиксели, которые не дают значительного вклада в декомпрессированное изображение. Легко понять, что большая доля уменьшения данных и, таким образом, компрессии, приходится на квантизатор. Используя повторяющиеся структуры, оставшиеся в квантованных данных, энтропийный кодировщик достигает дальнейшей компрессии.
Процесс энтропийного кодирования не имеет никаких потерь, и энтропийный декодер при декомпрессии может регенерировать выход квантизатора. Выход энтропийного кодера обычно встроен совместно с другой информацией, необходимой для корректной работы системы декомпрессии, в поток кода, который инкапсулирован в файловый формат. Декомпрессионная система работает в битовом потоке в потоке кода и реверсирует все процессы, которые составляли компрессию. Система декомпрессии также показана на рис. 1.
Текущей стандарт компрессии изображения (JPEG) способен предложить различные функциональные возможности через 44 различных режима работы. Разумеется, большинство этих режимов являются специальными приложениями и неприменимы к большинству JPEG декодеров. Пользователи часто жалуются, что JPEG часто не очень хорошо работает с изображениями, сгенерированными компьютером.
Этот ляпсус вызван тем фактом, что текущий JPEG был оптимизирован для естественных изображений. Подобные плохие характеристики отмечались, когда компрессировались сложные документы, содержащие смесь двухуровненной или текстовой части и естественных изображений. Также под вопросом характеристики текущего JPEG, когда требуется высокий уровень компрессии (низкая скорость передачи данных) - наблюдаются сопутствующие блоковые артифакты, очень неприятные при просмотре изображения.
Структура системы компрессии JPEG2000 позволяет разнообразие компрессии и эффективный доступ к потоку кода без полного декодирования. Входное изображение может быть разделено на неперекрывающиеся прямоугольные области, называемые плитками (tiles). Эта схема позволяет независимое кодирование и декодирование tile-компонент. Каждый tile-компонент передается трансформирующей подсистеме, где при помощи DWT выполняется его декомпозиция в несколько уровней поддиапазонов. Далее, коэффициенты подполос квантизируются, чтобы уменьшить количество данных.
DWT декомпозиция недорогая в том смысле, что число образованных коэффициентов такое же, как и число образцов в tile-компоненте. Двоичная декомпозиция в уровни поддиапазонов, предоставляемая DWT, подразумевает, что изображение с более низким разрешением может быть получено при декодировании соответствующего числа поддиапазонов. Другой уровень структуры, который делает гибким доступ к кодовому потоку - деление квантованных поддиапазонов данных на код-блоки. В действительности, код-блок является единицей данных, которая передается на энтропийный кодер, который выполняет трехпроходное индивидуальное бит-плоское кодирование квантизированных коэффициентов. Энтропийный кодер основан на арифметическом оцифровщике. Идея трехпроходного кодирующего процесса дает возможность достичь сжатые данные на этом уровне путем группирования бит-потока, возникающего при каждом проходе в слои. Следовательно, декодируя последовательные слои бит-потока можно получить изображение с увеличивающимся качеством.
Последняя структура - это пакет, который включает часть одного слоя из уровня декомпозиции tile-компоненты. Это представляет другой независимый блок доступа к пространственной области изображения из кодового потока.
Используя эту конструкцию, JPEG2000 предлагает характеристики в интегрированном кодовом потоке, которые невозможны с текущим JPEG стандартом компрессии изображения. Т.к. доступ к индивидуальным tile-компонентам может быть произведен из потока кода, различные пространственные области изображения могут быть декодированы и отображены. Для примера, большое спутниковое изображение может быть просмотрено без декодирования изображения в целом, декодируя только области, представляющие интерес.
Маска региона, представляющего интерес, может быть использована для селективного кодирования определяемого пользователем переднего плана с более высоким качеством, чем заднего. Интеллектуальная стратегия исправления ошибок делает JPEG2000 пригодным для использования в зашумленных беспроводных каналах.
Другая важная характеристика структуры компрессионной системы JPEG2000 - это возможность декодирования, из единого кодового потока, различных пространственных разрешений изображения. Это называется масштабируемостью разрешения. Используя один и тот же кодовый поток, изображения с различной точностью вплоть до абсолютно точных, могут быть декодированы - это называется масштабируемостью качества.
Основанный на wavelet-преобразовании, Jpeg2000 совместил в себе целый ряд инноваций, расширяющих возможности систем видеонаблюдения. Это покадровый метод компрессии видеоданных, его особенность состоит в том, что каждый кадр сжимается независимо от соседних. Такая изначальная ориентация формата имеет преимущество перед алгоритмами с межкадровой компрессией (MPEG-2, MPEG-4, H.264) и обеспечивает одинаково высокое качество всех записанных кадров.
Использование формата сжатия Jpeg2000 позволяет проводить криминалистические экспертизы записей и применять средства автоматической обработки архивных данных на более высоком уровне. В отличие от сходных форматов с покадровым методом компрессии Jpeg2000 - вместо дискретного косинусного преобразования – использует технологию wavelet-преобразования, основанную на представлении сигнала в виде волновых пакетов. За счет этого устраняется эффект, когда при увеличении сжатия появляются характерные хорошо заметные артефакты, например, блочность (разбиение изображения на блоки 8х8 пикселей), замыливание (потеря мелких деталей изображения) и т.д.
В применении к задачам записи видеопотоков Jpeg2000 обладает следующими основными преимуществами:
- более высокая степень сжатия по сравнению с JPEG в среднем на 20%;
- отношение сигнал/шум: Jpeg2000 обеспечивает эффективную организацию кодового потока;
- JPEG2000 обеспечивает как сжатие с потерями, так и сжатие без потерь.
Jpeg2000 устойчив к битовым ошибкам, которые вносятся зашумленными каналами связи. Это достигается путем вставки маркеров ресинхронизации, кодирования данных в относительно небольшие независимые блоки, и обеспечение механизмов для нахождения и локализации ошибок.
Имеются также дополнительные, не отмеченные в данной статье, интересные и уникальные характеристики в JPEG2000, которые сделают эту технологию технологией выбора в следующем поколении "изобразительных" продуктов. Ожидается, что широкое принятие этого стандарта будет способствовать введению инновационных продуктов работы с изображениями и приложений, которые могут использовать его замечательные гибкость и охват. Нет сомнения, стандарт JPEG2000 предлагает долгожданное решение в индустрии, требующей новую технологию для поддержки приложений, касающихся чрезвычайных сценариев.
Обзор для видеокамер с режимом 4 в 1 (AHD/CVI/TVI/CVBS) по переключению режимов без DIP переключателя.
Новый протокол XVI (AXVI) от известного разработчика XM Xiongmai Technology.
Выбирайте лучшее, но для начала определимся с критериями
Есть консьержка, а в подъезде постоянно неприятно пахнет и попадаются подозрительные люди на лестничной клетке. В лифте опять кто-то прошёлся маркёром по свежей краске. И вот что с этим делать? Можно проводить собрания, разъяснительные работы среди детей, но часто это ни к чему не приводит. На лестничных клетках чудом появляется мусор, а на последнем этаже внезапно оказывается пара человек без собственного жилья, зато с особым ароматом, от которого в подъезд вообще заходит не хочется.
Для того чтобы работать. Целей развития ИИ в данной сфере, конечно, может быть довольно много. Наиболее значимыми заказчиками в области развития видеонаблюдения и нейронных сетей являются государственные компании.
Вопрос кажется довольно простым и очевидным. Одни устройства для машин, другие для офиса, дома, дачи, склада или магазина. Это так, но сами по себе эти системы различаются довольно сильно.
Это комплекс оборудования включая видеокамеры и регистраторы, который создан в качестве замкнутой личной системы записи и трансляции видео. С английского CCTV, Сlosed Circuit Television - система телевидения замкнутого контура. Если говорить о самом понятии и явлении съемки с целью наблюдения, то перечень оборудования менялся с годами, и сегодня имеет большое разнообразие в зависимости от целей наблюдения и места установки.
Прежде всего стоит провести анализ охраняемого объекта. Для этого в первую очередь нужно обойти все потенциальные точки противоправных действий, найти оптимальные места установки камер наблюдения. Желательно выбирать точку, с которой будет максимально удобный обзор, она не должна быть слишком далеко от наблюдаемой позиции, иначе разглядеть необходимые детали на записи, даже с хорошей камеры не получится. Затем можно определится с количеством зон контроля и после этого приступать к выбору оборудования.
Камеры видеонаблюдения для нас являются обыденностью. Мы видим их в ТЦ, на улице, на дорогах, в магазинах и устанавливаем у себя дома. В охранных системах одной из их задач является фиксация правонарушений, а поскольку многие злоумышленники предпочитают действовать ночью, это потребовало от камер особых возможностей по съёмке в условиях плохой освещённости.
Распознавание объектов и, в частности лиц, для человека дело обыденное. Мы постоянно анализируем наше окружение и практически безошибочно определяем кто или что перед нами находится. Для машины процесс обучения происходит немного сложнее, нельзя просто так объяснить, чем отличается лицо обезьяны от человека. Развитие машинного зрения одна из первостепенных задач и вместе с тем часть комплексной системы распознавания образов. Сфера ее применения практически безгранична, начиная с систем контроля доступа и заканчивая сферой рекламы.