Очень много парился загружая видео на сайт, никак на голову неналазило почему все так паршиво получается. Вопросов уйма ответов еще больше, а как свести воедино, чтоб получился положительный результат . Вот и автор статьи со мной вполне согласен - знаний маловато будет. Поэтому решил выложить эту статью в блог, чтоб понять в чем суть вопроса .
Статья написана понятным и доступным языком, как для простого обывателя, за что автору большое спасибо!
Глядя на практически ежедневные вопросы пользователей на данную тему, решил выложить статью глубокоуважаемого мной человека и Профессионала с большой буквы.
Автор -4ami
источник - aeclub.net
Часть 1.
4:3 кладем в 16:9
Есть исходник PAL, изображение с соотношением сторон 4:3 и PAR=1,07.
Видео же мы делаем widescreen, т.е. 16:9 и PAR=1,42.
Задача: поместить исходник в видео с тем, чтобы все это выглядело
оптимальным образом.
Поскольку с самого начала и до конца критерий оптимальности - вещь
субъективная, то оценку оптимальности я буду давать, исходя из того,
как это видится мне.
Что, конечно же, не мешает кому бы то ни было соотнести мои выводы
со своими собственными представлениями об оптимальности.
Здесь, в самом начале, я хочу сделать принципиальное замечание, т.к.
на нем основаны все мои дальнейшие рассуждения.
Речь о том, что все рассматриваемые стандарты изображений, связанные
с ними вопросы формы пикселей и т.д., сводятся к элементарной и
простой идее: все, что ни изображается, я предлагаю видеть так, как
это выглядит или должно выглядеть, исходя из соответствующего
стандарта, на любом устройстве вывода, воспринимающего этот стандарт.
То есть, если это, к примеру, widescreen, соотношение сторон 16:9
и PAR=1,42, то, говоря упрощенно, на телевизоре, для которого этот
стандарт предназначен, картинка выводится в своем реальном виде.
Иными словами, круг должен выглядеть как круг.
Применительно к AE все вышесказанное означает, что я всегда работаю
с нажатой кнопкой Toggle Pixel Aspect Ratio Correction. Чего и вам
советую, иначе неизбежны недопонимание и плутание в трех соснах.
Вернемся к задаче размещения картинки 4:3 в 16:9.
На рис.1 показано, как выглядит картинка исходника 4:3, если мы
просто поместим ее в проект 16:9.
Проценты показывают масштаб соответственно по горизонтали и по вертикали относительно исходного изображения. A - граница области Action Safe, B - граница Title Safe. Это стандартные понятия, не требующие пояснений. Поле картинки, что выходит за границы Safe Area, заполнено диагонально-полосатым изображением. Это то, что обычно предполагается невидимым при выводе на ТВ, поскольку уходит за пределы экрана.
Естественно, то, что мы видим, нас никоим образом не устраивает и потому выполним скайлинг.
133,33% - это как раз такая величина скайлинга, при которой края нашей картинки 4:3 по бокам точно совместятся с боковыми краеми изображения 16:9 (См. рис.2).
Это хорошо, но теряются огромные куски исходника вверху и внизу. Скажем малые круги вверху срезаны наполовину. А представьте, что это срезанны наполовину головы любимых начальников в презентации, что вы готовите по случаю юбилея вашей компании.
Вот это, явно не хорошо.
Ужмем вертикаль до своих законных 100% (Рис.3).
Тоже так себе - как-то все сплющено. Особенно неприятно выглядят заметно располневшие начальники, а ведь они так хвалятся свом якобы ежедневным посещением фитнесс-зала.
А вот если растянуть нашу картинку по вертикали до 125% то начальникивыглядят вполне пристойно, но вот макушки у них опять снесены (Рис.4).
А, если впомнить, что Safe Area существует и для получившегося изображения (Рис.5), то начальствующие головы могут быть ополовинены.
Но, скорее всего, такая картина свойственна только старым моделям телевизоров, т.к. сейчас по моим наблюдениям срез по вертикали минимален в отличие от среза по бокам, который значительно больше. Если руководствоваться этими соображениями то можно использовать соотношения картинки как 125% по горизонтали и 112% по вертикали от исходного (Рис.6).
Что мы получаем? Практически все изображение исходной картинки помещается в окне 16:9. Некоторая сплюснутость по горизонтали (1,07 к 1) не так и заметна.
Остаются риски (Рис.7): первый, - это возможное появление черных полос по бокам, второй, - снесение макушки все тем же многострадальным начальникам. Если устройство вывода правильное и выводит картинку в оверскане, как то и должно, то риски минимальны. Особенно второй, т.к. в режиме widescreen (16:9) процент откусывания где-то 3-4%. Если оверскана нет, то черные края по бокам гарантированы. Но тут все претензии к изготовителям оборудования.
Часть 2.
16:9 кладем в 4:3
Есть исходник PAL, изображение с соотношением сторон 16:9 и PAR=1,42, т.е widescreen.
Видео же мы делаем с соотношением сторон 4:3 и PAR=1,07.
Задача такая же: поместить исходник в видео с тем, чтобы все это выглядело оптимальным для нас образом.
Поместив наш widescreen исходник в проект 4:3 (Рис.1) мы видим, что по вертикали картинки совпадают, а вот по горизонтали...
Плохо по горизонтали.
Стандартный прием - уменьшить изображение одновременно по горизонтали и вертикали до 75% (Рис.2). Края по бокам совпадут идеально, а сверху и снизу появятся черные полосы.
В принципе на этом можно успокоиться и продолжать работу над юбилейной презентацией.
Ну а с другой стороны... Все бы ничего, но теряется много пространства, исходное изображение становится заметно мельче и, что самое ужасное, начальство как-то мельчает тоже. А ведь подходил босс совсем недавно, любовался своим изображением, хвалил, что мол, ничего у тебя получается, молодец, давай-давай продолжай. Может растянуть на все окно? Если растянуть по вертикали до 1 00% (Рис.3), то, похоже, премия не светит.
А вот если попробовать, например, по 84% по горизонтали и вертикали (рис.4), то изображение станет явно больше, чем при 75% (Рис.2).
Если пойти дальше путем увеличения изображения, а, вернее, приближения его к исходному, то увеличив вертикаль до 94% получаем наи большую заполненность окна 4:3 исходным изображением (Рис.5).
Почему 94%? Потому что 94:84 дает нам соотношение 1,07. Это не принципиально, конечно, но более-менее приемлемо - т.е изображение слегка сплюснуто по горизонтали, но это не так сильно заметно. Есть и плюс - начальство, по крайней мере, выглядит стройным.
Опять-таки оценим риски.
Для этого выведем линии Safe Area в нашем 4:3 проекте (Рис.6).
На выводном устройстве есть риск получить черные полоски вверху и внизу. Потеря частей изображения по бокам при оверскане выглядит довольно значительной, но это обычно не носит такой уж драматический характер, поскольку значимых деталей там, скорее всего, не содержится.
==
Предложенные варианты совмещения не очень совместимых вещей могут быть оспорены, отвергнуты или, наоборот, использованы в своих работах. Так обычно я решаю эти проблемы, поскольку часто приходится поневоле этим заниматься, так как разнообразие неизбежно и ставить условия, что исходники должны быть только такими вот, просто нелепо.
Просто хотелось проиллюстрировать мысль, что чисто технический вопрос может иметь варианты решений, если не подходить к нему механистично.
То бишь, бездумно.
Резюмировать хотелось бы таким непритязательным соображением, что границы нашим стараниям в достижении наилучшего результата ставит или время, или мы сами. Пожелаю вам побольше первого, а второе увас и так есть. :)
Часть 3
Первоисточники
Я подумал и решил, что тема 16:9 & 4:3 не совсем полна. Дело в том, что я удрученно вижу одни и те же грабли, разбросанные по русскоязычным сайтам, на которые с упорством, достойным лучшего применения постоянно наступают те или иные пользователи. Тотчас, по факту события, с меньшим или большим жаром начинается обсуждение, и, после не особенно продолжительных дебатов, тема замирает до следующей своей инкарнации в лице очередного вопрошающего юзера.
Читая то или иное обсуждения, я зачастую с удивлением осознавал, наблюдая за самим собой, как по мере продвижения по топику, мои аналитические возможности таяли, как прошлогодний снег, в попытках связать воедино противоречивую порой информацию, содержащуюся в текстуальных упражнениях участников дискуссии.
Вполне прочувствовав свою беспомощность и осознав собственную неполноценность, по крайней мере в этом вопросе, я припал к источникам - книгам. Более того, обратился к людям, которые не понаслышке знакомы с предметом - ученым людям из Академии кино и телевидения. Совокупность обретенных знаний не претендует на большее, чем просто понимание. Но мне почему-то кажется, что не одному только мне необходимо хотя бы полистать те книги, которые я привожу в конце.
Основной сыр-бор ведется вокруг нашей темы, - как выглядит картинка 4:3 на
16:9 и наоборот.
В первых двух частях я давал примерные, оптимальные на мой взгляд, решения для реальной работы, с которой сталкивается в своей практике каждый, кто использует смешанные исходные материалы в AE. Но жизнь, естественно, шире, чем мир Адобовского композера. Люди делают некую работу с видео, записывают его на те или иные носители и само собой смотрят это все на самых разнообразных аппаратах: начиная от 2-дюймовых дисплейчиков КПК и заканчивая многометровыми изображениями проекторов. И если с этими самыми изображениями на компьютерных дисплеях еще можно как-то разобраться, то вот что там делается внутри телевизора с его непонятными многочисленными стандартами не очень-то ясно, да и лень разбираться - в век цифры громоздкий, сугубо специализированный телевизионный аналог скучен до судорог. Уж очень там все наворочено и заморочено - чего там только нет.
Вот это многообразие и сбивает с толку.
Ну, вот хотя бы.
В нынешнем ТВ-сигнале для PAL'а, присутствует такая штука - widescreen signalling (WSS), которая позволяет 16:9 корректно отображаться в соответствующем аспекте.
В большинстве ипостасей PAL (B, D, G, H, I, N, NC) WSS расположен обычно на 23 строке. Имеется в виду нумерация строк, исходя из полных 625-ти. Из 14 бит данных этого WSS нас интересует только первые четыре, отвечающие заAspect ratio.
Примечания к таблице. Каждый Case описывает, как выглядит та или иная картика с тем или иным aspect ratio на изображении 16:9:
Case 1:
Картинка 4:3 aspect ratio расположена посередине экрана с черными полосами по бокам.
Case 2:
Картинка 14:9 aspect ratio расположена посередине экрана с черными полосами по бокам. Как альтернатива, картинка может быть растянута на полную ширину экрана с допущением небольшого (обычно 8%) искажения геометрии.
Case 3:
Картинка 16:9 aspect ratio использует полностью всю ширину экрана.
Case 4:
Картинка >16:9 aspect ratio изображается, как в Case 3 или, используя полную высоту, дает изображение крупным планом, т.е. обрезается по бокам.
Примечание к последней строке таблицы - под кодом 0111 полноформатная картинка 16:9 изображается опять-таки все на том же 16:9.
И еще одно пояснение, очевидно, выявляющее основное заблуждение в трактовке термина Letterbox. А именно то, что Letterbox - это картинка того или иного aspect ratio (14:9, 16:9, >16:9) с уже обработанным, даунскалированным, т.е. уменьшенным, изображением, помещенным на кадр 4:3. О чем прямо говорит соответствующее количество активных строк, т.е. строк уже преобразованного изображения.
Т.е., проще говоря, изображение Letterbox существует уже до, а не после. В том смысле, что никаких преобразований полного изображения любого аспекта в Letterbox аппаратно не выполняется, если речь идет о бытовой технике. Все переключатели, обозначенные этим словом, если они где-либо имеются, вовсе не инициируют какой-то механизм пересчета с уменьшением строк и добавлением черного сверху-снизу и т.п. Все, что выполняется - это просто изменение aspect ratio уже имеющейся картинки на данном устройстве.
К слову, в аналоговом интерфейсе предусмотрена возможность для определения исходного изображения: для S-Video (и YPbPr) - смещение в сигнале цветности:
0V - исходник 4:3
2,3V - исходник Letterbox
5V - widescreen 16:9
SCART также может передавать сигнал о наличии 16:9. Использует ли ваша аппаратура эти сигналы - это можно выяснить только опытным путем, но скорее всего - нет. В основном, все манипуляции по определению того, что и как должно выглядеть, возложены на плечи пользователя.
Что касается MPEG-2, то в потоке также есть информация об аспекте изображения - display aspectratio (DAR). Называется попросту Aspect_ratio_information, где определены 4-х битовый код (Code) и его значения (Value) следующим образом:
0000 Forbidden
0001 Square sampling
0010 4:3
0011 16:9
0100 2.21:1
с 0101 по 1111 Reserved
Есть еще и Active Format Description (AFD). Это данные, связанные с Widescreen Signaling (WSS). Поддерживается опционально декодерами.
Не буду анализировать эту таблицу, т.к тут все достаточно очевидно.
Можно на этом и остановиться. И так, не правда ли, существенное расширение темы?
Тут вам и новый, не обсуждавшийся нигде прежде, насколько я знаю, аспект 14:9 и такие вещи, как 430 строк в letterbox, предусмотренные стандартом, вместо ожидаемых 432 (75% по вертикали от 576-ти). Понятно, что это не все.
Если припомнить, что из терминов преобразований 16:9 в 4:3 и наоборот, помимо Letterbox есть Pillarbox, он же Sidebar, есть и PanScan, который Pan and Scan. Это не просто смещение картинки вручную вправо-влево, как то обычно предполагается, а аппаратная функция, где окно 4:3 елозит вправо-влево по картинке 16:9, что-то там определяя по неведомым алгоритмам как значимое изображение, и обрезает изображение по бокам, поскольку высота изображения и там и там одинакова.
А ведь есть еще и Panorama, где на 16:9 кладется картинка 4:3 и, кроме нетронутой центральной части кадра 4:3, 25% справа и 25% слева изображения 4:3 нелинейно растягиваются до краев 16:9.
Общеизветно, что имеются разнообразные форматы кино и уж само-собой нельзя забыть о многочисленных вариантах PAR ТВ-сигнала различных стандартов, значения которых, между прочим, иногда не фиксированы. Но последнее замнем
для ясности. :)
Что-то есть еще, наверняка, просто я не в курсе или же не знаю, ну да и так поднятая тема стала существенно яснее, не так ли? :) Это я так шучу.
Тут самое время задаться вопросом - почему так все запутано и запущено - имеется в виду освещение данных вопросов в интернете?
Помимо традиционных умозаключений, что мол профессионалы, которые могли бы дать четкие определения, слишком заняты, да и редко посещают публичные места, я бы обратил внимание на то, что проблематика, несмотря на то, что выглядит довольно простой, слишком обширна, т.к. включает в себя помимо всего прочего, теорию и технику вещания, различные аппаратные интерфейсы, как профессиональной, так и бытовой аппаратуры, включает разнообразные виды подготовки видео, его обработки, модификации и вывода на оконечные устройства. Все это обусловлено теми или иными стандартами, традициями и просто модой в конце-концов. Поэтому становится понятным, что потенциально, да и принципиально не существует такого универсала, в полной мере владеющим знаниями по всем аспектами вышеперечисленного. Наоборот, практика говорит о довольной узкой специализации так называемых профессионалов, какой бы смысл ни вкладывался в этот термин - то ли означающий совокупность специфических знаний и опыта, то ли, как зачастую бывает, это просто означает профессию, - т.е. то, посредством чего человек зарабатывает на жизнь. А это, как вы понимаете, далеко не одно и то же.
Таким образом профессионал настолько же некомпетентен во всех вопросах, как и мы с вами, обычные смертные. Видимо в силу этого обстоятельства, да и, наверное, обычно свойственной им боязни покол*** чувство собственной значимости, я что-то не вижу (а если вижу, то редко), в сети присутствия этих самых профессионалов. Те же претенденты на подобное звание, коими они называют себя сами, настолько косноязычны, неинформативны и почему-то непременно высокомерны, что, как следствие, во-первых, вызывают всеобщую неприязнь, но это еще полбеды, хуже то, что, во-вторых, толку не прибавляется.
Но не все так плохо. Ведь это очевидно, что найдена и уже давно существует форма некоего коллективного творчества, присущая исключительно только сети - форумные FAQ'и, где концентрируется и оптимизируются текстуально логически связные описания тех или иных технологий, техник, методик и проч. Форма, настолько демократичная по сути, что удовлетворит и новичка и Профессионала.
Ну да я отвлекся. Самое время сказать самому себе – take it easy!
Вернемся к нашей путанной и по прежнему туманной теме.
Шутки шутками, но может быть вполне намеренно доводя вопрос до невменяемости (ну, кто-то, конечно, наверняка может сказать и иное), я хотел вывести в конце одну незатейливую мысль. Мешанина всех этих стандартов и условностей становится несущественной, если принять за основу простой принцип, а именно: четко знать целевое предназначение своей работы и работать всегда с реальным изображением. Таким, как оно должно и будет выглядеть на том устройстве, для которого предназначено. Потому как нам подвластно только это, а вот все остальные, дальнейшие, преобразования, по большей части от нас не зависящие, нами никак не контролируемые и представляющие собой в основном аппаратные решения, нужно иметь в виду, но не более того.
Представьте, что прилег некий, пусть будет Вася, у своего, только что купленного, супер-пупер аппарата во всю стену и с энтузиазмом тыкает поочередно кнопки на пульте, то сжимая, то растягивая изображение по осям. Ну и кто попытается потолковать с ним на тему аспект ратио? Оно ему надо? А ведь сколько этих Вась и у телевизоров, да и с камерами тоже, и сидящих за монтажом, пекущих собственноручно DVD - и не сосчитать! Видимо, об этом и попытался сказать Gradov_Georg (videoediting.ru) в теме, примерно такой же как наша - его фраза очень образна и афористична: "ибо кто-то предпочитает "щелевую амбразуру", а кто-то любит "обрезки" середины..."
Мне тут добавить нечего.
Но для себя-то надо как-то определиться, нет? :)
--
Источники и мои благодарности:
http://forums.pinnaclesys.ru/viewtopic.php?f=5&t=27180
форуму videoediting.ru
форуму по видео forum.ixbt.com
Charles Poynton, Digital Video and HDTV Algorithms and Interfaces
Keith Jack, Video Demystified - A Handbook for the Digital Enginee