TARGA 3000: новые решения

TARGA 3000: новые решения

В журнале "Цифровое Видео" №5, стр. 15-19 были рассмотрены основные характеристики восьми актуальных плат нелинейного монтажа, предназначенных для профессионального видеопроизводства, от трех ведущих фирм производителей: Pinnacle Systems, DPS и Matrox. При этом было отмечено, что TARGA 3000 “на голову” превосходит всех конкурентов, предлагая своим настоящим и особенно будущим пользователям действительно уникальные возможности цифрового монтажа и композитинга. В этом устройстве впервые применены принципиально новые технологические решения, открывающие следующую главу в истории развития подобных систем. В то же время, справедливости ради необходимо отметить, что в этой бесконечной гонке технологий фирма Pinnacle Systems всего лишь опередила своих конкурентов на промежуточном финише. И в ближайшее время стоит ожидать “ответных ходов” от DPS и Matrox, да и Pinnacle, очевидно, не остановится на достигнутом. Одним словом, на наших глазах происходит эволюционная смена поколений плат нелинейного монтажа. Однако, несмотря на очевидные различия в конкретных схемах их построения и характеристиках используемых цифровых видеопроцессоров, принципиально все эти будущие решения должны будут отвечать общим требованиям, соответствовать новому уровню планки “для взятия”, установленному появлением TARGA 3000 (далее по тексту T3K). Поэтому для последующего понимания основ их функционирования автор считает важным рассмотрение особенностей организации работы T3K - как первого представителя нового поколения, обещающего быть уже завтра весьма многочисленным.

Архитектура обработки

Оглядываясь назад, мы вынуждены констатировать, что большинство используемых в настоящее время цифровых систем обработки видео, по сути, являются всего лишь цифровой адаптацией традиционной концепции построения старых аналоговых монтажных систем. В них несколько цифровых аудио и видео потоков последовательно проходит через набор спецпроцессоров, обеспечивающих выполнение в реальном времени заранее заданных преобразований, предопределенных еще на стадии разработки каждого процессора. В качестве примера достаточно привести общую схему построения линейки DigiSuite от Matrox, в соответствии с которой в популярной плате DigiSuite LE для параллельной обработки двух видеопотоков используются соответственно два 2D-DVE процессора Matrox Fiesta-II, для работы с дополнительным слоем графики - контроллер Matrox MGA-2064SG, а собственно микширование с переходами выполняется в Matrox Siesta-II. А вот в полной версии собственно DigiSuite для обеспечения большей производительности число процессоров Fiesta-II увеличено до 5 штук. Аналогичный вывод справедлив и ReelTime/NITRO от Pinnacle Systems, и для DPS Reality/Velosity – для обеспечения новых эффектов и/или увеличения числа одновременно обрабатываемых слоев необходимо увеличение на борту вычислительной мощности, т.е. добавление новых спецпроцессоров. Так, преобразование Velosity 2D в Velosity 3D путем установки дочерней платы V3DX с процессором 3D-эффектов кроме всего прочего добавляет еще один слой графики.

Однако подобная последовательно-потоковая обработка имеет свои очевидные пределы, и не позволяет, например, удвоить или даже утроить число слоев, поменять порядок выполнения операций или осуществить многократное выполнение одного и того же эффекта. К тому же, все эти процессоры разработаны под определенный формат видео (4:3), заданные разрешение (720x576), цветовое представление (YUV 4:2:2) и глубину оцифровки (8-bit на компонент). В то время как мир стоит на пороге реального внедрения телевидения высокой четкости, многие программы уже сейчас снимаются и выпускаются в соотношении 16:9, а композиционная сложность современного видео требует высокоточной обработки в представлении 4:4:4:4 при 16-bit на компонент. Одним словом, цифровые платы, использующие традиционную обработку видео, “завтра” во многом перестанут отвечать требованиям времени. Необходим новый подход к организации процесса обработки, более гибкий и точный, позволяющий быстро перестраиваться от нужд “классического” видеопроизводства к потребностям “нового” телевидения. Именно такое решение и реализовано в T3K.

Теория ее построения сводится к следующим основным идеям:

использование большого буфера разделяемой памяти, позволяющего одновременно размещать до десятка различных кадров с произвольным доступом к любой ячейке;
преобразование входящих потоков видео в массивы пикселей и их размещение в буфере памяти с возможностью многократной записи/считывания как исходных массивов, так и результатов их обработки;
возможность задания в широких пределах как размеров исходных массивов, так и битовой глубины их отдельных ячеек;
и, наконец, параллельное задействование для операций над массивами пикселей нескольких вычислительных ресурсов, работающих с быстродействием, в несколько раз превышающим real-time, и позволяющих зацикливание процесса обработки.

Чтобы подчеркнуть принципиальное отличие данного подхода, специалисты Pinnacle Systems придумали для него специальное определение Memory-Centric – против традиционного, названного соответственно Stream-Centric. Здесь внимательный читатель вправе воскликнуть, что ничего особенного в Memory-Centric нет, ведь аналогичный подход уже давно используется в компьютерах общего назначения для решения самых обычных задач. Действительно, функционирование, например, процессора Pentium также немыслимо без активного задействования ресурсов оперативной памяти (RAM). И подобный компьютер действительно можно в том числе использовать для видеопреобразований. Но в этом случае придется забыть о реальном времени выполнения, поскольку задачи обработки видео столь специфичны и сложны, что требуют специальных вычислительных ресурсов.

Сердцем T3K стал новый сверхмощный видеопроцессор HUB3, разработанный специалистами Pinnacle и производимый фирмой IBM по 0,25-микронной технологии. В этом ASIC-микрочипе (Application Specific Integrated Circuit) объединены многоканальный программируемый контроллер (интерфейс) памяти, обеспечивающий суммарную пропускную способность до 1,5 ГБ/сек, по пять независимо контролируемых портов ввода и вывода аудио/видео информации, каждый с собственным DMA-доступом (Direct Memory Access) к интерфейсу памяти, и два специализированных вычислительных блока с производительностью 100 Мпиксел/сек каждый. Первый из блоков, RCL (Resizer / Color Converter / LookUpTable), выполняет двумерное геометрическое преобразование входного кадра (выделение фрагмента, задание нового размера и положения и т.д.), затем его матричное 3x3 цветовое преобразование в представлении YUV или RGB, и по завершению – линейную цветокоррекцию через LUT-таблицу из 1024 значений. Второй вычислительный блок, 4-Layer Compositor, принимая 4 исходных изображения (кадра), сначала производит независимые геометрические преобразования первых трех (относительное смещение и обрезание, но не масштабирование), а затем – их послойное микширование (наложение друг на друга с учетом задаваемой прозрачности). При необходимости, этот блок также аппаратно выполняет Chroma-Key операцию, активно используемую для построения виртуальных сцен.

Теперь оценим реальное быстродействие HUB3. Согласно стандарта ITU-R 601 телевизионный кадр - это 415 тысяч пикселей (720х576), что при глубине цветового представления в 2 байта на пиксел (4:2:2) соответствует 810КБ. Ну а поскольку кадровая частота равна 25 Гц, то цифровой поток некомпрессированного видео – это 10,4 миллиона пикселей или 20 МБ в секунду. Таким образом, за 1/25 сек – “время жизни” real-time процессов – стандартный кадр можно успеть 75 раз записать/считать в буфер памяти, или, другими словами, пропускная способность контроллера памяти HUB3 составляет 75 потоков видео! В то же время каждый из вычислительных блоков за 1/25 сек позволяет выполнить до 8 циклов соответствующей обработки потоков (теоретический предел 100/10,5 равен 9, но часть времени теряется на служебные установки, переключение режимов и т.д.), и, например, произвести в real-time 32-слойный композитинг и цветокоррекцию 8 потоков!

HUB3 также включает в себя собственный 64-битный PCI интерфейс, работающий на частоте 33 МГц и обеспечивающий скорость обмена данными между буфером памяти T3K и системной памятью компьютера и накопителями информации на жестких дисках до 200 МБ/сек. С этой точки зрения T3K может оперировать с 10 потоками! К сожалению, здесь весьма серьезным ограничением становятся возможности собственно дисковой подсистемы компьютера, вынужденной при чтении переключаться между записями различных потоков. Считая среднее время поиска/переключения на диске равным 5 мс и размер кэша чтения равным 1 МБ, легко вычислить, что уже при 5 потоках каждую секунду половина времени будет теряться именно на поиск требуемых записей (5 потоков x 20 раз x 5 мс), так что эффективная скорость передачи данных упадет вдвое. Для многопотоковых систем монтажа это очень серьезная проблема, над разрешением которой в настоящее время работают во многих фирмах, например, в корпорации Medea. Один из очевидных выходов – в уменьшении требуемой пропускной способности за счет сжатия видео. На T3K установлены два кодека DVXpert фирмы C-Cube, обеспечивающие 2 параллельных канала для компрессии и 4 для декомпрессии и поддерживающие стандарты как MPEG-2, так и DV25 (с возможностью программного upgrade до DV50). Таким образом, принципиально T3K уже сегодня могла бы работать по крайней мере с 5 потоками, и при испытаниях специалистам Pinnacle Systems действительно это удавалось. Но в настоящей версии программного обеспечения для обеспечения надежной работы и снижения требований к базовой компьютерной системе пока наложено ограничение в 3 потока некомпресссированного видео и в 2 – компрессированного (и дополнительно до 5 или 6 слоев графики соответственно).

Как уже отмечалось, HUB3 имеет 5 независимых портов ввода/вывода информации. Первые два соединены с кодеками DVXpert, один порт зарезервирован для встроенного разъема расширения AVIO, предназначенного для подключения к T3K будущих дочерних плат (например, платы 3D эффектов Infinite 3D), а оставшиеся два порта используются для связи с внешним блоком разъемов (BOB – Break-Out-Box), через который собственно и происходит передача входной и выходной информации. Таким образом, плата T3K в состоянии осуществлять одновременную запись и воспроизведение различных потоков, многоканальное независимое проигрывание цифровых файлов, микширование в real-time живого видео и цифровых файлов и т.д. К сожалению, настоящая версия программного обеспечения (Adobe Premiere или Speed Razor) не позволяет воспользоваться этими возможностями, оставляя их реализацию для более продвинутых приложений. Поэтому в T3K пока задействован только один из двух портов связи с BOB.

Также с запасом на будущее в данной архитектуре заложены возможность программного изменения кадрового разрешения, частоты и порядка развертки, аспектного отношения, структуры и глубины представления данных. Это превращает T3K в идеальную рабочую лошадку для решения самых разнообразных задач завтрашнего дня, от подготовки программ телевидения высокой точности до web-вещания.

Блок внешних соединений

Типы сигналов и число разъемов, требуемые для профессиональной платы монтажа
Тип сигнала	Вид разъема	Вход/выход
Composite Video	BNC (RCA)	1/1
S-Video (Y/C)	4-pin mini-DIN	1/1
Component Video	3 x BNC	1/1
DV	4-pin (6-pin) IEEE-1394	1
SDI Digital Video	BNC	1/1
Unbalanced Audio	2 x RCA	1/1
Balanced Audio	2 x XLR	2+/2+
S/P DIF Digital Audio	RCA	1/1
AES/EBU Balanced Audio	XLR	2+/2+
AES/EBU Unbalanced Audio	BNC	1/1
TDI/F Digital Audio	DB-25	1

Проблема обеспечения качественных соединений встроенной платы компьютера с внешними устройствами остро стоит перед производителями уже много лет. Спецификация PC-компьютеров оставляет на внешней планке платы очень небольшое пространство для размещения всех соединений. В то же время современные профессиональные устройства обязаны поддерживать самые разнообразные типы видео (Composite, S-Video, YUV (RGB), DV, SDI), так и аудио (небалансный, балансный, AES/EBU, S/PDIF, TDIF) сигналов, общим числом соединений более 30 (см. табл.2), причем это число с развитием видов вещания только возрастает. Сложность проблемы не столько в высокой (и возрастающей) плотности вывода контактов на задней планке, но и в размещении на самой плате необходимых микросхем приема и обработки (оцифровки, кодирования) соответствующих сигналов, в исключении их взаимного влияния (наводок), и в конце концов – в последующей надежной работе. Ведь известно, что наиболее часто возникающая при эксплуатации неисправность – “сгоревшие” входы-выходы (из них не менее чем в 50% случаев – композитные).

Известны различные подходы к решению задачи соединений. Самый прямой и дешевый с точки изготовления самой платы – интеграция на заднюю планку специального разъема высокой плотности (до 40 контактов) и комплектация платы соответствующим “хвостом” кабелей. Недостатки этого подхода общеизвестны: частичное отражение принимаемых электрических сигналов из-за невозможности полного согласования входных импедансов и неизбежные наводки по общей “земле”, неудобство эксплуатации тяжелого и негибкого “хвоста” (при частых соединениях возникает опасность механического повреждения разъема на плате или проводки в одном из кабелей), да и дороговизна собственно его изготовления (как правило, требующей ручной пайки). Развитием данного подхода является использование различных внешних блоков (BOB – BreakOutBox), на которые собственно и вынесены все необходимые разъемы. Такой BOB является своеобразным пассивным удлинителем, делающим более удобным и безопасным соединение платы с внешней аудио-видео аппаратурой. Однако, с точки зрения качества передачи сигналов, для него характерны те же проблемы.

Существенно более прогрессивным является использование активного BOB, в который вынесена часть необходимых операций обработки входных и выходных сигналов: их прием, аналого-цифровые преобразования, фильтрация и декодирование. В этом случае передача информации между BOB и платой вне зависимости от конкретного типа внешнего сигнала осуществляется уже в едином цифровом виде (например, компонентный для видео и балансный для аудио). При этом размеры BOB позволяют развести цепи обработки аналоговых сигналов и обеспечить их качественные прием и преобразование. Одним из важных следствий данного подхода является освобождение платы от рутинных операций оцифровки и освобождение пространства на ней для размещения дополнительных специализированных микросхем - вычислительных блоков эффектов. Привлекает и унификация устройств – один и тот же BOB может быть в дальнейшем использован для “подготовки” сигналов для других плат, и, наоборот, для расширения списка поддерживаемых сигналов (внешних устройств) или повышения точности их преобразования достаточно к существующей плате подсоединить новый BOB. Следующим шагом в этом направлении становится объединение в одном BOB приема как аналоговых, так и цифровых сигналов. Кроме собственно удобства соединений это принципиально позволяет осуществлять в рамках BOB преобразования типов сигналов, например, из SDI получать аналоговое компонентное видео, из S-Video – SDI.

Именно такая концепция активных BOB и реализована для семейства T3K, причем в настоящее время разработаны 3 различных устройства (см. табл.3). Это Pro Analog BOB (рис.3), Pro Digital BOB (рис.4) и Pro Digital & Analog BOB, осуществляющие ввод-вывод соответственно только аналоговых, только цифровых и обоих типов сигналов. Важным вопросом является интерфейс передачи цифровых данных между BOB и T3K. На первый взгляд согласно стандарту SMPTE 259M достаточно было обеспечить последовательный цифровой интерфейс SDI с пропускной способностью 270 Мбит/сек. Однако, будущие потребности телевидения высокой четкости (SMPTE 292M) требуют уже 1,485 Гбит/сек. Именно это значение, причем в обе стороны, и было заложено в новом типе цифрового интерфейса, названного специалистами Pinnacle Systems как Digital Tether (Цифровая Перевязь). Он может функционировать в двухканальном режиме на стандартных 27 Мгц или в одноканальном, но уже на 74,25 Мгц для ТВЧ. При этом каждый канал видео имеет информационную глубину представления 10-бит и дополнительно несет до 16 каналов аудио (16, 20 или 24-бит) и один канал с данными о тайм-коде (VITC) и служебной информацией.

Как уже отмечалось, в T3K пока задействован только один порт связи с Digital Tether, но в двухканальном режиме. А вот ее “сестрица” TARGA Cine, разработанная для MAC G4, уже поддерживает два порта, каждый из которых обеспечивает как двухканальный, так и одноканальный (ТВЧ) режимы. Впрочем, описание возможностей действительно интересной TARGA Cine уже выходит за рамки настоящего краткого обзора. В его заключение лишь еще раз подчеркнем, что как интерфейс Digital Tether, так и видеопроцессор HUB3 разработаны с большим запасом на будущее, допуская и предполагая появление в скором времени новых устройств, еще более мощных и продвинутых

Типы сигналов, поддерживаемые BOB платы Targa 3000
Тип сигнала	Pro Analog	Pro Digital	Pro D & A
Composite Video	1Вх/1Вых	-	1Вх/1Вых
S-Video (Y/C)	1Вх/1Вых	-	1Вх/1Вых
Component Video	1Вх/1Вых	-	1Вх/1Вых
SDI/SDTI Video	-	1Вх/1Вых	1Вх/1Вых
Balanced Audio	1Вх/1Вых (стерео)	-	2Вх/3Вых (стерео)
Unbalanced Audio	1Вх/1Вых (стерео)	-	1Вх/1Вых (стерео)
Embedded Audio	-	8Вх/8Вых	8Вх/8Вых
S/P DIF Audio	-	-	2Вх/Вых
AES/EBU Audio	-	-	4Вх/4Вых
TDI/F Audio	-	-	8Вх/8Вых

по материалам фирмы СТОИК