История скрытых субтитров: аналоговая эра

История скрытых субтитров: аналоговая эра
История скрытых субтитров: аналоговая эра

Скрытые субтитры на телевидении и субтитры на DVD, Blu-ray и потоковых носителях сегодня воспринимаются как должное. Но так было не всегда. На самом деле, это была настоящая борьба за то, чтобы субтитры стали обычным явлением. Еще в начале 2000-х я неожиданно оказался вовлеченным во множество проектов со скрытыми субтитрами, как в разработке оборудования, так и в консультациях с инженерными группами различных производителей бытовой электроники. Возможно, я был последним инженером, работавшим с аналоговыми субтитрами, поскольку все остальные перешли на цифровые.

Но прежде чем углубиться в тему, в этой теме есть много запутанных и неточных формулировок. Установим некоторые определения. Я часто использую слово «субтитры», которое включает в себя как скрытые титры, так и субтитры:

Closed Captions: Передаются невидимым образом в виде текстовых данных. Обычно они могут быть включены или отключены пользователем. В системе NTSC его часто называют строкой 21, поскольку он передавался по строке видео номер 21 в интервале вертикального гашения (VBI).

Sub titles:Визуализируется в графическом формате и накладывается на видео/фильм. Обычно их нельзя отключить. Также называются открытыми или жесткими титрами.

Текст, содержащийся в подписях, обычно относится к одной из трех категорий. Чистый диалог (не более того) часто представляет собой стиль субтитров, который вы видите в субтитрах на DVD или Blu-ray. Обычные субтитры включают в себя диалог, но с добавлением случайных сигналов для музыки или невидимого события (например, звонка в дверь). Наконец, «Субтитры для глухих или слабослышащих» (SDH) - это более подробный стиль, который добавляет еще больше описательной информации о программе, включая имя говорящего, события за кадром и т. д.

Грубо говоря, субтитры ориентированы на глухую и слабослышащую аудиторию. Субтитры нацелены на аудиторию, которая может слушать программу, но по какой-то причине хочет посмотреть диалог, например понять иностранный фильм или выучить новый язык.

Titles Before Talkies

Интертитры из фильма 1920 года Кабинет доктора Калигари

Субтитры так же стары, как и сами фильмы. Поскольку в первых фильмах не было звука, они использовали то, что сейчас называется интертитрами, для передачи диалогов и пояснительной информации. Это были полноэкранные тексты, вставленные (не наложенные) в фильм в соответствующих местах. Были предприняты некоторые попытки наложения субтитров с использованием второго проектора и стеклянных слайдов с текстом, которые вручную переключались киномехаником, надеюсь, синхронно с диалогом. Один дальновидный, но недооцененный изобретатель экспериментировал с диалоговыми воздушными шарами из комиксов, которые появлялись рядом с говорящим актером. Эти методы также сделали распространение фильма в других странах относительно безболезненным делом - нужно было переводить только титры.

Ситуация изменилась с появлением «звуковых радиостанций» в конце 1920-х годов. Теперь не было необходимости в титрах, так как вы могли слышать диалоги. Но переводы для иностранной аудитории по-прежнему были востребованы, и для создания субтитров, о которых мы думаем сегодня, использовались различные трудоемкие оптические и химические процессы. Но не было субтитров для местной публики - без сомнения, к раздражению глухих и слабослышащих посетителей, которые годами одинаково наслаждались фильмами наравне со слышащими людьми..

Телевидение

Малкольм Дж. Норвуд

По мере роста популярности телевидения в первые годы предпринимались попытки использовать оптические субтитры, но они не имели большого успеха и широкого распространения. В Соединенных Штатах к концу 1960-х годов возник интерес к системам скрытых субтитров. В апреле 1970 года FCC получила петицию с просьбой сопровождать оповещения о чрезвычайных ситуациях текстом для глухих зрителей. Этот запрос поступил в идеальный момент времени, когда технология была готова, а различные стороны были заинтересованы и готовы принять вызов.

Именно в это время в историю вступает глухой бюрократ Малкольм Норвуд из Министерства образования (тогда HEW). Он работал в отделе фильмов с субтитрами для глухих с 1960 года. Сегодня в сообществе его часто называют отцом субтитров. Он был идеальным лидером, отстаивающим эту новую технологию, и он принял вызов.

Федеральная комиссия связи в принципе согласилась с поднятыми вопросами и в ответ выпустила Публичное уведомление 70-1328 в декабре 1970 года. Малкольм и Министерство энергетики собрали команду в 1971 году, в которую вошли Национальное бюро стандартов, Национальная ассоциация Вещательные компании, ABC и PBS. Они провели конференцию в Нэшвилле (PDF) в декабре 1971 года, которая, можно сказать, была родиной скрытых субтитров.

Первая телепрограмма с субтитрами 1972 года, «Французский повар», которую вела Джулия Чайлд. Это были открытые субтитры, и зритель не мог их отключить.

Получается, что техническая реализация трансляции субтитров построена на уже существующих работах. В Национальном бюро стандартов инженер Дейв Хоу разрабатывал систему под названием TvTime для передачи сигналов точного времени по воздуху. Эта система отправляла код по видеолинии в VBI, используя метод, который в конечном итоге превратился в стандарт CC. Они тестировали систему с помощью ABC, PBS и NBC. ABC даже начала использовать эту систему для отправки текстовых сообщений между аффилированными станциями.

Другая система, представленная на конференции компанией HRB-Singer, изменила вертикальную развертку приемника так, чтобы были видны дополнительные строки VBI, и передала текст подписи в цифровом виде, но визуально, в этих новых открытых строках. Это вызвало некоторое беспокойство у производителей телевизоров, и, к счастью, система NBS в конечном итоге победила.

После нескольких многообещающих демонстраций в 1973 году станции PBS WETA в округе Колумбия было разрешено транслировать сигналы с субтитрами для дальнейшего развития и усовершенствования системы. Эти усилия увенчались успехом, и в 1976 году FCC официально зарезервировала строку 21 для субтитров.

Адаптация трансляций для строки 21

Эта каталожная карточка много лет лежала в моем портфеле. Сможете найти ошибку?

В своей окончательной форме сигнал в строке 21 имел несколько тактов синхронизации для блокировки генератора восстановления данных декодера, за которым следовал 3-битный стартовый шаблон, и, наконец, два символа текста с защитой по четности.. Кодировка текста почти всегда ASCII, за некоторыми исключениями и специальными символами, которые считаются необходимыми для выполнения задачи. Текст всегда передавался в виде пары символов и традиционно отправлялся заглавными буквами. Управляющие коды также являются парами байтов и выполняют такие функции, как позиционирование курсора, переключение сервисов субтитров, изменение цвета и т. д. Поскольку управляющие коды были очень важны для правильного отображения текста, защиты по четности было недостаточно - они обычно передавались дважды., повторяющаяся пара управляющих кодов игнорируется, если первая пара не содержала ошибок.

Сводка данных строки 21
Базовый тариф 503,496 кбод (32 x Гориз. частота)
Группировка 2 каждый 7-битный символ + бит четности / видеострока
Кодирование ASCII с некоторыми изменениями
Услуги нечетные поля: CC1/CC2, T1/T2
четные поля: CC3/CC4, T3, T4, XDS
Спецификация EIA-608, 47 CFR 15.119, TeleCaption II

Сегодня мы привыкли к почти идеальному программированию видео и аудио благодаря цифровым передачам и проводным/оптическим сетям. Добавление нескольких дополнительных байтов в существующий пакет протокола вряд ли заставит нас задуматься. Но тогда нужно было учитывать и другие факторы. Полученный стандарт CC был доработан в ходе длительных и трудоемких полевых испытаний. Видеосигнал с субтитрами должен был быть надежным при передаче по воздуху. Инженерам приходилось решать и решать такие проблемы, как ухудшение уровня сигнала в периферийных зонах приема и многолучевое распространение в густонаселенных городских районах.

Демо-кадр Pop-On CC от Felix the Cat

Что касается методов субтитров, было доступно несколько различных типов. Безусловно, наиболее распространенными стилями были POP-ON и ROLL-UP. При POP-ON титрах получатель накапливал входящий текст в буфере до получения управляющего кода «flip-memory», после чего весь титр немедленно появлялся на экране одновременно с речевым диалогом. Этот стиль обычно использовался с предварительно записанными материалами по сценарию, такими как фильмы и драмы. С другой стороны, с субтитрами ROLL-ON, как следует из названия, текст физически сворачивается снизу экрана построчно. Он использовался для прямых трансляций, таких как новостные программы и спортивные мероприятия. Текст, естественно, должен быть отложен от звука из-за характера процесса транскрипции живой речи.

Британцы поступили по-другому и в процессе внедрили телетекст

На другом берегу инженеры радиовещания BBC подошли к проблеме с другой стороны. Их менеджеры спросили, есть ли способ использовать передатчики для отправки данных, поскольку в противном случае они простаивали четверть каждого дня. Поэтому они работали над максимальным объемом передаваемых данных.

Первоначальный сервис работал как факсимильный аппарат, сканируя, передавая и печатая газетную страницу. В конце концов, BBC приняла полностью цифровой подход под названием CEEFAX, разработанный инженером Джоном Адамсом из Philips. В то же время другие вещательные компании запустили конкурирующую и несовместимую службу под названием ORACLE. В 1974 году все, наконец, остановились на объединенном стандарте под названием World System Teletext (WST), принятом как CCIR 653. Вещательные компании в Северной Америке приняли небольшой вариант WST под названием North American Broadcast Teletext Specification (NABTS). Благодаря более высокой скорости передачи данных, чем CC, телетекст менее терпим к ошибкам передачи. Он использует несколько различных кодов Хэмминга для защиты и, при необходимости, восстановления после ошибок в ключевых полях данных. Это довольно сложный формат для декодирования по сравнению со строкой 21.

Британская ассоциация производителей радиооборудования, спецификация вещательного телетекста

Что касается формата, службы телетекста транслируют трехзначные страницы текста и блочные графические данные - концептуально электронный журнал. Категории контента были сгруппированы по страницам:

Пример страницы журнала телетекста

  • 100s - Новости
  • 200s - Деловые новости
  • 300s - Спорт
  • 400s - Погода и путешествия
  • 500s - Развлечения
  • 600s - Списки теле- и радиопрограмм

Эти тексты на этих страницах журнала являются неотъемлемой частью структуры пакета. Например, текст строки 4 на странице 203 принадлежит определенному пакету для этой страницы/строки. Поскольку вещательная компания постоянно транслирует все журналы и их страницы, может пройти несколько секунд, прежде чем страница, которую вы запрашиваете, появится на экране. NABTS использует более свободный подход. Данные почти можно рассматривать как последовательный поток текста, как соединение терминала с компьютером. Если вам нужна новая строка текста, вы отправляете пару CR/LF.

Сводка данных телетекста
Базовый тариф 6,938 МБд
Группировка 360 бит/строка, 40 доступных текстовых символов
Кодирование Аналогично расширенному ASCII, но с кодовыми страницами
Услуги Многостраничные журналы, 40×24 символа на странице
Технические характеристики Европа: WST ITU-R BT.653 (ранее CCIR 653)
Северная Америка: NABTS EIA-516

Хаки, благодаря которым все заработало

Большинство моих проектов предназначались для использования в Северной Америке, но мне нужно было изучить европейский телетекст для нескольких проектов-кандидатов. В Европе 888-я страница системы телетекста предназначена для размещения текста скрытых субтитров. Эта страница имеет прозрачный фон, и приемник накладывает его на видео. Визуальный результат был практически таким же, как в Северной Америке. Но это создало некоторые проблемы с такими носителями, как кассеты VHS.

Сигнал телетекста не может быть записан или воспроизведен на вашем обычном домашнем видеомагнитофоне. Чтобы решить эту проблему, многие ленты были сделаны с использованием адаптации североамериканской системы линии 21, но с применением видеоформата PAL. Этот метод по-разному назывался строкой 22 или строкой 25 (путаница заключалась в том, что строка № 1 PAL находится в другом месте, чем строка № 1 NTSC), но в основном был одним и тем же. Производитель, у которого есть декодер CC в своем продукте NTSC, может легко адаптировать его для работы в странах PAL.

Как я получил кассеты PAL VHS? Я спросил коллегу-инженера из Philips Southampton, может ли он прислать мне несколько образцов лент для тестирования. Его жена купила несколько подержанных в местном прокате и прислала мне. Это было до дней PayPal, поэтому я отправил ей международный денежный перевод на 60 долларов. Это покрывало стоимость кассет и доставки, а также несколько дополнительных долларов «чаевых» за ее беспокойство. Несколько недель спустя я получил от него электронное письмо, в котором говорилось, что «вы, американцы, действительно даете щедрые чаевые». Его жена получила мой денежный перевод на 600 долларов, а не на 60! На это ушло много месяцев, но в конце концов почта поняла их ошибку, и она вернула излишки.

Автор устраняет проблему со скрытыми субтитрами на DVD в LG в 2003 году

В Южной Корее коллега занимался производством субтитров еще в конце 1990-х. Его попросили принять участие в правительственной комиссии по рассмотрению общенационального принятия скрытых субтитров. Конечный результат был комичен - вместо CC комитет решил бесплатно предоставить людям с нарушениями слуха очень громкие внешние телевизионные колонки. К счастью, традиционная форма скрытых субтитров была принята с появлением цифрового телевизионного вещания.

Проектирование на заднем фронте

К 2000 году почти все телевизоры имели встроенные декодеры CC. В результате было доступно множество микросхем для извлечения и обработки сигнала линии 21. Один пример был от Philips Semiconductor (которая стала NXP, а теперь Freescale). Как ключевой разработчик технологии телетекста и крупный поставщик микросхем для телевизионной индустрии, они предлагали широкий спектр процессоров CC и телетекста. Я разработал несколько дизайнов на основе чипа их семейства телевизионных контроллеров Painter. Это были микроконтроллеры на базе 8051 со всеми дополнительными функциями, необходимыми для телетекста, субтитров и пользовательских меню. У них были слайсеры данных VBI, генераторы символов и шрифты ROM, все интегрированные в один кристалл.

Техническое описание Philips Saa55xx (стр. 91)

Я до сих пор помню, как однажды обнаружил чип Painter, спрятанный глубоко в Интернете. Когда я не смог найти никакой подробной информации, я позвонил местному представителю, и мне сказали: «Вы не должны даже знать об этом номере детали - это секрет!». В конце концов деловая логистика была решена, и мне разрешили использовать чип. Это был единственный чип с маскированным ПЗУ, который я когда-либо делал. Я до сих пор чувствую урчание в животе в тот день, когда доставил шестнадцатеричный файл в местный офис Philips. Представитель и я сгорбились над компьютером, дважды и трижды проверяя каждую запись в их внутренней системе заказов. Как только мы нажали SEND, биты были безвозвратно переданы на завод и навсегда записаны во многие тысячи чипов. Несмотря на то, что мы тщательно протестировали и проверили прошивку в лаборатории, тем не менее, это был напряженный день.

Чип Philips Painter

Поскольку я разработал несколько других конструкций, стало ясно, что этих микросхем специального назначения следует избегать, если требуется разумная долговечность. Чипы Painter постепенно выводились из употребления, исчезали и некоторые другие опции. На стене было написано: цифровое вещание никуда не делось, а производители чипов больше не производили и не поддерживали аналоговые CC-чипы. Я решил, что будущие проекты CC должны выполняться с использованием интегральных схем общего назначения. Я планирую углубиться в это в будущей статье вместе с неожиданными применениями технологии CC, процессом создания субтитров и тем, как субтитры сделали (или не сделали) переход к цифровому вещанию и медиа.