О Программе

Up ] Новости ] Архив новостей ] О Программе ] Об авторе ] Скачать ] Отзывы ] Этюды VBA ] Этюды C++ ] Чтение ] Записки из отпуска ] E-Mail ] Поиск ] Спасибо! ]


Читать полное описание Программы (v.2) - Полное описание Программы в формате CHM (v.2, 1.5 Mb)

Звуковые транскрайберы

Несмотря на некоторый прогресс в технологиях распознавания речи, достигнутый за последние десятилетия, большая часть работы по преобразованию фонограмм в текст по-прежнему производится людьми. Основным инструментом для этой работы является транскрайбер.

Устройство, предназначенное для документирования фонограмм устной речи, называется транскрайбером.

Транскрайберы используются машинистками и журналистами для документирования фонограмм различных мероприятий, при подготовке сводок, протоколов совещаний, переговоров, лекций, интервью, судебных заседаний, заседаний акционерных обществ и так далее. Транскрайберы используются также преподавателями иностранного языка и студентами для аудирования. Фирма "Philips" давно производит специальные аппаратные транскрайберы - "магнитофоны для стенографирования". Аппаратные транскрайберы используют "настоящие" магнитофоны, например, такие -

Профессиональный цифровой магнитофон "Nagra IV-S" фирмы "Kudelski Group"
Картинка взята с сайта
http://www.nagra.com

Программные транскрайберы используют в качестве плейера мультимедийные возможности персонального компьютера. Программы транскрайберы, представленные на рынке, обычно используют простые текстовые редакторы типа WordPad. Microsoft Word используется только в самых продвинутых программах такого рода. По существу, простейший транскрайбер представляет собой текстовый редактор, дополненный возможностями звукового плейера. Более продвинутые транскрайберы позволяют также использовать метки в тексте документа для воспроизведения фонограммы, начиная с любого момента времени. Как правило, "любой момент времени" - это зафиксированное событие типа "начало заседания", "выступление участника мероприятия" и т.п.

Ножная Педаль

Профессиональные машинистки, набивающие 180 и более символов в минуту, как правило, вообще не используют мышь. Вместо этого они управляют транскрайберами с помощью ножной педали, например, такой

Трёхкнопочная педаль "Foot Control LFH 0110/90" фирмы "Philips".
Картинка взята с сайта www.philips.com

В качестве педали может использоваться любое устройство, подключенное к последовательному порту компьютера и генерирующее при нажатии кнопок стандартные сигналы модема "CTS", "DSR" или "DCD".

Пользователи транскрайберов

К самым распространенным категориям пользователей транскрайберов относятся

  • Машинистки, "расшифровывающие" фонограммы заседаний акционерных обществ, судебных заседаний, переговоров и так далее
  • Журналисты, работающие со звуком записанного интервью
  • Преподаватели иностранного языка, использующие фонограммы на занятиях
  • Студенты, изучающие иностранные языки
  • Частные детективы, работающие с фонограммами

Нетрадиционные пользователи транскрайбера могут хранить плей-листы непосредственно в документах Microsoft Word.

Назначение системы

Проект интегрирует две технологии Microsoft - текстовый процессор Microsoft Word и Windows Media Player (далее в тексте – просто "плейер").
Шаблон "AhWMPlayer2.dot" (далее в тексте – "Программа") предназначен для превращения текстового процессора Microsoft Word в полнофункциональный цифровой транскрайбер - аудиотекстовый редактор, используемый для профессионального набора текста с одновременным прослушиванием фонограммы и управлением воспроизведением. Использование аудиометок обеспечивает прямой доступ к любому участку фонограммы.

Программа работает в операционной среде Microsoft Windows 2000/XP. Программа предназначена для работы с Microsoft Word 2003 русской или английской редакции.
Программа тестировалась в следующем окружении

  • Microsoft Word 2003 (11.8026.8028) SP2 и

  • Windows Media Player версии 9.0.0.3349.

Комплект поставки

В комплект поставки входят следующие файлы

Файл Расположение Описание
AhWMPlayer2.dot MS Office Startup Folder
Обычно - это папка "C:\Program Files\Microsoft Office\OFFICE11\Startup"
Шаблон с макрокомандами для работы с аудиотекстовыми документами в текстовом процессоре Microsoft Word. Шаблон должен находиться в папке автозагрузки Microsoft Word.
AhWMPlayer2.ini там же Файл параметров Программы. При отсутствии создаётся автоматически при первом выходе из Microsoft Word или из диалога "Настройки".
AhPlayer2Rus.chm там же Файл справочной информации (на русском).
AhPlayer2Eng.chm там же Файл справочной информации (на английском).
Detochkin.mp3 В любом месте Файл фонограммы судебного заседания.
Detochkin.doc В любом месте Пример аудиотекстового документа.
Dialog131.mp3 В любом месте Файл фонограммы для урока английского языка.
Dialog131.doc В любом месте Пример аудиотекстового документа.

Следующие файлы могут входить или не входить в демонстрационную версию Программы.

Файл Расположение Описание
Транскрайбер Руководство по установке.doc В любом месте Руководство по установке полной версии Программы.
AhPlayer_FC.dll Системная папка.
Обычно - это папка "c:\Windows\System32".
Библиотека поддержки ножной педали.

Ограничения демонстрационной версии

Демонстрационная версия Программы распространяется свободно.
Для работы демонстрационная версия Программы не требует установки электронных ключей. К основным ограничениям демонстрационной версии Программы относится отсутствие поддержки работы с ножной педалью и поддержки темпокоррекции с помощью специального DSP плагина для Windows Media Player.

Установка и Запуск Программы

Для установки Программы необходимо выполнить следующие действия

  1. Распакуйте архив
  2. Скопируйте файлы "AhWMPlayer2.dot", "AhWMPlayer2.ini" и "AhPlayer2Rus.chm" в папку автозагрузки Microsoft Office (обычно это папка "C:\Program Files\Microsoft Office\OFFICE11\Startup")
  3. Если Вам нужна поддержка ножной педали, скопируйте файл "AhPlayer_FC.dll" в системную папку (обычно это папка "c:\windows\system32")
  4. Запустите или перезапустите Microsoft Word.

Совет
Аудиометки в документах примерах ссылаются на звуковые файлы, расположенные в папке "C:\_AhPlayer ". Если распаковать архив Программы на диск C (папка "C:\_AhPlayer" будет создана автоматически), то Вам не придётся использовать операции поиска и замены для исправления ссылок на звуковые файлы в документах примерах.

При запуске Microsoft Word появляется следующее сообщение, связанное с тем, что Программа использует управляющий элемент ActiveX "Windows Media Player".

Нажмите кнопку "OK" чтобы продолжить работу.

Техническая поддержка

Программа поставляется "как есть", техническая поддержка Программы не осуществляется. Разумные пожелания пользователей учитываются при разработке следующих версий Программы.

Автор будет рад любым пожеланиям и отзывам о работе Программы.
Связаться с автором можно по электронной почте.

Темпокоррекция

Темпокоррекцией называется изменение скорости воспроизведения (или темпа) фонограммы без изменения тембра голоса.

 

Алгоритмы темпокоррекции используются в профессиональных программных транскрайберах уже около двадцати лет. В последнее время эти алгоритмы стали использоваться даже музыкантами - см. например, описание программы "Amazing Slow Downer" (http://www.ronimusic.com/) в колонке Сергея Голубицкого в еженедельнике "Компьютерра" (Голубятня № 268 - http://www.internettrading.net/guru/ct/pub/06_268.html). Windows Media Player непосредственно поддерживает темпокоррекцию (см. пункт меню "View\Enhancements\Play Speed Settings...") - см. рис.

Кроме того, существует возможность расширения возможностей Windows Media Player путем использования специальных DSP-плагинов. Текущая версия Программы поддерживает встроенную поддержку темпокоррекции.

Форматы файлов

Windows Media Player версии 9 поддерживает темпокоррекцию для файлов формата .wma, .wmv, .wm, .mp3, и .asf. Кроме того, темпокоррекция может не работать при воспроизведении скачиваемых из Интернета файлов или файлов, воспроизводимых через Интернет (streaming).
Темпокоррекция для файлов формата WAV не поддерживается, при изменении скорости воспроизведения файлов формата WAV тембр голоса меняется довольно существенно.

Аудиометки и аудиотекстовые документы

Фонограммы

Фонограмма
Для простоты мы будем называть медиа файл любого совместимого с Windows Media Player формата фонограммой, имея в виду, что в качестве источника звука может использоваться как файл формата WAV или MP3, так и звуковая дорожка видеозаписи.

URL

URL – это компактное представление адреса и способа доступа к ресурсу, размещенному в сети Интернет. URL состоит из названия протокола (HTTP, HTTPS, FTP, или Gopher) и строки, уточняющей адрес ресурса, синтаксис которой зависит от протокола. Адрес ресурса может включать в себя путь к файлу, строку поиска и т.д. Другими словами, URL – это строка, которую мы обычно набираем в адресной строке браузера. В тексте документа URL обычно отображаются как гиперссылки, например http://transcriber.narod.ru/SoundFile.mp3.

Потоковые источники звука

Работа Программы с потоковыми источниками звука (например, сетевыми радиостанциями) не проверялась.

Аудиометки

Аудиометка по-существу является закладкой (или гиперссылкой) и используется для старта воспроизведения указанной фонограммы с указанного времени, позволяя использовать преимущества прямого доступа к звуковой информации. Ниже в таблице перечислена информация, содержащаяся в аудиометке.

Информация Комментарий
Фонограмма Имя файла или URL фонограммы
Время Время может быть указано в абсолютном (ДД/ММ/ГГГГ ЧЧ/ММ/CC) или в абсолютном и относительном (ЧЧ/ММ/CC) формате. Используется для старта воспроизведения фонограммы с указанного времени.
Описание Произвольный комментарий. Название события, ФИО выступающего, и т.д.

Поскольку аудиометка должна как-то отличаться от основного текста документа и допускать возможность изменения, использования и последующего удаления из документа, то лучше всего использовать для создания аудиометок специальные стили Microsoft Word.

Использование стилей для создания аудиометок

Для создания аудиометок идеально подходят стили Microsoft Word. Примем следующие соглашения о стилях, которые будут использоваться при работе с аудиометками.

 

Стили: Параграфные стили AhSoundLink и AhSoundText используются для вставки и удаления аудиометок и описания сопутствующего события в текст документа. Определения стилей AhSoundLink и AhSoundText (все параметры, кроме имени и типа стиля) могут быть изменены пользователем по собственному усмотрению. Другими словами, для работы Программы существенными являются только имена стилей. Атрибуты форматирования (шрифты, размер, цвет и т.д.) стилей, т.е. внешний вид аудиометок, могут быть произвольными.

В случае отсутствия стилей AhSoundLink и AhSoundText в документе в момент вставки аудиометок или описания событий (например, в случае удаления стилей пользователем), стили AhSoundLink и AhSoundText создаются Программой автоматически. На следующих картинках отражены определения стилей AhSoundLink и AhSoundText по умолчанию.

Определение стиля AhSoundLink Определение стиля AhSoundText

 

Аудиометка

Аудиометкой называется набор строк (параграфов в терминах Microsoft Word), помеченных параграфными стилями AhSoundLink или AhSoundText, который автоматически вставляется в документ и/или удаляется из документа после выполнения пользователем определенных команд.

Следующие строки иллюстрируют структуру формата используемых аудиометок:

[TimeMarker] [MediaFile URL] Строка, содержащая информацию о медиа файле и времени события помечена стилем AhSoundLink.
AudioLabel Text here... Строка с описанием события помечена стилем AhSoundText.

Аудиотекстовые документы

Звуковой документ: Аудиотекстовым (или звуковым) документом будем называть документ, содержащий аудиометки.

 

Следующие картинки иллюстрируют примерный вид аудиотекстовых документов.

Звуковой документ "Detochkin.doc".

Звуковой документ "Dialog131.doc".

 


 

 

О программе "Транскрайбер"


© 2007-2010 Евгений Ахунджанов. Все права сохранены.
www.transcriber.ru | Послать письмо автору