Форматы электронных книг – беспредел разнообразия

17.08.2010 | Автор : man | Рубрика: Технологии

“Всякая вещь есть форма проявления беспредельного разнообразия”, говаривал Козьма Прутков. Что уж там говорить про вещи не материальные, а оцифрованные. Сегодня я рискну приоткрыть взору читателя огромный и многоликий мир представления данных – мир форматов электронных книг.

В описании различных устройств для чтения, наряду с техническими характеристиками, можно увидеть перечисление форматов электронных книг, которые данное устройство воспроизводит. У одних читалок этот список достаточно внушителен, у других ограничен двумя-тремя специализированными форматами. Но этот перечень имеет немаловажное значение среди других характеристик устройства, так как именно он определяет универсальность и способность воспроизводить определенный вид информации.

Современная электронная информация представляет собой файл в определенном формате, который может воспроизводиться на экране в удобном для чтения виде. Вы могли уже обратить внимание на то, что одно устройство способно воспроизводить несколько различных форматов электронных книг. И эта особенность – это возможности аппаратного и программного обеспечения, которыми оснащен букридер. Чтобы информация на дисплее отображалась корректно, необходимо, чтобы формат электронной книги, которую вы скачали или купили, поддерживался вашим устройством.

Требования к форматам электронных книг

Для того, чтобы чтение с электронного устройства происходило в максимально комфортном для вашего зрения режиме, к форматам электронных книг предъявляются определенные требования. Основным требованием, конечно же, является легкость и удобство чтения текста – его полиграфичность. Возможность вставить иллюстрации, сноски и цитаты, выделить заголовки и другим образом форматировать текст, ведь именно это делает книгу книгой.

Масштабируемость и кроссплатформенность также имеют немаловажное значение. В идеале электронная книга должна читаться на различных устройствах при разных разрешениях и размерах экрана. Конвертируемость документа в другие форматы  делает его универсальным в условиях постоянно меняющихся стандартов представления данных. А поддержка гипертекста обеспечивает возможность моментально переходить в нужное место по ссылке.

Вот этим параметрам и стремятся соответствовать всевозможные форматы, поэтому при создании электронных книг используют как стандартные формы представления текстовой информации, так и специализированные. Давайте же рассмотрим подробнее наиболее распространенные форматы книг.

Формат TXT

История современных форматов начинается с тех самых пор как появилась необходимость для представления информации в ЗВМ. Такой древнейший формат электронной информации как TXT (или просто plaintext) до сих пор является самым распространенным. Тем более что он не требует установки дополнительного программного обеспечения.

TXT-формат универсален для многих платформ и без проблем конвертируется в другие форматы. Единственный его недостаток – это низкая полиграфичность текста. Как вы понимаете, практически любая электронная читалка поддерживает этот формат.

Форматы DOC и RTF

К типично текстовым форматам относятся так же знакомые многим форматы DOC и RTF, создателями которых является компания Microsoft. Распространенность формата DOC обусловлена повсеместным использованием текстового редактора Microsoft Word. А формат RTF был создан для удобства переноса размеченного текста из одной программы в другую.

Основными свойствами форматов этой группы являются их всеобщая доступность и распространенность. Но они по-прежнему считаются форматами для офисных документов, а не для книг и полиграфической продукции.

Проблема формата DOC в его зависимости от платформы Microsoft Windows. Из известных мне устройств формат DOC поддерживает только читалка iRiver Story EB02. RTF же поддерживается такими ридерами как Лбук V3 Plus, читалкой Azbuka N516 и многими другими.

Формат PDF

Полиграфичность электронных книг для букридеров на хорошем уровне поддерживает такой известный формат от компании Adobe, как PDF. Формат PDF был разработан для полиграфии. В нем распространяется огромное количество технической документации.

Он позволяет внедрять в документ необходимые шрифты, векторные и растровые изображения, вставлять JavaScript-сценарии, формы и даже мультимедиа-контент. PDF документы поддерживают несколько типов сжатия растровой информации и переходы по гиперссылкам. Существует так же формат PDF с электронной подписью для коммерческого использования и защиты авторских прав. После сканирования текста со сложной структурой, математическими формулами и схемами его проще перевести и хранить именно в этом формате.

Для просмотра книги в формате PDF на читалке понадобится программа Adobe Reader. Недостаток формата – это его громоздкость и высокие требования к вычислительным ресурсам. Наилучшими вариантами для чтения литературы в формате PDF являются PocketBook Pro 912Amazon Kindle DX или Sony Reader PRS-900.

Формат DjVu

Для облегчения распространения литературы через сеть Интернет был разработан формат DjVu, который представляет собой специальную технологию сжатия изображения. Алгоритм устроен таким образом, что запоминает изображение повторяющихся символов и хранит только одну их копию.

Этот формат является разработкой компании AT&T. Он отлично подходит для сканированных текстов: книг, исторических документов, рукописей, журналов, рисунков, формул и везде, где распознавание текста является слишком трудоемким процессом. Тем не менее DjVu позволяет хранить текстовый слой для поиска по словам, гиперссылки и даже оглавление. DjVu часто можно встретить в разнообразных онлайн-библиотеках, но для электронных читалок он является таким же крепким орешком как и PDF.

На сегодня с этим форматом более-менее научились справляться лишь  некоторые букридеры  с диагональю экрана в 6 и более дюймов, например, читалки PocketBook.

Форматы FB2 и ePub

Формат FB2, он же FictionBook, является без сомнения самым популярным форматом литературы на всем пространстве СНГ, аналогичную роль играет формат ePub на западе. Оба этих формата электронных книг были разработаны на основе языка разметки XML. Эти стандарты документов призваны максимально упростить кроссплатформенность и масшатбируемость. Они содержат в себе всю необходимую информацию для книги: сведения об авторе, структурированный текст, оглавление, иллюстрации, аннотацию и даже обложку.

Формат ePub является открытым стандартом и даже поддерживает каскадные таблицы стилей CSS и технологию защиты авторских прав DRM. Интересной особенностью обоих этих форматов является то, что они не декларируют, как должен выглядеть документ, оставляя это на откуп программе-просмотрщику.

Книги FB2 стали де-факто стандартом для отечественных электронных библиотек, а программы для их просмотра есть практически в любом букридере и операционной системе. Одна из таких программ-просмотрщиков FB2 – FBReader, а с ePub вполне справится даже обычный Sony Reader PRS-300.

Формат HTML

Ну куда же без гипертекста? Интернет в том виде, в котором мы привыкли видеть его через окна наших браузеров, состоит из документов в формате HTML. Массу информации можно получить только в этом формате, и современным устройствам для чтения книг тоже приходится подстраиваться.

Этот формат выгодно отличается от обычного текста тем, что поддерживает форматирование, сложные элементы типа таблиц и списков, оглавление и конечно же гиперссылки. Однако, он не очень подходит для книг: вся его прелесть и богатство теряется с отключением от сети Интернет, а самая простая книга с иллюстрациями будет состоять из россыпи файлов на вашей карте памяти, что, как вы понимаете, не очень удобно. Подавляющее большинство устройств для чтения электронных книг поддерживают отображение HTML документов.

Формат CHM

Если вы запустите в своей ОС Windows какую-нибудь программу вроде калькулятора и нажмете клавишу F1 на клавиатуре, то увидите справку Windows. Это и есть типичный файл формата CHM или Microsoft Compressed HTML Help.

Формат был придуман еще в 1997 году и основной особенностью его является возможность полнотекстового поиска по документу. Он также поддерживает гиперссылки и предметный указатель. Как правило CHM файл внутри состоит из набора HTML страниц, сжатых в один архив.

Главным недостатком этого формата является его ориентированность на платформу ОС Windows. Далеко не все электронные читалки имеют хорошую поддержку этого формата, но вам почти наверняка повезет с ридерами PocketBook.

Проприетарные форматы электронных книг

Я постарался осветить наиболее распространенные и используемые форматы для электронных книг, но этот список при желании можно дополнить еще несколькими десятками специализированных форматов, которые были разработаны конкретными компаниями для конкретных устройств для чтения. Такие форматы как PRC, PDB, MOBI, BBeB, LRF, AZW, WOLF и другие вы встретите в описании электронных читалок различных производителей.

Наверное, эксклюзивность формата предполагает защиту авторских прав книги, но вместе с тем ограничивает универсальность электронного устройства, программное обеспечение которого рассчитано только на свои форматы. На мой взгляд, это существенно снижает его конкурентоспособность на потребительском рынке аналогичных устройств, поддерживающих целый спектр различных форматов.

Выводы

Как видите, от разнообразия форматов рябит в глазах. Но пусть уважаемого читателя это не смутить. Подойдите к выбору электронной читалки прагматично. Вспомните, книги какого формата уже есть в вашей электронной библиотеке; те, что вы регулярно используете или планируете использовать. Этого вполне достаточно для того, чтобы грамотно выбрать и купить читалку.