Форматы текстовых файлов

TXT («простой текстовый») - родоначальник «жанра» файловых форматов. Активно используется по сей день. Так как текст хранится в виде последовательности символов, то размер файла в байтах равен числу символов плюс непечатаемые символы. За счет этого достигается малый размер файла. Однако возможности по форматированию подобных документов сильно ограничены.

RTF («Rich Text Format» - «формат обогащенного текста») - свободный межплатформенный формат хранения размеченных текстовых документов, созданный Microsoft в 1987 году. Ныне он широко распространен, поэтому большинство современных текстовых редакторов его поддерживают. Редактор WordPad, встроенный в Microsoft Windows по умолчанию сохраняет документы в формате RTF. Текстовые редакторы AbiWord и OpenOffice.org позволяют просматривать и редактировать файлы в формате RTF. Редактор по умолчанию в Mac OS X — TextEdit, также поддерживает RTF.

RTF позволяет производить и сохранять достаточно сложное форматирование, вставлять сноски, колонтитулы, рисунки, таблицы и формулы, хотя в этом он все же уступает формату DOC. Формат RTF выигрывает спор с DOC в отношении безопасности, так как не использует макросы. Поэтому зараженные макро-вирусами файлы Word можно «вылечить» сохранением в RTF-формат. Кроме того, формат RTF устойчив к повреждению файла. Если в DOC-файле изменить хотя бы один байт, то он уже не откроется в Word. А повреждение файла в формате RTF может привести только к потере поврежденного куска текста.

DOC(от англ. «document»). Изначально это расширение использовалось для обозначения простых текстовых файлов без форматирования, однако в начале 90-х Microsoft фактически его «приватизировала». Поэтому сейчас DOC ассоциируется только с продуктами этой компании. Этот формат обеспечивает большие возможности по форматированию текста. За счет этого ухудшилась совместимость с текстовыми редакторами сторонних разработчиков. В файле этого формата содержится огромное количество информации о шрифтах, начертании символов, абзацных отступах и интервалах, даже если все это вам совсем не нужно. Именно из-за этой дополнительной информации файл, содержащий только текст, превышает размер RTF-файла. Однако при включении в документ различных графических элементов и изображений DOC выигрывает в размере и обеспечивает большую совместимость. В отличие от ТХТ и RTF DOC является бинарным форматом, что делает его нечитабельным в простых текстовых редакторах.

DOCXс появлением Office 2007 компания Microsoft перешла на новые форматы, базирующиеся на Office Open XML (визуально отличаются тем, что к расширениям добавлена буква «х» на конце). Формат представляет собой zip-архив, содержащий текст в виде XML, графику и другие данные для уменьшения размера файла используется ZIP-компрессия. Документы обратно совместимы с Office 2000/ХР/2003, только если установлен Microsoft Office Compatibility Pack (найти и скачать его можно с официального сайта Microsoft, размер файла 27,8 Мб). Если нужно срочно конвертировать DOCX в другой формат, можно воспользоваться услугами сайта http://docx-converter.com. Если вы пользуетесь последней версией Office и планируете передавать файлы кому-либо, сохраняйте документы в RTF или DOC.

ODT/ODF («Ореn Document Format») ODF - общее наименование открытого формата документов для офисных приложений (текст, таблицы, рисунки, базы данных, презентации). Текстовые данные хранятся в файлах с расширением ODT. Стандарт был разработан индустриальным сообществом OASIS и основан на XML-формате. 1 мая 2006 года принят как международный стандарт ISO/IEC 26300. ODF доступен для всех и может быть использован без ограничений. Это бесплатная альтернатива закрытым форматам Microsoft. Для того чтобы производить чтение и запись формата ODF в продуктах Microsoft, был выпущен плагин Sun ODF Plugin for Microsoft Office. Поддержка ODF в Microsoft Office 2007 была введена с выпуском Service Pack 2. Уступает по распространенности RTF и DOC.

PDF(Portable Document Format - переносимый формат документов). Кроссплатформенный формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript. В первую очередь предназначен для представления в электронном виде полиграфической продукции. Для просмотра можно использовать официальную бесплатную программу Adobe Reader, а также программы других разработчиков (Foxit Reader, PDF-XChange Viewer PRO и др.). Удобен тем, что решена проблема со «слетевшим» форматированием, неправильным отображением внедренных графических элементов, отсутствием тех или иных шрифтов. Файл на любой платформе будет отображен в таком же виде, в каком он был создан. Традиционным способом создания PDF-документов является следующий: документ как таковой готовится в своей программе, а затем экспортируется в PDF. Некоторые программы имеют возможность для прямого экспорта (без использования виртуального принтера). Например, OpenOffice.org. или MS Word 2007. Стандарт де-факто для большинства документации.

Рекомендуется использовать PDF файл для сохранения готовых макетов визиток из следующих программ Adobe Illustrator, Photoshop, или Corel Draw. Также можно использовать Adobe Acrobat Distiller, который устанавливается вместе с программой Adobe Acrobat или Microsoft Publisher. PDF с 1 июля 2008 года является открытым стандартом ISO 32000.

DJVU(«дежа вю») Технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов - книг, журналов, рукописей и пр., где наличие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоемким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов. Очень распространен, многие библиотеки используют его для хранения отсканированных научных книг. DjVu иногда называют «тексто-графическим» форматом. Суть технологии DjVu заключается в автоматическом разбиении изображения на несколько участков (например, текст, логотип фирмы и растровая фотография), для каждого из которых выбирается оптимальный алгоритм сжатия. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области - ссылки, что позволяет реализовывать удобную навигацию. Дает выигрыш в размере файла по сравнению с pdf и gif-форматами в среднем в полтора-два десятка раз.

3. Издательские системы специализируются на подготовке набранного документа к публикации, создании макета издания.

Считается, что создание издательских систем началось с программы Aldus PageMaker, первая рабочая версия которой появилась в июле 1985 года для компьютеров Macintosh. Aldus ныне забыта, однако именно они разработали технологию OPI, которая позволяла использовать при верстке изображения с низким разрешением (высококачественные подставлялись лишь при выводе макета). Эта фирма участвовала в формировании стандарта PostScript, совместно с Microsoft создали формат TIFF. Они же выпустили Freehand, который потом отошел к Macromedia (позднее к Adobe) и PhotoStyler (в будущем Photoshop многое позаимствовал у этой программы).

Первой издательской системой для PC стала Ventura Publisher (1986г.), немного позднее появилась PC-версия PageMaker. В 1987 году компания Quark, занимавшаяся с 1981 года текстовыми редакторами, выпустила свою первую версию QuarkXPress.

Фирма Adobe была основана в 1982 году и их первой разработкой стал язык PostScript. В 1985 году Adobe выпустила первые в мире принтер и фотонабор с поддержкой PostScript, в 1986 году - первый набор шрифтов Adobe Type Collection. И только потом принялась за создание графического софта: в 1987 году вышел в свет Adobe Illustrator, в 1990-м Adobe Photoshop и Туре Manager (менеджер шрифтов). Следом - разработка PDF, выпуск Adobe Acrobat в 1993 году.

Тем временем Quark постепенно завоевывал рынок издательских программ. Основные конкуренты теряют популярность и в итоге покупаются другими компаниями. В 1993 году пакет Ventura Publisher приобретает компания Corel, а в следующем году Aldus поглощается Adobe. И сразу же выходят обновленные версии этих программ: Corel Ventura Publisher 4.2и Adobe PageMaker 5. Следующая версия «Вентуры» вышла лишь в 1996 году и с тех пор ее популярность неуклонно падала. Adobe вдобавок купила Frame Technology и стала под своим именем раскручивать Framemaker. «Кварк» дорос до версии 3.3. В следующем году вышла четвертая версия, ставшая очень популярной.

После выхода Pagemaker 6.0 пришла пора знаменитого «шестопятого» (PageMaker 6.5). В 1999 году появилась первая версия InDesign. Тогда же было заявлено о прекращении линейки PageMaker. Издательской программой № 1 Adobe стали называть InDesign. Продукт был хорош, но сыроват, поэтому до версии его 2.0 всерьез не воспринимали. Со временем InDesign избавился от многих проблем и оброс новыми возможностями, захватив пальму первенства в издательском бизнесе. Тем не менее, QuarkXPress от него не отстает, выпуская ежегодно новые версии.

Adobe Pagemaker(http://www.adobe.com/products/pagemaker/index.html)

Еще десять лет назад это был основной конкурент «Кварка». Наличие русифицированной PC-версии предопределили всенародную любовь к «пейджмейкеру» на постсоветском пространстве, а «шестопятый» стал классикой. В конце 90-х PageMaker (РМ) перевели в разряд бизнес-приложений, выпустив последнюю версию 7.0 (2004г.). Но так как она долгое время оставалась нерусифицированной, многие предпочитали работать с версией 6.52. В принципе им пользуются до сих пор, если нужна простая верстка. По сравнению с InDesign работает быстрее, хотя минусов немало. Например, можно отменить только одно последнее действие, неустойчив при работе с публикациями со множеством элементов.

QuarkXPress(http://www.quark9.ru/)

Версия для Windows вышла только в 1992 году. За это время эту нишу занял Pagemaker. В то время РМ ассоциировался с PC, a Quark - с Mac. Но «макинтоши» были дороже PC, поэтому в России PC завоевал массовый рынок. В настоящее время «Кварк» - один из лидеров на рынке издательских программ, конкурирующий с Adobe InDesign. К сожалению, новые продукты выходят примерно раз в год, но в них больше косметических изменений, чем функциональных. Поэтому не имеет смысла гнаться за самыми новыми версиями.

Adobe InDesign(http://www.adobe.com/ru/products/indesign.html)

Назывался «Убийца Кварка». Но окончательной «победы» одержать пока так и не смог. Входит в состав пакета Adobe Creative Suite. Интегрирован со многими программами из этого пакета. В этом плюсы: общая идеология, сходный интерфейс (особенно в последних версиях). Достаточно требователен к ресурсам. Умеет открывать пейджмейкеровские файлы (что помогло при миграции). Конвертор в PDF уже встроен в программу, не нужно использовать сторонние разработки. В принципе окончательная победа InDesign не нужна, потому что конечным пользователям конкуренция только на руку.

Adobe FrameMaker(http://www.adobe.com/ru/products/framemaker.html)

Разработка FrameTechnology была куплена Adobe в 1995 году. Основная специализация - объемные структурированные документы - инструкции и руководства, энциклопедические и справочные издания, корпоративная документация. Там, где необходима публикация сложных и повторяющихся материалов. Актуальная версия Adobe FrameMaker 11 объединяет в себе функции программы верстки и текстового редактора с широкими возможностями XML.

Наши рекомендации