Состав и назначение систем подготовки текстовых документов
Лекция КОМПЬЮТЕРНЫЕ СИСТЕМЫ ПОДГОТОВКИ ТЕКСТОВЫХ ДОКУМЕНТОВ
Обработка текстов как направление развития техники возникла в первой декаде XX в. с появлением механической пишущей машины. Затем более полувека пишущая машина оставалась единственным общедоступным средством получения печатного текста на бумаге. Очевидно, что при печатании на пишущей машине наиболее трудоемким является процесс внесения изменений в текст, когда в лучшем случае с помощью ножниц и клея создается новый вариант документа, который затем весь перепечатывается заново для получения чистового варианта. В процессе печати опечатки замазываются или исправляются подчисткой и повторным впечатыванием. Наибольшие усовершенствования пишущей машины, такие как возможность печати часто повторяющихся текстов с помощью механического читающего устройства с закодированными перфорацией знаками, принципиально не изменили процесса подготовки текста. С появлением микропроцессора и персональных компьютеров на их основе подготовка текстовых документов обрела принципиально новую основу. В 1980-е гг. было разработано множество программ подготовки текстовых документов для различных персональных компьютеров, отличающихся как функциональными возможностями, так и организацией взаимодействия с пользователями (интерфейсом). В последние несколько лет получили распространение программы с такими возможностями, что их можно считать настольными издательскими системами, позволяющими выполнять не только ввод и редактирование текста, но и верстку в интерактивном режиме сложного текста с иллюстрациями. Существующие в настоящее время компьютерные системы подготовки текстовых документов значительно отличаются друг от друга характеристиками, возможностями по вводу и редактированию текста, его форматированию и выводу на печать, а также по степени сложности освоения пользователем. Выбор конкретного программного продукта для обработки текста является весьма ответственным моментом. Разнообразные системы подготовки текстов позволяют эффективно использовать компьютер тем специалистам, которые связаны с информационными технологиями. Процесс выбора связан со многими факторами, но прежде всего необходимо использовать принцип разумной достаточности. Наиболее важной для практического пользователя характеристикой программы этого класса могла бы выступить область профессиональной деятельности, для которой программный продукт удобен в применении. Инструментальные средства подготовки текстовых документов используются для набора текстов программ, документов различной
степени сложности, научных статей, книг и т. д. Ограничивающим фактором может быть квалификация пользователя. Наиболее актуальным в процессе подготовки текстового документа является организация интерфейса пользователя, к которому в первую очередь относятся язык общения с программой, а также устройства ввода-вывода (клавиатура, манипулятор типа «мышь», экран видеотерминала и устройство печати). Современные системы подготовки текстовых документов обладают в большинстве своем дружественным пользовательским интерфейсом. Однако разработчики программ подготовки текстов учитывают тот факт, что у каждого пользователя свой стиль работы над документом (что удобно для одной группы пользователей — для другой является помехой). Поэтому наиболее привлекательными для разработчика документа выглядят те программные среды, в которых возможна настройка интерфейса под свои вкусы и потребности. С точки зрения удобства для пользователя одним из важнейших свойств текстовых процессоров является полное соответствие твердой копии (на бумажном носителе) образу документа на экране. Такая характеристика по-английски называется WYSIWYG (What You See Is What You Get — что вы видите, то и получите). Не последнюю роль при выборе программы играют объем занимаемой памяти и цена. Существующие в настоящее время компьютерные системы подготовки текстовых документов можно классифицировать по объему функциональных возможностей или по назначению для применения (рис. 1).
Рисунок 1 - Классификация систем подготовки текстовых документов
Текстовый редактор (text editor) обеспечивает ввод, изменение и сохранение любого символьного текста, но предназначен он в основном для подготовки текстов программ на языках программирования высокого уровня, поскольку они не требуют форматирования, т. е. автоматического преобразования расположения элементов текста, изменения шрифта и т. п.
Программный текст исторически первым стал обрабатываться с помощью компьютера. Набор операций текстовых редакторов определяет особенности построчной записи текстов на языках программирования, хотя этот набор и весьма широк. Результатом работы экранного редактора является файл, в котором все символы являются знаками кодовой таблицы ASCII (American Standards Committee for Information Interchange) с кодами, значения которых больше 315, а также символы новой строки. Такие файлы называются ASCII-файлами. Различаясь способами управления и набором сервисных возможностей, все редакторы текста в том или ином виде позволяют:
— набирать текст с отображением на экране видеомонитора, используя до 200 символов;
— исправлять ошибочные символы в режиме замены;
— вставлять и удалять группы символов (слова) в пределах строки, не переводя неизменившуюся часть строки, а сдвигая ее влево (вправо) целиком в режиме вставки;
— удалять одну или несколько строк, копировать их или перемещать в другое место текста;
— вставлять группы строк из других текстов;
— обнаруживать все вхождения определенной группы символов (контекста);
— заменять один контекст другим, возможно, разной длины;
— сохранять набранный текст для последующих корректировок;
— печатать текст на разных типах устройств печати (принтеров) стандартными программами печати одним шрифтом в пределах документа.
Из множества имеющихся редакторов текста можно выделить Norton Editor (фирма Peter Norton Computing Inc.), SideKick (фирма Borland), Brief (фирма Solution Systems), многофункциональный многооконный редактор Multi-Edit (фирма American Cybernetics Inc.), редактор Notepad в составе ОС Windows. К этой же категории относятся редакторы Турбосистем программирования.
Разнообразные Турбосистемы представляют удобные интегрированные инструментальные средства для создания, компиляции, отладки и выполнения программ на таких популярных языках программирования, как Бейсик, Паскаль, Си, Пролог, Ассемблер. Обязательной составляющей Турбосистем является редактор, обладающий широкими возможностями по созданию и обновлению программных текстов.
Команды редакторов Турбосистем основаны на командах популярной программы Word Star и в высшей степени стандартизированы. Когда основной задачей пользователя являются подготовка текстов на естественных языках для печати и печать этих документов, набор операций редактора должен быть существенно расширен, и программный продукт переходит в новое качество — систему подготовки текстов — продукт, которому соответствует англоязычный термин word processor. Такие программы для обработки документов ориентированы на работу с текстами, имеющими структуру документа, т. е. состоящими из абзацев, страниц и разделов.
Среди систем подготовки текстов на естественных языках можно выделить три больших класса, но с достаточно размытыми границами: форматеры, текстовые процессоры и настольные издательства. Исходя из внутримашинной структуры подготавливаемого документа, можно было бы предложить следующий подход к классификации систем подготовки текстов.
Форматер — система подготовки текстов, которая не использует для внутреннего представления текста никаких специальных кодов, кроме стандартных: конец строки, перевод каретки, конец страницы (по сути работает с ASCII-файлами).
Текстовый процессор — система подготовки текстов, которая во внутреннем представлении снабжает собственно текст специальными кодами — разметкой.
В основном текстовые редакторы и текстовые процессоры различаются по назначению:
первые создают ASCII-файлы, которые используются затем компиляторами или форматерами,
вторые — предназначены для подготовки текстов для последующей печати на бумаге, форма представления текста имеет большое значение.
Текстовые процессоры имеют специальные функции, которые предназначены для облегчения ввода текста и представления его в напечатанном виде. Среди этих функций можно выделить следующие:
— ввод текста под контролем функций форматирования, обеспечивающих немедленное изменение вида страницы текста на экране и расположение слов на ней, давая прилиженное представление о действительном расположении текста на бумаге после печати;
— возможность предварительного описания структуры будущего документа, в котором задаются такие параметры, как величина абзацных отступов, тип и размер шрифта для различных элементов текста, расположение заголовков, междустрочные расстояния, число колонок текста, расположение и способ нумерации сносок и т. п.;
— возможность автоматической проверки орфографии и получения подсказки при выборе синонимов;
— возможность ввода и редактирования таблиц и формул с отображением их на экране в том виде, в каком они будут напечатаны;
— возможность объединения документов в процессе подготовки текста к печати;
— возможность автоматического составления оглавления и алфавитного справочника.
Большинство текстовых процессоров имеют средства настройки на конфигурацию оборудования компьютера, в частности на тип графического адаптера и видеомонитора. Практически все текстовые процессоры имеют уникальную структуру данных для представления текста, что объясняется необходимостью включения в текст дополнительной информации, описывающей структуру документа, шрифты и т. п., поскольку каждое слово или даже символ могут иметь свои особые характеристики. Поэтому текст, подготовленный с помощью одного текстового процессора, как правило, не может быть прочитан другими текстовыми процессорами и, следовательно, не может быть отредактирован и напечатан. В целях совместимости текстовых документов при переносе их из среды одного текстового процессора в другой существует особый вид программного обеспечения — конвертеры, обеспечивающие получение выходного файла в формате текстового процессора — получателя документа.
Программа-конвертер на входе получает информацию в одном формате, а как результат своей работы выдает информацию в виде файла в другом (требуемом) формате. Дальнейшее усовершенствование систем обработки текстов привело к тому, что автономные программы-конвертеры практически прекратили свое существование и вошли составной частью в систему подготовки текстов. Сегодня наиболее яркие представители программ текстовой обработки поддерживают популярные файловые форматы за счет встроенных модулей конвертации. Существующие в настоящее время текстовые процессоры значительно отличаются друг от друга характеристиками, возможностями по вводу и редактированию текста, его форматированию и выводу на печать, а также по степени сложности освоения пользователем.
Достаточно условно эти инструментальные средства могут быть разделены на две категории.
К первой категории можно отнести текстовые процессоры, позволяющие подготовить и напечатать сложные и большие по объему документы, включая книги. К ним относятся WinWord, WordPerfect, ChiWriter, WordStar 2000, AmiPRo, T3. Самым популярным отечественным продуктом в этом классе, на наш взгляд, является текстовый процессор «Лексикон».
Текстовые процессоры второй категории имеют существенно меньшие возможности, однако проще в использовании, работают быстрее и требуют меньше оперативной памяти, существенно ниже по стоимости.
Специально рассчитанные на руководителей системы обработки текстов проще, и ими легче пользоваться. К этой категории можно отнести Beyond Word Writer, Professional Write, Symantec Just Write, DacEasy Word. Настольные издательства готовят тексты по правилам полиграфии и с типографским качеством. Подобно тому как текстовые процессоры не являются «развитием» форматеров, настольные издательства не являются более совершенным продолжением текстовых процессоров, так как у них совсем иное назначение.
Настольные издательские системы (desktop publishing, пакеты DTP или НИС) по сути являются инструментом верстальщика. Предназначены программы этого класса не столько для создания больших документов, сколько для реализации различного рода полиграфических эффектов. То есть программа настольного издательства позволяет легко манипулировать текстом, менять форматы страниц, размер отступов, дает возможность комбинировать различные шрифты, работать с материалом до получения полного удовлетворения от внешнего вида как отдельных страниц (полос издания), так и всего издания.
По ряду функциональных возможностей пакеты НИС аналогичны лучшим текстовым процессорам, и граница, разделяющая их, становится все незаметнее. Но пакеты НИС отличаются от текстовых процессоров еще двумя важными характеристиками.
Во-первых, пакеты НИС имеют более широкие возможности управления подготовкой текста.
Во-вторых, подготовленные в пакете НИС материалы выглядят изданиями высшего уровня качества, а не просто как изящные распечатки. Все пакеты имеют характеристики, отсутствующие в абсолютном большинстве текстовых процессоров, например сжатие и растяжение строк, вращение текста и изменение расстояний между строчками и абзацами с очень маленьким шагом приращения и т. д. Внешний файл, подготовленный текстовым процессором, можно распечатать только этим же текстовым процессором. Как правило, печать может быть выполнена на принтере любого типа, в том числе и на лазерном. Тексты, подготовленные настольными издательствами, распечатываются только на лазерных принтерах.
Среди систем подготовки текстовых документов в этом классе можно также предложить деление на две подгруппы:
- настольные издательства профессионального уровня;
- издательские системы начального уровня.
Системы первой подгруппы предназначены для работы над изданиями документов со сложной структурой или типа иллюстрированного журнала.
К системам профессионального уровня можно отнести QuarkXPress for Windows, FrameMaker for Windows, PageMaker for Windows. Однако освоение дорогих и сложных в эксплуатации «настольных типографий» обычно требует значительных временных затрат, поэтому вряд ли их целесообразно использовать тем специалистам, которым по роду занятий лишь изредка требуется красиво и довольно быстро подготовить документацию, письмо или объявление.
Системы второй группы обычно не предназначаются для получения промышленной полиграфической продукции. Пользователи данного класса НИС для решения своих задач, как правило, применяют другие программы, а НИС используют эпизодически, например при создании информационного бюллетеня или формирования поздравительной открытки для тиражирования в небольшой фирме.
Все пакеты данной категории ориентируются на новичка и пользователя, который отдает издательской деятельности лишь часть своего рабочего времени. Наиболее распространены в этой группе Microsoft Publisher, Pageplus for Windows.
Предложенная классификация систем подготовки текстов является во многом условной, так как некоторые функции текстовых редакторов различных классов перекрываются, постоянно появляются новые версии редакторов с более усовершенствованными и сложными процедурами обработки, что размывает границы между классами. Подготовка текстов с использованием текстовых процессоров заключается в последовательном выполнении ряда этапов:
— набор текста;
— редактирование введенной информации;
— форматирование (оформление) отдельных структурных элементов будущего документа;
— печать документа;
— сохранение текста документа и ведение архива текстов.
Набор текста
При современном уровне развития компьютерных информационных технологий клавиатура остается основным инструментом ввода текста будущих документов. Набор текста на клавиатуре может производиться с любой скоростью, потерь информации при этом не происходит, возможно лишь некоторое отставание обработки символов системой подготовки текстов от момента непосредственного ввода. Вводимый текст располагается в специально отведенной области экрана видеомонитора — текстовом окне или рабочей области. Остальная часть экрана отводится под служебную область. Размеры этих логических частей (служебной и рабочей) зависят от конкретной программы подготовки текста.
Обычно в служебной области присутствует строка статуса, которая содержит полезную для пользователя информацию о режиме работы программы подготовки текста и используется для краткой подсказки о действии программы при выборе того или иного пункта меню. Место экрана, на котором появляется следующий вводимый символ, т. е. позиция, ввода, отмечается специальным знаком — курсором.
В служебной области всегда помещена информация о текущем положении курсора. Вид курсора зависит от программы, обеспечивающей обработку текста. Обычно это ромб, прямоугольник или знак подчеркивания. Любая система подготовки текстов поддерживает два режима ввода — вставки или замены. Переключение между режимами осуществляется клавишными командами программы либо командой меню. Возможность легко исправить ошибку набора снижает внимание пользователя и стимулирует высокую скорость набора текста, а следовательно, увеличивает вероятность набора ошибочных символов.
Клавиша <Backspace> удаляет ошибочный символ слева от курсора, клавиша <Delete> удаляет из текста символ, находящийся в позиции курсора, а все символы справа смещаются влево в режиме вставки. Вводимый символ автоматически раздвигает строку при режиме вставки либо заменяет существующий символ в режиме замены. Когда все отведенные для текста строки экрана дисплея будут заполнены, система подготовки текстов автоматически сдвигает текст. При этом верхняя строка текста исчезает из поля зрения пользователя, а внизу появляется пустая строка для дальнейшего ввода символов. Этот процесс называют прокруткой, или скроллингом, строк.
При наборе текста на компьютере часто имеют место нарушения правил набора и размещения текста абзацев, которые, как и грамматические ошибки, недопустимы ни в каком документе. К часто нарушаемым правилам компьютерного набора можно отнести следующие:
— знаки препинания не отделяются от предшествующего текста; допускается отделять пробелом только вопросительный знак (?);
— не отделяются от цифр знаки процент, градус, минута, секунда (45%, 20° и т. п.);
— одним пробелом цифры отделяются от символов № и §;
—однако при вводе нужно использовать «неразрывный» пробел, который не будет ни растянут при форматировании, ни разорван при переносе;
— дефис пробелами не отделяется; в компьютерном наборе часто неправильно используют дефис вместо тире, потому что знака тире в стандартной раскладке клавиатуры нет;
— тире, наоборот, отделяется пробелом;
— исключение составляют тире в сочетаниях, имеющих смысл «от» и «до», например 1941—1945 гг.
Во всех перечисленных случаях отделение не должно быть больше одного пробелами на этом пробеле недопустим перенос. Поэтому здесь необходим только «неразрывный» пробел. По этой же причине следует взять за правило ставить именно «неразрывный» пробел после предлога, которым начинается предложение. В результате редакторской правки оно может оказаться в конце строки, а правила запрещают заканчивать строку предлогом или союзом, с которого начинается новое предложение. Наконец, упомянем типичные ошибки, встречающиеся при использовании сокращений:
— в конце общеупотребительных сокращений «кг», «т», «ц», «км» точка не ставится;
— сокращения типа «т.д.» и «с.г.» записываются без пробела;
— сокращения «и др.», «и т. д.», «и т. п.» могут быть применены только в конце предложения, в середине предложения их нужно записывать полностью.
Чтобы выполнять перечисленные правила, можно было бы рекомендовать следующую культуру набора текста:
— там, где нужен пробел, но недопустим перенос на следующую строку, ставить символ «неразрывного» пробела;
— там, где нужен дефис и недопустим перенос на следующую строку, ставить символ «неразрывного» дефиса;
— не отделять пробелами знаки препинания;
— для набора «правильных» типографских символов можно воспользоваться механизмом макропоследовательностей системы подготовки текста, закрепив за удобной для вас клавишной комбинацией символ, которого нет на клавиатуре.
Вторая группа ошибок набора связана с неправильной расстановкой переносов слов. Системы подготовки текстов используют четыре способа выравнивания текста абзаца при автоматической верстке строк в процессе набора: влево, вправо, по центру и по ширине (выключка) — когда каждая строка абзаца, кроме концевой, выравнивается и по правой, и по левой границам за счет расстановки переносов с последующим равномерным расширением пробелов между словами.
Последний способ наиболее распространен, так как более всего соответствует удобству чтения и восприятия текста. Если в документе, изготавливаемом с помощью компьютерной системы подготовки текста, не преследуются специальные цели, например зафиксировать с помощью рваной правой границы внимание читателя, то абзацы принято выравнивать выключкой. Если просто (без переносов) выравнивать текст по правой границе, возникает брак, называемый жидкой строкой, или зияющими пробелами. Выключка придает тексту более формальный вид и имеет еще одно важное преимущество: выровненный текст, как правило, содержит больше символов в каждой строке, что уменьшает общее количество строк. Именно поэтому газетный стиль оформления текста использует колонки с выровненным по краям текстом.
В текст документа программа текстового процессора при выключке добавляет так называемые «мягкие» пробелы, осуществляется разгонка строк. Термин «мягкие» в данном случае подчеркивает возможность изменения положения пробела самой программой подготовки текста. Пробелы, задаваемые пользователем в тексте при наборе, программой текстового процессора не могут быть изменены, поэтому они называются «жесткими» пробелами. «Мягкие» пробелы могут сильно увеличить междусловное расстояние и привести к уже упомянутым «жидким» строкам, «дырявости» набора. Проблема появления «мягких» пробелов и увеличения междусловного промежутка решается расстановкой переносов. Целесообразно перенос слов выполнять на завершающей стадии редактирования. При переносе слова разбиваются по слогам, и в них вставляются скрытые символы «мягкого» переноса (так называемые необязательные дефисы). Когда возникает необходимость переноса, один из символов «мягкого» переноса разбивает слово на части с учетом максимально возможного заполнения текущей строки. Таким образом, использование переноса позволяет более плотно компоновать текст на странице.
Существуют две возможности переноса:
— автоматический перенос без контроля разработчика документа;
— принудительный перенос с контролем выполнения переноса пользователем.
При подготовке важных документов рекомендуется использовать вариант с принудительным переносом. Программа текстового процессора в этом случае предлагает пользователю свои варианты разбиения слова, окончательное решение о месте переноса принимает пользователь. Если ни один из вариантов не устраивает разработчика документа, он имеет право отказаться от переноса в этом слове.
Общая рекомендация заключается в использовании «мягкого» переноса, поставленного в месте нужного переноса. В тот момент, когда слово попадет в зону возможного переноса, невидимый специальный символ «мягкого» переноса превратится в реальный правильный знак переноса. При возникновении конфликта между вашим «мягким» переносом и неправильным, который автоматически предлагает текстовый процессор, необходимо провести исправления переноса вручную. Современные правила орфографии разрешают нарушение правил переноса при наборе на узкий газетный формат, когда нет технической возможности избежать ошибки. Текстовые процессоры работают в диапазоне широких строк, поэтому данные исключения для них неприменимы.
2. Редактирование текста Созданный на этапе набора текст