Визуализация информации в текстовых документах S 4.4

САМОЕ ГЛАВНОЕ

Известно, что текстовая информация воспринимается человеком лучше, если она визуализирована — организована в виде списков, таблиц, диаграмм, снабжена иллюстрациями (фотографиями, рисунками, схемами).

Всевозможные перечни в документах оформляются с помощью списков. По способу оформления различают нумерованные и маркированные списки. Нумерованный список принято использовать в тех случаях, когда имеет значение порядок следования пунктов; маркированный — когда порядок следования пунктов в нём не важен. По структуре различают одноуровневые и многоуровневые списки.

Для описания ряда объектов, обладающих одинаковыми наборами свойств, наиболее часто используются таблицы, состоящие из столбцов и строк. Представленная в таблице информация наглядна, компактна и легкообозрима.

Визуализация информации в текстовых документах S 4.4 - student2.ru

 
  Визуализация информации в текстовых документах S 4.4 - student2.ru

В современных текстовых процессорах предусмотрены возможности включения, обработки и создания графических объектов.

Вопросы и задания

1. С какой целью разработчики включают в текстовые документы списки, таблицы, графические изображения?

2. Для чего используются списки? Приведите примеры.

3. Сравните нумерованные и маркированные списки. Что у них общего? В чём различие?

4. Какой список называется многоуровневым? Приведите пример такого списка?

5. Какая информация может быть организована в табличной форме? Какие преимущества обеспечивает табличное представле Визуализация информации в текстовых документах S 4.4 - student2.ru ние информации?

6. Каких правил следует придерживаться при оформлении таблиц?

7. Какие графические объекты могут быть включены в текстовый Визуализация информации в текстовых документах S 4.4 - student2.ru документ?

8. Перечислите основные возможности текстовых процессоров по работе с графическими объектами.

S 4.5

Инструменты распознавания текстов

И компьютерного перевода

Ключевые слова;

• программы распознавания документов

• компьютерные словари

• программы-переводчики

Кроме текстовых процессоров, предназначенных для создания и обработки текстов на компьютере, существует ряд программ, позволяющих автоматизировать работу человека с текстовой информацией.

Визуализация информации в текстовых документах S 4.4 - student2.ru
4.5.1. Программы оптического

Распознавания документов

Очень часто возникает необходимость ввести в компьютер несколь Визуализация информации в текстовых документах S 4.4 - student2.ru ко страниц текста из книги, статью из журнала или газеты и т. д. Конечно, можно затратить определённое время и просто набрать этот текст с помощью клавиатуры. Но чем больше исходный текст, тем больше времени будет затрачено на его ввод в память компьютера.

Судите сами. Предположим, кто-то из ваших одноклассников, Визуализация информации в текстовых документах S 4.4 - student2.ru освоивших клавиатурный тренажёр, может вводить текстовую ин Визуализация информации в текстовых документах S 4.4 - student2.ru формацию со скоростью 150 символов в минуту. Выясним, сколько Визуализация информации в текстовых документах S 4.4 - student2.ru времени ему понадобится для того, чтобы ввести в память компьюте Визуализация информации в текстовых документах S 4.4 - student2.ru ра текст романа А. Дюма «Три мушкетёра». Одно из изданий этого Визуализация информации в текстовых документах S 4.4 - student2.ru романа выполнено на 590 страницах; каждая страница содержит 48 строк, в каждую строку входит в среднем 53 символа.

Вычислим общее количество символов в романе: 590 • 48 53 1 500 960 (симв.).

Вычислим время, необходимое для ввода этого массива символов в память компьютера: 1500960 : 150 10000 (мин.). А это приблизительно 167 часов.

Распознавание текстов и компьютерный перевод Визуализация информации в текстовых документах S 4.4 - student2.ru

При этом мы не обсуждаем вопрос о времени на исправление возможных ошибок при таком способе ввода текста, не принимаем в расчёт усталость человека.

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов. Одной из наиболее известных программ такого типа является АВВУУ FineReader. Упрощённо работу с подобными программами можно представить так:

1. Бумажный носитель помещается под крышку сканера.

2. Визуализация информации в текстовых документах S 4.4 - student2.ru

 
  Визуализация информации в текстовых документах S 4.4 - student2.ru

В программе отдаётся команда Сканировать и распознать. Сначала создаётся цифровая копия исходного документа в формате графического изображения. Затем программа анализирует структуру документа, выделяя на его страницах блоки текста, табли Визуализация информации в текстовых документах S 4.4 - student2.ru цы, картинки и т. п. Строки разбиваются на слова, а слова — на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр. хранящи Визуализация информации в текстовых документах S 4.4 - student2.ru мися в её памяти. Программа рассматривает различные вариан Визуализация информации в текстовых документах S 4.4 - student2.ru ты разделения строк на слова и слов на символы. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста. Проанализировав огромное число возможных вариантов, программа принимает окончательное решение и выдает пользователю распоанапный текст.

З. Распознанный текст переносится в окно текстового редактора (например, Microsoft Word).

Вместо сканера можно использовать цифровой фотоаппарат или камеру мобильного телефона. Например, при работе с книгами в библиотеке вы можете сфотографировать интересующие вас страницы. Скопировав снимки на компьютер, вы можете запустить АВВУУ FineReader, распознать тексты и продолжить работу с ними в текстовом процессоре (рис. 4.20).

Визуализация информации в текстовых документах S 4.4 - student2.ru

Рис. 4.20. Оптическое распознавание документов

Визуализация информации в текстовых документах S 4.4 - student2.ru

4.5.2. Компьютерные словари

И программы-переводчики

Возможности современных компьютеров по хранению больших массивов данных и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков.

В обычном словаре, содержащем несколько сотен страниц, поиск нужного слова является длительным и трудоёмким процессом. Компьютерные словари обеспечивают мгновенный поиск словарных статей. Многие словари предоставляют пользователям возможность прослушивания слов в исполнении носителей языка.

Компьютерные словари (русско-английские и англо-русские, русс Визуализация информации в текстовых документах S 4.4 - student2.ru ко-французские, русско-немецкие и др.) могут быть установлены на компьютер как самостоятельные программы, бывают встроены в текстовые процессоры, существуют в оп-йпе-режиме в сети Интернет.

Визуализация информации в текстовых документах S 4.4 - student2.ru
www Сервис Яндекс-словари (http://slovari.yandex.ru/) обеспечивает перевод слов с семи иностранных языков на русский и обратно. Вы можете получить полную информацио о правильном произношении и написании иностранных слов, синонимах и примерах использования.

Компьютерные словари ВЫПоЛНЯЮт перевод отдельных слов и сло Визуализация информации в текстовых документах S 4.4 - student2.ru восочетаний. Для перевода текстовых документов применяются программы-переводчики. Они основаны на формальном знании языка — правил словообразования и правил построения предложений. Программа-переводчик сначала анализирует текст на исходном языке, а затем конструирует этот текст на том языке, на который его требуется перевести.

С помощью программ-переводчиков можно успешно переводить Визуализация информации в текстовых документах S 4.4 - student2.ru техническую документацию, деловую переписку и другие текстовые материалы, написанные «сухим» языком. Перевод художественных текстов, эмоционально окрашенных, богатых гиперболами, метафорами и др., в полной мере может выполнить только человек.

Сервис Переводчик текста (http://www.translate.ru/[)efault.aspxnext) предназначен для автоматизированного перевода небольших (не более 3000 символов) фрагментов текстовой информации с одного языка на другой. В нём поддерживаются английский, русский, немецкий, французский, испанский, португальский, итальянский и литовский языки; обеспечивается 26 направлений перевода (англо-русский и русско-английский; немецко-русский и русско-немецкий; французско-русский и русско-французский и т. д.).

Распознавание текстов и компьютерный перевод Визуализация информации в текстовых документах S 4.4 - student2.ru

САМОЕ ГЛАВНОЕ

Для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов.

Возможности современных компьютеров по хранению больших массивов информации и осуществлению в них быстрого поиска положены в основу разработки компьютерных словарей и программ-переводчиков. Компьютерные словари выполняют перевод отдельных слов и словосочетаний. Для перевода текстовых документов применяются программы-переводчики.

Вопросы и задания

1. В каких случаях программы распознавания текста экономят время и силы человека?

2. Сколько времени потребуется для ввода в память компьютера текста романа Л. Дюма «Три мушкетёра» с помощью сканера и Визуализация информации в текстовых документах S 4.4 - student2.ru Визуализация информации в текстовых документах S 4.4 - student2.ru программы АВВУУ FineReader, если известно, что на сканирование одной страницы уходит З с, на смену страницы в сканере — 5 с, на распознавание страницы — 2 с?

З. Найдите в Интернете информацию о технологии сканирующего листания. В чём её суть?

4. Какие, по вашему мнению, основные преимущества компьютерных словарей перед обычными словарями в форме книг?

5. Почему программы-переводчики успешно переводят деловые документы, но не годятся для перевода текстов художествен Визуализация информации в текстовых документах S 4.4 - student2.ru ных произведений?

6. С помощью имеющейся в вашем распоряжении программы-переводчика переведите на знакомый вам иностранный язык фразу: «Кроме текстовых процессоров, предназначенных для создания и обработки текстов на компьютере, существует ряд программ, позволяющих автоматизировать работу человека с текстовой информацией». Полученный результат с помощью той же программы переведите на русский язык. Сравните текст исходной фразы и конечный результат. Дайте свои комментарии.

Визуализация информации в текстовых документах S 4.4 - student2.ru

Визуализация информации в текстовых документах S 4.4 - student2.ru

54.6

Оценка количественных параметров

Текстовых документов

Ключевые слова:

• кодовая таблица

• восьмиразрядный двоичный код

• информационный объём текста

Наши рекомендации