Системы распознавания текстов

OCR-системы оптического распознавания символов. Первая такая система появилась в 1959г и могла распознавать тексты набранные только одним шрифтом(OCR-A, OCR-B). Сегодня OCR-система базируется на технологии целостного, целенаправленного, адаптивного распознавания. Целостность – объект воспринимается как единое целое с помощью значимых элементов и отношений между ними. Целенаправленность – распознавание строится как процесс выдвижения и целенаправленных проверок гипотез. адаптивность – способность системы к самообучению. Наиболее известной OCR-системой является Fine Reader. Этот продукт полностью совместим с последними версиями системы Windows. Его версия 6.0. поддерживает 177 языков мира, а также комбинацию рус-анг и др. процесс распознавания происходит без вмешательства человека, человек включается в окончательное редактирование полученного образа. Среди других систем этого класса – CuneiForm. Российская разработка конкурирующая с Fine Reader, о ее достоинствах говорит то, что ряд фирм включила ее в свои офисные пакеты.

35. Табличные процессоры: функциональные возможности.

Табличные процессоры – это специальный комплекс программ для управления электронной таблицей. Табличные процессоры обеспечивают:  ввод, хранение и корректировку большого количества данных;

Осн функции ЭТ: Обработка различных типов данных, Оформление и печать ЭТ, Создание многотабличных док-ов объединен формулами, Построение и модификация графич представления данных, Работа с табл как с база данных, Создание итоговых и сводных таблиц, Исп информ из внешних источников, Решение задач «что, если» путем подбора параметров, Статистическая обработка данных, Разработка макрокоманд для автоматизации некот действий и др.

Функциональные возможности: многооконный интерфейс(означает, что можно работать одновременно с несколькими открытыми окнами), многостраничные файлы(файл представляется в виде книги, кот разбивается на страницы), гибкое управление текстом, встроенные функции(большое количество встроенных функций, разбитых на классы), проверка рабочей таблицы(встроены различные способы проверки, подсказывающие пользователю о сделанных ошибках), разнообразие диаграмм и возможность рисовать, управление списками,т.е. возможность работать с табличным процессором как с базой данных, сводные таблицы, защита рабочей книги, обмен данными - поддерживает все способы обмена(через буфер, динамическая связь, OLE-технология), файловая совместимость, имеет собственный формат файла, управление базами данных, кроме списков EXCEL может читать файлы специализированных систем управления базами данных, мощная справочная система.

Основные понятия табличного процессора

Электронная таблица – компьютерный эквивалент обычной таблицы, в клетках (ячейках) которой записаны данные различных типов: текст, даты, формулы, числа

Основными понятиями Excel являются книга, лист, ячейка, страница, адрес ячейки, ссылка.

 книга – это файл, используемый для обработки и хранения данных, состоящий из отдельных листов;

 лист – разделен на строки и столбцы и служит основой для выполнения вычислений. Рабочий лист состоит из 256 столбцов и 65536 строк;

ячейка – область, определяемая пересечением столбца и строки электронной таблицы (ЭТ);

текущая (активная) ячейка – ячейка ЭТ, в которой в данный момент находится курсор;

адрес ячейки определяется названием (номером) столбца и номером строки;

ссылка – ссылка указывает на ячейку или диапазон ячеек листа, которые требуется использовать в формуле;

абсолютная ссылка – это ссылка, не изменяющаяся при копировании формулы в другую ячейку;

 относительная ссылка – это ссылка, автоматически изменяющаяся при копировании в соответствии с положением формулы.

Типы данных в Excel

В Excel могут быть выделены след виды данных:

· Числовые. Они представляют собой значения, кот можно исп в вычислениях

· Текстовые. Такие данные исп в кач-ве элементов оформления табл, либо для хранения и обработки текстовой информ (фамилии, адреса и др.)

· Дата и время. Дата исп для отображения даты. В памяти компа данные этого типа сохран как число, представл собой кол-во дней от 1 янв 1900 г. До введенной даты. Время хранится как часть суток

Для форматирования чисел исп команда «Формат» - «Ячейки» и вкладка «Число». Для данных числового типа предусмотрены след форматы:

1-Числовой. Исп для отображ целых чисел и десятичных дробей. Для этого формата можно установить разделитель между тысячными разрядами, а также кол-во чисел после запятой., 2-Денежный. Исп для проведения денежных расчетов. Можно установить кол-во выводимых на экран чисел после запятой, а также тип валюты., 3-Финансовый. Отлич от предыдущего только типом выравнивания в ячейке, 4-Дата. Позволяет установить разнообразные форматы вывода даты, 5-Время. Позвол установить разнообразные форматы вывода времени, 6-Процентный. Исп для отображ относит величины, выраж в процентах. В память компа даты в этом формате сохр как десятичные дроби, 7-Дробный. Исп для отображения простых дробей, 8-Экспоненциальный. Исп для отраж чисел в экспоненциальном виде.

Созд собств форматов.Когда встроенных форматов недостаточно, предусмотрена создание собственных формато. Для этого: Выделить одну или несколько ячеек для кот требуется изм формат, Выберите команду: Формат/Ячейки вкладка Число, затем в данном списке формата выбрать элемент /все форматы/, В поле Тип введите маску нового формата.

0 – исп для контроля кач-ва разрядов числа

? – исп аналогично предыдущему, только в разрядах дробной части числа заносятся не нули, а символы пробела

# -- исп когда нужно жестко задать порядок ростановки символов пробела

Возможности деловой графики

Деловая графика включ диаграммы (графики) различных видов.Диаграммы позволяют отображать соотношение значений табличных данных, увидеть динамику их изм, просмотреть прогнозирующую кривую для статистических данных.

Точка данных-одно значение ряда данных, подписи данных – текст или числа, кот отображ над графиками и соответствуют значению или критерию, заголовок диаграммы – заголовок, присвоенный диаграмме, ось значений – ось, на кот показаны значения, соответсвующие рядам данных, ось категорий – ось, на кот откладыв категории, соттв рядам данных, легнда – текстовое и графическое описание обозначений рядов данных в диаграмме, область построения диаграммы – область, в кот отображаются знач рядов данных, область диаграммы – область всей диаграммы, в кот расположены все элементы диаграммы, заголовок оси Х – поясняющ подпись к оси категории, заголовок оси Y – поясняющ подпись к оси значенийПостроение диаграмм осуществляется с помощью Мастера диаграмм.Созданные диаграммы можно корректировать, вплоть до изменения исходных данных и способа их представления. Редактирование диаграмм предполагает изменение типа диаграммы или ориентации данных, изменение визуальных эффектов. Можно также добавлять или удалять отдельные элементы, либо изменять определенные параметры. В Excel предусмотрена также возможность дополнения диаграмм другими рядами данных.

Диаграмму, созданную на рабочем листе, перед обработкой необходимо выделить двойным щелчком мыши. При выделении диаграммы на рабочем листе или листа диаграммы изменяется строка меню. В ней будут представлены команды, используемые для обработки и форматирования диаграмм.

Изменение вида элементов диаграммы (цвета фона, выбор узора, использование рамок и т.д.) или шрифта (типа, стиля начертания и размера используемых символов текста) выполняется с помощью форматирования. Окно форматирования для любого элемента диаграммы можно открыть с помощью двойного щелчка мыши на нем или путем активизации команды меню Формат.

Наши рекомендации