Технологии распределенной обработки данных
В современных сетевых информационных технологиях всё чаще используют распределённую обработку данных. Она позволяет повысить эффективность удовлетворения информационных потребностей пользователей, обеспечить гибкость и оперативность принимаемых им решений и др.
Под распределённой обработкой данных понимают обработку приложений несколькими территориально разделёнными ЭВМ. При этом в приложениях, связанных с обработкой базы данных, собственно управление базой данных может выполняться централизованно.
Распределенная обработка данных (Distributed Data Processing, DDP) - это методика выполнения прикладных программ группой систем. При этом пользователь получает возможность работать с сетевыми службами и прикладными процессами, расположенными в нескольких взаимосвязанных абонентских системах.
Распределённая обработка данных позволяет повысить эффективность удовлетворения информационных потребностей пользователей, обеспечивает гибкость и оперативность принимаемых ими решений.
Функции распределённой среды включают службы:
каталогов, позволяющую клиентам находить серверы;
удаленного вызова процедур;
обслуживания файлов;
безопасности данных;
времени, синхронизирующей часы в абонентских системах.
Наиболее часто данные размещаются в БД. Ими обычно управляют локальные СУБД, то есть размещённые на том же компьютере. Когда несколько таких БД удалены друг от друга на большие расстояния, то возникает необходимость решения задач управления ими, то есть распределёнными БД. Для решения таких задач между ЭВМ с локальными СУБД и БД организуют сеть передачи данных по каналам связи, а в ней обеспечивают техническую и программную поддержку обмена данными. То есть в этом случае используют ПО, управляющее распределёнными базами данных, которые могут образовывать банки данных.
3.1. Распределенные базы данных
Распределённые базы данных (англ. "Distributed DataBase", DDB) представляют определённым образом связанные между собой БД, рассредоточенные на какой-либо территории (локально или регионально), обеспечивающие свободный обмен информацией и поиск данных в них.
Распределённая база данных предполагает хранение и выполнение функций управления данными в нескольких узлах и передачу данных между этими узлами в процессе выполнения запросов. Разбиение данных в распределённой базе данных может достигаться путём хранения различных таблиц на разных компьютерах или даже хранения разных частей и фрагментов одной таблицы на разных компьютерах. Для пользователя или прикладной программы не имеет значения, каким образом распределены данные между компьютерами. Работа с распределённой базой данных осуществляется так же, как и с централизованной, т. е. размещение БД должно быть прозрачно.
При распределённой обработке работа с базой (представление данных, их обработка и др.) ведётся на компьютере клиента, а поддержание базы в актуальном состоянии – на сервере. При этом такие БД обычно располагаться на нескольких серверах – различных узлах компьютерной сети, а некоторые данные могут дублироваться.
Создание распределённых баз данных (РБД) вызвано попыткой одновременного решения двух задач: интеграции и децентрализации.
Интеграция подразумевает централизованное управление и ведение баз данных.
Децентрализация обеспечивает хранение данных там, где они появились и обрабатываются. При этом снижается стоимость системы и увеличивается степень её надёжности, а также повышается скорость обработки данных.
Выделяют однородные и неоднородные РБД. В неоднородных РБД используются различные СУБД. Основная проблема при этом заключается в сложности их интеграции.
3.2. Система управления распределёнными базами данных
Доступ пользователей к РБД и администрирование ею осуществляются с помощью системы управления распределённой базой данных (СУРБД).
Система управления распределёнными базами данных (Distributed dataBase management system, DDBMS) - это система управления базами данных, расположенными в нескольких узлах информационной сети.
В СУРБД используется комбинация централизованного и локального способов хранения данных.
Для решения задач с распределёнными БД, во-первых, необходимо организовать между этими ЭВМ сеть передачи данных, то есть соединить их каналами связи. Затем обеспечивают техническую и программную поддержку обмена данными между ними, образуя тем самым сеть ЭВМ.
СУРБД создаются таким образом, чтобы максимально обеспечить соблюдение принципа независимости прикладных программ от локализации данных в сети. При этом логическое представление распределённой БД и манипулирование данными для прикладной программы ничем не отличаются от работы пользователя с локальной базой. Такие СУРБД оснащены каталогами, в которых хранятся структура сети, информация о локальных СУРБД и базах данных, а также программным обеспечением, которое на основе этой информации управляет взаимодействием прикладной программы и конкретной локальной базой данных сети.
Сложность управления распределёнными базами данных во многом зависит от того, поддерживаются ли они однотипными локальными СУРБД, взаимодействие между которыми осуществляется просто. В противном случае в такую сеть включают различные программные и технические устройства, обеспечивающие единый интерфейс, согласование и возможность выполнения информационных процессов, например, использовать промежуточную интерфейсную СУРБД и др.