Настройка компонентов потока данных
Компоненты потока данных могут настраиваться на уровне компонента в целом; на уровне входа, выхода и выхода ошибок, а также на уровне столбцов:
- на уровне компонента определяются общие для всех компонентов свойства, а также свойства, характерные для конкретного компонента;
- на уровне входа, выхода и выхода ошибок определяются общие свойства входов, выходов и выходов ошибок компонента. Если компонент поддерживает работу с несколькими выходами, то их можно добавить;
- на уровне столбцов в дополнение к общим для всех столбцов свойствам задаются характерные свойства, предоставляемые компонентом для столбцов. Если компонент поддерживает добавление выходных столбцов, то их можно добавить к выходам;
Свойства задаются посредством конструктора служб SSIS или программно.
Развертывание служб SSAS
Планирование развертывания служб Analysis Services
После завершения разработки проекта служб SSAS в среде BI Dev Studio, а также после развертывания и тестирования проекта в собственной среде разработки можно перейти к развертыванию базы данных служб SSAS на отладочном и рабочем серверах.
При развертывании проекта служб SSAS необходимо ответить на следующие вопросы:
- какие программные ресурсы и ресурсы оборудования требуются на целевом сервере?
- как развертывать дополнительные объекты, выходящие за область проекта служб SSAS, а именно: пакеты, отчеты или схемы реляционных баз данных служб SSIS?
- как загружать и обновлять данные в развернутой базе данных служб SSAS?
- как обновлять метаданные (например, вычисления) в развернутой базе данных служб SSAS?
- нужно ли предоставлять пользователям доступ к данным служб SSAS через сеть Интернет?
- нужно ли предоставлять запросам возможность непрерывного доступа к данным служб SSAS?
- нужно развертывать объекты в распределенной среде при помощи связанных кубов или удаленных секций?
- как обеспечить безопасность данных служб SSAS?
Требования к ресурсам
Перед развертыванием проекта служб SSAS следует рассмотреть требования к ресурсам. В частности, следует рассмотреть необходимые ресурсы памяти, процессора и требования к месту на диске. Сведения о ресурсах памяти и процесса, требуемых для служб SSAS, зависящих от версии Microsoft Windows, установленной на сервере, могут быть найдены на сайте Microsoft. В следующих случаях требуется больше ресурсов памяти и процессора:
1. при обработке больших или сложных кубов. Для этого требуется больше ресурсов памяти и процессора в сравнении с обработкой малых или простых кубов;
2. при увеличении количества кубов в одной базе данных;
3. при увеличении количества БД в одном экземпляре служб SSAS;
4. при увеличении количества экземпляров служб SSAS на одном компьютере;
5. при увеличении количества пользователей с одновременным доступом к ресурсам служб SSAS.
Объем требуемого места на диске зависит от различных аспектов установки служб SSAS и задач, связанных с обработкой объектов.
Кубы с большими таблицами фактов требуют больше места на диске, чем кубы с небольшими таблицами фактов. Аналогично, хотя и в меньшей степени, кубы с большим количеством измерений требуют большего места на диске. Как правило, для базы данных служб SSAS требуется примерно на 20% больше объема места на диске в сравнении с таким же объемом данных, хранящемся в базовой реляционной базе данных.
Для агрегатов требуется дополнительное место, пропорциональное добавлению самих агрегатов: чем больше добавляется агрегатов, тем больше требуется места на диске. Если лишние агрегаты не используются, то дополнительное место на диске, необходимое для агрегатов, обычно не должно превышать 10% от размера данных, хранящихся в базовой реляционной базе данных.
По умолчанию структуры интеллектуального анализа данных кэшируют на диск набор данных, которые использовались для обучения.
Во время обработки службы Analysis Services хранят на диске копии объектов, которые участвуют в обработке транзакций, до завершения обработки. Затем обработанные копии объектов замещают исходные объекты. Следовательно, необходимо предоставить значительный объем дополнительного места на диске для второй копии обрабатываемых объектов. Например, если планируется обрабатывать в одной транзакции весь куб, то необходимо обеспечить достаточный объем места на диске для хранения второй копии всего куба.
Поддержание доступности
В среде служб SSAS куб или модель интеллектуального анализа данных могут быть недоступны для запросов вследствие возникновения сбоев оборудования или ошибок программного обеспечения.
Поддержание доступности установки служб SSAS заключается в первую очередь в обеспечении дополнительных ресурсов, позволяющих пользователям использовать систему в случае ошибок и сбоев. Для предоставления дополнительных ресурсов, необходимых для поддержания доступности в случае возникновения сбоев оборудования или ошибок программного обеспечения, используется кластеризация и балансировка нагрузки серверов.
Некоторые изменения в кубе могут вызвать недоступность куба во время его обработки. Например, при выполнении структурных изменений в измерении куба, даже при повторной обработке измерения, необходимо обработать все кубы, использующие это измененное измерение. Во время обработки таких кубов пользователи не могут выполнять запросы к этим кубам, а также к моделям интеллектуального анализа данных, основанным на кубе с измененным измерением. Чтобы обеспечить доступность во время обработки структурных изменений, влияющих на один или несколько кубов в проекте служб SSAS, следует рассмотреть использование промежуточного сервера и мастера синхронизации баз данных. Эта функция позволяет обновлять данные и метаданные на промежуточном сервере, а затем выполнять оперативную синхронизацию рабочего и промежуточного серверов.