Көп өлшемді модель
Қордағы мәліметтерді берудің көп өлшемді тәсілі реляциялық модельмен бірге пайда болды, бірақ осы уақытқа дейін нақты жұмыс істейтін көп өлшемді МҚБЖ өте аз болды. 90-шы жылдардың ортасынан бастап, бұл модельге қызығушылық жаппай етек алды. Бұған реляциялық тәсілдің негізін салушылардың бірі Э.Коддтың 1993 жылы жазған программалық мақаласы түрткі болды. Онда OLAP (Online Analitical Processing-жедел аналитикалық өңдеу) класындағы қойылатын 12 негізгі талап тұжырымдалған. Олардың ішіндегі ең маңыздысы көп өлшемді мәліметтерді өңдеу мен концептуальды беру мүмкіндіктерімен байланысты. Көп өлшемді жүйелер шешім қабылдау мен талдау жүргізуге арналған ақпараттарды жедел өңдеуге мүмкіндік береді.
Ақпараттық жүйелер тұжырымдамасының дамуында төмендегідей екі бағытты бөліп көрсетуге болады:
• жедел (транзакциялық) өңдеу жүйесі;
• аналитикалық өңдеу жүйесі (шешім қабылдауды сүйемелдеу жүйесі).
Реляциялық МҚБЖ ақпараты жедел өңдейтін ақпараттық жүйелерге арналды және осы салада барынша тиімді болды. Ал аналитикалық өңдеу жүйелерінде айтарлықтай қолайлылық танытпады, ал көп өлшемді МҚБЖ әлде қайда тиімді болды.
Көп өлшемді МҚБЖ ақпаратты интерактивті аналитикалық өңдеуге арналған МҚБЖ болып табылады. Енді көп өлшемді МҚБЖ-де пайдаланатын негізгі ұғымдарға тоқталайық: мәліметтердің болжанатындығы, тарихилығы және агрегаттылығы.
Мәліметтердің агрегаттылығы-ақпаратты жалпылаудың әртүрлі деңгейінде қарастыруды көрсетеді. Ақпараттық жүйелерде пайдаланушы үшін ақпаратты берудің даралылығы оның деңгейіне тәуелді болады: талдаушы, пайдаланушы-оператор, басқарушы, жетекші.
Мәліметтердің тарихилығы мәліметтердің және олардың өзара байланысының жоғары деңгейдегі тұрақтылығын, сондай-ақ, уақытқа байланыстылығының міндетті болуын қамтамасыз етеді.
Мәліметтердің тұрақтылығы оларды өңдеу барысында шақыру, сақта, индекстеу және таңдаудың арнайы әдістерін пайдалануға мүмкіндік береді.
Мәліметтердің уақытқа байланыстылығы таңдау құрамында уақыт пен
ай-күннің мәндері болатын сұрауларды жиі орындау үшін қажет. Мәліметтерді өңдеу және беру процесінде мәліметтерді уақыт бойынша реттеу қажеттілігі пайдаланушыға сақтау механизмі мен ақпаратқа кіру мүмкіндігіне қойылатын талапты жүктейді. Уақытты азайту үшін сұрауларды өңдеу дұрыс болып табылады, мәліметтер жиі сұралатын деңгейде сұрыпталып тұруы қажет.
Мәліметтердің болжанатындығы болжау функциясын беруге болатынын және оның әртүрлі уақыт аралығында қолданылатындығын білдіреді.
Мәліметтердің көп өлшемді моделі цифрлық мәліметтерді көрнекілендірудің көп өлшемдігін емес, мәліметтерді манипуляциялау операцияларында және сипаттауда ақпарат құрылымын көп өлшемді логикалық беруде болып табылады.
Реляциялық модельмен салыстырғанда мәліметтерді көп өлшемді етіп ұйымдастыру жоғары көрнекілік пен хабардарлылықты қамтамасыз етеді. Оны 2.7-кестедегі автомобильдің сатылу көлемі жөніндегі мысалда реляциялық (а) және көпөлшемді (ә) тәсілмен берілулерін көруге болады.
а)
Моделі | Ай | Көлемі |
«Жигули» | июнь | |
«Жигули» | июль | |
«Жигули» | август | |
«Москвич» | июнь | |
«Москвич» | июль | |
«Волга» | июль |
ә)
Моделі | Июнь | Июль | Август |
«Жигули» | |||
«Москвич» | No | ||
«Волга» | No | No |
8-сурет. Мәліметтердің реляциялық және көпөлшемді берілулері.
Мәліметтердің көп өлшемді моделінің негізгі ұғымдарын қарастырайық, оған өлшем мен ұяшық жатады.
Өлшем – бұл гиперкубтың бір бүйір қырын құрайтын бір типті мәліметтер жиынтығы. Жиі пайдаланылатын уақыт өлшемдерінің мысалына Күндер, Айлар, Тоқсандар, және Жылдар жатады. Географиялық өлшем ретінде Қалалар, Аймақтар, және Елдер алынады. Мәліметтердің көп өлшемді моделінде гиперкубтың ұяшықтарындағы нақты мәндерді идентификациялауда өлшеу индекстер ролін атқарады.
Ұяшық немесе көрсеткіш – бұл мәндері тіркелген өлшеулер жиынтығымен бір мәнді анықталатын өріс. Өрістің типі көпшілік жағдайда сандық болып анықталады. Кейбір ұяшықтың мәндерінің қалай қалыптасатынына тәуелді, ол әдетте айнымалы болуы (мәндері өзгеріп, сыртқы мәліметтер көзінен шақырылуы немесе программалық жолмен қалыптасуы) немесе формула арқылы (алдын ала берілген формула бойынша электрондық кестедегі тәрізді есептелуі) мүмкін.
Қазіргі көп өлшемді МҚБЖ-де мәліметтерді ұйымдастырудың екі негізгі схемасы пайдалынады: гиперкубтық және поликубтық.
Поликубтық үлгіде МҚ-да әртүрлі бірнеше гиперкуб анықталуы мүмкін және оның әрбір қырындағы өлшемдері әртүрлі болып келеді. Поликубтық үлгідегі МҚ-н сүйемелдейтін жүйенің мысалына Oracle Express Server жатады.
Гиперкубтық үлгіде барлық көрсеткіштер белгілі бір өлшеулер жиынтығымен анықталады. Бұл МҚ-дағы болатын бірнеше гиперкубтардың өлшемдері бірдей болатынын көрсетеді. Кейбір жағдайларда, егер ұяшықтарды міндетті түрде толтыру талап етілсе. Онда МҚ-дағы ақпарат шамадан тыс артық болуы мүмкін.
Мәліметтердің көп өлшемді моделінде қолданылатын бірқатар арнайы операциялар бар: «кесу», «айналдыру», «агрегациялау» және «детализациялау».
«Кесу» (Slice) бір немесе бірнеше өлшеуді тіркеу нәтижесінде алынған гиперкубтар жиынтығы. Кесу пайдаланушының қолданатын мәндерін шектеу үшін орындалады, өйткені гиперкубтың барлық мәндері практикада ешқашан бір мезгілде пайдаланылмайды. Мысалы, гиперкубтағы автомобиль моделін өлшеу мәндерін шектесе («жигули» маркалы), онда автомобильдің осы маркасын жыл бойы әртүрлі менеджерлердің сатуын бейнелейтін екі өлшемді кесте алынады.
«Айналдыру» (Rotate) екі өлшемді мәліметтерді беру үшін қолданылады. Оның негізгі мәні мәліметтерді көрнекі етіп көрсету жағдайында өлшеу ретін өзгерту болып табылады. Мысалы, 2.7-суреттегі ә-кестеде екі өлшемді кестенің айналуы көрсетілген. Мұнда өзгеріс Х осінің бойында автомобиль маркалары, ал У осінің бойында уақыт орналасатындай болып өзгереді.
«Айналдыру» операциясын көп өлшемді жағдай үшін де жалпылауға болады, ол үшін өлшеуді шығару ретінің өзгерісі процедурасы ретінде қарастырамыз.
«Агрегациялау» (Drill Up) және «детализациялау» (Drill Down) операциялары гиперкубтағы ақпаратты пайдаланушыға жалпылап беруге немесе талдап беруге көшуді көрсетеді.
«Агрегациялау» операциясының мағынасын бейнелеп көрсетуді төмендегідей гиперкуб мысалымен түсіндіруге болады. Гиперкубта келтірілген өлшеулермен қатар, тағы да мынадай өлшеулер бар: бөлімше, аймақ, фирма, мемлекет. Бұл жағдайларда өлшеулердің арасында иерархиялық қатынас бары байқалады (төменнен жоғары қарай): бөлімше, аймақ, фирма, мемлекет. Берілген гиперкубтың сипатталуында менеджер Дәулетовтің 1995 жылы «Жигули» және «Волга» автомобилін сатқаны анықталған болсын. Иерархия бойынша бір деңгейге жоғары көтеріле отырып, «агрегация» операциясының көмегімен Даулетов істейтін бөлімше деңгейдегі осы модельдердің сатылу қатынасының қалай көрінетінін анықтауға болады.
9-сурет. Үшөлшемді модельдің мысалы.
Өлшемі: уақыты (жылмен) – 1994, 1995, 1996; менеджерлер – Даулетов, Сарсенов, Айбеков; модель- «Волга», «Жигули», «Нива»; көрсеткіші: сату мөлшері.
Мәліметтердің көп өлшемді моделінің негізгі жетістігі – уақытқа тәуелді үлкен көлемді мәліметтерді аналитикалық өңдеу тиімділігі мен қолайлығында болып табылады. Ұқсас мәліметтерді реляциялық модель негізінде өңдеуді ұйымдастыруда МҚ-дағы өлшемділікке тәуелді күрделі операциялардың сызықтық емес өсуі байқалды және индекстеуге оперативті жадының айтарлықтай көлемде жұмсалатыны көрінеді.
Мәліметтердің көп өлшемді моделінің кемшілігі – қарпайым есептегі ақпаратты жедел өңдеудің айтарлықтай күрделігінде. Мұндай жүйелердің мысалына Essbase (Arbor Software), Media Multi-matrix (Speedware), Oracle Express Server (Oracle) және Cache (InterSystems) жатады. Кейбір программалық өнімдер, мысалы Media /MR (Speedware) бір уақытта көп өлшемді және реляциялық МҚ –н жұмыс істеуге болады. Мәліметтердің ішкі моделі көпөлшемді модель болып табылатын Cache МҚБЖ-де мәліметтерге енудің үш тәсілі бар: тікелей (көпөлшемді массив түйіндері деңгейінде), объектілі және реляциялық.