Tehnologii informatice inteligente de accesare multidimensională a bazelor şi depozitelor de date de marketing - PDF

Description
Tehnologii informatice inteligente de accesare multidimensională a bazelor şi depozitelor de date de marketing Autor: Gheorghe Orzan Abstract: În mod tradiţional, una dintre cele mai importante şi mai

Please download to get full document.

View again

of 12
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Information
Category:

Education

Publish on:

Views: 41 | Pages: 12

Extension: PDF | Download: 0

Share
Transcript
Tehnologii informatice inteligente de accesare multidimensională a bazelor şi depozitelor de date de marketing Autor: Gheorghe Orzan Abstract: În mod tradiţional, una dintre cele mai importante şi mai frecvente activităţi ale unui departament de marketing constă în gestionarea unor volume mari de date acumulate de a lungul timpului, de consultare a variate baze de date cantitative, de grafică sau multimedia in stare offline sau online, orientate spre piaţă (market oriented), date care provin din cercetările de marketing, de la alte organizaţii şi care impun operativ consultarea interactivă şi de o manieră flexibilă şi consistentă prin operaţii de integrare, sintetizare şi agregare, de reorganizare şi stocare, de gestionare şi procesare în raport de obiectivele de marketing. Acestea se constituie în surse de informaţii esenţiale în procesul de fundamentare a deciziilor, atât la nivelul activităţilor de marketing, cât şi în ansamblul organizaţiei. Tehnicile moderne din domeniul IT&C fac însă posibilă o analiză mult mai rapidă şi mai eficientă a acestor date, practic în timp real, în ciuda eventualelor distribuţii geografice. Această lucrare îşi propune prezentare unor situaţii teoretice şi practice în care tehnici de tip OLAP sau data mining eficientizează activitatea profesioniştilor în domeniul marketingului. Cuvinte cheie: asistarea deciziilor, strategii de marketing, data warehouse, sisteme asistarea deciziilor, OLTP, OLAP, data mining. A. Depozitele de date (data warehause) reprezintă un produs al mediului economic tot mai competitiv, global, dinamic şi complex în care organizaţia îşi desfăsoară activitatea şi care solicită informaţii relevante, actuale, de o manieră consistentă şi foarte flexibilă în procesul de fundamentare a deciziilor de marketing iar, pe de altă parte este rezultatul evoluţiilor spectaculoase în ceea ce priveşte tehnologiile din domeniul IT&C. Un depozit de date este o sumă de date consistentă din punct de vedere semantic care serveşte la o implementare fizică a unui model de date ca suport pentru sprijinirea deciziei şi stochează informaţii pe care o organizaţie le solicită în fundamentarea decizilor strategice. Un data warehouse (Inmon, 1996) este o colecţie de date orientată pe subiecte, integrată, atemporală, istorică si persistentă, destinată spijinirii procesului de fundamentare a deciziei manageriale. În sinteză definitia prezentată mai sus exprimă caracteristicile de bază ale depozitelor de date: orientarea pe subiecte majore (clienţi, furnizori, concurenţi, producţie, vînzari), prin integrarea unor multiple surse eterogene de informaţii (baze de date relaţionale, distribuite, baze de date multimedia şi de tip hipermedia, fişiere şi inregistrări), sunt independente de timp şi au caracter de istoric atribuit prin dimensiunile spaţiale şi temporale ale depozitului (prin consultarea valorilor succesive ale variabilelor cercetate pentru a determina evoluţia în timp şi spaţiu şi a estima tendinţele proceselor şi fenomenelor investigate), cât şi persistenţa datelor (datele din depozit sunt permanente şi nu pot fi modificate, fiind deja istorie a 29 evenimentului). In mod uzual depozitele de date implică numai două operaţii: construirea sau încarcarea iniţială a datelor (integrarea datelor, filtrarea, curăţarea şi consolidarea datelor) şi accesul la date printr o colecţie de tehnologii inteligente de asistare a procesului de fundamentare a deciziilor si care va permite specialiştilor (manageri, analişti, consultanţi, executivi) acces rapid, consistent şi facil la informaţiile din depozit. O comparaţie între bazele de date şi depozitele de date pune în valoare rolul depozitelor de date, ca model de organizare şi sursă suport de informaţii pentru fundamentarea deciziei. Atît bazele de date cît şi depozitele de date sunt structuri logice de organizare de date, exploatează tehnologii informatice de organizare şi gestiune de date diferite şi înmagazinează mari cantităţi de date. Diferenţele semnificative între cele două modele de organizare logică de date pot fi structurate astfel: Bazele de date din sistemele informatice conţin date curente, detaliate, care sunt actualizate şi interogate în aceleaşi perioade cu culegerea şi procesarea lor şi fac obiectul sistemelor informatice de prelucrare a tranzacţiilor (TPS). Depozitele de date sunt construite special ca sisteme suport de asistare a deciziei şi au ca obiectiv regruparea şi consolidarea datelor, agregarea şi sintetizarea lor, reorganizarea şi stocarea informaţiilor provenite din surse diverse şi variate de date inclusiv date multimedia, hipermedia şi de localizare spaţială şi fac obiectul sistemelor informatice inteligente sisteme suport de asistare a deciziei (DSS). Ele se aplică asupra unor volume foarte mari de date, eterogene, constituite ca depozite de istoric/arhivă de date şi presupun calcule complexe (analiză de tendinţă, corelaţii între evenimente, asociaţii intre anumite fapte, secvenţe, tipare de comportament, modele de cunoaştere) ; Sistemele de gestiune a bazelor de date sunt adecvate aplicaţiilor curente de gestiune şi servesc la crearea şi întreţinerea sistemelor de baze de date tranzacţionale OLTP (On Line Transaction Processing) şi au ca obiectiv execuţia în timp real a tranzacţiilor zilnice (aprovizionare, vînzari, stocuri, producţie, decontări, plăti, activităţi de marketing şi management, contabilitate) cât şi a procedurilor de interogare (Query). Sistemele de gestiune a depozitelor de date, pe de altă parte, servesc top managerii, managerii, utilizatorii sau specialiştii în domeniul analizei şi fundamentării deciziei, fac obiectul sistemelor informatice OLAP (On Line Analytical Processing) şi oferă tehnologii de agregare a datelor stocate în depozitele de date într o abordare multidimensională, cu acces rapid la informaţiile necesare, într o manieră consistentă, interactivă şi foarte flexibilă; Un sistem OLTP este centrat pe client (customer oriented) şi este utilizat pentru procesarea tranzacţiilor şi interogărilor din bazele de date constituite operaţional, baze care pot oferi răspunsuri la întrebări de tipul Cine?, Ce?, Unde?, Când? prin analiza datelor de tip numeric sau statistic. Un sistem OLAP este orientat spre piaţă (maket oriented) şi este utilizat de manageri, analişti, specialişti prin instrumente FASMI (Fast Analysis Shared Multidimensional Information) de analiza rapidă a informaţiei multidimensionale distribuită în locaţii multiple şi accesibilă în acelaşi timp unui număr mare de utilizatori pentru analize complexe prin agregare, sintetizare, consolidare şi care permit construirea de scenarii, prin posibilitatea de a răspunde la întrebări de tipul Ce ar fi dacă? pentru a descoperi corelaţii 30 între evenimente, asociaţii între anumite fapte, secvenţe şi tipare de comportament; Tehnologiile OLAP utilizează bazele de date multidimensionale, construite de regulă din date de istoric sau date care provin de la diferite organizaţii, integrând informaţii din surse eterogene, de tipuri şi naturi diferite. Tehnologiile OLTP utilizează baze de date relaţionale, care sunt bidimensionale prin definiţie, fiind focalizate pe datele curente dintr o organizaţie sau departament fără a referi date istorice sau date din alte organizaţii. B. Tehnologia OLAP (OnLine Analytical Processing) este un instrument puternic, performant şi uşor accesibil de agregare a datelor stocate în arhive mari de date, care printr o abordare multidimensională, asigură acces rapid la informaţii, iar printr o analiza multidimensională oferă răspunsuri concrete, consistente, corecte şi în timp real la întrebările analiştilor de marketing privind fenomene, procese şi activităţi de marketing. Tehnica OLAP permite o modelare dimensională, prin utilizarea cubului OLAP, o structură multidimensională, un hipercub, care modelează aspectul complex al unui proces sau fenomen, atit prin reprezentările sale cantitative, măsurabile ale activităţii, în strânsă legatură cu aspectele calitative sau de context. Context este definit prin dimensiunile/parametrii săi: când s a desfăşurat, unde s a desfăsurat, cine a iniţiat, cine a executat o, cine a beneficiat de ea,, cu ce resurse, cu cine a fost efectuată, de la cine şi către cine s a desfăşurat. Trăsătura esenţială a acestor întrebări este caracterul lor multidimensional. Există totuşi câteva tipuri uzuale de întrebări, care pot arunca o lumină asupra complexităţii instrumentelor care trebuie să furnizeze răspunsuri: rapoarte multidimensionale, ca de exemplu: vânzările totale ale firmei din produsul X, şi respectiv ponderea vânzărilor realizate prin magazinele din oraşul Y în perioada.? comparaţii, ca de exemplu: care este media abaterii procentuale de la planul de vânzări în primul semestru al acestui an comparativ cu vânzările din primul semestru al anului trecut? clasificări şi profiluri statistice, ca de exemplu: care este volumul vânzărilor şi media adaosului pentru primii 20 % dintre distribuitori şi care este contribuţia acestora la totalul vânzărilor pe trimestrul trecut? agregări libere, ca de exemplu: care sunt veniturile realizate în ultimele două trimestre de filialele judeţene din Muntenia? evaluări What If, ca de exemplu: în ce măsură ar influenţa profitul total al firmei o creştere cu 15 % a vânzărilor în judeţele din Moldova? Pentru oricine care a formulat interogări în bazele de date multidimensionale (engl. Query), este evident că exprimarea unor asemenea cereri depăşeşte posibilităţile oricărui instrument de acces şi raportare. Printre calităţile pe care trebuie să le îndeplinească un bun instrument OLAP se numără: să poată susţină analize sofisticate; să poată fi utilizate eficient de diverse categorii de utilizatori; să fie scalabile la volume oricât de mari de date; să permită accesul concurent al unui mare număr de utilizatori; să fie uşor de intreţinut şi de configurat; 31 să fie bazate pe o arhitectură deschisă deoarece evoluţia tehnologiei informaţiei poate aduce schimbări radicale în structura sistemului informatic care, însă, nu trebuie să afecteze instrumentaţia utilizată pentru analiză. O bază de date multidimensională utilizată de tehnologiile OLAP este formată din două structuri: Structura datelor prin care se descriu structurile proprii ale bazelor de date referite, cu câmpurile, atributele şi caracteristicile asociate; Structura metadatelor definită prin dimensiunile, structurile ierarhice ale dimensiunilor, membrii şi multipli acestor structuri. Dimensiunile OLAP sunt identificate în bazele de date tranzacţionale ca fiind cîmpurile ce conţin caracteristicile unei tranzacţii, datele de identificare a tranzacţiei respective şi care în cele mai multe cazuri sunt cheile externe utilizate în bazele respective. Dimensiunile reprezintă parametrii în care s a desfăsurat o activitate, nu se intersectează cu alte dimensiuni şi sunt de natură complet diferită (timp, spaţiu, produse, furnizori, clienţi, resurse financiare, resurse materiale, resurse umane). Mulţimea valorilor posibile pe care le poate lua dimensiunea respectivă poartă numele de membrii dimensiunii. Prin regruparea valorilor se generează multipli de membrii, grupe de valori ale dimensiunii respective cu o caracteristică comună. De exemplu se poate defini localitatea ca multiplu de membrii formaţi din toţi clienţii organizaţiei din localitatea respectivă. Dimensiunile şi multipli lor formează structuri arborescente cunoscute în OLAP sub numele de ierarhii. Modelarea dimensională oferă un model conceptual, cubul OLAP, care permite agregarea datelor într o structură ierarhică, simpla şi foarte flexibilă, fără a modifica structura de bază a colecţiilor încorporate în depozit, cu păstrarea legăturilor cu sursele iniţiale de date şi cu posibilitatea de descompunere a datelor centralizate pe niveluri ierarhice inferioare pînă la setul de tranzacţii iniţiale. Motorul OLAP foloseşte ca mod de vizualizare a datelor în depozitul de date, o reprezentare într un spaţiu n dimensional, prin care axele dau dimensiunea logică a cubului. Figura 1: Cubul de date 32 Dacă luăm ca exemplu dimensiunile: Produsul, timpul regiunea (zona), cubul măsurilor cantitative sau valorice ar avea reprezentarea din figura 1. Asupra cuburilor n dimensionale motorul analitic execută o serie de operaţii care se integrează în aplicaţii OLAP manevrate de utilizatorul final. Pentru execuţia acestor operaţii este necesară navigarea liberă de a lungul nivelelor ierarhice definite pentru depozitul de date. Principalele operaţii OLAP care se pot efectua sunt: Specificarea criteriilor de selecţie este primul pas în orice analiză. Utilizatorul trebuie să poată exprima cu uşurinţă criterii simple, bazate pe valori ale atributelor şi/sau pe valori ale metricelor. Aceste criterii simple trebuie să poată fi apoi combinate prin operatori logici şi trebuie să poată fi salvate în biblioteci pentru eventuale reutilizări. Rotaţiile sunt operaţii care permit utilizatorilor să găsească perspectiva care l interesează specificînd dimensiunile şi direcţiile de rotaţie sau indicând un pivot. Schimbarea nivelului de agregare permite găsirea nivelului de agregare optim pentru analiză. Se poate adânci analiza spre nivele de detaliu prin operaţii de schimbare a sensului de navigării de a lungul nivelelor unei ierarhii; prin drill down se poate naviga pe nivelele cu un grad de detaliu mai mare, iar prin roll up se va naviga pe nivelele ierarhice superioare ca nivel de agregare. Specificarea modului de prezentare trebuie să permită analistului să găsească modalităţile optime de valorificare vizuală a datelor extrase. În afară de posibilităţile grafice tipice pentru prezentare, este important ca utilizatorul să poată vizualiza date multidimensionale într o manieră tabelară. În acest sens se pot utiliza tabele complexe, care să poată grupa coloane şi linii exprimând dimensiuni diferite (de pildă timpul şi dispunerea în spaţiu) şi nivele de agregare diferite.perspectiva multidimensională asupra datelor se face prin operaţii care permit obţinerea de vederi (view) bidimensionale dintr un cub n dimensional, care se mai numesc slice uri, felii de informaţii care servesc unor anumite scopuri si decizii manageriale. REGIUNEA TIMP PRODUS Figura 2: Slice pentru viziunea managerului de produs De exemplu viziunea managerului de produs interesează doar vânzările anumitor produse, în toată regiunea şi în toată perioada de timp considerată 33 Alte tipuri de slice uri pot felia cubul pe toate cele trei coordonate carteziene aşa cum se poate vedea în figura de mai jos. Figura 3: Alte tipuri de slice uri Pentru prezentarea convenabilă a rezultatelor se fac racordări ale vederilor bidimensionale cu baza de date multidimensională, prin mapări de date, coroborate cu utilizări de grafice şi tabele complexe Fiind o tehnologie relativ nouă, modelul de arhitectură OLAP (figura 4) care s a impus pentru sistemele orientate spre analiză multidimensională este unul de tip client/server în trei straturi. Sisteme informatice OPERATIONALE Data Warehouse Motor OLAP Aplicatii OLAP Metadate Figura 4:. Arhitectura unui sistem OLAP a) Data Warehouse formează nivelul cel mai de jos, responsabil cu stocarea şi regăsirea datelor. De regulă aplicaţiile tranzacţionale utilizează sisteme relaţionale dar pentru depozitele de date se folosesc sisteme multidimensionale. Dat fiind volumul mare de date, este recomandabil ca SGBD urile folosite să ofere suport pentru prelucrări paralele şi distribuite, să dispună de mecanisme performante de indexare şi de optimizare, să ofere un înalt nivel de siguranţă; b) Motorul analitic OLAP (OLAP engine) are sarcina de a prelua cererile exprimate de utilizatori şi, pe baza consultării metadatelor, să genereze cererile necesare pentru obţinerea datelor ce vor fi redirectate către clienţi. În plus, datelor obţinute li se vor aplica la acest nivel o serie de prelucrări de generarea de interogări, manipulări de date şi de sintetizarea rezultatelor; 34 c) Metadatele în care sunt stocate dimensiunile, membrii şi multipli lor, precum şi structurile ierarhice ale dimensiunilor, informaţii care apar pe axele cuburilor şi sunt prezentate utilizatorului ca nume de rînduri sau de coloane (pivot table); d) Aplicaţiile OLAP sunt reprezentate de instrumente mânuite de utilizatorul final. Există aplicaţii generale care răspund suficient de bine nevoilor unei categorii largi de utilizatori, există instrumente specializate pe domenii (cum ar fi de pildă analize regresionale, analize ANOVA, analize SWOT, analiza financiară) şi, în fine, există posibilitatea de a dezvolta instrumente foarte specifice. Din punct de vedere al utilizatorului final, aplicaţia pe care o foloseşte trebuie să i asigure două funcţionalităţi importante: navigarea liberă prin depozitul de date în căutarea informaţiilor relevante şi posibilităţi diverse de prezentare a datelor. Aceste funcţionalităţi sunt strâns legate între ele şi este greu de spus care operaţie este de navigare şi care este de prezentare. Cerinţele de administrare şi dezvoltare pentru OLAP, deşi similare cu cele pentru instrumentele de interogare şi raportare, sunt în general mult mai complexe. Punerea în funcţiune a unui sistem OLAP şi a softului de acces la date necesită o înţelegere clară a modelului de date al întreprinderii şi a funcţiilor analitice cerute de conducerea executivă şi strategică. Produsele comerciale pot fi de mare folos, dar rareori există soluţii,,la cheie pentru OLAP; arhitectura trebuie reglată astfel încât să suporte sursele de date folosite şi să facă faţă cerinţelor. În schimb, odată ce sistemul OLAP este funcţional, suportul tehnic pentru utilizator este minimal. C. Tehnologiile Data mining (mineritul în date) reprezintă, într o accepţiune simplă, un mod automat de detectare într o bază de date a unor tipare relevante. Data mining utilizează o serie de tehnici statistice şi de inteligenţă artificială ce dau posibilitatea construirii de modele ce pot previziona comportamentul clienţilor. Tehnologia îşi sporeşte calităţile prin integrare cu depozitele de date comerciale şi cu noile modalităţi de prezentare şi raportare. Data mining îşi datoreşte numele similarităţii dintre căutarea de informaţii valoroase într o bază de date mare şi săparea unor galerii în munte pentru detectarea unor zăcăminte valoroase. Data mining este un proces de descoperire a cunoştinţelor (Knowledge discovery KD), de extragere a informaţiei necunoscută anterior din baze de date foarte mari. Procesul descoperirii de corelaţii semnificative, modele şi tendinţe se asigură prin explorarea unor mari cantităţi de date stocate în depozite de date, utilizând tehnologii de recunoaştere a modelelor, precum şi tehnici statistice şi matematice. Conform unui raport din 1997 al Grupului Gartner:,,Data mining şi inteligenţa artificială se află între primele cinci tehnologii cheie care vor avea în mod sigur un impact major asupra unui mare număr de industrii în următorii ani. Gartner situează data mining între primele 10 tehnologii în care firmele vor investi în următorii 5 ani. Studiile arată că în ultima perioadă s a înregistrat o explozie dramatică a nivelului de interes privind data mining, în condiţiile în care utilizatorii au dorit să profite dinstrumentel
Related Search
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks