Databázový marketing II
Databázový marketing (DM) vzniká
Ako prirodzená reakcia na rozvoj elektronického obchodovania a na rast veľkého počtu informácií. Elektronické obchodovanie predstavuje novú ekonomiku, ktorá kladie vysoké nároky na jej efektívne využívanie. Potrebu účelne s informáciami narábať rieši práve databázový marketing. Jeho cieľom je získavať údaje o zákazníkoch, starostlivo tieto údaje ukladať do databáz, vyťažovať z týchto údajov podstatné informácie a následne tieto informácie využívať v prospech dokonalejších rozhodovacích procesov.
Zameriava sa na
Najmenší segment zo všetkých, na jednotlivca a preto sa niekedy nazýva mikromarketing (Micromarketing) alebo vzťahový marketing (Relationship Marketing). V rámci DM pracujeme s informáciami za účelom účinnejšieho oslovovania zákazníkov. Pre existenciu zákazníckej databázy je nevyhnutný rozvoj informačnej technológie.
Databázový marketing ako časť informačných systémov podniku
Celý proces manipulácie s informáciami patrí do oblasti informačných systémov a informačnej technológie, označovanej ako IS/IT (Information Technologies/Information Communications).
Účelom IS/IT
Je prepojiť vzájomne komunikujúce podniky. Táto potreba prepojiť jednotlivé informačné systémy podnietila vznik marketingového informačného systému (MIS), ktorý tvorí akúsi nadstavbu nad existujúcimi IS podniku a je schopný integrovať vnútorné informačné zdroje s vonkajšími. Poskytuje komplexné informácie, nevyhnutné pre proces rozhodovania a riadenia.
Základom tohto systému sú
Obsluha systému – jej súčasťou je vývoj obslužného softvéru a užívateľských aplikácií, servis, zálohovanie dát, údržba systému vrátane správy dát a návrhy a úpravy štruktúr databázy podľa aktuálnych činností vstupy do systému – táto časť rieši začleňovanie nových dát do systému podľa jednotlivých zdrojov.
Zároveň sa tu rieši aj odstránenie duplikátov a evidovanie histórie záznamov.
Externé výstupy – zaisťujú komunikáciu so zákazníkom a zároveň dávajú odporúčanie k ďalším aktivitám, ktoré môžu túto komunikáciu podporiť alebo slúžiť ako zdroj dát.
Interné výstupy – môžu to byť rozbory a databázy, ktoré poskytujú informácie pre rôzne typy rozhodnutí a aktivít vo vnútri spoločnosti alebo ich najbližších partnerov.
Marketingová databáza – súhrn všetkých informácií o zákazníkoch, najdôležitejšia časť celého systému.
Systém MIS
Teda zahŕňa pracovníkov, zariadenia, informačné technológie pre zber, triedenie, analyzovanie a distribuovanie potrebných, včasných a presných informácií tvorcom marketingových rozhodnutí.
Funkcionalitu MIS zabezpečuje architektúra, pozostávajúca z dátovej pumpy, realizujúcej import a transformáciu dát do dátového skladu, ktorý obsahuje dáta upravené takým spôsobom, ktorý umožňuje čo najľahšie získavanie analytických informácií a z prostriedkov na vizualizáciu a analýzu dát, ktoré umožňujú modelovanie budúcich udalostí a vykonávanie tzv. what-if analýz. What-if analýzy určujú vplyv určitých parametrov, napríklad cena alebo portfólio produktov a služieb, na správanie zákazníka.
Údajová základňa MIS (dátový sklad) sa stáva cenným vstupom pre data miningové analýzy.
Hlavným účelom MIS
Je zefektívniť rozhodovací proces, kontrolovať aktivity podniku a koordinovať aktivity organizácie. V tomto prípade ho môžeme označiť ako marketingový systém na podporu rozhodovania (Decision Support Systems, DSS).
Špeciálnym typom informačných systémov
Sú geografické informačné systémy (GIS), v ktorých sa všetky uložené údaje vzťahujú k lokalitám v priestore. Databázový aspekt práce s GIS sa v súčasnosti začína čoraz viac presadzovať v tzv. geomarketingu. Jeho výhodou je vizualizácia a analýza dát na mapovom podklade. Geomarketing umožňuje pracovať s dátami v geografickom prostredí, vytvárať mapové vrstvy, ktoré optimálne sledujú marketingové ciele klienta. Výrazne takto pomáha nielen plánovať ale aj vyhodnocovať výsledky direct marketingových kampaní.
Poskytovanie geodemografických dát
(oblasť, počet obyvateľov, charakter oblasti, podnebie…) úzko súvisí so segmentáciou trhov, presnejšie s mikrogeografickou segmentáciou. Segmentácia alebo zacielenie reklamy na cieľové skupiny sa označuje ako tzv. targeting, resp. target-groups. Na základe týchto dát dokážeme stanoviť najvhodnejšie oblasti, presne zmapovať pokrytie materiálmi ako aj výsledky kampane. Presnejšie definovanie oblasti distribúcie tiež šetrí náklady na výrobu materiálov.
Jedným z nádejných typov segmentácie vôbec je geozhlukovanie
(viacnásobná segmentácia). Predstavuje podrobnejšiu charakteristiku ľudí žijúcich v určitej lokalite, ako poskytuje tradičná demografia, pretože odráža sociálno-ekonomické postavenie a životný štýl miestnych obyvateľov. Ľudia, ktorí majú podobný životný štýl, robia podobnú prácu a majú podobné záujmy sú takto zoradení v jednom zhluku. Jednotlivé zhluky nám potom dávajú odpovede na dôležité otázky ako napríklad ktorý zhluk je pre naše produkty najpríťažlivejší, ktoré trhy, distribučné siete a komunikačné médiá nám poskytujú najlepšie príležitosti.
Rastúca efektivita geozhlukovania
Ako nástroja segmentácie má za následok neustále vznikanie nových, odlišných skupín obyvateľov v dôsledku premenlivého rastu rôznych etník, premien vekovej štruktúry obyvateľstva, zmeny skladby domácností atď.
Okrem geografických informačných systémov sa používajú na segmentáciu spotrebiteľských trhov aj demografické a psychografické charakteristiky, ideálne je ich vzájomné spolupôsobenie.
Informačné technológie a modely B2B, B2C
Elektronické obchodovanie (e-commerce, e-business) súvisí s rozvojom internetu, ktorý predstavuje v súčasnosti najviac rastúcu oblasť informačných technológií. Prvý základný typ elektronického obchodu sa označuje skratkou B2B (Business To Business – podnik-podniku, podnik-podnik) a používa sa pre obchodovanie na medzipodnikovej úrovni.
Druhým základným typom je model B2C (Business To Cuustomer – podnik zákazníkovi, spotrebiteľovi), ktorý slúži na obchodovanie medzi podnikom a koncovým zákazníkov. Obidva modely boli založené na technológii EDI (Electronic Data Interchange) a táto elektronická výmena dát je považovaná za predchodcu internetu.
Dáta a informácie
Dáta sú údaje (technické, ekonomické, finančné, administratívne, štatistické…) alebo informácie, ktoré je možné spracovávať pomocou technických prostriedkov (programov). Sú to neusporiadané, surové informácie, v kódovanej alebo číselnej podobe z istého zdroja, fakty a čísla týkajúce sa daného problému. Z dát môžeme vygenerovať významy.
Dáta sú využívané predovšetkým na prenášanie informácií medzi ľuďmi a počítačmi, na ukladanie informácií pre budúce využitie, na odvodenie nových informácií na základe manipulácie s dátami.
Báza dát je množina dát, ktoré sa vzťahujú k určitej riešenej úlohe.
Informácie
Sú dáta obohatené o relevantnosť a účelnosť, premena dát do informácií vyžaduje znalosti. Informáciami môžeme chápať všetko podstatné, čo je možné pridávať alebo čo je možné dedukovať z nejakej množiny dát; môžeme ich chápať ako určitú potenciálnu funkciu dát.
Údaj je najmenší nedeliteľný prvok oblastí hodnôt dátového typu.
Proces transformácie údajov na informácie a prevod týchto informácií na znalosti sa nazýva Business Intelligence (BI) – manažérske informačné systémy, ktorých zložkami sú data warehouse a data mining.
Základnými atribútmi použiteľných informácií sú
Kvalita – zahŕňa presnosť a spoľahlivosť aktuálnosť – znamená mať informácie v správny čas a na správnom mieste úplnosť – informácie by mali poskytovať ucelený obraz pre rozhodovacie procesy relevantnosť – znamená platnosť a účelovosť informácií v súlade s potrebami a podmienkami, za ktorých sa manažér rozhoduje
Dôležitosť presných a kvalitných informácií
Pramení z toho, že sú pre fungovanie firmy nevyhnutné a sú základným bodom úspešnosti firmy. Náklady spojené so získavaním a využívaním informácií by sa mali premietnuť do kvality rozhodovania a takto dosiahnuť efektívnosť ich využívania. Včasné a spoľahlivé informácie poskytujú firmám dôležité konkurenčné výhody. Vďaka nim môže firma identifikovať potreby a priania zákazníkov, vytvárať lepšie ponuky a efektívne implementovať marketingové plány.
Neadekvátne informácie, neinformovanosť zákazníkov či zamestnancov sa môže výrazne prejaviť v strate zákazníka.
Význam informácií
Je však relatívny a žiadna informácia nemá všeobecnú univerzálnu platnú dôležitosť. Výber informácií, ktoré sú svojím významom pre nás podstatné závisí na definícii veľmi presných objektívnych aj subjektívnych kritérií, ktorých stanovenie nemá nikdy trvalú platnosť, pretože sa pohybujeme v neustále sa meniacom prostredí a sme nútení čeliť neprestajne sa meniacim okolnostiam.
Zdroje dát
Spôsob získavania informácií v databázovom marketingu sa niekedy nazýva aj Marketing Insight. Všeobecne možno povedať, že ťažisko tu už nepredstavujú výskumné agentúry ale práve databázový marketing.
Všetky údaje získané zo všetkých zdrojov musia byť navzájom integrované pre komplexný pohľad na správanie zákazníka. Všetky tieto údaje sú následne ukladané do zákazníckej marketingovej databázy.
Zdroje dát členíme na
Interné zdroje dát – sú to najmä dáta získané z poštových objednávok, údaje zo sťažností a z požiadaviek zákazníkov, záručné listy, zoznamy predplatiteľov, rôzne propagačné akcie v rámci podpory predaja (napríklad získavanie darčekov alebo vzoriek zdarma) a v rámci spotrebiteľských súťaží (vernostné programy, zákaznícke kluby), údaje z vyplňovania rôznych dotazníkov, nákup cez internet, vyžiadanie ďalších informácií cez internet (pri zakladaní e-mailovej schránky, pri objednávaní platených alebo neplatených internetových periodík, registrácia pri vstupe na určité stránky)
Externé zdroje dát – externé dáta predstavujú údaje o trhovej situácii, o trhovom objeme a trhovom potenciáli.
Báza dát
Marketingová databáza obsahuje veľké množstvo informácií, s ktorými musíme pracovať, pozerať sa na ne z rôznych uhlov pohľadu, aktualizovať ich…
Môžeme ju označiť aj ako tzv. databanku, banku údajov. Jej predchodcom je klasická databáza v podobe tabuľky alebo zoznamu.
Databázu je možné kupovať alebo požičiavať, ideálnym prípadom je však tvorba vlastnej databázy, čo je aj bezpečnejšie.
Podľa celoročného prieskumu propagačných zvyklostí
Ktorý uskutočnila firma Donnely Marketing Inc., plných 56 % výrobcov a maloobchodov má založenú alebo práve zakladá databázu zákazníkov, ďalších 10 % podnikateľských subjektov sa k tomu chystá a celých 85% podnikateľských subjektov je presvedčených, že databázu zákazníkov potrebujú preto, aby si zachovali konkurencieschopnosť aj v novom tisícročí.
Zákaznícka marketingová databáza musí obsahovať užitočné marketingové informácie o každom individuálnom zákazníkovi či potenciálnom zákazníkovi, ktoré sú potrebné na to, aby sa s ním dalo dlhodobo pracovať.
Jedna z najväčších databáz na svete sa nachádza na Stanfordovej univerzite v Kalifornii. Tamojší vedci pracujúci v oblasti časticovej fyziky ukladajú do databáz dáta získané z prevádzkovania časticového urýchľovača. Už existujúci počet 500 terabajtov sa denne zvyšuje o ďalšie 2 terabajty a očakáva sa prelomenie petabajtovej hranice.
Obsah databáz
Úspešnosť kvalitnej databázy predpokladá presné poznanie marketingových cieľov a tým existenciu len užitočných dát v databázach.
Dáta zahrnuté v databáze sa rozdeľujú na historické dáta (mená, adresy, údaje o tom, ako často zákazníci nakupujú, kedy to bolo naposledy, ich reakcie na ponuky, hodnotu nákupov) a prognostické dáta (ktoré skupiny a s akou pravdepodobnosťou na určitú ponuku zareagujú).
Osobitú kategóriu tvoria tzv. citlivé dáta, ktorých získavanie by odporovalo etike a legislatíve a preto ich databázy neobsahujú. Sú to údaje o zdravotnom stave, náboženskom vierovyznaní a politickej príslušnosti.
Úplná zákaznícka databáza obsahuje tieto údaje
meno, priezvisko, titul, adresa, vek, telefónne číslo, mobilné číslo, faxové číslo, adresa web stránky, e-mail, dátum narodenia, zamestnanie, pridelené identifikačné kódy údaje o predošlých nákupoch a nákupných zvyklostiach, názory na výrobok, záujmové oblasti, koníčky, údaje o príjme, reakcie na jednotlivé typy súťaží a marketingové akcie, dátum zaradenia do databázy, dátum aktualizácie
Pri spoločnostiach by mala byť databáza doplnená ešte o tieto údaje
Úplný názov spoločnosti, typ spoločnosti (s.r.o., a.s.), dátum založenia spoločnosti, činnosti firmy, počet zamestnancov, výška ročného obratu za uplynulé obdobie, zahraničný pôvod, pobočky
Personálne obsadenie pozícií s rozhodovacími právomocami, IT manažér, riaditeľ, generálny riaditeľ, ostatní pracovníci vo vedúcich funkciách jednotlivých oddelení, konatelia spoločnosti
Obsah databázy nebýva vždy takto úplný, v závislosti od vyjadrení zákazníkov o neželanom uložení akýchkoľvek alebo určitých údajov o jeho osobe alebo vplyvom nedostatočných zdrojov, resp. metód na zber informácií.
Databázový marketing
By však mal disponovať čo možno najkompletnejšou zákazníckou databázou, aby sme pomocou neho mohli lepšie rozčleniť zákazníkov do rôznych skupín podľa spoločných charakteristík (napr. životný štýl, životné zvyklosti, kúpna sila…) a ponúkať im takto produkty alebo služby, ktoré sú pre nich vhodné a žiaduce (dáta nadobúdajú v tomto kontexte aj formu vzoriek).
V súvislosti s presným zacielením na zákazníka hovoríme aj o tzv. cross-sellingu, ktorého podstatou je maximálne vyťaženie klientov práve ponúkaním produktov a služieb, ktoré sú „šité na mieru“ jeho individuálnym potrebám a záujmom, pričom cieľom je dosiahnuť predaj aj podobných produktov. a o tzv. cross-brande, kedy zasielame viacnásobné ponuky ľuďom s podobnou vekovou kategóriou alebo životným štýlom.
Databázové systémy
Medzi prvé veľké spoločnosti, ktoré začali využívať vlastnú bázu dát, patrili v priebehu sedemdesiatych rokov koncerny z oblasti vydavateľstva ako napríklad Pergamon Press vo Veľkej Británii, medzinárodné agentúry, napríklad Európska agentúra pre výskum vesmíru vo Frascati v Taliansku (DC ESA-IRS), Medzinárodná agentúra pre atómovú energiu vo Viedni (systém INIS). V USA zohrala významnú úlohu Národná lekárska knižnica (systém MEDLINE) a Národná poľnohospodárska knižnica (systém AGRICOLA).
Už koncom šesťdesiatych a začiatkom sedemdesiatych rokov vznikli prvé systémy, ponúkajúce úplnejšie riešenie databázových požiadaviek. Nazývajú sa systémy riadenia bázy dát, SRBD (Database Management Systems, DMS). SRBD umožnili, oproti systémom súborov, konkurentnú prácu na úrovni záznamov, transakčný mechanizmus, prostriedky na zálohovanie a autorizáciu, nastavovanie parametrov pre správu externej pamäte.
Databázový systém (DBS)
Tvorí báza dát (BD) a systém riadenia bázy dát (SRBD). Pojmy báza dát alebo data báza sa často chybne zamieňajú so systémami riadenia bázy dát.
Databáza obsahuje množstvo zozbieraných dát, pričom systémy riadenia databázy predstavujú konkrétny softvér, uchovávajú dáta a ďalej ich spracovávajú.
Databázový systém tvoria nasledovné komponenty
Dáta ,Hardvér ,Softvér ,Užívatelia
Postupom času možno dáta nadobudnú rovnocenné postavenie a začneme ich popri pojmoch hardware a software, označovať ako "dataware".
Základné požiadavky
Ktoré sa vo všeobecnosti kladú na databázové systémy sú, že dáta sú objekty, ktoré budú integrované a súčasne zdieľané. Integrovanie dát znamená, že dáta udržiavané v databáze môžu byť umiestnené vo viacerých súboroch tak, aby bola minimalizovaná duplicita výskytov dát a zároveň, aby program mohol súčasne sprístupniť dáta z viacerých súborov.
Zdieľanie znamená, že každý objekt v databáze môže byť zdieľaný viacerými užívateľmi, opakovane alebo súčasne, keď viacerí užívatelia chcú s daným dátovým objektom pracovať v rovnakom čase.
Dotazovacie jazyky
Na prácu s uchovávanými dátami používame aplikačné programy, vytvorené programátormi. Pri vyhľadávaní údajov v databáze podľa ad – hoc kritérií (tieto kritéria nebývajú známe vopred, sú jednoduché a dočasné), sa pre ne neoplatí vytvárať špeciálne programy. Databázový systém by mal preto poskytovať jazyk veľmi vysokej úrovne, ktorý by dovolil laickému používateľovi, so znalosťou základnej štruktúry databázy, vyhľadávanie dát podľa jednoduchých kritérií. Tento deklaratívny dotazovací jazyk by mal byť štandardizovaný, aby sa dal využiť v rôznych databázových systémoch.
Dotazovací jazyk
Môžeme označiť aj ako vyhľadávací alebo prístupový jazyk. Je to typ používateľského jazyka, ktorý je tvorený systémom príkazov s presne definovaným významom a pravidlami pre ich používanie v dialógu s počítačom pri vyhľadávaní v uložených bázach dát. Dotazovací jazyk je teda určený na výber dát a ich prezentáciu používateľovi na výstupných pamäťových médiách. Na tento účel sa navrhujú rôzne typy jazykov. Najrozšírenejšie sú QBE a SQL.
Dátové sklady (data warehousing)
Pojem dátový sklad je prekladom anglického termínu data warehouse. Používanie výrazu data warehousing, znamená realizáciu dátových skladov ako proces a nie ako konkrétnu štruktúru.
Dátové sklady predstavujú vývoj trendov v obchodnej a technologickej oblasti. Dátový sklad by sme mohli definovať ako súbor zjednotených, predmetovo orientovaných databáz navrhnutých za účelom poskytovať informácie požadované pre rozhodovanie.
Všetky dáta, ktoré sú k dispozícii v dátových skladoch musia prejsť čistením a filtráciou. V tomto bode zohráva dôležitú úlohu tzv. dátová pumpa.
Jadrom každého dátového skladu
Je rozsiahla databáza, ktorá obsahuje integrované podnikové dáta, získané z interných a externých zdrojov dát. Interné dáta získavame z činností prevádzkovaných vo vnútri podniku, externé dáta sú poskytnuté tretími stranami (obchodní partneri, zákazníci, úrady, organizácie).
Okrem týchto interných a externých zdrojov dát, dátový sklad obsahuje aj metadáta (dáta o dátach).
Význam prepojenia dát z interných a externých zdrojov nám dáva integrovaný pohľad na zákazníka, čo je neoceniteľným prínosom pri využívaní systému CRM.
Pri využívaní dátových skladov
Je nevyhnutná dostupnosť bezchybných a detailných integrovaných dát, ktoré sú dôležité pre efektívne plánovanie a rozhodovanie v marketingových procesoch. Detailnosť ukladaných dát sa nazýva granularita. Čím je granularita nižšia, tým vyššia je detailnosť dát a tým vyššie nároky sú na predpokladané objemy ukladaných informácií. Zachovanie integrity dát znamená zachovanie hodnoty dát, napríklad pri aktualizácii dát.
V prípade narušenia dát (narušenie dátovej integrity nazývané tiež dátová korupcia), existujú programy na obnovu dátovej integrity, tzv. Data Recovery Service ale najlepšie je predísť takejto situácii zlepšenou ochranou dát.
Podpora podnikania dátovými skladmi má široké uplatnenie vo všetkých oblastiach marketingu a obchodu.
Určitou nevýhodou dátových skladov
By však mohli byť investície, ktoré je potrebné do celého projektu vložiť, keďže budovanie dátových skladov vo firme nie je lacná vec. Z tohto dôvodu potom často vyplývajú názory, že dátové sklady si môžu dovoliť iba veľké spoločnosti. V skutočnosti existujú pre menšie firmy rôzne riešenia využívajúce napríklad prednastavené balíčky a štandardné nástroje, čo značným spôsobom znižuje náklady a urýchľuje nasadenie. Okrem toho si môžu menšie spoločnosti vypracovať pilotný projekt, to znamená začať s tvorbou menšieho dátového skladu a testovať jeho použitie a účinnosť.
Ďalšou nevýhodou
Môže byť obava firiem z reinžinieringu, ako čo najlepšie dátové sklady začleniť do štruktúry spoločnosti.
Pre mnohé firmy však najväčšiu prekážku predstavuje pomerne ťažký odhad prínosov (ROI, Return Of Investment), keďže výnosy z nasadenia dátových skladov nie sú okamžité.
Vložené investície do tohto procesu sa ale v skutočnosti mnohonásobne vracajú.
Na dátové sklady ako dôležitú a finálnu časť databázového marketingu nemožno nazerať ako na izolovanú zložku, ale ako na jednu z mnohých zložiek, ktoré sa spolupodieľajú na čo možno najefektívnejšom výslednom postavení firmy vo vzťahu k svojim zákazníkom.
Aké sú časti dátového skladu?
Metadáta
V databázach sú tiež uložené metadáta. Sú to údaje, ktoré bližšie popisujú obsah dátového skladu. Niekedy sa nazývajú aj ako dátový slovník (Data Dictionary).
Dátové trhy (Data marts)
Slúžia na spracovávanie iba niektorej vybratej oblasti, sú to menšie dátové sklady, resp. podmnožina dátových skladov, ktorá môže byť vyvinutá napríklad pre oddelenie, divíziu alebo geografickú lokáciu.
Veľkosť dátových trhov môže byť niekoľko megabajtov až gigabajtov, veľkosť dátových skladov niekoľko gigabajtov a terabajtov.
Termín dátové trhy (data marts) sa skôr viaže k informáciám, ktoré väčšinou pochádzajú z jedného zdroja, napríklad z personálneho útvaru, zatiaľ čo dátové sklady skôr zodpovedajú získavaniu dát z viacerých zdrojov, napríklad z finančného útvaru, z výroby, od dodávateľa, z personálnych zdrojov.
Dátová pumpa (ETL)
Úlohou dátovej pumpy je vybrať špecifikovanú časť dát z prevádzkového systému a túto časť prekopírovať do databázy dátového skladu. Zároveň sa takto mení štruktúra ukladaných dát .
Plnenie dátového skladu prebieha dávkovane. Dáta z produkčných databáz sú načítavané periodicky a ich načítavanie prebieha selektívne, to znamená, do dátového skladu sa ukladajú iba tie dáta, ktoré sú pre významné.
Dátová pumpa pomáha centralizovať dáta, ktoré sa nachádzajú na rôznych miestach a v rôznych formách.
Dátové pumpy sa označujú aj ako ETL nástroje (Extraction, Transformation, Loading)
Pozostávajúce z extrakcie, transformácie a ukladania dát do databázy dátového skladu. Je to proces, v ktorom dáta najskôr načítavame z interných a externých zdrojov podniku, čistíme tieto dáta a tým redukujeme nepodstatné dáta a napokon ich následne načítavame do databázy dátového skladu. Výkon ETL nástrojov teda podstatne ovplyvňuje výkon dátového skladu.
Databázy dátových skladov
Pre celopodnikové dátové sklady je najvhodnejšie použiť relačné systémy riadenia bázy dát, pretože umožňujú ukladať veľmi veľké množstvá dát.
Pri relačných modeloch databáz sú dáta sú ukladané v tabuľkách a stĺpcoch. Súčasťou tejto databázy môžu byť aj niektoré údaje z vnútorného informačného systému firmy. Pri dostatočnom naplnení a vhodnej štruktúre je možné databázu využívať aj k ďalším účelom, napríklad k marketingovým výskumom, testovaniu nových produktov, meraniu účinnosti médií, sledovaniu vývojových trendov atď.
Pri multidimenzionálnych databázach
Druhom type databáz dátových skladov, používame jazyk MDX (Mutlidimensional Expresions), ktorý by sme mohli označiť ako určitý ekvivalent SQL jazyka (Structured Query Language) používaného v relačných databázach.
Výsledkom analýzy údajov býva multidimenzionálna dátová štruktúra – kocka (Data Cube), ktorá je ekvivalentom tabuľky v relačnej databáze. Každá kocka má niekoľko dimenzií (indexové polia v relačných tabuľkách).
Na rozdiel od relačných SRBD, multidimenzionálne databázy sú zasa vhodné pre dátové trhy (data marts), ktoré majú menší rozsah a menšiu veľkosť oproti dátovým skladom (data warehouses). Väčšina multidimenzionálnych platforiem má obmedzenú veľkosť databázy približne do stovky gigabajtov.
A čo data mining?
Pod data miningom rozumieme ťažbu dát z dátových báz. Vzniká v závere procesu spracovania dát. Pomocou neho dokážeme odhaľovať skryté vzťahy a zákonitosti vo veľkých dátových súboroch a dáta sa takto pre nás môžu stať zdrojom cenných informácií a následne zvýšiť kvalitu našich rozhodnutí.
Data mining predstavuje pokročilejšiu databázovú technológiu, rovnako ako aj data warehousing a je to exaktná oblasť.
Ťažba dát
Rieši problémy väčšiny firiem, ktoré spočívajú v roztrieštenosti alebo zložitej dostupnosti zákazníckych dát, z ktorých je potrebné vyťažiť informácie a závery pre dokonalejšie poznanie a rozšírenie zákazníckej základne, ponúkanie správnych produktov, prípravu vhodných kampaní alebo riadenie rizika. Moderné databázové servery umožňujú s množstvom dát nielen bezpečne a rýchlo pracovať, ale čo je dôležitejšie, získavať z týchto dát skutočné informácie a z nich potom vyvodzovať poznatky, ktoré môžeme efektívne využívať v procese rozhodovania.
Po získaní hodnotných informácií z databáz, dokážeme zlepšovať riadiace procesy, ktoré sú nevyhnutné na trhu so silnou konkurenciou a vyrovnanou ponukou. Rozvoj firmy musí brať zákazníka čoraz viac do úvahy.
K zlepšeniu rozhodovania
Je dobré vybudovať efektívnejší rozhodovací proces, zbierať vhodnejšie a presnejšie dáta, používať lepšie metódy a nástroje, zrýchliť akciu a realizáciu, zaistiť užitočnejšie výsledky. Kľúčovú úlohu v tomto procese zohrávajú práve informácie.
Data Mining
Predstavuje nástroj riadenia a rozhodovania, ktorý vďaka sústave princípov, postupov a prostriedkov premieňa surové dáta na informácie a napokon zužitkúva tieto informácie vo forme znalostí.
Mohli by sme ho prirovnať k človeku, ktorý prijíma, nazhromažďuje a ukladá vo svojej pamäti množstvo neustále pribúdajúcich a z rôznych zdrojov prenikajúcich informácií a v okamihu kedy z nich má vyťažiť ich skutočnú hodnotu, "skutočnú informáciu", nájsť medzi nimi väzby a súvislosti, je nútený rozmýšľať. Je to úlohou inteligencie, aké súvislosti je človek schopný v týchto informáciách nachádzať. Data mining pracuje na rovnakom princípe, s tým rozdielom, že je to akási umelá inteligencia, ale veľmi exaktná a veľmi efektívna.
Overuje správnosť či nesprávnosť hypotéz, rýchlou dostupnosťou riešení umožňuje rýchlo reagovať a tým sa stáva mimoriadne cenným pomocníkom riadiacim pracovníkom.
Umelá inteligencia (Artificial Intelligence)
Analogicky k data miningu spája súvislosti, príbuznosti, vzájomné zodpovedajúce prvky a vzorce, využívajúc induktívnu logiku, modelovanie rôznych entít a premís, extrahovanie relevantných informácií a tým objavovanie podstatných znalostí v databázach (tzv. Knowledge Discovery in Databases, KDD).
KDD sa vzťahuje na viaceré oblasti, zaoberajúce sa výskumníctvom ako sú oblasť počítačov, astronómie, biológie, medicíny a pod.
V tejto súvislosti hovoríme o tzv. inteligentných databázach.
Pri procese ťažby dát
By sme si mali najskôr zadefinovať cieľ, pričom tento cieľ musí byť dosiahnuteľný analýzou dát technikami data miningu a dáta musí byť možné získať. Po definovaní cieľa by sme si mali určiť a získať potrebné dáta z interných a externých zdrojov. Tieto činnosti sú väčšinou najnáročnejšou fázou celého procesu, pretože je potrebné zoznámiť sa s presným obsahom a významom jednotlivých dátových položiek. Ďalej je to výber vhodnej data miningovej techniky (deskriptívne, prediktívne techniky), napokon interpretácia výsledkov a použitie týchto výsledkov v praxi
Štatistické nástroje data miningu
Pri používaní štatistických nástrojov data miningu (ale aj pri budovaní dátových skladov), je vidieť prepojenie technológie s biznisom, čo sa stalo vlastne potvrdením mnohých prognóz marketingových analytikov. Pri spracovaní dát v databázach používame tieto štatistické prístupy na abstrahovanie relevantných znalostí.
Zhluková analýza
Zhluková analýza je technika redukcie údajov, ktorá zoskupuje buď premenné alebo prípady založené na podobných charakteristikách. Vďaka týmto vlastnostiam je užitočná pre nájdenie zákazníckych segmentov založených na spoločných charakteristikách ako sú demografické a finančné informácie alebo spôsoby nákupu.
Analýza faktorov
Táto technika je užitočná pri hľadaní dôležitých základných charakteristík, ktoré nemusia byť viditeľné, ale ktoré môžu byť nájdené ako skryté premenné. Oproti zhlukovej analýze, vytvára analýza faktorov modely z údajov.
Rozhodovacie stromy
Na základe rozhodovacích stromov (decision trees, answer trees) dokážeme zákazníkov zaradiť do skupín a odhadnúť pravdepodobnosť nákupu určitých produktov.
Hlavné výhody rozhodovacích stromov sú
Zrozumiteľnosť výstupov (oproti napríklad neurónovým sieťam), jednoduché použitie a nácvik, pomerne málo predpokladov (napríklad oproti regresii), praktickosť výstupov (je možné hneď vypočítať očakávanú úspešnosť, očakávaný zisk, návratnosť investícií…), rýchlosť nasadenia (niekedy môže poskytnúť dostatočne kvalitné informácie bez potreby budovať komplikované štatistické modely) a pružnosť (model je dosť zložitý a vhodným nastavením parametrov je možné ho prispôsobiť požiadavkám zákazníka).
Neurónové siete
Využitie neurónových sietí (neural networks) má najväčšie uplatnenie vo fyzike a v technických odvetviach, ale ich výhody prenikajú už aj do ekonomiky.
Výhodou neurónových sietí je, že nie je potrebné mať na mysli nejaký špeciálny model, keď sa spúšťa analýza. Neurónové siete môžu tiež nájsť interakčné efekty (napríklad efekty z kombinácie veku a pohlavia), ktoré musia byť explicitne vyjadrené v regresii. Nevýhodou je ťažšia interpretácia výsledného modelu, preto ich použitie je užitočnejšie na predpovedanie cieľovej premennej, keď sú údaje nelineárne, ale nie sú veľmi užitočné, keď tieto vzťahy údajov je potrebné vysvetliť
Systém STATISTIKA DataMiner
Predstavuje veľmi progresívnu aplikáciu neurónových sietí dostupných na trhu. Obsahuje General Neural Networks Explorer.
Asociačná analýza
Pomocou asociačných modelov hľadáme pravidlá o prvkoch, ktoré patria k sebe v nejakom prípade, ako sú napríklad nákupné transakcie. Pravidlá nachádzajú veci, ktoré „patria k sebe“, čo je iné ako keď sú predpovedané. Tieto modely sú často označované ako Market Basket analýza, ak sú aplikované v obchodnom priemysle na skúmanie nákupných schém zákazníkov.
Vizualizácia údajov
Využívajú počítačovú grafiku na zobrazovanie údajov v diagramoch, ktoré sú prevedené do ľahko prístupného jazyka ako sú obrázky a sú ľahšie vnímateľné.
Pravidlová indukcia
Je to technika pre objavovanie skupín "Ak/Potom" pravidiel z údajov pre klasifikovanie rôznych prípadov. Táto technika je výkonná, pretože hľadá dôležité schémy v skupinách údajov, na druhej strane však nemusí pokrývať všetky možné situácie, keďže pravidlá sú nezávislé a často si môžu navzájom odporovať.
Kurt Thearling, jeden z významných odborníkov v oblasti softvérového data miningu, označuje zhlukovacie analýzy a im podobné nástroje za klasické techniky a rozhodovacie stromy a neurónové siete za novú technologickú generáciu.
Okrem vyššie popísaných techník na ťažbu dát, rozoznávame ešte techniky modelovania vychádzajúce z teórie, ako sú korelácie, lineárna a logistická regresia, diskriminantná analýza, metódy predpovedania a pod.
Najznámejší a najkvalitnejší produkt v oblasti ťažby dát je SAS Enterprise Miner ktorý vyvinula spoločnosť SAS Institute
Poskytuje účinnú metodickú pomôcku, tzv. SEMMA (Sample – vzorkovanie, Explore – skúmanie, Modify – modifikovanie, Model – modelovanie a Assess – vyhodnocovanie), teda umožňuje bez hlbokých teoretických znalostí vytvárať v grafickom prostredí predikatívne modely ako sú regresia, neurónové siete a rozhodovacie stromy a tiež zhlukové analýzy, asociácie a sekvencie. Je tiež bez ťažkostí integrovateľný s prostredím data warehouse a data martov.
Z ostatných významných produktov je to napríklad SGI od Silicon Graphics, ktorý sa vyznačuje silnými vizualizačnými nástrojmi. Ponúka pokročilú 4D vizualizáciu – 3D grafy sa môžu meniť podľa dvoch ďalších premenných dimenzií.
Intelligent Miner od IBM
Je zasa vyvážený produkt poskytujúci rôzne techniky, ktoré sú integrované do jedného modelu. Nastavenie parametrov je jednoduché, používateľ je navigovaný pomocou wizardov. Ponúka najlepší clustering, t.j. zhlukovanie.
Komplexná metodológia dolovania údajov, ktorá vo svojom návode vedie začiatočníkov krok za krokom, CRISP-DM (CRoss-Industry Standard Process for Data Mining) je prístupná na adrese .
Účelom data miningu nie je len systematicky nazhromaždiť obrovské množstvo neustále pribúdajúcich dát, ale mali by sme vedieť tieto informácie zhrnúť a prezentovať tak, aby boli využiteľné. Nachádzaním skrytých štruktúr a dôležitých informácií ktoré sú v nich obsiahnuté, vieme potom lepšie určovať marketingové stratégie.
Môžeme zistiť, ktorí zákazníci
Sú pripravení akceptovať ponuku modifikovaného produktu sú ochotní kúpiť ostatné produkty firmy majú pre firmu najväčšiu hodnotu a je im potrebné venovať viac pozornosti a starostlivosti majú tendenciu od firmy odísť a akými opatreniami tomu môžeme zabrániť
Data mining je súčasťou technológií pre podporu rozhodovania. Samotné rozhodovanie však musí urobiť príslušný zodpovedný pracovník. K tomuto rozhodovaniu potrebuje vstupy, ktoré prichádzajú aj z aplikácie data miningu. Úloha manažmentu je teda nezastupiteľná, spočíva v definovaní vízie, podnikateľských hypotéz, v určovaní kvantifikovateľných cieľov a v rozhodovaní v procese realizácie.
Proces ťažby dát tak zahŕňa
Postupy od formulovania aplikačnej otázky až po implementáciu a rozšírenie výsledkov do praxe organizácie. Proces však nemusí končiť, pretože meniace sa prostredie vyžaduje údržbu databáz, preverovanie modelov a pri postupnej ďalšej kumulácií dát prípadné upresňovanie modelov.
Je dôležité presne porozumieť možnostiam obchodného uplatnenia výsledkov data miningu, aby nevznikli problémy s malou podporou obchodne zodpovedných manažérov ("Našich zákazníkov poznáme"), čo sa následne môže odraziť v nedôslednom doťahovaní zistených výsledkov do úrovne obchodných procesov.
Pozitívnou prognózou
Je predpoklad širšieho používania nástrojov na ťažbu dát aj novými užívateľmi a rast povedomia o týchto nástrojoch vo všeobecne dostupných článkoch a v odborných publikáciách.
Pre firmy, ktoré už investovali mnohomiliónové čiastky do vybudovania dátových skladov, je data mining nutnosťou, pretože je jedným zo spôsobov, ako zhodnotiť vložené prostriedky. Ťažba dát môže byť prínosom aj pre firmy, ktoré zatiaľ dátové sklady nemajú. Bude však ťažšia, keďže pre ne bude náročnejšia fáza získavania dát.
Funkčné a stabilné prostredie dátového skladu
Nielen značne uľahčuje problémy so získavaním dát a kvalitou dátových zdrojov, ale čím sa stanú dátové sklady väčšie a tým vznikne naliehavejšia potreba využívania data miningu, pozornosť sa snáď zameria aj na zlepšenie v kvalite dát.
Obdobou data miningu je text mining a web mining.
Pomocou text miningu získavame dôležité informácie z textových dokumentov, konkrétne z neštruktúrovaného textu. Keďže získané informácie sa prejavujú tiež vo forme znalostí, môžeme ho označiť ako text data mining.
Web mining
Znamená získavanie a analýzu použiteľných informácií z web stránok. Stáva sa cenným nástrojom pri sledovaní zákazníkov pohybujúcich sa na našich web stránkach, všímame si ich meniace sa záujmy a očakávania, aj prostredníctvom analýzy preklikávacích sekvencií (clickstream údaje) a na základe týchto informácií zlepšujeme obsah a celkovú úpravu webovej stránky.
Web data mining rozdeľujeme
Na obsahový, ktorý v sebe zahŕňa automatické prehľadávanie a získavanie informácií z internetových serverov a online databáz a na prístupový, kedy získavame a analyzujeme prístupy k týmto informáciám pomocou záznamov o prístupe k serveru, referenčných záujmoch, registrácii užívateľov alebo profilových informácií.
Pri práci s osobnými údajmi
Je veľmi dôležité dbať na ich ochranu, aj keď "žiadna ochrana nie je 100%, ale kombináciou viacerých prvkov súčasne, môžeme účinnosť ochrany značne zvýšiť". Pri ochrane osobných údajov o zákazníkoch v integrovanom databázovom marketingu sa však predpokladá, že táto ochrana bude 100percentná. Marketingoví pracovníci sú povinní pri práci s údajmi o zákazníkoch dodržiavať Zákon o ochrane osobných údajov č. 428/2002 Z.z.
V zahraničí sú v súčasnosti sprísnené podmienky pre vlastnenie a disponovanie s údajmi o zákazníkoch, napríklad vo Veľkej Británii je nezákonné vlastniť akékoľvek údaje o zákazníkoch, pokiaľ sa títo zákazníci najskôr nezaregistrovali do Registra ochrany dát (Data Protection Register).
Ochrana dát znamená
zabezpečenie, aby sa informácie nezničili zabezpečenie, aby sa k informáciám dostali len oprávnené osoby zabezpečenie, aby sa spracovávali nefalšované informácie zabezpečenie, aby sa dalo zistiť, kto informáciu vytvoril, zmenil, odstránil zabezpečenie, aby sa informácie nekontrolovateľným spôsobom nevyzradili zabezpečenie, aby informácie boli dostupné, keď sú potrebné
Existuje viacero postupov a metód, ktoré pomáhajú zvýšiť ochranu dát, cez výber bezpečnej miestnosti (miesta) lokality, únikové a záchranné plány zabezpečenie miestnosti (bezpečnostné dvere a zámky, mreže, trezor, poplašný systém, po nastavenie hesiel pri štarte počítača, prihlásení sa do systému, až po identifikáciu užívateľa (kto, kedy, čo, s čím, odkiaľ robil).
Účinnou formou ochrany dát
Je ich archivácia (denná, týždenná, kompletná, rozdielová, pravidelnosť, viac záloh na rôznych miestach mimo originálu.Realizácia plánu archivácie sa nazýva tzv. backup plán.
Takisto je dôležité bezpečné mazanie dát (kôš – dáta na nepoužívanom mieste na disku, fyzické odstránenie dát), kvalitné pamäťové médiá (disky, diskety, pásky, CD ROM, starnutie materiálu, dĺžka trvácnosti materiálu), elektronický podpis, overenie pravosti dokumentu a tiež novšia a v súčasnosti čoraz obľúbenejšia forma ochrany, tzv. biometria (biometrické identifikačné metódy, na základe ktorých overujeme totožnosť osoby, charakteristické rysy tejto osoby. Používajú sa odtlačky prstov a dlaní, geometria ruky, očné pozadie, hlas).
Ochrana pred zlyhaním hardvéru (hard crash)
Sa zabezpečuje predovšetkým hardvérovými prostriedkami. Databázový systém ju podporuje iba čiastočne, prostriedkami na zálohovanie dát do záložnej externej pamäte. Výraznejšiu ochranu poskytuje pred zlyhaním softvéru (soft crash), kde zahŕňa predovšetkým transakčný mechanizmus, umožňujúci zachovanie konzistentnosti databázy.
Pri akomkoľvek zlyhaní by malo existovať redundantné úložné zariadenie s rovnakým obsahom. Pre bezpečnosť a jednoduchú správu dát je ideálne, zabezpečiť nízku mieru ich distribúcie v infraštruktúre, to znamená, zhromažďovať dáta na jedno miesto a vytvorenie aktuálnej kópie týchto dát, dislokovanej na inom mieste. Takéto riešenie prináša stav dokonalej redundancie.
Na realizáciu zhromaždenia dát do centrálnych dátových skladov
Sa používajú diskové technológie. Dnešné diskové technológie ponúkajú tri základné spôsoby uloženia dát (DAS – Direct Attached Storage, NAS – Network Attached Storage, SAN – Storage Area Network).
Úlohou datacentrického modelu výpočtového systému, označovaného aj centrálna podniková pamäť (Enterprise Storage), je uschovávať veľký objem dát a zabezpečovať ochranu týchto dát. Napriek tomu, že mnoho výrobcov sa snaží vyvíjať tieto pamäťové systémy, dnes jediným výrobcom pamäťových systémov, ktoré možno označiť ako Enterprise Storage je EMC Corporation.
Spoločnosť EMC Corporation
So sídlom v USA v Hopkintone, Massachusetts je vedúcim svetovým výrobcom a dodávateľom systémov pre prostredie mainframe a je strategickým partnerom spoločnosti MHM zastúpenej aj na Slovensku. Zaoberá sa profesionálnym projektovaním a výstavbou bezpečných výpočtových systémov, tiež plánmi disaster recovery v prípade potreby obnovovania poškodených alebo stratených dát. Zákazníkmi spoločnosti MHM u nás sú také veľké a úspešné spoločnosti ako napríklad ORANGE Slovensko, a.s., Union poisťovňa, a.s., OTP Banka Slovakia alebo Slovenské telekomunikácie a v zahraničí napríklad telekomunikačná spoločnosť Infonet alebo internetový portál Yahoo! (Satmetrix Systems).
Spoločnosť Microsoft Research sa tiež veľmi dôkladne zaoberá problematikou bezpečnosti dát, ich zobrazovania a ukladania.
Aj keď zákon síce stanovuje pravidlá na ochranu osobných údajov, je potrebné si uvedomiť, že ide len o pravidlá a že technické riešenie v prípade využitia informačných technológií zostáva na samotnom systéme, resp. na jeho tvorcoch a užívateľov. Preto problematiku zabezpečovania dát ovplyvňujú skupiny organizačné a technické.
Monitoring dodržiavania legislatívy v členských krajinách EÚ
Uskutočňuje pravidelne dvakrát ročne spoločnosť The Alliance for Research, ku ktorej sa v roku 2003 pridalo aj Slovensko. Zameriava sa na oblasti legislatívy v ochrane osobných údajov všeobecne, v ochrane osobných údajov pri telefonickom, faxovom a internetovom zbere dát, v oblastiach výskumu verejnej mienky a publikácii výsledkov, v odvetviach výskumu trhu a jeho samoregulácií a monitoruje prístup k verejným informáciám a dátam.
Ochrana osobných údajov
Je prirodzene veľmi dôležitá fáza databázového marketingu, pretože pomáha strážiť a uchovávať veľké množstvo cenných informácií a jej nedôsledné sledovanie (okrem prírodných faktorov možnosti zničenia údajov) môže viesť ľahko zo strany zákazníka k strate dôveryhodnosti k firme, nadobudnutí zlej povesti firmy a napokon k úplnej strate zákazníka a jeho prejdení ku konkurencii.