Esittelyssä kolme yleistä tietomallinnusmenetelmää

Mitä on tietomallinnus?

 

Tietomalli määrittää ja dokumentoi organisaation liiketoimintaprosesseissaan käsittelemät asiat käsitteinä ja toisaalta dataobjekteina omine ominaisuuksineen. Mallinnus voidaan aloittaa korkean tason käsitteiden mallinnuksesta (conceptual data modeling), josta seuraava askel on looginen tietomalli ja lopuksi päädytään fyysiseen tietomalliin.

 

Tässä artikkelissa esitellään kolme tietomallinnusmenetelmää fyysisen tietomallin tekemiseen. Tarkoituksena on näyttää miten erilaisia taulurakenteet ovat riippuen siitä mikä menetelmä on valittu. Tämä on tarkoitettu enemmän johdatukseksi aihepiiriin - tyyppiseksi kirjoitukseksi, eikä se suinkaan sisällä kaikkia mahdollisia yksityiskohtia joita eri ratkaisuihin liittyy.  Esimerkkinä mallinnusratkaisuissa käytetään myyntilasku, tuote ja asiakas - alueen ilmiötä.

 

Ensimmäinen malli on dimensionaalisen tietomallinnusmenetelmän mukainen. Dimensioonalisen tietomallinnuksen tekniikan esitteli ensimmäisen kerran Ralph Kimball 1990 - luvulla ja se on yksi käytetyimpiä menetelmiä tietovarastoinnissa tai vähintäänkin modernin data-alustan esityskerroksen osana. Dimensionaaliset mallit ovat helposti ymmärrettäviä, joustavia ja niistä saa helposti raportointivälineiden perustoiminnallisuuksin erilaisia summatunnuslukuja ulos. Kääntöpuolena dimensionaalisessa mallissa on että ne tallentavat ylimääräistä dataa ja mallinnus edellyttää etukäteen tiettyjen asioiden määrittämistä.

Dimensionaalista mallia ei ole optimoitu operatiivisten järjestelmien pohjaksi. Malli ei myöskään tallenna kaikkia muutoksia lähdejärjestelmissä, vaikkakin dimensionaalisen tietomallinnustekniikan SCD2 - tyyppisillä ominaisuuksilla dimensioissa se olisikin mahdollista.

 

Seuraava malli on 3. normaalimuodon mukainen (yleisesti puhutaan myös normalisaatiosta), jonka esitteli E.F.Codd jo 70-luvulla. Normaalimuotoja on tunnistettu yhteensä 6 kappaletta (1-6), mutta kolmatta normaalimuotoa pidetään yleensä riittävänä tarjoamaan riittävän yksinkertaisen tietomallin kuitenkin poistaen Update, Insert ja Delete -operaatioihin liittyviä anomalioita. Normalisointi poistaa datan turhaa/päällekkäistä tallentamista ja sitä käytetään operaatiivisissa järjestelmissä joissa on runsaasti insert ja update -operaatioita (OLTP  - online transaction processing).

 

Viimeisenä esittelyssä on Dan Lindstedin julkaisema Data Vault (DV) - metodologia . Data Vaulttia käytetään dimensionaalisen mallinnustekniikan tavoin pääasiassa tietovarastoinnin - projekteissa, vaikkakin menetelmä tarjoaa keinot yhdistää relaatiomallin mukaisia ja Data Laken puolelle tallennettuja objekteja. Data Vault - metodologia on selvästi monimutkaisempi kuin edellä mainitut menetelmät, ainakin taulujen määrällä mitattuna. DV ei ole vielä kaikkein käytetyin menetelmä, joskin sillä on intohimoinen kannattajajoukko. Menetelmä tallentaa kaikki lähes kaikki muutokset lähdejärjestelmästä, joka on voi olla tietyissä tilanteissa toimiva ratkaisu. Kyselyjen tekeminen tähän malliin on selvästi monimutkaisempaa kuin esimerkiksi dimensionaalisesta mallista, jonka vuoksi DV:n lisänä on dimensionaalinen informaatiomart - kerros. 

Lisätietoja

The Data Warehouse Toolkit

Building a Scalable Data Warehouse with Data Vault 2.0

Lisää ajankohtaisia julkaisuja:

Tekoälyn hyödyntäminen kuvien luonnissa – mahtavat mahdollisuudet – myös väärinkäyttöön.
Viime aikoina sosiaalisessa mediassa on kovaa vauhtia yleistynyt ilmiö, jossa esitellään kuvia, jotka on luotu tekoälyn avulla. Kurkataan nyt siihen, mitä pinnan alla tapahtuu, kun tekoäly muodostaa kuvia pelkän tekstisyötteen perusteella, ja mitä seurauksia tällaisen teknologian kehityksellä voi olla.
Tutustu tarinaan
DAX-debuggauksen uusi aika Power BI -kontekstissa
Tutustu tarinaan
Pörssisähkön futuurihinnat
Syksyn ja talven -22/23 mittaan kylmäävä kysymys on miltä sähkön hinnan kehitys näyttää.
Tutustu tarinaan
D365 Finance + Power App = automatisoitu talouden raportointi
Tutustu tarinaan
Power BI -kenttäparametrit, uutta ja mielenkiintoista!
Power BI:n toukokuun päivitys tarjoili käyttäjille hyödyllisiä toiminnallisuuksia Kenttäparametrien (Field parameters) muodossa.
Tutustu tarinaan

Lisää ajankohtaisia julkaisuja:

Tekoälyn hyödyntäminen kuvien luonnissa – mahtavat mahdollisuudet – myös väärinkäyttöön.
Viime aikoina sosiaalisessa mediassa on kovaa vauhtia yleistynyt ilmiö, jossa esitellään kuvia, jotka on luotu tekoälyn avulla. Kurkataan nyt siihen, mitä pinnan alla tapahtuu, kun tekoäly muodostaa kuvia pelkän tekstisyötteen perusteella, ja mitä seurauksia tällaisen teknologian kehityksellä voi olla.
Tutustu tarinaan
DAX-debuggauksen uusi aika Power BI -kontekstissa
Tutustu tarinaan
Pörssisähkön futuurihinnat
Syksyn ja talven -22/23 mittaan kylmäävä kysymys on miltä sähkön hinnan kehitys näyttää.
Tutustu tarinaan
D365 Finance + Power App = automatisoitu talouden raportointi
Tutustu tarinaan
Power BI -kenttäparametrit, uutta ja mielenkiintoista!
Power BI:n toukokuun päivitys tarjoili käyttäjille hyödyllisiä toiminnallisuuksia Kenttäparametrien (Field parameters) muodossa.
Tutustu tarinaan