Esittelyssä kolme yleistä tietomallinnusmenetelmää

Tietomallintaminen

Mitä on tietomallinnus?

Tietomalli määrittää ja dokumentoi organisaation liiketoimintaprosesseissaan käsittelemät asiat käsitteinä ja toisaalta dataobjekteina omine ominaisuuksineen. Mallinnus voidaan aloittaa korkean tason käsitteiden mallinnuksesta (conceptual data modeling), josta seuraava askel on looginen tietomalli ja lopuksi päädytään fyysiseen tietomalliin.

Tässä artikkelissa esitellään kolme tietomallinnusmenetelmää fyysisen tietomallin tekemiseen. Tarkoituksena on näyttää miten erilaisia taulurakenteet ovat riippuen siitä mikä menetelmä on valittu. Tämä on tarkoitettu enemmän johdatukseksi aihepiiriin - tyyppiseksi kirjoitukseksi, eikä se suinkaan sisällä kaikkia mahdollisia yksityiskohtia joita eri ratkaisuihin liittyy.  Esimerkkinä mallinnusratkaisuissa käytetään myyntilasku, tuote ja asiakas - alueen ilmiötä.

Ensimmäinen malli on dimensionaalisen tietomallinnusmenetelmän mukainen. Dimensioonalisen tietomallinnuksen tekniikan esitteli ensimmäisen kerran Ralph Kimball 1990 - luvulla ja se on yksi käytetyimpiä menetelmiä tietovarastoinnissa tai vähintäänkin modernin data-alustan esityskerroksen osana. Dimensionaaliset mallit ovat helposti ymmärrettäviä, joustavia ja niistä saa helposti raportointivälineiden perustoiminnallisuuksin erilaisia summatunnuslukuja ulos. Kääntöpuolena dimensionaalisessa mallissa on että ne tallentavat ylimääräistä dataa ja mallinnus edellyttää etukäteen tiettyjen asioiden määrittämistä.

Dimensionaalista mallia ei ole optimoitu operatiivisten järjestelmien pohjaksi. Malli ei myöskään tallenna kaikkia muutoksia lähdejärjestelmissä, vaikkakin dimensionaalisen tietomallinnustekniikan SCD2 - tyyppisillä ominaisuuksilla dimensioissa se olisikin mahdollista.

Seuraava malli on 3. normaalimuodon mukainen (yleisesti puhutaan myös normalisaatiosta), jonka esitteli E.F.Codd jo 70-luvulla. Normaalimuotoja on tunnistettu yhteensä 6 kappaletta (1-6), mutta kolmatta normaalimuotoa pidetään yleensä riittävänä tarjoamaan riittävän yksinkertaisen tietomallin kuitenkin poistaen Update, Insert ja Delete -operaatioihin liittyviä anomalioita. Normalisointi poistaa datan turhaa/päällekkäistä tallentamista ja sitä käytetään operaatiivisissa järjestelmissä joissa on runsaasti insert ja update -operaatioita (OLTP  - online transaction processing).

Viimeisenä esittelyssä on Dan Lindstedin julkaisema Data Vault (DV) - metodologia . Data Vaulttia käytetään dimensionaalisen mallinnustekniikan tavoin pääasiassa tietovarastoinnin - projekteissa, vaikkakin menetelmä tarjoaa keinot yhdistää relaatiomallin mukaisia ja Data Laken puolelle tallennettuja objekteja. Data Vault - metodologia on selvästi monimutkaisempi kuin edellä mainitut menetelmät, ainakin taulujen määrällä mitattuna. DV ei ole vielä kaikkein käytetyin menetelmä, joskin sillä on intohimoinen kannattajajoukko. Menetelmä tallentaa kaikki lähes kaikki muutokset lähdejärjestelmästä, joka on voi olla tietyissä tilanteissa toimiva ratkaisu. Kyselyjen tekeminen tähän malliin on selvästi monimutkaisempaa kuin esimerkiksi dimensionaalisesta mallista, jonka vuoksi DV:n lisänä on dimensionaalinen informaatiomart - kerros. 

Lisätietoja

The Data Warehouse Toolkit

Building a Scalable Data Warehouse with Data Vault 2.0

Lisää ajankohtaisia julkaisuja:

Kunnan toiminnan kehittäminen data-analytiikan avulla
Tutustu tarinaan
Tekoälyavustettu OpenAI – sovelluskehitys Azuressa
Tutustu tarinaan
Energia-alan analytiikka
Tutustu tarinaan
Myynnin data-analytiikka
Tutustu tarinaan
Markkinoinnin data-analytiikka
Tutustu tarinaan

Lisää ajankohtaisia julkaisuja:

Kunnan toiminnan kehittäminen data-analytiikan avulla
Tutustu tarinaan
Tekoälyavustettu OpenAI – sovelluskehitys Azuressa
Tutustu tarinaan
Energia-alan analytiikka
Tutustu tarinaan
Myynnin data-analytiikka
Tutustu tarinaan
Markkinoinnin data-analytiikka
Tutustu tarinaan