tietomallinnus

tietomallinnus on prosessi, jossa dokumentoidaan monimutkainen ohjelmistojärjestelmäsuunnitelma helposti ymmärrettäväksi diagrammiksi käyttäen tekstiä ja symboleita kuvaamaan tapaa, jolla tiedot tarvitsevat virtaamista. Kaaviota voidaan käyttää datan tehokkaan käytön varmistamiseen, uuden ohjelmiston rakentamiseen tai vanhan sovelluksen uudelleensuunnitteluun.

tiedon mallinnus on tärkeä taito datatutkijoille tai muille data-analyysiin osallistuville. Tietomalleja on perinteisesti rakennettu projektin analyysi-ja suunnitteluvaiheessa, jotta uuden sovelluksen vaatimukset ymmärrettäisiin täysin. Datamalleihin voidaan vedota myös myöhemmin datan elinkaaressa ohjelmoijien alun perin ad hoc-pohjalta luomien tietomallien järkeistämiseksi.

Data modeling approaches

Data modeling approaches voi olla vaivalloinen prosessi etukäteen, ja sellaisena sen joskus nähdään olevan ristiriidassa nopean kehityksen menetelmien kanssa. Kun Ketterä ohjelmointi on tullut laajempaan käyttöön kehitysprojektien nopeuttamiseksi, tiedon mallinnuksen jälkiteknisiä menetelmiä muokataan joissakin tapauksissa. Tyypillisesti tietomalli voidaan ajatella vuokaaviona, joka havainnollistaa datan välisiä suhteita. Sen avulla sidosryhmät voivat tunnistaa virheet ja tehdä muutoksia ennen kuin mitään ohjelmakoodia on kirjoitettu. Vaihtoehtoisesti mallit voidaan ottaa käyttöön osana takaisinmallinnusta, joka poimii malleja olemassa olevista järjestelmistä, kuten NoSQL-datasta nähdään.

tietomallinnuksen tekijät käyttävät usein useita malleja tarkastellakseen samoja tietoja ja varmistaakseen, että kaikki prosessit, kokonaisuudet, suhteet ja tietovirrat on tunnistettu. Ne käynnistävät uusia hankkeita keräämällä vaatimuksia liiketoiminnan sidosryhmiltä. Tiedon mallinnusvaiheet jakautuvat karkeasti loogisten tietomallien luomiseen, jotka osoittavat tiettyjä attribuutteja, entiteettejä ja suhteita entiteettien ja fysikaalisen tietomallin välillä.

looginen tietomalli toimii perustana fysikaaliselle tietomallille, joka on spesifinen toteutettavalle sovellukselle ja tietokannalle. Tietomalli voi olla perusta yksityiskohtaisemman tietomallin rakentamiselle.

tiedon mallinnusprosessin keskeiset vaiheet

hierarkkinen tietomallinnus

tietomallinnus tieteenalana alkoi syntyä 1960-luvulla, johon liittyi käytön nousu tietokantojen hallintajärjestelmien (dbmses). Tiedon mallinnuksen avulla organisaatiot pystyivät tuomaan tietojenkäsittelyyn johdonmukaisuutta, toistettavuutta ja hyvin järjestettyä kehitystä. Sovelluksen loppukäyttäjät ja ohjelmoijat pystyivät käyttämään tietomallia referenssinä viestinnässä datasuunnittelijoiden kanssa.

hierarkkiset tietomallit, joissa dataa on treelike-muodossa, yksi-moneen-järjestelyt leimasivat näitä varhaisia pyrkimyksiä ja korvasivat tiedostopohjaiset järjestelmät monissa suosituissa käyttötapauksissa. IBM: n Information Management System (IMS) on ensisijainen esimerkki hierarkkisesta lähestymistavasta, jota käytettiin laajasti yrityksissä, erityisesti pankkitoiminnassa. Vaikka hierarkkiset tietomallit suurelta osin syrjäyttivät-1980-luvulta alkaen-relaatiodatamallit, hierarkkinen menetelmä on yleinen vielä nykyäänkin XML: ssä (Extensible Markup Language) ja paikkatietojärjestelmissä (gises). Verkon datamallit syntyivät myös dbmses: n alkuaikoina keinona tarjota datasuunnittelijoille laaja käsitteellinen näkemys järjestelmistään. Yksi tällainen esimerkki on Conference on Data Systems Languages (CODASYL), joka perustettiin 1950-luvun lopulla ohjaamaan standardin ohjelmointikielen kehittämistä, jota voitaisiin käyttää erityyppisissä tietokoneissa.

Relaatiodatan mallinnus

vaikka se vähensi ohjelman monimutkaisuutta verrattuna tiedostopohjaisiin järjestelmiin, hierarkkinen malli edellytti silti yksityiskohtaista ymmärrystä käytetystä fyysisestä tietomallinnuksesta. Hierarkkisen tietomallin vaihtoehdoksi ehdotettu relaatiodatamalli ei vaadi kehittäjiä määrittelemään datapolkuja. Relaatiodatan mallinnuksen kuvasi ensimmäisen kerran IBM: n tutkija E. F. Codd teknisessä tutkielmassa vuonna 1970. Codd: n relaatiomalli loi teollisuudelle vaiheen relaatiotietokantojen käytölle, jossa datasegmentit liitetään eksplisiittisesti taulukoiden avulla, verrattuna hierarkkiseen malliin, jossa data liitetään implisiittisesti yhteen. Pian perustamisensa jälkeen relaatiodatamalli yhdistettiin strukturoituun Kyselykieleen (SQL) ja alkoi saada yhä suurempaa jalansijaa enterprise computingissa tehokkaana keinona käsitellä dataa.

entiteettisuhdemalli

Relaatiodatan mallinnus otti uuden askeleen eteenpäin 1970-luvun puolivälistä alkaen entiteettisuhdemallien (er) käytön yleistyessä. Läheisesti relaatiotietomalleihin integroituina er-mallit käyttävät kaavioita kuvaamaan graafisesti tietokannan elementtejä ja helpottamaan taustalla olevien mallien ymmärtämistä.

relaatiomallinnuksessa tietotyypit määräytyvät ja muuttuvat harvoin ajan myötä. Yhteisöihin kuuluu attribuutteja; esimerkiksi työntekijäyhteisön attribuutteja voivat olla sukunimi, etunimi, työvuodet ja niin edelleen. Suhteet ovat visuaalisesti kartoitettu, joka tarjoaa valmiita keinoja kommunikoida datan suunnittelun tavoitteita eri osallistujille tietojen kehittämiseen ja ylläpitoon. Ajan myötä mallinnustyökalut, kuten Ideran ER / Studio, Erwin Data Modeler ja SAP PowerDesigner, saivat laajaa käyttöä data-arkkitehtien keskuudessa järjestelmien suunnittelussa.

graafitietomalli
Graafitietomallit tulevat tutuiksi ohjelmoijille, jotka ovat työskennelleet er-kaavioiden ja objektimallien kanssa, sekä alakoululaisille, jotka ovat jäsentäneet lauseita.

kun oliokeskeinen ohjelmointi sai jalansijaa 1990-luvulla, oliokeskeinen mallinnus sai vetoapua jälleen yhtenä keinona suunnitella järjestelmiä. Vaikka oliokeskeiset lähestymistavat muistuttavat jonkin verran ER-menetelmiä, ne eroavat toisistaan siinä, että ne keskittyvät reaalimaailman entiteettien olioabstraktioihin. Objektit ryhmitellään luokkahierarkioihin, ja tällaisten luokkahierarkioiden sisällä olevat objektit voivat periä attribuutteja ja menetelmiä vanhempaluokista. Tämän periytymisominaisuuden vuoksi olio-suuntaisilla tietomalleilla on joitakin etuja verrattuna ER-mallinnukseen tietojen eheyden varmistamisen ja monimutkaisempien datasuhteiden tukemisen kannalta. 1990-luvulla syntyivät myös erityisesti tietovarastoinnin tarpeisiin suunnatut tietomallit. Merkittäviä esimerkkejä ovat snowflake skeema ja star skeema-ulottuvuusmallit.

Graafitietomallit

hierarkkisen ja verkkotietomallinnuksen sivujuonne on ominaisuusgraafimalli, joka yhdessä graafitietokantojen kanssa on havainnut lisääntyvää käyttöä tietoaineistojen monimutkaisten suhteiden kuvaamisessa erityisesti sosiaalisessa mediassa, suosittelija-ja petostentunnistussovelluksissa.

graafitietomallin avulla suunnittelijat kuvailevat järjestelmäänsä solmujen ja suhteiden yhdistetyksi kuvaajaksi, paljolti samaan tapaan kuin he saattaisivat tehdä ER-tai objektitietomallinnuksella. Graafitietomalleja voidaan käyttää tekstianalyysiin, jolloin luodaan malleja, jotka paljastavat dokumenttien sisältämien tietopisteiden välisiä suhteita.

Related Posts

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *