Datové modelování je proces dokumentující komplexní softwarový systém design jako snadno srozumitelný diagram, s využitím textu a symbolů představují způsob, jak data musí proudit. Diagram lze použít k zajištění efektivního využití dat, jako plán pro konstrukci nového softwaru nebo pro přepracování starší aplikace.
modelování dat je důležitá dovednost pro datové vědce nebo jiné osoby zapojené do analýzy dat. Tradičně, datové modely byly vytvořeny během fáze analýzy a návrhu projektu, aby bylo zajištěno, že požadavky na novou aplikaci budou plně pochopeny. Datové modely lze také vyvolat později v životním cyklu dat, aby se racionalizovaly návrhy dat, které původně vytvořili programátoři ad hoc.
přístupy k modelování dat
modelování dat může být pečlivým počátečním procesem a jako takové je někdy považováno za v rozporu s metodikami rychlého vývoje. Vzhledem k tomu, že agilní programování se rozšířilo k urychlení vývojových projektů, v některých případech se přizpůsobují metody modelování dat po faktu. Datový model lze obvykle považovat za vývojový diagram, který ilustruje vztahy mezi daty. Umožňuje zúčastněným stranám identifikovat chyby a provádět změny před napsáním jakéhokoli programovacího kódu. Alternativně mohou být modely zavedeny jako součást úsilí o reverzní inženýrství, které extrahuje modely z existujících systémů, jak je vidět u dat NoSQL.
datoví modeláři často používají více modelů k zobrazení stejných dat a zajišťují, že byly identifikovány všechny procesy, entity, vztahy a datové toky. Iniciují nové projekty shromažďováním požadavků od obchodních zúčastněných stran. Fáze modelování dat se zhruba rozpadají na vytváření logických datových modelů, které ukazují specifické atributy, entity a vztahy mezi entitami a fyzický datový model.
logický datový model slouží jako základ pro vytvoření fyzického datového modelu, který je specifický pro implementovanou aplikaci a databázi. Datový model se může stát základem pro vytvoření podrobnějšího datového schématu.
Hierarchické modelování dat
modelování Dat jako disciplína začala vznikat v roce 1960, doprovázející vzestup v používání databáze systémů řízení (DBMSes). Datové modelování umožnilo organizacím přinést konzistenci, opakovatelnost a dobře uspořádaný vývoj zpracování dat. Koncoví uživatelé aplikací a programátoři byli schopni použít datový model jako referenci v komunikaci s datovými designéry.
Hierarchické datové modely, které pole dat v treelike, one-to-many režim označil tyto rané úsilí a nahrazuje soubor-založené systémy v mnoha populárních případy použití. IBM Information Management System (IMS) je primárním příkladem hierarchického přístupu, který našel široké využití v podnicích, zejména v bankovnictví. Ačkoli hierarchické datové modely, byly do značné míry nahrazeny — začátek v roce 1980-tím, že relační datové modely, hierarchické metody je společné ještě v XML (Extensible Markup Language) a geografické informační systémy (GISes) dnes. Síťové datové modely také vznikly v počátcích DBMS jako prostředek k poskytnutí návrhářům dat široký koncepční pohled na jejich systémy. Jedním takovým příkladem je Konference o Data Systems Languages (CODASYL), který tvořil v pozdní 1950, aby vodítkem pro vývoj standardní programovací jazyk, který by mohl být použit napříč různými typy počítačů.
Relační datové modelování
i Když to snižuje složitost programu versus souborové systémy, hierarchický model, stále vyžaduje detailní porozumění konkrétní fyzické ukládání dat zaměstnán. Navrhuje se jako alternativa k hierarchický model dat, relační model dat nevyžaduje vývojářům definovat datové cesty. Modelování relačních dat bylo poprvé popsáno v technickém dokumentu z roku 1970 výzkumníkem IBM E. F. Coddem. Relační model Codd připravil půdu pro průmyslové využití relačních databází, ve kterých jsou datové segmenty explicitně spojeny pomocí tabulek, ve srovnání s hierarchickým modelem, kde jsou data implicitně spojena dohromady. Brzy po svém vzniku, relační datový model byl spolu s Structured Query Language (SQL) a začal získávat stále větší oporu v enterprise computing jako efektivní prostředky pro zpracování údajů.
entity relationship model
Relační datové modelování udělal další krok vpřed začátek v polovině-1970 jako použití entity relationship (ER) modely stal se více převládající. Úzce integrován s relačních datových modelů, ER modely používají diagramy graficky znázornit prvky v databázi a usnadnit pochopení základních modelů.
při relačním modelování jsou datové typy určeny a zřídka se mění v průběhu času. Entity obsahují atributy; například atributy entity zaměstnance mohou zahrnovat příjmení, jméno, roky zaměstnané a tak dále. Vztahy jsou vizuálně mapovány, poskytuje připravené prostředky pro komunikaci cílů návrhu dat různým účastníkům vývoje a údržby dat. V průběhu času získaly modelovací nástroje, včetně Idera ER / Studio, Erwin Data Modeler a SAP PowerDesigner, široké využití mezi datovými architekty pro navrhování systémů.
Jako objektově orientované programování získala země v roce 1990, objektově orientované modelování získal trakci jako další způsob, jak navrhnout systémy. Objektově orientované přístupy se sice podobají metodám ER, ale liší se tím, že se zaměřují na objektové abstrakce reálných entit. Objekty jsou seskupeny do hierarchií tříd a objekty v těchto hierarchiích tříd mohou zdědit atributy a metody z nadřazených tříd. Vzhledem k této dědičnosti mají objektově orientované datové modely oproti modelování ER určité výhody, pokud jde o zajištění integrity dat a podporu složitějších datových vztahů. V 90. letech také vznikly datové modely specificky zaměřené na potřeby datového skladu. Pozoruhodné příklady jsou sněhové vločky schéma a hvězda schéma dimenzionální modely.
Graf datové modely
odnož hierarchické a síťové datové modelování je majetkem graf, model, který, spolu s grafem databází, bylo zjištěno zvýšené využívání pro popis složitých vztahů v rámci datové sady, zejména v sociálních médiích, doporučující a odhalování podvodů aplikací.
Pomocí grafu datového modelu, návrháři popsat jejich systému jako připojený graf uzly a vztahy, stejně jako oni by dělat s ER nebo objekt datového modelování. Grafové datové modely lze použít pro textovou analýzu, vytváření modelů, které odhalují vztahy mezi datovými body v dokumentech.