Data modeling is the process of documenting a complex software system design as an easily understanded diagram, using text and symbols to represent the way data needs to flow. O diagrama pode ser usado para garantir o uso eficiente dos dados, como um modelo para a construção de um novo software ou para re-engenharia de uma aplicação legada.a modelagem de dados é uma habilidade importante para cientistas de dados ou outros envolvidos com a análise de dados. Tradicionalmente, os modelos de dados foram construídos durante as fases de análise e concepção de um projeto para garantir que os requisitos para uma nova aplicação são totalmente compreendidos. Modelos de dados também podem ser invocados mais tarde no ciclo de vida dos dados para racionalizar projetos de dados que foram originalmente criados por programadores em uma base ad hoc.
abordagens de modelagem de dados
modelagem de dados pode ser um processo meticuloso e, como tal, às vezes é visto como estando em desacordo com metodologias de desenvolvimento rápido. Como a programação ágil tem vindo a ser mais usada para acelerar projetos de desenvolvimento, métodos de modelagem de dados após o fato estão sendo adaptados em alguns casos. Tipicamente, um modelo de dados pode ser pensado como um fluxograma que ilustra as relações entre os dados. Permite que as partes interessadas identifiquem erros e façam alterações antes de qualquer código de programação ter sido escrito. Alternativamente, modelos podem ser introduzidos como parte dos esforços de engenharia reversa que extraem modelos de sistemas existentes, como visto com dados NoSQL.
modeladores de Dados Muitas vezes usam vários modelos para ver os mesmos dados e garantir que todos os processos, entidades, relacionamentos e fluxos de dados foram identificados. Eles iniciam novos projetos, reunindo requisitos de Partes Interessadas do negócio. Os estágios de modelagem de dados dividem-se aproximadamente na criação de modelos de dados lógicos que mostram atributos específicos, entidades e relações entre entidades e o modelo de dados físicos.
o modelo de dados lógicos serve como base para a criação de um modelo de dados físicos, que é específico para a aplicação e banco de dados a ser implementado. Um modelo de dados pode tornar-se a base para a construção de um esquema de dados mais detalhado.
de modelagem de dados Hierárquicos
modelagem de Dados como uma disciplina começou a surgir na década de 1960, acompanhando o aumento no uso de sistemas de gerenciamento de banco de dados (Sgbds). A modelagem de dados permitiu que as organizações trouxessem consistência, repetibilidade e desenvolvimento bem ordenado para o processamento de dados. Usuários finais de aplicação e programadores foram capazes de usar o modelo de dados como referência em comunicações com designers de dados.
modelos hierárquicos de dados que agregam dados em treelike, um-para-muitos arranjos marcaram esses primeiros esforços e substituíram sistemas baseados em arquivos em muitos casos de uso popular. O sistema de gestão de Informação da IBM (IMS) é um exemplo primário da abordagem hierárquica, que encontrou amplo uso nas empresas, especialmente no setor bancário. Embora os modelos de dados hierárquicos tenham sido largamente substituídos — a partir dos anos 80 — por modelos de dados relacionais, o método hierárquico ainda é comum em XML (Extensible Markup Language) e sistemas de Informação Geográfica (gises). Modelos de dados de rede também surgiram nos primeiros dias de DBMSes como um meio de fornecer designers de dados com uma ampla visão conceitual de seus sistemas. Um exemplo é a Conferência sobre linguagens de Sistemas de dados (CODASYL), que se formou no final da década de 1950 para orientar o desenvolvimento de uma linguagem de programação padrão que poderia ser usada em vários tipos de computadores.
modelagem de dados relacionais
embora tenha reduzido a complexidade do programa versus sistemas baseados em arquivos, o modelo hierárquico ainda exigia compreensão detalhada do armazenamento de dados físicos específicos Empregados. Proposto como uma alternativa ao modelo de dados hierárquico, o modelo de dados relacionais não exige que os desenvolvedores definam caminhos de dados. A modelagem de dados relacionais foi descrita pela primeira vez em 1970 pelo pesquisador da IBM E. F. Codd. O modelo relacional de Codd definiu o cenário para o uso industrial de bases de dados relacionais em que os segmentos de dados são explicitamente associados ao uso de tabelas, em comparação com o modelo hierárquico em que os dados são implicitamente Unidos. Logo após sua criação, o modelo de dados relacionais foi acoplado com a linguagem de consulta estruturada (SQL) e começou a ganhar uma posição cada vez maior na computação corporativa como um meio eficiente de processar dados.
o modelo de relação de entidade
a modelagem de dados relacionais deu mais um passo em frente a partir de meados da década de 1970, à medida que o uso de modelos de relação de entidade (ER) se tornou mais prevalente. Intimamente integrado com modelos de dados relacionais, os modelos ER usam diagramas para retratar graficamente os elementos em um banco de dados e para facilitar a compreensão dos modelos subjacentes.com modelagem relacional, os tipos de dados são determinados e raramente alterados ao longo do tempo. As entidades incluem atributos; por exemplo, os atributos de uma entidade empregado podem incluir o sobrenome, o primeiro nome, os anos empregados e assim por diante. As relações são mapeadas visualmente, proporcionando um meio pronto para comunicar os objetivos de design de dados a vários participantes no desenvolvimento e manutenção de dados. Ao longo do tempo, Ferramentas de modelagem, incluindo ER/Studio da Idera, ERwin Data Modeler e SAP PowerDesigner, ganharam amplo uso entre os arquitetos de dados para projetar sistemas.
As object-oriented programming gained ground in the 1990s, object-oriented modeling gained traction as yet another way to design systems. Embora tendo alguma semelhança com os métodos ER, abordagens orientadas a objetos diferem em que eles se concentram em abstrações de objetos de entidades do mundo real. Os objetos são agrupados em hierarquias de classes, e os objetos dentro dessas hierarquias de classes podem herdar atributos e métodos de classes-mãe. Por causa desta herança, modelos de dados orientados a objetos têm algumas vantagens versus modelagem ER, em termos de garantir a integridade dos dados e suportar relações de dados mais complexas. Também surgiram na década de 1990 modelos de dados especificamente orientados para as necessidades de armazenamento de dados. Exemplos notáveis são esquemas de flocos de neve e modelos dimensionais de esquemas de estrelas.
modelos de dados de Grafos
um ramo da modelagem de dados hierárquicos e de rede é o modelo de grafo de propriedade, que, juntamente com bases de dados de grafos, encontrou maior uso para descrever relações complexas dentro de conjuntos de dados, particularmente nas mídias sociais, recomendações e aplicações de detecção de fraudes.
usando o modelo de dados de grafos, designers descrevem seu sistema como um grafo conectado de nós e relacionamentos, tanto quanto eles podem fazer com ER ou modelagem de dados de objetos. Modelos de dados de grafos podem ser usados para análise de texto, criando modelos que descobrem relações entre pontos de dados dentro de documentos.