No contexto de ciência de dados e gestão de dados, normalmente fala-se dos tipos de dados segundo a sua estrutura e forma de armazenamento. Neste artigo vamos abordar o que são dados e que tipo de dados existem no contexto da ciência e gestão.
Os dados representam a realidade e, quando processados com propósito, transformam-se em informação. Dentro da ciência ou gestão de dados, há dados estruturados, semiestruturados e não estruturados, acompanhados de metadados técnicos, de negócio, operacionais e de uso.
O ciclo de vida dos dados envolve a sua criação, armazenamento, limpeza, análise, visualização, partilhe e eventual destruição.
Quais os tipos de dados?
Tal como referido, no contexto de ciência de dados e gestão de dados, os tipos de dados são classificados de acordo com a sua estrutura e forma de armazenamento. Os principais tipos são:
- Dados Estruturados
- Dados Não Estruturados
- Dados Semi-estruturados
- Metadados
Dados Estruturados
Os dados estruturados estão organizados em tabelas, linhas e colunas, como numa folha de Excel ou base de dados relacional. Por exemplo:
- Registos de clientes (nome, idade, NIF, morada)
- Transações financeiras
- Inventário de produtos
Este tipo de dados são fáceis de armazenar, pesquisar e analisar com SQL, BI, estatística tradicional, etc.
Dados Não Estruturados
Os dados não estruturados não seguem propriamente um formato, uma estrutura. São exemplos:
- Textos (emails, posts de redes sociais, artigos)
- Imagens e vídeos
- Áudio (gravações, podcasts)
- Documentos PDF ou Word sem metadados definidos
Representam a maior parte dos dados existentes (~80-90%), mas exigem técnicas de IA, PLN ou visão computacional para extrair valor.
Dados Semi-estruturados
Este tipo de dados não têm a rigidez dos estruturados, mas possuem organização através de etiquetas ou hierarquias. São exemplos deste tipo de dados:
- JSON
- XML
- Logs de servidores
- Dados de sensores IoT com tags
Este tipo de dados são flexíveis e comuns em sistemas modernos, especialmente na integração entre aplicações.
Metadados
Quando falamos de Metadados, ou Metainformação, estamos a falar de dados sobre outros dados, ou seja, qualquer dado usado para auxiliar na identificação, descrição e localização de informações. São exemplos:
- Data de criação de um ficheiro
- Autor de um documento
- Geolocalização numa fotografia
Como referido, dentro dos metadados existem também diversos tipos, dos quais se destacam metadados técnicos, de negócio, operacionais e de uso.
Este tipo de dados são fundamentais para catalogação, governança de dados e compliance.