Compartilharei nessa sequência de posts a minha experiência e vivência na implementação de um Catálogo de Dados.
1. O que é um Catálogo de Dados?
tl;dr; (too long, didn’t read): Um local para procurar por ativos de dados,
isto é, procurar por tabelas, dashboards, datasets etc.
Um catálogo de dados é um inventário dos ativos de dados de uma empresa para que os usuários possam encontrar rapidamente as informações de que precisam. O catálogo é constituído principalmente de metadados que fornecem informações básicas sobre outros dados e descrevem o que são. Combinados com gerenciamento de dados e ferramentas de pesquisa, você tem um catálogo de dados.

2. Como começar um Catálogo de Dados?
Diria que há duas formas de fazer:
Começar a listar todos os ativos. No fim você terá um Catálogo, talvez não tão bem organizado e não tão eficiente nos quesitos busca e organização, mas terá rsrs.
OU
Planejar uma organização prévia de acordo com suas regras de negócio e, então, começar a listar e classificar seus ativos de acordo com essas regras.
Um modo de fazer desta forma é definindo um ou mais Glossário(s) de Negócio.
Um Glossário de Negócio nada mais é do que definir acordos com as áreas envolvidas a respeito das palavras usadas. Afinal, uma mesma palavra pode ter significados diferentes de acordo com a empresa ou até mesmo de acordo com o time que usa aquela palavra!
Já parou pra pensar nisso?! Quando você fala “ticket” ou “tempo de atendimento”, por exemplo, o significado muda de acordo com a área. Para atendimento, ticket é uma coisa, para vendas pode ser outra. Para a operação, tempo de atendimento é uma coisa, para o marketing pode ser outra.
Que tal alinhar os significados antes?
Um Glossário de Negócios tem 4 objetivos segundo o framework DAMA (Chapter 3 – 2.14):
- Alinhar um entendimento comum sobre os conceitos e terminologias do core do negócio;
- Reduzir o risco de os dados serem usados de forma errada por erro no entendimento ou má interpretação a respeito dos conceitos e terminologias;
- Prover o alinhamento entre as áreas técnicas, com seus jargões, e as áreas de negócio;
- Maximizar a capacidade de busca e garantir o acesso ao conhecimento documentado;
Mas lembre-se, um Glossário não é meramente uma lista de termos e seus significados, ele precisa estar associado a outros metadados tais como: sinônimos, métricas, linhagem, regras de negócios, um Owner (dono)…
3. Mas eu queria fazer um Catálogo e agora preciso fazer um Glossário? (Chapter 12 – 1.3.5.2)
É isso mesmo! Lá na frente vai ajudar rsrs #confia
Muitas empresas têm seus Glossários em planilhas. Sim, planilhas! Você não precisa de um ERP, uma plataforma XPTO ou a ferramenta da moda para tal, uma planilha vai ajudar a construir um Glossário.
Um bom Glossário vai trazer as seguintes definições:
- Nome do termo, definição, acrônimos ou abreviações e sinônimos;
- Unidade de negócio e/ou aplicação responsável pela gestão dos dados associados com o termo;
- Pessoa responsável pelo termo e a data de atualização;
- Categorização do termo (associação funcional de acordo com o negócio);
- Conflitos que precisam de resolução, a natureza do conflito e a ação a ser tomada;
- Linha do tempo;
- Confusões mais comuns a respeito do significado;
- Algoritmos que suportam a definição;
- Linhagem do termo;
- Fonte de dados OFICIAL ou AUTORIZADA que serve ao termo;
Além disso, é importante frisar que um Glossário é feito para atender à três grupos de usuários chaves:
- Usuários de negócio: Analistas de dados, cientistas de dados, analistas de variados departamentos tais como comercial, marketing, pessoas etc, gestores e executivos;
- Data Owner e Data Steward: esses usuários usam o glossário para manter o ciclo de vida do termo e suas definições assim como melhorar o conhecimento contido no Glossário atualizando todas as variáveis citadas anteriormente;
- Usuários técnicos: usuários que utilizarão o Glossário para desenvolver arquiteturas de sistemas, análises de impacto, conceber novas funcionalidades nos variados sistemas e aplicativos, entre outros;
4. Colocando a mão na massa
Teorizei muita coisa, trouxe definições mas, e na prática, o que faço?
Já vimos que fazer um Catálogo simplesmente começando a listar os ativos é arriscado.
Como eu disse, na prática, até é possível fazer, mas não é recomendado pois lá na frente:
- você ainda incorrerá em casos de interpretações equivocadas;
- não terá grande eficiência na busca de ativos;
- corre o risco de listar vários ativos distintos entre si mas que são relacionados ou, até mesmo, equivalentes, logo, terá um Catálogo de Dados poluído;
Então vamos ao passo a passo:
#agoravai
- Defina um dono para o seu glossário, este será responsável por iniciar o Glossário e, depois de feito, MANTER o Glossário através de processos de revisão e melhoria.
- O dono do Glossário deve se reunir com outros usuários, se possível, se reunir já com os Owners (donos) dos termos do Glossário, e começar a listar os termos e as definições. Pode seguir a sugestão a ser preenchida.
- Comunicar o levantamento feito e conseguir um “de acordo” com os Owners dos termos, com o dono do Glossário e, vale a pena também, a chancela de um gestor para dar peso e significância ao trabalho feito.
- Após o “de acordo” comunicar à empresa e a todos os usuários em potencial do Glossário como acessar e como utilizar o Glossário.
- Internamente, como trabalho de Governança, pode-se criar métricas para acompanhar o uso do Glossário. Métricas de uso, assertividade e revisão.
- CRIAR processos de manutenção, revisão e melhoria do Glossário.
5. Conclusão
Escrevi, escrevi e ainda não iniciamos o Catálogo de Dados rsrs
Mas é isso pra começo de conversa. O trabalho é grande, nada simplório e é importante fazer com calma para que lá na frente não fique faltando algo ou não seja metido os pés pelas mãos.
Será que no próximo artigo a gente começa o Catálogo de Dados?
Até…
Pingback: Parte 4 - Processos para Catálogo de Dados - Leonardo Borba
Pingback: Parte 3 - Mãos à massa! Iniciando um Catálogo de Dados - Leonardo Borba
Pingback: Parte 2 - (spoiler) não é agora que começamos o Catálogo - Leonardo Borba