Catálogo de Dados – parte 1 ou prelúdio…

Compartilharei nessa sequência de posts a minha experiência e vivência na implementação de um Catálogo de Dados.

1. O que é um Catálogo de Dados?

tl;dr; (too long, didn’t read): Um local para procurar por ativos de dados,

isto é, procurar por tabelas, dashboards, datasets etc.

Um catálogo de dados é um inventário dos ativos de dados de uma empresa para que os usuários possam encontrar rapidamente as informações de que precisam. O catálogo é constituído principalmente de metadados que fornecem informações básicas sobre outros dados e descrevem o que são. Combinados com gerenciamento de dados e ferramentas de pesquisa, você tem um catálogo de dados.

Imagem do funil de um Catálogo de Dados

https://www.tibco.com/pt-br/reference-center/what-is-a-data-catalog#:~:text=O%20que%20%C3%A9%20um%20cat%C3%A1logo%20de%20dados%3F%20Um,sobre%20outros%20dados%20e%20descrevem%20o%20que%20s%C3%A3o

2. Como começar um Catálogo de Dados?

Diria que há duas formas de fazer:

Começar a listar todos os ativos. No fim você terá um Catálogo, talvez não tão bem organizado e não tão eficiente nos quesitos busca e organização, mas terá rsrs.

OU

Planejar uma organização prévia de acordo com suas regras de negócio e, então, começar a listar e classificar seus ativos de acordo com essas regras. 

Um modo de fazer desta forma é definindo um ou mais Glossário(s) de Negócio.

Um Glossário de Negócio nada mais é do que definir acordos com as áreas envolvidas a respeito das palavras usadas. Afinal, uma mesma palavra pode ter significados diferentes de acordo com a empresa ou até mesmo de acordo com o time que usa aquela palavra!

Já parou pra pensar nisso?! Quando você fala “ticket” ou “tempo de atendimento”, por exemplo, o significado muda de acordo com a área. Para atendimento, ticket é uma coisa, para vendas pode ser outra. Para a operação, tempo de atendimento é uma coisa, para o marketing pode ser outra.

Que tal alinhar os significados antes?

Um Glossário de Negócios tem 4 objetivos segundo o framework DAMA (Chapter 3 – 2.14):

  • Alinhar um entendimento comum sobre os conceitos e terminologias do core do negócio;
  • Reduzir o risco de os dados serem usados de forma errada por erro no entendimento ou má interpretação a respeito dos conceitos e terminologias;
  • Prover o alinhamento entre as áreas técnicas, com seus jargões, e as áreas de negócio;
  • Maximizar a capacidade de busca e garantir o acesso ao conhecimento documentado;

Mas lembre-se, um Glossário não é meramente uma lista de termos e seus significados, ele precisa estar associado a outros metadados tais como: sinônimos, métricas, linhagem, regras de negócios, um Owner (dono)…

3. Mas eu queria fazer um Catálogo e agora preciso fazer um Glossário? (Chapter 12 – 1.3.5.2)

É isso mesmo! Lá na frente vai ajudar rsrs #confia

Muitas empresas têm seus Glossários em planilhas. Sim, planilhas! Você não precisa de um ERP, uma plataforma XPTO ou a ferramenta da moda para tal, uma planilha vai ajudar a construir um Glossário.

Um bom Glossário vai trazer as seguintes definições:

  • Nome do termo, definição, acrônimos ou abreviações e sinônimos;
  • Unidade de negócio e/ou aplicação responsável pela gestão dos dados associados com o termo;
  • Pessoa responsável pelo termo e a data de atualização;
  • Categorização do termo (associação funcional de acordo com o negócio);
  • Conflitos que precisam de resolução, a natureza do conflito e a ação a ser tomada;
  • Linha do tempo;
  • Confusões mais comuns a respeito do significado;
  • Algoritmos que suportam a definição;
  • Linhagem do termo;
  • Fonte de dados OFICIAL ou AUTORIZADA que serve ao termo;

Além disso, é importante frisar que um Glossário é feito para atender à três grupos de usuários chaves:

  • Usuários de negócio: Analistas de dados, cientistas de dados, analistas de variados departamentos tais como comercial, marketing, pessoas etc, gestores e executivos;
  • Data Owner e Data Steward: esses usuários usam o glossário para manter o ciclo de vida do termo e suas definições assim como melhorar o conhecimento contido no Glossário atualizando todas as variáveis citadas anteriormente;
  • Usuários técnicos: usuários que utilizarão o Glossário para desenvolver arquiteturas de sistemas, análises de impacto, conceber novas funcionalidades nos variados sistemas e aplicativos, entre outros;

 

4. Colocando a mão na massa

Teorizei muita coisa, trouxe definições mas, e na prática, o que faço?

Já vimos que fazer um Catálogo simplesmente começando a listar os ativos é arriscado.

Como eu disse, na prática, até é possível fazer, mas não é recomendado pois lá na frente: 

  • você ainda incorrerá em casos de interpretações equivocadas; 
  • não terá grande eficiência na busca de ativos;
  • corre o risco de listar vários ativos distintos entre si mas que são relacionados ou, até mesmo, equivalentes, logo, terá um Catálogo de Dados poluído;

Então vamos ao passo a passo:

#agoravai

  1. Defina um dono para o seu glossário, este será responsável por iniciar o Glossário e, depois de feito, MANTER o Glossário através de processos de revisão e melhoria.
  2. O dono do Glossário deve se reunir com outros usuários, se possível, se reunir já com os Owners (donos) dos termos do Glossário, e começar a listar os termos e as definições. Pode seguir a sugestão a ser preenchida.
  3. Comunicar o levantamento feito e conseguir um “de acordo” com os Owners dos termos, com o dono do Glossário e, vale a pena também, a chancela de um gestor para dar peso e significância ao trabalho feito.
  4. Após o “de acordo” comunicar à empresa e a todos os usuários em potencial do Glossário como acessar e como utilizar o Glossário.
  5. Internamente, como trabalho de Governança, pode-se criar métricas para acompanhar o uso do Glossário. Métricas de uso, assertividade e revisão.
  6. CRIAR processos de manutenção, revisão e melhoria do Glossário.

 

5. Conclusão

Escrevi, escrevi e ainda não iniciamos o Catálogo de Dados rsrs

Mas é isso pra começo de conversa. O trabalho é grande, nada simplório e é importante fazer com calma para que lá na frente não fique faltando algo ou não seja metido os pés pelas mãos.

Será que no próximo artigo a gente começa o Catálogo de Dados?

Até…