Data Observability | Observabilidade de Dados versus Monitoramento de Pipeline de Dados

Data Observability | Observabilidade de Dados versus Monitoramento de Pipeline de Dados

O Monitoramento de Pipeline de Dados envolve o uso de aprendizado de máquina para entender a maneira como seus pipelines de dados normalmente se comportam e, em seguida, enviar alertas quando ocorrerem anomalias nesse comportamento (ver os 5 pilares).


Leia todos os tópicos:


Algumas ferramentas da pilha de dados moderna, como o Airflow, por exemplo, terão a capacidade de monitorar sua parte do pipeline de ETL. Embora sejam úteis, as equipes de dados precisam monitorar todo o pipeline de ponta a ponta, desde a ingestão até o destino e através da transformação até o consumo na camada de BI.


É também importante que a monitorização do pipeline de dados seja complementada com um processo de monitorização da própria qualidade dos dados. Isso ocorre porque, embora o pipeline possa estar funcionando bem, os dados que fluem por ele podem ser lixo.


Por exemplo, os valores dos dados podem estar fora do intervalo histórico normal ou pode haver anomalias presentes nas taxas NULL ou nos percentuais exclusivos. O Monitoramento de Pipeline de Dados em si pode ser feito automaticamente com aprendizado de máquina, bem como através da definição de regras personalizadas, por exemplo, se você souber que uma taxa de conversão monetária nunca pode ser negativa.


Quando o Monitoramento de Pipeline de Dados automatizado de dados é combinado com recursos para acelerar a resolução de incidentes, compreender o impacto desses incidentes e ilustrar a integridade dos dados ao longo do tempo, isso se torna a observabilidade dos dados.


 Clique aqui e nos contate via What's App para avaliarmos seus projetos 

Comente e compartilhe este artigo!

brazilsalesforceeffectiveness@gmail.com


Leia também:

eBook: Série DONUT PROJECT 2015: Projetos e Códigos de Visual Basic for Applications - Autor: André Luiz Bernardes  eBook: Série Top 10 Funções: Top 10 Funções VBA para o Microsoft Excel - Autor: André Luiz Bernardes

eBook: Série Funções Poderosas: 13 Funções Poderosas no MS Excel - Autor: André Luiz Bernardes  eBook: Série Visual Basic For Application: Criando Logs de acesso: Dicas e Códigos de Visual Basic for Applications - Autor: André Luiz Bernardes

eBook: Série VBA Tips: Rastrei seus Dashboards, Scorecards, Reports, Relatórios, Planilhas e Aplicações - Dicas e Códigos - Autor: André Luiz Bernardes  eBook: Série Data Science: Big Data, Como? - Autor: André Luiz Bernardes

eBook: Série Smarter Analytic: 5 Previsões de Big Data - Autor: André Luiz Bernardes

Nenhum comentário:

Postar um comentário

diHITT - Notícias