4 formas de garantizar que su lago de datos no se convierta en un pantano de datos

Para que los lagos de datos funcionen para datos de series temporales, es importante agregar buenos metadatos, garantizar la capacidad de conectar su plataforma de análisis a su lago de datos y tomar medidas para mejorar el rendimiento para el análisis.

Lago De Datos Ppal

Si su empresa está involucrada en una iniciativa completa de fabricación inteligente, Industria 4.0 u otra iniciativa de transformación digital, es probable que haya encontrado el término "lago de datos". Un lago de datos es esencialmente un lugar para almacenar todos los datos recopilados de sus operaciones. En un lago de datos, los datos almacenados allí pueden ser estructurados o no. No se requiere procesamiento previo para que aquellos se almacenen en un lago de datos.

Debido a que se pueden almacenar todo tipo de datos en un lago, estos sitios de almacenamiento tienen un gran potencial para brindar orientación sobre asuntos que quizás aún no considere importantes. Según Amazon Web Services, tener diferentes tipos de datos almacenados en un repositorio central significa que puede aplicar numerosos tipos de análisis, como consultas SQL, análisis de Big Data, búsqueda de texto completo, análisis en tiempo real y aprendizaje automático para descubrir nuevos conocimientos.

Pero, al igual que ese cajón de basura en su casa estaba destinado a almacenar artículos necesarios que no encajan en otro lugar, puede convertirse fácilmente en un depósito general para las cosas que ya debería haber tirado. De manera similar, un lago de datos puede convertirse en un pantano de datos.

Niki Driessen, director arquitecto de TrendMiner.Niki Driessen, director arquitecto de TrendMiner.Los lagos de datos también pueden convertirse en pantanos de datos cuando los usuarios necesitan un desarrollo especial o habilidades técnicas para acceder y utilizar los datos, dice Niki Driessen, arquitecto jefe de TrendMiner, un proveedor de tecnología de análisis de datos para las industrias de procesamiento. “Actualmente, los lagos de datos se están volviendo cada vez más importantes para las industrias de procesos que capturan y almacenan inmensas cantidades de datos de series temporales generados por sensores”, explica. “Para hacer que los lagos de datos funcionen para datos de series temporales, es importante comprender que [este tipo de] datos no pueden simplemente arrojarse al lago con la expectativa de extraer su valor”.