fernandosaenz.com

Pursuing the gold hidden behind raw data


Bienvenido/a,

No te voy a mentir, esto es un blog técnico, aunque no trata sobre tecnologías específicas. Expongo la motivación que hay detrás del diseño de cada sistema, y sus resultados. No voy a darte una explicación técnica de cada tecnología que diseño o utilizo. No vamos a "ver las tripas".

En estos últimos diez años, en los que he ejercido de gerente, he podido ver cómo la explotación inteligente de datos mejora de forma notable los resultados en diferentes ámbitos de la empresa. En este blog comparto esas experiencias, explicadas de forma resumida pero clara.

fernandosaenz.com
En cada post verás que incluyo una ficha que encabeza la lectura, y que ofrece una visión instantánea de lo que encontrarás si decides continuar. La mayoría de artículos los podrás leer en 3-4 minutos de tu tiempo.

Busco ofrecer un formato de micro-posts que giren en torno a la búsqueda de valor añadido buceando en datos crudos. Y siempre orientados a la divulgación de las experiencias que he vivido en esta obsesión que tengo por aplicar tecnología, a veces sencilla pero suficiente, en cada ámbito de la empresa.

Espero que lo disfrutes tanto como yo.

- Fernando Sáenz -

10/01/16 tecnología no hay comentarios

Aplicación de Cloud Data Lakes en la industria

  • Tiempo de lectura: 9 minutos
  • Problema: los entornos industriales generan datos de morfología variable, dificultando su gestión y tratamiento
  • Observación: existen tecnologías y diseños orientados a optimizar el tratamiendo de este tipo de datos
  • Propuesta: estudiar una posible integración de los conceptos sobre Data Lakes en los entornos de Big Data industrial

En este artículo quiero revisar un concepto que está ganando fuerza, y que está siendo también fuente de una interesante controversia; los sistemas de gestión de datos denominados Data Lakes.

Definición

Lo primero es identificar con exactitud a qué nos estamos refiriendo. La primera alusión al término se le atribuye a James Dixon, quien lo describió con la siguiente analogía en su blog: “If you think of a datamart as a store of bottled water – cleansed and packaged and structured for easy consumption – the data lake is a large body of water in a more natural state. The contents of the data lake stream in from a source to fill the lake, and various users of the lake can come to examine, dive in, or take samples.” Leer más