Según Stadista, el 31% de las empresas españolas usa el Big Data para la aceleración de toma de decisiones, siendo el departamento de marketing el principal interesado. Y es que el objetivo final de esta tecnología es la obtención de información estratégica mediante el procesamiento de datos a tiempo real y/o batch.

Se trata de una industria que crece mundialmente en facturación al ritmo del 25% según Wikibon y que espera alcanzar los 103.000 millones de dólares en 2027.

El hecho diferenciador

¿Cómo saber si podemos catalogar como Big Data la información que almacenamos? La respuesta: si cumple con la «regla de las cinco V«:

  • V de Volumen: terabytes y petabytes de información.
  • V de Velocidad: generación de datos a un ritmo vertiginoso sin fin.
  • V de Variedad: combinación de datos estructurados, semi-estructurados y no estructurados.
  • V de Veracidad: información de calidad.
  • V de Valor: el procesamiento de los datos aporta información estratégica para la toma de decisiones.

Si esta regla no se cumple no es rentable ni necesario implementar una arquitectura de Big Data a nivel empresarial. Bastará con disponer de una buena arquitectura de almacenamiento (data warehouse o cloud) y contratar cualquiera de las soluciones de business intelligence o analítica existentes en el mercado (Power BI, Google Data Studio, etc).

El estándar

Cloudera, el consorcio fundado por Google, Yahoo y Facebook en 2008, es a día de hoy el estándar de implementación de estructuras Big Data.

El sistema de ficheros más utilizado sigue siendo Hadoop, que se caracteriza por su distribución, escalabilidad y por ser de código abierto, y Spark es el motor más instalado en este tipo de clústeres.

Usos del ‘Big Data’

Sectores como banca, aseguradoras, redes sociales o plataformas de contenidos bajo demanda son los principales desarrolladores y usuarios de infraestructuras de Big Data. Algunos de los usos más extendidos son:

  • Business Intelligence
  • 360º Degree Customer View
  • Análisis predictivo
  • Detección de fraude
  • Solución low cost de almacenamiento
  • Machine Learning
  • Analítica y visualización de datos