Big Data

take control of your data

“Gracias a Big Data, cosas que antes parecían imposibles, ahora están al alcance de la mano.” José Ruiz Responsable de Big Data en Paradigma

Volver

Las cantidades ingentes de datos que se mueven en Internet (terabytes, petabytes…) han generado la necesidad de una tecnología que permita a las empresas extraer el valor de estos datos de forma eficiente en tiempo y dinero. Esta tecnología es lo que conocemos como Big Data.

Las empresas pueden seguir los comportamientos de sus clientes para sacar información muy útil que pueda transformarse en beneficios económicos. Cualquier dato puede ser analizado, tanto los almacenados de manera consciente como los que no.

Información útil a partir de todo tipo de documentos

Uno de los aspectos mas importantes de Big Data es que permite tratar gran variedad de datos, muchos hasta hace poco ignorados por la dificultad que implicaba acceder a ellos. Estos tipos de datos no son sólo los generados dentro de la empresa:

Estructurados
big_data_estructurados
Son aquellos datos bien definidos (conocemos su formato, longitud, cadenas de caracteres…). Un ejemplo son los extraídos de hojas de cálculo o bases de datos relacionales (SQL).
No estructurados
big_data_no_estructurados
No tienen un formato específico, se presentan tal y como fueron creados. Un par de ejemplos son un archivo PDF o un correo electrónico.
Semiestructurados
big_data_semiestructurados
Se trata de registros que tienen algunos atributos definidos y otros no. Los extractos basados en lenguajes HTML y XML son ejemplos de este tipo de datos.

working_in_a_window

Big Data: un Internet para cada usuario

Conocer al cliente gracias a analizar un ingente volumen de datos, de gran variedad y a gran velocidad.

¿Y de dónde provienen esos datos?

  • Webs y Social Media: la información generada al navegar por una web, cuando enviamos mensajes por WhatsApp, posteamos en Facebook, publicamos información en un blog…
  • Los generados por las personas: pueden ser mensajes de voz grabados en un call center, emails, estudios médicos…
  • Grandes transacciones de datos: como las realizadas en los bancos, reclamaciones, recibos, datos de facturación…
  • Machine to Machine: las que relacionan los datos recogidos por distintos dispositivos o sensores que registran la temperatura, la presión, la salinidad…
  • Biométrica: aportados por lectores de reconocimiento facial, lectores de cadenas de ADN, monitores de actividad y ritmo cardiaco…

Los conceptos más importantes de Big Data

La mayor parte de expertos habla de tres importantes conceptos, las tres ‘V’: volumen, velocidad y variedad. Otras tendencias añaden otras cuatro ‘V’ a esta clasificación: visualización, veracidad, variabilidad y valor (como propuso en 2013 Mark van Rijmenam).

Volumen

El universo digital sigue creciendo. Mucha de esa información puede parecer ahora irrelevante, pero tal vez en el futuro resulte de utilidad. En los dos últimos años se han generado el 90% del total de datos creados a nivel histórico y se espera que en la próxima década crezca 44 veces más. La revolución Internet-Móvil, el eCommerce, el Social Media… generan un torrente de información continuo.

Velocidad

Se refiere a la velocidad a la que se generan los datos, cada vez más acelerada, así como a la de su procesamiento, almacenaje y análisis por las bases de datos.

Veracidad

Aunque hay un acuerdo generalizado del valor potencial de Big Data, estos datos no sirven para nada si no son los correctos.

Variedad

Existen tres tipos de datos: estructurados, no estructurados y semiestructurados. El 90% del total pertenece al grupo de no estructurados.

Variabilidad

Se refiere a los datos cuyo significado está cambiando constantemente.

Visualización

Una vez procesados los datos, hace falta presentarlos de manera visible y accesible. Este es uno de los grandes retos de Big Data.

Valor

Es la finalidad real, la extracción del valor de toda esa información almacenada. El valor potencial es enorme.