El big data hace referencia a un conjunto de datos de especial complejidad por su mayor variedad, su gran volumen y la velocidad de su obtención.
Últimamente, a estas tres características se están añadiendo dos más: la veracidad y el valor, asegurando que los datos son confiables y que se puede extraer beneficio de ellos. Los datos que pueden formar parte del big data incluyen la interacciones de los usuarios en una página web, las compras que hacen o la música que escuchan en internet, o la información recopilada por los sensores de teléfonos móviles o altavoces inteligentes.
Tal cantidad de datos producida constantemente ha generado ya entre treinta terabytes y varios petabytes (entre 30.000 millones y un billón de gigabytes) de información total, según algunas estimaciones; un volumen equivalente a entre treinta veces la serie Friends y más de 65.000 películas en alta definición. La especial complejidad y gran volumen del big data dificultan que pueda analizarse con las herramientas tradicionales, y que requiera de una tecnología analítica superior para analizar todos los datos. En este sentido, otro de los criterios usados para definir el big data es que los datos no puedan analizarse de manera convencional.
Las aplicaciones de los datos son muchas, pero la más destacada es conocer los gustos, inquietudes y estilos de vida de los usuarios, lo que permite a las empresas ajustar mejor el producto a sus clientes.
Características del Big Data (Las 5 V)
Volumen
Como ya hemos mencionado, no hay una determinada cantidad de datos a partir de la cual se consideren datos masivos. Sin embargo, podemos considerar que el volumen de datos que maneja esta técnica sería de muchos Terabytes.
Una mediana empresa puede utilizar un volumen de los datos que puede alcanzar cientos de Gigabytes. Esa información no se considera Big Data. De hecho, una empresa que guarde ese volumen de datos no utiliza la tecnología Big Data. Sí se usa, en cambio, por empresas muy grandes. Por ejemplo, de comercio electrónico o por entidades financieras que generan enormes cantidades de datos.
Velocidad
Los datos usados en Big Data se trabajan a mayor velocidad que los gestionados en bases de datos tradicionales. De esta forma, la inteligencia de datos se ocupa de datos que se generan en tiempo real, o incluso a velocidad superior de un dato por segundo.
Un ejemplo de ello son las transacciones que se realizan en la Bolsa de Nueva York en un día, donde las operaciones se ejecutan en menos de un segundo. Igualmente, Internet ha pasado a ser sin duda en el mayor motor de generación de contenidos. Y, por ello, en el gran generador de datos a gran velocidad.
Variedad
Si en alguna ocasión has trabajado con una base de datos sabrás que, en su mayoría, los datos que contiene son texto y números, a menudo relacionados entre sí en una base de datos relacional. En el caso del Big Data los datos son más variados, no se trabaja solo con textos y números.
Valor
Debido a la inmensa cantidad de datos que se debe procesar, se ha de tener especial cuidado en la elección de los datos que realmente son importantes para la empresa y sus futuras operaciones. Una buena definición de objetivos y estrategia previa al almacenamiento de datos ahorrará mucho tiempo de cómputo y facilitará la gestión a largo plazo.
Veracidad
Estos datos serán más veraces siempre y cuando el programa que los registre no esté comprometido. Partiendo de este supuesto, podemos confirmar que a mayor información, más fácil será que esta pueda ser constatada como información auténtica.
Si te interesa conocer más acerca de estos temas, te invitamos a revisar el curso experto en Servicios y Sistemas de Información Digital, el cual te permitirá alcanzar un transcendente manejo y administración de los sistemas de información, beneficiándose de las posibilidades generadoras de negocio y aplicándolas en la globalización de la empresa.
Comentarios