Big Data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.
Aunque el tamaño utilizado para determinar si un conjunto de datos determinado se considera Big Data no está firmemente definido y sigue cambiando con el tiempo, la mayoría de los analistas y profesionales actualmente se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes.
La naturaleza compleja del Big Data se debe principalmente a la naturaleza no estructurada de gran parte de los datos generados por las tecnologías modernas, como los web logs, la identificación por radiofrecuencia (RFID), los sensores incorporados en dispositivos, la maquinaria, los vehículos, las búsquedas en Internet, las redes sociales como Facebook, computadoras portátiles, teléfonos inteligentes y otros teléfonos móviles, dispositivos GPS y registros de centros de llamadas.
Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían. En otras palabras, proporciona un punto de referencia. Con una cantidad tan grande de información, los datos pueden ser moldeados o probados de cualquier manera que la empresa considere adecuada. Al hacerlo, las organizaciones son capaces de identificar los problemas de una forma más comprensible.
La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los datos permiten que las empresas se muevan mucho más rápidamente, sin problemas y de manera eficiente. También les permite eliminar las áreas problemáticas antes de que los problemas acaben con sus beneficios o su reputación.
El análisis de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para identificar nuevas oportunidades. Eso, a su vez, conduce a movimientos de negocios más inteligentes, operaciones más eficientes, mayores ganancias y clientes más felices. Las empresas con más éxito con Big Data consiguen valor de las siguientes formas:
- Reducción de coste: Las grandes tecnologías de datos, como Hadoop y el análisis basado en la nube, aportan importantes ventajas en términos de costes cuando se trata de almacenar grandes cantidades de datos, además de identificar maneras más eficientes de hacer negocios.
- Más rápido, mejor toma de decisiones: Con la velocidad de Hadoop y la analítica en memoria, combinada con la capacidad de analizar nuevas fuentes de datos, las empresas pueden analizar la información inmediatamente y tomar decisiones basadas en lo que han aprendido.
- Nuevos productos y servicios: Con la capacidad de medir las necesidades de los clientes y la satisfacción a través de análisis viene el poder de dar a los clientes lo que quieren. Con la analítica de Big Data, más empresas están creando nuevos productos para satisfacer las necesidades de los clientes.
El crecimiento exponencial del Mundo Digital es uno de los principales motores de la relevancia de las ciencias Data Mining y Big Data, pero esta reseña tan significativa, no quiere decir que sean lo mismo.
Aunque, ambas ciencias estén relacionadas con el uso de grandes cantidades de datos, cada una se utiliza para fines diferentes.
Big Data el “activo” y Data Mining es el "manejador"
Por ejemplo, una compañía como Amazon está tratando de comprender mejor a sus clientes para que puedan comercializar y recomendar productos que creen que tu podrías estar listo para comprar. Por lo tanto, están viendo cosas como: historial de compras, historial de navegación, historial de carritos de compras, datos demográficos de clientes, geografía, respuestas pasadas a sus correos electrónicos de marketing y promociones, uso de códigos de cupones, etc. Eso es una gran cantidad de datos.
Ahora digamos que eres Walmart. Supongamos que tiene toda la información sobre las ventas de chicles en todo el mundo. Haz malabares con esto y encontrarás que, por razones desconocidas, los martes son realmente bajos para las ventas de chicles. Así que, literalmente, mueves un par de interruptores, y ahora, todos los martes, en todas las tiendas del país, los chicles están de promoción.
Se necesitan toneladas y toneladas de datos antes de que estos patrones se vuelvan evidentes y ahora es muy fácil (desde un punto de vista técnico) recolectar y cultivar esta cantidad de material, de ahí la tendencia del Big Data. En el pasado reciente habría necesitado un montón de hardware muy caro y personas inteligentes para ejecutarlo, por lo que solo estaría disponible para los gigantes como Walmart.
Su tendencia es reciente porque es mucho más accesible con los avances en tecnología barata.
Es buscar patrones en grandes cantidades de datos.
Un caso conocido de hace un tiempo fue este: los minoristas tienen una enorme base de datos de lo que compraron los clientes. Un analista tuvo esta idea: se puede ver cuándo una mujer acaba de tener un bebé porque, por ejemplo, ha comenzado a comprar pañales. Pero, ¿hay algo en los patrones de compra de una mujer que cambie antes de dar a luz? Entonces, por ejemplo, podría enviarle anuncios o muestras gratuitas y hacer que sea más probable que use su producto.
Resulta que sí, puedes hacer eso. Observa a las mujeres que tu conoces que acaban de dar a luz, luego verifica si la historia de sus últimos 9 meses tiene algo que las distingue de la mujer promedio. Y encontrarás cosas como un patrón de detención para comprar alcohol, comprar vitaminas, etc. Con suficientes datos, puede ajustar esto mucho, hasta el punto de descubrir mujeres embarazadas incluso antes de que se lo digan a nadie.