El pasado fin de semana en Ecommaster Presencial tuvieron lugar dos clases muy interesantes sobre el Big Data, en las que Álex Rabasa introdujo a los alumnos al Big Data y se vieron unas cuantas aplicaciones prácticas muy interesantes aplicadas al ecommerce.
Índice ¿Qué vamos a ver?
¿Qué es el Big Data?
Definir el Big Data en una sola oración puede ser una tarea ardua complicada, además de que el resultado final no sería del todo satisfactorio. La traducción del Big Data podría ser “Grandes Datos” o “Muchos datos”. En términos muy generales esa es la esencia del Big Data: grandes cantidades de datos que no pueden ser analizados, medidos, recogidos, representados, etc., con las técnicas convencionales de tratamiento de datos.
Según Álex Rabasa, el Big Data debe ser entendido (que no definido), como un proceso integral de grandes volúmenes de datos, con el objeto de poder extraerles información valiosa. Ver más en El Sofá Ecommaster con Alex Rabasa.
Las 5 V del Big Data
No obstante, el Big Data tiene que ser seguir cinco criterios (llamadas las 5 Vs del Big Data) para que cualquier problema se pueda clasificar como un problema de Big Data:
Volumen: la cantidad de datos con la que se trabaja debe ser muy elevado, tanto que no se puedan tratar con herramientas convencionales
Velocidad: la velocidad a la que cambian los datos debe también ser alta
Variedad: la cantidad de datos diferentes que se intentan controlar y monitorizar debe ser de diferente tipo (con diferentes variables)
Veracidad: los datos deben de ser verdaderos
Valor: se tiene que acabar dándole un sentido a los datos (principalmente en el caso de los ecommerce, sacarle benficio económico)
El proceso integral del Big Data
El Big Data no es un único proceso de análisis y gestión de los datos, sino una agrupación de operaciones, cada una de ellas muy compleja:
Es importante destacar que la mayoría de las empresas que tratan con gran número de datos no realizan todo el proceso Big Data, sino que se centran en dos o tres de éstos procesos (por ejemplo, se puede especializar en el análisis de datos y en la representación, o solamente en la recopilación).
Cabe decir que muchas veces los problemas Big Data no vienen por una gran cantidad de datos en vertical que recoger (como por ejemplo los datos de los clientes que compren un tipo de producto), sino por la existencia de muchas variables que afectan a la compra de solamente tres o cuatro productos (integración), como el tiempo, la época del año, la hora, etc.
Tipos de análisis Big Data
Existen muchos tipos de análisis a la hora de realizar Big Data. En la lista siguiente, están los que se vieron en clase (aunque algunos no se explicaron en profundidad debido a su gran complejidad y a su escaso uso habitual):
Te puede interesar este post >> Big Data: No te puedes imaginar lo que puedes hacer con un csv.
Descripción (pasado): estos tipos de análisis se utilizan para descubrir que han ocurrido con los datos recogidos a lo largo del tiempo.
- Agrupamiento: agrupar a los clientes dependiendo de algunas características escogidas de éstos.
- Dependiendo de si los clientes se agrupan en grupos más o menos grandes y relevantes se pueden sacar productos o servicios que resulten rentables.
- Factorizaciones
- Reglas de Asociación: hechos que ocurren simultáneamente en una base de datos. Ejemplo: existen estudios que demuestran que la compra de cerveza aumenta al mismo tiempo que la de pañales.
- Detección de valores anómalos. es muy importante conocer también estos hechos, ya que pueden permitir realizar cambios para mejorar el sistema o los procesos. Ejemplo: nadie que está más de 6 minutos en la página del ecommerce acaba comprando. Habrá que hacer algo para ver porque esto ocurre y ver si se puede mejorar.
Predicción (futuro): estos análisis sirven para interpretar los datos y realizar predicciones (valga la redundancia) con esos mismos datos.
- Clasificación/Reglas Clasificación: si la variable que se busca predecir no es una variable numérica. Algunas de estas variables pueden ser, por ejemplo, reservas aceptadas o canceladas, paciente sano o enfermo, país de origen; es decir, variables que no permiten una variación en sí mismas: o es una cosa u otra. A partir de localizar esas variables, se empieza viendo una a una en un árbol de variables, hasta llegar a una predicción con altas posibilidades de cumplirse.
- Categorización
- Regresión: si la variable objetivo es numérica, como la edad, la cantidad de tiempo que se está en una página web, el gasto medio de un usuario en un ecommerce, etc.
Perspectiva dentro de 3 años
El Big Data avanza a pasos agigantados. En primer lugar, seguramente aparecerán herramientas de análisis potentes y precisas con salidas gráficas interactivas y con generación automática de informes. Ya en la actualidad Google y Amazon están apostando fuerte con el Big Data, pero es Phyton la herramienta que está tomando la delantera, ya que por sí misma permite la recolección y almacenamiento de los datos, la computación y el análisis de estos y por último permite la visualización de los datos.
En segundo lugar, aparecerán más herramientas que permitan facilidades de integración con Data Streaming (automatización de gestión de datos) y Open Data (que las aplicaciones que se utilicen para el análisis de datos se puedan conectar a otras plataformas para obtenerlos, como por ejemplo Twitter o Facebook).
Algunas aplicaciones del Big Data a los ecommerce
El Big Data puede ayudar a cualquier ecommerce de diversas maneras (siempre que se tengan la suficiente cantidad de datos). Algunas de estas aplicaciones pueden ser:
- Analizar el comportamiento de compra del cliente a partir de los productos que compra y en qué momento
- Descubrir patrones de compra de los usuarios
- Saber por qué los usuarios abandonan la página o en qué momento abandonan el proceso de compra
- Descubrir el tiempo que pasan los usuarios en cada página
- Conocer cuáles son los productos/servicios que más compran cada uno de los tipos de clientes que se tenga, utilizando para agruparlos características comunes o cercanas
- Etc.
Prácticamente se puede aplicar el Big Data con cualquier finalidad que se pueda ocurrir, pero siempre y cuando los datos con los que se dispongan cumplan las 5 V. Así que no lo dudéis no perdáis la perspectiva y pensad en qué puede ayudaros el Big Data en vuestro ecommerce.
¡Hasta el próximo post!