En esta oportunidad quería comentarles algunos puntos sobre la minería de datos, y sobre todo trasmitirles que es una herramienta que no está fuera su alcance.
En muchas ocasiones en nuestras actividades y en nuestra vida cotidiana, hay conceptos que nos generan la sensación de ser muy complejos, y que por consiguiente no aplican a nuestra compañía.
Lo que busco en estas líneas es tratar de acercar conceptos, no técnicos, y que finalmente se animen a probar esta herramienta, que muy probablemente ya tengan disponible en sus organizaciones.

¿Qué es minería de datos o data mining? Básicamente, son un conjunto de técnicas y tecnologías para explorar un conjunto de datos y encontrar patrones dentro de los mismos. Estos patrones pueden encontrarse utilizando estadísticas o algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

Si bien esto es muy complejo, hoy en día, Microsoft en su motor de base de datos SQL Server, ya tiene incluidas estas herramientas, y seguramente en tu organización, ya existe este motor, por consiguiente, ya tenemos licenciada la herramienta.
Ahora bien, para terminar de despertar tu interés sobre el tema, y adelantándome al proceso que deberíamos seguir, enumero algunos escenarios que se pueden explorar con la minería de datos:
Escenarios:
  • De Pronóstico: cálculo de las ventas.
  • De Riesgo y probabilidad: elección de los mejores clientes para la distribución de correo directo, determinación del punto de equilibrio probable para los escenarios de riesgo, y asignación de probabilidades a diagnósticos y otros resultados.

  • De Recomendaciones: determinación de los productos que se pueden vender juntos y generación de recomendaciones.

  • De Búsqueda de secuencias: análisis de los artículos que los clientes han introducido en el carrito de la compra y predicción de posibles eventos.

  • De Agrupación: distribución de clientes o eventos en grupos de elementos relacionados, y análisis y predicción de afinidades.

Ahora bien, ya viste que el resultado aplica en casi todos los casos a preguntas frecuentes de las empresas. Para llegar a un buen modelo, te recomiendo seguir estos pasos:
Primero, definir el problema, preparar los datos, explorar los datos, crear el modelo, explorar y validar, y finalmente implementar.
En este link que te dejo vas a encontrar un tutorial pasa a paso que explica cómo implementar algunos de los ejemplos que se detallaron más arriba. Es importante destacar, que cualquier modelo se puede validar, si uno toma un subconjunto de datos históricos como por ejemplo: ventas hasta el año 2019. Uno podría aplicar el resultado sobre los datos del 2020 y de esta forma validar el modelo para asegurarnos que los resultados se ajustan por lo menos a esos datos pasados y de esta forma tener más certeza en su aplicación hacia el futuro.
Comparto un tutorial muy completo, con el paso a paso y ejemplos para entender más profundamente el tema y poder llevarlo a la práctica.

Espero que puedas utilizar la herramienta, y en estos tiempos difíciles de pandemia, innovar en los procesos y aprovechar al máximo los recursos y la eficacia y eficiencia que estos pueden aportarte.

Fuente: Por Sebastián Russinyol, Director de Producto Softland Argentina