Comparativa de modelos de Machine Learning para cross-selling en el entorno empresarial

Bookmark (0)
Please login to bookmark Close

La optimización de las campañas de venta cruzada es prioritaria para incrementar el retorno comercial y reducir costes operativos en una operadora de telecomunicaciones. MasOrange, con un histórico extenso de transacciones y métricas de uso, plantea sustituir el marketing masivo por acciones dirigidas sustentadas en análisis de datos.
El proyecto parte de la construcción de un conjunto de datos limpio y reproducible: imputación de valores ausentes, escalado robusto para las variables numéricas, codificación para las categóricas y reducción de dimensionalidad mediante correlación y selección recursiva de características. Sobre esta base se entrenaron y validaron varios algoritmos de aprendizaje automático mediante validación cruzada estratificada y optimización de hiperparámetros. Las métricas consideradas combinan indicadores técnicos (AUC-ROC, F1, Balanced Accuracy) con métricas de negocio, destacando el uplift acumulado en los primeros deciles de propensión a la compra.
Los resultados demuestran que un enfoque basado en datos permite focalizar las campañas en el tercio superior de la cartera, duplicando la tasa de conversión respecto a la selección aleatoria y reduciendo interacciones comerciales innecesarias. La interpretabilidad, aspecto de vital importancia para las áreas de negocio que necesitan entender y respaldar cada acción comercial, se garantiza mediante valores SHAP y análisis de importancia global y local, que clarifican la contribución de cada variable a la propensión de compra cruzada.
Abstract:
The optimization of cross-selling campaigns is a priority to increase commercial return and reduce operating costs in a telecommunications operator. MasOrange, with an extensive history of transactions and usage metrics, proposes to replace mass marketing with targeted actions based on data analysis.
The project starts from the construction of a clean and reproducible dataset: imputation of missing values, robust scaling for numerical variables, coding for categorical variables and dimensionality reduction through correlation and recursive feature selection. On this basis, several machine learning algorithms were trained and validated by stratified cross-validation and hyperparameter optimization. The metrics considered combine technical indicators (AUC-ROC, F1, Balanced Accuracy) with business metrics, highlighting the cumulative uplift in the first deciles of propensity to purchase.
The results show that a data-driven approach allows targeting campaigns in the top third of the portfolio, doubling the conversion rate compared to random selection and reducing unnecessary commercial interactions. Interpretability, of vital importance to business areas that need to understand and support each commercial action, is ensured through SHAP values and global and local importance analysis, which clarifies the contribution of each variable to cross-purchase propensity.

​La optimización de las campañas de venta cruzada es prioritaria para incrementar el retorno comercial y reducir costes operativos en una operadora de telecomunicaciones. MasOrange, con un histórico extenso de transacciones y métricas de uso, plantea sustituir el marketing masivo por acciones dirigidas sustentadas en análisis de datos.
El proyecto parte de la construcción de un conjunto de datos limpio y reproducible: imputación de valores ausentes, escalado robusto para las variables numéricas, codificación para las categóricas y reducción de dimensionalidad mediante correlación y selección recursiva de características. Sobre esta base se entrenaron y validaron varios algoritmos de aprendizaje automático mediante validación cruzada estratificada y optimización de hiperparámetros. Las métricas consideradas combinan indicadores técnicos (AUC-ROC, F1, Balanced Accuracy) con métricas de negocio, destacando el uplift acumulado en los primeros deciles de propensión a la compra.
Los resultados demuestran que un enfoque basado en datos permite focalizar las campañas en el tercio superior de la cartera, duplicando la tasa de conversión respecto a la selección aleatoria y reduciendo interacciones comerciales innecesarias. La interpretabilidad, aspecto de vital importancia para las áreas de negocio que necesitan entender y respaldar cada acción comercial, se garantiza mediante valores SHAP y análisis de importancia global y local, que clarifican la contribución de cada variable a la propensión de compra cruzada.
Abstract:
The optimization of cross-selling campaigns is a priority to increase commercial return and reduce operating costs in a telecommunications operator. MasOrange, with an extensive history of transactions and usage metrics, proposes to replace mass marketing with targeted actions based on data analysis.
The project starts from the construction of a clean and reproducible dataset: imputation of missing values, robust scaling for numerical variables, coding for categorical variables and dimensionality reduction through correlation and recursive feature selection. On this basis, several machine learning algorithms were trained and validated by stratified cross-validation and hyperparameter optimization. The metrics considered combine technical indicators (AUC-ROC, F1, Balanced Accuracy) with business metrics, highlighting the cumulative uplift in the first deciles of propensity to purchase.
The results show that a data-driven approach allows targeting campaigns in the top third of the portfolio, doubling the conversion rate compared to random selection and reducing unnecessary commercial interactions. Interpretability, of vital importance to business areas that need to understand and support each commercial action, is ensured through SHAP values and global and local importance analysis, which clarifies the contribution of each variable to cross-purchase propensity. Read More