当前位置:首页 > 运营 > 正文

使用Databricks进行营销效果归因分析的应用实践

本文介绍如何使用Databricks进行广告效果归因分析,完成一站式的部署机器学习,包括数据ETL、数据校验、模型训练/评测/应用等全流程。

内容要点:

在当下的信息化时代,用户每天都会收到媒体投放的广告信息,如何做到精准广告投放,可以通过分析广告产出结果来合理分配广告渠道。归因分析(Attribution Analysis):通过归因分析模型,分析不同渠道的店铺客流量数据,量化评估影响客户消费的活动因子。面对多且杂的数据,Databricks 如何通过一站式数据分析平台和 Delta Lake 架构简化执行过程。使用Databricks进行营销效果归因分析的应用实践  第1张

一、数据ETL使用Databricks进行营销效果归因分析的应用实践  第2张

完成ETL的相关工作之后,进入机器学习模块,将不同来源的人流量数据,统一到Data Lake架构里。通过数据清洗,得到需要的数据。然后,对数据进行校验,确定是否满足机器学习的模型训练需求。

使用Databricks进行营销效果归因分析的应用实践  第3张

通过Python绘图,可以看到数据的分布情况,比如广告投放的连续情况,以及社交媒体网站的浏览情况。

使用Databricks进行营销效果归因分析的应用实践  第4张

完成上述操作后,对数据集的整体分布进行校验,得出feature分布符合预期。综上所述,该数据集满足Xgboost学习训练的要求。

使用Databricks进行营销效果归因分析的应用实践  第5张

接下来,使用Xgboost机器学习框架进行训练。通过调整参数,选择一个相对损失较小的训练模型,对该模型进行实际预测,从上图可以看到,红色线是预测结果,蓝色线是真实的客户流量。

使用Databricks进行营销效果归因分析的应用实践  第6张

通过该模型进行实际预测,得出社交媒体对客流量的影响,占总体的50.7%,网页浏览对客流量的影响,占总体的39%。故得出,不同渠道的广告对客流的影响,真实有效。

使用Databricks进行营销效果归因分析的应用实践  第7张

综上所述,利用SHAP模型整合各媒介渠道客流的百分比,通过绘制图表,能够准确找到影响客流量最大的因子。社交媒体和home页面访问是推动客流量最有效的渠道,所以预算分配可以有的放失,从而提高整体销售或市场份额。

三、Demo演示

操作演示视频:https://developer.aliyun.com/live/249173

作者:冯加亮阿里云开源大数据平台技术工程师

原文链接:http://click.aliyun.com/m/1000346558/

本文为阿里云原创内容,未经允许不得转载。

取消
扫码支持 支付码