我们的目标是预测购买事件的发生,在这样的业务背景下,我们先关注一下CTR指数(操作购买转化率),即用户购买商品与需要操作的次数的平均比率。通过pandas统计
value_counts()
统计behavior_type
数据列可得:CTR = 购买操作样本数 / 样本总数 = 232579 / 23291027 = 0.009986 ≈ 1%
即用户平均下来大约要进行100次操作(各种商品的点击查看、加购物车等行为),才会生成一次购买决定。
复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23# -*- coding: UTF-8 -*- import os import sys import timeit import pandas as pd ################################ # calculation of CTR ################################ count_all = 0 #操作样本总数,包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4 count_4 = 0 # 购买操作 = 4 for df in pd.read_csv(open("../fresh_comp_offline/tianchi_fresh_comp_train_user.csv", 'r'),chunksize = 100000): try: count_user = df['behavior_type'].value_counts() count_all += count_user[1]+count_user[2]+count_user[3]+count_user[4] count_4 += count_user[4] except StopIteration: print("Iteration is stopped.") break # CTR ctr = count_4 / count_all print(ctr)
最后
以上就是老迟到高山最近收集整理的关于阿里移动推荐算法大赛——点击购买转化率的全部内容,更多相关阿里移动推荐算法大赛——点击购买转化率内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复