概述
我们的目标是预测购买事件的发生,在这样的业务背景下,我们先关注一下CTR指数(操作购买转化率),即用户购买商品与需要操作的次数的平均比率。通过pandas统计
value_counts()
统计behavior_type
数据列可得:CTR = 购买操作样本数 / 样本总数 = 232579 / 23291027 = 0.009986 ≈ 1%
即用户平均下来大约要进行100次操作(各种商品的点击查看、加购物车等行为),才会生成一次购买决定。
# -*- coding: UTF-8 -*-
import os
import sys
import timeit
import pandas as pd
################################
# calculation of CTR
################################
count_all = 0 #操作样本总数,包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4
count_4 = 0 # 购买操作 = 4
for df in pd.read_csv(open("../fresh_comp_offline/tianchi_fresh_comp_train_user.csv", 'r'),chunksize = 100000):
try:
count_user = df['behavior_type'].value_counts()
count_all += count_user[1]+count_user[2]+count_user[3]+count_user[4]
count_4 += count_user[4]
except StopIteration:
print("Iteration is stopped.")
break
# CTR
ctr = count_4 / count_all
print(ctr)
最后
以上就是老迟到高山为你收集整理的阿里移动推荐算法大赛——点击购买转化率的全部内容,希望文章能够帮你解决阿里移动推荐算法大赛——点击购买转化率所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复