我是
靠谱客 的博主
迅速百褶裙 ,最近开发中收集的这篇文章主要介绍
用户行为路径漏斗一、分析脑图二、数据预处理三、计算指标四、漏斗图 ,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
一、分析脑图
二、数据预处理
import pandas as pd
import numpy as np
import sqlalchemy
import warnings
warnings. filterwarnings( 'ignore' )
engine= sqlalchemy. create_engine( 'mysql+pymysql://。。略。。。' )
sql_flow= 'select * from plat_flow'
sql_check= 'select * from loans_check'
dt_flow= pd. read_sql( sql= sql_flow, con= engine)
dt_check= pd. read_sql( sql= sql_check, con= engine)
dt_flow. rename( columns= {
"date" : "日期" ,
"PV" : "PV" ,
"UV" : "UV" ,
"regist_cnt" : "注册数" ,
"regist_rate" : "访客注册率" ,
"active_cnt" : "激活数" ,
"active_rate" : "激活访问率"
} , inplace= True )
dt_flow. head( )
日期 PV UV 注册数 访客注册率 激活数 注册激活率 0 2020-05-01 7121 1972 375 0.190162 341 0.909333 1 2020-05-02 6340 1910 210 0.109948 183 0.871429 2 2020-05-03 6473 1834 183 0.099782 174 0.950820 3 2020-05-04 8544 3195 415 0.129890 349 0.840964 4 2020-05-05 3749 1106 177 0.160036 168 0.949153
dt_check. rename( columns= {
"ID" : "用户ID" ,
"date" : "申请日期" ,
"new_cus" : "是否新用户(1为是,0为否)" ,
"lending" : "是否放贷"
} , inplace= True )
dt_check. head( )
用户ID 申请日期 是否新用户(1为是,0为否) 是否放贷 0 1 2020-05-01 1 0 1 2 2020-05-01 1 1 2 3 2020-05-01 1 1 3 4 2020-05-01 1 0 4 5 2020-05-01 1 0
三、计算指标
PV UV 注册数 激活数 新用户申请数 新用户放贷数
new= dt_check[ dt_check[ '是否新用户(1为是,0为否)' ] == 1 ]
new. head( )
用户ID 申请日期 是否新用户(1为是,0为否) 是否放贷 0 1 2020-05-01 1 0 1 2 2020-05-01 1 1 2 3 2020-05-01 1 1 3 4 2020-05-01 1 0 4 5 2020-05-01 1 0
new_index1= pd. pivot_table(
data= new,
index= '申请日期' ,
values= [ '是否放贷' ] ,
aggfunc= [ np. sum , 'count' ]
)
new_index1. columns= [ '新用户放贷数' , '新用户申请数' ]
new_index1. reset_index( ) . head( )
申请日期 新用户放贷数 新用户申请数 0 2020-05-01 56 228 1 2020-05-02 26 126 2 2020-05-03 12 124 3 2020-05-04 43 234 4 2020-05-05 22 116
new_index1. shape
(30, 2)
info= pd. merge( new_index1, dt_flow, how= 'inner' , left_on= '申请日期' , right_on= '日期' )
info. head( )
新用户放贷数 新用户申请数 日期 PV UV 注册数 访客注册率 激活数 注册激活率 0 56 228 2020-05-01 7121 1972 375 0.190162 341 0.909333 1 26 126 2020-05-02 6340 1910 210 0.109948 183 0.871429 2 12 124 2020-05-03 6473 1834 183 0.099782 174 0.950820 3 43 234 2020-05-04 8544 3195 415 0.129890 349 0.840964 4 22 116 2020-05-05 3749 1106 177 0.160036 168 0.949153
info_u= info[ [ "PV" , "UV" , "注册数" , "激活数" , "新用户申请数" , "新用户放贷数" ] ]
info_u. head( )
PV UV 注册数 激活数 新用户申请数 新用户放贷数 0 7121 1972 375 341 228 56 1 6340 1910 210 183 126 26 2 6473 1834 183 174 124 12 3 8544 3195 415 349 234 43 4 3749 1106 177 168 116 22
info_sum= pd. DataFrame( info_u. sum ( ) ) . reset_index( )
info_sum. columns= [ '指标' , '汇总' ]
info_sum
指标 汇总 0 PV 130380 1 UV 37689 2 注册数 5151 3 激活数 4535 4 新用户申请数 3113 5 新用户放贷数 594
四、漏斗图
from plotly import graph_objects as graph
trace = graph. Funnel(
y = info_sum[ "指标" ] ,
x = info_sum[ "汇总" ] ,
textinfo = "value+percent initial" ,
marker= dict ( color= [ "deepskyblue" , "lightsalmon" , "tan" , "teal" , "silver" , "yellow" ] ) ,
)
data = [ trace]
fig = graph. Figure( data)
fig. show( )
最后
以上就是迅速百褶裙 为你收集整理的用户行为路径漏斗一、分析脑图二、数据预处理三、计算指标四、漏斗图 的全部内容,希望文章能够帮你解决用户行为路径漏斗一、分析脑图二、数据预处理三、计算指标四、漏斗图 所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站 推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复