我是靠谱客的博主 迅速百褶裙,最近开发中收集的这篇文章主要介绍用户行为路径漏斗一、分析脑图二、数据预处理三、计算指标四、漏斗图,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

一、分析脑图

脑图

二、数据预处理

import pandas as pd
import numpy as np
import sqlalchemy

import warnings
warnings.filterwarnings('ignore')
#从数据库读取数据:plat_flow平台流量表 loans_check:贷款审核表
engine=sqlalchemy.create_engine('mysql+pymysql://。。略。。。')
sql_flow='select * from plat_flow'
sql_check='select * from loans_check'
dt_flow=pd.read_sql(sql=sql_flow,con=engine)
dt_check=pd.read_sql(sql=sql_check,con=engine)

#改名1
dt_flow.rename(columns={
    "date":"日期",
    "PV":"PV",
    "UV":"UV",
    "regist_cnt":"注册数",
    "regist_rate":"访客注册率",
    "active_cnt":"激活数",
    "active_rate":"激活访问率"
},inplace=True)
dt_flow.head()
日期PVUV注册数访客注册率激活数注册激活率
02020-05-01712119723750.1901623410.909333
12020-05-02634019102100.1099481830.871429
22020-05-03647318341830.0997821740.950820
32020-05-04854431954150.1298903490.840964
42020-05-05374911061770.1600361680.949153
#改名2
dt_check.rename(columns={
    "ID":"用户ID",
    "date":"申请日期",
    "new_cus":"是否新用户(1为是,0为否)",
    "lending": "是否放贷"
},inplace=True)
dt_check.head()
用户ID申请日期是否新用户(1为是,0为否)是否放贷
012020-05-0110
122020-05-0111
232020-05-0111
342020-05-0110
452020-05-0110

三、计算指标

PV
UV
​注册数
​激活数
新用户申请数
​新用户放贷数

new=dt_check[dt_check['是否新用户(1为是,0为否)']==1]
new.head()
用户ID申请日期是否新用户(1为是,0为否)是否放贷
012020-05-0110
122020-05-0111
232020-05-0111
342020-05-0110
452020-05-0110
new_index1=pd.pivot_table(
    data=new,
    index='申请日期',
    values=['是否放贷'],
    aggfunc=[np.sum,'count']
)
new_index1.columns=['新用户放贷数','新用户申请数']
new_index1.reset_index().head()
申请日期新用户放贷数新用户申请数
02020-05-0156228
12020-05-0226126
22020-05-0312124
32020-05-0443234
42020-05-0522116
new_index1.shape
(30, 2)
info=pd.merge(new_index1,dt_flow,how='inner',left_on='申请日期',right_on='日期')
info.head()
新用户放贷数新用户申请数日期PVUV注册数访客注册率激活数注册激活率
0562282020-05-01712119723750.1901623410.909333
1261262020-05-02634019102100.1099481830.871429
2121242020-05-03647318341830.0997821740.950820
3432342020-05-04854431954150.1298903490.840964
4221162020-05-05374911061770.1600361680.949153
info_u=info[["PV","UV","注册数","激活数","新用户申请数","新用户放贷数"]]
info_u.head()
PVUV注册数激活数新用户申请数新用户放贷数
07121197237534122856
16340191021018312626
26473183418317412412
38544319541534923443
43749110617716811622
info_sum=pd.DataFrame(info_u.sum()).reset_index()
info_sum.columns=['指标','汇总']
info_sum
指标汇总
0PV130380
1UV37689
2注册数5151
3激活数4535
4新用户申请数3113
5新用户放贷数594

四、漏斗图

from plotly import graph_objects as graph
trace = graph.Funnel(
    y = info_sum["指标"],
    x = info_sum["汇总"],
    textinfo = "value+percent initial",
    marker=dict(color=["deepskyblue", "lightsalmon", "tan", "teal", "silver", "yellow"]),
  
)
    
data =[trace]

fig = graph.Figure(data)

fig.show()

在这里插入图片描述

最后

以上就是迅速百褶裙为你收集整理的用户行为路径漏斗一、分析脑图二、数据预处理三、计算指标四、漏斗图的全部内容,希望文章能够帮你解决用户行为路径漏斗一、分析脑图二、数据预处理三、计算指标四、漏斗图所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(47)

评论列表共有 0 条评论

立即
投稿
返回
顶部