概述
交通大数据干货总结(1)
本文列举了交通领域的相关学者、会议、论文、数据集、书籍以及代码
以上资料均提供了超链接和简要说明
前言
当前,城市交通正面临着安全、堵塞、环境污染三大难题。随着云计算、物联网、移动互联网、大数据等新兴技术的发展,城市交通进入智能化阶段。而智能化实现需要利用各种技术获取有价值的数据资源,提供决策依据。交通大数据为交通决策与服务带来了新的解决思路和方法【1】。
相关学者(待完善)
(注:排名不分先后…)
一、北京交通大学的万怀宇教授
主页:http://faculty.bjtu.edu.cn/8793/
学者简介:北京交通大学,计算机与信息技术学院,副教授、博士生导师,现任计算机科学系副主任。主要研究方向为数据挖掘与信息抽取,具体研究兴趣包括时空数据挖掘、社交网络挖掘、文本信息抽取、知识图谱应用等。已在AAAI、ICDE、ECML PKDD、DASFAA等学术会议和TKDE、TITS、KBS、JCST等学术期刊上发表学术论文40余篇。
代表文献:
【1】Shengnan Guo, Youfang Lin, Ning Feng, Chao Song, Huaiyu Wan*. Attention Based Spatial-Temporal Graph Convolutional Networks for Traffic Flow Forecasting. The 33rd AAAI Conference on Artificial Intelligence (AAAI), 2019.
【2】Chao Song, Youfang Lin, Shengnan Guo, Huaiyu Wan*. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting. The 34th AAAI Conference on Artificial Intelligence (AAAI), 2020.
二、香港科技大学的Hai Yang教授
主页:http://ihome.ust.hk/~cehyang/
学者简介:杨海教授本科毕业于武汉大学,日本京都大学的博士。主要研究领域为交通网络建模、交通系统分析和交通经济学等。
代表文献:
【1】Ke, J., Qin, X., Yang, H., Zheng, Z., Zhu, Z., Ye, J., 2020. Predicting origin-destination ride-sourcing demand with a spatio-temporal encoder-decoder residual multi-graph convolutional network. Transportation Research Part C: Emerging Technologies (under review).
三 、 香港科技大学的Dr. Hong K. LO教授
主页:http://ihome.ust.hk/~cehklo/
学者简介:罗教授的主要研究领域为交通系统管理、ITS、DTA和动态交通控制等,为Journal of ITS的管理编辑、Transportmetrica的副主编。
代表文献:
【1】Li, L., Lo, H.K., Huang, W., Xiao, F. 2021. Mixed bus fleet location-routing-scheduling under range uncertainty. Transportation Research Part B, accepted.
【2】Zhang, SY, Lo, H.K. 2020. Metro Disruption Management: Contracting Substitute Bus Service under Uncertain System Recovery Time. Transportation Research Part C, 110, 98-122
原始数据总结
一、TaxiBJ,北京出租车数据集,郑宇,"BJ15_M32x32_T30_InOut.h5",原始数据shape=(5596,2,32,32),"2"代表出In/Out两种流量。
备注:数据应用在ST-ResNet(AAAI17,郑宇的经典,该领域的里程碑)中。(数据地址:链接:https://pan.baidu.com/s/1uLLiSRjWAKoOgBqeSR5CUg 提取码:g1n2 )
二、METR-LA,洛杉矶高速路数据集,"metr-la.h5",原始数据shape=(12,6850,207)——间隔5分钟,预测未来1小时(12,207,2)->(12,207,1)
备注:数据应用在DCRNN文章中。(数据地址:链接:https://pan.baidu.com/s/1RIukWVbXS-C6OgN4cajuNQ 提取码:43sd )
三、NYC-Taxi,纽约出租车数据集,"volume.train.npz",原始数据shape=(1920,10,20,2),"10,20"代表网格化地图形状,同郑宇的"32,32"
备注:数据应用在STDN文章中。(数据地址:链接:https://pan.baidu.com/s/1T5TQeVQFnKi5KAeCT9NuKQ 提取码:u2yc )
四、PeMS系列数据集:PeMS03/04/07/08/PeMS-bay/PeMS-M,加利福尼亚高速数据,"data.npz",原始数据shape=(10195,307,3)——间隔5分钟预测1小时(307,3,36)->(307,3,12)
备注:数据分别应用在ASTGCN/Graph wavenet/ST-GCN/SLCNN等文章中,"3"代表交通流量3种特征(flow,speed,occupancy)。(数据地址:链接:https://pan.baidu.com/s/1dwdYbtEXJ68k3zAf_Kw38g
提取码:2fih )
五、北京地铁数据集:2016年北京地铁进进出站客流量数据集,共276个站点,25天工作日,三种时间粒度划分 (10min、15min和30min。附北京同时间天气条件与空气质量数据集,
天气条件数据每半小时记录一次,空气 质量数据每一小时记录一次。(数据地址:链接:https://pan.baidu.com/s/1eVBUs0zxs5xYvFpnR13yUA 提取码:d399 )
备注:数据分别应用在ResLSTM/Conv-GCN等论文中。
六、MetroHZ,杭州地铁数据集,"raw_data.npy",原始数据shape=(2448,81,2)——间隔10分钟预测下一个时间片
备注:数据应用在ADST文章(T-ITS)中
七、BusJN,济南公交数据集,原始数据shape=(26496,11,81)
备注:数据应用在文章XXX(Ubicomp->T-ITS)中
八、其他数据集
1)2009.5月——北京出租车数据集(一个月);
2)2014.8月——成都出租车数据集(一个月);
备注:数据应用在牛老师的L-CNN文章(TVT 2018)中。
3)kaggle比赛纽约数据集(预测行程时间);
学术论文梳理
NIPS会议
2017,PredRNN 清华,利用自定义的 “时空LSTM” 单元,基于历史数据帧预测未来图片,数据集采用Moving Mnist(Mnist视频流也是高端...),也找到了作者Yunbo Wang的git分享。
CVPR会议
2017,Structural-RNN,Jain,将时空图转换成RNN混合体的一种通用的可扩展的方法。作者是用来做行为识别的。感觉是非常视觉的paper,膜拜一下就好...
AAAI会议
2017,ST-Net 郑宇;目前已经基本复现了微软亚研院郑宇在人群流量预测工作中使用的ST-ResNet残差网络。
2018,DMVST 宾夕法尼亚(姚骅修,滴滴实习生等);综合考虑时间、空间、语义三方面信息,预测出租车需求(笔记),其中数据来自2017年滴滴出行在广州的近两个月数据。作者提供了开源代码,这个团队后续在AAAI2019又发表了一篇"Revisting Spatial-Temporal similar",提出STDN网络(姚骅修,数据来自NYC纽约),工作也是相当多的。
2019,ASTGCN 北交(郭晟楠,林友芳,宋超等):学习PPT(已经联系作者找到原文),采用加利福尼亚的两段高速数据,目前为预测1小时后的交通流量,使用mxnet搭建神经网络(添加了注意力机制的STGCN,源码)。使用三个组件对时间序列上三个不同长短的周期模式进行建模。2019.2.15在北交网站发表了动态。
2019,STMGCN(李亚光,滴滴):空间上引入Multi-Graph多图,针对地图区域间非欧关系,本文提出更加详细的三种关系图(距离临近、功能相似、道路相通),对多图进行图卷积并聚合。时间上Contextual Gated RNN,实际为SENet思想。针对训练样本序列,利用SENet的Squeeze和Excitation操作,对每个时刻图进行全局池化,和图自身卷积池化的结果相加,再利用Excitation达到不同通道权重化的效果。
ICLR会议
2018,DCRNN 南加大(李亚光,虞琦等人):作者提供了github链接,本文借鉴ICLR2017的一篇reject文章(RNN对图结构数据的推广)的思想,将该模型用于交通预测。本文在会议官网上收到了很好的Review评价。首先构建图,这个图可以加权也可以不加权,可以有向也可以无向,本文使用的是加权双向有向图。交通预测挑战在于:空间路网复杂,时间依赖非线性。本文干的事概括来讲是:给定历史车速与路网数据,预测未来的车速。使用基于图bidirectional random walks捕获空间依赖,使用基于序列的带预定采样的编解码机制捕获时间依赖。上来创新点扣了个大帽子:“交通空间结构非欧,有向”。本文在洛杉矶构建了带权有向图,图的顶点是sensors(207个),边是权重,通过路网上 sensor 之间的距离得到。时间间隔5分钟,预测未来1小时的速度,所以输入数据中一个样本是(12,207,2),输出为(12,207,1)。
2018,GAT 剑桥大学(还有Bengio大神),图注意力,徐博在计算所提到过。
IJCAI会议
2018 STGCN,提出了时空图卷积的网络架构,有一个中文博客辅助说明,作者通过构建时空卷积块预测交通图中不同路网节点的速度v,且利用的是加州和北京两个数据集进行验证。使用局部图卷积(基于拉普拉斯图的一阶近似),无向图。
2018 GeoMan,还是郑宇,张均波那些人的,预测传感器值的回归问题,同样有中文博客的说明。使用水质数据和空气质量两个数据集进行验证。
Sensors
2017 Deep CNN 北航+北交,用CNN模拟空间相关性,但空间结构在欧式空间 (例如:2D图像),理解为普通网格地图策略。
IJCNN会议
2018 Deep Transport 百度,通过明确收集各道路上下游的邻域道路, 并分别对这些邻域进行传统卷积, 对空间依赖关系进行建模。
交通领域期刊
相关公众号及优质博主
【1】中科院计算所徐冰冰 https://github.com/Eilene/spatio-temporal-paper-list
【2】交通大学博士研究生张金雷 https://blog.csdn.net/zuiyishihefang 公众号:当交通遇上机器学习
相关资料下载
交通规划类书籍:
【1】城市规划原理(第四版) 吴志强 李德华 链接:https://pan.baidu.com/s/1KyBOIXrXrNUewcDbpMMi5Q 提取码:uz2a
【2】现代交通规划学 刘灿齐 人民交通出版社 链接:https://pan.baidu.com/s/1uUVhblqR6OuooIxlkef_fQ 提取码:n2li
【3】图卷积在交通预测中的应用-20190911(预测文章总结) 链接:https://pan.baidu.com/s/1Nzd-oP8x5c0lSlz9c9Ek-Q 提取码:fcbf
【4】深度学习与交通大数据实战V2.0版 链接:https://pan.baidu.com/s/14ZKGazCWKIYzb5-wYLx5HQ 提取码:spqz
注:3、4资料均来自于公众号《当交通遇上机器学习》
参考:
【1】张昕, 曾鹏, 张瑞, & 张帆. (2016). 交通大数据的特征及价值. 软件导刊, 015(003), 130-132.
【2】本文参考了qwezhaohaihong的文章,文章链接https://www.jianshu.com/p/fc407f437219
【3】参考了天道教育 责任编辑为zhangzx的文章 文章链接http://graduate.tiandaoedu.com/magnetic/24350.html
最后
以上就是无私世界为你收集整理的交通大数据干货总结(1)交通大数据干货总结(1)的全部内容,希望文章能够帮你解决交通大数据干货总结(1)交通大数据干货总结(1)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复