我是靠谱客的博主 雪白眼睛,最近开发中收集的这篇文章主要介绍精读论文:Urban Traffic Prediction from Mobility Data Using Deep Learning,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

Urban Traffic Prediction from Mobility Data Using Deep Learning

IEEE Network 2018


OUTLINE

  • mobility data 的种分类
  • 传统方法及种任务的介绍和深度学习在种任务中的进展
  • 未来的个研究方向

文章把预测交通的 mobility data 分成如下几类

  1. Traffic Data from Infrastructures
    • e.g., loop detectors and traffic cameras
    • 时间变但空间不变的点数据,因为一旦部署之后位置不变,但它的获得的数据是随时间在变(郑宇博士的分类)
  2. Trajectory Data from Vehicles
    • e.g., taxis and buses (with GPS)
    • 时间变且空间变的网数据,->轨迹数据是最复杂的时空数据之一(郑宇博士的分类)
  3. AFC Records from Transit Systems
    • AFC = 城市轨道交通自动售检票系统,例如高速公路的ETC,地铁等
    • 时间变但空间不变的网数据,想象->带有路网的交通流数据(郑宇博士的分类)
  4. Other Data Sources
    • e.g., accident reports, Social networking services, Cellphone data, sensing data from crowdsourcing systems
    • 从这可以看出预测交通的数据量多且多源…也是这个任务的一大难点
  5. 补充郑宇博士对整个时空数据的分类
summary1
  • 按照数据格式可以分成以下两类

    • 第一行点数据
    • 第二行网数据
  • 所谓时空数据一定是有时间与空间的属性,根据数据所关联的时空属性变与不变可以分成以下三类

    • 第一列是时间空间都不变,比如,
      • 点数据:一个加油站或学校是一个兴趣点(Point of Interest,简称为POI)。这个POI一旦建好,它的空间位置及各种属性(如面积大小)就不会随着时间而变化。因此它是一个时空都静态的点数据据。
      • 网数据:简单的路网是一个时空静态的网络结构数据。道路一旦修建完成,它们的位置和属性就不会随时间变化
    • 第二列是时间变但空间不变,比如,
      • 点数据:有些传感器的位置虽然不变,但它每个时间段产生的读数(比如一个地方的温度)不断变化,因此它是一个空间静态但时间动态的点数据。
      • 网数据:我们把时变的交通流量信息叠加到路网上,就形成了空间静态但时间动态的网数据。
    • 第三列是时间空间都变,比如,
      • 点数据:对于滴滴专车和摩拜带车,在不同的时间和地点我们会收到不同的用户请求。因此,它是一个时空都动态的点数据。
      • 网数据:轨迹数据是时空都变化的网数据,列如一辆汽车在不同的时间处于不同的位置,车的油耗、速度和朝向等属性也在不停的变化。一个移动物体产生的轨迹点形成一个链式的网络结构。轨迹数据是时空数据中结构最为复杂,且蕴含信息最为丰富的一种数据。

然后总结目前的模型架构(基于统计或者机器学习的方法,列如 ARIMA, ANN, and SVM )及时空数据的特点(存在时间空间属性)和交流预测的子任务及目标,见下图

summary1

接着上场的就是Deep Learning的方法在Traffic Prediction中的应用了

  • 作者首先铺垫了一些NN, CNN, RNN, SAE 等知识,总结如下
summary2
  • 任务一:Traffic Speed Prediction

    • 首先作者点了一下交通速度数据的特点(is influenced by many factors in both the temporal and spatial dimensions)
    • 之后介绍了自己的早期工作 DeepSense(选择该目标数据多个相关数据,按照数据时序输入RBM提取特征,然后用SVM预测交通速度…具体可能需要看原文)
    • 最后讨论了一下 DL 的方法了,特别解释了为什么 CNN 比较合适这个任务,btw…这里有篇文章挺有意思的,之后需要补一下(J. Wang et al., “Traffic Speed Prediction and Congestion Source Exploration: A Deep Learning Method)
  • 任务二:Traffic Flow Prediction

    • 首先作者提出流量数据同速度数据特点类似(is also affected by temporal and spatial factors )然后说不同(traffic flow should be considered on a large scale since human mobility usually covers a large area)
    • 因此,针对数据特性,作者将道路网络或整个城市划分为网格,并将交通流量放入这样的二维网格空间,以形成即时交通流快照,并依旧认为 CNN 适合这个任务。
    • 然后重点介绍了郑宇组的 ST-ResNet ~~
    • 个人觉得这种grid-base的方法不适合交通流预测的场景,因为交通流预测目标是为了提前知道道路的拥堵情况,除非把数据预处理得很好,划分grid分得很细,才可能适用,(可以想象1.原始数据会因噪声而分布在道路四周,2.当grid在交叉路口时)所以ST-ResNet是从社会安全的角度出发,为了解决人流预测问题而提出的方法,它预测的是某一区域而非道路的人流量,只不过是采用的是车辆的数据,强烈推荐读原论文或我的博文,一篇精彩的paper
  • 任务三:Traffic Accident Risk Prediction

    • 首先作者否定了人工提取的特征(大多基于先验知识)不适用于表达这种极其复杂的模式
    • 接着 Thanks to the deep architecture …O(∩_∩)O,解释了为什么深度模型比浅层模型更适合该任务,因为深度模型提取的特征比人工设计的更好。。。

未来……

  1. Joint Optimization of Multi-Source Data and Traffic Modeling
  • 问题
    • 如何选择最合适的 mobility data 目前还未知
    • 最合适的深度模型的类型,融合方法及其超参数设置细节需要探索
    • 因此多源数据,模型结构及融合方法需要联合优化
    • 我的思考:这是时空数据挖掘的重点也是难点,同样也是深度学习的难点,基本无解,但我相信以后会有解决方案吧。
  • 可能的方案
    • 利用所有可用的 mobility data 进行预测,具体如下
    • 对每一种数据用深度学习进行建模,然后融合结果
    • 也可以利用集成学习理论来整合单模型的结果
    • 作者在实践中,省略的数据选择的问题,独立的地对每个数据进行设计深度模型建模,然后采用加权平均策略来计算最终预测
    • 我的思考:这并不是最合理的方法,但也算是一种解决方案。就像贪心算法一样单个最后加在一起总不是最优的,在说了很多数据是冗余的会浪费存储和计算资源,其实进一步可以根据融合的权重进行选择,或者用集成学习理论进行选择也阔以。。
  1. Parallel Computing Promoted Deep Learning to Accelerate Traffic Predictions:

    • 问题

      • 深度模型存在很多参数需要调整,传统的计算系统不适用这种任务,特别特别特别是遇到 multi-source mobility data 这种数据时问题更严重。因为这种数据多嘛!

      • 如何在保持通信和计算的最小成本的同时实现最佳建模是一个挑战

      • 如何将在不同机器上学习的参数片段合并到完整的模型中以进行快速预测仍有待探索

      • 我的思考:这是该问题的第二大重点与难点,但是我是学生接…触不到那么大的数据,期待以后有机会再研究!

    • 方案

      • 可以通过利用参数服务器(PS)架构[15]来构建我们的深度学习模型,以在机器之间管理和同步模型参数
      • 由于附近的区域在交通流中是相关的,我们可以根据其地理信息在机器之间放置移动数据
      • 在实践中,我们可以将更多的交通领域知识嵌入到我们的模型和系统设计中,以进一步提高大规模交通预测的准确性和效率。
      • 我的思考:不太懂,但是感觉能实际应用会很有意义!

总结……

  • 待补充

最后

以上就是雪白眼睛为你收集整理的精读论文:Urban Traffic Prediction from Mobility Data Using Deep Learning的全部内容,希望文章能够帮你解决精读论文:Urban Traffic Prediction from Mobility Data Using Deep Learning所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(58)

评论列表共有 0 条评论

立即
投稿
返回
顶部