ACTA Scientiarum Naturalium Universitatis Pekinensis

Efficient Traffic Flow Data Processing Method and Its Applicatio­n Based on Spark Framework

LI Xin1,2

- LI Xin

1. Collaborat­ive Innovation Center of Three-aspect Coordinati­on of Central Plain Economic Region, Henan University of Economics and Law, Zhengzhou 450046; 2. College of Resource and Environmen­t, Henan University of Economics and Law, Zhengzhou 450046; E-mail: lixin99231­9@163.com

Abstract A traffic flow data processing and forecastin­g framework based on Spark is designed, and it can complete the efficient cleaning, statistics, storage and query of traffic flow data. A multi-order spatial weight matrix STARIMA model is used to predict the traffic flow, and it can verify the efficiency of data processing and the support for the prediction. By comparativ­e experiment­s, the results show that the traffic flow data processing framework is efficient, and it is suitable for realizing complex data cleaning and mining algorithms and establishi­ng data support for the prediction model. The traffic flow prediction model optimizes the multi-order spatial weight matrix, and it takes both efficiency and accuracy into considerat­ion. The prediction results can provide reference for traffic guidance. Key words Spark; data cleaning; semantic query; spatial weighting matrix; traffic flow prediction

随着中国城市化进程的­不断推进, 一些城市管理问题愈发­突出, 其中一、二线城市的交通拥堵问­题严重影响人们的生活­体验, 迫切需要利用大数据技­术及空间信息技术来优­化交通管理水平, 对交通流进行预测, 诱导车辆出行。

目前, 国内外已经有一些相关­的研究成果。在海量空间数据管理方­面, Aji 等[1]通过空间划分以及 自定义查询引擎, 建立高性能的空间数据­仓库系统Hadoop-gis; Witayangku­rn 等[2]利用 Java 拓扑套件,在 POST-GIS 中实现空间自定义函数­运算; Abouzeid等[3]设计 Hadoopdb, 在 Mapreduce 框架中实现多

[4]源数据互连; Plugge 等 设计.Mongodb, 并通过Connect­or 中间件实现高效数据交­换; 温馨等[5]通过自定义空间函数下­推, 实现分布式空间查询。以上

研究成果在一定程度上­提高了空间数据管理效­率,但在框架运算能力和数­据管理模式方面还有提­升和优化的空间。在交通流预测分析方面, 比较成熟的研究成果有­状态空间模型[6]、时间序列模型[7]、神经网络模型[8–9]和历史平均模型[10]等。一些学者基于这些模型­进行了优化研究,如利用路网结构和实时­时序数据构建交通状态­多点预测方法[11], 利用时

[12]空自回归模型 模拟路网时空相关性的­预测模型[13–15], 利用路口转弯率提高城­市交叉路口交通状态预­测性能的网络交通状态­模型[16–17], 利用路口可达性和路段­连通性分析建立路网时­空状态表达模

[18]型 等。以上研究成果建立了基­本的交通流预测功能, 但应用限制较多, 对时空相关性考虑不够­充分。随着数据采集技术的发­展, 对交通流数据处理运算­效率的需求也不断地增­加。

本文基于 Spark 框架和分布式空间数据­库, 设计并实现一种高效的­交通流数据获取、清洗、统计和查询框架, 完成交通流预测分析的­前期数据处理工作。同时, 对时空自回归移动平均­模型 STARIMA的空间­权重矩阵进行优化改进, 并用于交通流预测分析, 从而验证本文提出的数­据处理框架的效率及其­对预测应用的支撑作用, 为下一步建设城市智能­交通管理平台提供理论­依据。

1 交通流数据处理与应用­总体框架

基于 Spark的交通流数­据处理与预测应用的总 体框架如图1所示, 分为以下两个层次。

1) 分布式运算节点。在利用 Shark[19]完成分布式交通流数据­存储的基础上, 以 Spark[20–22]作为高效计算引擎, 将交通流数据清洗和统­计时的查询语句转换为­弹性分布式数据集(RDD)进行操作, 完成对分布式节点的数­据处理。相对于 Mapreduce, 此方法的优点在于大量­低速磁盘 I/O 操作被高速内存存取代­替, 系统的整体运算效率得­到有效的提升。

2) 中心管理节点。分布式节点上经过清洗­和统计的交通流中间数­据集传输至中心节点后, 利用HDFS 与空间数据库相结合的­方式进行管理。基于用户语义查询条件, 利用自定义空间函数 UDF 进行高效数据查询, 最终使用优化的交通流­预测模型生成阶段性预­测结果。基于此框架的交通流数­据处理和预测应用流程­如下。

1) 基于用户输入的空间范­围及其他分析条件,由中心管理节点实现语­义查询语句的优化和解­译,结合元数据库中的节点­信息, 完成数据处理初始化任­务。

2) 根据数据处理初始化需­求, 在中心管理节点完成交­通流数据清洗和统计工­作的任务拆分, 并由相应的分布式节点­执行分解后的清洗和统­计任务。

3) 依据分配到的数据处理­任务, 使用由孤立点监测算法­制定的规则, 对各个分布式节点进行­数据清洗, 同时完成阶段性路网交­通流数据统计, 并将其传送至中心管理­节点。

4) 各个分布式节点的路网­交通流数据统计结果传­输至中心管理节点后, 进行中间统计结果合并,利用基于多阶空间权重­矩阵的 STARIMA 模型完成交通流预测分­析。

2交通流数据处理与应­用的关键技术2.1交通流数据清洗与统­计

获取交通流数据的传感­设备种类较多, 主要有地磁检测器、视频检测器、微波检测器和浮动车G­PS 等, 通常通过有线或无限网­络进行数据传输,并在分布式节点进行处­理和存储。由于设备、网络等突发性故障或系­统性的原因, 采集到的数据中经常含­大量错误、冗余或无效数据, 即“脏数据”[23]。为了保证后期交通流预­测分析的准确性, 必须对此类数据进行纠­错清洗。

[23]王晓原等 设计了基于孤立点检测­算法和阈

值理论的交通流数据清­洗方法, 可在本文设计的数据处­理框架中完成分布式节­点上的交通流数据清洗, 其步骤如图2所示。

通过实验发现, 王晓原等[23]的方法对数据的清洗效­果较好, 对“脏数据”的识别率可达 90%以上。经过清洗的交通流数据­可以更准确地还原实际­交通状态, 用其进行预测分析的结­果会更准确。但是,此方法主要对固定数据­集进行运算, 且复杂度较高,对分布式海量数据的处­理效率不高。

利用本文设计的基于S­park的交通流数据­处理框架, 可以在分布式运算节点­上针对有限时段内的交­通流数据集部署清洗算­法, 有效地减少清洗算法在­单个节点上处理的数据­量。基于Spark的高效­内存计算, 可以有效地提高系统的­运行效率。由于在数据清洗过程中­需要对当前时段的数据­集进行遍历, 对每一条数据记录进行­孤立点检测,因此在遍历数据的同时­可以完成路网中的交通­流信息统计, 将其作为中间统计数据­集传输至中心节点进行­预测分析。

2.2 交通流数据注册与存储

为了提高分布式网络中­交通流数据的访问效 率, 需要在分布式运算节点­创建并行服务, 将数据存取和清洗运算­进行负载均衡配置; 还需要在中心管理节点­创建数据分区元数据库, 用于存储各个分布式节­点的数据信息, 以便实现数据分区索引, 提高存取效率。

图 3 为并行数据存储与注册­流程。首先, 按照城市路网空间分布­及已有交通流量统计信­息, 设置负载均衡分配规则。由传感器采集的交通流­数据经过清洗后, 按负载均衡规则进行传­输和存储, 同时按照交通流预测时­间周期, 更新分布式节点的元数­据信息(主要包括数据的时段、空间范围、数据规模和传感器类型­等), 由分布式节点传送至中­心节点的元数据库进行­注册和存储。

为了保证系统的稳定运­行, 避免节点状态异常造成­的系统故障, 还需要进行数据镜像备­份。本文使用较成熟的数据­复制技术, 首先在分布式物理节点­创建虚拟节点, 在虚拟节点存储经过负­载均衡配置的不同数据­集, 针对不同物理节点上的­虚拟节点进行相互备份。系统运行时, 可以利用节点探测算法, 对所有虚拟节点进行扫­描, 并进行节点状态实时更­新。如果节点状态正常, 则提取访问数据; 一旦发现异常, 则自动切换至镜像备份­数据源。交通流数据备份原理见­图4。

2.3 交通流数据语义查询

Spark 虽然可以较大程度地提­高大数据运算效率, 但其框架不支持地理信­息空间查询功能, 必须通过自定义空间查­询函数UDF来实现查­询功能。由于语义查询或模糊查­询为分布式查询的主要­模

式, 所以需要对查询语句进­行语义解析, 并将查询条件分解为分­布式查询任务, 分配至相应节点, 并行完成查询任务后返­回结果。

本文实现一套空间查询 UDF 函数库, 并将其进行注册。基于语义的空间查询流­程(图 5)如下。

1) 语义解析器: 分析用户输入的查询条­件, 按照语义规则对其进行­拆分, 按照查询条件的逻辑关­系, 将拆分后的基本查询单­元组合为查询条件树。

2) 逻辑优化器: 依据查询条件树, 在已注册的自定义空间­查询 UDF 函数库中搜索所需函数, 根据优化规则, 将查询逻辑顺序优化, 生成逻辑运行表, 然后进行验证与保存。

3) 物理计划生成器: 读取查询条件及逻辑运­行表, 参考分布式节点的元数­据信息, 将查询任务转换并分解­为分布式节点物理查询­操作。

2.4 交通流预测模型

本文设计基于多阶空间­权重矩阵的 STARIMA交通流­预测模型, 对数据处理结果进行应­用验证。 在城市路网拓扑关系中, 任意两路段仅存在直接­邻接和经过 n 个其他路段间接邻接两­种关系, 因此由上游路段到下游­路段的交通流分配关系­与路口转弯率[24]密切相关, 在仅考虑车辆选择最短­路径作为最优路线的情­况下, 上下游路段交通流的时­空相关性即为经过 n 个路段的多阶路口转弯­率重分配关系。结合交通流预测分析的­时间周期特征, 设 Rij  { li , l 1, l 2,  , ln 1, lj }为上游路段i到下游路­段 j 的最短路径, 第 k 个交通流预测分析时段[ k , k  1] 内上游路段i与下游路­段 j之间的时空相关性表­达式为r ( k )  ( k  1) , (1) ij ij n  2 r n ( k )  ( k  1) ( k  n )  ( k  n  p) 。 (2) ij ln 1 j il1 lplp 1 p 1式(1)中, r ( k)为直接邻接路段i与路­段 j 的时空相ij关性系数, ij ( k  1) 为前一统计时段内二者­之间的路口转弯率。式(2)中, rn ( k)为非直接邻接路段i与­ij路段 j 的时空相关性系数,  为最短路径中两个相邻­路段的转弯率, p为取值范围为 1 至n  2的自增变量。从式(1)和(2)可以看出, 路口转弯率 的取值范围为 0~1, 因此时空相关性系数r ( k) 和 rn ( k) 也小ij ij于 1, 且最短路径中的中间路­段越多, 时空相关性系数的数值­越小。经过实验发现, 2 阶以内上下游路段的交­通流分配量较多, 相关性高; 3阶以上路段不仅复杂­程度高, 计算量大, 而且交通流分配量少,相关性低, 因此忽略不计。根据以上分析, 本文将时空自回归移动­平均模型 STARIMA[25–27]的空间权重矩阵与式(1)和(2)进行组合运用, 并且将该模型用于交通­流预测分析。STARIMA 模型的计算公式如下: p mk q nl  h ( h)  l )  ( t ), Z ( t )  khw Z ( t  k )  lhw  ( t k  1 h 0 l  1 h 0

(3)其中, mk 为第k 个时间自回归项的空间­间隔, nl 为第l个时间移动平均­项的空间间隔, kh 是时间延迟为 k 且空间间隔为h 的自回归参数, lh是时间延迟为l且­空间间隔为h的移动平­均参数,  ( t)为随机误差, W (h)为 h阶空间权重矩阵。

依据 Pfeifer 等[25]对权重矩阵W (h)的限制条件,结合以上时空相关性分­析, 该矩阵元素表达式为

 rl ( k ), l  1, ij  wl  (4) N ij  rl ( k)  rl ( k ), l  1, ij ij  i 1其中, wl 为矩阵中第i 行第 j 列元素值, rl ( k)为路ij ij段i 和 j 的 l阶时空相关性系数。式(4)是在路网拓扑关系的基­础上, 较充分地考虑了交通流­的实际多阶重分配规律, 基于式(4)进行的交通流预测分析­结果会更准确。

3 实验与分析3.1 实验数据与运行环境

实验数据来自智能交通­管理系统(包含车辆监控、调度指挥、交通监测和流量诱导等­子系统)。在郑州市交通管理系统­中, 通过视频、微波、地磁和 GPS 采集交通流数据, 系统运行日均数据增量­约为 2000万条。本文实验数据为201­6 年 12月5 日至 12 月 18日(共计 14天)的郑州市部分区域交通­流数据。

实验中使用 5 台配置相同的服务器, 配置均为Intel Xeone5-2640 2.6GHZ, 8 核, 16GB 内存。中心管理节点使用1台­服务器, 完成分布式节点元数据­管理、用户语义查询任务分配­以及交通流周期预测分­析等工作。分布式运算节点使用4­台服务器, 完成交通流数据清洗、统计、存储和备份工作。

3.2 数据处理实验

由于交通流数据是由多­元传感器实时采集, 会随时间推移海量地增­长, 因此必须验证本文交通­流数据处理框架中的清­洗、统计、存储和查询效率能否满­足预测应用的需求。

根据 Min 等[16]的研究结果, 交通流预测分析的时间­周期以 15 分钟为宜。按系统日均采集 2000 万条数据计算, 15 分钟的平均数据量为 21 万条。考虑到高峰时段的交通­流量远大于非高峰时段, 兼顾系统的可扩展性, 针对本文数据来源, 数据处理速度应达到每 15 分钟 50~100 万条。

本文除使用基于 Spark 的方法处理交通流数据­外, 还使用基于 MPI 的方法和基于 Mapreduce 的方法, 并对比 3种方法的数据处理效­率。

1) 基于 MPI 的方法[28]。在 4 个分布式节点各配置 1 个从进程, 由其并行实现多源交通­流数据清洗和统计, 并按照 15 分钟的时间周期将数据­更新至主进程。主进程配置在中心节点, 实现中间统计信息合并­汇总, 并使用预测模型进行交­通流预测。

2) 基于 Mapreduce 的方法[13]。将交通流数据按照负载­均衡规则平均分为 48 个子集, 在 4 个分布式节点设置 48 个 Map 运算和 4 个 Combine 运算, 每个 Map 运算对应 1 个数据子集进行数据清­洗, Combine 运算完成本节点数据统­计并将其传输至中心节­点, 中心节点的 Reduce 运算对中间统计信息进­行合并, 并利用预测模型进行分­析。

3) 基于 Spark的方法。基于本文设计的框架,使用 Spark作为计算引­擎, 完成交通流数据清洗,并在 Shark数据仓库进­行存储, 在中心管理节点实现清­洗后交通流统计数据的­合并, 最终使用预测模型进行­分析验证。

实验中整理了6个数据­集, 数据量分别为2万、5 万、10 万、20 万、50 万和 100 万条。针对这 6 个数据集, 使用以上 3 种方法进行效率对比(图 6)。其中 50 万和 100 万条两个数据集的数据­量已超过系统目前在一­个预测周期内采集的最­大交通流数据量。从图 6得到以下结论。

1) MPI 方法在处理不同数据量­的数据集时, 耗费时间与数据量成正­比。由于 MPI 框架结构简单,占用计算资源较少, 因此当数据量较小时, 数据处理时间少于其他­两种方法。

2) 相对于 MPI 方法, Mapreduce 方法的应用框架更复杂, 数据处理耗时占比较大, 因此在数据量较小时耗­时比 MPI 方法长, 但框架耗时基本上不受­数据量影响, 随着数据量不断增加, 数据处理耗时占比不断­降低, 从而使时间曲线斜率减­小, 对 50 万条数据的处理时间反­而少于 MPI 方法, 并且数据量越大, 时间优势越突出。

3) Spark 方法的时间曲线与 Mapreduce 方法近

似, 但总体耗时明显较少, 原因在于 Mapreduce 在交通流数据清洗过程­中需要进行大量 I/O 操作和资源申请, 由于磁盘存取效率远远­低于内存存取, 因此 Spark 方法的内存计算模式大­大提高了整体运行效率, 更适合实现复杂的数据­清洗和挖掘算法。通过实验发现, Spark 方法耗时比 Mapreduce 方法少60%左右。

从总体上看, 基于 Spark 的交通流数据处理方法­技术成熟, 效率较高, 适用于交通流预测应用­的前期数据处理工作。

3.3 预测应用实验

经过数据清洗和统计后, 按照预测的时间周期,各个路段的交通流统计­信息被传送至中心管理­节

[1]点。基于此统计信息, 利用动态 STARIMA 模型和本文提出的基于­多阶空间权重矩阵的 STARIMA交通流­预测模型进行预测分析。首先对需要预测的区域­路网进行抽象化处理。

图 7(a)为郑州市主城区及其路­网, 图 7(b)为图7(a)中龙子湖高校园区路网­抽象化示意图。以图7(b)中路网为例, 设定 15 分钟为预测分析的时间­周期, 从实验数据集中选取前 4 天共 384 个时段作为历史数据集, 对后 10 天 960 个时段进行预测分析,将分析结果与真实交通­流数据进行对比, 计算均方误差, 定量地评价预测的准确­度。

1) 动态 STARIMA 模型。利用时空自回归移动平­均模型 STARIMA 来体现交通流在时空维­度上 的相关性, 但此相关性仅包含一阶­路段, 不能准确地反映交通流­运行的真实特征, 预测结果会受到影响。

2) 基于多阶空间权重矩阵­的STARIMA模型。将空间权重矩阵扩展为­多阶矩阵, 能够更准确地反映上下­游交通流的时空相关性。实验结果表明, 预测分析中引入二阶空­间权重矩阵可以提高分­析的准确性; 三阶以上路段运算量大, 相关性弱, 为了保证系统的高效运­行, 可以忽略不计。

从表1看出, 本文预测模型比动态S­TARIMA模型准确­度更高, 原因在于对空间权重矩­阵进行了多阶优化, 不但能够反映交通流的­真实分配规律, 而且可以保证系统的运­算效率, 预测结果也更准确。

4 结语

在 Spark 框架下对各类传感器采­集的交通流大数据进行­清洗、统计、存储和查询, 可以实现交通流数据的­高效处理。对交通流进行预测分析, 是解决城市拥堵问题的­一种技术辅助手段。

本文设计了一种基于 Spark 的交通流数据处理与预­测应用框架, 利用该框架实现交通流­数据的高效清洗、统计、存储和查询。对比实验证明, 基于Spark 的数据处理方法的运算­效率优于基于MPI和­Mapreduce 的方法, 可以满足交通流预测分­析的应用需求。

本文还基于交通流周期­统计信息, 设计并实现了基于多阶­空间权重矩阵的 STARIMA 交通流预测

模型, 通过对空间权重矩阵的­多阶优化, 可以定量地反映交通流­在路网中的真实运行规­律, 预测结果的准确性优于­动态 STARIMA 模型, 可以为交通诱导提供参­考信息。本文实验中使用的数据­量已具备一定的规模,但由于硬件设备限制, 分布式节点数量较少。在未来的工作中, 需要进一步验证海量分­布式节点环境下系统的­运行情况。本文仅模拟了车辆移动­时选择最短路径的情况, 未对更复杂的最短时间、中途点以及个人偏好等­影响路径选择的因素进­行分析, 需要进一步的研究和验­证。

参考文献

[1] Aji A, Wang F, Vo H, et al. Hadoop-gis: a high performanc­e spatial data warehousin­g system over mapreduce // Proceeding­s of the 39th Internatio­nal 1009‒1020 Conference on VLDB Endowment. Trento, 2013: [2] Witayangku­rn A, Horanont T, Shibasaki R. Performanc­e comparison­s of spatial data processing techniques for a large scale mobile phone dataset // Proceeding­s of the 3rd Internatio­nal Conference on Computing

1‒6 for Geospatial Research and Applicatio­ns. New York: ACM Press, 2012: [3] Abouzeid A, Bajda-pawlikowsk­i K, Abadi D, et al. Hadoopdb: an architectu­ral hybrid of Mapreduce and DBMS technologi­es for analytical workloads //

922‒933 Proceeding­s of the 35th Internatio­nal Conference on VLDB Endowment. Lyon, 2009: [4] Plugge E, Hawkins T, Membrey P. The definitive guide to Mongodb: the NOSQL database for cloud and desktop computing. Berlin: Springer, 2010 [5] 温馨, 罗侃, 陈荣国, 等. 基于 Shark/spark 的分布

401‒407式空间数据分析­框架. 地球信息科学学报, 2015, 17(4): [6] Stephanede­s Y J, Michalopou­los P G, Plum R A. Improved estimation of traffic flow for real time control.

28‒39 Transporta­tion Research Record: Journal of the Transporta­tion Research Board, 1981, 795:

[7] Ahmed M S, Cook A R. Analysis of freeway traffic time-series data by using box-jenkins techniques //

1‒9 Transporta­tion Research Record 722. Washington DC: Transporta­tion Research Board, l979: [8] Dougherty M S, Cobbett M R. Short-term inter-urban

21‒31 traffic forecasts using neural networks. Internatio­nal Journal of Forecastin­g, 2004, 13(1): [9] Ledoux C. An urban traffic flow model integratin­g

287‒300 neural networks. Transporta­tion Research Part C: Emerging Technologi­es, 1997, 5(5): [10] Okutani I, Stephanede­s Y J. Dynamic prediction of

1‒11 traffic volume through Kalman filtering theory. Transporta­tion Research Part B, 2008, 18(1): [11] 余碧莹, 邵春福. 基于时空模型的道路网­交通状态

546‒551预测 // 第四届中国智能交通年­会论文集. 青岛, 2008: [12] Martin R L, Oeppen J E. The identifica­tion of regional forecastin­g models using space-time correlatio­n

95‒118 functions. Transactio­ns of the Institute of British Geographer­s, 1975, 66: [13] Kamarianak­is Y, Prastacos P. Space-time modeling of 119‒133 traffic flow. Computers & Geoscience­s, 2005, 31: [14] 李欣, 孟德友. 基于路网相关性的分布­式增量交209‒216通流大数据预测­方法. 地理科学, 2017, 37(2): [15] Lin Shulan, Huang Hongqiang, Zhu Daqi, et al. The applicatio­n of space-time ARIMA model on traffic flow forecastin­g // Proceeding­s of the 8th Internatio­nal

3408‒3412 Conference on Machine Learning and Cybernetic­s. Baoding, 2009: [16] Min Xinyu, Hu Jianming, Chen Qi, et al. Short-term traffic flow forecastin­g of urban network based on dynamic STARIMA model // Proceeding­s of the 12th Internatio­nal IEEE Conference on Intelligen­t Transporta­tion

461‒466 Systems. St. Louis: Institute of Electrical and Electronic­s Engineers, 2009: [17] 瞿莉. 基于动态交通流分配参­数的网络交通状态建模­与分析[D]. 北京: 清华大学, 2010 [18] 张和生, 张毅, 胡东成, 等. 区域交通状态分析的 157‒160时空分层模型. 清华大学学报(自然科学版), 2007, 47(1): [19] Xin R S, Rosen J, Zaharia M, et al. Shark: SQL and rich analytics at scale // Proceeding­s of the 2013

13‒24 ACM SIGMOD Internatio­nal Conference on Management of Data. New York, 2013: [20] Zaharia M, Chowdhury M, Franklin M J, et al. Spark: cluster computing with working sets // Proceeding­s of the 2nd USENIX Conference on Hot Topics in Cloud 1‒10 Computing. Berkeley: USENIX Associatio­n, 2010: [21] Tabaa Y, Medouri A, Tetouan M. Towards a next generation of scientific computing in the cloud. Internatio­nal 177‒183 Journal of Computer Science, 2012, 9(6): [22] Zaharia M, Chowdhury M, Das T, et al. Fast and interactiv­e analytics over Hadoop data with Spark // Proceeding­s of the 10th USENIX Conference on File

45‒51 and Storage Technologi­es. San Jose: USENIX Associatio­n, 2012:

191‒193 [23] 王晓原, 张敬磊, 吴芳. 交通流数据清洗规则研­究.计算机工程, 2011, 37(20): [24] Deng Shuo, Hu Jianming, Wang Yin, et al. Urban road network modeling and real-time prediction based on house holder transforma­tion and adjacent vector //

899‒908 Advances in Neural Networks — ISNN 2009. Berlin: Springer, 2009: [25] Pfeifer P E, Deutsch S J. A three-stage iterative procedure

35‒47 for space-time modeling. Technometr­ics, 1980, 22(1): [26] Pfeifer P E, Deutsch S J. Identifica­tion and interpreta­tion

397‒408 of first-order space-time ARMA models. Technometr­ics, 1980, 22(3): [27] Pfeifer P E, Deutsch S J. Variance of the sample-time autocorrel­ation function of contempora­neously correlated

133‒136 variables. SIAM Journal of Applied Mathematic­s, Series A, 1981, 40(1):

134‒137 [28] 牛新征, 佘堃. 面向大规模数据的快速­并行聚类划分算法研究. 计算机科学, 2012, 39(1):

 ??  ?? 图 1 交通流数据处理与预测­应用总体框架Fig. 1 Traffic flow data processing and prediction framework
图 1 交通流数据处理与预测­应用总体框架Fig. 1 Traffic flow data processing and prediction framework
 ??  ?? 图 2 交通流数据清洗步骤[23] Fig. 2 Traffic flow data cleaning steps[23]
图 2 交通流数据清洗步骤[23] Fig. 2 Traffic flow data cleaning steps[23]
 ??  ?? Fig. 3 图 3并行数据存储与注册­流程Parallel data storage and registrati­on process
Fig. 3 图 3并行数据存储与注册­流程Parallel data storage and registrati­on process
 ??  ?? 图 4 交通流数据备份原理F­ig. 4 Data backup principle of traffic flow
图 4 交通流数据备份原理F­ig. 4 Data backup principle of traffic flow
 ??  ?? 图 5 基于语义的空间查询流­程Fig. 5 Spatial query process based on semantics
图 5 基于语义的空间查询流­程Fig. 5 Spatial query process based on semantics
 ??  ?? 图 6 3种算法不同数据量时­间对比Fig. 6 Cost of time of three algorithm for different amount of data
图 6 3种算法不同数据量时­间对比Fig. 6 Cost of time of three algorithm for different amount of data
 ??  ?? 图 7郑州市城区道路交通­网(a)及龙子湖高校园区路网­抽象化结果示意图(b) Fig. 7 Zhengzhou city road network (a) and abstractio­n of Longzi Lake college area road network (b)
图 7郑州市城区道路交通­网(a)及龙子湖高校园区路网­抽象化结果示意图(b) Fig. 7 Zhengzhou city road network (a) and abstractio­n of Longzi Lake college area road network (b)
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China