资源描述
ICS 93.080.30 CCS Q 84 5201 贵阳市地方标准 DB5201/T 1372024 基于移动 通信数据 的居民出 行调查技 术 规范 Technical specification for resident trip surveys based on mobile communication data 2024-05-08 发 布 2024-08-01 实施贵阳市市 场监督 管 理局 发 布 DB5201/T 1372024 I 目 次 前言.II 1 范围.1 2 规范性引用文件.1 3 术语和定义.1 4 总体要求.2 5 数据采集与处理.3 6 居民出行特征识别与统计.4 7 扩样和校核.7 8 调查成果.7 附录 A(规范性)数据类型格式与数据文件存储格式.8 附录 B(资料性)基于空间单元的关键过程数据表格.9 参考文献.11 DB5201/T 1372024 II 前 言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由贵阳市交通委员会提出并归口。本文件起草单位:贵阳市交通发展研究中心、昆明理工大学、中国联合网络通信有限公司贵州省分公司。本文件主要起草人员:钟宇、何明卫、成国积、石庄彬、吴杰、何莉、帅春燕、刘阳、刘杰、刘甜甜、廖强、郑和标、李衡。DB5201/T 1372024 1 基于移动通信数据的居民出行调查技术 规范 1 范围 本文件规定了基于移动通信数据的居民出行调查的总体要求、数据采集与处理、居民出行特征识别与统计、扩样与校核、调查成果等。本文件适用于城市综合交通调查中基于移动通信数据的居民出行调查。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 35273 信息安全技术 个人信息安全规范 3 术语和定义 下列术语和定义适用于本文件。3.1 居民出行调查 resident trip survey 为了全面了解城市居民或者流动人口出行的源和流,以及居民出行的发生规律,对居民的出行从出发到终止过程的全面情况进行调查。3.2 手机信令 mobile signaling 移动通信系统中,用来传输用户信息和保障正常通信所需的设备与网络之间的协议控制信号。3.3 手机信令数据 mobile signaling data 移动通信用户在发生通话、收发短信、位置移动或上网等事件时,与运营商的通信基站之间发生信息交换所产生的数据。3.4 基站 base station 在一定的无线电覆盖区中,通过移动通信交换中心,与移动通信终端之间进行信息传递的公用无线电收发电台。3.5 加密移动用户识别码 encrypted mobile subscriber identification 基于手机信令的数据处理及服务中经脱敏处理的唯一标识信令所属移动用户的识别码。3.6 静止冗余数据 static redundant data在连续一段时间内,同一持卡人的多个相邻时间戳对应的基站编号以及基站经纬度均相同的手机信令数据。DB5201/T 1372024 2 3.7 乒乓切换数据 ping-pong switching data 移动通信系统中,由于基站信号强度会随时间发生变化,移动通信用户持有的手机可能在邻近的两个基站间来回切换(乒乓效应),所产生的手机信令数据。3.8 基站漂移数据 base station drift data 由于地形、建筑物等对基站信号的遮挡和反射效应,导致移动通信用户的基站位置忽然切换到较远的基站,一段时间后又切换回邻近基站,在此过程中产生的手机信令数据。3.9 驻留 one stop 移动通信用户在满足空间限制的某一区域内连续停留超过最小停留时长。注:最小停留时长和空间限制应根据具体应用场景而定。3.10 驻留点 stop point 移动通信用户在某个超过最小停留时长的连续时间范围内,与其发生信号交互的基站位置满足空间限制时,这些基站位置的质心。3.11 驻留空间 stop space 移动通信用户驻留时间内与其发生信号交互的多个基站所覆盖的区域可合并为一个驻留的空间区域。3.12 驻留时长 stop time 移动通信用户在某一驻留区域从驻留开始时间到驻留结束时间的时间长度。3.13 驻留人数 stop number 给定统计时段,在某一空间范围内累计驻留时长超出给定阈值的不计重移动通信用户数量。3.14 出行 trip 移动通信用户按照时间的先后顺序,从一个驻留点(O点)移动到另一个驻留点(D点)的过程。3.15 核查线 screen line 结合交通分析和交通模型的需要在调查区域内设置的交通流量调查的分隔线,一般结合天然或人工屏障(铁路、河流等)设置。4 总体要求 涉及重要居民出行特征指标应基于不同尺度的空间单元分别进行统计和分析。可采用行政区(县)、4.1 街道或组团、交通小区、空间栅格的层级方式,并说明不同尺度空间单元的从属关系。应采集调查区域内至少连续 1个月的手机信令数据。4.2 基于移动通信数据进行居民出行调查分析工作应遵守国家有关法律法规。4.3 DB5201/T 1372024 3 5 数据采集与处理 数据采集 5.1 5.1.1 移动通信数据源应选择一家及以上移动通信运营商在调查周期内的完整数据。5.1.2 同时采集多家移动通信运营商的数据时,宜采用相互比较、相互校核的方式提高数据结果的可靠性。5.1.3 采集的移动通信数据的数据类型格式与数据文件存储格式见附录A。5.1.4 基站数据宜包括以下内容:a)基站编号;b)基站所属运营商标识;c)基站所在位置的省份标识;d)基站所在位置的城市标识;e)基站类型,包括普通基站、地铁基站、铁路专用基站、地上基站与地下基站等;f)基站地理位置的经度数值;g)基站地理位置的纬度数值。5.1.5 手机信令数据宜包括以下内容:a)加密移动用户识别码;b)信令时间戳;c)信令事件类型,包括开关机、语音呼叫、短信、周期性位置更新、切换基站等;d)当前所在基站的地理位置的经度数值;e)当前所在基站的地理位置的纬度数值。5.1.6 用户基本特征数据宜包括以下内容:a)加密移动用户识别码;b)用户年龄范围区间;c)用户性别;d)号码归属地。数据处理 5.2 5.2.1 应进行数据质量检查,内容包括信令日变和时变、基站位置坐标及不同类型区域中基站的布局密度等。5.2.2 应根据物联网特殊号段及从移动用户识别码获取的设备类型识别并剔除物联网卡等非人号卡产生的信令记录。5.2.3 当条件满足时,应进行一人多卡去重,可通过计算多个加密移动用户识别码的轨迹重合度进行处理。5.2.4 数据清洗处理流程包括但不限于:a)残缺数据处理:当手机信令记录的缺失值为用户识别码、信令时间戳等关键字段时,应删除;当手机信令记录的缺失值为非关键字段时,可采用插补方法对缺失值进行处理;b)重复数据处理:当手机信令原始数据存在数据字段内容完全相同的记录时,应合并去重;c)静止冗余数据处理:应对信令记录中的静止冗余数据进行合并删除,保留连续在同一位置的第一条和最后一次信令交互数据;d)乒乓切换数据处理:在手机信令记录中,宜以用户在“乒乓效应”发生期间连接次数最多的基站为主基站,剔除“乒乓效应”期间产生的除主基站外的记录;DB5201/T 1372024 4 e)基站漂移数据处理:应根据同一用户每条信令记录的驻留时间、驻留位置及其下一条记录的驻留时间、驻留位置,计算每次移动的速度,通过设定速度阈值,剔除短时间内发生大位移的信令记录。数据安全 5.3 5.3.1 个人信息安全应符合GB/T 35273的规定。5.3.2 基于移动通信数据的居民出行特征应为聚合统计后的指标结果,且保证无法识别特定个人。6 居民出行特征识别与统计 基本要求 6.1 6.1.1 应建立基站位置与基本空间单元之间的对应关系,基本空间单元宜采用空间栅格或交通小区。6.1.2 基本空间单元的大小应结合基站密度合理确定,当采用空间栅格形式划分空间单元时,宜在中心城区划分为250 m250 m或 500 m500 m的栅格,外围区可根据基站密度适当扩大。居民出行特征识别 6.2 6.2.1 驻留与出行识别 6.2.1.1 驻留状态识别应确定合理的最小驻留时长和空间限制取值,最小驻留时长和空间限制的取值宜考虑具体应用场景。6.2.1.2 出行状态识别应根据驻留状态的识别结果进行判断,可通过移动通信用户两次相邻驻留状态之间的空间移动过程进行识别。6.2.1.3 通过对用户驻留状态期间记录的手机信令数据的基站位置综合加权以确定移动通信用户的驻留点。6.2.1.4 夜间时段内当用户在某一位置驻留时间不少于连续 6 个小时,将该位置标记为用户的单日夜间驻留地,夜间时段可取 21:00 至次日 7:00。夜间时段在目标区域存在单日夜间驻留地的不计重的移动通信用户数量记为单日夜间驻留人数。6.2.1.5 日间时段内当用户在某一位置累计驻留时间不少于 6 个小时,将该位置标记为用户的单日日间驻留地,日间时段可取10:00至 17:00。日间时段在目标区域存在单日日间驻留地的不计重的移动通信用户数量记为单日日间驻留人数。6.2.1.6 移动通信用户驻留指标应包括驻留时长、驻留人数、单日夜间驻留人数、单日日间驻留人数。6.2.2 人口与岗位识别 6.2.2.1 居住地识别 6.2.2.1.1 统计单个移动通信用户在整个统计周期内所有单日夜间驻留地出现的频次,可采用频率最高的单日夜间驻留地作为该用户的居住地。必要时,可进一步区分第一居住地和第二居住地。6.2.2.1.2 用户居住地识别过程中应设置有效性判断规则,被识别为居住地的单日夜间驻留地在整个统计周期中重复出现的频次宜不少于调查周期天数的50%。6.2.2.1.3 可根据调查目的和数据统计周期长度结合单日夜间驻留地累计时长、单日夜间驻留地重复率加权取值进行判断。DB5201/T 1372024 5 6.2.2.2 就业地识别 6.2.2.2.1 统计单个移动通信用户在整个统计周期中所有工作日单日日间驻留地出现的频次,可采用频率最高的工作日单日日间驻留地作为该用户的就业地。6.2.2.2.2 用户就业地识别过程中应设置有效性判断规则,被识别为就业地的工作日单日日间驻留地应在整个统计周期中重复出现的频次宜不少于调查周期天数的50%。6.2.2.2.3 可根据调查目的和数据统计周期长度结合工作日单日日间驻留地累计时长、工作日单日日间驻留地重复率加权取值进行判断。6.2.2.3 常住人口识别 宜筛选出目标区域夜间驻留天数大于调查周期天数50%的用户作为该区域的常住人口。6.2.2.4 短期驻留人口识别 6.2.2.4.1 用户在该城市范围内单日连续驻留 3 小时以上且不属于该城市常住人口的,计入该城市的当日短期驻留人口计算对象,一个用户按城市纳入不计重。6.2.2.4.2 不在同1天内同时驻留的短期驻留用户不应累加,宜在30日内逐日计算符合短期驻留规则的人数,计算日平均值作为所在区域的短期驻留人口。6.2.3 出行目的识别 6.2.3.1 通勤出行识别 用户定期往返于居住地和工作地之间的出行识别为通勤出行。用户的早间通勤出行由居住地指向就业地,晚间通勤出行方向则相反,且日间时段主要在就业地驻留,夜间时段主要在居住地驻留。必要时可结合工作日和节假日具体分析。6.2.3.2 非通勤出行识别 用户出行端点不同时为居住地及工作地的出行识别为非通勤出行,可根据移动通信数据信息的完整程度和数据时空精确程度细分。居民出行特征统计 6.3 6.3.1 出行量与出行率 6.3.1.1 出行量 6.3.1.1.1 统计不同尺度空间单元的分时段和日均出行量。6.3.1.1.2 筛选工作日早、晚高峰时段的数据进行高峰小时出行量统计和分析。6.3.1.1.3 根据出行目的类型,分别统计出行量。6.3.1.1.4 根据常住人口和短期驻留人口类型,分别统计出行量。6.3.1.2 出行率 6.3.1.2.1 统计不同尺度空间单元内全部人口的出行率。6.3.1.2.2 统计不同尺度空间单元内有出行用户的出行率。6.3.1.2.3 根据出行目的类型,分别统计出行率。6.3.1.2.4 根据常住人口和短期驻留人口类型,分别统计出行率。DB5201/T 1372024 6 6.3.2 出行时耗与出行距离 6.3.2.1 出行时耗 6.3.2.1.1 统计不同尺度空间单元内居民出行时耗分布。6.3.2.1.2 根据出行目的,分别统计平均出行时耗。6.3.2.1.3 根据常住人口和短期驻留人口类型,分别统计平均出行时耗。6.3.2.2 出行距离 6.3.2.2.1 统计不同尺度空间单元内居民出行距离分布。6.3.2.2.2 根据出行的总人数,计算有出行用户的平均单日出行距离和平均单次出行距离。6.3.2.2.3 根据出行目的类型,分别统计平均单日出行距离、平均单次出行距离。6.3.2.2.4 根据常住人口和短期驻留人口类型,分别统计单次出行距离分布。注:出行距离可采用起讫点间曼哈顿距离或欧式距离与路径曲折系数的乘积近似表示。6.3.3 出发时间分布与出行空间分布 6.3.3.1 出发时间分布 6.3.3.1.1 分别统计工作日与非工作日出发时间分布。6.3.3.1.2 根据不同尺度空间单元,分别统计各时段的出发时间分布。6.3.3.1.3 根据出行目的类型,分别统计各时段的出发时间分布。6.3.3.2 出行空间分布 应统计不同尺度空间单元工作日、非工作日的分时段出行起讫点(OD)矩阵,并选取合适的空间尺度绘制出行OD期望线并进行分析。6.3.4 通勤出行特征 6.3.4.1 通勤出行特征统计宜包括职住空间分布、通勤出行量、通勤出行率、通勤时间和通勤距离等。6.3.4.2 职住空间分布宜提供不同尺度空间单元人口与就业岗位的数据和密度分布,并在获得数据许可的情况下,宜针对不同性别、年龄段及移动通信用户的归属地分别进行统计分析。6.3.5 其它出行特征 6.3.5.1 基于移动通信数据获取城市出行联系应在人口与岗位识别结果的基础上进行测算,测算时段不宜小于 1个月。6.3.5.2 对于调查区域与其他城市之间的出行联系宜包括人群分类、主要出行路径、出行时间段(工作日、周末和节假日)、出行目的、出行方式等。6.3.5.3 根据调查需要可选择主要的交通枢纽、城市片区和客流集散点等重点区域进行出行特征分析。6.3.5.4 移动通信系统中,位于城市轨道交通系统中的车站、隧道等地下空间的基站具有特定的类型编码,可用于识别使用城市轨道交通作为交通方式的出行。DB5201/T 1372024 7 7 扩样和校核 扩样 7.1 7.1.1 在进行扩样前,应收集和准备以下材料:a)调查区域的街道常住人口、户均人口数量、年龄段人口分布、性别人口分布、收入人口分布情况等;b)调查区域街道面积、边界等。7.1.2 扩样方法宜包括以下步骤:a)结合移动通信运营商在当地的电信市场占有率,获得调查区域内全部移动通信用户的不计重总体数量。电信市场占有率的测算宜采用移动通信运营商长期记录的话单数据估算,或结合活跃用户的规模占比进行估计;b)结合调查区域手机普及率,确定不同居民群体的调整系数,获得调查区域实际居民的总体数量。调整系数的测算可采用手机普及率问卷调查方式,并考虑当地人口的年龄和性别结构及允许获取的移动通信用户个体信息进行综合测算。校核 7.2 7.2.1 应对基于移动通信数据进行居民出行特征识别与统计获得的结果进行校核。7.2.2 数据校核宜采用定性与定量相结合的方法,将基于移动通信数据进行居民出行特征识别与统计获得的数据,与近期或同期的城市居民出行问卷调查数据、人口普查数据、统计年鉴数据及核查线道路流量调查数据进行对比分析,验证分析结果的准确性。8 调查成果 调查分析报告 8.1 8.1.1 居民出行调查分析报告内容应包括数据采集与处理、居民出行信息提取方法、居民出行特征的识别与统计及相关参数取值。8.1.2 居民出行调查分析报告中数据分析部分应结合图形或图表形式展示。关键过程数据 8.2 8.2.1 关键过程数据应包括行政区(县)、街道或组团和所采用基本空间单元层级的相关统计数据,数据格式包括但不限于以表格文件(.xls 格式)、文本文件(.csv 格式)等形式进行存储,并应提供不同尺度空间单元(空间栅格、交通小区、街道、行政区)的划分方式、空间边界线、编号和位置对应关系、从属关系。8.2.2 基于多种尺度空间单元的关键过程数据应至少包含以下内容:a)基于空间单元的出行量统计;b)基于空间单元的通勤出行量统计;c)基于空间单元的职住关系统计;d)基于空间单元的常住人口数量统计;e)基于空间单元的短期驻留人口数量统计。8.2.3 基于空间单元的关键过程数据表格见附录B。DB5201/T 1372024 8 A A 附 录 A(规范性)数据类型格式与数据文件存储格式 A.1 数据类型格式 数据类型格式见表A.1。表A.1 数据类型格式 数据类型 数据格式 说明 数据格式示例 字符型(string)Cm 表示定长 m 个字符型格式,m为自然数 C5 表示定长5 个字符 C.0 表示长度不确定的字符型格式 C.0 表示一个长度不确定的字符,一般多为大量的文本内容 C.表示确定最小和最大长度的不定长字符 C1.10 表示一个最短1 位、最长 10 位的字符型格式;C.6表示该指标是一个最长为6位的字符 数值型(int、double)Nm 表示定长为 m 位的数字,m 为自然数 N8 表示定长8 位的数值 N.m 表示最长为 m 位的数字,m 为自然数 N.4 表示最长4 位的数值 N.p,q 表示最长 p 位数字,小数点后 q位,p、q均为自然数 N.8,2 表示最长8 位,小数点后 2 位的数值 日期时间型(Date)DT 形式 YYYYMMDDhhmmss(24 小时制)20060612235959 D 形式 YYYYMMDD 20060612 逻辑型(bool)B 0 表示非,1 表示是 0 或 1 A.2 数据文件存储格式 基站数据文件和信令数据文件主要以表格文件(.xls)、文本文件(.csv)等形式存储,字段间采用“,”分隔。csv格式要求如下:a)开头不留空,以行为单位;b)可含或不含列名,含列名则居文件第一行;c)一行数据不跨行,无空行;d)以半角逗号(即,)作分隔符,列为空也应表达其存在;e)列内容如存在半角引号(即),替换成半角双引号()转义,即用半角引号(即)将该字段值包含起来;f)文件读写时引号,逗号操作规则互逆;g)内码格式不限,可为 ASCII、Unicode 或其他;h)不支持数字和特殊字符。DB5201/T 1372024 9 B B 附 录 B(资料性)基于空间单元的关键过程数据表格 B.1 出行量统计表 基于空间单元的出行量统计表见B.1。表B.1 基于空间单元的出行量统计表 ITEM MARKDAY TIME_O TIME_D CELL_O CELL_D COV_TRIP B.2 通勤出行量统计表 基于空间单元的通勤出行量统计表见B.2。表B.2 基于空间单元的通勤出行量统计表 ITEM MARKDAY TIME_O TIME_D CELL_O CELL_D COV_TRIP B.3 职住关系统计表 基于空间单元的职住关系统计表见B.3。表B.3 基于空间单元的职住关系统计表 ITEM CELL_HOME CELL_WORK COV_HW DB5201/T 1372024 10 B.4 常住人口数量统计表 基于空间单元的常住人口数量统计表见B.4。表B.4 基于空间单元的常住人口数量统计表 ITEM CELL COV_HOME COV_WORK B.5 短期驻留人口数量统计 基于空间单元的短期驻留人口数量统计表见B.5。表B.5 基于空间单元的短期驻留人口数量统计表 ITEM MARKDAY CELL COV_DAY COV_NIGHT B.6 字段说明 统计表的字段说明见表B.6。表B.6 统计表的字段说明 字段名称 说明 ITEM 序号 MARKDAY 日期类型,可分为工作日和周末 TIME_O 出行开始时段 TIME_D 出行结束时段 CELL_O 出行起点的空间单元编号 CELL_D 出行终点的空间单元编号 COV_TRIP 出行量 CELL_HOME 居住地的空间单元编号 CELL_WORK 就业地的空间单元编号 COV_HW 符合职住关系条件的人数 CELL 空间单元编号 COV_HOME 以某空间单元为居住地的常住人口数量 COV_WORK 以某空间单元为就业地的常住人口数量 COV_DAY 白天短期驻留人口数量 COV_NIGHT 晚上短期驻留人口数量 DB5201/T 1372024 11 参 考 文 献 1 GB/T 51334-2018 城市综合交通调查技术标准 2 JT/T 1182.1-2018 基于手机信令的路网运行状态监测数据采集及交换服务 第 1 部分:数据元 D B 5 2 0 1/T 1 3 7-2 0 2 4
展开阅读全文