本文选取的高铁交通大数据主要包括数据名称、数据类型、数据来源、样本量等字段,主要涉及两方面数据。①高铁站区新增企业数据和高铁开通时间。使用爱企查数据平台的地图查询工具,选取各高铁站点周边3000米内的企业,导出自高铁站开通以来新设立并运营至2023年底的企业数据,具体包括企业名称、注册地址、行业类别、企业类型、成立时间等信息,之后依据《国民经济行业分类》(GB/T 4754—2017)的定义,借鉴王少剑等的做法,剔除4个明显的政务性和福利性行业以及文体教育类行业,剔除采掘业以及电力、煤气和水生产供应业等在很大程度上依赖于自然资源分布的行业,并兼顾行业特性,将样本量较少的金融业划归商务服务业,最终筛选出具有代表性的11个产业作为研究主体。②企业空间点位数据。本文利用企业注册地址和百度地图开放平台,批量查询企业注册地址对应的经纬度坐标,从而形成高铁站区企业的GIS空间点位地图。通过分析,除去地址不清晰和无法识别的企业,本文选取的案例站区的企业总空间化率均超过80%。