当前位置：首页 > news >正文

【论文分享】使用多源数据识别建筑功能：以中国三大城市群为例

news 2026/3/18 2:55:28

建筑功能对城市规划至关重要，而利用多源数据进行建筑功能分类有助于支持城市规划政策。本研究通过分析建筑特征和POI密度，识别了中国三个城市群的建筑功能，并使用XGBoost模型验证了其在大规模映射中的高准确性和有效性。研究强调了建筑环境对分类准确性的影响，并发现长三角和珠三角城市群的开发策略较为协调，而京津冀城市群则不然。

【论文题目】

Identifying building function using multisource data: A case study of China's three major urban agglomerations

【题目翻译】

使用多源数据识别建筑功能：以中国三大城市群为例

【期刊信息】

Sustainable Cities and Society，Volume 108, August 2024, 105498

【作者信息】

Yue Zheng, 广东省城市化与地理仿真重点实验室，地理与规划学院，中山大学，广州 510275，中国

Xucai Zhang, 地理系，根特大学，比利时根特9000；跨学科空间分析实验室（LISA），土地经济系，剑桥大学，英国

Jinpei Ou, 广东省城市化与地理仿真重点实验室，地理与规划学院，中山大学，广州 510275，中国

Xiaoping Liu，广东省城市化与地理仿真重点实验室，地理与规划学院，中山大学，广州 510275，中国；南方海洋科学与工程广东省实验室（珠海），珠海 519000，中国，liuxp3@mail.sysu.edu.cn

【论文链接】

https://doi.org/10.1016/j.scs.2024.105498

【关键词】

建筑功能映射、XGBoost、兴趣点、建成环境、建筑几何特征

【本文亮点】

一种在大规模下快速识别单个建筑功能的方法。
通过迁移实验验证建筑环境的有效性。
成功识别了中国3900万座建筑的功能。

【摘要】

作为塑造城市景观的关键地理成分，定义建筑功能在规划城市发展和促进社会经济活动中发挥着重要作用。现有的大规模映射研究主要忽视了建筑周围环境，导致在某些学科中对大规模建筑级别映射的需求不能得到充分满足。为了弥补这一差距，本文计算了建筑轮廓的几何特征、建筑与邻近物体的距离以及兴趣点（POI）的核密度，以识别中国三个城市群（京津冀城市群、长三角城市群和珠三角城市群）中的建筑主要功能。通过利用XGBoost，我们的模型在三个城市群中分别达到了0.936、0.934和0.940的准确率，以及0.883、0.868和0.891的kappa系数，表明其在大规模映射中识别建筑功能的能力。此外，对不同特征组合和迁移能力的实验强调了建筑环境在提高分类准确性方面的重要性。此外，对三个城市群建筑分类结果的分析显示，长三角城市群和珠三角城市群的开发策略协调一致，而京津冀城市群的城市则没有表现出相同的发展策略。所有结果表明，利用多源可获得数据来高效地对大区域内的建筑功能进行分类是可行的，并且具有成本效益。这一方法可以在中国甚至更大范围内复制，为复杂的城市空间提供洞察，并帮助城市规划者提供政策支持，如旧城改造和新城规划。

【引言】

城市和城市群作为经济和社会发展的主要引擎，是中国现代化的主战场（Fang et al., 2013; Fang & Yu, 2017; Guan et al., 2018）。自改革开放政策以来，中国大力推动城市化，根据中国国家统计局发布的《政府工作报告》，城市化率从1978年的17.9%激增至2022年的65.2%（Keqiang, 2023; Xiaobo et al., 2018）。建筑物构成了城市的物质基础，是城市生活的核心，第一项国家自然灾害风险调查显示，中国城市和农村地区的建筑总数高达6亿。快速的城市化进程带来了中国建筑数量和功能的重大变化（Wang et al., 2015）。建筑功能作为建筑的核心元素，提供了人类的基本需求，并揭示了人类活动的社会经济形式（Niu & Silva, 2021; Zhang & Zhang, 2009）。在这种背景下，对国家建筑功能分类的全面和细致理解有助于未来的城市规划、环境保护、热岛效应响应、建筑部门的碳中和以及其他各种倡议（Choi & Yoon, 2023; Shen et al., 2021）。然而，传统的手工建筑功能调查费时且覆盖面有限。商业地图服务如Google Maps通常无法直接提供单个建筑的功能，只提供兴趣点（POI）的功能。因此，急需提出一种快速且自动化的大规模建筑功能识别方法。
几十年来，许多研究人员专注于智能功能映射方法的深入研究，这些方法适用于大规模映射。传统方法主要关注地块级别的土地利用分类，主要依赖遥感数据和地理特征或纹理，忽视了人类活动的社会经济特征（Hu & Wang, 2013; Pacifici et al., 2009）。近年来，许多新兴的城市数据，如手机信号数据（Wei Tu & Li, 2017）、社交网络签到数据（Cai et al., 2022）和兴趣点数据（POI）（Andrade et al., 2020），被用于更细粒度的城市土地利用映射。同时，机器学习算法的广泛应用促进了这些不同数据集与遥感信息的更有效集成，为城市土地利用研究开辟了新的途径。例如，GongPeng et al.（2020）应用随机森林算法，利用高德POI、腾讯MPL、夜间灯光影像及其他遥感数据对中国440,000个城市地块进行了分类。类似地，Zhang et al.（2020）利用微博签到数据来细化广州的土地利用类型，并比较了随机森林、支持向量机和朴素贝叶斯模型的性能。尽管这些研究在一定程度上提高了准确性，但其对地块级别分类（Zhang et al., 2020）的关注仍不足以探索具有高度混合和快速变化土地利用的现代城市。迫切需要开发新技术以实现细粒度的建筑功能映射，尤其是在大规模下，以描述单个建筑功能的分布。
在城市土地利用分类的基础上，关于单个建筑功能分类的研究已经展开。高分辨率遥感影像包含丰富的地面细节信息，学者们从中提取光谱特征以分类屋顶类型或连续建筑类型（Taubenböck et al., 2009）。然而，从这些地球观测遥感影像中推断建筑类型仍然具有挑战性。此外，像素级别的遥感影像可能导致建筑边缘或角落几何信息的丢失。此外，地面图像数据被引入用于识别单个建筑的功能，常用来源包括通过在线地图服务如OpenStreetMap或Google Street View获取的街景图像（Shivangi Srivastava & Tuia, 2020; Srivastava et al., 2018），这些图像提供了建筑轮廓和建筑立面的详细特征（Atwal et al., 2022）。例如，Kang et al.（2018）使用街景数据推广了一种实例建筑分类方法，并在美国和加拿大的多个城市进行实验，将建筑分类为八个类别，并取得了更好的结果。然而，街景地图的明显缺点是覆盖范围有限（Cao et al., 2018）。街景地图只能提供主要城市的详细描述，并集中在道路沿线，这对处理远离道路的建筑物提出了挑战（Zhong et al., 2014）。随后，社交媒体数据被引入到单个建筑分类中，如微信用户密度和签到数据，以及出租车轨迹。Liu et al.（2018）整合了社交网络数据、出租车轨迹和遥感影像来描述广州天河区的建筑。Zhang et al.（2023）引入了腾讯位置数据集，以识别深圳南山区的建筑类别。Zhuo et al.（2019）结合了出租车轨迹数据和实时腾讯用户密度（TUD）数据，识别广州海珠区的建筑功能。类似地，出租车轨迹数据通常难以覆盖整个城市区域，对远离主要道路的建筑功能推断存在困难。此外，高分辨率TUD数据通常不公开且难以获取。在城市群或全国范围内的广阔区域进行建筑功能识别研究困难重重。总体而言，无论是基于街景地图还是社交媒体数据的方法，都仅适用于数据覆盖丰富的小区域内的建筑功能识别。因此，在大规模下识别单个建筑功能仍面临许多挑战。
近年来，一些学者也尝试在大规模下进行建筑功能识别。Chen et al.（2023）整合了POI、土地利用地块和建筑几何数据，使用OneClassSVM在美国50个城市识别建筑功能。然而，他们仅简单地将POI类别分配给建筑，未能充分展示POI数据与建筑之间的空间关系。然而，在大区域尺度上识别单个建筑功能仍有很大的改进空间。Zhang et al.（2023）在深圳的实验确认了考虑建筑环境对建筑功能识别的有效性，这在现有的大规模建筑功能识别中尚未被考虑。应考虑邻近建筑的影响，也应考虑其他邻里因素。例如，建筑与道路之间的距离很重要，因为商业和公共建筑通常位于道路附近，而住宅建筑通常与邻近建筑的距离较小。因此，需要进一步挖掘POI的使用，并考虑建筑环境，以实现大规模建筑功能映射。
为弥补这些研究空白，本文引入了包括建筑环境信息（到最近道路、河流和建筑物的距离）和POI数据在内的多源数据，以及建筑几何特征（通过形状指标量化的建筑轮廓几何属性）。通过利用机器学习算法，我们的实验展示了这一方法在广泛区域内快速识别建筑功能的适用性。本文的贡献总结如下：1. 本研究引入了建筑自身的几何特征，包括12个二维形状指标和一个三维特征建筑高度，这在识别建筑分类中非常有用。2. 我们计算了目标建筑的POI核密度，而不是量化POI数量，旨在更好地弥补POI分布不均的情况，并提供更细致的理解。3. 我们充分考虑了建筑环境，不仅包括最近的建筑，还包括到最近道路、水体和城市中心的距离。4. 通过对不同模型和特征组合的彻底比较，我们选择了XGBoost算法，该算法在三个城市群中分别达到了0.936、0.934和0.940的准确率，kappa系数分别为0.883、0.868和0.891。多个验证实验充分证明了所选多源数据和模型在大区域尺度上识别单个建筑功能的有效性。

【材料和方法】

2.1. 时间序列夜间光数据集的构建

本研究选择了中国的三个主要城市群作为研究区域：北京-天津-河北城市群（BTHUA）、长江三角洲城市群（YRDUA）和珠江三角洲城市群（PRDUA）。BTHUA位于中国北方，是中国的“首都经济圈”。该区域包括13个城市，涵盖了北京、天津以及河北省的保定、唐山、廊坊、石家庄、秦皇岛、张家口、承德、沧州、衡水、新泰和邯郸。YRDUA位于长江下游，包括直辖市上海，以及江苏省的南京、无锡、常州、苏州、南通、扬州、镇江、泰州，浙江省的杭州、宁波、嘉兴、湖州、绍兴、舟山和台州，共计16个城市和近1200万座建筑。PRDUA作为中国南部对外开放的门户，包括广东省的广州、佛山、肇庆、深圳、东莞、惠州、珠海、中山和江门，覆盖了700万座建筑。三个城市群代表了中国人口密度最高、创新能力最强、综合实力最优的地区。这些城市建筑的复杂性和多样性使得模型在挑战条件下识别建筑功能的能力得到了更全面的检验。因此，选择这38个城市作为研究区域具有战略意义，为大规模建筑功能分类提供了宝贵的洞见。城市位置如图1所示。

图1. 中国三个主要城市群及38个城市的位置和空间分布

2.2. 数据集准备与处理

表1总结了本研究中使用的数据及其来源，包括建筑数据、兴趣点（POIs）、道路网络、水路和县级中心。

表 1 数据集和来源的总结

表2 建筑主要功能类型

表3 建筑轮廓的形状指标

2.2.1. 建筑数据

本研究中使用的建筑数据可以分为两个主要部分：（1）建筑轮廓和高度；（2）建筑功能数据。建筑轮廓数据来源于Shi等人（2023）发布的公开数据，这些数据提供了包括中国在内的东亚地区的高质量和完整的建筑轮廓数据。建筑高度数据来自百度地图，这是中国的一家专业地图数据服务平台，提供大量的基础地理数据。建筑功能数据来自Open Street Map（OSM）和政府调查数据。OSM提供了部分建筑的功能信息。具体来说，在长三角城市群（YRDUA）中，该数据集包括22万栋建筑的信息；在京津冀城市群（BTHUA）中，有13万栋建筑的信息；在珠三角城市群（PRDUA）中，涵盖了4万栋建筑的功能信息。此外，还包含了政府调查数据，涵盖了深圳50万栋建筑和珠三角城市群120万栋建筑的功能信息。在整理和精炼这两个数据集后，我们通过谷歌地图和街景数据验证了数据的正确性。建筑功能的分类依据中国土地利用分类标准进行精细化，详细分类列在表2中。需要特别说明的是，本文中识别的建筑功能指的是建筑的主要功能，而非混合功能。例如，如果一栋住宅楼的底层包含零售店等商业店铺，而上层是住宅房屋，那么该建筑的主要功能仍然是住宅楼，而不是商业和住宅混合建筑。该数据集被视为“训练数据集”和“测试数据集”，以便于模型的训练和验证。

建筑轮廓包含了每个顶点的纬度和经度坐标，从中可以推导出大量其他指标。建筑轮廓的几何特征在一些建筑研究中得到了应用，并且被证明是有效的（Arehart等人，2021）。在本研究中，我们尝试探讨建筑轮廓几何特征对建筑功能识别的贡献。除了建筑高度外，我们计算了12个与建筑轮廓相关的形状指数，包括部分简单指标，如建筑轮廓的面积和周长、最小建筑包围矩形和最小凸包，以及复杂指标，如紧凑性和分形度。我们选择这12个指数不仅因为它们可以有效量化对象的整体几何配置，还因为它们在之前的研究中被广泛使用（Xu等人，2022）。这些指标的名称和计算公式详见表3。

2.2.2. 兴趣点和开放街图

POI 数据集记录了丰富的实际地理空间信息，能够很好地反映城市中的社会经济、功能结构、人口分布以及其他空间特征。利用其丰富的语义、短期获取周期、低成本和快速更新，POI 在城市社会经济空间分布、城市土地利用模拟和城市功能区域识别中得到了广泛应用。在本研究中，我们使用了高德地图（http://gaode.com）提供的 POI 数据，这些数据能够提供中国丰富的 POI 数据以进行建筑分类。在应用之前，POI 数据的预处理至关重要。首先，为了匹配建筑功能分类标准，我们将 POI 数据重新分类为 12 类：城市村庄/乡村、城市住宅、酒店、餐厅、购物、工厂、公共设施、交通、金融、政府、医疗服务和教育。其次，POI 的分布在城市中是不均匀的。商业中心和中央商务区等人口密集区域往往拥有集中的 POI，而不太繁忙的区域则表现出较稀疏的 POI 分布。这导致一个建筑物中可能会有多个不同类别的POI，而有些建筑物可能完全没有 POI。为了解决这个问题，我们引入了核密度分析，这是一种非参数统计方法，用于估计数据分布，广泛应用于地学研究，能够更好地揭示数据的空间分布模式和特征。对 12 种POI 的核密度分别在 500 米范围和1000 米范围内进行了计算，从而计算出每个建筑的 POI 核密度，而不仅仅是计数POI 的数量。通过考虑两个不同范围内的 POI 核密度，这种计算方式不仅考虑了POI 对所在建筑的影响，还考虑了它们对周围区域的影响。这种方法增强了对 POI 对特定建筑及其更广泛背景影响的理解。

开放街图（OpenStreetMap，简称OSM）是一个志愿地理信息（VGI）项目，提供了丰富的地理数据，包括交通路线、土地利用图、水道和建筑物。其中，路网和水道被选用于后续的建筑功能分类。此外，县中心的位置通过高德地图确定。至今，已经计算了每个建筑物到道路网络、水道和县中心的欧几里得距离，作为建成环境信息。

2.3. 整体框架

我们使用 XGBoost 算法来识别三个城市群中的建筑功能，基于描述建筑轮廓几何特征的形状指数、POI 数据和建筑环境信息。本研究的整体框架如图2 所示，分为四个部分：(1) 数据准备，包括收集和处理各种类型的数据集以生成模型变量，并收集带有类别信息的建筑用于训练和测试样本集；(2) 模型开发，在此过程中我们设计了五种不同的特征组合并引入了四种不同的算法。我们分别在每个城市群中构建了 XGBoost 分类模型，使用训练样本集对模型进行训练，并使用测试样本集对模型进行评估。然后，我们评估了模型在深圳的适用性；(3) 结果展示，包括选择三个城市的部分区域进行三维展示并验证其正确性；(4) 评估和分析，展示归一化混淆矩阵并分析各城市中不同建筑类型的数量和比例。

图 2. 建筑功能识别的整体框架

2.4. 模型说明和评估

决策树、随机森林和极端梯度提升（XGBoost）算法是目前广泛使用且成本效益高的监督学习分类方法。其中，XGBoost 算法是一种基于决策树梯度提升的集成机器学习算法（Chen et al., 2015）。在 XGBoost 中，每棵决策树是逐步构建的。在构建的每一步中，需要考虑前面决策树的结果，以获得更好的预测。此外，引入了正则化和梯度下降，使算法具有更好的鲁棒性和泛化能力。与随机森林相比，后者通过对每棵决策树的结果进行投票或平均来获得最终结果，XGBoost 算法的优化技术更适合解决大规模数据集和高维特征问题，并能提供更好的预测。XGBoost 在各种地质研究和城市问题中已被证明是可靠的（Abdullah et al., 2019；Abedi et al., 2022；Lu et al., 2021；Zhou et al., 2022）。

在本文中，我们应用 XGBoost 算法来识别中国三个主要城市群的建筑功能。使用每个建筑属性作为自变量，建筑功能作为因变量，XGBoost 模型在训练样本上进行了训练，并在测试样本上进行了测试。
我们引入了两个指标来评估模型性能：准确率和 Kappa 系数。准确率是检测模拟值准确性的基本评估指标。Kappa系数是基于混淆矩阵的一致性测试指标。对于分类问题，Kappa 系数用于测试模型模拟结果与实际分类之间的一致性。Kappa 系数可以分为五个组，表示不同的一致性水平：0.00.20为非常轻微的一致性，0.210.40 为一般一致性，0.410.60为中等一致性，0.610.80 为显著一致性，0.81~1为几乎完美的一致性。计算准确率和 Kappa 系数的公式（公式(1)–(4)）如下：

Isodata方法在K-means聚类算法的基础上做了一些改进，其中最显著的优化是：虽然K-means和Isodata方法都需要预先指定聚类数，但Isodata更加灵活。如果类间距离小于用户指定的值或类内样本数过少，它可以自动“合并”聚类；如果聚类数少于指定值的一半，它可以自动“分裂”聚类，从而达到理想的聚类效果。在本研究中，K-means方法中的k值是根据Isodata自动“分裂”或“合并”所获得的最终聚类数来确定的。

【结果与讨论】

3.1. 模型性能比较

对于三个主要的城市群，我们在城市群内进行了随机抽样，将70%的样本用作训练样本，其余30%作为测试样本。同时，我们对随机森林、决策树、前馈神经网络算法和XGBoost算法进行了比较，如表4所示。在XGBoost算法中，北京-天津-河北城市群的准确率为0.936，Kappa系数为0.883；长江三角洲城市群的准确率为0.934，Kappa系数为0.868；珠江三角洲城市群的准确率为0.940，Kappa系数为0.891，这些都优于其他算法。在模型设置和调整方面，我们使用了“GridSearchCV”函数进行调整，并引入了早期停止机制，其中包括几个重要的超参数，如学习率0.05；n_estimators为400，max_depth为12。

图3 京津冀城市群、长江三角洲城市群和珠江三角洲城市群的归一化混淆矩阵

表4 三个城市群中不同模型的结果

我们编制了三个地区模拟结果与真实结果之间的标准化混淆矩阵，如图3所示。纵轴为建筑物的真实类别，横轴为模型模拟的类别，沿对角线的值表示模型正确模拟的每个类别建筑物的比例。可以看到，城市村庄/乡村、住宅和工厂的准确性在所有三个区域均保持在较高水平。同时，北京-天津-河北城市群和长江三角洲城市群的学校建筑模拟结果也较好，准确率均超过0.85。此外，商业和酒店的精确度稍差，这可能与这些类别样本较少有关，导致可能的混淆。

图4 三大城市群的特征重要性地图。形状指标的缩写已在表3中详细解释。以“_1”和“_5”结尾的特征表示不同类型POI的核密度值。以“Dis”开头的特征表示与其他地理实体的距离

图4展示了XGBoost模型的特征重要性，从左到右分别是BTHUA、YRDUA和PRDUA。每个城市群中每个特征的重要性值不同，排名差异显著。在BTHUA中，建筑高度的贡献最大，而在YRDUA和PRDUA中，最重要的特征分别是最小建筑包围矩形的宽度和长度。此外，一些特征在三个研究区域中始终保持较高的排名和重要性值，如建筑高度、商业、工厂和医院的POI核密度，这表明这些特征对于建筑功能识别在任何区域都是重要的。令人惊讶的是，几个建筑环境特征在三个研究区域中排名较高，表明这些特征的引入对推断建筑功能是有意义的。特征重要性图表明，不同特征集的选择对模型性能的影响不同。为了验证不同特征组合对建筑功能分类的影响并选择最佳特征组合，我们进行了五组实验（M1-M5），表5详细列出了每组实验的特征选择。表 5 不同特征组合下的实验模型

其中，POI核密度指的是12种POI类型的核密度值。建筑环境指的是每个建筑物到最近建筑物、道路网络、水道和县中心的欧几里得距离。形状指数是描述每个建筑物轮廓几何特征的指标。表 6 三大城市群中不同模型和不同特征组合的结果

从表6中的分析结果可以明显看出，三个城市群中的XGBoost模型表现出良好的准确性，特别是当结合了POI核密度、建筑高度、建筑环境信息和建筑几何特征的形状指数的特征组合5时，这些结果确认了三种特征在准确识别建筑功能中的重要性，特别是建筑环境信息的纳入显著提高了模型的准确性。特征组合5中的模型特征是在追求准确性和有效性过程中优化的顶峰。此外，从不同模型准确度的比较中也可以看出，XGBoost模型的准确度始终高于其他模型。这可能归因于XGBoost在其结构中引入了更多的正则化和优化技术，从而在处理大规模数据集和高维特征时表现最优。

3.2. 模型迁移能力

模型的迁移能力是至关重要的，因此我们在本节中评估了这一能力。我们选择在深圳进行此实验，因为其他城市和地区样本稀疏，难以准确反映迁移实验的效果。深圳为超过50万栋建筑提供了真实的建筑功能信息，使我们在类型和数量上获得了更完整的样本。位于深圳经济特区中部的福田区也是该市的行政、金融、文化、商业和国际交流中心，该区内的建筑类型广泛（见图5）。为了评估模型的性能和迁移能力，我们随机从福田区的18000栋建筑中选择了30%的样本作为验证样本。首先，我们选择用深圳市内福田区以外的建筑进行训练，同时作为对照，我们用福田区剩余70%的样本训练另一个模型，以预测相同的验证样本。同时，为了验证建筑环境在模型迁移能力中的重要性，我们分别训练了包含和不包含建筑环境信息的模型。我们实验的综合结果详见表7。

图 5 深圳及福田区的位置

表 7 模型迁移性结果

对结果的细致分析揭示了建筑环境对四种不同模型准确性的影响。特别是，在随机抽样时，建筑环境的整合在所有模型中都显现出明显但适度的准确性提升。相比之下，建筑环境在迁移实验中的准确性提升中发挥了关键作用。同样，在所有模型比较中，XGBoost模型在迁移和随机抽样中均表现最为有效。迁移能力方面观察到的显著效果突显了建筑环境在提高建筑功能识别中的重要性。

3.3. 建筑功能分类结果展示

由于研究范围广泛，我们无法展示所有建筑功能分类的结果。因此，我们选择展示三个城市群中一些关键区域的详细结果，包括5公里网格下的测试样本准确性以及不同功能区域的3D表现：北京市的故宫及其周边、上海市的陆家嘴区，以及广州市的高等教育 mega 中心。这些选定地点为展示我们的功能分类模型在不同城市环境中的有效性和应用提供了说明性例子。

图 6 北京故宫周边建筑分类地图

3.3.1.故宫，北京

如图6所示，左侧为北京市5公里网格下的准确性地图，展示了整体满意的结果；右侧为故宫的3D展示。故宫（即紫禁城）是中国明清两代的皇宫，位于北京市中心轴线的中部，是世界上最大且保存最完好的古木结构群之一，也是世界遗产。故宫前的天安门广场上有中国国家博物馆和毛泽东纪念堂，这些作为对公众开放的博物馆在研究中被归类为红色公共建筑。故宫东侧分布着住宅建筑，大多数是胡同和四合院，典型的北方中国住宅。在天安门广场东侧，有中国生态环境部、首都酒店等。此外，大多数王府井步行街上的建筑被识别为商业建筑，少数为商务建筑。北京协和医院和北京妇产医院也被成功识别为医疗建筑。

图 7 上海陆家嘴地区建筑分类地图

3.3.2.陆家嘴区，上海

图7左侧展示了上海5公里网格下的准确性地图，右侧为位于上海浦东新区黄浦江畔的陆家嘴区。作为上海国际金融中心的核心功能区，陆家嘴是许多跨国银行和公司的中国及东亚总部所在地。陆家嘴区包含大量高层或超高层商务建筑，如632米的上海中心大厦，它是上海的地标建筑，主要用于办公、商业和旅游。上海国际会议中心是现代化的会议场所，准确地被识别为公共建筑。此外，陆家嘴有许多豪华酒店，如凯宾斯基酒店、上海浦东文华东方酒店、香格里拉酒店等，这些在图中显示为深绿色。陆家嘴东部有更多如汤臣瑞士等住宅建筑，这些建筑排列整齐，高度较商务建筑低。东方明珠电视塔是集城市观光、时尚餐饮、购物娱乐、广播电视传输等多功能于一体的国家5A级旅游景区。在研究中，它被归类为商业建筑。

图 8 广州高等教育Mega 中心建筑分类地图

3.3.3.广州高等教育 mega 中心

图8中，测试样本的分布不如北京和上海广泛，但5公里网格也基本覆盖了广州市的主要城市区域。图8右侧展示了位于广州番禺区小谷围岛的广州高等教育 mega 中心（HEMC），占地17.9平方公里，是世界上为数不多的岛屿大学城之一，目前大学城内有十所大学，包括中山大学和华南理工大学。HEMC内大部分区域为大学，因此大量建筑为教学或宿舍楼，在图中被标为紫色教育建筑。大学城内有四个城中村，分别是北岗村、南亭村、北亭村和随石村，在地图上显示为橙色的小建筑群。城中村附近有许多小餐馆和其他商业店铺，在地图上显示为翡翠绿色。在HEMC的南北轴附近，有几个高层住宅区，图中显示为蓝色建筑。HEMC西北部的广东科学中心作为一个社会科学和技术活动场所，为公众提供科学教育，正确地被归类为公共建筑。大学城中心的大学城主体育场也被归类为公共建筑。高等教育 mega 中心南部的岭南印象园作为岭南民俗文化的旅游景点，也被归类为公共建筑。广东省中医院，作为HEMC唯一的三级综合医院，被正确地归类为医疗类别。此外，大学城内的商业中心 GOGO 新世界在图8的右上角显示为翡翠绿色。

3.4. 各类别建筑数量和比例统计

使用训练好的XGBoost模型对三个主要城市群的建筑进行功能分类，得到了详细的分类信息，共涵盖230万栋建筑。为了对这些建筑进行详细分析，我们首先统计了各类别建筑的数量和比例。如图9所示，每个城市的堆叠柱状图展示了每个类别建筑的数量，高度表示建筑数量。附带的饼图则展示了各城市中建筑数量占比大于1%的类别比例。

图 9 每个城市中不同类型建筑的数量和百分比

根据《广东省旧城区旧厂区旧村落休闲协会和国家发展战略学院，RUC，2023年年鉴与报告》及《住房和城乡建设部，2022年》，广州和深圳的城中村因其规模大、密度高在国家特大城市中显得尤为突出，而其他城市群中的城中村/村主要集中在外围区域。尽管广州、深圳和东莞与北京、上海和南京都属于一线或新一线城市，但PRDUA中的城中村数量和比例显著高于后者。此外，广东和江苏的城市化率分别排名第七和第八，超过河北省13%以上，河北省排名第22（中国国家统计局，未注明日期）。在BTHUA中，保定、邢台、邯郸等城市的城中村/村比例较高，可能与河北省大量农村地区有关。在YRDUA中，住宅建筑占据了最大类别，占比超过46%。在三个主要城市群中，YRDUA的商业建筑比例最高，达到了2.3%，这显示了其在商业上的繁荣程度。相反，PRDUA中的工厂建筑比例明显高于其他两个城市群，这与PRDUA作为改革开放的前沿和世界工厂的制造业发达密切相关（Li等，2022年）。总体而言，建筑功能比例的结果和分析表明，YRDUA在三个主要城市群中最适合商业开发，而PRDUA则在工业方面特别发达。

图 10 住宅建筑与非住宅建筑数量的散点图

图10展示了每个城市中的住宅建筑（城市住宅和城中村/村）和非住宅建筑的数量，用红色表示非住宅建筑比例高的城市，用蓝色表示住宅建筑比例高的城市。观察发现，PRDUA中的大多数城市具有较高的非住宅建筑比例，而BTHUA中的大多数城市则具有较高的住宅建筑比例。此外，图中突出显示了如上海、广州、保定和北京等城市的非住宅建筑数量都超过了38万栋。此外，珠江三角洲和长江三角洲城市群中的城市在散点图中较为接近，暗示了这些城市发展战略的相似性。相比之下，BTHUA中的城市分布更为分散，表明城市之间的建筑数量和比例差异较大。这意味着BTHUA中的城市在发展战略上并不完全一致，违背了城市群城市一体化的理念。在制定政策时，决策者应更加关注城市群内城市发展战略的协调性。

【结论】

本研究提出了一种基于POI数据、建筑环境信息和建筑轮廓几何特征的方法，以快速识别大范围区域内单栋建筑的功能。我们在研究中详细考察了不同特征组合的影响，并采用了包括随机森林、决策树和前馈神经网络等多种算法，评估了它们对建筑功能准确识别的效果。通过一系列实验，我们的发现不仅确认了所选特征的有效性，还揭示了它们的最佳组合。这些实验扩展到了迁移场景，结果突显了建筑环境的重要性。虽然在随机抽样且样本分布均匀的情况下，建筑环境信息可能不会显著提高准确性，但在迁移实验中其效用变得明显。基于这些实验，我们成功识别了中国三个主要城市群中超过3900万栋建筑的功能分类。验证过程进一步确认了我们方法的可行性，三大城市的模型测试样本准确率均超过0.93，Kappa系数超过0.86。建筑分类的结果以三维方式进行了全面展示。此外，我们详细分析了38个城市中不同建筑类别的数量和比例。分析揭示了一个一致的模式：在每个城市和城市群中，住宅建筑（无论是城市住宅还是城中村/村）的比例和数量始终排名第一。由于城市化率较低，BTHUA的城中村/村比例较高，而YRDUA则表现出较高的商业建筑比例，而以工业著称的PRDUA则具有比其他两个城市群更多的工厂建筑。与其他两个主要城市群中的城市较为相似相比，BTHUA中的城市住宅比例更高，建筑比例差异更大，这表明在制定政策时应更加考虑城市之间的差异。BTHUA中建筑功能的独特动态和变化需要更有针对性和细致的政策制定，考虑到每个城市在城市群中的具体需求和挑战。

未来的研究应致力于解决本研究的局限性。首先，鉴于研究的广泛范围和大量建筑数据，应进行更全面的验证过程。本研究提到，仅选取了少数城市中的部分建筑进行验证，我们将扩大验证过程，涵盖来自不同城市的更多具有代表性的建筑样本。其次，本研究获取的建筑功能指的是建筑的主要功能。为了提供更细致的理解，未来的研究可以探讨识别单栋建筑的多重潜在功能，以反映其实际使用情况，例如混合住宅和商业功能。这可能涉及开发一个更精细的分类系统，包括数十个类别，并建立准确性验证机制。第三，在计算建筑与其他实体（如最近建筑、城市中心、道路和水道）的接近度时，我们使用了欧几里得距离，主要是为了降低计算成本。未来的实验可以考虑使用更现实的替代距离度量，如曼哈顿距离或网络距离。最后，尽管本研究涵盖了中国广泛的区域，但涉及的建筑都是中国风格的。模型所需的数据在美国和欧洲也可用。因此，当这些地区和国家的数据可用时，可以验证该方法在不同地理和文化背景下的适用性。例如，调整不同国家建筑环境的建筑分类。
总之，本研究获得的所有结果表明，我们的方法在大范围尺度内识别单栋建筑功能的效果显著，并成功填补了低成本、高效率、高准确性的大区域单栋建筑功能识别的空白。同时，本研究结果也为城市问题的探索提供了更多可能性。建筑分类数据作为分析城市生活各个方面的基础元素。例如，未来的城市研究可以将人口数据与建筑功能分类数据结合，以计算街道和城市尺度的人均住宅面积、适龄儿童的教育资源、人均公共设施以及不同区域居民的医疗设施可达性。通过识别资源的分布不均和不足，可以为城市更新、改善生活环境以及公共设施和基础设施规划选址提供建议和决策支持。此外，建筑功能识别的成就为城市能源供应、建筑碳排放以及城市的精细三维空间研究提供了重要的数据支持。总之，我们研究结果的综合性不仅为建筑功能识别领域做出了贡献，还扩展了此类数据在城市研究和规划的多种潜在应用。

【论文分享】使用多源数据识别建筑功能：以中国三大城市群为例

建筑功能对城市规划至关重要，而利用多源数据进行建筑功能分类有助于支持城市规划政策。本研究通过分析建筑特征和POI密度，识别了中国三个城市群的建筑功能，并使用XGBoost模型验证了其在大规模映射中的高准确性和有效性。研究强调了建筑环境对…...

编程日记 2024/11/20 7:45:40

华为手机启用ADB无线调试功能

打开开发者模式，勾选USB调试，和“仅充电”模式下允许ADB调试确认设置添加adb路径到PATH变量使用adb查看安卓设置切换为无线模式：查看手机IP...

编程日记 2024/11/20 7:41:36

云原生之Kubernetes集群搭建

1、Kubernetets基础概念传统的服务器架构演进，现在基于docker容器化应用可以完成快速部署，但是对于大型的应用，有可能出现成百上千个容器化应用，一个挂了需要人工管理是相当麻烦，因此急需一个大规模容器编排系统。 Kubernetes Kubernetes 是一个可移植、可扩展的开源平…...

编程日记 2024/11/20 7:40:35

STM32单片机CAN总线汽车线路通断检测

目录目录前言一、本设计主要实现哪些很“开门”功能？ 二、电路设计原理图 1.电路图采用Altium Designer进行设计： 2.实物展示图片三、程序源代码设计四、获取资料内容前言随着汽车电子技术的不断发展，车辆通信接口在汽车电子控…...

编程日记 2024/11/20 7:37:32

大连理工大学概率上机作业免费下载

大连理工大学概率论与数理统计上机资源本资源库收录了大连理工大学概率论与数理统计课程的上机作业范例代码，旨在通过实际操作加深学生对概率统计概念的理解，帮助学生更好地理解和掌握知识点。作业内容概览第一题：随机变量关系探索数…...

编程日记 2024/11/20 7:36:31

Tomcat 如何管理 Session

Tomcat 如何管理 Session 我们知道，Tomcat 中每一个 Context 容器对应一个 Web 应用，而 Web 应用之间的 Session 应该是独立的，因此 Session 的管理肯定是 Context 级的，也就是一个 Context 一定关联多个 Session。 Tomcat 中主…...

编程日记 2024/11/20 7:32:28

stm32启动过程解析startup启动文件

1.STM32的启动过程模式 1.1 根据boot引脚决定三种启动模式复位后，在 SYSCLK 的第四个上升沿锁存 BOOT 引脚的值。BOOT0 为专用引脚，而 BOOT1 则与 GPIO 引脚共用。一旦完成对 BOOT1 的采样，相应 GPIO 引脚即进入空闲状态，可用于…...

编程日记 2024/11/20 7:31:24

SystemVerilog学习——构造函数new

一、概述在 SystemVerilog 中，new 是一个构造函数，用于创建类的实例（即对象）。它在面向对象编程（OOP）中起着重要作用，负责实例化一个对象并进行初始化。与传统编程语言（如 C 或 Jav…...

编程日记 2024/11/20 7:30:22

力扣题目总结

1.游戏玩法分析IV AC: select IFNULL(round(count(distinct(Result.player_id)) / count(distinct(Activity.player_id)), 2), 0) as fraction from (select Activity.player_id as player_idfrom (select player_id, DATE_ADD(MIN(event_date), INTERVAL 1 DAY) as second_da…...

编程日记 2024/11/20 7:27:19

Java API 进阶指南：从核心API到高级应用的全面提升

文章目录 Java API 进阶学习指南1. 深入理解核心API1.1 集合框架（Collections Framework）1.2 输入输出流（I/O Streams）1.3 并发编程（Concurrency）1.4 反射（Reflection）1.5 泛型&…...

编程日记 2024/11/20 7:26:14

esp32c3开发板通过micropython的ubluetooth库连蓝牙设备

ESP32-C3开发板是一款高性能、低功耗的微控制器，搭载了Espressif自家的RISC-V处理器。通过MicroPython，一种面向微控制器的精简版Python编程语言，开发者可以轻松地为ESP32-C3编写代码。MicroPython的ubluetooth库使得ESP32-C3能够通过蓝牙与各…...

编程日记 2024/11/20 7:25:10

leetcode hot100【LeetCode 35.搜索插入位置】java实现

LeetCode 35.搜索插入位置题目描述给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用 O(log n) 的时间复杂度来实现。示例 1: 输入: nums [1,3,5,6…...

编程日记 2024/11/20 7:23:08

我们要用平凡来诠释非凡

#孟晚舟香港中文大学演讲# #华为价值观念# #并非站在山顶才能被看见# #传递正确的价值观# #如果信仰有颜色，那一定是中国红# #送给自己的价值理念# 在信息大爆炸的时代，很多同学都希望尽可能的抓取更多的知识，尽可能的不要遗漏任何热点…...

编程日记 2024/11/20 7:22:07

synchronized和volatile区别

synchronized和volatile是Java并发编程中两种重要的同步机制，它们之间存在明显的区别。以下是对这两者的详细比较： 一、基本定义与作用 synchronized 是一个用于实现线程同步的关键字。可以用来锁住方法或代码块，从而确保在同一时刻只有一个…...

编程日记 2024/11/20 7:20:05

125.验证回文串-力扣（LeetCode）

题目： 解题思路： 首先进行移除非字母数字字符，并将大写字符转换为小写字符的操作。这个过程中，主要利用快慢指针的方式来进行移除操作，通过加32将大写字符转换为小写字符。完成后，将前一半的数据与后一半的…...

编程日记 2024/11/20 7:18:03

线程间通信：wait和notify

线程间通信：wait和notify 1、Object的wait和notify方法 Java中的Object类提供了两个重要的方法，用于线程间的通信和同步：wait()方法和notify()方法 wait()方法的定义方法签名：public final void wait() throws InterruptedEx…...

编程日记 2024/11/20 7:16:01

风险识别和管理的工具

1.‌风险识别工具和根本原因识别在项目管理中非常重要，常用的工具包括因果图根本原因识别RCA鱼骨图因果图因果图是一种图形工具，用于识别问题或风险的根本原因。它通过将问题或风险因素与可能的根本原因联系起来，帮助团队更深入地了解问…...

编程日记 2024/11/20 7:13:58

qt之QFTP对文件夹（含嵌套文件夹和文件）、文件删除下载功能

一、前言主要功能如下： 1.实现文件夹的下载和删除，网上很多资料都是单独对某个路径的文件操作的，并不能对文件夹操作 2.实现目标机中含中文名称自动转码，有些系统编码方式不同，下载出来的文件会乱码 3.实现ftp功能…...

编程日记 2024/11/20 7:11:57

为何数据库推荐将IPv4地址存储为32位整数而非字符串？

目录一、IPv4地址在数据库中的存储方式？ 二、IPv4地址的存储方式比较 （一）字符串存储 vs 整数存储 （二）IPv4地址"192.168.1.8"说明三、数据库推荐32位整数存储方式原理四、存储方式对系统性能的影响…...

编程日记 2024/11/20 7:08:53

Mybatis框架之责任链模式 (Chain of Responsibility Pattern)

在 MyBatis 框架中，责任链模式 (Chain of Responsibility Pattern) 被广泛应用于多个功能模块中，例如插件拦截器、SQL 执行流程中的拦截器链、动态 SQL 的解析与处理等。这种设计模式为 MyBatis 提供了高度的扩展性和灵活性，使其能够轻松应对…...

编程日记 2024/11/20 7:06:48

逆向分析入门：从OllyDbg到Cheat Engine的实战游戏修改指南

逆向分析入门：从OllyDbg到Cheat Engine的实战游戏修改指南逆向分析作为安全领域的核心技能之一，正逐渐从专业领域走向技术爱好者的视野。不同于传统的软件开发流程，逆向工程更像是一场与程序作者的智力对话——通过分析二进制代码、内存结构…...

编程新知 2026/3/18 2:09:16

mPLUG视觉问答功能体验：支持多格式图片，分析结果秒级返回

mPLUG视觉问答功能体验：支持多格式图片，分析结果秒级返回 1. 视觉问答技术的新体验当你面对一张复杂的照片时，是否曾希望有个助手能立即告诉你图片中的内容？mPLUG视觉问答工具让这个愿望成为现实。这个基于ModelScope官方模型的…...

编程新知 2026/3/18 0:52:46

从内核到应用层：全面解析安卓系统中dmesg和logcat的工作原理与区别

从内核到应用层：全面解析安卓系统中dmesg和logcat的工作原理与区别在安卓系统开发与调试过程中，日志工具如同开发者的"听诊器"，能够精准定位系统运行时的各类问题。对于需要深入系统底层或优化应用性能的开发者而言，掌…...

编程新知 2026/3/17 21:17:09

AD组策略密码安全配置指南：从默认策略到企业级防护

AD组策略密码安全配置实战：从基础加固到企业级防护体系在当今企业IT环境中，Active Directory（AD）作为身份认证的核心枢纽，其密码安全策略的强度直接影响着整个组织的安全防线。许多管理员往往止步于默认策略配置&…...

编程新知 2026/3/17 21:01:03

手把手教你为Android设备添加自定义蓝牙遥控按键（含KeyEvent详解）

手把手教你为Android设备添加自定义蓝牙遥控按键（含KeyEvent详解） 在智能家居和多媒体设备普及的今天，蓝牙遥控器已成为许多Android设备的标配外设。然而，标准遥控器的按键布局往往无法满足特定应用场景的需求，这就需要…...

编程新知 2026/3/17 20:26:50

从RockYou到SecLists：Kali Linux字典目录全解析与实战应用指南

从RockYou到SecLists：Kali Linux字典目录全解析与实战应用指南在渗透测试和安全评估领域，字典文件就像锁匠的开锁工具包，选择正确的工具往往能事半功倍。Kali Linux作为安全从业者的瑞士军刀，预装了数十种经过实战检验的字典文件…...

编程新知 2026/3/17 20:10:39

Phi-3-vision-128k-instruct部署案例：轻量级128K上下文多模态模型落地解析

Phi-3-vision-128k-instruct部署案例：轻量级128K上下文多模态模型落地解析 1. 模型简介 Phi-3-Vision-128K-Instruct是微软推出的轻量级多模态模型，属于Phi-3系列的最新成员。这个模型最大的特点是支持128K超长上下文窗口，同时具备强大的图…...

编程新知 2026/3/17 19:50:27

用Selenium操控寺庙：香火钱自动分账系统

一、系统架构与测试挑战寺庙香火分账系统采用“支付-清算-分账”三层架构：前端支付层：多殿堂独立收款码（微信/支付宝/云闪付）及现金通道，需兼容老年香客的无感支付流程规则引擎层：预设阶梯分账比例&#xf…...

编程新知 2026/3/17 17:36:58

GESP2026年3月认证C++二级( 第一部分选择题（9-15））

第9题：continue 和 break 的迷宫正确答案：C（6）1、代码：int count 0; for (int i 1; i < 4; i)for (int j 1; j < 5; j){if (j 3)continue;if (i 2)break;count 1;} cout << (count);2、&#x1f31f…...

编程新知 2026/3/17 17:34:58

OpenClaw安装tavily-search（skill）

tavily-search直接把 Tavily Search API 集成进 OpenClaw，让你的 AI 助手能享受到专为 Agent/RAG 优化的搜索结果：更干净的结构化输出、AI 生成的摘要、页面提取、网站爬取，甚至深度研究报告。相比 Brave，它在减少幻觉、提升回答…...

编程新知 2026/3/17 17:30:54