大数据与城市规划第一章课程概况习题1新数据的出现使得城市规划与城市研究更加深入,下面哪个不属于新数据(大数据+开放数据)?A、公共交通刷卡记录数据B、人口普查公报C、社交媒体数据D、手机信号数据解析:新数据为大数据以及公开数据,人口普查公报是汇总的数据,也是传统数据,因此不属于新数据。
2、请问以下数据几何形式上属于哪种类型?A、线状数据(polyline)B、面状数据(polygon)C、点状数据(point)D、以上皆非解析:根据图片的点状分布以及核心字段的说明,可推断出本数据为point点状数据。
3、下列关于“街道步行指数”核心字段的解释,下列叙述哪个不恰当?A、WalkScore:街道步行指数,是街道可步行性的综合指标B、function_density:街道功能密度,以街道的商业建筑面积密度做参考C、function_mix:街道功能混合度,一个区域内设施的功能多样性D、junction_density:道路交叉路口密度,街道周边一定范围内的道路交叉路口数量与面积的比值解析:unction_density:街道功能密度是以计算该街道的兴趣点POI密度。
公式如下:4、请问以下哪个字段不包含在“ResidentialCommunity居住小区”数据里?A、小区占地面积B、小区内容积率C、邻近设施状态D、小区住房成交量解析:此字段不包含于该数据中5、下面哪项属于本课程的教学内容?A、数据抓取B、数据分析C、数据可视化D、数据增强设计E、以上皆是第二章变化中的中国城市与未来城市1、以城市规划学科而言,下面对于城市的定义哪个不恰当?A、行政地域是一般大家所熟悉的城市范围,其边界大多依据历史、地理等要素划定B、实体地域是指利用地形地貌所刻画出来的适宜城市建设的范围C、功能地域侧重于实质功能上的关联,如:通勤交通所体现的劳动力市场解析:实体地域是实际情况下城市化的土地,一般以城镇建设用地的范围作为表征。
2、关于当前中国城市的叙述,下列叙述哪个不恰当?A、现在的行政地域与真实的城市状况有所出入的,不足以客观表达中国的城市化进程以及中国城市的基本规模和分布B、过去的人类社会发展属于“硅基文明”,演化进程相对于“碳基文明”更为缓慢C、互联网的发展虽为人类带来了高效与便捷,却也出现了碾压城市空间,造成城市空间凋敝甚至是衰败等现象解析:人类社会发展以来长期属于碳基文明,如今,硅基文明以更低耗的进化速率席卷而来,驱动着世界朝向更高阶层的进化。
3、近几年中国城市正在面临各种变革,以下何者为本章所提及的变化之一?A、全天候在线化B、小型化C、居家化D、以上皆是解析:以上三种皆为本章提及的"当前中国城市所面临的变化"。
4、智能化的快速发展逐步冲击各行各业,下列叙述哪个不恰当?A、亚马逊的无人商店Amazon Go 有自动识别商品、自动结账等技术,对传统零售商产生较大冲击B、国际四大会计事务所之一的德勤与人工智能企业合作,将人工智能引入会计和审计等工作中C、设计师、教职人员、医务人员等职业并不会被智能化的趋势所影响和取代。
解析:阿里巴巴在2016年已经使用了智能机器人“鲁班”设计商品广告的海报。
在不久后,教职人员、分析師、医务这些以往被认为无可取代的工作,都有可能受到智能化的趋势所影响。
5、下列关于“共享化”趋势的叙述,下列叙述哪个不恰当?A、近年来,“共享”概念在城市里蓬勃发展,闲置物品、空间,甚至是知识经验获得了更有效率的重新分配或交换,同时也对城市空间带来了巨大影响B、在北上广深等城市,共享单车仍旧无法改善交通盲点(以公共交通工具服务半径无法到达的区域)的困境C、不只是交通设施的共享化,从Maker Space、Co-working Space、Co-living Space等共享空间的出现说明了城市空间也越来越注重此趋势解析:在北上广深等城市,共享单车对交通盲点的覆盖超过99%,甚至达到全覆盖。
第三章城市数据类型和数据介绍1、下列何种数据不属于“传统数据” ?A、航拍影像图B、社交平台签到数据C、中国城市建设统计年鉴D、北京市家庭交通出行调查问卷解析:社交平台签到数据属于新数据类型2、下列关于新数据环境的叙述,下列叙述哪个不恰当?A、近年来,随着信息通信技术与物联网技术的发展,大数据与开放数据共同构成了“新数据环境”B、与传统数据相比,新数据环境主要呈现出精度低、覆盖广、更新慢等特点C、新数据环境不仅意味着更大的数据量,更反映了数据背后关于人群行为、移动、交流等活动的丰富信息D、新数据环境的特点与新型城镇化时期“以人为本”、“存量更新”、“自下而上”等城市规划理念不谋而合,被认为是促进城市规划科学化与城镇治理高效化的有力工具解析:与传统数据相比,新数据环境主要呈现出精度高(以单个的人或设施为基本单元)、覆盖广(不受行政区域限制)、更新快(每月、每日、甚至每分钟更新)等特点。
3、兴趣点(Point of Interests, POIs)为一种常见的城市数据,下列叙述哪个不恰当?A、多以“点状数据型态”呈现B、是目前城市规划分析领域使用较广的数据类型C、用以标示出该地所代表的政府部门、各行各业之商业机构、旅游景点、古迹名胜、交通设施等处所D、就目前的技术与数据环境而言,尚属于较难获取的数据类型解析:目前多个互联网公司如导航公司、在线地图等均提供兴趣点获取的API,即应用程序编程接口,可通过其获取。
4、关于“数据有偏性”,下面哪个是适当的应对方法?A、可以充分利用数据的有偏性,并与其他有偏数据研究互补B、利用有偏数据并不会影响关注整体的行为特征C、新数据类型的偏差并不会影响研究结果的可信性解析:(B) 关注局部整体的行为特征。
(C) 新数据类型的偏差使得研究结果的可信性受到质疑。
5、关于当前城市大数据所面临的问题,下列叙述哪个不恰当?A、新数据大多不是为城市研究“量身定做”,但是仍旧可以作为传统数据的重要补充B、目前城市大数据的分析多见于图片的元数据或文本数据,而对信息量最为丰富的图片内容挖掘较少,还有较大的信息挖掘空间C、在新数据环境下,各种不同数据平台或是用户所提供的空间数据精度都相当一致,有效地提升了研究结果质量D、利用新数据的城市研究需要一些经典的共享数据集,作为标准来对各种研究方法与结果进行比较解析:各平台的空间定位精度不同是目前数据存在问题之一,同时用户刻意提供不正确或者假冒(location spoofing)的地理坐标,也会影响数据的空间定位。
这些不确定空间位置信息对于研究结果质量的影响将会被放大。
第四章城市大数据的获取与清洗1、以下哪一种方式属于当前城市空间大数据的获取方法?A、人工搜集大量数据B、直接购买数据C、购买抓取数据的服务D、研究组织共享的大数据E、学习数据抓取的技术并自我实践F、以上皆是解析:有些数据不是直接呈现在网页上,不能直接爬取,比如:以可视化方式呈现的百度迁徙网页,但是抓包工具可以实现这种数据的爬取传统数据2、请依序排列结构化网页数据采集的步骤:甲、地理编码及坐标系统转换;乙、将获取的网络开放数据保存在本地;丙、数据的清洗、预处理;丁、定位查找数据源的网络地址A、甲→乙→丙→丁B、乙→丙→丁→甲C、丁→乙→丙→甲D、甲→丙→乙→丁3、以下对于抓包工具及其抓取数据的说明,下列叙述哪个不恰当?A、抓包工具只能针对直接呈现数据列表的网页进行爬取B、抓包工具的原理是查找数据源从而得到相应数据,通过抓包方式得到完整JSON并字段化C、除了电脑端网页的数据,也可以通过安装Fiddler软件等软件进行手机端的网页抓包解析:有些数据不是直接呈现在网页上,不能直接爬取,比如:以可视化方式呈现的百度迁徙网页,但是抓包工具可以实现这种数据的爬取。
4、以下对于Google Earth Engine的说明,下列叙述哪个不恰当?A、GEE(全称Google Earth Engine)是一款可以批量处理卫星影像数据的工具,属于Google Earth的系列工具B、相比于传统的处理影像工具,GEE可以快速、批量处理数量“巨大”的影像C、GEE可通过影像分析全球植被指数,但是还无法预测作物相关产量和监测全球森林变化D、GEE可以做全球尺度、长时间序列的数据分析出图,是地球科学领域的强大工具解析:通过GEE可以快速计算比如NDVI等植被指数,可以预测作物相关产量、监测旱情长势变化、监测全球森林变化等。
5、以下关于地理坐标系的说明,下列叙述哪个不恰当?A、坐标体系(GCJ-02),又称“火星坐标”,由国测局2002年发布,是国内广泛使用的坐标系B、地面上任一点的位置,通常用经度和纬度来决定,这两组正交的曲线构成的坐标,称为地理坐标系C、坐标系统的不同,会导致空间位置无法完全匹配,需要进行坐标纠正D、百度、搜狗等公司目前都开发了自己的坐标体系,一般是由火星坐标GCJ-02经过偏移算法得到,各个互联网公司之间的坐标系非常兼容解析:不同公司开发的坐标体系一般与其他坐标体系不兼容第五章城市大数据的统计与分析1、以下对于空间数据的概述,哪一项是正确的?A、空间数据分成点、线、面,并且每一个空间数据都带有标签及属性B、空间数据的分析主要由两方面组成,分别是空间分析和统计分析C、空间数据是城市大数据的主要组成部分D、以上皆是解析:2、关于相关性分析,以下哪一个叙述是错误的?A、相关性分析测量的是两个变量之间的线性关系程度B、相关性分析分为三类:皮尔逊积差相关系数、斯皮尔曼秩相关系数以及肯德尔等级相关系数C、皮尔逊积差相关系数是最常用的,而它适用于各种数据D、如果有一个变量是非连贯数据,则适合使用斯皮尔曼系数和肯德尔系数E、解析:皮尔逊积差相关系数是最常用的,而它仅适用于连贯数据3、进行数据统计分析时,以下哪种数据的准备工作步骤较为恰当?A、1. 数据导入;2. 删除不合理数据B、数据导入;2. 数据格式转换;3. 字段属性复查C、1. 数据导入;2. 直接进入分析工作D、1. 数据导入;2. 调整数据排列顺序解析:4、在运用普通最小二乘法回归(OLS Regression)之前,需要检查数据是否符合这种模型的假设。
以下几种假设中哪个是错误的?A、因变量和自变量呈线性关系B、观测结果的独立性C、观测结果要符合正态分布D、残差应具有相同的方差且相互独立解析:是残差要呈正态分布,不是观测结果5、以下哪几种关于地理加权回归(GWR)的说法是错误的?A、样本数量要至少300个B、G WR只能运用在多边形分析中,不适用于点和线C、G WR的结果中,每一个样本都有一个最佳模型D、在工具设置中,核类型和带宽方法都需要根据数据实际情况设置第六章城市大数据的可视化1、在ArcGIS的功能中,可控制以下数据可视化的哪些要素? 甲、展现内容;乙、展现方式;丙、展现颜色;丁、展现顺序;戊、透明度A、甲、丙B、甲、丙、丁C、乙、丁、戊D、甲、乙、丙、丁、戊2、以下哪一个研究机构,有开展数据可视化的相关研究工作?A、北京大学数据可视化小组B、M IT Senseable City LaboratoryC、城市象限D、以上皆是3、以下哪一个是数据可视化的作用?A、洞察问题(数据观察)B、艺术修养(视觉美感)C、科学素养(科学分析)D、公众对话(用户交互)E、以上皆是4、以下哪一个软件,不属于数据可视化软件?A、P ower MapB、U rban CanvasC、D3.jsD、F iddlerE、Tableau5、对于数据可视化的表达,以下叙述哪一个不恰当?A、相比图表,数据的可视化显示更加一目了然B、同样的数据,不同展示的方式不会影响可视化效果C、不同的分析单元展现的数据可视化,展示出的现象也有可能有很大差异D、根据展示数据种类的不同,需要找到最佳的可视化方式第七章城市大数据的挖掘:空间句法1、以下哪一个不是空间句法的常用软件?A、D epthmapB、sDNAC、SPSSD、Axwoman解析:SPSS是数据统计软件。