一、填空题1、已知vec = [[1,2], [3,4]],则表达式[[row[i] for row in vec] for i in range(len(vec[0]))] 的值为_________________________。
2、已知 x = list(range(10)),则表达式 x[-4:] 的值为__________。
3、已知 path = r'c:\',那么表达式 path[:-4]+'htm' 的值为__________。
4、已知 x = [3, 5, 7],那么执行语句 x[1:] = [2]之后,x的值为________________。
5、已知 x = [3, 5, 7],那么执行语句 x[:3] = [2]之后,x的值为________________。
6、已知x为非空列表,那么执行语句y = x[:]之后,id(x[0]) == id(y[0])的值为__________。
7、已知 x = [1, 2, 3, 2, 3],执行语句(2) 之后,x的值为____________。
8、表达式 3<<2 的值为_______________。
9、表达式 65 >> 1 的值为_____________。
10、表达式chr(ord('a')^32) 的值为___________。
11、表达式chr(ord('a')-32) 的值为___________。
12、表达式 abs(3+4j) 的值为____________。
13、表达式 callable(int) 的值为___________。
14、表达式 list(str([1,2,3])) == [1,2,3] 的值为______________。
15、表达式str([1, 2, 3]) 的值为__________________。
16、已知 x = '123' 和 y = '456',那么表达式 x + y 的值为______________。
17、已知x = 'a234b123c',并且re模块已导入,则表达式('\d+', x) 的值为_________________。
18、已知 x = [3, 5, 7],那么执行语句 x[:3] = [2]之后,x的值为________________。
19、表达式 'Hello world'.lower().upper() 的值为___________。
20、表达式 'abcab'.strip('ab') 的值为__________。
21、表达式 [str(i) for i in range(3)] 的值为____________。
22、表达式 ''.endswith(('.txt', '.doc', '.jpg')) 的值为___________。
23、表达式 list(filter(None, [0,1,2,3,0,0])) 的值为___________________。
24、表达式 list(filter(lambda x:x>2, [0,1,2,3,0,0])) 的值为_________。
25、表达式 list(range(50, 60, 3)) 的值为_______________________。
26、表达式 list(filter(lambda x: x%2==0, range(10))) 的值为__________________________。
27、表达式 list(filter(lambda x: len(x)>3, ['a', 'b', 'abcd'])) 的值为___________。
28、Python使用_________________关键字来定义类。
29、表达式 isinstance('abc', str) 的值为________________。
30、表达式 isinstance('abc', int) 的值为_______________。
31、表达式 isinstance(4j, (int, float, complex)) 的值为_____________。
32、表达式 isinstance('4', (int, float, complex)) 的值为_____________。
33、代码 print(1,2,3,sep=':') 的执行结果为__________________。
34、代码 for i in range(3):print(i, end=',') 的执行结果为_________________。
35、表达式 eval('''__import__('math').sqrt(9)''') 的值为______________。
36、表达式 eval('''__import__('math').sqrt(3**2+4**2)''') 的值为_________。
37、表达式 eval('3+5') 的值为________8_________。
38、大数据最具潜能的三大应用领域分别为商业智能、公共服务和市场营销。
39、HDFS对元数据和实际数据采取分别存储的方法,元数据存储在 Namenode ,实际数据储存在 Datanode 。
40、列表、元组、字符串是Python的___有序______(有序?无序)序列。
41、写出range(2,10,2)的值 [2,4,6,8] 。
42、数据仓库的主要特征是面向主题、集成时变、和非易失。
参考答案:1、[[1, 3], [2, 4]]2、[6, 7, 8, 9]3、'c:\\'4、[3, 2]5、[2]6、True7、[1, 3, 2, 3] 8、12 9、32 10、'A' 11、'A' 12、 13、True 14、False15、'[1, 2, 3]' 16、'123456' 17、[‘a’,’b’,’c’]18、[ 2] 19、'HELLO WORLD' 20、'c' 21、['0', '1', '2'] 22、True23、[1, 2, 3] 24、[3] 25、[50, 53, 56, 59] 26、[0, 2, 4, 6, 8]27、['abcd'] 28、class 29、True 30、False 31、True 32、False33、1:2:3 34、0,1,2, 35、36、37、838、商业智能公共服务市场营销39、Namenode Datanode 40、有序 41、[2,4,6,8]42、面向主题集成时变非易失二、简答题1、叙述大数据的概念,并指明大数据的4V 特征。
答:大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理数据。
大数据4V 特征为:大量化 多样化 快速化 价值密度低2、列举身边获取大数据的例子。
(1)QQ ,微博等社交软件产生的数据(2)天猫,京东等电子商务产生的数据(3)互联网上的各种数据3、简述数据预处理方法和内容。
① 数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。
② 数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。
需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等。
③ 数据变换:将原始数据转换成为适合数据挖掘的形式。
包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构。
④ 数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。
2、简述大数据的数据管理方式。
答:对于图像、视频 、URL 、地理位置等类型多样的数据,难以用传统的结构化方式描述,因此需要使用由多维表组成的面向列存储的数据管理系统来组织和管理数据。
也就是说,将数据按行排序,按列存储,将相同字段的数据作为一个列族来聚合存储。
不同的列族对应数据的不同属性,这些属性可以根据需求动态增加,通过这样的分布式实时列式数据库对数据统一进行结构化存储和管理,避免了传统数据存储方式下的关联查询。
3、 画出1sin()y x =,2cos()y x =在[,]x ππ∈-上的曲线,如图:y4、画出1sin()y x =,2cos()y x =,3tan()y x =在[,]x ππ∈-上的曲线,画在三个子图中,如图:-101y 1=sin(x), x ∈[-π,π]x y ←sin(x)-202-101y 2=cos(x), x ∈[-π,π]x y ←cos(x)-55x y 3=tan(x), x ∈[-π,π]y ←tan(x)三、编程题1、利用给定的数据,创建分裂式饼图。
Labels=[‘Nokia ’,’Samsu ’,’Apple’,’Lumia’]Values=[10,30,45,15]2、利用函数填充多边形区域。
数据给定为:x = , 2,y1 = *x)y2 = *(4**x)3、绘制等值线图。
颜色设置先由黑色过渡到红色,再过渡到黄色,最后最大值使用白色。
这种彩图中,cmp参数的值为。
数据为:x=,,dx)y=,,dy)4、使用条状图表现对比关系。
两列有着共同类别的数据,其条状图分列于x轴两侧,沿y 轴方向生长。
数据:x0=(8)y1=([1,3,4,6,4,3,2,1])y2=([1,2,5,4,3,3,2,1])。