当前位置:文档之家› 南开20春学期《网络爬虫与信息提取》在线作业满分答案

南开20春学期《网络爬虫与信息提取》在线作业满分答案

8
Redis中往集合中添加数据,使用关键字()
A sadd
B add
C append
D sappend
答案:A
9
下面Python代码输出为():
def default_para_without_trap(para=[], value=0):
if not para:
para = []
para.append(value)
20
以下哪个HTML标签表示定义HTML表格中的行()
A <ul>
B <li>
C <tr>
D <td>
答案:C
1
Python中一个函数可以有()个return语句
A 0
B 1
C多个
D 2
答案:CDBA
2
最常见的HTTP请求类型有()
A GET
B POST
二、多选题共10题,20分
C SEND
D RECEIVE
D body
答案:A
3
如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个()
A列表
B元组
C字典
D集合
答案:A
4
下列关于mitmproxy的安装说法错误的是()
A对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install mitmproxy
A Scrapyd
B ScrapyDeploy
C Deploy
D Scrapy_Deploy
答案:A
6
PyMongo中逻辑查询表示大于的符号是()
A $gt
B $lt
C $gte$$lte
答案:A
7
Python中把列表转换为集合需要使用1函数
A set
B list
C convert
D change
答案:A
return para
print('第一步:{}'.format(default_para_trap(value=100)))
print('第二步:{}'.format(default_para_trap(value=50)))
A第一步:[100]
第二步:[100,50]
B第一步:[100]
第二步:[50]
B在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python 3.5或者更高版本
C在windows系统中无法使用linux的命令,只能通过下载安装包来安装
D UBUNTU中执行命令sudo pip3 install mitmproxy进行安装
答案:C
5
()是Scrapy官方开发的,用来部署、运行和管理Scrapy爬虫的工具
A列表
B元组
C字典
D集合
答案:DCA
10
Redis中的值可以支持()
A列表
B哈希
C集合
D有序集合
答案:CDBA
1
MongoDB在频繁读写方面优于Redis
A对
B错
答案:B
2
Redis的集合与Python的集合一样,没有顺序,值不重复
A对
B错
答案:A
3
插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1
D安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
答案:BD
5
Python中()与元组由类似的数据读取方式
A字符串
B列表
C字典
D集合
答案:AB
6
Python中有哪些实现多线程方法()
A multiprocess.dummy
B threading.Thread
C process
D PyMongoDB
答案:BA
7
要使用tesseract来进行图像识别,需要安装两个第三方库
A requests
B beautifulsoup
C Pillow
D pytesseract
答案:DC
8
BS4可以用来从()中提取数据
A HTML
B XML
C数据库
D JSON
答案:BA
9
Python中()容器有推导式
A组件
B模块
C控件
D单元
答案:A
17
xpath中extract方法返回值类型是()
A列表
B元组
C字典
D集合
答案:A
18
下列哪项不是HTTP的请求类型()
A GET
B POST
C PUT
D SET
答案:D
19
请问按哪个键可以打开Chrome自带的开发者工具()
A F10
B F1
C F11
D F12
答案:D
A headers
B文本内容
C目标网站
D user-agent
答案:D
12
Python中若定义object=[1, 2, 3, 4, 5],则print(object[:3])输出()
A 12
B 123
C 23
D 234
答案:B
13
当需要把Python里面的数据发送给网页时,应先将其转换成()
A Json字符串
答案:BA
3
自动填充验证码的方式有
A手动识别填写
B图像识别
C打码网站
D浏览器自动识别
答案:CB
4
下列关于在IOS上配置charles的说法正确的是()
A不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B手机和电脑需要在同一个局域网下。
C HTTP代理可以使用“自动”选项。
A对
B错
答案:B
4
Python中写CSV文件的writerow方法参数为包含字典的列表类型
A对
B错
答案:B
5
在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服
B GET
C POST
D Request
答案:A
14
以下表示请求பைடு நூலகம்源找不到的HTTP状态码为
A 200
B 301
C 404
D 500
答案:C
15
Redis若要进入交互环境,需要打开终端输入()
A redis-cli
B redis
C redis-cmd
D redis-start
答案:A
16
Scrapy_redis是Scrapy的“()”,它已经封装了使用Scrapy操作Redis的各个方法
C第一步:[100]
第二步:[]
D第一步:[100]
第二步:[100]
答案:B
10
Python写CSV文件需要哪个方法()
A CSVWriter
B CsvWriter
C DictWriter
D FileWriter
答案:C
11
使用python定制mitmproxy,下面的语句请求的是()。{req.headers["User-Agent"]}
南开20春学期《网络爬虫与信息提取》在线作业满分答案
1
浏览器用来记录用户状态信息的数据叫
A session
B cookies
C moonpies
D selenium
答案:B
2
()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。
A meta
B head
C header
相关主题