首页 > 建筑工程类考试

题目内容（请给出正确答案）

[单选题]

连续不断地爬取网页信息，较容易被网站识别，想要实现间隔15s来爬取网页需要使用以下哪一项指令（）。

A.timestop（5）

B.timesleep（15）

C.timestrptime（15）

D.timesleep（5）

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“连续不断地爬取网页信息，较容易被网站识别，想要实现间隔15s…”相关的问题

第1题

以下哪种说法是正确的（）。

A.网站服务器可以识别你使用的访问软件，因为在发送访问请求中有特定位置的字符串和软件类型相关

B.低级别的代理服务器十分容易被识别

C.可以通过修改opener的proxy来模拟浏览器访问

D.爬取图片的流程被中断时，之前所有爬取的信息都将被自动删除

点击查看答案

第2题

常用的爬虫技巧有以下哪些（）。

A.更改header，伪装成浏览器进行爬取

B.设置爬取的时间间隔

C.应用神经网络算法识别网站验证码

D.通过代理服务器进行爬取

点击查看答案

第3题

以下关于API爬虫哪些说法是错误的（）。

A.基于API返回的结果通常会比较干净

B.基于API的爬虫任务中，速度一般较慢

C.基于API的爬虫爬取的好处是没有次数的限制

D.基于API的爬取能够覆盖网站所有信息

点击查看答案

第4题

下列说法正确的是（）。

A.cookielib库提供可存储cookie的对象，以便于与urllirequest库配合使用来进行访问

B.过于频繁的爬虫不会带给网站额外的压力

C.使用split（）可以进行字符串的拆分

D.正则表达式可以实现对爬取信息的快速过滤

点击查看答案

第5题

数据采集工具不能爬取学术信息。（）

点击查看答案

第6题

网页防篡改技术包括的有（）。

A.网站采用负载平衡技术

B.防范网站、网页被篡改

C.访问网页时需要输入用户名和口令

D.网页被篡改后能够自动恢复

点击查看答案

第7题

数据采集工具可以针对某个主题从微博爬取相关信息。（）

点击查看答案

第8题

网页无法打开可能有以下几种原因()。

A.IP被封堵

B.域名被封堵

C.网站问题

D.DNS解析问题

点击查看答案

第9题

对于网址的认识，下列说法不正确的是（）

A.网站必须标有全世界唯一的网址，才能被我们准确地找到

B.百度网址：https://www.baidu.com，其中.com代表的是国家政府机构

C.网站网页地址由超文本传输使用协议和域名组成

点击查看答案

第10题

对于网站网址下列说法不正确的是（）

A.网站上信息非常丰富，我们可以找到音乐、图书、购物、体育等各种内容

B.网站种类很多，可以分为政府网站、商务网站、新闻网站等

C.网址就好比家庭住址，有了它就不用担心在网络上迷路了

D.在地址栏中输入中文网址，不能够找到相应的网页

点击查看答案

第11题

随着现代科学技术的发展，信息传播手段的日益网络化趋势，网络学习资源成为重要的学习资源之一。下列哪项不是网络学习资源的组织形式：（）。

A.电子书籍

B.网页网站

C.导航系统

D.搜索引擎

点击查看答案

长沙图香大数据有限公司版权所有 ©2024

湘ICP备20011576号-3 营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）