1.【单选题 】
以下哪个选项是用于读取Excel文件?()
A.to_csv()
B.read_excel()
C.read _csv()
D.to_excel()
参考答案:B
2.【单选题 】
网络数据采集是指通过何种技术或网站公开API等方式从网站上获取数据信息?
A.网络爬虫
B.手工
C.搜索引擎
D.浏览器
参考答案:A
3.【单选题 】
根据数据来源,电子邮件来源于哪里?()
A.人为数据
B.机器和传感器数据
C.互联网开放数据
D.移动通信数据
参考答案:A
4.【单选题 】
网络数据采集是指通过何种技术或网站公开API等方式从网站上获取数据信息?
A.网络爬虫
B.手工
C.搜索引擎
D.浏览器
参考答案:A
5.【多选题 】
数据的内部来源包括:
A.ERP系统
B.电子标签数据
C.社交数据
D.商品交易数据
参考答案:A,B,D
6.【多选题 】
数据采集又称数据获取,是大数据生命周期中的第一个环节,是通过()等方式获得各种类型的结构化、半结构化及非结构化的海量数据的技术。 ……此处隐藏19个字…… >
参考答案:A,B,D
6.【多选题 】
数据采集又称数据获取,是大数据生命周期中的第一个环节,是通过()等方式获得各种类型的结构化、半结构化及非结构化的海量数据的技术。
A.RFID射频数据
B.传感器数据
C.社交网络数据
D.移动互联网数据
参考答案:A,B,C,D
7.【多选题 】
常见的()和传感器产生的数据都属于非结构化数据。
A.音乐
B.视频
C.微博
D.图像
参考答案:A,B,C,D
8.【多选题 】
属于大数据的数据采集的特点的是?()
A.来源广泛,数据量巨大
B.数据类型丰富,包括结构化、半结构化、非结构化的数据
C.使用分布式数据库以手工采集为主
参考答案:A,B,C
9.【判断题 】
在数据采集阶段我们的态度应该是“全而细”。“全”是指各种数据都要采集到。“细”则是说在采集阶段要尽可能的采集到每一个数据。
A.正确
B.错误
参考答案:B
10.【判断题 】
对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
A.正确
B.错误
参考答案:B