1.【单选题 】
以下哪个选项不是数据分析流程中的一个阶段?
A.数据预处理
B.深度学习
C.数据可视化
D.分析与建模
2.【单选题 】
数据中心采取“( )”的方式,可以有效地提高信息资源的利用率。
A.数据集中、应用分布
B.一次存储、到处访问
C.无人值守、网络访问
D.资源共享、用户隔离
参考答案:A
3.【单选题 】
绘制柱形图表时,其图表类型值是()。
A.bar
B.line
C.scatter
D.pie
参考答案:A
4.【单选题 】
数据挖掘经常需要数据集成,下面关于数据集成说法错误的是()
A.数据集成有助于减少结果数据集的冗余和不一致
B.数据集成有助于提高其后挖掘过程的准确性和速度
C.数据集成将多个数据源中的数据合并,存放到一个一致的数据存储中
D.进行数据集成的数据必须存储在同构的存储中,不能对异构的数据源进行数据集成
参考答案:D
5.【单选题 】
根据数据来源,电子邮件来源于哪里?()
A.人为数据
B.机器和传感器数据 ……此处隐藏4771个字…… 【判断题 】
在数据采集阶段我们的态度应该是“全而细”。“全”是指各种数据都要采集到。“细”则是说在采集阶段要尽可能的采集到每一个数据。
A.正确
B.错误
26.【判断题 】
非结构化数据是一组具有复杂结构的数据,可能具有也可能没有规则。
A.正确
B.错误
27.【判断题 】
对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。
A.正确
B.错误
28.【判断题 】
常见的大数据解决方案面临的挑战包括:缺乏处理大数据的综合方法、数据分类的方法不正确、缺乏将大数据转化为重要洞察的基础设施、缺乏大数据技能。
A.正确
B.错误
29.【判断题 】
大数据的数据包括网络日志、音频、视频、图片、地理位置信息等等
A.正确
B.错误
30.【判断题 】
一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。
A.正确
B.错误