问题:
[判断题]数据清洗主要是删除原始数据集中的无关数据、处理缺失值、重复值、异常值等工作
答案解析:
您可能感兴趣的问题
- 日常我们用到的云服务器.钉钉办公软件.百度网盘等应用都是云计算服务厂商提供的云计算服务。()
- 云计算的服务模式包括()。 A基础设施即服务 B平台即服务 C系统即服务 D软件即服务
- OpenFlow组件包括()。 AOpenFlow控制器 BOpenFlow交换机 C数据转发平面 D控制平面
- Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。()
- 各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络.物联网.电子商务等领域的非结构化数据。()
- MapReduce计算框架具有数据本地性特性,本地性可避免跨节点或机架数据传输,提高运行效率。()
- 下列对Storm集群结构描述正确的是()。 ANimbus负责在集群范围内分发代码.为Worker分配任务和监测故障。 BZookeeper负责Nimbus和多个Supervisor之间的所有协调工作
- Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。()
- 存储云是指通过互联网或内部网提供给云用户,是一个可扩展的弹性的存储或数据服务,物理存储设备对用户是透明的。()
- 以下属于Microsoft公司的云计算组件是()。 A 虚拟化平台Windows Server Container B 虚拟化平台Hyper-V Container C 云计算管理平台System C