我是靠谱客的博主 单身宝贝,最近开发中收集的这篇文章主要介绍大数据技术期末复习习题-前两章 大数据概述及Hadoop概述,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

链接:大数据技术原理与应用期末复习第三章知识点
链接:HDFS编程实践

习题

1【单选题】
人类社会的数据产生方式大致经历了三个阶段,不包括____C____。
A、运营式系统阶段

B、用户原创内容阶段

C、互联网应用阶段

D、感知式系统阶段

2【单选题】
以下哪个现象不属于大数据的典型特征:A
A、数据包含噪声及缺失值

B、数据量大

C、数据类型多

D、产生速率高

3【单选题】
以下哪项不属于大数据思维的涵盖内容:B
A、从模型驱动到数据驱动

B、通过采样的手段获取目标群体的统计特性

C、数据就是生产资料

D、全样本分析

4【单选题】
在思维方式方面,不是大数据显著影响的是____C____。
A、全样而非抽样

B、效率而非精确

C、存储而非计算

D、相关而非因果

5【单选题】
下列属于批处理计算的是____D____。
A、Storm

B、Hive

C、Sqoop

D、Spark
批处理计算的代表产品:MapReduce和Spark
6【单选题】
云计算平台层(PaaS)指的是什么?A
A、操作系统和围绕特定应用的必需的服务

B、将基础设施(计算资源和存储)作为服务出租

C、从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型

D、提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务

7【单选题】
就数据的量级而言,1EB=D TB。
A、2^9

B、1000

C、2^10

D、2^20
8【单选题】
对于数据的数量级来说,1PB=___C_____GB;
A、1000

B、2^2

C、2^20

D、2^10

9【多选题】
数据产生方式大致经历了三个阶段,包括___BCD_____。

A、移动互联网数据阶段

B、运营式系统阶段

C、感知式系统阶段

D、用户原创内容阶段

10【多选题】
人类社会的数据产生方式大致经历了三个阶段,不包括___BD_____。

A、运营式系统阶段

B、移动互联网时代

C、感知式系统阶段

D、互联网应用阶段

11【多选题】
大数据的特征包含___ABCD_____。
A、数据量大

B、数据类型繁多

C、处理速度快

D、价值密度低

12【多选题】
图灵奖获得者、著名数据库专家Jim Gray博士认为,人类自古以来在科学研究上先后经历了四种范式,下列哪些属于 ___ACD_____这四种范式。
A、实验科学

B、猜想科学

C、理论科学

D、计算科学
在科学研究上先后经历的四种范式: 实验科学、理论科学、计算科学、数据密集型科学
13【多选题】
大数据对思维方式的影响包括____ABD____。
A、全样而非抽样

B、效率而非精确

C、实践而非理论

D、相关而非因果

14【多选题】
大数据的计算模式包括__ABCD____。
A、批处理计算

B、图计算

C、流计算

D、查询分析计算

15【多选题】
云计算的典型服务模式包括____ACD____。
A、平台即服务

B、物联网即服务

C、基础设施即服务

D、软件即服务

知识点及习题

1、人类社会的数据产生方式大致经历的三个阶段:
运营式系统阶段——用户原创内容阶段——感知式系统阶段。
2、大数据的典型特征(4V):

  • 数据量大
  • 数据类型繁多
  • 处理速度快
  • 价值密度低

3、大数据对思维方式的影响:

  • 全样而非抽样
  • 效率而非精确
  • 相关而非因果

4、大数据的计算模式:

  • 批处理计算(MapReduce、Spark等)
  • 流计算(Flink、Storm、Streams等)
  • 图计算(GraphX等)
  • 查询分析计算(Hive等)

5、云计算的三种典型服务模式:

  • 基础设施即服务(IaaS):将基础设施(计算资源和存储)作为服务出租。
  • 平台即服务(PaaS):操作系统和围绕特定应用的必须的服务。
  • 软件即服务(SaaS):把软件作为服务出租。

6、云计算的关键技术:

  • 虚拟化
  • 分布式存储
  • 分布式计算
  • 多租户

7、数量级之间换算单位:
1EB=2 ^ 10PB = 2 ^ 10TB=2 ^ 10GB=2 ^ 10MB = 2 ^10KB =2 ^10B

8、在科学研究上先后经历的四种范式:

  • 实验科学
  • 理论科学
  • 计算科学
  • 数据密集型科学

判断
1、物联网与云计算、大数据是相辅相成的关系,物联网就是指无线传感器。(X)
解析:
物联网是物物相连的互联网,是互联网的延伸,利用局部网络或互联网等通信技术把传感器、控制器、计算机、人员和物等通过新的方式连在一起,形成人与物、物与物相连,实现信息化和远程管理控制。
2、MapReduce是分布式并行计算框架,其计算模式属于流计算,实时性好。(X)
解析:
MapReduce属于批处理计算。

第二章

1、启动hadoop所有进程的命令:
start-all.sh
2、关于Hadoop的说法:

  • Hadoop的核心是HDFS和MapReduce。
  • Hadoop是基于Java语言开发的,支持多种编程语言。
  • Hadoop MapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算。

3、Hadoop的特性:

  • 高可靠性
  • 高效性
  • 高可扩展性
  • 高容错性
  • 成本低
  • 运行在Linux操作系统上
  • 支持多种编程语言

4、名次解释:

  • HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现。
  • Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。
  • HBase:提供高可靠性、高性能、分布式的列式数据库,是谷歌BigTable的开源实现。
  • Zookeeper:针对谷歌Chubby的一个开源实现,是高校可靠的协同工作系统。

5、Hadoop是Apache公司旗下的分布式计算平台。
6、Hadoop项目结构中,YARN负责资源管理和调度。
7、Hadoop的生态技术:

  • HDFS
  • HBase
  • MapReduce
  • Hive
  • Pig
  • Mahout
  • Zookeeper
  • Flume
  • Sqoop
  • Ambari

8、Hadoop生态系统的优势包含:

  • 高扩展
  • 低成本
  • 开源工具成熟
  • 高容错性

9、大数据技术方案为了简化并行分布式计算,采用MapReduce软件模块进行处理。

判断题
1、Hadoop是IBM公司开发的一款商用大数据软件。(X)
解析:
Hadoop是Apache公司旗下的分布式计算平台。
2、Hadoop是基于Java语言开发的,具有很好的跨平台特性。(√)
3、Hadoop是跨平台的,安装Hadoop时没必要安装JDK。(X)
解析:
Hadoop本身是使用Java编写的,因此Hadoop的开发和运行都需要Java的支持。

最后

以上就是单身宝贝为你收集整理的大数据技术期末复习习题-前两章 大数据概述及Hadoop概述的全部内容,希望文章能够帮你解决大数据技术期末复习习题-前两章 大数据概述及Hadoop概述所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(59)

评论列表共有 0 条评论

立即
投稿
返回
顶部