我是靠谱客的博主 默默鞋垫,这篇文章主要介绍山东大学软件学院2022-2023数据科学导论期末试题,现在分享给大家,希望可以做个参考。

考试时间:2023.2.18

刘宁老师课堂内容十分充足,因此以为会考很难,计算和公式会考很多。花了很多时间准备。

但实际上考的不难,基本全是概念性的题目。

甚至以为一定会考的TF-IDF都没有考,只考了个很简单的独热表示。

不过该背的东西还是要背。

题目很多都是往年题。

一、

  1. 大数据的定义和4个特点。
  2. 数据规范化的目标,并列举三个方法。
  3. 列举处理缺失数据的三个方法。

二、计算图表A,B的关系连接:INNER JOIN (内连接)和 LEFT OUTER JOIN(左向外连接)

表格和这道往年题基本是一样的:2021-2022山东大学软件学院数据科学导论期末考试回忆版_南河的南的博客-CSDN博客_山东财经大学数据科学导论期末考试

1、SELECT * FROM Table A INNER JOIN Table B ON A.sid=B.sid 画出结果表格

2、SELECT A.name, B.address FROM Table A LEFT OUTER JOIN Table B ON A.sid=B.sid 画出结果表格

三、SQL语言的类型有哪几种?创建名为student的表,包含学号(sid),姓名(name),年龄(age)。

四、关系型数据库和非关系型数据库的区别。

五、

  1. 什么是数据的集中趋势?列举三个指标。
  2. 什么是数据的离散程度?列举两个指标。
  3. 什么是数据的形状特点?列举三个指标。
  4. 最大后验估计之于极大似然估计的区别。
  5. 假设检验和参数估计的区别?说明假设检验的主要步骤。

六、说明独热表示的原理,并使用独热方式表示下面三个文档:

Doc 1: I am a boy, boy.

Doc 2: You are a girl, girl.

Doc 3: We are different, different.

七、给出日常生活中的图结构,并举出一些数据可视化的工具的例子。

最后

以上就是默默鞋垫最近收集整理的关于山东大学软件学院2022-2023数据科学导论期末试题的全部内容,更多相关山东大学软件学院2022-2023数据科学导论期末试题内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(62)

评论列表共有 0 条评论

立即
投稿
返回
顶部