考试时间:2023.2.18
刘宁老师课堂内容十分充足,因此以为会考很难,计算和公式会考很多。花了很多时间准备。
但实际上考的不难,基本全是概念性的题目。
甚至以为一定会考的TF-IDF都没有考,只考了个很简单的独热表示。
不过该背的东西还是要背。
题目很多都是往年题。
一、
- 大数据的定义和4个特点。
- 数据规范化的目标,并列举三个方法。
- 列举处理缺失数据的三个方法。
二、计算图表A,B的关系连接:INNER JOIN (内连接)和 LEFT OUTER JOIN(左向外连接)
表格和这道往年题基本是一样的:2021-2022山东大学软件学院数据科学导论期末考试回忆版_南河的南的博客-CSDN博客_山东财经大学数据科学导论期末考试
1、SELECT * FROM Table A INNER JOIN Table B ON A.sid=B.sid 画出结果表格
2、SELECT A.name, B.address FROM Table A LEFT OUTER JOIN Table B ON A.sid=B.sid 画出结果表格
三、SQL语言的类型有哪几种?创建名为student的表,包含学号(sid),姓名(name),年龄(age)。
四、关系型数据库和非关系型数据库的区别。
五、
- 什么是数据的集中趋势?列举三个指标。
- 什么是数据的离散程度?列举两个指标。
- 什么是数据的形状特点?列举三个指标。
- 最大后验估计之于极大似然估计的区别。
- 假设检验和参数估计的区别?说明假设检验的主要步骤。
六、说明独热表示的原理,并使用独热方式表示下面三个文档:
Doc 1: I am a boy, boy.
Doc 2: You are a girl, girl.
Doc 3: We are different, different.
七、给出日常生活中的图结构,并举出一些数据可视化的工具的例子。
最后
以上就是默默鞋垫最近收集整理的关于山东大学软件学院2022-2023数据科学导论期末试题的全部内容,更多相关山东大学软件学院2022-2023数据科学导论期末试题内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复