概述
一直想找一本数据科学的书,为信息管理专业的学生来用,赵了国内数据科学技术与应用,太笼统了,没有专业性,找了吴喜之的python-统计人的视角,又觉得数据科学的东西少了,所以一直在找教材中。
这次机械工业出版社翻译的这本数据科学导论感觉不错,作者是意大利人,一直没有体验下意大利民族的特点,这次体验下。
首先,阿尔贝托是信号处理以及统计学的,主要作自然语言处理的,这个背景其实做数据科学还是不错的,有技术背景以及有一定的行为学背景。另一个卢卡,是市场研究和多元统计分析的专家,主要是客户分析的。这两个人的组合还是比较符合数据科学的背景的,我一直不喜欢纯计算机专业的作为数据科学的研究者,太计算机化了,按照我们有些老师的说法就是,太喜欢用计算机来处理问题了,认为计算机是万能的。
由于数据科学是以问题为导向的,我们最重要的是要认识问题,这样才能使用或是改进某些东西来使计算更好或是更快。所以有社会科学背景的数据科学家写的书更容易被人理解。
不说废话,这个是这本书给我的第一印象。
我看过很多数据科学的教材,都是讲半天,然后慢慢导入numpy,pandas,matplotlib,等等等等,很慢,这本书就是一开始讲一下anaconda的安装,然后直接上数据。
上了数据就是pandas,这个是必须的,如何处理数据,如何预处理,如何访问其他数据格式,抓取数据都说了,虽然很简单,但是老齐的课也是这样来的。然后就是numpy,都是针对数据分析的,这个是基础,还不错。
接下来接着就是PCA,异常检测,超参数优化的问题,这个可是处理完数据后接着就要做的事情,很切合实际应用的处理,感觉就是有经验的人写的书,不是学院派。
后面就是机器学习,这个都差不多了,和其他的书感觉一样,说实话,真的就是没什么特别的东西的,数据科学就那些算法,熟悉一本书就可以了啊。最后就是可视化,matplotlib就登场了。
本书还有一个特点就是带了Spark的大数据分析,感觉写出来了,但是不尽兴。毕竟这个一本书肯定讲不完。
综合而论,这本书却是适合本科教学的,大数据专业,数据科学专业都可以的。
最后
以上就是虚心电源为你收集整理的数据科学导论python语言实现_数据科学导论-python语言的全部内容,希望文章能够帮你解决数据科学导论python语言实现_数据科学导论-python语言所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复