这套Python数据科学备忘录来源于国外的DataCamp.com网站,DataCamp是一个专业的数据科学课程培训网站,提供各种数据科学课程的学习,同时也开放了很多实用有料的资料。
在数据科学的学习和工作中,我们会使用到很多的工具、模块和库,当工具越来越多,我们需要理解和掌握的概念也就越来越多,这无论是对于初学者还是数据科学大牛来说,都是一个挑战。
在这种情况下,一个完整全面的备忘录就很有必要了,在一些概念模糊不清,模块的使用方法不确定的时候,快速地查看备忘录,可以极大地提高效率。
下面,我们就来了解一下这一套来自于DataCamp的Python数据科学备忘录(原版高清PDF下载地址见文末)
PS:文中图片较多较大,加载会有点忙
文章目录
初学者的Python数据科学备忘录
这份备忘录,适用于Python数据科学的初学者,里面涵盖了Python中数据类型的基本操作方法、NumPy数组的操作方法。
Pandas模块基本操作示例备忘录
Pandas是Python数据科学的一大利器,广泛地用于基础数据的处理和清洗,这份备忘录涵盖了Pandas模块的数据结构、数据输入输出、数据选择、数据排序、数据查看等等诸多基础操作。
Scikit-Learn机器学习备忘录
Scikit-Learn是Python中非常著名的机器学习库,它使用简单、API调用方便,这个库提供了机器学习从数据处理,到模型创建,到模型训练,到模型评估一整个流程的支持,同时支持贝叶斯、随机森林、决策树、SVM等诸多传统机器学习算法和简单的神经网络算法。
NumPy基础备忘录
NumPy是Python中用于科学计算的一个强大第三方库,这个NumPy备忘录可以帮助你解决使用NumPy进行Python科学计算时所必需的基础知识。
Scipy备忘录
Scipy是Python中用于进行线性代数计算的一个库,和NumPy库类似。
Matplotlib基础备忘录
matplotlib是Python中经久不衰的数据可视化库,虽然现在各种基于JS的动态数据可视化框架层出不穷,但是高质量的图表生成还是得看matplotlib。
Pandas高级操作备忘录
Pandas中有很多高级的数据处理和分析操作,但是可能平时用得少就忘了,这份备忘录正好适合需要的适合翻一翻。
PySpark备忘录
PySpark是在Python中操作Spark这个大数据分析平台的第三方库,这份备忘录中涵盖了PySpark的基础操作和使用示例。
Keras备忘录
Keras是一个功能强大且易于使用的Python深度学习库,提供了高级的神经网络API让我们可以快速地创建一个高效的深度学习模型。
PySpark SQL备忘录
SeaBorn备忘录
seaborn是基于matplotlib的一个易于使用的数据可视化库,因为matplotlib的api过于复杂,所以它就诞生了。
Bokeh备忘录
bokeh是另一个数据可视化库,与前面介绍的数据可视化库各有特点。
Jupyter notebook备忘录
Jupyter可以说是做数据科学的小伙伴非常喜欢的一个工具了。
以上就是州的先生整理的来自于DataCamp的Python数据科学备忘录,有需要的小伙伴可以在州的先生微信公众号(ID:zmister2016)后台回复关键词:0014,获取上述13份高清PDF版本的备忘录
文章版权所有:州的先生博客,转载必须保留出处及原文链接
感谢分享,0014
公众号回复关键词