【周末荐书】Python数据科学指南:循序渐进的数据分析及机器学习工具书

今天推荐一本编排和内容都很不错的Python书籍——《Python数据科学指南》,英文书名叫《Python Data Science Handbook》。因为没有中文版的出版,所以我们只介绍英文版的。

1、结构

这本书的编排结构非常好,一共分为5章,每章一个主题,每个主题对应一个Python的模块:

  • 第一章:介绍IPython和Jupyter的使用;
    这两个模块提供了数据科学人员进行工作的Python计算环境。
  • 第二章:介绍Numpy的相关使用;
    numpy提供了对Python的密集数据进行高效存储的ndarray数组对象的操作。
  • 第三章:介绍数据处理和Pandas模块的使用;
    pandas提供了DataFrame对象用来高效的存储和操纵数据。
  • 第四章:介绍数据可视化和Matplotlib的使用;
    matplotlib提供了灵活的数据可视化功能。
  • 第五章:介绍机器学习和scikit-learn模块的使用;
    sklearn提供了已有机器学习算法的高效和简洁的Python实现。

基本上,这就是一个完整的数据科学的路线图了(向前还欠缺统计学和线性代数的部分,向后还欠缺深度学习的部分),首先使用科学计算工具搭建环境,学习基高效的数据结构,数据操作处理,数据可视化,最后进行机器学习实践。对于想要系统地掌握Python数据分析或是数据挖掘的人来说,这个编排,无疑是很平缓的。而且直接运用工具进行代码实操,对于数学基础薄弱的人来说,也能够很快地做出效果来,而不用纠结于数学概念而徘徊不前。

2、内容

内容上,基本上以小的知识点为主,一个解释然后一个代码演示,即使英文水平不好,看着代码也能理解其中的意思。

以sklearn模块的文本特征提取为例:

3、最后

实在对英文有障碍的同学,可以下载一个必应词典或者有道词典等能够进行划词翻译的翻译软件,借助它们,配合代码实操,基本上是能够理解书中介绍的知识点。

这本书的PDF电子版网络上都有,在此就不给出下载的链接的。
有心人,终不负……
大家周日愉快!

猜你也喜欢

发表评论

邮箱地址不会被公开。