Python AI极简入门:1、搭建一个用于AI预测的Python环境

2017年人工智能的火把Python烧的热血沸腾,听说很多公司因为Python开发人员需求暴涨导致的薪资上升而不得不切换到其他语言上去(好像需求爆涨和薪资上升都跟我没沾上半点关系,还是苦逼一个,:))。

既然如此,我们这些与AI不相干的Pythoner也来蹭一蹭Python人工智能这团火,看看能不能从中取一点暖。所以就有了这套《Python 极简入门》的文章。

没敢称之为“教程”,是因为本来就是个半吊子,然后又讲一个半吊子的东西,纯属自娱自乐,入不了专业AI人士的法眼(专业人士可以绕过了)。

又因为是半吊子讲半吊子的东西,所以整套文章不会有公式和算法的详细讲解(专业人士可以再次绕过了),我们从不生产算法,我们只是机器学习库的搬运工。

不要介意做一个调库侠,工具的发明本来就是为了降低某些操作的难度,还不是专业人士,暂且不用自己创造改造算法,轮子太多,拣着合适的用就行。废话不多说,开始~

一、创建一个Virtual虚拟环境

为了不与本地的Python 环境有冲突,我们使用virtualenv模块创建一个新的Python虚拟环境:

virtualenv python_ai

如下图所示,安装完成:

接着启动python_ai这个虚拟环境:

Scripts\activate

二、安装所需的模块

进行python_ai这个虚拟环境之后,我们来安装所需要的模块,其中主要有:

  • numpy:用于科学计算的基本模块
  • scipy:科学计算工具箱
  • pandas:数据分析和处理模块
  • scikit-learn:机器学习经典算法的集成包
  • nltk:自然语言处理模块
  • jieba:中文分词模块
  • jupyter:一个交互式的笔记本,我们的代码的主战场

其他没有列出的模块,在后面的文章中有使用时会提及大家安装。大部分模块都可以使用pip命令直接安装完成,少部分使用pip命令直接安装不了的,可以通过https://www.lfd.uci.edu/~gohlke/pythonlibs/ 网站下载模块的whl文件,再通过pip命令安装这些whl文件。

pip install pandas 

安装pandas模块会附带安装上pandas的依赖库,其中包括Numpy等:

pip install scikit-learn

使用pip命令也可直接安装scikit-learn:

pip install scipy

scipy模块也能通过pip直接安装完成:

pip install jupyter

jupyter的依赖库很多,但也能顺利通过pip命令安装完成:

接下来是jiaba和nltk模块,都能够顺利安装:

三、测试模块

模块安装好之后,我们来测试一下这些模块的安装是否正确。在命令行输入命令:

jupyter notebook

以启动jupyter笔记本:

在Home页面新建一个Python3的notebook:

在新的notebook中导入刚刚安装好的模块,并打印其版本号:

import numpy as np
import pandas as pd
import scipy
import sklearn
import nltk
import jiaba

print(np.__version__)
print(pd.__version__)
print(scipy.__version__)
print(sklearn.__version__)
print(nltk.__version__)
print(jieba.__version__)

结果成功显示,没有报错:

这样,我们用于Python AI预测的环境就搭建好了,下一节,我们将介绍机器学习的工作流。

猜你也喜欢

  1. 匿名说道:

    最后那个库是"jieba",不是“jiaba”

    1. 州的先生说道:

      多谢指正

发表评论

邮箱地址不会被公开。