分类: 数据应用

Python AI极简入门:3、对数据进行预处理

一、数据预处理的重要性 在机器学习中,数据的准确性关乎着机器学习任务的成败、直接影响着预测测的结果。 而数据的准确性,一方面指数据的完整度,用于机器学习预测的数据是否全面;另一方面则指数据的统一度,数据与数据之间的分布是否统一。 二、在Python中进行机器学习数据预处理 对数据进行预处理的方式有很...

Python AI极简入门:2、简单理解机器学习

一、AI与机器学习 在网络上,AI、人工智能、机器学习、深度学习等等名词充斥了诸多文章中,让很多人摸不着头脑,到底什么是什么。 下面,我们来简单梳理一下: AI,是Artificial Intelligence的英文首字母缩写,也就是人工智能,所示说AI = 人工智能; 机器学习,是人工智能的一种实...

Python AI极简入门:1、搭建一个用于AI预测的Python环境

2017年人工智能的火把Python烧的热血沸腾,听说很多公司因为Python开发人员需求暴涨导致的薪资上升而不得不切换到其他语言上去(好像需求爆涨和薪资上升都跟我没沾上半点关系,还是苦逼一个,:))。 既然如此,我们这些与AI不相干的Pythoner也来蹭一蹭Python人工智能这团火,看看能不能...

更懂你的客户:使用机器学习进行用户细分

1、关于用户细分 用户细分是客户关系管理(CRM)中很重要的一个组成部分。无论是传统企业,还是新兴的互联网企业;不管是面向企业的业务还是面向于个人的业务;在全行业中,对用户群体进行划分类型,都可以更好的抓住用户的诉求,以进行更加精准的营销。 在传统的营销方案中,手段简单且粗暴,对所有的用户都是千篇一...

pyqtgraph数据可视化2:使用PyQtGraph绘制图形的6种方法

对于一个图形的绘制,在PyQtGraph中有很多中方法可以实现。比如可以直接使用PyQtGraph的plot()方法绘制,或者是创建一个网格窗口,再其中添加绘制图形等。下面我们就一一了解一下PyQtGraph的绘制图形方法。 首先利用numpy模块创建两个随机数组,用来作为图形绘制的数据: impo...

pyqtgraph数据可视化1:使用PyQtGraph的三种方式

使用pyqtgraph的三种方式 pyqtgraph提供了三种方式来进行pyqtgraph图像的绘制和调用,分别是: 命令行控制台调用 直接显示图像窗口 嵌入在PyQt部件 下面逐一进行介绍: 在命令行终端调用pyqtgraph 在命令行终端对pyqtgraph进行调用非常简单,首先在命令行界面进入...

Scikit-Learn机器学习实践——垃圾短信识别

前不久,我们使用NLTK的贝叶斯分类模型垃圾对短信数据进行机器学习的垃圾短信识别。 其实除了使用NLTK,我们还可以使用Scikit-Learn这个集成了诸多机器学习算法的模块进行上述的实验。 Scikit-Learn的API设计非常合理和高效,对于初触机器学习的同学来说非常友好,值得大家尝试和使用...

Python机器学习实战—使用朴素贝叶斯进行垃圾短信识别

一、引子 现在的很多手机管理软件都有垃圾短信拦截的功能,很智能很贴心是不是 嗯~ o( ̄▽ ̄)o 对于经常被垃圾短信骚扰的人来说,很是有用。(๑•̀ㅂ•́)و✧ 但是很多的拦截软件在拦截到垃圾短信之后……又发个通知提示拦截到了垃圾短信╮(﹀_﹀)╭ 好奇心害死猫,你告诉了我你拦截到了垃圾短信,我当然...

从数据爬取到机器学习——标题党,你的标题值几何

一、前言: 听说自媒体火了 听说自媒体平台多了 听说自媒体平台补贴高了 听说搞自媒体的人都赚翻了 …… 我也想不撸码,投身于自媒体行业去~( ̄▽ ̄~)(~ ̄▽ ̄)~ 二、引子: 前段时间拿到一个自媒体平台伪原创的采集器,嗯,长下面那样: 某自媒体平台伪原创采集器 按照阅读量排序进行采集,选择高阅读量...

分类目录: 数据应用

标签: 机器学习

【我爱背单词】用Python提炼3000英语新闻高频词汇

学英语,无论目的何在,词汇量总是一个绕不过去的坎,没有足够的词汇量,都难以用文法来组词造句。 前段时间,恶魔的奶爸提供了几份偏向于各个领域的高频词汇,很是不错。 最近用Python写爬虫入门教程的时候,碰到过几个英文网站,便有了统计一份网站英文单词词频的念头。 3000高频单词库说明: 来源:htt...

Matplotlib可视化实践系列:折线图

matplotlib是Python下最常用的数据可视化绘图库,功能强大,绘图精美,虽然也有基于matplotlib的seabron库,极大得简化的绘图的流程,但个人还是更加偏向于在静态数据可视化方面使用matplotlib来进行绘图工作。 下面,我们从matplotlib的一个折线图开始,了解如何使...

分类目录: 数据应用

加盟创富好项目?简单可视化分析告诉你78网上到底都有啥!

数据来源于本月早些时候从78网上爬取到的768份数据,数据量不大,但是可以深入挖掘的地方还是有不少的,由于时间关系,在此只作简单的数据处理和可视化分析; 一、数据集概览: aear cate subcate name maxmoney minmoney activetime 0 广东省 服装鞋包 女...