【理论向】简述推荐系统的四种类型

协同过滤推荐系统 协作过滤是推荐引擎的基本形式。在这种类型的推荐引擎中,通过用户的偏好协同完成大量替代项目的筛选项目。 协同过滤推荐系统的基本假设是,如果两个用…

优雅地记录Python程序日志2:模块组件化日志记录器

本篇将会涉及: logging的各个模块化组件 构建一个组件化的日志器 logging的模块组件化 在上一篇文章中,我们介绍了Python的内置模块loggin…

优雅地记录Python程序日志1:logging模块简介

本篇涉及: logging模块的调用; 保存log日志为文件; 调整输入日志等级; 修改日志消息格式; 前言 在使用Python编写程序的过程中,我们经常使用p…

Python中文自然语言处理:一、基础文本处理

对中文进行分词 import jieba text = '你好,我正在进行Python自然语言处理,有些问题需要处理,笑哈哈' word = jieba.cut…

通过修改User-Agent标识将PhantomJS伪装成Chrome浏览器

在写爬虫的过程中,出于系统环境或是效率的问题,我们经常使用PhantomJS作为Selenium操纵的浏览器webdriver,而不是直接使用Chrome或Fi…

Python并发:多线程与多进程

本篇将会涉及: 线程与多线程 进程与多进程 多线程并发下载图片 多进程并发提高数字运算 关于并发 在计算机编程领域,并发编程是一个很常见的名词和功能了,其实并发…

Pandas读取MongoDB数据的另一种方式

之前介绍了在Pandas中读取MongoDB数据的方法,在索引出数据之后,将结果转换为列表list,然后在传入一个pandas的DataFrame中。 impo…

【周末荐书】Python数据科学指南:循序渐进的数据分析及机器学习工具书

今天推荐一本编排和内容都很不错的Python书籍——《Python数据科学指南》,英文书名叫《Python Data Science Handbook》。因为没…

Python GUI教程(五):通过Qt设计师在GUI中添加窗口部件

本篇将会介绍到: 使用qt设计师添加窗口部件到我们的GUI中; 当我们移动光标到菜单时更新状态栏信息; 通过一个菜单关闭应用程序; 添加一个选项卡、按钮和刻度盘…

利用Python打造短链服务(一)

一、越来越长的网址与短链服务 互联网发展愈快,功能越多,有些网址也越来越长,如果仅仅是浏览还好,涉及到传播,一大串的网址分发容易出错也不易推广。 淘宝上的一个活…

可能是比Python更方便的词云制作了

一、使用Python制作词云 在Python中,利用wordcloud库可以很轻松的绘制一个词云。 1、引入模块 from wordcloud import W…

Python快速搭建会学习的微信聊天机器人

最近微软小冰和QQ小冰又火了一把,对于聊天机器人大家都是很有兴趣。 今天分享一个快速搭建的微信聊天机器人。 依赖于两个开源项目: ChatterBot 一个基于…

10行Python搞定微信公众号邮箱检测

微信公众号的注册需要使用邮箱,而一个邮箱又只能注册一个微信公众号。有时候注册管理的公众号多了,新注册公众号时,就不记得自己的哪些邮箱已经注册了,哪些没注册。 微…

【我爱背单词】用Python提炼3000英语新闻高频词汇

学英语,无论目的何在,词汇量总是一个绕不过去的坎,没有足够的词汇量,都难以用文法来组词造句。 前段时间,恶魔的奶爸提供了几份偏向于各个领域的高频词汇,很是不错。…