分类: 编程

【理论向】简述推荐系统的四种类型

协同过滤推荐系统 协作过滤是推荐引擎的基本形式。在这种类型的推荐引擎中,通过用户的偏好协同完成大量替代项目的筛选项目。 协同过滤推荐系统的基本假设是,如果两个用户过去有相同的兴趣,他们将来也会有相似的品味。例如,如果用户A和用户B具有相似的电影偏好,并且用户A最近观看了《妖猫传》(用户B还没有看到)...

分类目录: 编程

标签: 推荐系统

优雅地记录Python程序日志1:logging模块简介

本篇涉及: logging模块的调用; 保存log日志为文件; 调整输入日志等级; 修改日志消息格式; 前言 在使用Python编写程序的过程中,我们经常使用print()函数打印一些信息到控制台,方便的查看结果和一些调试信息,以判断程序的运行是否正常。 print()确实是方便和易用,但是也有一些...

通过修改User-Agent标识将PhantomJS伪装成Chrome浏览器

在写爬虫的过程中,出于系统环境或是效率的问题,我们经常使用PhantomJS作为Selenium操纵的浏览器webdriver,而不是直接使用Chrome或FireFox的webdriver,尽管后者更加直观。 PhantomJS的优点虽然很多,但是缺点却也不少,有一个不能称之为缺点的缺点就是,Ph...

Python并发:多线程与多进程

本篇将会涉及: 线程与多线程 进程与多进程 多线程并发下载图片 多进程并发提高数字运算 关于并发 在计算机编程领域,并发编程是一个很常见的名词和功能了,其实并发这个理念,最初是源于铁路和电报的早期工作。比如在同一个铁路系统上如何安排多列火车,保证每列火车的运行都不会发生冲突。 后来在20世纪60年代...

Pandas读取MongoDB数据的另一种方式

之前介绍了在Pandas中读取MongoDB数据的方法,在索引出数据之后,将结果转换为列表list,然后在传入一个pandas的DataFrame中。 import pymongo import pandas as pd # 设置MongoDB连接信息 client = pymongo.MongoC...

分类目录: 编程

【周末荐书】Python数据科学指南:循序渐进的数据分析及机器学习工具书

今天推荐一本编排和内容都很不错的Python书籍——《Python数据科学指南》,英文书名叫《Python Data Science Handbook》。因为没有中文版的出版,所以我们只介绍英文版的。 1、结构 这本书的编排结构非常好,一共分为5章,每章一个主题,每个主题对应一个Python的模块:...

分类目录: 编程

Python GUI教程(五):通过Qt设计师在GUI中添加窗口部件

本篇将会介绍到: 使用qt设计师添加窗口部件到我们的GUI中; 当我们移动光标到菜单时更新状态栏信息; 通过一个菜单关闭应用程序; 添加一个选项卡、按钮和刻度盘; 继续添加一个菜单 如同第二篇文章中使用代码创建了GUI,我们继续在GUI窗口中创建一个“修改”菜单: 为“退出”菜单添加状态栏信息 目前...

利用Python打造短链服务(一)

一、越来越长的网址与短链服务 互联网发展愈快,功能越多,有些网址也越来越长,如果仅仅是浏览还好,涉及到传播,一大串的网址分发容易出错也不易推广。 淘宝上的一个活动介绍页 而且,有些互联网巨头严防死守竞争对手的的链接出现在自家的产品里,用尽一切手段限制竞争对手的网址链接在自家产品上被顺利打开引流。 限...

Python快速搭建会学习的微信聊天机器人

最近微软小冰和QQ小冰又火了一把,对于聊天机器人大家都是很有兴趣。 今天分享一个快速搭建的微信聊天机器人。 依赖于两个开源项目: ChatterBot 一个基于机器学习的聊天机器人 ItChat 微信号接口 原理: 1、利用ItChat模块对微信号进行登录和消息接收的发送 2、将接收到的消息使用Ch...

分类目录: 编程

10行Python搞定微信公众号邮箱检测

微信公众号的注册需要使用邮箱,而一个邮箱又只能注册一个微信公众号。有时候注册管理的公众号多了,新注册公众号时,就不记得自己的哪些邮箱已经注册了,哪些没注册。 微信公众号的注册页面本身是提供了邮箱的检测的。 我们使用它的接口,用Python来调用,10行代码就能够搞定: # coding:utf-8 ...

分类目录: 编程

【我爱背单词】用Python提炼3000英语新闻高频词汇

学英语,无论目的何在,词汇量总是一个绕不过去的坎,没有足够的词汇量,都难以用文法来组词造句。 前段时间,恶魔的奶爸提供了几份偏向于各个领域的高频词汇,很是不错。 最近用Python写爬虫入门教程的时候,碰到过几个英文网站,便有了统计一份网站英文单词词频的念头。 3000高频单词库说明: 来源:htt...