Python中文自然语言处理:一、基础文本处理

对中文进行分词 输出: 去除文本中的标点符号 输出: 生成一个单词的起始位置 输出: 去除重复词 输出: 对文本应用Zipf定律 相似性度量 输出: