博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python nltk 入门demo
阅读量:5890 次
发布时间:2019-06-19

本文共 1216 字,大约阅读时间需要 4 分钟。

sudo pip install -U pyyaml nltk

 

import nltknltk.download()

搞不定,必须代理:

Installing via a proxy web server

If your web connection uses a proxy server, you should specify the proxy address as follows. In the case of an authenticating proxy, specify a username and password. If the proxy is set to None then this function will attempt to detect the system proxy.

>>> nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD')) >>> nltk.download() 然后下载: 输入d,下载模块,比如 stopwords等。
import nltkfrom nltk.stem.lancaster import LancasterStemmerdef main():    english_punctuations = set([',', '.', ':', ';', '?', '(', ')', '[', ']', '!', '@', '#', '%', '$', '*'])    stemmer = LancasterStemmer()    stopwords = set(nltk.corpus.stopwords.words('english'))    sentence = """At eight o'clock on Thursday morning Arthur didn't feel very good. interesting booking store."""    sentence = sentence.lower()    tokens = nltk.word_tokenize(sentence)    for word in tokens:        if not word in english_punctuations:            if not word in stopwords:                word = stemmer.stem(word)                print wordif __name__ == '__main__':    main()

输出:

eight

o'clock
thursday
morn
arth
n't
feel
good
interest
book
stor

 

转载地址:http://wsfsx.baihongyu.com/

你可能感兴趣的文章
python 重载方法有哪些特点 - 老王python - 博客园
查看>>
在Fedora8上安装MySQL5.0.45的过程
查看>>
TCP长连接与短连接的区别
查看>>
设计模式之命令模式
查看>>
android 测试 mondey
查看>>
Spring AOP项目应用——方法入参校验 & 日志横切
查看>>
TestNG 六 测试结果
查看>>
用Fiddler或Charles进行mock数据搭建测试环境
查看>>
使用REST-Assured对API接口进行自动化测试
查看>>
GitHub发布史上最大更新,年度报告出炉!
查看>>
王潮歌跨界指导HUAWEI P20系列发布会 颠覆传统 眼界大开!
查看>>
王高飞:微博已收购一直播 明年一季度重点是功能与流量打通
查看>>
趣头条发行区间7至9美元 预计9月14日美国上市
查看>>
新北市长侯友宜:两岸交流应从隔壁最亲近的人开始
查看>>
全面屏的Nokia X即将上线,不到2000元的信仰你要充值吗?
查看>>
HTML5音频audio属性
查看>>
ES6学习
查看>>
Centos7搭建Django环境
查看>>
序列化一个Intent
查看>>
JavaScript数据类型及语言基础--ife
查看>>