我要投稿

nltk 之 snowball 提取词干

猪小侠源码 Python教程

2022-01-22 0 187

机器学习中很重要的应用场景就是机器自动分类，而分类的关键是词干提取。所以我们要用到snowball。下面说一下snowball 提取词干的两种方法。

两种方法：

方法一：

>>> from nltk import SnowballStemmer
>>> SnowballStemmer.languages # See which languages are supported
(\'danish\', \'dutch\', \'english\', \'finnish\', \'french\', \'german\', \'hungarian\',
 \'italian\', \'norwegian\', \'porter\', \'portuguese\", \'romanian\', 
 \'russian\', \'spanish\', \'swedish\')
>>> stemmer = SnowballStemmer(\"german\") # Choose a language
>>> stemmer.stem(u\"Autobahnen\") # Stem a word
u\'autobahn\'

但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用：

方法二：

>>> ps = nltk.stem.snowball.PortugueseStemmer()
>>> ps.stem(\'celular\')
u\'celul\'
>>> ps.stem(\'celular\')
u\'celul\'

收藏 (0) 点赞 (0)

：本文采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可，转载请附上原文出处链接。
1、本站提供的源码不保证资源的完整性以及安全性，不附带任何技术服务！
2、本站提供的模板、软件工具等其他资源，均不包含技术服务，请大家谅解！
3、本站提供的资源仅供下载者参考学习，请勿用于任何商业用途，请24小时内删除！
4、如需商用，请购买正版，由于未及时购买正版发生的侵权行为，与本站无关。
5、本站部分资源存放于百度网盘或其他网盘中，请提前注册好百度网盘账号，下载安装百度网盘客户端或其他网盘客户端进行下载；
6、本站部分资源文件是经压缩后的，请下载后安装解压软件，推荐使用WinRAR和7-Zip解压软件。
7、如果本站提供的资源侵犯到了您的权益，请邮件联系： 442469558@qq.com 进行处理！

猪小侠源码-最新源码下载平台 Python教程 nltk 之 snowball 提取词干 http://www.20zxx.cn/295414/xuexijiaocheng/python.html