nltk 之 snowball 提取词干

2022-01-22 0 187
机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball。下面说一下snowball 提取词干的两种方法。
两种方法:
方法一:
>>> from nltk import SnowballStemmer
>>> SnowballStemmer.languages # See which languages are supported
(\'danish\', \'dutch\', \'english\', \'finnish\', \'french\', \'german\', \'hungarian\',
 \'italian\', \'norwegian\', \'porter\', \'portuguese\", \'romanian\', 
 \'russian\', \'spanish\', \'swedish\')
>>> stemmer = SnowballStemmer(\"german\") # Choose a language
>>> stemmer.stem(u\"Autobahnen\") # Stem a word
u\'autobahn\'
但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用:
方法二:
>>> ps = nltk.stem.snowball.PortugueseStemmer()
>>> ps.stem(\'celular\')
u\'celul\'
>>> ps.stem(\'celular\')
u\'celul\'


:本文采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可, 转载请附上原文出处链接。
1、本站提供的源码不保证资源的完整性以及安全性,不附带任何技术服务!
2、本站提供的模板、软件工具等其他资源,均不包含技术服务,请大家谅解!
3、本站提供的资源仅供下载者参考学习,请勿用于任何商业用途,请24小时内删除!
4、如需商用,请购买正版,由于未及时购买正版发生的侵权行为,与本站无关。
5、本站部分资源存放于百度网盘或其他网盘中,请提前注册好百度网盘账号,下载安装百度网盘客户端或其他网盘客户端进行下载;
6、本站部分资源文件是经压缩后的,请下载后安装解压软件,推荐使用WinRAR和7-Zip解压软件。
7、如果本站提供的资源侵犯到了您的权益,请邮件联系: 442469558@qq.com 进行处理!

猪小侠源码-最新源码下载平台 Python教程 nltk 之 snowball 提取词干 http://www.20zxx.cn/295414/xuexijiaocheng/python.html

猪小侠源码,优质资源分享网

常见问题
  • 本站所有资源版权均属于原作者所有,均只能用于参考学习,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担
查看详情
  • 最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,建议提前注册好百度网盘账号,使用百度网盘客户端下载
查看详情

相关文章

官方客服团队

为您解决烦忧 - 24小时在线 专业服务