NLTK|NLTK中使用Stanford parser
原文链接:http://blog.csdn.net/qq_19670461/article/details/42681551
nltk工具包中有一个用于自然语言句法分析的文件夹parse(地址C:\Python27\Lib\site-packages\nltk\parse\stanford.py)。其中stanford.py就是我们要用的stanford parser的源文件,这里面有parser的接口,直接使用可以进行最简单的句法分析。
步骤
1.下载stanford最新版本,最新版本为stanford-parser-full-2014-10-31。下载地址:http://nlp.stanford.edu/software/lex-parser.shtml#Download。
2.打开下载好的压缩包,进入/edu/stanford/nlp/models/lexparser/,找到englishPCFG.ser.gz 并解压到某处(比如我的地址为E:/stanford-parser-full-2014-10-31/stanford-parser-3.5.0-models/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz)。
3.新建jars文件夹(比如我的地址为E:/jars),将stanford文件夹中的stanford-parser.jar, stanford-parser-3.4.1-sources.jar, stanford-parser-3.4.1-javadoc.jar拷贝进来。
4.执行代码查看结果。
import os
from nltk.parse import stanford#添加stanford环境变量,此处需要手动修改,jar包地址为绝对地址。
os.environ['STANFORD_PARSER'] = 'E:/jars/stanford-parser.jar'
os.environ['STANFORD_MODELS'] = 'E:/jars/stanford-parser-3.5.0-models.jar'#为JAVAHOME添加环境变量
java_path = "C:/Program Files (x86)/Java/jdk1.8.0_11/bin/java.exe"
os.environ['JAVAHOME'] = java_path#句法标注
parser = stanford.StanfordParser(model_path="E:/stanford-parser-full-2014-10-31/stanford-parser-3.5.0-models/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz")
sentences = parser.parse_sents("Hello, My name is Melroy.".split(), "What is your name?".split())
print sentences# GUI
for sentence in sentences:
sentence.draw()
【NLTK|NLTK中使用Stanford parser】参考
http://stackoverflow.com/questions/13883277/stanford-parser-and-nltk
推荐阅读
- 热闹中的孤独
- Shell-Bash变量与运算符
- JS中的各种宽高度定义及其应用
- 2021-02-17|2021-02-17 小儿按摩膻中穴-舒缓咳嗽
- 深入理解Go之generate
- 由浅入深理解AOP
- 异地恋中,逐渐适应一个人到底意味着什么()
- 【译】20个更有效地使用谷歌搜索的技巧
- 我眼中的佛系经纪人
- 《魔法科高中的劣等生》第26卷(Invasion篇)发售