1樓:育知同創教育
目前我用來
以下**可
源以獲得sentence的denpendency tree t:
result = dependency_parser.raw_parse(sentence)t = result.__next__().tree()
t.triples()可以bai獲du得所有節點zhi之間dependency,乙個triple表示為(word1, dependency, word2), t.draw()可以畫出樹形圖dao等。
如何用 python 中的 nltk 對中文進行分析和處理
2樓:匿名使用者
一、nltk進行分詞
用到的函式:
nltk.sent_tokenize(text) #對文字按照句子進行分割
nltk.word_tokenize(sent) #對句子進行分詞
二、nltk進行詞性標註
用到的函式:
nltk.pos_tag(tokens)#tokens是句子分詞後的結果,同樣是句子級的標註
三、nltk進行命名實體識別(ner)
用到的函式:
nltk.ne_chunk(tags)#tags是句子詞性標註後的結果,同樣是句子級
上例中,有兩個命名實體,乙個是xi,這個應該是per,被錯誤識別為gpe了; 另乙個事china,被正確識別為gpe。
四、句法分析
nltk沒有好的parser,推薦使用stanfordparser
但是nltk有很好的樹類,該類用list實現
可以利用stanfordparser的輸出構建一棵python的句法樹
3樓:匿名使用者
買本書看 ……
4樓:令梅函靖巧
有很多好用的中文處理包:
jieba:可以用來做分詞,詞性標註,textrankhanlp:分詞,命名實體識別,依存句法分析,還有fudannlp,nlpir
個人覺得都比nltk好用~
怎樣招到python高手,python高手煉成要多久
熟知主流硬體體系 x86,x64 熟知 cpython 的具體實現,如若可能至少通讀原始碼三遍以上 熟知每條 python bytecode 如何被解釋執行 熟知每條 python 語句如何 compile 成 bytecode 熟知 python 主要資料結構所採用的優化手段 熟知 jit 以及哪...
python這樣寫多執行緒對嗎Python多執行緒效率不高嗎
多執行緒供你參考 import threading import time exitflag 0 class mythread threading.thread def init self,threadid,name,counter threading.thread.init self self.t...
Python中怎樣使用shape計算矩陣的行和列
import numpy a numpy.array 1,2,3 4,5,6 print a.shape 矩陣有乙個shape屬性,是乙個 行,列 形式的元組 python中怎樣使用shape計算矩陣的行和列 import numpy a numpy.array 1,2,3 4,5,6 print ...