Python怎樣對nltk tree Tree物件進行處理

2021-04-25 08:55:49 字數 1082 閱讀 7873

1樓:育知同創教育

目前我用來

以下**可

源以獲得sentence的denpendency tree t:

result = dependency_parser.raw_parse(sentence)t = result.__next__().tree()

t.triples()可以bai獲du得所有節點zhi之間dependency,乙個triple表示為(word1, dependency, word2), t.draw()可以畫出樹形圖dao等。

如何用 python 中的 nltk 對中文進行分析和處理

2樓:匿名使用者

一、nltk進行分詞

用到的函式:

nltk.sent_tokenize(text) #對文字按照句子進行分割

nltk.word_tokenize(sent) #對句子進行分詞

二、nltk進行詞性標註

用到的函式:

nltk.pos_tag(tokens)#tokens是句子分詞後的結果,同樣是句子級的標註

三、nltk進行命名實體識別(ner)

用到的函式:

nltk.ne_chunk(tags)#tags是句子詞性標註後的結果,同樣是句子級

上例中,有兩個命名實體,乙個是xi,這個應該是per,被錯誤識別為gpe了; 另乙個事china,被正確識別為gpe。

四、句法分析

nltk沒有好的parser,推薦使用stanfordparser

但是nltk有很好的樹類,該類用list實現

可以利用stanfordparser的輸出構建一棵python的句法樹

3樓:匿名使用者

買本書看 ……

4樓:令梅函靖巧

有很多好用的中文處理包:

jieba:可以用來做分詞,詞性標註,textrankhanlp:分詞,命名實體識別,依存句法分析,還有fudannlp,nlpir

個人覺得都比nltk好用~

怎樣招到python高手,python高手煉成要多久

熟知主流硬體體系 x86,x64 熟知 cpython 的具體實現,如若可能至少通讀原始碼三遍以上 熟知每條 python bytecode 如何被解釋執行 熟知每條 python 語句如何 compile 成 bytecode 熟知 python 主要資料結構所採用的優化手段 熟知 jit 以及哪...

python這樣寫多執行緒對嗎Python多執行緒效率不高嗎

多執行緒供你參考 import threading import time exitflag 0 class mythread threading.thread def init self,threadid,name,counter threading.thread.init self self.t...

Python中怎樣使用shape計算矩陣的行和列

import numpy a numpy.array 1,2,3 4,5,6 print a.shape 矩陣有乙個shape屬性,是乙個 行,列 形式的元組 python中怎樣使用shape計算矩陣的行和列 import numpy a numpy.array 1,2,3 4,5,6 print ...