Python怎樣對nltk tree Tree物件進行處理

1樓：育知同創教育

目前我用來

以下**可

源以獲得sentence的denpendency tree t:

result = dependency_parser.raw_parse(sentence)t = result.__next__().tree()

t.triples()可以bai獲du得所有節點zhi之間dependency，乙個triple表示為(word1, dependency, word2), t.draw()可以畫出樹形圖dao等。

如何用 python 中的 nltk 對中文進行分析和處理

2樓：匿名使用者

一、nltk進行分詞

用到的函式：

nltk.sent_tokenize(text) #對文字按照句子進行分割

nltk.word_tokenize(sent) #對句子進行分詞

二、nltk進行詞性標註

用到的函式：

nltk.pos_tag(tokens)#tokens是句子分詞後的結果，同樣是句子級的標註

三、nltk進行命名實體識別（ner）

用到的函式：

nltk.ne_chunk(tags)#tags是句子詞性標註後的結果，同樣是句子級

上例中，有兩個命名實體，乙個是xi,這個應該是per，被錯誤識別為gpe了；另乙個事china，被正確識別為gpe。

四、句法分析

nltk沒有好的parser，推薦使用stanfordparser

但是nltk有很好的樹類，該類用list實現

可以利用stanfordparser的輸出構建一棵python的句法樹

3樓：匿名使用者

買本書看 ……

4樓：令梅函靖巧

有很多好用的中文處理包：

jieba：可以用來做分詞，詞性標註，textrankhanlp：分詞，命名實體識別，依存句法分析，還有fudannlp，nlpir

個人覺得都比nltk好用～

怎樣招到python高手，python高手煉成要多久

熟知主流硬體體系 x86,x64 熟知 cpython 的具體實現，如若可能至少通讀原始碼三遍以上熟知每條 python bytecode 如何被解釋執行熟知每條 python 語句如何 compile 成 bytecode 熟知 python 主要資料結構所採用的優化手段熟知 jit 以及哪...

python這樣寫多執行緒對嗎Python多執行緒效率不高嗎

多執行緒供你參考 import threading import time exitflag 0 class mythread threading.thread def init self,threadid,name,counter threading.thread.init self self.t...

Python中怎樣使用shape計算矩陣的行和列

import numpy a numpy.array 1,2,3 4,5,6 print a.shape 矩陣有乙個shape屬性,是乙個行,列形式的元組 python中怎樣使用shape計算矩陣的行和列 import numpy a numpy.array 1,2,3 4,5,6 print ...

Python怎樣對nltk tree Tree物件進行處理

怎樣招到python高手，python高手煉成要多久

python這樣寫多執行緒對嗎Python多執行緒效率不高嗎

Python中怎樣使用shape計算矩陣的行和列

相關推薦