1樓:魔斯漢堡包
..這個工程量貌似很大啊。。要是有的話我20分同求。。謝謝樓主了
哪位大神能大致描述一下,樸素貝葉斯實現自動文字分類,明天覆試擔心導師會問
2樓:繡乞群群
該文bai
主要**如何通過du樸素貝葉斯演算法對中文論壇中zhi的文字資訊進dao行 自動分類,專文中首先介紹了屬樸素貝葉斯演算法的基本原理,並分析了該演算法在文字分類中存在的不足之處
然後針對中文論壇的文字資訊進行研究,結合中文論壇文字 的特點對樸素貝葉斯演算法提出了兩點修正,給出了修正後的分類演算法公式
最後介紹了如何借助lucene開源框架、berke?leydb資料庫及 ikanalyzer分詞器等工具
對修正樸素貝葉斯演算法進行技術實現。
基於樸素貝葉斯方法的文字分類簡單嗎
3樓:月下陪聊
如果缺乏好的對文字自動進行索引及摘要的工具,要從inter***浩瀚的文字中檢索有用資訊是很困難的。因此,文字分類成為資訊檢索(informationretrieval)的重要組成部分。樸素貝葉斯分類是應用統計理論進行文字分類的有效方法之一。
該文結合web文字的特點使用樸素貝葉斯分類器實現了乙個web文字分類系統webcat,並獲得了很好的分類結果
樸素貝葉斯文字分類器的特徵向量是怎麼定義的?
4樓:匿名使用者
一般是先分詞,然後用tfidf方法
來向量化,只用詞頻效果不是很好,然後可以用特徵選專擇方法或特徵抽取方法來屬降低維度,一般的方法有資訊熵、資訊增益等等很多種的。如果你的機器跑得動的話不降也可以,不過一般來說還是要降的
基於weka實現文字分類 中文短文本 不同演算法的結果差異較大 樸素貝葉斯明顯優於其他 請問原因
5樓:東邊的雲
樓主你好
對於文字分類,樸素貝葉斯或者貝葉斯信念網路 的效果是最好的 和一般的聚類分類是有區別的
樓主可以參閱 bug triage的相關文獻
6樓:匿名使用者
你好!每種分類方法都有自己的擅長領域,對於文字分類問題,可能你的資料條件比較適合應用樸素貝葉斯方法,svm、決策樹方法等也是有缺點的!
什麼時候用全概率公式和貝葉斯公式
1.全概公式 首先建立乙個完備事件組的思想,其實全概就是已知第一階段求第二階段,比如第 一階段分a b c三種,然後a b c中均有d發生的概率,最後讓你求d的概率 p d p a p d a p b p d b p c p d c 2.貝葉斯公式,其實原本應該叫逆概公式,為了紀念貝葉斯這樣取名而已...
全概率公式與貝葉斯公式有什麼區別
1.全概公式 首先建立乙個完備事件組的思想,其實全概就是已知第一階段求第二階段,比如第一階段分a bc三種,然後a bc中均有d發生的概率,最後讓你求d的概率p d p a p d a p b p d b p c p d c 2.貝葉斯公式,其實原本應該叫逆概公式,為了紀念貝葉斯這樣取名而已.在全概...
垃圾郵件貝葉斯演算法token串的頻率和hash表感覺沒多大聯絡
2005年全國計算機等級考試四級考試大綱 基本要求 1.具有計算機及其應用的基礎知識。2.熟悉計算機作業系統,軟體工程和資料庫的原理及其應用。3.熟悉計算機體系結構 系統組成和效能評價的基礎和應用知識。4.具有計算機網路和通訊的基礎知識。5.具有計算機應用專案開發的分析設計和組織實施的基本能力。6....