對於不服從正態分佈的資料如何剔除奇異點

2021-04-18 10:00:15 字數 1513 閱讀 2462

1樓:葉輝亮

第一:針對一樓,bai如果你是想做回du歸模型zhi,在資料不服從正態假設dao的情況下,你可以版對資料進行變換再做權回歸分析,至於用什麼樣的變換,建議你使用box-cox變換族,通過引數來控制變換型別,你舉的例子都是特例,詳細可參見王松桂等著的《線性模型引論》p175.

第二:如果你是想做回歸模型,但是側重於對資料的影響分析,建議你採用廣義線性模型,詳細可參見韋博成等著的《統計診斷》,或者相關的一些其他資料,這個網上很多。

第三,你只是想單純的提出一些奇異點或者高影響點,並且不知道任何樣本分佈的先驗資訊,建議你採用一些非參的方法,這個處理一般來說是比較好的,但是資料要多一點效果才好,一種典型的非引數方法就是bootstrap。

所有資料都服從正態分佈嗎?如有不服從,舉個例子

spss中資料不服從正態分佈怎麼做相關性分析,有人說資料量大於50可以不考慮是不是服從正態分佈(400個資料

2樓:匿名使用者

相關分析的結果只是提示作用,0.1-0.2的話意義不是很大了。

正態性的話還是要看的,可以不考慮你考慮的話也不會錯,對吧

3樓:匿名使用者

可以不考慮是否正態,p=0.00表示有相關了,不過0.1幾的r確實是低,

4樓:頭石會說話

可以先把資料標準化 轉化為z分數 在做相關看看 你的相關係數太低了

5樓:匿名使用者

可以考慮使用非引數檢驗

怎麼才能確定一組資料能夠服從正態分佈?

6樓:小小愛學童子

在有大量實來驗資料時才會符合正態分自布。如果你僅僅是湊的話,那麼確定平均值x,在影象上劃分一些小區間,然後查表確定每一區間所佔的概率,然後乘以總資料數得到落在該區間的樣本數m,然後你隨便在該區間取m個數就可以了,其他區間也同理

7樓:匿名使用者

spss,分析-探索分析,可以進行正態分佈檢驗

8樓:匿名使用者

相關係數不超過某個值吧…課本上有。

9樓:程琪冠昊英

我知道的方法主要bai

是兩種:

第一du,概率密度估計。用模式zhi識別裡常用的概dao率密度函式估計方法專,估計出該組資料的概屬率密度函式p(x)。然後用這組資料的均值和方差作為引數,得出乙個gauss(正態)概率密度函式f(x)。

用絕對值偏差、方均根或其他標準比較f(x)和p(x),如果充分接近,則說明該組資料符合正態分佈。(甚至可以利用假設檢驗的概念指定置信度水平等)。

第二,累積量。三階和四階累積量有其明確的意義,即所謂「偏度」和「峰度」。前者表明概率密度函式的對稱性,如果值接近0則表示對稱性好;後者表明概率密度函式(假定是單峰的)的尖銳程度,如果值接近0則表示接近正態分佈(正態分佈的所有二階以上累積量值為0)。

注意,峰度可能還有其他定義,注意不要混淆。

隨機誤差項為什麼要服從正態分佈,不服從會怎麼樣

問題問的挺好,在自然條件下,誤差如果是真正的 隨機 隨機誤差一定是正態的,無法改變。如果不正態,那一定是受某種控制了。當隨機誤差項不服從正態分佈時,估計結果是否無偏?這是因為bai 二項分布的極限是du正態分佈,組成zhi大量的隨機現象的樣本服從dao二項分布,比如今回 天路過答某個十字路口車輛的總...

如何處理不服從工作安排的員工,員工不服從工作安排如何處理?

我自己想無法管理的原因就是那麼幾個 一 我們公司在制度上對有些崗位沒有明確的生產指標,如果沒有明確的標準就無法說明那個員工的工作沒有達到公司的要求 二 因為公司的福利待遇有不合理的地方,工資待遇能上不能下,拿高階別工資的員工沒有做出她 他 應有的貢獻 三 公司目前的經營情況不是很好,很多任務人看不到...

如何辭退不服從安排的員工,職工不服從工作安排,可以開除嗎?

及浩然 如果他當時說不做了,你有證據可以從07年開媽做補償,如果沒有有效的證據,你是不能這麼做的,他如果是在你們廠做了十年,你要辭掉他要付他十個月的工資為補償,這是在提前一個月的時間通告他,如果即時辭掉他的話你得付11個月的工資。也就是說他幹了多少年你就得多付他幾個月的工資為補償,如果你在用工期間沒...