P value如何計算,統計學中的P值應該怎麼計算

2021-05-04 18:37:41 字數 4848 閱讀 4287

1樓:三重石

假設檢驗是推斷統計中的一項重要內容。

用sas、spss等專業統計軟體進行假設檢驗,在假設檢驗中常見到p 值方法( p-value,probability,pr),這是由於它更容易應用於計算機軟體中。

統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為顯著, p <0.01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 或0.01。

實際上,p 值不能賦予資料任何重要性,只能說明某事件發生的機率。p < 0.01 時樣本間的差異比p < 0.05 時更大,這種說法是錯誤的。

統計結果中顯示pr > f,也可寫成pr( >f),p = p或p = p。

下面的內容列出了p值計算方法。

(1) p值是:

1) 一種概率,一種在原假設為真的前提下出現觀察樣本以及更極端情況的概率。

2) 拒絕原假設的最小顯著性水平。

3) 觀察到的(例項的) 顯著性水平。

4) 表示對原假設的支援程度,是用於確定是否應該拒絕原假設的另一種方法。

5)注意:p值不是給定樣本結果時原假設為真的概率,而是給定原假設為真時樣本結果出現的概率。

(2) p 值的計算:

一般地,用x 表示檢驗的統計量,當h0 為真時,可由樣本資料計算出該統計量的值c ,根據檢驗統計量x 的具體分布,可求出p 值。具體地說:

左側檢驗的p 值為檢驗統計量x 小於樣本統計值c 的概率,即: p = p

右側檢驗的p 值為檢驗統計量x 大於樣本統計值c 的概率: p = p

雙側檢驗的p 值為檢驗統計量x 落在樣本統計值c 為端點的尾部區域內的概率的2 倍: p = 2p (當c 位於分布曲線的右端時) 或p = 2p (當c 位於分布曲線的左端時) 。若x 服從正態分佈和t 分布,其分布曲線是關於縱軸對稱的,故其p 值可表示為p = p 。

計算出p 值後,將給定的顯著性水平α與p 值比較,就可作出檢驗的結論:

如果α > p 值,則在顯著性水平α下拒絕原假設。

如果α ≤ p 值,則在顯著性水平α下接受原假設。

在實踐中,當α = p 值時,也即統計量的值c 剛好等於臨界值,為慎重起見,可增加樣本容量,重新進行抽樣檢驗。

2樓:海使用者

假設檢驗是推斷統計中的一項重要內容。在假設檢驗中常見到p 值( p-value,probability,pr),p 值是進行檢驗決策的另乙個依據。

p 值即概率,反映某一事件發生的可能性大小。統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為顯著, p <0.

01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 或0.01。

實際上,p 值不能賦予資料任何重要性,只能說明某事件發生的機率。 p < 0.01 時樣本間的差異比p < 0.

05 時更大,這種說法是錯誤的。統計結果中顯示pr > f,也可寫成pr( >f),p = p或p = p。

下面的內容列出了p值計算方法

(1) p值是:

1) 一種概率,一種在原假設為真的前提下出現觀察樣本以及更極端情況的概率。

2) 拒絕原假設的最小顯著性水平。

3) 觀察到的(例項的) 顯著性水平。

4) 表示對原假設的支援程度,是用於確定是否應該拒絕原假設的另一種方法。

(2) p 值的計算:

一般地,用x 表示檢驗的統計量,當h0 為真時,可由樣本資料計算出該統計量的值c ,根據檢驗統計量x 的具體分布,可求出p 值。具體地說: 左側檢驗的p 值為檢驗統計量x 小於樣本統計值c 的概率,即:

p = p 右側檢驗的p 值為檢驗統計量x 大於樣本統計值c 的概率:p = p 雙側檢驗的p 值為檢驗統計量x 落在樣本統計值c 為端點的尾部區域內的概率的2 倍: p = 2p (當c位於分布曲線的右端時) 或p = 2p (當c 位於分布曲線的左端時) 。

若x 服從正態分佈和t分布,其分布曲線是關於縱軸對稱的,故其p 值可表示為p = p 。 計算出p 值後,將給定的顯著性水平α與p 值比較,就可作出檢驗的結論: 如果α > p 值,則在顯著性水平α下拒絕原假設。

如果α ≤ p 值,則在顯著性水平α下接受原假設。 在實踐中,當α = p 值時,也即統計量的值c 剛好等於臨界值,為慎重起見,可增加樣本容量,重新進行抽樣檢驗。

p值是怎麼來的

從某總體中抽 ⑴、這一樣本是由該總體抽出,其差別是由抽樣誤差所致; ⑵、這一樣本不是從該總體抽出,所以有所不同。 如何判斷是那種原因呢?統計學中用顯著性檢驗賴判斷。

其步驟是: ⑴、建立檢驗假設(又稱無效假設,符號為h0):如要比較a藥和b藥的療效是否相等,則假設兩組樣本來自同一總體,即a藥的總體療效和b藥相等,差別僅由抽樣誤差引起的碰巧出現的。

⑵、選擇適當的統計方法計算h0成立的可能性即概率有多大,概率用p值表示。⑶、根據選定的顯著性水平(0.05或0.

01),決定接受還是拒絕h0。如果p>0.05,不能否定「差別由抽樣誤差引起」,則接受h0;如果p<0.

05或p <0.01,可以認為差別不由抽樣誤差引起,可以拒絕h0,則可以接受令一種可能性的假設(又稱備選假設,符號為h1),即兩樣本來自不同的總體,所以兩藥療效有差別。

統計學上規定的p值意義見下表

p值 碰巧的概率 對無效假設 統計意義

p>0.05 碰巧出現的可能性大於5% 不能否定無效假設 兩組差別無顯著意義

p<0.05 碰巧出現的可能性小於5% 可以否定無效假設 兩組差別有顯著意義

p <0.01 碰巧出現的可能性小於1% 可以否定無效假設 兩者差別有非常顯著意義

注意要點

理解p值,下述幾點必須注意: ⑴p的意義不表示兩組差別的大小,p反映兩組差別有無統計學意義,並不表示差別大小。因此,與對照組相比,c藥取得p<0.

05,d藥取得p <0.01並不表示d的藥效比c強。 ⑵ p>0.

05時,差異無顯著意義,根據統計學原理可知,不能否認無效假設,但並不認為無效假設肯定成立。在藥效統計分析中,更不表示兩藥等效。哪種將「兩組差別無顯著意義」與「兩組基本等效」相同的做法是缺乏統計學依據的。

⑶統計學主要用上述三種p值表示,也可以計算出確切的p值,有人用p <0.001,無此必要。 ⑷顯著性檢驗只是統計結論。

判斷差別還要根據專業知識。樣所得的樣本,其統計量會與總體引數有所不同,這可能是由於兩種原因

統計學中的p值應該怎麼計算

3樓:河傳楊穎

p值的計算公式是

=2[1-φ(z0)] 當被測假設h1為 p不等於p0時;

=1-φ(z0)  當被測假設h1為 p大於p0時;

=φ(z0)   當被測假設h1為 p小於p0時;

總之,p值越小,表明結果越顯著。但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要根據p值的大小和實際問題來解決。

擴充套件資料

統計學中回歸分析的主要內容為:

1、從一組資料出發,確定某些變數之間的定量關係式,即建立數學模型並估計其中的未知引數。估計引數的常用方法是最小二乘法。

2、對這些關係式的可信程度進行檢驗。

3、在許多自變數共同影響著乙個因變數的關係中,判斷哪個(或哪些)自變數的影響是顯著的,哪些自變數的影響是不顯著的,將影響顯著的自變數加入模型中,而剔除影響不顯著的變數,通常用逐步回歸、向前回歸和向後回歸等方法。

4、利用所求的關係式對某一生產過程進行**或控制。回歸分析的應用是非常廣泛的,統計軟體包使各種回歸方法計算十分方便。

4樓:牽陽焱梁桃

統計學意義(p值)zt

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的乙個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有乙個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推導出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:

一是用替代的非引數檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於乙個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分布並不呈正態。

統計學中f值的意義,統計學中F值的意義

f值是f檢驗的統計量值 f檢驗是一種在零假設 null hypothesis,h0 之下,統計值服從f 分布的檢驗。其通常是用來分析用了超過乙個引數的統計模型,以判斷該模型中的全部或一部分引數是否適合用來估計母體。f值和t值是f檢驗和t檢驗的統計量值,與它們相對應的概率分布,就是f分布和t分布。統計...

統計學的問題,統計學問題?

binompdf numtrials,p x 給定離散二項分佈的 numtrials和每次實驗成功 概率p 計算其在x處的 概率.binomcdf為離散二項分佈 例一 兩人遊戲,你想測定對方有至少兩個6的概率。p 至少有兩個6的概率 1 binomcdf 8 0.1 1 0.18670.所以有18....

怎樣理解平均數在統計學中的地位統計學!在加權算數平均數中,如何理解權數意義。簡答

平均數是集中量數的代表,也是最常用的一種描述統計指標.它反映了資料的代表性.也即可以通過平均數對資料的集中性或代表性有乙個直觀的了解.其次,平均數也是常用的一種統計量,許多推斷統計方法都是基於平均數進行的.目前大多數統計方法中,平均數都占有最重要的位置.無論是要掌握某個總體的狀況,還是要比較不同總體...