1樓:匿名使用者
統計學意義(p值)zt
結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的乙個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。
如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有乙個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。
(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。
在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。
通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.
05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.
001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。
所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推導出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。
許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:
一是用替代的非引數檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。
後一種方法是基於乙個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分布並不呈正態
2樓:匿名使用者
p值是描述隨機事件發生可能性的大小。等於0表示在這個關係中,沒有可能是隨機事件導致解釋變數與被解釋變數之間的聯絡
統計學中t值p值是什麼意思?怎麼計算?
3樓:不是苦瓜是什麼
1、t指的是t檢驗,亦稱student t檢驗(student's t test),主要用於樣本含量較小(n<30),總體標準
差σ未知的正態分佈資料。
計算:t的檢驗是雙側檢驗,只要t值的絕對值大於臨界值就是不拒絕原假設。
2、p值(p value)就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果p值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,p值越小,我們拒絕原假設的理由越充分。
計算:概率定義為:p(a)=m/n,其中n表示該試驗中所有可能出現的基本結果的總數目。m表示事件a包含的試驗基本結果數。
統計學是關於認識客觀現象總體數量特徵和數量關係的科學。它是通過蒐集、整理、分析統計資料,認識客觀現象數量規律性的方**科學。由於統計學的定量研究具有客觀、準確和可檢驗的特點,所以統計方法就成為實證研究的最重要的方法,廣泛適用於自然、社會、經濟、科學技術各個領域的分析研究。
4樓:匿名使用者
簡單地說,t值和p值都用來判斷統計上是否顯著的指標, 例如不良貸款y對貸款餘額的估計方程x的回歸估計方程為:y=-0.8+0.
03x,那麼這個方程的係數0.03是否在統計上有意義呢?是否貸款餘額沒增加1個單位,不良貸款就要增加0.
03個單位呢?那麼可以通過計算其t值和p值來判斷,經計算t=7.5,p=0.
000,根據假設檢驗的相關知識,可以判斷這個方程式有意義的。
我認為,要想把它弄清楚,還是需要找本統計學原理的書看看好
5樓:東哥
,t值和p值都用來判斷統計上是否顯著的指標。
p值就是拒絕原假設的最小alpha值嘛,把統計量寫出來,帶進去算出來之後,根據統計量的分布來算p值啊,舉個例子,比如說算出來的統計量的值為z,服從的是正態分佈,如果是雙邊檢驗的話那麼pvalue=2*(1-probnorm(abs(z)));
單邊檢驗的話,應該是1-probnorm(z);
具體問題具體分析,不同的檢驗方法求p值方法也不一樣,統計的書上肯定都有;t值計算方法相似。
6樓:匿名使用者
統計學中t值p值是什麼意思,怎麼計算統計學中的批直系踢值他的統計表去計算。
7樓:甲殼蟲知道多
最通俗的來講,p值代表原假設成立的概率,所以p值越小代表原假設越不成立,所以可以拒絕原假設。一般p值小於等於5%就可以視為原假設大概率不成立了。
8樓:忽悠村——村長
1:t 這是數理統計中的一種統計量 t統計量
2:而統計量指不含未知引數的樣本函式。如樣本x
9樓:匿名使用者
正態分佈中的引數
p=正態分佈函式()
t是其逆函式
如p(0)=0.5
卡西歐計算器上就有這功能
求問統計學裡的p值是什麼含義?請用通俗易懂的語言解釋,謝謝!
10樓:語言學新兵
你需要的可能是乙個故事。
從前,你有個朋友,他每月開一輛小貨車去市場裡採購東西,然後再把所有這些東西轉賣出去。月復一月,年復一年。
但是,因為市場**變動,每乙個月他賣東西得到的毛爺爺數目並不一樣,差不多有個5000塊錢左右吧。你呢能看到他每個月的收入統計。
時間長了,有一次,無聊的你準備戲耍一下這個無辜的小夥伴,你偷偷在他的小貨車上裝了一小瓶尿。既然他肯定會在集市上賣掉所有東西,那麼這一小瓶尿他一定也會賣出去,只不過這瓶尿的**可能也就是零吧。
這一次他賺了5400塊,這可比以往的平均數5000塊錢還多。那問題就來了:為什麼這個月他賺的比平常多呢?
有兩種情況:其一,你那瓶尿很值錢,他自然會多賺;其二,你那瓶尿根本不值錢,他多賺了只是因為這個月市場上**不錯。
那到底是哪種情況呢?這個問題的實質是,你那瓶尿到底值不值錢。如果這瓶尿根本不值錢,那他賣東西和以前賣東西的情況沒什麼兩樣,只不過是市場**影響而已。
於是,你翻了他以前賣東西的紀錄,算了算所有他的個人月收入超過5400塊的概率,大概是0.1。也就是說在你這瓶尿沒有任何價值的情況下,只靠市場**,他只有0.
1的概率賣到5400塊。
所以你得出的結論是,你的那瓶尿有價值,你這個結論的p值就是0.1。
===================
故事講完了,來分析一下。
為什麼要用p值?換句話說,為什麼要做推斷統計?我想,p值到底是啥並不重要,我知道你做研究時多半只是負責看看p到底有沒有比0.05小的。而這個問題,才是我最想告訴你的。
推斷統計,之所以要「推斷」,是因為我們沒有辦法正面驗證某種情況。在這個故事中,你以前沒乾過偷偷把一瓶尿放在車上的事兒,他以前也沒賣過你的尿,所以儘管你有的是他的銷售資料,但那些舊賬本沒辦法正面告訴你你的尿到底值不值錢。
這就是「沒辦法正面驗證」,在這樣的情況下,你就沒辦法了麼?非也,我們可以換個角度考慮這個問題,假設「你那瓶尿毫無價值」是成立的,他賣了這瓶尿跟沒賣時候沒什麼兩樣,那這一次和以往自然也沒什麼兩樣。既然這次賣東西和以往一樣,那舊賬本中的記錄就能幫到你了。
你可以算算舊賬本,他在沒賣過你那瓶尿的情況下,賺到5400塊及以上的可能性(概率),這個概率就是「你那瓶尿毫無價值」的概率,這裡也就是0.1.
這樣,「你那瓶尿有價值」的概率,當然就是這個假設的相反情況,也就是0.9,這也是你的假設成立的可能性。
那這個p值到底顯著與否呢?那得看市場**。這裡市場**是隨機的,所以「顯著」與否簡單點就是在說你那瓶尿能不能跑贏市場。
業內經常以兩個標準差作為衡量「顯著」的標準。絕大多數情況下,作為隨機變數的市場**服從正態分佈。而正態分佈中,超過兩個標準差的概率是0.
05,這也就是為什麼大家要拿0.05作為「公認」的顯著性水平尺度了。
統計推斷,核心就是反證法。你那瓶尿沒價值的可能性越小,反而越能證明你那瓶尿有價值。
「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離」
這是你的書上寫的定義,但是很明顯,你把結尾最重要的「的概率」三個字漏掉了。正常情況下,這個定義應該是
「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離的概率」
不信你可以再看看你的書。
但是,怎麼可以容忍這麼***的定義?我們來用這個故事做個轉換吧:
「在原假設成立的情況下」 -> 在你那瓶尿不值錢情況下
「抽到的統計量與原假設之間的距離」 -> 他舊賬本裡的銷售記錄
「至少等於」 -> 大於或等於
"樣本計算值與原假設之間的距離" -> 他這一次的銷售記錄(5400塊)
「的概率」 -> 的概率
連起來讀讀,p值的定義就變成:
「在你那瓶尿不值錢的情況下,他舊賬本裡的銷售記錄大於或等於他這一次的銷售記錄(5400塊錢)(這個事件發生)的概率。」
這一次,好懂了點嗎?
最後要說明,說得通俗易懂是要承擔風險的,因為通俗很可能意味著不嚴謹,易懂很可能意味著不周全。以上有很多有失嚴謹之處,希望題主還要多多看書哇。
最後的最後,為什麼我要用「一瓶尿」這樣乙個非常粗俗**的故事?因為所謂的p value,不就是用來證明你的pee value的麼?
個人觀點,僅供參考!
11樓:喵喵喵
專業上,p值為結果可信程度的乙個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.
05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即
假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有乙個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果。
當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。
擴充套件資料
所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。
當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,。這種條件下有兩種方法:一是用替代的非引數檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。
另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。後一種方法是基於乙個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。
即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分布並不呈正態。
統計學中f值的意義,統計學中F值的意義
f值是f檢驗的統計量值 f檢驗是一種在零假設 null hypothesis,h0 之下,統計值服從f 分布的檢驗。其通常是用來分析用了超過乙個引數的統計模型,以判斷該模型中的全部或一部分引數是否適合用來估計母體。f值和t值是f檢驗和t檢驗的統計量值,與它們相對應的概率分布,就是f分布和t分布。統計...
關於幾個統計學符號意思,求助幾個統計學符號表示什麼意思等於什麼
那個x拔是s的下標吧?要是大寫s,那代表總體平均數的標準差 要是小寫s,代表樣本平均數的標準差。p頭頂上有的這個 符號,代表 值或估計值。表示估計值。x拔是x的的均值。s是標準差吧。求助幾個統計學符號表示什麼意思 等於什麼 定積分,其形式為 f x dx 上限a寫在 上面,下限b寫在 下面 若f x...
統計學裡的f是什麼意思,統計學中t,p,f是什麼意思
是抄f統計量麼,可能是f檢驗bai.f檢驗又叫方差齊性檢驗.在兩樣本 dut檢驗中要用到f檢驗.從兩研zhi究總體中隨dao機抽取樣本,要對這兩個樣本進行比較的時候,首先要判斷兩總體方差是否相同,即方差齊性.若兩總體方差相等,則直接用t檢驗,若不等,可採用t 檢驗或變數變換或秩和檢驗等方法.其中要判...