英論閣Enago官方博客分享 http://www.ueservicedoffices.com/u/Enago

博文

統計學指標p值還可信嗎? 精選

已有 3137 次閱讀 2019-5-22 13:39 |個人分類:英論寫作發表|系統分類:論文交流| P值

StatisticsHasMoreToOfferThanJustThe_p-value_Image.jpg

科研工作者經常用統計學方法來判斷某個結果是否在不同的實驗條件下存在差異,并且判斷這種差異是否由于偶然因素造成。使用最廣泛的統計指標是p值,用來檢測差異的顯著性水平!皃<0.05”代表著樣本間的差異由抽樣誤差所致的概率小于0.05,這種有統計學顯著性差異的結果正是科研人員夢寐以求的。有了這樣的結果,就可能意味著論文發表,科研經費到位,甚至功成名就,對p值的濫用和誤用現象也因此而生,即所謂的p-hacking,指p值篡改或p值操縱。

由于p<0.05被推上神壇,被視為論文可能發表的指標,就有科研者費盡心機操縱p值。不管是有心還是無意,科研者會不斷嘗試各種統計學方法和數據,直至p<0.05。P-hacking的手段有對變量進行選擇性取舍、對數據進行選擇性刪除、對樣本量進行選擇性增加、在統計分析后把指標進行合并或拆分、發現p值有意義后就停止收集數據等等。這樣的統計分析很容易產生假陽性結果,也導致實驗的不可重復性?杀氖,這種行為在發表的科研論著中相當普遍。

2015年,Science發表了一項實驗心理學的大規模重復性研究,僅有39%的結果能夠被成功重復。Nature的一項調查發現70%的科研人員無法重復他人的研究,50%的科研人員甚至無法重復自己的實驗結果?蒲械男庞靡呀洷弧翱芍貜托晕C”損害,而p-hacking對此也起到了推波助瀾的作用,讓很多統計學家和科學家都非常擔憂。

如何避免p值操縱呢?最好的辦法就是提高科研者對p-hacking危害性的認識,避免對實驗數據進行選擇性地分析。弗吉尼亞大學心理學教授Brian Nosek發起成立了推動科研界更開放更透明的公益組織—開放科學中心(Center for Open Science),幫助科研者更好的設計實驗,提高實驗的可重復性。比如,雙盲實驗就可以避免科研者選擇性地處理數據。

另外一項統計學指標“信心指數”(Confidence Index) 可以用來更加準確地評估實驗數據的可靠性。p值依靠樣本量和反應頻率,而信心指數不同,它是個復合指標,由以下三點決定:隨機變量,先驗概率,假設真相。p<0.05說明實驗結果有95%的可能性是有意義的,而信心指數則明確清晰的說明結果有意義的具體可能性是多少。這樣的統計指標尤其對臨床研究的決策有指導性意義。斯坦福大學醫學院流行病學教授Steven GoodmanNature上撰文建議使用信心指數,可以減少對p值的依賴和舞弊。

統計學家在2016年初專門發表聲明,澄清p值的真正意義以及應該如何正確使用p值。然而p值仍延續著一直被批判,從未被取代的地位。如何對科研界的現狀進行有效的改變,還需要科研者和學術出版界共同努力,探索新的統計學標準以及適用的領域。

您可能感興趣的文章

如何高效地檢索和審閱專利


更多精彩文章,請點擊訂閱英論閣學術院

或關注英論閣微信公眾號EnagoChina

§博客內容皆由英論閣資深學術專家團隊撰寫提供§




http://www.ueservicedoffices.com/blog-681387-1180495.html

上一篇:解讀STEM領域性別失衡的原因
下一篇:我們應當抵制學術出版商嗎?

7 李欣海 黃裕權 楊正瓴 黃永義 王衛 王從彥 李哲林

該博文允許注冊用戶評論 請點擊登錄 評論 (2 個評論)

數據加載中...

Archiver|手機版|科學網 ( 京ICP備14006957 )

GMT+8, 2019-5-26 06:12

Powered by ScienceNet.cn

Copyright © 2007- 中國科學報社

返回頂部
时时彩平台