國家健康和營養檢查調查 (NHANES)。是一項旨在評估美國**和兒童的健康和營養狀況的研究計畫。 這項調查的獨特之處在於它結合了:採訪跟體檢。美國疾病控制與預防中心(CDC)負責向全國提供健康統計資料。
Nhanes訪談包括:人口社會經濟飲食和健康相關問題檢查部分包括:醫療牙科跟生理測量,以及由訓練有素的醫務人員進行的實驗室測試。
近年來,在公共資料庫中發表的論文數量逐年增加,NHANES資料庫的資料質量較高,每年發表的論文數量甚至更高新型復合指標等等!
今天的複製文章為您帶來了一篇關於NHANES資料庫中合成指標的文章的複製品,包括所有這些指標** 它還隨處理後的資料一起提供
1.複製品介紹
我們今天要介紹的複製文章發表在“.nutrition metabolism and cardiovascular diseasesif=3.9題為:“association of life’s essential 8 with all-cause and cardiovascular mortality among us adults: a prospective cohort study from thenhanes 2005-2014 ”研究**。
題目:美國成人生命與健康八要素與全因心血管死亡率之間的關係:NHANES 2005-2014 的前瞻性佇列研究。
生命健康的八大要素
生命的八行(生命's essential 8),這是近年來NHANES資料庫文章中使用最頻繁的綜合指標之一,包括:節食體力活動吸菸(尼古丁暴露)。睡個好覺bmi血脂血糖跟血壓。這些指標中的每乙個都有一種新的評分演算法(0-100 分),可以在最後生成新的綜合心血管健康評分(0-100 分)。
總分分別<50分、50-79分、80分,表明心血管健康窮中等跟更好
文章資料介紹
NHANES資料庫研究涉及的變數如下表所示,本次複製中使用的變數也與文章中相同始終如一
醫學**與統計分析"答"241 複製品"獲取全部**和資料。
2. R語言再現
此複製品中包含的統計方法是:
基線差異分析繪製公里曲線COX回歸多模型控制混雜趨勢分析 p 趨勢繪製非受限三次樣條曲線 (RCS)。
資料匯入和預處理
首先,我們匯入了從NHANES資料庫中提取的處理資料,轉載的資料包括19,481名研究物件(原文n=23,110),樣本量略有不同,因此請多注意統計方法的使用。
基線差異分析
使用此複製基線**tableone 軟體包這裡“myvars”彙總基線表所有變數,其中一些是分類變數,需要傳遞“catvars”具體說明,否則,分類資料也將作為定量資料呈現。
這裡 tab2 和 tab3 顯示了兩種統計描述方式,tab2 沒有指定分組變數,則只顯示每個變數的資料分布,tab3 使用“strata=” 指定分組變數,在顯示資料分布的基礎上,增加了:分組資料之間的差異比較
另外“showAllLevels = true” 表示顯示類別變數的所有類別因子的結果“nonnormal =”指定的定量資料將用作:偏態分布對於分析,如果所有定量資料都有偏斜,則可以簡潔地使用“nonnormal = true”來代表。
最後,基線表結果輸出儲存在工作區,這裡我們將另存為CSV 格式
CSV格式的結果顯示如下:
繪製公里曲線
這是繪製公里曲線的地方生存套餐跟SurvMiner 軟體包,如果需要單獨完成LogRank 測試,survdiff 函式直接執行!
輸出讀取最後一行的 p<2e-16,規範書寫應為 p<0001。
在這裡使用SurtvFit 函式構建模型,ggsurvplot 函式負責圖形的繪製和美化,有很多引數可以調整,這裡旁邊有標記的**,可以根據需要進行調整。
顯示繪圖結果
COX 返回
這裡使用生存包進行回歸模型建模,autoreg 包可以美化輸出結果,生成更直觀簡潔的三行**樣式,還可以自定義回歸方法,其中"uni=true"指單變數結果的輸出'threshold"可以定義過濾器變數進入多元回歸的 p 閾值
最後,利用rrtable 軟體包結果輸出到 Word,結果的 Word 版本也儲存在工作區中間。
以模型 3 為例,顯示 R 輸出結果:
趨勢分析 p 趨勢
有兩種方法可以計算 P 趨勢:
秩或定量自變數直接納入回歸分析,各組的中位數作為特殊值作為趨勢分析的節點值。
這裡更多推薦方法下面分別演示了以下兩種方法:
方法一:秩或定量自變數直接納入回歸分析
這裡as.numeric(cvh1)即將原來的分類變數CVH1轉換成數值變數,直接納入回歸模型,其餘**與普通COX回歸一致。
結果:
與該方法相比,在回歸分析之前多了乙個步驟,即對每組資料的中位數進行選擇和變換,以重複資料為例,CVH1變數有3類在組內使用中值變換成為特殊的三方資料。
由於使用了資料轉換豎線字元 %>%。,所以需要載入DPLYR 軟體包轉換完成後,將按相同的方法執行回歸分析,只是使用轉換後的 CVH3 而不是原始的 CVH1。
以模型 3 為例,顯示 R 輸出結果:
與方法相比,計算結果也略有不同,但正負方向大體一致。
繪製 RCS 曲線
這裡還有兩種繪製 R 包的方法,即 plotrcs 包或 RMS 和 ggplot 包的組合。
plotrcs 軟體包繪製RCS影象相對容易,引數設定也很容易理解,但其他細節有點讓人不知所措。
生成的影象顯示:
1.計算P值與HR值的非線性關係
2. 繪製 RCS 影象
ggplot2 包在繪製影象時更加靈活,例如通過新增輔助線"geom_hline"指導軌的縱軸位置"linetype=2"將線型定義為實心,以同樣的方式,"geom_vline"指導軌的水平軸位置這裡"xintercept"要查詢 HR=1 對應的變數值,需要查詢上一步計算的 HR 表。
生成的影象顯示:
3. 風暴統計平台再現
風暴統計平台是一款基於r**的統計分析平台,具有快速、準確、簡單的操作帶您,並已實現多種統計分析方法的選單式操作,這裡通過文章的轉載為大家全面展示。 (搜尋“Storm Statistics”平台)。
基線差異分析
進入 Storm Stats 平台後,單擊“風暴智慧型統計”。“混雜偏差的回歸控制""控制混雜偏差的多模型方法",該模組可一站式解決基線差異分析COX 回歸多模型構建
按照以下提示逐一操作,右側會出現三線基線差異,操作起來非常方便
p 值計算與 R 結果一致,並且顯示的統計資料比 R 中顯示的統計資料多!
COX 返回
所謂多種模型控制混雜偏差,即通過構建 model1、model2、model3 等逐漸調整不同的混雜因素,並觀察核心暴露的p值的變化。
目前,風暴統計平台最多可構建4個多因子模型"多種模型控制混雜偏差"模組中,選擇回歸模型,依次選擇回歸變數,右側給出 model1 的結果分析。
後面model2和model3的構造,根據下面介面的提示依次選擇,直接在右側生成最終的多模型三行表,省去了自己繪製表格和填寫資料的步驟結果HR值、95%CI值和P值與R語言一致
繪製公里曲線
需要風暴統計資料來繪製 km 曲線“風暴智慧型統計”。生存分析生存分析全套這裡輸入,匯入資料後,在"生存曲線與生存時間"模組,依次選擇變數,右側生成km曲線。
這些步驟可以對圖形進行微調,最後直接,**因顯示問題導致的風險表字型擠壓現象將在**的**中恢復正常!
趨勢分析 p 趨勢
趨勢分析p趨勢的計算需要提前完成資料的轉換,如組內的中位數轉換,然後利用平台進行回歸分析CVH1 被量化為核心包含在分析中,可以獲得 p 值,即 p 趨勢。
繪製 RCS 曲線
要繪製 RCS 曲線,您需要輸入不同的模組並單擊它“風暴智慧型統計”。小白畫出精美統計圖表一鍵繪製RCS曲線
重新匯入資料後,根據以下提示依次選擇變數,即可獲得RCS映象!p 值結果與 R 中的結果完全相同這個模組適合所有人R 語言可用**完成分析後,還可以複製 R 語言進行驗證,這也是受支援的**硬碟**
本文以上為完文轉載,若對本次轉載**或資料感興趣,歡迎參看醫學**與統計分析後台回覆241 複製品獲取全套r**和實用資料