臨床研究的缺失資料處理解釋NEJM頂級論文的統計方法

更多資訊請點選右側：2024年“真實世界臨床研究”培訓班，傳送全套傾向評分方法**。

今天的第一篇文章：

NEJM**缺失資料處理臨床試驗的解釋。

缺乏資料是困擾臨床研究的乙個主要問題，研究人員非常焦慮，以至於他們抓撓耳朵和臉頰。缺少的資料太多了，這讓無數的計算機科學家、數學家和醫學家都彎腰駝背。今天我們來看看發表在頂級期刊NEJM上的一篇結尾多插值文章。

2023 年 12 月 28 日，一篇題為："restrictive or liberal transfusion strategy in myocardial infarction and anemia"的臨床隨機對照試驗**發表在：《the new england journal of medicine》（頂部，IF=158。5）作者來自羅格斯大學的Jeffrey L Carson團隊。該研究納入了3504例心肌梗死和貧血患者，分為限制性輸血策略和開放性輸血策略，採用二項式回歸模型和多重插補，以確定不同輸血策略與心肌梗死或死亡之間的關係。 結果顯示，在心肌梗死和貧血患者中，自由輸血策略並未顯著降低30天內發生心肌梗死或死亡的風險。然而，不能排除限制性輸血策略的潛在危害。

摘要和主要結果

1. 研究摘要

目標：在心肌梗死和貧血患者中，自由輸血策略不會顯著降低 30 天內心肌梗死或死亡的風險。然而，不能排除限制性輸血策略的潛在危害。

方法：在這項 3 期干預試驗中，研究人員將心肌梗死和血紅蛋白水平低於 10 g dl 的患者隨機分配到限制性輸血策略（輸血血紅蛋白截止，7 或 8 g dl）或自由輸血策略（血紅蛋白截止，< 10 g dl）。主要結局是心肌梗死或30天時死亡。結水果：共有 3504 名患者被納入主要分析。限制策略組輸注紅細胞單位（SD）的平均數為07 ± 1.6. 2. 在免費政策組中5 ± 2.3。在隨機分組後第1至3天，限制策略組的平均血紅蛋白水平比自由策略組低1%3 比 16 g/dl。限制性策略組 1749 例患者中有 295 例（16.）9%），自由策略組 1755 名患者中有 255 名（14.）5%）發生主要終點事件（不完全隨訪的多重歸因風險比為115;95% 置信區間 [CI] 099比134; p = 0.07)。9.9% 的患者採用限制性策略和 83%的自由策略患者發生死亡（風險比1）。19.95% ci，0.96-1.47) ，8.5% 和 7心肌梗死發生率為 2%（風險比 1.）。19.95% ci，0.94-1.49)。

結論：在心肌梗死和貧血患者中，自由輸血策略不會顯著降低 30 天內心肌梗死或死亡的風險。然而，不能排除限制性輸血策略的潛在危害。 2. 調查結果

1.基線特徵

從 2017 年 4 月到 2023 年 4 月，共入組 3506 名患者，其中 3504 名患者在 2 名患者不同意使用其資料後被納入分析。患者的平均年齡為72歲1歲，其中45歲5%是女性。這些患者通常有合併症，約三分之一有心肌梗死、冠狀動脈重建或心力衰竭病史，近一半有腎功能衰竭。多血管疾病和左心室收縮功能下降在隨機分組前接受冠狀動脈造影和左心室功能評估的患者中很常見。大多數（55.）8% 的患者患有 2 型心肌梗死，其次是 1 型心肌梗死（41）。7%)。隨機分組前的平均血紅蛋白水平為 86 g dL，中位肌酐為 14 mg/dl (124μmol/l)。至3447例（98例）。3%）接受隨機分組的患者隨訪30天。

2.干預措施的實施限制性策略組的平均血紅蛋白水平為1.，低於第1天的自由策略組3 g DL（95% 置信區間 [CI] 1.）2 比 14）第 3 天下 16 g/dl (95% ci，1.5 比 17)。游離策略組輸注的紅細胞總數為3個5 倍（4,325 輛對 1,237 輛）。游離策略組平均輸注的紅細胞單位（SD）數為 25 ± 2.3，而限制策略組為 07 ± 1.6。隨機分組與出院、停藥或死亡之間的中位住院時間為 5 天（間隔 2-10 天）。

在限制性策略組、46 名患者（26%），其中24例是由於臨床原因，包括手術和出血。

自由派政策小組241 名患者（13）終止了該方案。7%）其中，89例患者提供了臨床原因，包括不良反應、液體超負荷、透析和輸血反應。

停藥的其他原因包括患者偏好（68）、提供者偏好（53）和其他原因（31），包括血液**短缺和人員配備問題。

3.我們研究了主要和次要結局限制性策略組 1749 例患者中有 295 例（16.）9%），心肌梗塞或30天內因任何原因死亡（主要結果），游離策略組1755名患者中有255名（14。5%）死亡。粗 rr（限制性和自由）為 116(95% ci，1.00-1.35)。根據57例患者（限制性策略20例，自由策略37例）的部位調整和不完全隨訪。對數二項式模型，主要結局的估計 RR 為 115(95% ci，0.99-1.34; p = 0.07)。調整基線預後因素後（RR = 116; 95% ci 1.00-1.36），模型對主要結果的估計與前兩個計算結果一致。

4.主要結局（心肌梗死或死亡）的 K-M 曲線。

5.亞組分析與自由輸血策略相比，限制性輸血對主要結局的影響在所有預先指定的亞組中是一致的。在 1 型心肌梗死患者中，限制性策略比自由策略導致更多的主要結局事件（風險比 132; 95% ci，1.04-1.67），對2型心肌梗死患者無顯著影響（風險比1.05; 95% ci，0.85-1.29)。

設計與統計方法

1. 研究設計p：來自美國 144 個試驗地點的成人（18 歲）ST 段抬高或非 ST 段抬高型心肌梗死伴貧血（隨機分組前 24 小時內血紅蛋白水平< 10 g DL），共 3506 名患者。

e/c：自由輸血策略（血紅蛋白臨界值，< 10 g dl）限制性輸血策略（輸血血紅蛋白臨界值，7 或 8 g dl）。

o：心肌梗死或死亡發生在 30 天。

s：開放標籤隨機對照試驗。 2. 統計方法

1.採用itt為了進行分析，使用雙側檢驗，=005、試驗功效為80%，假設心肌梗死或死亡的總發生率為164%。

2.用對數二項式回歸分析主要結局，確定輸血策略的固定效應，隨機效應為不同的臨床試驗地點。

3.用鏈式方程的多重插值（MICE）對 30 天前退出或失訪且沒有主要結局事件的冒名頂替患者進行了多重插補結局資料缺失

4.對於所有試驗結局，我們分析了粗略的30天風險，沒有進行多次插補，並計算RR 和 95% CI。

5.對主要結局進行了二次分析，我們使用了：Kaplan Meier 方法在停藥時和 30 天時評估和使用主要結局事件的累積風險log-rank 統計資訊比較兩條累積風險曲線。

插補與多重插補

1. 資料插補的基本知識

對於缺失值，我們有三種常見的處理方法：不處理（演算法適應或轉換為新分類）; 刪除; 歸責。但每一條臨床資料都是我們經常希望最大限度地利用的寶貴資源，因此合理的歸因是一種理想的方法。常見的歸因可分為以下幾種：1均值、中位數、眾數和眾數插補。

對於連續定量資料，可以插補均值或中位數。這是一種經常使用的簡單可行的方法。

對於離散定量資料，可以使用模式插補。眾數是指頻率最高的資料組的中值。 2.固定值填充。

替換為統一參考值、標準值和特殊值。

3.鄰近插補。

當 k 個樣本的屬性值與缺失樣本最接近（最相似）時，加權平均值將進行後插補。當k=1時，最接近的插補方法也稱為熱卡填充法。 4.回歸插補。

構建回歸模型以擬合缺失值。

5.函式插值。

對於一維資料，可以使用兩個取樣點進行線性插值。也可以使用多個附近的取樣點進行拉格朗日插值和牛頓插值。函式插值和回歸插值的區別在於，函式插值是完全擬合的，而回歸插值是擬合以實現最小方差的。

6 多重插補（MI）。

多重插補是使用模型估計和重複模擬來生成一組完整的資料集。其基本原理是模擬生成缺失資料的隨機分布，然後從中隨機選擇資料來填充缺失值。

例如，對於缺失值 n，如果我們用 y=ax+b 進行插補，則不考慮抽樣的偏差。但是在增加殘差 e 後，用 y=ax+b+e 進行插補，仍然假設 a，b 是真值，但 a，b 只是我們的估計值。因此，我們從貝葉斯後驗分布中隨機選擇 a，b。使用馬爾可夫鏈蒙特卡洛（MCMC）方法，我們可以通過生成穩態分布鏈和模擬抽樣來實現這種多重插補。 2. 本文的多重插補

1.多重插補方法在附錄和協議中有詳細描述。主要應用其原理是馬爾可夫鏈蒙特卡洛（MCMC）多重插補方法。 它用於在歸因隨訪期間退出或缺席的患者主要結局資料，即漏診死亡和心肌梗死的 30 天結果值（是否）。使用的軟體是SAS 94 proc mi 和 proc mianalyze。

2.這樣做的方法是應用已經完成的資料，建立乙個對數二項式模型估算結果和關鍵變數關係。該模型將用於缺失 30 天結果的參與者的結果概率。根據這些概率，它將被建立10 個插補資料集將為每個插補資料集估計具有站點隨機效應的對數二項式模型，並使用穩健的方法呈現結果收斂為了獲得**效果，適當調整標準誤差單一估計。 然後進行了一些敏感性分析，結果與各種方法的結果相似。

3.多個插補模型中包含的變數：

附言：

只要你做過臨床研究、資料收集、統計分析，你幾乎肯定會遇到資料缺失的問題，這就像是現實世界中人類研究的印記。如果我的資料丟失了，我該怎麼辦？你只是刪除它嗎？您不妨嘗試多次插值以挽救緊急情況。多重插補（multiple imemnumeration，MI）是一種用於填充複雜資料缺失值的方法，近年來已出現在許多高質量的SCI臨床研究中。

本文通過多次插補，對缺失的資料進行補足，得到更符合實際情況的資料，得出更現實的結論。這也為讀者在遇到類似情況時提供了一種思考方式。更詳細的方法需要你閱讀其他文獻，畢竟學習是無止境的，總有新的東西。

詳情請點選右邊：醫療統計服務：專題、**畢業資料分析等。

臨床研究的缺失資料處理解釋NEJM頂級論文的統計方法

相關問題答案

2024年資料處理與通訊技術與訊號處理國際學術會議（ICDPCTSP 2024）

資料處理方法的總結與分析

雲計算中的資料處理從海量資料中提取價值

Excel資料處理技巧：將一堆資料分離在一起！

工業級固態硬碟超越傳統，為資料處理效率和能效樹立新標桿

臨床研究的缺失資料處理 解釋NEJM頂級論文的統計方法

相關問題答案

2024年資料處理與通訊技術與訊號處理國際學術會議（ICDPCTSP 2024）

資料處理方法的總結與分析

雲計算中的資料處理 從海量資料中提取價值

Excel資料處理技巧：將一堆資料分離在一起！

工業級固態硬碟超越傳統，為資料處理效率和能效樹立新標桿

臨床研究的缺失資料處理解釋NEJM頂級論文的統計方法

雲計算中的資料處理從海量資料中提取價值