臨床預(yù)測模型這么火，它到底是什么？!

發(fā)布日期：2022-03-10 作者：WLT 點擊：

臨床預(yù)測模型既重要又復(fù)雜。

近年來，臨床預(yù)測模型在診療決策、患者預(yù)后管理和公共衛(wèi)生資源配置中的應(yīng)用越來越重要，但臨床預(yù)測模型的建立是一項復(fù)雜的系統(tǒng)工程。本文回顧了相關(guān)的權(quán)威研究，總結(jié)了建立臨床預(yù)測模型的全過程，介紹了相關(guān)概念和重要原則。

建立臨床預(yù)測模型的五個階段

在個性化的醫(yī)學(xué)時代，對流行病或意外疾病的結(jié)果(診斷)或未來疾病進展(預(yù)后)的預(yù)測對于醫(yī)護人員的患者管理變得更加重要。臨床預(yù)測模型用于研究特定條件下患者未來或未知結(jié)局(終點)與基線健康狀態(tài)(起點)之間的關(guān)系。它通常結(jié)合多個參數(shù)來幫助醫(yī)生洞察模型中每個預(yù)測因子的相對影響。

該模型需要準確預(yù)測特定事件，并且相對簡單易用。一方面，如果預(yù)測模型對未來事件的估計不準確，會誤導(dǎo)醫(yī)療專業(yè)人士；另一方面，如果模型具有較高的可預(yù)測性，但難以應(yīng)用(例如，計算復(fù)雜或不熟悉的問題/項目或單元)，耗時、成本高或相關(guān)性低(例如，對所有患者進行無差別篩查)，則不會在臨床上廣泛應(yīng)用。因此，可預(yù)測性和可操作性之間的平衡是建立良好臨床預(yù)測模型的關(guān)鍵。

目前，雖然對預(yù)測模型的理想構(gòu)建方法還沒有達成共識，但臨床研究領(lǐng)域的許多專家提出了許多方法來提高模型開發(fā)的質(zhì)量和影響力?；谇叭说难芯砍晒?，本文將建立臨床預(yù)測模型的全過程歸納為五個主要階段:

建立臨床預(yù)測模型的五個階段

一個

第一階段:界定研究問題。

從統(tǒng)計技術(shù)的角度來看，臨床預(yù)測模型是臨床研究中比較先進的研究類型，但并不是所有的問題都適合用臨床預(yù)測模型來回答。例如，干預(yù)/暴露措施的效果估計和比較適合用傳統(tǒng)的統(tǒng)計假設(shè)檢驗或校正模型來回答，如T檢驗/方差分析、卡方檢驗和對數(shù)秩檢驗。臨床預(yù)測模型適用于回答與疾病的診斷或預(yù)后相關(guān)的問題，特別是如何通過預(yù)測因素的組合來準確估計疾病或事件發(fā)生的概率。臨床預(yù)測模型的本質(zhì)是利用臨床數(shù)據(jù)集建立一個多元的、高精度的、有意義的預(yù)測模型。首先，我們需要明確幾個重要的研究問題:1)靶疾病領(lǐng)域的靶結(jié)果是什么？如糖尿病和心血管疾病；某種并發(fā)癥，死亡。2)目標患者是誰？例如普通人群、65歲以上的老年人或二型糖尿病患者。3)預(yù)測模型的目標用戶是誰？例如疾病領(lǐng)域的其他醫(yī)生、健康相關(guān)組織、處于疾病風(fēng)險中的群體和關(guān)注疾病的其他群體。根據(jù)以上問題的回答，結(jié)合患者選擇的目標區(qū)域和相關(guān)區(qū)域的數(shù)據(jù)集，目標用戶的類別將決定指標的選擇和處理過程，從而影響臨床預(yù)測模型的專業(yè)性和復(fù)雜性。

預(yù)測模型適用的問題類型。

第二階段:選擇數(shù)據(jù)集。

在融合的過程中，醫(yī)學(xué)教學(xué)、科研、管理的應(yīng)用需要人才的聚集和產(chǎn)業(yè)生態(tài)的建立。自2013年成立以來，國內(nèi)已有近百家領(lǐng)先的醫(yī)療研究機構(gòu)(150強)和政府機構(gòu)與醫(yī)療人工智能公司醫(yī)療都勻展開合作。醫(yī)學(xué)都勻在發(fā)展中，憑借其戰(zhàn)略國際化和文化多樣性，吸引了專業(yè)領(lǐng)域的世界知名科學(xué)家和人才。整合了跨越10余年的醫(yī)學(xué)信息進行醫(yī)院處理和整合，覆蓋40余種重大疾病，創(chuàng)建了3000余個專科疾病模型，自主研發(fā)了醫(yī)學(xué)數(shù)據(jù)智能平臺。數(shù)據(jù)集是臨床預(yù)測模型最重要的組成部分之一。在現(xiàn)實中，需要搜索最合適的數(shù)據(jù)集并充分利用它。通常，您也可以選擇使用專業(yè)的臨床數(shù)據(jù)源輔助和管理工具來整理和建立包含研究終點和所有關(guān)鍵預(yù)測指標的主數(shù)據(jù)集。研究人員可以根據(jù)預(yù)測模型的目的，使用不同的方法提取不同的子數(shù)據(jù)集。不同的臨床預(yù)測模型問題適合用不同的研究設(shè)計數(shù)據(jù)來回答。對于診斷問題來說，預(yù)測因素和結(jié)果都在同一時間或短時間內(nèi)，因此使用橫截面數(shù)據(jù)建立診斷模型是合適的。對于預(yù)后問題，預(yù)測因子和結(jié)果之間存在縱向時間邏輯，適合用隊列研究數(shù)據(jù)擬合預(yù)后模型。隨機臨床試驗可視為更嚴謹?shù)那罢靶躁犃?，因此也可用于建立預(yù)后模型，但外推法有限。不同類型的臨床預(yù)測模型的特征如下表所示:

不同預(yù)測模型的特點及數(shù)據(jù)選擇

對于數(shù)據(jù)集中樣本容量的最低要求，沒有絕對的共識。一般來說，較大且較新的數(shù)據(jù)集能更好地反映目標群體的特征，增強模型的相關(guān)性、可重復(fù)性和普及性，是建模的理想選擇。為了客觀地驗證建模結(jié)果，通常需要將研究數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集和驗證數(shù)據(jù)集兩部分。根據(jù)研究者的具體目標，分割率可能有所不同，但一般來說，更多的研究對象應(yīng)該被分配到開發(fā)數(shù)據(jù)集，而不是驗證數(shù)據(jù)集。臨床預(yù)測模型首先通過算法從訓(xùn)練集中提取規(guī)則，其預(yù)測性能要根據(jù)驗證集在不同的組中進行評估。為了確定模型的可擴展性和健壯性，可以根據(jù)數(shù)據(jù)集格式，盡可能使用來自外部研究組或隊列的測試數(shù)據(jù)集進行外部驗證。

醫(yī)療大數(shù)據(jù)成為預(yù)測模型數(shù)據(jù)集的重要選擇。

三

第三階段:處理特征變量。

首先，需要對確定的數(shù)據(jù)集進行基本的清洗，包括檢查數(shù)據(jù)一致性、處理無效值和錯誤值等。因為數(shù)據(jù)集通常包含比最終預(yù)測模型中使用的變量更多的變量，所以在建立模型之前，需要評估和選擇最可預(yù)測和最敏感的預(yù)測因子。一般來說，特征變量的評價主要有三個方面:1。要求檢查員處理丟失的數(shù)據(jù)。在大多數(shù)數(shù)據(jù)分析中，數(shù)據(jù)缺失是一個長期的問題，丟失的原因各不相同，包括不收集、不可用或不適用、被調(diào)查者拒絕，或者“不知道”。為了解決這個問題，研究人員可以考慮使用插值技術(shù)將答案分為“是”和“其他”，或者允許“未知”作為單獨的類別，以盡可能提高數(shù)據(jù)填充率。

2.需要專家對之前發(fā)現(xiàn)的顯著預(yù)測因子進行判斷，通常應(yīng)將其作為候選變量，如糖尿病風(fēng)險評分中的糖尿病家族史。應(yīng)該注意的是，并非所有重要的預(yù)測因素都需要包括在最終模型中，例如P

3.要求數(shù)據(jù)科學(xué)家對變量編碼分類變量和連續(xù)變量有不同的處理方法。對于分類變量，我們可以根據(jù)臨床實際意義和數(shù)據(jù)特點，對類別進行組合或重新分類。比如，在基本的人口特征中，教育程度往往分為小學(xué)、初中、高中、大專、本科、研究生、博士等。根據(jù)分析和以往研究的需要，高中畢業(yè)與否可能是一個重要的分界點，可以重新劃分為小學(xué)、中學(xué)、本科及以上。這樣可以相對平衡其他人的數(shù)量，避免過度細分。連續(xù)變量的相對影響由模型中使用的測量尺度決定。例如，空腹血糖水平對心血管疾病風(fēng)險的影響可以解釋為，每10 mg/dl通常比每1 mg/dl對結(jié)果的影響更大。在對特征變量進行求值和處理后，由于不同的算法需要不同的數(shù)據(jù)類型，所以需要對數(shù)據(jù)和算法進行適配。通常情況下，連續(xù)變量通常比分類變量承載更豐富、更準確的信息，但同時也可能增加模型的復(fù)雜性和難度或者外行人難以理解。研究者可以通過觀察建模過程中的一些預(yù)測因素，進一步調(diào)整變量類型，從而優(yōu)化模型。

加工特征變量的工作比例

四

第四階段:預(yù)測模型的建立。

雖然在選擇預(yù)測目標變量和確定預(yù)測模型方面沒有全行業(yè)一致的指南，但我們可以借鑒統(tǒng)計分析的概念。根據(jù)預(yù)期用途，將問題求解方法定義為分類預(yù)測模型、線性預(yù)測模型和風(fēng)險預(yù)測模型。建立臨床預(yù)測模型的幾點建議:

所有的候選變量都包含在模型中，一些不重要的候選變量可以通過逆向淘汰或逐步選擇的方法去除。包含所有候選變量可以避免過度擬合和選擇偏差。模型的擬合程度可以通過參考赤池信息準則(AIC)和貝葉斯信息準則(BIC)來檢查。AIC是模型擬合的一個指標。通常，AIC值越低，模型擬合越好。有人認為AIC涉及解釋，而BIC涉及預(yù)測，其中BIC可視為貝葉斯算法的相應(yīng)指標。如果研究人員對高級算法比較熟悉，可以考慮用機器學(xué)習(xí)算法進行模型擬合。根據(jù)響應(yīng)變量(因變量Y)的類型，可以分配不同的建模算法。類似研究中常用的算法如下。

常見算法和特征

五

第五階段:模型評估與驗證(內(nèi)部/外部)模型生成后，研究人員應(yīng)使用獨立的測試數(shù)據(jù)集來評估其提出的模型的預(yù)測能力。不同類型的問題有不同的評價指標，可以反映模型不同方面的特點。下面分別列出分類問題和回歸問題的評價指標。在實際的建模工作中，還需要了解各個指標的含義，并對這些指標進行合理的解讀。

分類問題中的指標

回歸問題中的指標

預(yù)測模型的驗證及應(yīng)用方向

由于模型開發(fā)的復(fù)雜性，咨詢數(shù)據(jù)科學(xué)家和統(tǒng)計專家可以提高預(yù)測模型研究的有效性和整體質(zhì)量。在開發(fā)模型之后，在使用模型之前，我們應(yīng)該使用盡可能多的外部數(shù)據(jù)集，并有效地傳播給相關(guān)方。臨床預(yù)測模型的應(yīng)用場景不限于醫(yī)療機構(gòu)?；谥袊壳暗那闆r，Web或智能移動應(yīng)用程序可以更好地成為向公眾宣傳和普及預(yù)測模型的重要渠道。希望本文的內(nèi)容能夠幫助醫(yī)生和研究人員對臨床預(yù)測模型有一個初步的了解，并能夠支持實際的科學(xué)研究。在未來的推文中，我們將詳細介紹預(yù)測模型中使用的回歸方法和算法的主題。

參考文獻:moonskg，Royston P，Vergouwe Y，格羅布·比德，奧特曼DG。預(yù)后和預(yù)后研究:什么、為什么和如何？BMJ 2009；338:b375。Hemingway H，Croft P，Perel P，Hayden JA，Abrams K，Timmis A，等。預(yù)后研究策略(進展)1:研究臨床結(jié)果的框架。BMJ青奧會；346:e5595。Greenland S .對成本效益預(yù)測重新定位的需要:對M. J. Pencina等人的“評估一種新標記物從ROC曲線下面積到重新分類及以后的額外預(yù)測能力”的評論，醫(yī)學(xué)統(tǒng)計學(xué)(DOI: 10.1002/sim.2929)。統(tǒng)計醫(yī)學(xué)2008；27:199-206.格里芬SJ，小PS，黑爾斯CN，金月AL，韋勒姆新澤西州。糖尿病風(fēng)險評分:全科醫(yī)療中二型糖尿病的早期檢測。糖尿病代謝研究2000年修訂版；16:164- 71.小戈夫·DC、勞埃德·瓊斯、貝內(nèi)特·G、科亞迪·S、達戈斯蒂諾·RB、吉本斯·R等，2013年美國心臟病學(xué)會/美國心臟協(xié)會心血管風(fēng)險評估指南:美國心臟病學(xué)會/美國心臟協(xié)會實踐指南工作組報告。循環(huán)2014；129 (25補編第2號):S49-73。邁向更好的臨床預(yù)測模型:發(fā)展的七個步驟和驗證的ABCD。歐洲心臟雜志2014；35:1925-31.我們驗證一個預(yù)后模型意味著什么？統(tǒng)計醫(yī)學(xué)2000；19:453-73.斯特耶伯格。臨床預(yù)測模型:開發(fā)、驗證和更新的實用方法。紐約:斯普林格；2009.Steyerberg EW，Moons KG，van der Windt DA，Hayden JA，Perel P，Schroter S，等。預(yù)測研究策略(進展)3:預(yù)測模型研究。PLoS Med 201310:e1001381?？铝炙笹S，賴茨馬JB，奧特曼DG，月亮KG。個體預(yù)后或診斷多變量預(yù)測模型的透明報告(TRIPOD):TRIPOD聲明。Ann實習(xí)生Med 2015162:55-63.李YH，邦H，樸YM，Bae JC，李BW，康ES，等。非酒精性脂肪性肝病的非實驗室自我評估篩查評分:發(fā)展，驗證和與其他評分的比較。PLoS One 20149:e107584。Bang H，Edwards AM，Bomback AS，Ballantyne CM，Brillon D，Callahan MA，等。糖尿病風(fēng)險患者自我評估評分的開發(fā)和驗證。Ann實習(xí)生Med 2009151:775-83.Kotronen A，Peltonen M，Hakkarainen A，Sevastianova K，Bergholm R，Johansson LM，等.利用代謝和遺傳因素預(yù)測非酒精性脂肪性肝病和肝臟脂肪.胃腸病學(xué)2009；137:865-72.回歸建模策略:應(yīng)用于線性模型、邏輯回歸和生存分析。紐約:斯普林格；2001.主要血管手術(shù)后心臟事件的預(yù)測因素:臨床特征、多巴酚丁胺超聲心動圖和β-受體阻滯劑治療的作用JAMA 2001285:1865-73.解釋還是預(yù)測？統(tǒng)計科學(xué)2010年:289-310。Heikes KE，Eddy DM，Arondekar B，Schlessinger L .糖尿病風(fēng)險計算器:檢測未診斷糖尿病和糖尿病前期的簡單工具。2008年糖尿病護理；31:1040-5.統(tǒng)計建模:兩種文化(作者有評論和反駁)。統(tǒng)計學(xué)家Sci 200116:199-231.Steyerberg EW，Vickers AJ，Cook NR，Gerds T，戈寧M，Obuchowski N，等,《評估預(yù)測模型的性能:傳統(tǒng)和新方法的框架》。流行病學(xué)2010；21:128-38.一種新的肝脂肪變性診斷評分的開發(fā)、外部驗證和比較評估。美國胃腸病學(xué)雜志2014；109:1404-14.Hilden J .評論:關(guān)于NRI、IDI和“好看”的統(tǒng)計數(shù)據(jù)，下面什么也沒有。2014年流行病學(xué)；25:265-7.

欣賞醫(yī)學(xué)的美好，快樂學(xué)習(xí)生活。歡迎關(guān)注微信官方賬號【樊棋醫(yī)學(xué)BioSCI】。微信官方賬號專注于生物醫(yī)學(xué)研究、科研項目設(shè)計、SCI論文寫作等領(lǐng)域的知識梳理和數(shù)據(jù)分享。，為醫(yī)務(wù)工作者提供了方便。