心肺復(fù)蘇模型

新聞分類

什么是解耦表示學(xué)習(xí)?使用beta-VAE模型探究醫(yī)療和金融問(wèn)題!

什么是解耦表示學(xué)習(xí)?使用beta-VAE模型探究醫(yī)療和金融問(wèn)題!

發(fā)布日期:2022-03-11 作者:WLT 點(diǎn)擊:

【導(dǎo)讀】本文介紹并比較了傳統(tǒng)人工數(shù)學(xué)建模和機(jī)器學(xué)習(xí)的優(yōu)缺點(diǎn),介紹了一種結(jié)合兩者優(yōu)點(diǎn)的方法——解耦表示學(xué)習(xí)。之后,作者使用DeepMind發(fā)布的基于解耦表征學(xué)習(xí)的貝塔-VAE模型,對(duì)醫(yī)療和金融領(lǐng)域的兩個(gè)數(shù)據(jù)集進(jìn)行了探索,展示了模型效果,并提供了實(shí)驗(yàn)代碼。

實(shí)驗(yàn)中GitHub項(xiàng)目的地址:

https://github.com/Rachnog/disentanglment

本文將討論傳統(tǒng)數(shù)學(xué)建模和機(jī)器學(xué)習(xí)建模之間的關(guān)系。傳統(tǒng)數(shù)學(xué)建模是我們?cè)趯W(xué)校都學(xué)過(guò)的一種建模方法。在這種方法中,數(shù)學(xué)家基于專家經(jīng)驗(yàn)和對(duì)現(xiàn)實(shí)世界的理解來(lái)建立模型。機(jī)器學(xué)習(xí)建模是另一種完全不同的建模方法。機(jī)器學(xué)習(xí)算法以更微妙的方式描述了一些客觀事實(shí)。雖然人類無(wú)法完全理解模型的描述過(guò)程,但在大多數(shù)情況下,機(jī)器學(xué)習(xí)模型比人類專家建立的數(shù)學(xué)模型更準(zhǔn)確。當(dāng)然,在更多的應(yīng)用領(lǐng)域(比如醫(yī)療,金融,軍事等。),機(jī)器學(xué)習(xí)算法,尤其是深度學(xué)習(xí)模型,無(wú)法滿足我們對(duì)清晰易懂決策的需求。

本文將重點(diǎn)討論傳統(tǒng)數(shù)學(xué)建模和機(jī)器學(xué)習(xí)建模的優(yōu)缺點(diǎn),并介紹一種將它們結(jié)合起來(lái)的方法——解耦d表示學(xué)習(xí)。

如果想在自己的數(shù)據(jù)集上嘗試解耦表示學(xué)習(xí)的方法,可以參考Github上解耦學(xué)習(xí)的分享,以及Google Research提供的解耦學(xué)習(xí)的項(xiàng)目代碼。深度學(xué)習(xí)中的問(wèn)題

由于深度學(xué)習(xí)技術(shù)的發(fā)展,我們?cè)诤芏囝I(lǐng)域嘗試了神經(jīng)網(wǎng)絡(luò)的應(yīng)用。在一些重要的領(lǐng)域,使用神經(jīng)網(wǎng)絡(luò)是合理的,并取得了良好的應(yīng)用效果,包括計(jì)算機(jī)視覺、自然語(yǔ)言處理、語(yǔ)音分析和信號(hào)處理等。在上述應(yīng)用中,深度學(xué)習(xí)方法都是利用線性和非線性變換從復(fù)雜數(shù)據(jù)中自動(dòng)提取特征,并將特征表示為“向量”,也就是俗稱的“嵌入”。之后,神經(jīng)網(wǎng)絡(luò)對(duì)這些向量進(jìn)行運(yùn)算,完成相應(yīng)的分類或回歸任務(wù):


1.jpg


從特征提取和精度的角度來(lái)看,這種“嵌入”的方法是非常有效的,但也存在很多方面的不足:可解釋性:嵌入時(shí)使用的N維向量不能很好地解釋模型分析的原理和過(guò)程,只有通過(guò)逆向工程才能找到對(duì)分析有較大影響的輸入數(shù)據(jù)內(nèi)容。對(duì)數(shù)據(jù)的巨大需求:如果只有10~100個(gè)樣本,深度學(xué)習(xí)就無(wú)法使用。無(wú)監(jiān)督學(xué)習(xí):大多數(shù)深度學(xué)習(xí)模型需要標(biāo)記的訓(xùn)練數(shù)據(jù)。零樣本學(xué)習(xí):這是一個(gè)關(guān)鍵問(wèn)題?;谝粋€(gè)數(shù)據(jù)集訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在沒有重新訓(xùn)練的情況下很難直接應(yīng)用于另一個(gè)數(shù)據(jù)集。對(duì)象生成:除了GANs(生成對(duì)抗網(wǎng)絡(luò)),其他模型很難生成一個(gè)真實(shí)的對(duì)象。操作:嵌入很難調(diào)整輸入對(duì)象的具體屬性。理論基礎(chǔ):雖然我們掌握了一般近似理論,但是還不夠。

這些問(wèn)題很難用機(jī)器學(xué)習(xí)框架來(lái)解決,但是最近,我們?nèi)〉昧艘恍┬碌倪M(jìn)展。數(shù)學(xué)建模的優(yōu)勢(shì)

20年、50年甚至100年前,大部分?jǐn)?shù)學(xué)家都沒有遇到上述問(wèn)題。原因是他們主要以數(shù)學(xué)建模為主,通過(guò)數(shù)學(xué)抽象來(lái)描述現(xiàn)實(shí)世界中的物體和過(guò)程,比如用分布、公式、各種方程等。在這個(gè)過(guò)程中,數(shù)學(xué)家定義了我們?cè)陬}目中提到的常微分方程(ODE)。通過(guò)比較深度學(xué)習(xí)中的問(wèn)題,分析了數(shù)學(xué)建模的特點(diǎn)。需要注意的是,在下面的分析中,“嵌入”表示數(shù)學(xué)模型的參數(shù),比如微分方程的自由度集合。說(shuō)明:每個(gè)數(shù)學(xué)模型都是基于科學(xué)家對(duì)客觀事物的描述,建模過(guò)程包含了數(shù)據(jù)科學(xué)家對(duì)客觀事物的描述動(dòng)機(jī)和深刻理解。比如對(duì)物理運(yùn)動(dòng)的描述,“嵌入”包括物體質(zhì)量、運(yùn)動(dòng)速率和坐標(biāo)空間,不涉及抽象矢量。大數(shù)據(jù)需求:數(shù)學(xué)建模的大部分突破不需要基于龐大的數(shù)據(jù)集。無(wú)監(jiān)督學(xué)習(xí):它也不適用于數(shù)學(xué)建模。零樣本學(xué)習(xí):一些隨機(jī)微分方程(如幾何布朗運(yùn)動(dòng))可以應(yīng)用于金融、生物或物理領(lǐng)域,只需要對(duì)參數(shù)進(jìn)行重命名。對(duì)象生成:不限,只要采樣參數(shù)即可。操作:不限,只需操作參數(shù)即可。理論:數(shù)百年的科學(xué)基礎(chǔ)。

我們之所以不用微分方程來(lái)解決所有問(wèn)題,是因?yàn)閷?duì)于大規(guī)模的復(fù)雜數(shù)據(jù),微分方程的性能要比深度學(xué)習(xí)模型差很多,這也是深度學(xué)習(xí)發(fā)展迅速的原因。但是,我們?nèi)匀恍枰斯?shù)學(xué)建模。把機(jī)器學(xué)習(xí)和人工建模方法結(jié)合起來(lái)。

在處理復(fù)雜數(shù)據(jù)時(shí),如果能夠?qū)⑿阅芰己玫纳窠?jīng)網(wǎng)絡(luò)與人工建模方法相結(jié)合,則可在一定程度上解決可解釋性、生成和操作對(duì)象的能力、無(wú)監(jiān)督特征學(xué)習(xí)和零樣本學(xué)習(xí)等問(wèn)題。例如,視頻1介紹了一種用于人像的特征提取方法。

對(duì)于微分方程等人工建模方法,圖像處理比較困難,但通過(guò)與深度學(xué)習(xí)相結(jié)合,上述模型讓我們可以生成和操作物體,可解釋性很強(qiáng)。最重要的是,該模型可以在其他數(shù)據(jù)集上做同樣的工作。這個(gè)模型的唯一問(wèn)題是建模過(guò)程不是完全無(wú)人監(jiān)管的。此外,在對(duì)象的操作上還有一個(gè)重要的改進(jìn),就是當(dāng)我改變“胡子”的特征時(shí),程序會(huì)自動(dòng)讓整張臉變得更像一個(gè)男人,這意味著雖然模型中的特征是可解釋的,但這些特征是相關(guān)的,換句話說(shuō),它們是耦合在一起的。β -VAE

有一種方法可以幫助我們實(shí)現(xiàn)解耦表示,即嵌入中的每個(gè)元素對(duì)應(yīng)單個(gè)影響因素,嵌入可以用于分類、生成和零樣本學(xué)習(xí)。該算法是由DeepMind實(shí)驗(yàn)室基于變分自編碼器開發(fā)的。與重建損失函數(shù)相比,該算法更注重潛在分布與先驗(yàn)分布之間的相對(duì)熵。

更多細(xì)節(jié),請(qǐng)閱讀貝塔-https://openreview.net/forum·VAE的論文?id = sy 2 fzu 9 GL);也可以參考本視頻2中的介紹,詳細(xì)講解一下beta-VAE的內(nèi)在思想,以及這種算法在監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)中的應(yīng)用。

β-VAE可以從輸入數(shù)據(jù)中提取影響變量的因素,包括物理運(yùn)動(dòng)的方向、物體的大小、顏色和方向等。在強(qiáng)化學(xué)習(xí)的應(yīng)用中,該模型可以區(qū)分目標(biāo)和背景,并且可以在現(xiàn)有訓(xùn)練模型的基礎(chǔ)上,在實(shí)際環(huán)境中進(jìn)行零樣本學(xué)習(xí)。實(shí)驗(yàn)過(guò)程

我主要研究模型在醫(yī)療和金融領(lǐng)域的應(yīng)用。在這些領(lǐng)域的實(shí)際問(wèn)題中,上述模型可以在很大程度上解決模型解釋、人工數(shù)據(jù)生成和零樣本學(xué)習(xí)等問(wèn)題。因此,在接下來(lái)的實(shí)驗(yàn)中,我使用了beta-VAEs模型來(lái)分析心電圖(ETC)數(shù)據(jù)和比特幣(BTC)價(jià)格數(shù)據(jù)。這個(gè)實(shí)驗(yàn)的代碼可以在Github上找到。

首先,我使用veta-VAE(一種非常簡(jiǎn)單的多層神經(jīng)網(wǎng)絡(luò))對(duì)PTB診斷數(shù)據(jù)中的心電圖數(shù)據(jù)進(jìn)行建模,該數(shù)據(jù)包含三種變量:心電圖圖、每個(gè)人隨時(shí)間變化的脈搏數(shù)據(jù)和診斷結(jié)果(即是否有梗死)。VAE訓(xùn)練時(shí),歷元大小設(shè)置為50,瓶頸大小設(shè)置為10,學(xué)習(xí)率為0.0005,容量參數(shù)設(shè)置為25(參數(shù)設(shè)置參考本GitHub項(xiàng)目)。模型的輸入是心跳。訓(xùn)練后,模型學(xué)習(xí)了影響數(shù)據(jù)集中變量的實(shí)際因素。

下圖是我使用其中一個(gè)單一特征操作心跳數(shù)據(jù)的過(guò)程,其中黑線代表心跳,使用的特征數(shù)據(jù)值從-3逐漸增加到3。在此過(guò)程中,其他功能保持不變。不難發(fā)現(xiàn),第五個(gè)特征對(duì)心跳的形式影響很大,第八個(gè)特征代表心臟病的情況(藍(lán)色心電圖代表梗塞的癥狀,紅色則相反),第十個(gè)特征可以輕微影響脈搏。


2.jpg


圖:解耦心電圖的心跳

不出所料,金融數(shù)據(jù)的實(shí)驗(yàn)效果并沒有那么明顯。該模型的訓(xùn)練參數(shù)類似于先前實(shí)驗(yàn)的參數(shù)。使用的數(shù)據(jù)是2017年收集的比特幣價(jià)格數(shù)據(jù)集,包含一個(gè)180分鐘的比特幣價(jià)格變化數(shù)據(jù)。預(yù)期的實(shí)驗(yàn)效果是用貝塔-VAE學(xué)習(xí)一些標(biāo)準(zhǔn)的金融時(shí)間序列模型,比如均值回歸的時(shí)間序列模型,但是在實(shí)際中很難解釋得到的表征。在實(shí)驗(yàn)結(jié)果中可以發(fā)現(xiàn),第五個(gè)特征改變了輸入時(shí)間序列的趨勢(shì),第二、第四、第六個(gè)特征增加/減少了時(shí)間序列不同階段的波動(dòng),或者使其更穩(wěn)定或者更動(dòng)蕩。


3.jpg


圖:比特幣收盤價(jià)脫鉤

多個(gè)對(duì)象的解耦

假設(shè)圖像中有多個(gè)物體,我們想找出每個(gè)物體的影響因素。下面的動(dòng)


4.jpg

展示了模型的效果。


5.jpg



6.jpg


摘要

以下是對(duì)機(jī)器學(xué)習(xí)中問(wèn)題列表的beta-VAE模型的總結(jié):可解釋:特征是完全可解釋的,我們只需要驗(yàn)證每個(gè)特定的嵌入元素。數(shù)據(jù)需求大:因?yàn)槟P蛯儆谏疃葘W(xué)習(xí)框架,所以數(shù)據(jù)需求還是很大的。無(wú)監(jiān)督學(xué)習(xí):可以實(shí)現(xiàn)完全的無(wú)監(jiān)督學(xué)習(xí)。零樣本學(xué)習(xí):可以進(jìn)行,本文展示的強(qiáng)化學(xué)習(xí)的應(yīng)用就屬于這一類。對(duì)象生成:像普通VAE一樣容易對(duì)參數(shù)進(jìn)行采樣。操作:你可以很容易地操作任何感興趣的變量。理論:待研究。

上述模型幾乎具備了數(shù)學(xué)建模的所有優(yōu)質(zhì)特征,同時(shí)也具備了深度學(xué)習(xí)在分析復(fù)雜數(shù)據(jù)時(shí)的高準(zhǔn)確率。那么,如果能以完全無(wú)監(jiān)督的方式從復(fù)雜數(shù)據(jù)中學(xué)習(xí)到如此好的表示結(jié)果,是否意味著傳統(tǒng)數(shù)學(xué)建模的終結(jié)?如果一個(gè)機(jī)器學(xué)習(xí)模型可以建立一個(gè)復(fù)雜的模型,而我們只需要特征分析,那我們還需要人工建模嗎?這個(gè)問(wèn)題有待討論。

下面是本文視頻的網(wǎng)站鏈接和百度網(wǎng)盤鏈接。供參考:視頻1:鏈接:https://youtu.be/O1by05eX424百度網(wǎng)盤:鏈接:https://pan.baidu.com/s/11qsgCVlRF0R4jm7ZLlzF2w提取代碼:f76s視頻2:鏈接:https://youtu.be/ yv 698 fi 2 xze百度網(wǎng)盤:鏈接:https://pan.baidu.com/s/153FBz8YWaw3PWrqJAbPj2A提取代碼:ee8v

原始鏈接:

https://towardsdatascience . com/gans-vs-odes-the-end-of-mathematical-modeling-EC 158 f 04 ACB 9

(本文為AI技術(shù)大本營(yíng)整理文章,轉(zhuǎn)載請(qǐng)聯(lián)系微信1092722531)



本文網(wǎng)址:http://www.sem136.com/news/960.html

相關(guān)標(biāo)簽:

最近瀏覽:

相關(guān)產(chǎn)品:

相關(guān)新聞:

在線客服
分享