當(dāng)前位置: 郭利方心理咨詢工作室 > 心理科普 > 青少年心理 > 正文
導(dǎo)讀郭一璞偽裝發(fā)自斯坦福量子位報(bào)導(dǎo)|大眾號(hào)QbitAI在全世界范圍內(nèi),有超越3億人患有抑郁癥。其間的60%的人都沒(méi)有承受任何醫(yī)治。咱們時(shí)有聽(tīng)到名人患抑郁癥乃至嚴(yán)重到自殺的音訊,卻不知周圍一些普通人身在病中不知病。面臨這一病癥,AI能做些什么?從前說(shuō)過(guò)“AI...
在全世界范圍內(nèi),有超越3億人患有抑郁癥。其間的60%的人都沒(méi)有承受任何醫(yī)治。
咱們時(shí)有聽(tīng)到名人患抑郁癥乃至嚴(yán)重到自殺的音訊,卻不知周圍一些普通人身在病中不知病。
面臨這一病癥,AI能做些什么?
從前說(shuō)過(guò)“AI沒(méi)有國(guó)界,AI的福祉亦無(wú)鴻溝”的李飛飛教師這次要為那些置疑自己患抑郁癥的人發(fā)明福祉了,這次她和團(tuán)隊(duì)瞄準(zhǔn)了AI確診抑郁癥這個(gè)方向:
結(jié)合語(yǔ)音辨認(rèn)、計(jì)算機(jī)視覺(jué)和自然言語(yǔ)處理技能,經(jīng)過(guò)表情和言語(yǔ)確診一個(gè)人是否患了抑郁癥。
現(xiàn)在,這項(xiàng)研討初見(jiàn)成效,確診抑郁癥的機(jī)器學(xué)習(xí)模型現(xiàn)在precision到達(dá)83.3%,recall到達(dá)82.6%。
而且,這個(gè)模型能夠布置到手機(jī)上,讓更多人能便利的確診抑郁癥,不再受困于“沒(méi)錢”、“沒(méi)時(shí)刻”、“他人知道我去查抑郁癥會(huì)怎樣談?wù)撐摇钡淖瓒糁小?/p>
別的,這項(xiàng)研討成果還當(dāng)選了 NIPS NeurIPS 2018醫(yī)療健康機(jī)器學(xué)習(xí)(ML4H)Workshop。
下面,量子位為咱們具體介紹李飛飛這篇新著作的具體內(nèi)容。
為什么用表情和言語(yǔ)能確診抑郁癥?由于醫(yī)師便是這么干的。
在現(xiàn)在的抑郁癥確診過(guò)程中,醫(yī)師需求和患者面臨面談天,來(lái)判別對(duì)方是否患病。
需求醫(yī)師來(lái)查詢的要素包含:
對(duì)方是否語(yǔ)調(diào)單一,完全不波瀾起伏;
說(shuō)話音量是否比較低;
說(shuō)話時(shí)手勢(shì)是不是比正常人少;
是不是總愛(ài)垂頭向下看;
……
別的,還需求經(jīng)過(guò)患者健康問(wèn)卷(PHQ, Patient Health Questionnaire)來(lái)查詢來(lái)了解更具體的信息。
用AI來(lái)確診抑郁癥,就相當(dāng)于用機(jī)器學(xué)習(xí)模型來(lái)替代那個(gè)和患者對(duì)話的醫(yī)師,把患者在醫(yī)師面前的體現(xiàn)變成數(shù)據(jù),輸入機(jī)器學(xué)習(xí)模型中。
因而,李飛飛團(tuán)隊(duì)選用的計(jì)劃是先模型中輸入3D面部要害點(diǎn)視頻、患者說(shuō)話的音頻和轉(zhuǎn)成文字的訪談錄音三種數(shù)據(jù),別離對(duì)應(yīng)下圖中的abc三行。
之后,輸出PHQ評(píng)分或抑郁癥分類標(biāo)簽,就能得出此人是否患了抑郁癥。
練習(xí)模型全過(guò)程練習(xí)這個(gè)模型用到的是DAIC-WOZ數(shù)據(jù)集,包含142名患者的PHQ評(píng)分和189次臨床訪談、一共50小時(shí)的數(shù)據(jù)。
整個(gè)模型由兩個(gè)部分組成。
第一個(gè)部分叫語(yǔ)句級(jí)嵌入(Sentence-Level Embeddings)。
以往的嵌入方法都是嵌入一個(gè)音節(jié)或單詞,只能捕捉幾百毫秒的時(shí)刻。李飛飛團(tuán)隊(duì)用的是整個(gè)語(yǔ)句多模態(tài)嵌入,能夠完成捕捉更長(zhǎng)時(shí)刻的聲響、視覺(jué)和言語(yǔ)元素。
下圖便是多模態(tài)語(yǔ)句級(jí)嵌入的示例:
第二個(gè)部分叫因果卷積網(wǎng)絡(luò)(C-CNN, Causal Convolutional Networks)。
之所以用因果卷積網(wǎng)絡(luò),是由于抑郁癥患者說(shuō)話慢。
比較普通人,抑郁癥患者說(shuō)話的時(shí)分會(huì)在不同的字詞之間中止更長(zhǎng)時(shí)刻,因而整個(gè)語(yǔ)句的音視頻也就比較長(zhǎng)。處理這種長(zhǎng)語(yǔ)句的時(shí)分,因果卷積網(wǎng)絡(luò)要比RNN強(qiáng)。
作用怎么咱們來(lái)看一下試驗(yàn)成果。
其間,A是指輸入數(shù)據(jù)為音頻,V是指輸入數(shù)據(jù)為視頻,L是指輸入數(shù)據(jù)為文本。
比照前人的試驗(yàn)成果,李飛飛的這項(xiàng)新研討數(shù)據(jù)上相對(duì)較高。不過(guò),與前人不同的是,這項(xiàng)新研討并不依靠一些預(yù)先做好的訪談?dòng)涊d,所以來(lái)的布景材料更少。而且,這項(xiàng)新研討無(wú)需特征工程,能夠直接用輸入原始數(shù)據(jù)。
這張?jiān)囼?yàn)成果表格比照了運(yùn)用不同嵌入方法的成果。其間,前兩行是手藝嵌入,第3~6行是預(yù)練習(xí)嵌入,最終兩行是咱們用到的語(yǔ)句級(jí)嵌入,輸入的是log-mel光譜圖、3D面部要害點(diǎn)視頻和Word2Vecs的序列。
傳送門論文:
Measuring Depression Symptom Severity from Spoken Language and 3D Facial Expressions
Albert Haque, Michelle Guo, Adam S Miner, Li Fei-Fei
https://arxiv.org/abs/1811.08592
— 完 —
誠(chéng)摯招聘
量子位正在招募修改/記者,工作地點(diǎn)在北京中關(guān)村。等待有才華、有熱心的同學(xué)參加咱們!相關(guān)細(xì)節(jié),請(qǐng)?jiān)诹孔游淮蟊娞?hào)(QbitAI)對(duì)話界面,回復(fù)“招聘”兩個(gè)字。
量子位 QbitAI · 頭條號(hào)簽約作者
?'?' ? 追尋AI技能和產(chǎn)品新動(dòng)態(tài)