您現(xiàn)在的位置:首頁 > 科技 > 正文

你刷到的每一條微博,可能都包含了抑郁癥患者的求救信號(hào)

時(shí)間:2023-07-08 22:54:46    來源:科普中國網(wǎng)    


(資料圖)

圖片來源:Pixabay

每日更新社交網(wǎng)絡(luò)上的信息,已經(jīng)成為現(xiàn)代人不可忽視的生活方式之一。科學(xué)家可以從這些信息中分析出人們的心理和生理健康狀況。撰文 | 約翰尼斯 · C · 艾希施泰特(Johannes C. Eichstaedt)翻譯 | 侯悠揚(yáng) 2010年谷歌時(shí)代精神論壇當(dāng)晚,積極心理學(xué)之父馬丁·E·P·塞利格曼(Martin E.P. Seligman)出現(xiàn)在了一群技術(shù)巨頭之中,他是論壇演講嘉賓之一。彼時(shí),谷歌剛剛開創(chuàng)了用搜索引擎追蹤美國流感傳播的新方法,谷歌地圖也正風(fēng)靡世界。這些技術(shù)廣闊的應(yīng)用前景讓塞利格曼和谷歌創(chuàng)始人拉里·佩奇(Larry Page)湊到了一起,討論更多的可能性。 他們在思考,谷歌監(jiān)測流感趨勢的工具能否用來描繪美國人的心理健康狀態(tài)?通過分析人們在社交媒體上所使用的語言,電腦算法是不是也可以預(yù)測人們的快樂和幸福感在時(shí)間和空間上的變化? 在那之后的幾個(gè)月,我與塞利格曼,還有他在賓夕法尼亞大學(xué)的同事們一起,聯(lián)合谷歌公司的慈善部門Google.org啟動(dòng)了世界幸福計(jì)劃(WWBP)。 2015年1月,我的團(tuán)隊(duì)發(fā)表了第一項(xiàng)研究成果,證實(shí)了之前提出的想法。通過對(duì)全美1300個(gè)縣、一億條推特(Twitter)信息的分析,我們發(fā)現(xiàn),一個(gè)地區(qū)的負(fù)面信息——特別是那些表達(dá)憤怒和仇恨的信息——能預(yù)測該地區(qū)的心臟病死亡率。接下來的一系列研究也表明,在推特或臉書(Facebook)上發(fā)表的內(nèi)容與人們的年齡、性別、性格、收入水平、精神疾病還有生理疾病都密切相關(guān)。 在一項(xiàng)對(duì)美國不同縣市的分析中,我們發(fā)現(xiàn),負(fù)面信息(紅字)和心臟病發(fā)病率有正相關(guān)。經(jīng)常討論樂觀話題(綠字)的社區(qū)心臟病發(fā)病率更低。我們還發(fā)現(xiàn),感情強(qiáng)烈的詞匯與冠心病相關(guān)。這些結(jié)果表明,社交媒體數(shù)據(jù)對(duì)心理學(xué)家、社會(huì)學(xué)家和流行病學(xué)家來說,都是一項(xiàng)豐富的資源。他們可以從中挖掘出有價(jià)值的信息,預(yù)測社群健康,甚至預(yù)測個(gè)人疾病的診斷信息。然而在巨大機(jī)遇的背后,這一飛速發(fā)展的領(lǐng)域也有自己的陰暗面。在分析人們在社交媒體上所說的話時(shí),只依靠統(tǒng)計(jì)學(xué)方法,但統(tǒng)計(jì)分析的結(jié)果會(huì)揭露很多東西,以至于其他情報(bào)機(jī)構(gòu)、政客和商人(例如市場營銷和保險(xiǎn)公司)也會(huì)像科學(xué)家一樣,對(duì)這些數(shù)據(jù)產(chǎn)生濃厚興趣。然而,很少人了解,在應(yīng)用計(jì)算機(jī)算法后,這些機(jī)構(gòu)能從臉書和推特上人們的日常行為中,挖掘出多少信息。

推文透露的秘密

在WWBP團(tuán)隊(duì)開始分析推特,預(yù)測健康趨勢之前,谷歌已經(jīng)邁出了第一步。2008年,谷歌的健康策略官羅尼·澤戈?duì)枺≧oni Zeiger)和同事合作發(fā)起了谷歌流感趨勢(Google Flu Trends)項(xiàng)目。這個(gè)項(xiàng)目主要關(guān)注人們?nèi)绾卧诠雀枭纤阉髁鞲械陌Y狀與治療方法,以及搜索時(shí)他們所在的地理位置,從而實(shí)時(shí)追蹤流感的傳播趨勢。值得注意的是,澤戈?duì)枅F(tuán)隊(duì)對(duì)于流感季節(jié)性的判斷和美國疾病控制與預(yù)防中心(CDC)的統(tǒng)計(jì)數(shù)據(jù)吻合。不過谷歌的信息更及時(shí),因?yàn)樗麄儾幌馛DC那樣,需要醫(yī)生和醫(yī)院報(bào)告,才知道流感何時(shí)在何處暴發(fā)。 理解整個(gè)人群的心理狀態(tài)比追蹤疾病更復(fù)雜,因?yàn)楹苌儆腥藭?huì)在網(wǎng)上像搜索如何治感冒一樣搜索“如何變快樂”。因此,我們只能側(cè)面分析人們在社交媒體上發(fā)表的內(nèi)容。數(shù)十年的研究已經(jīng)揭示了人們?nèi)粘?duì)話與心理狀態(tài)之間的密切關(guān)系,而心理狀態(tài)又與身體健康密不可分。壓力、負(fù)面情緒、焦慮和抑郁都會(huì)損害我們的免疫系統(tǒng)和心血管系統(tǒng),正面和樂觀的情緒則會(huì)保護(hù)我們遠(yuǎn)離冠心病等疾病,提高預(yù)期壽命。 20世紀(jì)90年代開始,任教于得克薩斯大學(xué)奧斯汀分校的社會(huì)心理學(xué)家詹姆斯·潘納貝克(James Pennebaker)和同事就開始探尋人類語言和身心健康之間的關(guān)系。他們想知道,為什么在受到創(chuàng)傷后采用表達(dá)性寫作(expressive writing),記錄下事實(shí)的人,會(huì)比那些保守創(chuàng)傷秘密的人恢復(fù)得更好。為了記錄下受試者寫了什么,他們使用了一種程序,快速標(biāo)記文章中包含的詞匯和概念。 圖片來源:Unplash潘納貝克意外地發(fā)現(xiàn),無論是正面還是負(fù)面的詞匯和想法,寫作內(nèi)容本身和受試者的精神健康沒有太大的關(guān)系,一些功能性的語匯在其中扮演了重要角色。比如,患有抑郁的人并不會(huì)寫很多悲傷的事情,卻會(huì)大量使用第一人稱代詞:我(I、me)或是我的(mine)。這說明,抑郁癥患者的思想常被他們自己的痛苦占據(jù)。他們還發(fā)現(xiàn),創(chuàng)傷癥狀常常隨著表達(dá)因果關(guān)系的詞匯(因?yàn)?、所以、但是)和?fù)雜詞匯的增加而改善。這些模式表明,患者試圖理解創(chuàng)傷,把它們納入到一個(gè)更有條理的敘述中。 在過去10年中,臉書、推特興起,能夠用于語言分析的數(shù)據(jù)也在飛速增長,這為心理學(xué)家了解社交媒體用戶的心理健康狀況打開了一扇新的窗口(我們的工作已征得用戶的同意,并且將數(shù)據(jù)匿名化)。當(dāng)然,人們在網(wǎng)上往往會(huì)展示一個(gè)舉止行為良好、生活豐富的自我,研究者稱這種現(xiàn)象為社會(huì)贊許性偏差(social desirability bias )。 不過這種偏差并沒有我們想象的大,臉書上只與真實(shí)好友交流的用戶,在網(wǎng)上也能保持較為真實(shí)的自我,而真實(shí)世界的熟人朋友也知道他們的生活并不是只有野餐和派對(duì)。此外,由于每個(gè)人都會(huì)受到這種偏差的影響,所以借助算法可以區(qū)分人群間的真實(shí)差異。為了支持這種觀點(diǎn),我們可以對(duì)比兩種預(yù)測結(jié)果,一種來自社交媒體,一種來自傳統(tǒng)方法收集的數(shù)據(jù)(電話調(diào)查、醫(yī)院報(bào)告等更有代表性的群體)。令人吃驚的是,這兩種方法的結(jié)果相差無幾。

把握核心原則

充斥了俚語和表情符號(hào)的社交媒體語言給數(shù)據(jù)分析帶來了許多挑戰(zhàn)。多虧過去30年間自然語言處理技術(shù)的發(fā)展,我們才能從中提取出有意義的信息。 在這些技術(shù)發(fā)展之前,心理學(xué)的語言分析更多基于簡單的詞典方法(dictionary-based approaches)。在這種方法中,人的情緒狀態(tài)由一系列相關(guān)的詞匯來定義。如果一段話中出現(xiàn)了“高興”,就意味著寫作者處于積極的情緒。但由于語言本身的模糊性,這種方法有時(shí)會(huì)帶來令人困惑的結(jié)果。早期的一些研究就曾將心理學(xué)家編制的“積極情緒”詞典應(yīng)用于社交媒體信息,結(jié)果基于人們在元旦時(shí)相互祝賀“新年快樂”的祝詞,而做出了人們元旦當(dāng)天更快樂的錯(cuò)誤判斷。 圖片來源:Unplash現(xiàn)代的機(jī)器學(xué)習(xí)方法就避免了這種錯(cuò)誤。他們不對(duì)詞語和情緒、個(gè)性的關(guān)系做任何先驗(yàn)假設(shè),而是根據(jù)聚合、統(tǒng)計(jì)、打分、區(qū)隔詞語的方法從頭“學(xué)習(xí)”詞語與情緒的關(guān)系。這種方法的缺點(diǎn)在于,分析所需要的數(shù)據(jù)量至少要在5000到10 000個(gè)用戶。當(dāng)然,數(shù)據(jù)越多,就能越好地從充滿噪音的日常內(nèi)容中挖掘微弱的信號(hào)。好在現(xiàn)在大多數(shù)社交媒體網(wǎng)站都擁有百萬級(jí)的用戶量供我們分析。 2013年,我和塞利格曼、任教于石溪大學(xué)的安德魯·施瓦茨(Andrew Schwartz)等人一起發(fā)表了一項(xiàng)研究報(bào)告。我們用機(jī)器學(xué)習(xí)方法分析了75 000名臉書用戶發(fā)布的7億條詞語,同時(shí)讓他們接受了一項(xiàng)性格量表測試。通過人們在臉書上發(fā)表的大量文字和性格量表的測量結(jié)果,機(jī)器學(xué)習(xí)算法可以計(jì)算出語言和性格特質(zhì)之間的關(guān)系。 通過這項(xiàng)研究,我們得到了與外向型和內(nèi)向型人格、神經(jīng)質(zhì)和穩(wěn)定型人格相關(guān)的詞匯集。我們發(fā)現(xiàn),有些很少被人使用的詞匯能夠準(zhǔn)確預(yù)測人們的性格特質(zhì),例如“抑郁”就是神經(jīng)質(zhì)人格的一項(xiàng)顯著指標(biāo)。 雖然我們得到的關(guān)聯(lián)結(jié)果大部分比較合理,但其中也有例外。也許你覺得,和外向性格有關(guān)的詞包括“派對(duì)”,和內(nèi)向性格有關(guān)的詞包括“電腦”,這并不奇怪。但是,你或許會(huì)驚訝,為什么在神經(jīng)質(zhì)上得分較高的人會(huì)經(jīng)常使用“顯然地”?為什么情緒更穩(wěn)定的人會(huì)發(fā)表更多與運(yùn)動(dòng)有關(guān)的信息?內(nèi)向的人為什么對(duì)動(dòng)漫和表情符號(hào)等日本文化元素更感興趣?在后續(xù)的一項(xiàng)研究中,我們的同事格雷戈里格·帕克(Gregory Park)根據(jù)臉書上用戶的發(fā)帖,利用算法預(yù)測了他們的性格。這項(xiàng)算法的準(zhǔn)確性甚至比受試者的朋友對(duì)前者的推測更精準(zhǔn)。通過這項(xiàng)研究,可以更自信地說,我們已經(jīng)很好地解決了“社會(huì)贊許性偏差”的問題了。 我和同事一起,采用上述方法,在沒有敲開受試者房門的情況下,分析了美國1300名推特用戶的“心理檔案”。結(jié)合美國CDC的死亡原因和死亡數(shù)量統(tǒng)計(jì),我們發(fā)現(xiàn),在推特上表達(dá)更多憤怒、敵意等負(fù)性情緒的地區(qū),心臟病的致死率更高,而在“樂觀”地區(qū),心臟病的致死率更低。進(jìn)一步的分析發(fā)現(xiàn),這項(xiàng)結(jié)論對(duì)冠心病的預(yù)測特別準(zhǔn)確。冠心病是美國人的頭號(hào)殺手,它的發(fā)病率和心理因素密切相關(guān)。 有趣的是,發(fā)推特的人往往沒有生命危險(xiǎn)。目前,這種方法無法預(yù)測個(gè)人患冠心病的風(fēng)險(xiǎn),關(guān)注重點(diǎn)也是整個(gè)推特呈現(xiàn)出的趨勢——往往是年輕人發(fā)表的信息——與整個(gè)社區(qū)心理健康狀況的關(guān)系。這些信息很有可能預(yù)測了社區(qū)社會(huì)學(xué)家所稱的社會(huì)凝聚力(social cohesion),也就是社區(qū)成員是否愿意互助協(xié)作的意愿。研究表明,社區(qū)凝聚力和社區(qū)居民的心理及生理健康息息相關(guān)。在現(xiàn)有的研究中,我們將繼續(xù)使用這種方法摸索詞語的使用和其他致死性因素(如癌癥和中風(fēng))之間的關(guān)系,也期待能看到更積極的結(jié)果:富有凝聚力的社區(qū)也會(huì)幸福。

建立健康數(shù)據(jù)平臺(tái)

此前,很多政府試圖通過統(tǒng)計(jì)數(shù)字預(yù)測疾?。ɡ绶逝?、糖尿病、吸煙和高血壓)的死亡風(fēng)險(xiǎn)。和這些研究相比,我們通過分析推特,預(yù)測社區(qū)心臟病致死率的正確率更高。即便在控制了一些重要的預(yù)測因素(如教育和貧困率)后,這項(xiàng)基于語言模式的預(yù)測模型,仍然有出色的表現(xiàn)。 此外,我們的預(yù)測還會(huì)隨著社交媒體用戶的增加變得更加精準(zhǔn)。15年前,只有很少人使用臉書,大部分用戶還是青少年。然而,在2015年10月,皮尤研究中心發(fā)布的一項(xiàng)調(diào)查顯示,65%的美國成年人經(jīng)常使用社交媒體,這一比例是2005年的10多倍。該調(diào)查還顯示,90%的年輕人會(huì)使用社交媒體,而65歲以上成人的使用率從2010年以來翻了3倍?,F(xiàn)在,推特用戶的平均年齡是32歲——比美國全國人口年齡的中位數(shù)只年輕6歲。 分析社交媒體的文本,或許可以幫助臨床心理學(xué)家對(duì)病人做有針對(duì)性的治療。我們研究團(tuán)隊(duì)中的麗莉·安格(Lyle Ungar)、萊納·曼徹特(Raina Merchant)和賓夕法尼亞大學(xué)醫(yī)學(xué)院的同事一起,在賓大校醫(yī)院的急診室里通過iPad做了一項(xiàng)研究。自愿參與研究的急診室病人登陸他們的臉書賬號(hào),并提供帳號(hào)上的文本給研究者使用。這樣一來,我們就可以使用機(jī)器學(xué)習(xí)的方法,在他們的語言習(xí)慣和醫(yī)療記錄之間建立關(guān)系,從中挑出很多疾病(例如抑郁癥)的語言征兆。在不久的未來,醫(yī)生或許就可以根據(jù)人們在社交媒體發(fā)布的內(nèi)容,判斷對(duì)方是否出現(xiàn)了疾病的“預(yù)警信號(hào)”,從而適當(dāng)對(duì)病人進(jìn)行跟蹤診療。 通過手機(jī)應(yīng)用分析日常語言,提高醫(yī)療水平,這種想法并不遙遠(yuǎn)。設(shè)想一下,一位心理治療師可以自動(dòng)接受抑郁癥病患的每日情緒報(bào)告,并給他發(fā)送關(guān)鍵提醒、提示或者緊急建議。醫(yī)生也可以通過社交媒體檢測到心臟病患者的抑郁前兆,從而防止心臟病復(fù)發(fā)。2013年,微軟研究員就用推特預(yù)測了376名新媽媽的產(chǎn)后抑郁癥。通過分析這些女性在生產(chǎn)前發(fā)布的文字,這項(xiàng)預(yù)測的準(zhǔn)確率達(dá)到了71%,再加上產(chǎn)后幾周的數(shù)據(jù),預(yù)測的準(zhǔn)確率更是高達(dá)80%。 然而,保險(xiǎn)公司和借貸公司可能也會(huì)偷偷使用類似的社交媒體分析法,用作拒絕服務(wù)或是提高貸款利率的借口。但在我們的研究中,已事先征得了受試者的同意,并嚴(yán)格遵循著隱私原則。不過,只有很少有臉書用戶意識(shí)到,通過他們發(fā)布的文字,甚至是“點(diǎn)贊”行為,任何公司都能用相關(guān)技術(shù),分析出他們詳盡的性格特征。 社會(huì)的進(jìn)程必須和新科技一起前進(jìn),而這需要科學(xué)、政策和工業(yè)界的共同努力,才能把技術(shù)引導(dǎo)到正確的方向。我們會(huì)繼續(xù)發(fā)掘社交媒體分析在健康和身心健康方面的應(yīng)用,通過努力共同建設(shè)一個(gè)更自覺,更道德,對(duì)人類生命更有意義的未來。 本文節(jié)選自《環(huán)球科學(xué)》2016年6月刊

標(biāo)簽:

相關(guān)新聞

凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。

特別關(guān)注

熱文推薦

焦點(diǎn)資訊