您現(xiàn)在的位置：首頁 > 科技 > 正文

時(shí)訊：AI偽造人聲無敵了么？

時(shí)間：2022-12-15 16:49:12 來源：科普中國(guó)網(wǎng)

2014 年的一個(gè)清晨，瓦爾·基爾默醒來，發(fā)現(xiàn)自己置身血泊之中。全身上下唯一的異樣是喉嚨，里面出現(xiàn)了一個(gè)腫塊，讓他吞咽困難。

(資料圖)

他很快得到診斷，是喉癌導(dǎo)致的嘔血。為了治療，他不得不接受氣管切開術(shù)。手術(shù)在喉嚨上留下一個(gè)洞，進(jìn)食時(shí)需要接入一根管子。此后，“呼吸還是吃飯？”，變成了一個(gè)二選一的問題。

瓦爾·基爾默在《壯志凌云》中與阿湯哥的對(duì)手戲｜來源：Looper

對(duì)于這位曾扮演 95 版蝙蝠俠的好萊塢演員，更嚴(yán)重的后果是，他失去了自己的聲音。如今，當(dāng)他嘗試說話，只能發(fā)出介于“吱吱聲和低吼”之間的聲音。

去年，基爾默決定與人工智能公司 Sonantic 合作，恢復(fù)自己“說話的能力”。憑借有限的錄音，他們成功克隆出了跟生病前的基爾默十分相像的聲音，未來將可以替代他進(jìn)行發(fā)言。

AI 合成人聲的技術(shù)已經(jīng)十分成熟。一些開放免費(fèi)測(cè)試的主流平臺(tái)，例如 Resemble AI、Descript ，僅需要你錄入 25 句話或 10 分鐘錄音，就能克隆你的聲音——當(dāng)然，訓(xùn)練集的時(shí)長(zhǎng)越長(zhǎng)，模型就會(huì)與你越相像。最低要求呢？3.7 秒就可以。

除了服務(wù)基爾默這樣的病人，語音克隆還有一大用處，是“復(fù)活故人”，不論是去世的親人，還是已故的名人。不久前，語音合成公司 Play.ht 釋出了一集播客，內(nèi)容是喬布斯與著名播客主播喬·羅根對(duì)談——其中的文本和人聲全都是 AI 合成的。

“冒牌貨”們?cè)诓タ屠镎勑︼L(fēng)生，從頭至尾本尊都不用參與其中。這是否會(huì)涉及到侵權(quán)呢？尤其是已過世者，他們的聲音所有權(quán)歸屬于誰呢？任何人都可以使用么？

更棘手的問題是，真假如何分辨呢？

挺好的技術(shù)，卻被用來行騙？

別說你一定分得出人聲與 AI。

2019 年 3 月，英國(guó)一家能源公司的員工接到老板電話，要求他在一個(gè)小時(shí)內(nèi)轉(zhuǎn) 22 萬歐元給匈牙利的一家供應(yīng)商，電話那頭“老板”略帶德國(guó)口音，和平時(shí)老板說話的聲音不差分毫，他毫不懷疑立刻照辦了，轉(zhuǎn)賬后這筆錢很快被轉(zhuǎn)移到墨西哥，難再追回；2020 年，香港的一名銀行經(jīng)理被克隆語音欺騙，向詐騙者批準(zhǔn)了一筆 3500 萬美金的轉(zhuǎn)賬。

這種事情正在變得越來越多， VMware 今年的調(diào)查顯示，三分之二的受訪企業(yè)表示過去一年收到的詐騙攻擊中存在音頻或視頻偽造的成分。

當(dāng)你在電話里聽到一個(gè)熟悉的聲音，大多數(shù)人“沒有建立起肌肉記憶來真正應(yīng)對(duì)它?！卑Ｉ馨踩径驴偨?jīng)理麗莎?奧康納表示。

生理結(jié)構(gòu)上，人類大腦面對(duì)假聲音時(shí)會(huì)變得蠢蠢的。

2019 年加州大學(xué)河濱分校的一項(xiàng)研究發(fā)現(xiàn)，在觀看倫勃朗畫作的真跡和贗品時(shí)，人們的腦部掃描會(huì)顯現(xiàn)出明顯的差異；聆聽摩根 · 弗里曼、機(jī)器弗里曼和模仿者說話時(shí)，卻沒有同樣表現(xiàn)。

“結(jié)果表明，人類可能在本質(zhì)上無法區(qū)分真實(shí)的和非真實(shí)的聲音?！?/p>

聆聽真人和合成人聲時(shí)，人腦活動(dòng)沒有顯現(xiàn)出顯著差異｜來源：論文配圖

AI 偽造人聲無敵了么？

科學(xué)家正在試圖應(yīng)對(duì)它。

最近的一項(xiàng)研究中，佛羅里達(dá)大學(xué)的研究者們發(fā)現(xiàn)了機(jī)器的一個(gè)破綻：沒有聲道?；蛘哒f，人類發(fā)聲方式的局限，在于每一個(gè)人的聲道結(jié)構(gòu)，而 AI 不具備這樣的“局限性”。

數(shù)十年來，科學(xué)家都試圖重現(xiàn)史前生物的聲音。猛犸象、恐龍……它們的嘯叫、呼喊，聽起來會(huì)是怎樣的？骨骼的形狀提供了許多線索，比如副櫛龍，它們的頭骨中有一個(gè)很長(zhǎng)的腔，科學(xué)家據(jù)此來估測(cè)它的共振頻率。

人類發(fā)聲也是如此，通過使用聲道的各種結(jié)構(gòu)，聲帶、舌頭、嘴唇，協(xié)作擠壓空氣來發(fā)出聲音并改變聲音。使用聲學(xué)和流體動(dòng)力學(xué)模型，研究者可以倒推出怎樣的一個(gè)結(jié)構(gòu)發(fā)出了這段聲音。

通常會(huì)像是這樣，一個(gè)不規(guī)則的，有突起和凹陷的通路。

口腔的打開程度會(huì)決定我們發(fā)出怎樣的聲音｜來源：論文截圖

然而，當(dāng)他們把機(jī)器生成的聲音放入同樣模型時(shí)，奇怪的事情就發(fā)生了：

紅圈中為機(jī)器的“聲道結(jié)構(gòu)” ｜來源：論文截圖

機(jī)器人聲倒推出來聲道，就像一根又細(xì)又長(zhǎng)的吸管，這跟人體的正常結(jié)構(gòu)完全不同。僅憑這樣的側(cè)面解剖圖，就幾乎可以立刻分辨這是人發(fā)出的聲音，還是機(jī)器的。通過這個(gè)方法，他們檢驗(yàn)了 4966 個(gè)音頻語段，準(zhǔn)確率高達(dá) 99.9%。

想象一下，這或許很快會(huì)成為一個(gè)基礎(chǔ)配置，當(dāng)你接起一通電話，一個(gè)附加的插件會(huì)同時(shí)開始運(yùn)轉(zhuǎn)，判斷對(duì)面是真人還是機(jī)器合成人聲，再向你發(fā)出警告。

已經(jīng)有很多人在為此努力。2019 年，為了對(duì)抗克隆語音、假音頻，Google 發(fā)布了一個(gè)合成語音數(shù)據(jù)庫，來推動(dòng)對(duì)假音頻檢測(cè)的研究，里面包含了谷歌深度學(xué)習(xí)模型所“說”的上千個(gè)短語，用 68 種不同的聲音覆蓋了各式各樣的口音，希望以此鼓勵(lì)外界開發(fā)出更多語音鑒真的方案。

沒有科學(xué)家的工具，我們自己怎么辦？

有一些小竅門，但主要靠直覺。

語音認(rèn)證服務(wù)公司 Pindrop 一直在開發(fā)合成聲音，這個(gè)過程中他們也發(fā)現(xiàn)了機(jī)器的一些缺陷：

不善于處理摩擦音，比如 f，s，v，z ，因?yàn)檐浖茈y將它們與噪音區(qū)分開來

愛拖長(zhǎng)音，算法很難區(qū)分單詞的末尾和錄音中的背景噪音，會(huì)出現(xiàn)斷句的問題

過于“干凈”，像是在錄音室里用專業(yè)設(shè)備錄制的，且質(zhì)量始終如一

Pindrop 也發(fā)現(xiàn)了一些異?！奥斆鳌钡姆缸锓肿?，為了掩蓋這些缺陷，故意放入嘈雜的環(huán)境音來干擾對(duì)方的判斷。有一位他們稱之為“雞人”的詐騙犯，總是在背景中播放公雞的叫聲；還有一位女士會(huì)利用嬰兒的啼哭聲做背景音，試圖來博取對(duì)方的同情。

因此，當(dāng)發(fā)現(xiàn)對(duì)面有持續(xù)奇怪的噪聲，你就要小心了。

對(duì)于涉及重大交易的對(duì)話，深度偽造偵測(cè)公司 Deeptrace 的主管亨利?阿杰德給出了一個(gè)實(shí)用建議：考慮使用暗號(hào)進(jìn)行對(duì)話，或者在通話開始時(shí)提出或回答一個(gè)秘密問題。

以當(dāng)前 AI 的學(xué)習(xí)速度，相信很快，這些拙劣的破綻就會(huì)被逐一擊破——曾有一篇論文研究發(fā)現(xiàn)，通過人物眨眼的不規(guī)律，可以判斷視頻是否為深度偽造。可僅僅幾個(gè)月之后，開發(fā)者就解決了這個(gè) bug 。

但至少現(xiàn)在，人類仍能通過細(xì)枝末節(jié)的線索，判斷出對(duì)方非我同類。比如，在羅根與喬布斯的對(duì)談中，總有詭異的笑聲穿插在流利的對(duì)話中，“呵呵呵、嘻嘻嘻”，十分突兀，語調(diào)也會(huì)因此變形。

這讓人想起 Resemble 在語音生成后，會(huì)給你一些選項(xiàng)，可以在段落中加入停頓或是“憤怒”、“喜悅”這樣的情緒。從反饋來看，模型似乎并尚不能很好地處理情緒。

但終有一天，我們要懷疑一切。

前幾天同事小楊接到一個(gè)推銷電話，開了免提，熱火朝天地跟辦公室里其他人討論對(duì)方是不是機(jī)器人。

突然，電話對(duì)面緩緩傳來：“對(duì)不起，我說話的方式讓您誤解了?！?/p>

“你信這是真人了么？”

他回答：“哼，我才不信，這肯定是 AI 的伎倆?！?/p>

參考文獻(xiàn)

[1] https://www.ndss-symposium.org/wp-content/uploads/2019/02/ndss2019_08-3_Neupane_paper.pdf

[2] https://theconversation.com/deepfake-audio-has-a-tell-researchers-use-fluid-dynamics-to-spot-artificial-imposter-voices-189104

[3] https://www.nytimes.com/2020/05/06/magazine/val-kilmer.html

[4] https://www.yahoo.com/entertainment/val-kilmer-cancer-treatment-lost-voice-142401511.html

[5] https://www.hellomagazine.com/healthandbeauty/health-and-fitness/20210825120419/val-kilmer-heartbreaking-reveal-cancer-diagnosis/[6] https://arstechnica.com/information-technology/2022/10/fake-joe-rogan-interviews-fake-steve-jobs-in-an-ai-powered-podcast/

[7] https://www.howtogeek.com/682865/audio-deepfakes-can-anyone-tell-if-they-are-fake/

[8] https://senseient.com/wp-content/uploads/Deepfakes-updated.pdf

[9] https://mitsloan.mit.edu/ideas-made-to-matter/deepfakes-explained

作者：翁垟

果殼（ID：Guokr42）

如需轉(zhuǎn)載，請(qǐng)聯(lián)系sns@guokr.com

歡迎轉(zhuǎn)發(fā)到朋友圈

來源：果殼

標(biāo)簽：從頭至尾加州大學(xué)河濱分校談笑風(fēng)生

相關(guān)新聞

凡本網(wǎng)注明“XXX（非現(xiàn)代青年網(wǎng)）提供”的作品，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。

特別關(guān)注

天天即時(shí)：《卿卿日?！防铮糯ǘY儀為何各不同？

原標(biāo)題：《卿卿日?！防铮糯ǘY儀為何各不同？這部戲的禮儀從最開始的時(shí)候，最吸引觀眾的就是九川禮儀各不相同了。從第一集開始，我們就看到

2022-12-15 05:44
焦點(diǎn)日?qǐng)?bào)：此“郁金香”非彼“郁金香” 唐代的外來香料真“香”

原標(biāo)題：此“郁金香”非彼“郁金香”唐代的外來香料真“香”文北京青年報(bào)記者陳品中國(guó)香文化歷史悠久，早在石器時(shí)代就有焚香祭祀的行為，先祖

2022-12-14 13:42
全球報(bào)道:談?wù)摴枢l(xiāng)，是一門學(xué)問，也是一種心境

原標(biāo)題：《故鄉(xiāng)潮州》出版專訪陳平原教授（引題）談?wù)摴枢l(xiāng)，是一門學(xué)問，也是一種心境（主題）文北京青年報(bào)記者王勉而心境好解，這學(xué)問又是如

2022-12-13 20:33
《逐光的孩子》高校“開講”

原標(biāo)題：《逐光的孩子》高校“開講”工人日?qǐng)?bào)—中工網(wǎng)記者鄒明強(qiáng)通訊員卓張鵬胡蘭楊倩文攝影彭佳12月11日，中南財(cái)經(jīng)政法大學(xué)藝術(shù)大思政課《逐

2022-12-13 17:34
【世界新要聞】打磨六七年小說《天圣令》講了什么故事？

原標(biāo)題：打磨六七年小說《天圣令》講了什么故事？中新網(wǎng)12月12日電近日，兩場(chǎng)主題為“從‘天圣令’看宋韻文化”的講座舉行，著名作家蔣勝男從

2022-12-13 13:50
環(huán)球滾動(dòng):《人在草木間》系列融媒體報(bào)道今起推出

原標(biāo)題：《人在草木間》系列融媒體報(bào)道今起推出北京時(shí)間11月29日晚，“中國(guó)傳統(tǒng)制茶技藝及其相關(guān)習(xí)俗”，列入聯(lián)合國(guó)教科文組織人類非物質(zhì)文化

2022-12-12 21:39
每日速看!山西明日起多個(gè)文化場(chǎng)館恢復(fù)開放

原標(biāo)題：山西明日起多個(gè)文化場(chǎng)館恢復(fù)開放記者日前了解到，山西博物院、山西青銅博物館、太原市博物館、臨汾市博物館以及太原市圖書館等文化場(chǎng)

2022-12-12 20:36
《三體》上線首日播量放過億

原標(biāo)題：《三體》上線首日播量放過億工人日?qǐng)?bào)—中工網(wǎng)記者張翀12月10日，《三體》動(dòng)畫在嗶哩嗶哩（以下簡(jiǎn)稱“B站”）全網(wǎng)獨(dú)家上線，首周兩集連

2022-12-12 19:33
郭沫若屈原研究的時(shí)代氣象

原標(biāo)題：郭沫若屈原研究的時(shí)代氣象晚清七十年，中西文化在激烈碰撞中相互借鑒、吸收和融合。在這一時(shí)代大背景之下，20世紀(jì)上半葉的楚辭研究在

2022-12-12 14:45
中國(guó)近代日記研究的拓展、反思與未來——從“日記研究叢書”說起

原標(biāo)題：中國(guó)近代日記研究的拓展、反思與未來（主題）——從“日記研究叢書”說起（副題）日記這種文獻(xiàn)類型和書寫方式，在中國(guó)具有悠久的傳統(tǒng)

2022-12-12 14:43
世界速讀：《詩經(jīng)》的禮義、樂義、詩義與經(jīng)義

原標(biāo)題：《詩經(jīng)》的禮義、樂義、詩義與經(jīng)義《詩經(jīng)》所載樂歌，本為兩周禮儀的用樂與歌舞的歌詞，要對(duì)其詩義進(jìn)行清晰的解讀，需要回到歷史現(xiàn)場(chǎng)

2022-12-12 11:32
微短劇靠什么贏得觀眾喜歡

原標(biāo)題：微短劇靠什么贏得觀眾喜歡最近一段時(shí)間，單集不超過10分鐘的微短劇深受觀眾喜愛。數(shù)據(jù)顯示，今年僅快手平臺(tái)的微短劇日活躍用戶便增長(zhǎng)

2022-12-12 08:32
要聞：考古還原青藏高原絲路的樣貌

原標(biāo)題：考古還原青藏高原絲路的樣貌仝濤【考古中國(guó)】??●青海都蘭熱水一號(hào)大墓出土大量來自唐朝、中亞和西亞的絲織品、金銀器,以及各類寶石

2022-12-12 08:52
全球微資訊！圖片故事丨劍川木雕：傳承千年技藝

圖片故事原標(biāo)題：劍川木雕：傳承千年技藝段四興在進(jìn)行木雕制作中的打坯流程（12月1日攝）。劍川木雕是云南省劍川縣傳統(tǒng)美術(shù)項(xiàng)目，歷史悠久，具

2022-12-12 08:37
劇場(chǎng)藝術(shù)如何拓展邊界找尋多樣表達(dá)

原標(biāo)題：劇場(chǎng)藝術(shù)如何拓展邊界找尋多樣表達(dá)北京晚報(bào)記者高倩12月8日至9日，“2022世界劇院北京論壇”和“2022臺(tái)湖舞美國(guó)際論壇”在國(guó)家大劇院

2022-12-12 05:40
熱推薦：打工新鮮事兒丨想學(xué)藝、想掙錢？快來村里這塊“寶地”集合！

原標(biāo)題：想學(xué)藝、想掙錢？快來村里這塊“寶地”集合！據(jù)12月8日甘肅省文旅廳、人社廳、鄉(xiāng)村振興局聯(lián)合印發(fā)的通知，甘肅新認(rèn)定28家省級(jí)非遺工坊

2022-12-11 21:55
西安多家博物館明天起陸續(xù)開放

原標(biāo)題：西安多家博物館明天起陸續(xù)開放陜西西安多家博物館11日發(fā)布公告，明天（12日）起陸續(xù)恢復(fù)開放。西安博物院12月12日（星期一）起恢復(fù)對(duì)

2022-12-11 21:36
天天快消息！世界杯的魅力

原標(biāo)題：世界杯的魅力韓立群1990年世界杯我17歲，我家黑白電視14寸。記得馬拉多納無能為力的淚水。1994年巴喬橫空出世，一路帶著意大利打入決

2022-12-11 20:42
【速看料】初冬

原標(biāo)題：初冬張燕峰初冬。田野空曠，露出黑油油的泥土，像一位剛剛生產(chǎn)過的母親，袒露著的胸膛，平靜而疲憊?？拷坪跄苈牭絹碜源蟮厣钐?/p>
2022-12-11 11:36
別了，青石板的巷陌

原標(biāo)題：別了，青石板的巷陌田海明夏雨猛烈而迅疾，砸在屋檐上，迸濺出水花，瀉出朦朧的水簾，隔絕了我望向窗外的視線。爸從外邊回來，穿著的

2022-12-11 11:44
一把檀木梳

原標(biāo)題：一把檀木梳鄧素芳《牡丹花瓶》　文森特·凡高[荷]　瑪咖供圖月光從門外涌進(jìn)來，閃著銀色的粼光。我坐在梳妝臺(tái)前，檀木梳隱發(fā)著淡淡的

2022-12-11 11:32
每日焦點(diǎn)！藝評(píng)丨最好的書店氛圍，是看得見的對(duì)閱讀的愛

【藝評(píng)】原標(biāo)題：最好的書店氛圍，是看得見的對(duì)閱讀的愛羅筱曉最近，位于杭州解放路的新華書店因內(nèi)部改造暫時(shí)閉店。這家書店建成于1954年，是

2022-12-11 05:44
從“中文熱”到“天宮熱”

原標(biāo)題：從“中文熱”到“天宮熱”（主題）——中文教學(xué)助推中國(guó)和阿拉伯國(guó)家文化交流（副題）藺妍林建杰“這是中國(guó)，這是阿聯(lián)酋，我們是好朋

2022-12-11 05:32
每日?qǐng)?bào)道：視線丨《大博弈》書寫時(shí)代浪潮下的中國(guó)工業(yè)制造

【視線】原標(biāo)題：電視劇、小說同時(shí)推出（引題）《大博弈》書寫時(shí)代浪潮下的中國(guó)工業(yè)制造（主題）中工網(wǎng)訊（工人日?qǐng)?bào)—中工網(wǎng)記者蘇墨）近日，

2022-12-11 05:34
熱點(diǎn)！“凌家灘文化展”在安徽博物院開展

原標(biāo)題：“凌家灘文化展”在安徽博物院開展12月7日，觀眾參觀“凌家灘文化展”。12月7日起，“璀璨星光——凌家灘文化展”在安徽博物院開展。

2022-12-11 05:36

熱文推薦

1妊娠期糖尿病飲食的正確打開方式：適當(dāng)補(bǔ)充紐特舒瑪膳食纖維
2懂收藏的人，都在悄悄行動(dòng)！
3王者榮耀七周年攜手網(wǎng)易LOFTER齊整活，游戲IP同人創(chuàng)作的流向改變了
4軟文推廣要這樣刷“存在感”，才能讓潛在用戶“無處可逃”
5綿延山峰、雪落草原這一刻越野精神與哈弗H9在一起
6怎樣搞好商業(yè)服務(wù)軟文推廣？寫商業(yè)軟文實(shí)際效果如何？
7獨(dú)家！越博動(dòng)力遭罷免董事長(zhǎng)“喊冤”：我被圍攻、脅迫30多個(gè)小時(shí)簽下協(xié)議
8雀巢母嬰專業(yè)服務(wù)再升級(jí)，聚焦育兒共同壓力
9掌上生活9.0全新發(fā)布：開放平臺(tái)+小程序強(qiáng)化數(shù)字化經(jīng)營(yíng)中臺(tái)能力
10預(yù)防新冠藥物熊去氧膽酸膠囊“爆火”，安士制藥為首家“過評(píng)”企業(yè)
11神旅集團(tuán)90后董事長(zhǎng)朱靜當(dāng)選省會(huì)最年輕在泉州山東商會(huì)會(huì)長(zhǎng)！
12“快閃”成都，五糧濃香兔年生肖酒打響旺季攻勢(shì)、搶跑“春節(jié)檔”！
13十八數(shù)藏讓“動(dòng)物活化石”與元宇宙相遇跨次元反差增添潮流感
14一曲肝腸斷天涯何處覓知音|作曲家董穎達(dá)攜電影配樂榮登十八數(shù)藏
15共謀創(chuàng)新合作賦能產(chǎn)業(yè)發(fā)展杭州數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)旅游國(guó)際對(duì)話大會(huì)成功舉辦
16貝索斯30億投資Altos、麥克斯科學(xué)收購瑞維拓，衰老干預(yù)市場(chǎng)再掀新浪潮
17看看大S在喝什么！看來汪小菲的錢還沒到賬！
18HPV疫苗，越早越小接種獲益越高
19進(jìn)擊南美市場(chǎng)，哈弗H6 PHEV開啟在巴西的顛覆之旅
20《看中國(guó)》
21鄭志剛推動(dòng)中國(guó)文化走出去，首屆“藝文香港”開幕，見證中國(guó)文藝蓬勃發(fā)展！
22品牌的力量 | 北京京都兒童醫(yī)院在2022年上海醫(yī)交會(huì)斬獲5項(xiàng)大獎(jiǎng)
23燭照千年網(wǎng)易LOFTER首屆高校概念藝術(shù)大賽征稿啟動(dòng)
24國(guó)控星鯊首次亮相糖酒會(huì)，全家營(yíng)養(yǎng)概念備受關(guān)注
25數(shù)字化人才培養(yǎng)研討會(huì)暨產(chǎn)教創(chuàng)新聯(lián)盟籌備會(huì)在黃河交通學(xué)院順利召開

時(shí)訊：AI偽造人聲無敵了么？

特別關(guān)注

焦點(diǎn)資訊

時(shí)訊：AI偽造人聲無敵了么？