作者 | 古月一刀
(資料圖片)
如果問華語樂壇近期產(chǎn)量最高的歌手是誰,“AI孫燕姿”一定有姓名。
在B站上搜索“AI孫燕姿”,便是無窮無盡的翻唱視頻。
里面既有聽眾們耳熟能詳?shù)摹兑恢焙馨察o》《歲月神偷》《紅豆》,也有令人哭笑不得的《好漢歌》《火紅的薩日朗》《朝你大胯捏一把》。
AI技術(shù)加持下的孫燕姿,各種曲風(fēng)皆不在話下。與以往“鬼畜視頻”里的那種怪異調(diào)音不同,此類音頻極大地保留了孫燕姿本人的聲音特質(zhì),在一些作品中甚至能達(dá)到以假亂真的程度。
孫燕姿
除了“AI孫燕姿”,周杰倫、王力宏、鄧紫棋、陳奕迅等歌手也出現(xiàn)了大批AI分身。他們彼此翻唱著對方的歌,無須授權(quán),無須付費(fèi)。在這里,音樂圈似乎率先邁入了烏托邦。
如果說夸張的“鬼畜創(chuàng)作”只是博聽眾們一笑,歌手們還能勉強(qiáng)接受的話,那么現(xiàn)在的“AI創(chuàng)作”則實(shí)實(shí)在在地讓他們感到了恐慌。
是福,是禍?這一波勢不可擋的AI浪潮,究竟該以怎樣的姿態(tài)面對?繼程序員、秘書、插畫師、模特等職業(yè)之后,歌手們也不得不開始思考了。
01
柯南的變聲器
“UP主”子魚(化名),雖然至今只做了4個(gè)“AI孫燕姿”的音頻,但總播放數(shù)已經(jīng)超過了150萬次。其中僅《下雨天》單曲就超過了100萬次,收藏人數(shù)接近2萬人。
視頻中,諸如“開口跪”“一模一樣”“這不是原唱?”等彈幕比比皆是,不少網(wǎng)友震驚于AI技術(shù)已經(jīng)發(fā)展到如此地步。
網(wǎng)友震驚于AI技術(shù)的發(fā)展
子魚之前也做過“AI周杰倫”“AI陶喆”等視頻,但對比下來,效果都遠(yuǎn)遠(yuǎn)不如“AI孫燕姿”。
“這可能與孫燕姿本身的聲音辨識(shí)度有關(guān),吐字相對清晰,音色有一定的顆粒感,氣息使用也自成一派,訓(xùn)練出的AI模型貼合了這樣的特質(zhì),所以讓人感覺像。”他說。
子魚告訴我,比起那些“鬼畜區(qū)”的大佬,他的技術(shù)還很稚嫩,都是在網(wǎng)上看視頻一步步自學(xué)的,核心就是開源項(xiàng)目So-vits-svc(以下簡稱Sovits)的使用。
這個(gè)Sovits的作用,就等同于柯南脖子上的“蝴蝶結(jié)變聲器”,即把一個(gè)音色變成另一個(gè)音色,這也是做“AI歌手”的關(guān)鍵。
名偵探柯南
根據(jù)Github上的介紹,目前這個(gè)項(xiàng)目已經(jīng)迭代到了4.0版本。相較于以往VITS、soft-vc、VISinger2等項(xiàng)目,Sovits的使用大大簡化,僅憑數(shù)段音頻就可訓(xùn)練出用戶想要的聲學(xué)模型。
當(dāng)然,這個(gè)音頻有一些特殊的要求。
比如,它得是“干聲”。在一首歌中,它就是去掉樂器、伴奏、混響、和聲后剩下的“原始聲音”。
再比如,它得訓(xùn)練材料得足夠多。“在4.0版本里,想完成一首惟妙惟肖的作品,最起碼要有2小時(shí)的‘干聲’材料打底。”子魚說。
在歌曲上,為了讓AI的唱腔更加游刃有余,訓(xùn)練者還必須收集歌手在各個(gè)音調(diào)中的“干聲”表現(xiàn)。“所以一般而言,音域廣的歌手,ta的AI作品會(huì)更像一些。”
這些特殊的要求,如果單靠創(chuàng)作者自己找,實(shí)際上也很難完成。但因?yàn)橛泻芏嗑W(wǎng)友分享了自己整合的歌手“干聲”材料,上傳到網(wǎng)上讓感興趣的網(wǎng)友們自行下載,這大大降低了Sovits的使用門檻。
子魚最初使用的就是這些整合包,讓他很快訓(xùn)練出了“AI孫燕姿”的聲音模型。后面只要用這個(gè)模型去替換掉原本歌曲的干聲即可,熟手的話,整個(gè)過程不超過2小時(shí)。
孫燕姿
在訓(xùn)練過程中,子魚后面也掌握了正常的使用方法,即便不用整合包,他自己也能通過軟件去篩出一首成品歌曲的“干聲”,以一首歌約3分鐘為例,只要篩40首歌,就能獲得足夠時(shí)長的“干聲”材料。
“當(dāng)然了,由于算法的局限以及材料的質(zhì)量高低,很多AI歌手的表現(xiàn)還不算完美。但這些通過補(bǔ)充更多高質(zhì)量的材料以及后期的修音,可以一定程度地解決這些問題。”
子魚私底下訓(xùn)練出過自己的AI模型,他用自己的聲音替換了許多歌曲,英文的,日文的,都很輕松地兼容了。
“第一次聽到自己聲音的時(shí)候,起了滿身的雞皮疙瘩,好玩的同時(shí)也感到一絲恐懼。”子魚說。
02
在誰的手上
感到恐懼的遠(yuǎn)不止子魚一人,那些首當(dāng)其沖的歌手們更是如此。
最近,女歌手陳珊妮在社交媒體上自曝,她在3月14日發(fā)布的新歌《教我如何做你的愛人》,實(shí)際上是“AI陳珊妮”唱的。
陳珊妮自爆其新歌由“AI陳珊妮”演唱
消息一出,音樂圈無不感到震驚。
因?yàn)樵诖饲皼]有聽眾發(fā)現(xiàn)過,甚至有粉絲評論過陳珊妮的嗓音好像“回春”了——這首歌的演唱水準(zhǔn)比她近年的表現(xiàn)要更好。
這件好像是行為藝術(shù)的事,向人們赤裸裸地傳遞了一個(gè)信息——一個(gè)制作精良的“AI歌手”已經(jīng)可以做到瞞天過海,欺騙過絕大多數(shù)人了。
陳珊妮隨后公布了自己這么做的初衷,“在 AI 發(fā)展熱議的當(dāng)下,希望透過這首歌,與所有關(guān)心創(chuàng)作的人一起思考——如果 AI 的時(shí)代必將到來,創(chuàng)作人該在意的或許不是‘我們是否會(huì)被取代’,而是‘我們還可以做些什么’。”
實(shí)際上,AI歌手并不是一個(gè)新鮮事物。
初音未來早在2007年就面世了,后來模仿這種“二次元形象+語音合成引擎”的虛擬歌手層出不窮,B站的洛天依,LOL推出的K/DA女團(tuán)都是這種。
初音未來 (來源:初音未來官方圖集)
但以往的這些AI歌手,并未引起過太大的波瀾。究其原因在于,這些歌手通常有著鮮明的虛擬形象,大家都心知肚明ta是個(gè)假的,其“電力充足”的電子音喉也無時(shí)無刻不在提示著ta們的虛擬身份。它們的存在,不會(huì)混淆人們的真假認(rèn)知。
現(xiàn)在的AI歌手則不一樣。他們的聲音來源于真實(shí)的材料,“調(diào)教”的目的也是為了無限度地?cái)M真,這使得人們的認(rèn)知很容易產(chǎn)生混亂。
一個(gè)理所當(dāng)然的疑問就出現(xiàn)了,如果人們刻意使用“AI歌手”來作惡怎么辦?
本就泛濫的假唱變得更加難以辨別,歌手行當(dāng)?shù)拈T檻變得越來越低,有關(guān)歌手聲音上的侵權(quán)變得愈加頻繁……
而有關(guān)聲音的作惡,也會(huì)順其自然地會(huì)延展到更廣的領(lǐng)域。由親朋好友的聲音所偽裝的電信詐騙,AI變聲后而造成的入室搶劫,婚戀領(lǐng)域?qū)乙姴货r的“殺豬盤”有了新型工具……
與此次相對的,則是通過“AI歌手”來向善。
比如還原鄧麗君、張國榮、邁克爾·杰克遜這些已故歌手的聲音,讓聽眾們得以緬懷。而這一點(diǎn)放在更廣的層面,也可“復(fù)活”那些離世人們的聲音,給親朋們以慰藉。
就和技術(shù)本身沒有善惡,關(guān)鍵要看使用者的意圖一樣,“AI歌手”的出現(xiàn)既有可能更好為公眾服務(wù),也有可能成為犯罪者的幫兇,其核心還是要看使用者的抉擇。
03
黑船來襲
長期來看,AI技術(shù)與音樂的加深綁定,幾乎是一種勢不可擋的趨勢。雖然總有人認(rèn)為,AI無法代替人的藝術(shù)性創(chuàng)作,AI的聲音是沒有感情的,AI無法實(shí)現(xiàn)人類細(xì)膩的表達(dá)云云,但實(shí)際上對于音樂圈而言,AI技術(shù)早已深入到產(chǎn)業(yè)的方方面面。
音樂播放器用之已久的“猜你喜歡”,就是AI技術(shù)的運(yùn)用的一個(gè)表現(xiàn)。它實(shí)現(xiàn)了對用戶口味的精準(zhǔn)猜測,讓播放器隨機(jī)出的歌曲越來越對聽眾的胃口。它也讓更多才華橫溢的小眾音樂人得以露頭,省去了新人們進(jìn)行自我營銷帶來的高昂成本。
基于AI技術(shù)的母帶制作服務(wù)(例如LANDR),為音樂人們提供了一種成本遠(yuǎn)低于傳統(tǒng)母帶制作服務(wù)的替代性方案,目前已經(jīng)有超過200萬音樂家利用它制作出超過1000萬首歌曲,AI技術(shù)幫助許多不具備音頻調(diào)整技能的音樂人們解決了大難題。
但對于音樂人來說,此時(shí)此刻最擔(dān)心的,恐怕是自身的權(quán)益損害問題。
上個(gè)月,一位外國網(wǎng)友就因制作了說唱歌手Drake和“盆栽哥”The Weeknd的AI版歌曲《Heart on My Sleeve》引起了法律糾紛。
說唱歌手Drake和“盆栽哥”
這首一經(jīng)推出就獲得了超過2000萬播放量的AI歌曲,被環(huán)球音樂集團(tuán)怒懟下架,并公告粉絲們:
“你們是想站在藝術(shù)家、粉絲、人類的創(chuàng)造性表達(dá)這一邊,還是站在造假、欺詐、不給藝術(shù)家付款、否定藝術(shù)家的那一邊?”
如此上綱上線,正義凜然,少不了生意上的考量,如果把聽眾也容納到整個(gè)音樂圈子里,對于此事的態(tài)度遠(yuǎn)沒有那么涇渭分明。
至少從《Heart on My Sleeve》的大多數(shù)正面評論來看,很多聽眾是喜歡這樣的作品的,他們認(rèn)為這是一首兼具娛樂性和藝術(shù)性的歌。
但問題在于這樣的行為究竟是一種新技術(shù)勃發(fā)后,創(chuàng)作者們搏粉絲一笑的創(chuàng)意行為,還是用技術(shù)圈錢,實(shí)則侵犯了歌手“聲音權(quán)”的侵權(quán)行為,兩者的界限在當(dāng)下并沒有被清晰地劃定。
在國內(nèi),“AI孫燕姿”們的視頻,仍然大張旗鼓地高掛于視頻平臺(tái)上。它們與“AI換臉”視頻一樣,現(xiàn)階段還是被當(dāng)做娛樂性的,具有“圈地自萌”性質(zhì)的事物看待。
然而當(dāng)這樣的視頻更加出圈呢?當(dāng)中國也誕生了一首中國版的《Heart on My Sleeve》爆紅作品,未經(jīng)授權(quán)用了兩大知名歌手的聲音,很難說不會(huì)遭遇與海外一樣的版權(quán)糾紛。
畢竟創(chuàng)作者實(shí)實(shí)在在收獲了流量與金錢,而被他使用聲音的歌手們也無故受到了或正面、或負(fù)面的影響。
不可否認(rèn),音樂圈也有人愿意把自己的聲音貢獻(xiàn)出來讓人使用。比如歌手格萊姆斯,她就公開表示過“很樂意大家使用她的聲音”。但她不是沒有條件的,她的要求是要分50%的版稅。
黎安·萊姆斯 鄉(xiāng)村音樂與流行音樂歌手 (圖源:百度百科)
如果創(chuàng)作者與歌手能夠達(dá)成某種利益分成上的約定,這倒不失為一種好的模式。
就像1853年停在江戶灣的那艘大黑船,“AI歌手”的誕生讓人害怕的同時(shí)也讓人好奇。是利大于弊,還是弊大于利,現(xiàn)在還難以言明。唯一明確的是,現(xiàn)在才剛剛開始。
文中配圖來源于網(wǎng)絡(luò)
編輯 | 向由
排版 | 澤偉
關(guān)注南風(fēng)窗,查看更多精彩內(nèi)容