2020-10-26 18:46:10聖天使

AI作曲的諾亞方舟將去往何處



[文丨智能相對論(ID:aixdlun),作者丨黃康瑄]


10月8日,韓國新人歌手夏妍發布了由人工智能作曲機器人EvoM製作的單曲《Eyes on you》,成為全世界第一位憑藉AI作曲出道的人類歌手。

EvoM是韓國光州科學技術院人工智能研究生院研發的韓國首個人工智能作曲機器人,在《Eyes on you》的錄製中負責作曲、編曲工作。EvoM的研發者安昌旭表示,他的目標是讓人工智能創作的歌曲登上K-POP排行榜。


啟航-音樂生產自動化的野心

早在上個世紀,人類就開始探討計算機獨立製作音樂的可能性。1956年,在列哈倫·希勒(Lejaren Hiller)的研究室里,世界上第一首完全由計算機生成的音樂作品--弦樂四重奏《伊利亞克組曲》(Illiac Suite)誕生了。1995年,阿爾佩(Alpern)研發的EMI作曲系統也是較早的一個成熟的古典音樂作曲系統,該系統主要採用拼接的方式來創作再現已故作曲家音樂風格的作品,其中有類巴赫的創意曲、器樂協奏曲和組曲,還有類莫扎特的奏鳴曲以及類肖邦的夜曲。


隨着人工智能相關技術的發展和普及,近年來,越來越多企業和機構開始研究這個科技與藝術結合的奇妙領域,各式各樣的作曲算法不斷湧現,不少虛擬音樂人展露頭角。「智能相對論」梳理了下:

2016年,Google公司研發的機器學習項目馬真塔(Magenta studio)通過神經學習網絡創作出一首時長90秒的鋼琴曲。同年,Sony旗下的計算機科學實驗室(Computer Science Laboratories,簡稱Sony CSL)開發了Flow Machines平台。


Flow Machines利用馬爾科夫鏈分析數據庫中現存的歌曲,提取旋律及和弦的關鍵信息,利用這些關鍵信息作為變量來學習音樂風格,讓不同風格的歌曲相互轉換、融合,並加以優化,其代表作是一首披頭士音樂風格的歌曲《爸爸的汽車》(Daddy's Car)。此外,Sony CSL還開發了一個名為「DeepBach(深度巴赫) 」的神經網絡,利用巴赫創作的352部作品來訓練DeepBach,最終完成2503首讚美詩的創作。


第一個正式獲得世界地位的AI虛擬作曲家則是2016年誕生的AIVA(Artificial Intelligence Virtual Artist)。AIVA通過讀取由莫扎特、巴赫、貝多芬等名家譜寫的15000首曲子進行學習,利用深度學習技術,搭建體現它自己對音樂理解的數學模型,運用模型創作出完全原創的曲子。

作為虛擬音樂人,AIVA已通過法國和盧森堡作曲家協會(SACEM)的合法註冊,成為該協會首位非人類會員,並擁有自己的署名版權。

今年2月,美國數字研究機構Space150模仿知名說唱歌手Travis Scott的人聲和音樂風格,做出了說唱機器人Travis Bott。


這是一個關於人工智能創造性的實驗,研發團隊採用附加神經網絡技術(Additional Neural Network),創造出「Travis Scott味」的旋律和打擊樂伴奏,再將Travis Scott的歌詞輸入「文本生成器模型(Text Generator Model)」,得到了機器自動仿照Travis風格生成的歌詞。


於是,Travis Bott完成了自己的創作--《Jack Park Canny Dope Man》。最後,研發團隊使用基於AI的人體圖像合成技術「Deepfake」,為這首歌拍攝了MV。就樂曲效果而言,Travis Bott對Travis Scott的模仿幾乎以假亂真,完全融匯了Travis Scott作品以及人物魅力最主要的外部特徵。同時,該項目也進一步驗證了人工神經網絡技術(Artificial Neural Networks)的蓬勃發展,有助於探索未來AI在音樂中的應用價值。


写诗、作曲、绘画 人工智能创作的春天来了


造船原理-幾種算法模型

現代人工智能作曲技術背後蘊含了多種算法模型的結合運用,包含人工神經網絡、馬爾科夫鏈及遺傳算法等。如AIVA和Travis Bott就使用了一種基於人工神經網絡的深度學習技術。

人工神經網絡是一種對生物神經的網絡行為特徵進行模仿,開展分布式並行信息處理的算法數學模型。程序員必須搭建一個多層「神經網絡」,在多層的結構中分別加以編程,從而處理各種輸入和輸出點之間的信息。作品數據輸入後,人工神經網絡會找到眾多被輸入作品之間存在的規律,繼而形成對音樂旋律、節奏、音高、強弱變化的理解與學習。


這種學習的主要目的是用來預測,並非就此生成作品。AI程序會帶着它對以上音樂風格的預測繼續運行,並將在前方遇到下一個驗證數據集。這個數據集會判定它的預測是否正確,正確與錯誤的回饋都將被AI記住。

在不斷的高速學習中,AI的預測能力就會越來越強,最終掌握程序員大數據歸總後的曲風,進而編寫出自己的曲子。人工神經網絡為從前的算法作曲提供了一種新的方式,其優勢在於能夠對音樂作品的全局性特徵進行學習,但是需採用大量的樣本進行訓練。當下國內外有許多基於該種算法所形成的人工智能作曲系統,如LSTM神經網絡,可以確保所創作音樂的完整性。


除了人工神經網絡,馬爾科夫鏈(Markov Chain)也一直被廣泛地應用於算法作曲領域。馬爾科夫鏈是一種隨機選擇過程,主要用於產生一段具有一定風格的旋律。就像按照一個特定的標準人為構造制定的轉換表來依次選擇音符,計算並選擇下一個要出現音符的可能性。


這種方法可以模擬作曲家創作音樂時的思維,來控制計算機生成相應的音樂作品,但是整部作品的曲式結構無法通過馬爾科夫鏈建模。遺傳算法(Genetic Algorithm)則是模仿生物進化過程的智能計算方法,使用適應性函數來演化樣本、優化全局。


其中,變異算子可以模擬人在其創作當中靈感的閃現,相當於留下最具代表性的作品來產生新的旋律。該算法的壁壘在於適應性函數的設計至今尚無統一標準。


ai创作再陷纷争 作品版权,到底归谁


版權的「暗礁」,依然是AI作曲要面臨的主要問題

由於AI音樂的產生是根據算法模型,讓計算機在大量現成作品中尋求「規律」,按照這些規律提取資料中特定的樂章片段,依據計算得出的概率重新進行排列組合,故人工智能作曲必然涉及到資料庫中大量現成作品的版權問題。

AI如何判斷研究人員提供的曲庫中哪些作品收到版權保護?AI作曲成果是否侵犯學習對象的版權?如AIVA最初以古典音樂為學習對象,它所使用的莫扎特、貝多芬等人的作品歷史久遠,版權時效已過,故沒有此類問題。


AIVA研發人員特意選擇古典音樂為其學習對象,主要就是為了避免版權問題。但像Travis Bott所用的Travis Scott人物及作品相關資料皆需取得授權,而Travis Bott在此基礎上創作的作品算不算對Travis Scott的抄襲?音樂作品抄襲的議題屢見不鮮,相關討論仍然不時出現,至今依然沒有統一、明確的判斷標準。從版權問題可見,現在的人工智能作曲技術依託於算法,受限於曲庫的音樂「規則」,還無法產生突破既有規律的作曲創意,此為AI作曲面臨的另一個技術難題。


即便AI作曲技術經過不斷優化,最終得以生產出純原創、不涉及任何侵權的作品,此作品又將面臨到版權認證的問題。隨着AI創作相關技術的成熟與普及,一些國家開始在法律上明確界定AI作品的版權歸屬。

1988年,英國正式頒布了《版權、設計和專利法案》(Copyright,Designs and Patents Act 1988),其中,對於計算機創作的內容進行了明確的規定:「為計算機所生成之作品進行必要程序者,視為該計算機生成之作品的作者,其保護期限是自作品完成創作之年的最後一日起50年後屆滿」。


規定AI作品的版權屬於「進行必要程序者」,同時也明確界定了對計算機生成作品「進行必要程序者」,即包括程序員、使用者,也可能是人工智能系統或設備的投資者。

2017年,世界知識產權組織(WIPO)雜誌提到:如果一部作品的創作過程中「人類的參與有限,或根本沒有人類參與」,著作權法可以有兩種潛在的生效方式--著作權法可以「拒絕」對計算機生成的作品進行版權保護,也可以將此類作品的作者歸屬於程序的創建者。現在國內解決此類問題也基本沿襲這個思路。


2018年,上海一家公司未經過授權,將騰訊開發的自動化編寫程序Dream writer生成的財務報告複製到該公司網站。深圳市南山區法院裁定,該公司因侵犯騰訊的版權而需承擔民事責任,向騰訊公司賠償1500元人民幣。


中國現行的《著作權法》尚未明確界定AI作品的版權歸屬,這一裁定可能是AI創作領域的重要里程碑。《著作權法》:「著作權是著作權法賦予民事主體對作品及相關客體所享有的權利。」其中,民事主體指公民、法人或非法人組織。《著作權法》保護的對象是作為民事主體的獨創性思想表達,並非民事主體的AI無法單獨享有著作權,但只要在作者名錄加上人類作曲家或研發者的名字就能解決此問題。人工智能雖無法成為受法律保護的主體,但對其作品版權的保護也開始受到法律認可。


人工智能伴侣虚拟机器人小冰的技术解读


沒有感情的輔助器-方舟的航向

人工智能作曲技術的日漸成熟,在音樂行業掀起一股不小的浪潮。儘管人工智能已經實現通過讀取、記憶大量樂曲獲取規律,計算音符節奏的出現概率並排列組合來「創造」音樂。但音樂的核心並非音樂本身而是「人」,音樂源於人類情感流動。


《禮記·樂記》對音樂起源的解釋非常貼切:「凡音之起,由人心生也。人心之動,物使之然也。感於物而動,故形於聲;聲相應,故生變;變成方,謂之音。」作曲家和演奏者透過旋律、節奏表達的情緒與觀眾聆聽音樂引起的共鳴,這種藉由音符實現的,跨越時間、空間與種族的情感交流才是音樂存在的意義,也是莫扎特、貝多芬等音樂家流芳百世的根本原因。


從某種角度來說,由於音樂是人類抒發心情的一種方式,讓沒有感情的人工智能作曲或許可以說是一個偽命題。人工智能不具備情感,不了解音符、節奏等音樂表層結構和基於情緒表達的音樂深層邏輯之對應關係,其製作的音樂只是基於概率所排列的音符。

無論算法作曲技術發展得多麼成熟,音樂作為人類情感交流的藝術形式之一,AI所作的樂曲必然無法完全取代人類音樂作品在社會中的功能和角色,人工智能也無法替代行業內頂尖的音樂創作者及表演者。不僅是音樂,在美術、文學等藝術創作中皆是如此。


現在較為成熟的AI音樂公司除了Google、Sony、AIVA外,還有英國的AI Musical、德國的Melodrive、美國的Humtap、Popgun、Snafu Records及諸多硅谷大亨聯合建立的人工智能非營利組織OpenAI、字節跳動旗下的Jukedeck等。

百度、騰訊、阿里、網易雲等音樂平台都在不同程度上對人工智能音樂有布局。

即便人工智能暫時無法掌握樂曲中細膩的情感變化及流動,但基於計算機具備對大量作品進行數據處理、運算分析及排列組合的強大能力,使得人工智能編曲效率遠遠高於人類。在一些注重成本且審美要求不高的應用場景中,AI作曲占有明顯的優勢。因此,一批專業度不足的音樂從業者可能面臨被淘汰的命運。


目前,人工智能作曲技術逐漸往商業應用與輔助創作的方向發展,「智能相對論」看到,其應用場景主要為視頻配樂、遊戲配樂、電視預告片、商業廣告、發布會和電影等方面。

以非藝術場景的商用音樂為主要市場,打破了固有音樂市場關於成本及創作時間的限制。

如上文提及的AIVA已開始為電影、視頻、電視劇製作音樂。微軟(亞洲)互聯網工程院開發的小冰樂隊能自動生成旋律和編曲框架,已為2020世界人工智能大會創作了主題曲《智聯家園》。


由西電灃東人工智能與類腦感知產業技術研究院研發的Muses人工智能作曲系統,基於GAN和LSTM的智能譜曲算法和視頻多元素提取算法,實現了視頻自助譜曲、智能仿曲和譜曲輔助智能等功能。

通過對視頻進行內容物體識別、色彩分析和畫面節奏分析,生成合適的背景音樂;也可透過用戶輸入的仿曲或關鍵詞、語句啟發音符,產生類似風格的音樂。另有一款專門製作視頻配樂的AI Ecrett Music,通過識別不同的視頻主題、時間及情緒,對視頻配樂進行個性化編輯,為視頻製作者持續產生不同的音律。為創意要求較低、對價格較敏感的部分商業音樂創作提供了全新解決方案。


人工智能可以作曲吗?


除此之外,人工智能作曲技術對音樂愛好者進行創作也起到了輔助作用。

2019年上線的「哼趣」APP就是一款基於人工智能的音樂創作工具,只需簡單哼唱,AI就會根據哼唱內容、音調、旋律生成一段完整的、悅耳的曲子,此外,還可對生成的曲子進行個性化編輯,一鍵選擇變換不同樂器、風格與時長。「哼趣」的核心原理是通過大量的樂曲訓練來形成一套完善的LSTM神經網絡的方式。


同時,算法團隊解決了MP3與MIDI格式的相互轉換和降噪問題,將人聲與機器可識別的MIDI語言進行轉化,再利用帶有音頻判定的神經網絡進行樂曲生成。

使用這類軟件或APP,不僅使得音樂創作更加便利快捷,也大大降低了普羅大眾創作音樂的門檻。對專業音樂人而言,比起原先需要通過MIDI鍵盤輸入旋律的創作形式,在很大程度上提升了工作效率,減少重複勞動,並降低了與製作方的溝通成本。人工智能作曲隨機生成的旋律也能在創作陷入瓶頸時,為使用者提供靈感,編曲工具的發展將使專業作曲家的創造力得到進一步釋放。


結語

AI作曲技術讓音樂產業鏈運作更有效率,人工智能創作的歌曲登上K-POP排行榜也許不再是天方夜譚。技術革新既是挑戰,也是機會。科技的進步促使人類在探索更多可能性的同時,也重新審視自己的價值。---(鈦媒體)

參考資料:

1. 周莉,鄧陽《人工智能算法作曲發展的現狀和趨勢研究》,《藝術探索》,2018年9月

2. 毛康,林勇《人工智能作曲發展的現狀探討》,《山西青年》,2019年7月

3. 機器之心《不會音樂也能作曲?AI開啟智能音樂創作》

4. 任夢岩《當AI開始作曲 還有啥不可能的?》

5. 中國新聞社《科班畢業,兩分鐘寫首歌......AI歌手來了,人類還能做什麼?》

6. 范正輝《在AI面前,Rapper要率先失業了?》

7. 木槿淺藏心《人工智能與音樂創作》