當下,說唱文化正逐漸在中國流行起來。 去年夏天《中國有嘻哈》播出以來,社交網站上的話題幾乎都被它包圓了,以至于今年要播出的第二季還未見蹤影,就已經引爆了觀眾的期待感。 《中國有嘻哈》把說唱歌曲這類小眾文化帶到更廣泛的人群面前。但對于普通用戶來說,比起流行歌曲,“說唱”顯然更有難度:節奏、押韻,說唱文化中的嘻哈態度都讓人望而卻步。 但是最近,人工智能好像為我們解決了一部分難關。 在百度7月4日舉辦的AI開發者大會上,百度副總裁沈抖攜說唱歌手孫八一,發布了一款名為“愛說唱”的智能小程序:用戶只需選擇背景音樂,然后隨便說出一段話,就可自動生成一段堪比專業的RAP歌曲。 人人皆可RAP?聽上去很吸引人。作為人工智能的新嘗試,愛說唱獲得了不少目光,畢竟沒有freestyle也沒問題了。那么,還有哪些人工智能已經在樂壇上出道了? 今天小貝就帶大家來盤點一下那些AI歌姬們。 初音未來、洛天依 說起“虛擬偶像”,幾乎所有的宅友們腦海中跳出的第一個名字便是“初音未來”,作為世界上第一個舉辦演唱會的虛擬歌手,世界第一公主殿下的名號可以說是響徹云霄。 初音未來,是2007年由Yamaha的VOCALOID系列語音合成程序為基礎開發的虛擬少女偶像。 對,你沒有看錯,這個蔥色雙馬尾辮的少女的締造者,是雅馬哈。說到雅馬哈,估計大家腦子里首先跳出來的會是: 事實上,看起來“不務正業”的雅馬哈產品還包括鋼琴、電子琴、數碼鋼琴、等樂器,音效芯片、XG聲卡、影音處理機器、系統處理機器、專業音響機器、半導體至電子產品、防音工程及高爾夫球用品都屬于業務范圍之內。 總之,就是讓你彈雅馬哈、聽雅馬哈、用雅馬哈、打雅馬哈.... 我整個人都雅馬哈了 事實上,看起來“不務正業”的雅馬哈除了生產摩托車以外,還是世界上最大的音樂樂器的生廠商,其中就包括了音樂合成器。2004年,雅馬哈開發了電子音樂制作語音合成軟件核心引擎VOCALOID,就是初音未來和她的中國風妹妹洛天依的核心。 根據目前主流的語音合成方式,Vocaloid采用的是“拼接合成”技術,使用者可以通過輸入歌詞和音符的方式直接生成歌曲,而歌曲的基礎聲音數據則來自于配音演員。 如果需要創作一首新的曲子,使用者需要規劃歌詞和音調,編輯歌詞和音調。并且可以更改每一個音符,對生成的"唱詞"進行各項微調,包括呼吸力度、口的開合甚至顫音,通過這些調整,就可令原本破碎的聲音數據變為連貫的類人電子聲音。 采用這種方式來創作,可以實現對歌曲最精確的控制,但另一方面,也很需要作者調整各項參數的功力。 微軟小冰 不同于初音未來這種天生歌姬,微軟小冰是半路出家,唱歌的原理也不一樣——虛擬歌手需要錄制好的聲音庫,再通過重新拼接聲音庫中的片段形成歌曲;而小冰唱歌是根據輸入的信號做出發聲的反應,也就是機器學習。 如今的小冰已經更新到了第四代,在音調、音質、自然度、銜接上都有了極大的改進,此外又加上了換氣的聲音和人類的演唱技巧,大大提高了演唱的自然度。 佐藤莎莎拉 佐藤莎莎拉是由基于HMM合成技術的聲音創作軟件CeVIO Creative Studio創造的虛擬歌姬,因其酷似真人的聲音,被粉絲稱為站立在現實和動畫的交界處的女主角。 CeVIO Creative Studio采用的算法在本質上與VOCALOID的"拼接算法"不同,HMM合成通過提取人聲中的特征量建模,可以最大程度保留人聲的特征,經過后期可以與VOCALOID媲美甚至更加接近人聲,在聲音的擬真度上可以說也并不遜于今天的小冰。 在某種意義上,虛擬歌姬和小冰都是利用技術降低了藝術創作的門檻,但根本性的不同在于對這一問題的回答: 科技在藝術創作中應該扮演什么樣的角色? 顯而易見的是,小冰所代表的無疑是一個激進的科技派:利用科技的發展降低、乃至消除藝術創作的門檻,讓技術引導人類的進步。 而Vocaloid方面,盡管YAMAHA公司也一直在不斷探索前沿的語音合成技術,在音樂創作上采取的卻是最為傳統的姿態:提供一個樂器,但將創作的自由完全歸還給創作者。 這種態度最大程度上回歸了藝術的本源:人的自我表達,但另一方面,也在客觀上保留了創作的門檻。在Vocaloid的圈子里,真正創造價值的仍然是創作者本身,在這里,技術讓位于了人類。 當然,以小冰的人工智能水平,我們并不需要討論“人工智能威脅論”之類的東西,但現實的問題確實擺在眼前:在藝術創作領域,“大眾”、“簡便”的工業化生產似乎已經近在咫尺,而這種流水線生產真的就能完全取代專業而精密的調教了嗎?對于創作者而言,“藝術創作”究竟是怎樣一種行為,而對于觀眾們來說,他們欣賞藝術作品時,希望接收到的又是什么呢? 小貝認為,藝術創作所賦予觀眾乃至社會的,并不是簡單地文字優美、曲調生動,而應該是一種來自于現實社會的思想。 標貝科技 ? 音領智能未來 專注于智能語音交互 提供智能語音整體解決方案和數據服務 |