最近的AI歌手好厲害...我完全聽不出來是合成語音!! (Synthesizer V等合成語音討論串)

本文由 聰明的木頭2022-10-16 發表於 "錄音、MIDI、音樂製作" 討論區

  1. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    在自己開的討論裡自肥上傳自己的創作。
    額外提一下,不曉得是我沒找到用法還是本來就不支援,
    Synthesizer V在Piano roll裡剪下/複製音符時不會一併將Automation (Parameters) 帶走,
    Automation另外複製也就罷了,但剪下複製的時間軸卻又不會跟音符同步,
    這實在很麻煩…

    Synthesizer V Weina
    使用Synthesizer V的Gender功能把中文女聲Weina變成男聲,
    效果不錯,聲音還有點像我之前的主唱。
    歌詞打上去其實表現就差不多了,
    有些抑揚頓挫雖不合意,但不想深入研究怎麼調整就睜一只眼閉一隻眼
    所以我幾乎沒有什麼調整,也沒有太多心力慢慢調整,科技進步真好。

    類Speed Metal曲風。
    歌曲解說:
    https://chichengjuanhe.blogspot.com/2014/12/flameblade.html


    歌詞:
    Verse 1

    毀滅 我是毀滅的火燄
    燒盡世上的一切
    破壞 我是破壞的劍
    斬斷所有的是非

    Pre-Chorus
    在光影的交界之間
    看不到日月的光輝
    在過去與未來的狹縫之中
    等待約定之日的到來

    Chorus
    永不熄滅的火燄是傳承的血
    是身上灼熱的鮮血
    冰冷無情的長劍是輪迴的碑
    在永恆的盡頭 指引著下一個起點

    Verse 2
    生命 我是生命的火燄
    循環再生的輪迴
    守護 我是守護的劍
    擋下惡意的威脅
     
    Last edited: 2024-02-20
  2. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    在繼續自肥貼自己的創作前,
    先講講這幾天使用Synthesizer V處理第二首樂曲主唱的心得:
    • Automation沒有可觀測參考的數值。
      你得要用肉眼去辨識判斷Automation的量,這在音量控制上是個超級大麻煩。
      我這次匯出Wav進DAW才發現Verse 1跟Verse 2音量有微妙的差異,
      回頭去Synthesizer V內查才發現兩段音量Automation沒有完全校準,
      因為兩段Automation曲線不是完全一樣、不能用複製貼上,
      只好用老花眼盯著螢幕慢慢對、慢慢拉。

    • 最糟糕最惡劣的問題。
      我不知道在其他DAW上會不會發生、但Synthesizer V 在Ableton Live 11內會"自動儲存SVP檔案",
      這意味著只要在DAW內亂調、甚至刪除Synthesizer V內的音符,
      就算你沒有儲存當下的DAW Project跟Synthesizer V SVP,
      Synthesizer V仍會自動儲存最後的工作狀態,當你再次開啟DAW時就會發現檔案不一樣了,
      事實上我有幾次以為沒有儲存就沒事而做各種調整測試,結果重開Project才發現豬羊變色!!
      幸好檔案每天都有備份才沒有做白工,但也深感Synthesizer V這個極度惡劣的功能只會造成使用者的麻煩。
      不是很確定它自動儲存的時機,但推測是在DAW的Project要關閉時,
      而且不管你有沒有選在Host內儲存它都會自動儲存最後的工作狀態。

      建議各位在DAW內開啟Synthesizer V時最好先備份當下的SVP檔案,
      以免一個疏忽、費心耗時調整的檔案就被"自動儲存"給洗掉。

    -----------------------------------------------------------------------------------------

    自肥時間,一樣是Synthesizer V Weina轉男聲,類Speed Metal曲風。
    這次我留意到雖然轉男聲很好用,
    但有時很難避免原本女聲特有的抑揚頓挫出現,
    結果就是有些歌詞咬字發音很"中性"…這個真沒辦法處理。

    這次除了大幅微調音符時機、讓演唱不要太精準以外,
    也大量運用Synthesizer V的AI Retake功能來調整演唱音調,
    不過這個就跟擲骰子一樣很吃運氣,我曾一度試到六七十次都按不到想要的音色。

    由於歌曲的調太低,主歌Verse的演唱效果不甚理想。
    有試過調高八度,反而變太高連女聲都唱不好;
    改旋律則牽扯到整個歌曲的抑揚頓挫,掙扎了一下就放棄了…

    最後由於我這次重混音堅持不在錄音軟體DAW內拉音量Automation、也不用Compressor控制主唱音量,
    所以主唱無法避免地會有明顯音量大小不一的狀況。

    歌曲解說:
    https://chichengjuanhe.blogspot.com/2015/01/sword-of-conviction.html


    Lyrics:
    Chorus
    黑色的業火不停燃燒 淨化與生俱有的罪孽
    沒有人能公平審判那對與錯
    深淵之中貫徹我的正義

    Verse 1
    抹滅不去的烙印是你我的原罪
    自天地之始、從生命之源
    蠢蠢欲動的意識是心底的惡念
    在血肉之中、到骨髓深處

    Pre-Chorus
    無謂的爭戰殺伐 只枯萎了年華
    永無平靜的心 放任 荒蕪
    在混沌的世界裡 祭起斷罪的長劍

    Verse 2
    反覆無情的背叛是人心的隔閡
    如突來的風、似頃刻的雨
    漂泊不定的命運是無常的浮雲
    從虛空而來、往無盡處去

    Bridge
    罪 該如何判定
    彼此 都堅持真理
    歷史的軌跡 看不見正義
    不變的是 你和我手中血腥
     
    Last edited: 2024-02-20
  3. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    VoiSona推出三個音色庫:
    Pricing: Annual plan (Subscription-based): 6,600 JPY (6,000 JPY without tax), Monthly plan (Subscription-based): 880 JPY (800 JPY without tax)
    官網英文資訊:
    https://voisona.com/news_detail/55/
    各音色庫連結內的Demo似乎都是相對較舊的影片,我就不特別轉貼上來。
    VoiSona這家公司推出新產品時都不會特別製作新Demo影片…真的有打算推廣產品嗎?
    [​IMG]
     
  4. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    這邊講一下兩個我遇到的狀況,
    不確定是本來Synthesizer V程式設計的問題,還是我漏掉了什麼?
    但總之、這兩個狀況很蠢:
    1. 複製貼上時若有音符重複,Synthesizer V會將新的音符"覆蓋"在舊音符上、而不是取代。
      覆蓋的意思就是系統會判別成兩個獨立的音符在同一個位置上,
      基於Synthesizer V若有音符重疊就無法發聲的設計,
      意即你必須先刪除原有音符才能貼上新音符…這什麼史前時代的設計?

      萬一你貼上後沒注意就紀錄的話,
      要解決無聲現象、你就只能手動"一個一個"慢慢點重疊在上方的音符後刪掉,
      還不能Ctrl + A再按Delete刪除…

    2. 在Ableton Live 11內以Plugin使用時,
      Synthesizer V無法正確地辨別Tempo automation,
      我現在正在處理的樂曲有一段速度是從BPM 74加倍變成148,
      然後很神奇地Synthesizer V不是繼續往下播放、而是迴圈跳到前面某個小節,
      就算避開加速的部分、直接從同樣BPM 74的下一段開始播放,
      Synthesizer V卻又比樂曲快了十幾個小節…這…
      解決方式就是不要在DAW內使用Synthesizer V...爛死了。
    弄歌弄到一半不只主唱莫名迴圈對不準小節位置、還突然全部沒聲音,搞得我火都上來了…
     
  5. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    又到了自肥時間,新補上主唱的歌曲,一樣是Synthesizer V Weina轉男聲。
    慢板金屬曲風。
    身為作曲者,每首樂曲自然都是自己的傑作,
    不過這首歌在此次重製改寫後在我心中從"還不錯"變成了不會褪色的"名曲",
    聽起來有點誇飾,但我真的這麼認為…

    歌曲及歌詞解說:
    https://chichengjuanhe.blogspot.com/2015/01/red-moon.html


    Lyrics
    Verse 1
    命運就像看不見的繩索
    如蔓藤般緊緊纏繞著我
    狠狠地將我往前拖著走
    直到我淹沒在沙塵之中

    Verse 2
    生命就像無邊際的長河
    人活著像孤舟載浮載沉
    終其一生在迷網中度過
    掙脫不開那宿命的枷鎖

    Chorus 1&2
    我也想自由飛翔 凌雲騰空之上
    看那染血的翅膀 今夜又是悔恨與絕望

    Bridge
    這夢 已漸遠
    轉眼 被浪潮沖遠
    在這黑暗深淵 誰願與我共醉
    等待那未可知的明天

    Chorus 3
    我要捨棄這翅膀 只為重生的火光
    在寂靜的黑夜裡 只有紅色的月牙
    在未來永劫中放光芒
     
    Last edited: 2024-02-20
  6. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    這邊補充一個我剛剛才發現的兩個狀況。
    • 前面幾篇文章提到Synthesizer V內建的性別轉換功能 Gender 其實有個頗為嚴重的問題:
      使用Gender轉換後會在不特定字詞的發聲時伴隨類似機械人聲或者像是蛙鳴的聲音
      呃~聽起來就像星際大戰的Darth Vader那樣,
      因為這個聲音會被咬字壓過去,所以不注意聽不會發現,
      但轉成Wav後單獨聽就可以聽得相當清楚…
      沒用Gender就不會出現,但偏偏現在只有Gender後的聲音最適合我的樂曲…頭痛了。

      總之、目前有需要使用Gender功能的話,最好先做好心理準備,
      雖然混在樂器中就沒有那麼明顯,但畢竟還是存在。

    • 另一個就是匯出Wav聲音會變,就算是匯出32 bit floating 也一樣。
     
    Last edited: 2024-02-06
  7. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    前一篇提到Synthesizer V會不特定出現機械人聲 Darth Vader voice的問題,
    可以透過AI Retake暫時處理:
    1. 點選有問題的句子,使用AI Retake。
    2. 把AI Retake的新句子刪掉。
    3. 原本有機械人聲 Darth Vader voice問題的句子就會變得正常些。
    這個問題推測是聲音合成引擎的瑕疵,
    而且只要一旦句子在合成過程中出現機械人聲 Darth Vader voice,
    就算重新讀取SVP檔案、或者用AI Retake"以外"的調整,這個聲音都不會消失,
    只有用AI Retake讓聲音合成引擎主動重新計算才會修正。

    …過去已經匯出上傳的三首成品我不想再重弄了,只是虐待自己而已…

    另外、今天又發現一個很罕見的瑕疵,
    不知道什麼原因在固定句子前方會出現該句字首的發音,
    如:「曾經」這句話的一個小節前會莫名出現一兩次"cé",好像沒有有效的解決辦法?。

    …為啥什麼怪問題都給我遇到…
     
    Last edited: 2024-02-15
  8. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    補充幾個關於前面兩篇連續提到的機械人聲 Darth Vader voice的資訊:
    • 用AI Retake處理過後不一定要刪掉新的Retake才能讓舊檔案正常化,
      用Undo (Ctrl + Z) 回復上一動也可以有一樣的效果。
    • 即便用AI Retake處理過在極少部分字尾還是會有一點點機械人聲 Darth Vader voice,
      但基本上不是非常明顯、就算Wav單獨拉出來聽也不容易發覺。
    • 機械人聲 Darth Vader voice的成因可能跟Gender功能無關,
      我個人推測是同一個SVP檔修改越多次越容易出現

      因為我回去聽幾乎沒有什麼調整的第一首歌主唱音軌時,
      發現它幾乎沒有機械人聲 Darth Vader voice,三首歌裡面修改最多次的歌曲則剛好相反。
    大概就是這樣,在原廠沒有修改這個問題之前,
    各位如果有遇到機械人聲 Darth Vader voice,可以試試上面的方法。
     
    Last edited: 2024-02-14
  9. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    最近合成語音歌唱軟體都沒有甚麼大消息,所以我就繼續自肥貼自己的創作。
    搖滾曲風,是新補上主唱的舊作,一樣為Synthesizer V Weina轉男聲。

    這次補上主唱後的感想…世界級名曲 (笑)。
    至少在我心中這必須要是世界級名曲才對得起當初因為錄這首歌而壞掉的左手,
    及為了摸索復健方法而蹉跎掉的十年光陰…
    但憑心而論這首歌真的不錯,不管是不是樂手,
    我想在任何領域上出現中年危機、停滯不前的人多少都有這首歌所描寫的心境吧。

    歌曲及歌詞解說:
    https://chichengjuanhe.blogspot.com/2015/01/next-to.html


    Lyrics
    Verse 1
    曾經熱血沸騰 夢想在世界的頂端
    現在疲憊不堪 世界在夢裡才有吧

    Pre-Chorus
    何時 遠離了戰場
    忘卻 靈魂的羈絆

    Chorus 1
    我們還能揮霍多久屬於我們的青春
    在世界將我們淹沒以前
    用盡力氣在半空中 擺動 直到墜落
    想飛

    Verse 2
    時光不停流轉 澎湃的衝動已不再
    並肩同行的人 轉眼剩模糊的容顏

    Chorus 2
    他們早就回到地表努力安穩地生活
    讓現實將歲月掩埋消失
    隨波逐流在淺海中 漂送 失了方向
    暈眩 模糊的眼光看不見理想....

    Chorus 3
    我們還能揮霍多久屬於我們的青春
    在世界將我們淹沒以前
    用盡力氣在半空中 擺動 直到墜落
    想飛 染血的翅膀能否再飛翔
    染血的翅膀能否再飛翔
    就讓那翅膀再次地飛翔
     
    Last edited: 2024-02-21 , 5:34 上午
  10. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    Synthesizer V跟DAW的相容性不佳似乎是普遍現象。
    有位日本人因為Logic崩潰,從Logic自動備份檔中找回Project時,
    發現不僅Project內的Synthesizer V檔案、連SVP來源的備份資料夾也跟著Logic崩潰而被刪除:
    https://x.com/yu_5_3_/status/1758013739553702361

    這個狀況我推測跟我之前遇到的差不多,
    就是Synthesizer V會自動跟被拉進DAW內的SVP檔案同步,
    任何在DAW內做的改變、即便你沒有存檔、Synthesizer V仍會自動同步紀錄。
    所以建議各位:
    • 不要在DAW內編輯Synthesizer V,
      把樂曲匯出後放進Synthesizer V內編輯會安全許多。
    • 一定要在DAW內編輯Synthesizer V的話,請先異地備份Synthesizer V檔案。
     
  11. 聰明的木頭

    聰明的木頭 Well-Known Member

    註冊日期:
    2004-10-24
    文章:
    10,414
    讚:
    3,021
    VoiSona的英文女聲"Chis-A [tʃíːseɪ]"推出version "2.0",
    除原有的付費訂閱制以外也提供買斷版:下載版13,200 JPY (12,000 JPY without tax)。
    https://voisona.com/news_detail/60/


    另外Vocaloid 6也釋出6.3.1a版,並追加MICHELLE, LUCAS兩個英文語言:
    https://www.vocaloid.com/en/news/support_27/

    順帶一提、我從前面幾篇開始就一直在講的Synthesizer V瑕疵:機械人聲 Darth Vader voice,
    我注意到在複製貼上音符後就會開始出現,
    不曉得是不是複製貼上導致語言合成引擎出錯?
     

分享此頁面