專題摘要  
  生
活無時無刻都伴隨著聲音,隨著科技日新月異,音訊處理在科技發展中漸漸占重要的地位。自古至今,歌唱一直是人們表達情緒的一種管道,因此本專題運用MATLAB為平台,以人聲為樂器,MIDI音樂為樣本,將語音處理與歌唱做結合。首先錄製一段語音,進行區段的切割並做訊號頻譜上的分析,了解其基頻與有無聲判斷,再讀取MIDI音樂的拍速、音符、音長等資訊,最後將錄製的人聲合成出一首MIDI檔的旋律,只需一段人聲,唱歌也能成為一件輕鬆簡單的事。



研究方向

  本專題實驗以人聲為樂器,哼奏出MIDI檔中音樂旋律。為了要哼奏出每個音符來完成音樂的演奏,首先得從語音訊號處理著手。

    在做合成音樂之前,要先了解一些音訊資訊並做前置處理。一開始先找出最有效的求取基頻方式,並分析語音訊框基頻頻率;為了消除錄音時的靜音部分,我們要選擇一種辨識Voice/Unvoice訊框的方法;再來就是使用HNM將分析好的基頻合成其他的音調;除此之外,因為是要合成MIDI音樂檔,所以我們先要對MIDI音樂檔取出拍速、音符、音長等資訊做分析。等這些步驟都完成後,才開始做合成音樂的研究。

     最後我們也會針對幾項研究時會發生的問題做研究改善,例如自相關函數(Auto correlation function, ACF)對頻譜解析度不足所造成的基頻位置誤差,因此得對基頻頻率進行修正;合成語音FrameFrame間相位問題,訊框間相位不連續處容易產生雜音或爆音,可對Frameoverlap降低此問題的發生;合成音自然度不足為TTS(Text-To-Speech)最常見的問題,我們可以加入類雜訊方式可改善語音品質。