Optimal Adaptive Voice Smoother for New Generation VoIP Services

 

摘要

 

VoIPs是目前新興技術之一,可以在IP寬頻網路上提供高品質的即時性語音服務。針對VoIP服務而言,感受到的語音品質的好壞常是VoIP提供服務是否成功的一項重點,然而VoIPIP網路的傳輸過程中,常常會被一些延遲效應所造成的播放不連續或因傳送過程中所遺失的一些封包而降低語音品質的表現。針對這個問題,在網路接收端提供播放緩衝器可以補償在網路中傳輸所造成的延遲效應與減緩延遲所造成的遺失封包對語音品質的破壞,並可在此中找到最佳緩衝器大小來提供最好的語音播放品質。可調式的緩衝器可以根據網路的參數來動態調整緩衝器大小,可以有效的解決播放語音品質破壞。所以這篇論文中發展了一些有效且能夠明顯改善聽到的語音品質的動態可調式緩衝區演算法,可最佳化語音的播放品質。文中首先建立線上即時的網路封包延遲遺失模型並利用Lagrange MultiplierITU-T E-Model的演算法來調整緩衝區大小來最佳化語音播放品質,不同於其他論文所提出的演算法,我們所建立的緩衝器很容易適用在各種不同的語音編解碼器,而且都屬於低複雜度的演算法。當可調式緩衝區被建立之後,我們發現在傳送端與接收端之間的同步變的十分重要,因為當傳送端時脈快於接收端時,經過長時間傳輸會造成接收端的緩衝區會總是處於溢滿狀態,所以我們發展出緩衝區重新同步的演算法,來避免緩衝區溢滿的情形。最後的模擬實驗可以驗證我們發展的動態可調式緩衝區演算法對於語音播放品質有很重大的改善。

 

Key words:      Adaptive voice smoother, VoIP, buffer re-synchronization, delay/loss trade off, E-model