Date post: | 01-Jan-2016 |
Category: |
Documents |
Upload: | vitalis-kiril |
View: | 18 times |
Download: | 3 times |
1
Complexity Scalability Design in the Internet
Low Bit Rate Codec(iLBC) for Speech Coding
In: IEICE Trans. Information and Systems, vol. E93-D, no. 5, pp.1238-1243, May. 2010.
F.K. CHEN ,K.B. KUO speaker: 許仕
衡2012/5/15
2
Outline
1.Introduction2. Internet Low Bit Rate Codec(iLBC)3.Complexity scalability design
4.Performance Analysis5.Conclusion
3
1. Introduction(1/2) Internet Low Bit Rate Codec(iLBC)
iLBC 規格 音框模式 : 20ms 、 30ms 傳輸率 : 15.2Kbps 、 13.33kbps 音框長度 : 160 點、 240 點 子區間數量 : 4 、 6
iLBC 是現今網路通訊軟體” Skype” 的編碼核心之一,因為他可以改善在網路傳輸中,當封包遺失時的語音品質。
4
1. Introduction(2/2) Internet Low Bit Rate Codec(iLBC)
但因為 iLBC 計算複雜度較高,所以只能在高階手機或是電腦執行,因此提出了各種簡化計算複雜度的方法,來降低編碼的計算量。
5
2.iLBC(1/8) iLBC 語音編碼器,類似 ITU 和 MPEG 標準,
都是先執行 LPC 分析,求出殘值訊號。
iLBC 使用了 2 種方式建立 LPC 係數 : differential pulse code modulation(DPCM) dynamic codebook
6
2.iLBC(2/8) DPCM 對初始訊號編解碼,解碼出來的來
當作初始的碼簿,並使用 3 stages 碼簿搜尋進行編碼。
動態碼簿包含 4 種碼簿可供搜尋 base-codebook expanded-codebook augmented base-codebook augmented expanded-codebook
7
2.iLBC(3/8) 更新碼簿的過程
先找出最小的加權誤差值
為了避免同時決定最佳的 g(m) 、 C(i) ,所以採用了 shape-gain vector quantization ,求最大正規畫的相似度
8
2.iLBC(4/8) shape-gain vector quantization
optimal gain
9
2.iLBC(5/8) 利用 R(i) 的結果,進行碼簿更新與下一階
段目標向量的更新 在 iLBC 標準裡,不同的搜尋範圍所使用到
的碼簿不一樣
10
2.iLBC(6/8) 對目標向量做更新動作
每個子區塊的碼簿更新完後,對基礎碼簿做更新動作
11
2.iLBC(7/8) iLBC 計算量分佈圖
12
2.iLBC(8/8) 在 iLBC 標準中,但在 IETF 標準文件中建議,
在搜尋 expanded-codebook 時,可以只搜尋base-codebook 中,所搜尋出的最佳位置附近前後 K 個位置
K=17 計算量變為原始的 31.8%~34.2%
13
3.Complexity scalability design(1/4)
對內積作分割成 S 段
Es(m)可以靠累加出來,但是累加的順序無
法改變
14
3.Complexity scalability design(2/4)
所以在這裡給他一個 pilot 函數來給定累加順序
15
3.Complexity scalability design(3/4)
目標訊號和相應的 pilot 函數在 S=8 的例子
16
3.Complexity scalability design(4/4)
給定了 pilot 函數,可以把公式修改成,本篇論文稱為 complexity scalability iLBC
(CS-iLBC)
17
4.Performance Analysis(1/5)
在 Complexity scalability design裡,比較了設定不同 N/S 區的 MOS-LQO平均數值、 ND(%) 、 Std of ND 、 Complexity
其中 ND(%)
18
4.Performance Analysis(2/5)
20ms
19
4.Performance Analysis(3/5)
30ms
20
4.Performance Analysis(4/5)
20ms modle
21
4.Performance Analysis(5/5)
30ms modle
22
5.Conclusion(1/1)
MOS-LQO 客觀評估衰減百分比,略低於原始語音品質,但計算量下降了 15%~95% 區間
經過了修改後的方法,計算量降低了,因此能在手機上發揮最佳效能。