- 相關(guān)推薦
小波轉(zhuǎn)換影像壓縮模式之研究
摘要
由於在現(xiàn)今資訊流通普遍的社會中,影像的需求量越來越大,影像的數(shù)位化是必然的趨勢。然而在數(shù)位化過的影像所占的資料量又相當(dāng)龐大,在傳輸與處理上皆有所不便。將資料壓縮是最好的方法。如今有一新的模式,在壓縮率及還原度皆有不錯的表現(xiàn),為其尚未有一標(biāo)準(zhǔn)的格式,故在應(yīng)用上尚未普及。但在不久的未來,其潛力不可限量。而影像之於印刷有密不可分的關(guān)系。故以此篇文章介紹小波(WAVELET)轉(zhuǎn)換的歷史淵源。小波轉(zhuǎn)換的基礎(chǔ)原理,F(xiàn)今的發(fā)展對印刷業(yè)界的沖擊。影像壓縮的未來的發(fā)展。
壹、前言
由於科技日新月異,印刷已由傳統(tǒng)印刷走向數(shù)位印刷。在數(shù)位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當(dāng)?shù)馁M(fèi)時,現(xiàn)今個人擁有True Color的視訊卡、24-bit的全彩印表機(jī)與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實(shí)自然,更要搭配多媒體或動畫。但是相對的高畫質(zhì)視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經(jīng)地義的事,但是用網(wǎng)路傳個640X480 True Color圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業(yè)在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數(shù)學(xué)家與資訊理論學(xué)者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實(shí):壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現(xiàn)鋸齒狀的現(xiàn)象。皆會造成印刷輸出的問題。影像壓縮技術(shù)是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉(zhuǎn)路轉(zhuǎn),科學(xué)家便將注意力移轉(zhuǎn)到WAVELET轉(zhuǎn)換法,結(jié)果不但發(fā)現(xiàn)了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論。小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點(diǎn),又能克服其不足之處?蛇_(dá)到完全不失真,壓縮的比率也令人可以接受。由於其數(shù)學(xué)理論早在1960年代中葉就有人提出了,而到現(xiàn)在才有人將其應(yīng)用於實(shí)際上,其理論仍有相當(dāng)大的發(fā)展空間,而其實(shí)際運(yùn)用也屬剛起步,其後續(xù)發(fā)展可說是不可限量。故研究的動機(jī)便由此而生。
貳、 WAVELET的歷史起源
WAVELET源起於Joseph Fourier的熱力學(xué)公式。傅利葉方程式在十九世紀(jì)初期由Joseph Fourier (1768-1830)所提出,為現(xiàn)代信號分析奠定了基礎(chǔ)。在十九到二十世紀(jì)的基礎(chǔ)數(shù)學(xué)研究領(lǐng)域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續(xù)圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規(guī)范正交基。其後1984年,法國地球物理學(xué)J. Morlet在分析地震波的局部性質(zhì)時,發(fā)現(xiàn)傳統(tǒng)的傅利葉轉(zhuǎn)換,難以達(dá)到其要求,因此引進(jìn)小波概念於信號分析中,對信號進(jìn)行分解。隨後理論物理學(xué)家A.Grossman對Morlet的這種信號根據(jù)一個確定函數(shù)的伸縮,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展開的可行性進(jìn)行了研究,為小波分析的形成開了先河。
1986年,Y. Meyer建構(gòu)出具有一定衰減性的光滑函數(shù)Ψj,k(x),其二進(jìn)制伸縮與平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構(gòu)成L2(R)的規(guī)范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構(gòu)了小波函數(shù)的構(gòu)造及信號按小波轉(zhuǎn)換的分解及重構(gòu)。1988年Daubechies建構(gòu)了具有正交性(Orthonormal)及緊支集(Compactly Supported);及只有在一有限區(qū)域中是非零的小波,如此,小波分析的系統(tǒng)理論得到了初步建立。
三、 WAVELET影像壓縮簡介及基礎(chǔ)理論介紹
一、 WAVELET的壓縮概念
WAVELET架在三個主要的基礎(chǔ)理論之上,分別是階層式邊碼(pyramid coding)、濾波器組理論(filter bank theory)、以及次旁帶編碼(subband coding),可以說wavelet transform統(tǒng)合了此三項(xiàng)技術(shù)。小波轉(zhuǎn)換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應(yīng)用於編碼、解碼、檢測邊緣、壓縮數(shù)據(jù),及將非線性問題線性化。良好的分析局部的時間區(qū)域與頻率區(qū)域的信號,彌補(bǔ)傅利葉轉(zhuǎn)換中的缺失,也因此小波轉(zhuǎn)換被譽(yù)為數(shù)學(xué)顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經(jīng)由數(shù)學(xué)公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關(guān))。以較少的資料代替原來的資料,達(dá)到壓縮資料的目的,這種經(jīng)由取舍資料而達(dá)到壓縮目地的作法,是近代數(shù)位影像編碼技術(shù)的一項(xiàng)突破。即是WAVELET的概念引入編碼技術(shù)中。
WAVELET轉(zhuǎn)換在數(shù)位影像轉(zhuǎn)換技術(shù)上算是新秀,然而在太空科技早已行之有年,像探測衛(wèi)星和哈柏望遠(yuǎn)鏡傳輸影像回地球,和醫(yī)學(xué)上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現(xiàn)的效果。
以往lossless的編碼法只著重壓縮演算法的表現(xiàn),將數(shù)位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。 將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài),控制解碼後影像的品質(zhì),選擇適當(dāng)?shù)木幋a法,而且還在擷取圖形資料時,先幫資料「減肥」。如此才是WAVELET編碼法主要的觀念。
二、 影像壓縮過程
原始圖形資料 →
色彩模式轉(zhuǎn)換 → DCT轉(zhuǎn)換 → 量化器 → 編碼器 → 編碼結(jié)束
三、 編碼的基本要素有三點(diǎn)
(一) 一種壓縮/還原的轉(zhuǎn)換可表現(xiàn)在影像上的。
(二) 其轉(zhuǎn)換的系數(shù)是可以量化的。
(三) 其量化的系數(shù)是可以用函數(shù)編碼的。
四、 現(xiàn)有WAVELET影像壓縮工具主要的部份
(一) Wavelet Transform(WAVELET轉(zhuǎn)換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二) Filters(濾鏡):這部份包含Wavelet Transform,和一些著名的壓縮方法。
(三) Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內(nèi)插量化,對編碼的架構(gòu)有一定的影響。
(四) Entropy Coding(熵編碼器):有兩種格式,一種是使其減少,一種為內(nèi)插。
(五) Arithmetic Coder(數(shù)學(xué)公式):這是建立在Alistair Moffat's linear time coding histogram的基礎(chǔ)上。
(六) Bit Allocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、 WAVELET影像壓縮未來的發(fā)展趨勢
一、 在其結(jié)構(gòu)上加強(qiáng)完備性。
二、 修改程式,使其可以處理不同模式比率的影像。
三、 支援更多的色彩?梢蕴幚鞷GB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、 加強(qiáng)運(yùn)算的能力,使其可支援更多的影像格式。
五、 使用WAVELET轉(zhuǎn)換藉由消除高頻率資料增加速率。
六、 增加多種的WAVELET。如:離散、零元樹等。
七、 修改其數(shù)學(xué)編碼器,使資料能在數(shù)學(xué)公式和電腦的位元之間轉(zhuǎn)換。
八、 增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、 增加8X8格的DCT模式,使其能重疊。
十、 增加trellis coding。
十一、 增加零元樹。
現(xiàn)今已有由中研院委托國內(nèi)學(xué)術(shù)單位研究,也有不少的研究所的碩士論文發(fā)表。國外更是如火如荼的展開研究。相信實(shí)際應(yīng)用於實(shí)務(wù)上的日子指日可待。
伍、 影像壓縮研究的方向
1. 輸入裝置如何捕捉真實(shí)的影像而將其數(shù)位化。
2. 如何將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài)。
3. 如何控制解碼影像的品質(zhì)。
4. 如何選擇適當(dāng)?shù)木幋a法。
5. 人的視覺系統(tǒng)對影像的反應(yīng)機(jī)制。
小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點(diǎn),又能克服其不足之處。
陸、 在印刷輸出的應(yīng)用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續(xù)發(fā)展?jié)摿o窮,尤其在網(wǎng)路出版方面,其利用價值更高,WAVELET的出現(xiàn)就猶如當(dāng)時的JPEG出現(xiàn),在影像的領(lǐng)域中掀起一股旋風(fēng),但是WAVELET卻有JPEG沒有的優(yōu)點(diǎn),JPEG乃是失真壓縮,且解碼後復(fù)原程度有限,能在網(wǎng)路應(yīng)用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點(diǎn)必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數(shù)位印刷上。等到WAVELET的應(yīng)用成熟,再發(fā)展其適用的RIP,又是一段時間以後的事了。
在網(wǎng)路出版上已經(jīng)有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網(wǎng)路上大量使用,應(yīng)該是未來的趨勢。對於網(wǎng)路出版應(yīng)該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網(wǎng)路的使用費(fèi)用,增加企業(yè)的利潤,由於傳版的時間減少,也使印刷品在當(dāng)?shù)赜∷⒌目赡苄栽龈,減少運(yùn)費(fèi),減少開支,提高時效性,創(chuàng)造新的商機(jī)。
柒、 結(jié)論
WAVELET的理論并不是相當(dāng)完備,但是據(jù)現(xiàn)有的研究報告顯現(xiàn),到普及應(yīng)用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學(xué)領(lǐng)域上,均有其應(yīng)用價值。國內(nèi)已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現(xiàn)。這也顯示國內(nèi)的研究速度,遠(yuǎn)落在外國的後面,國外已成立不少相關(guān)的網(wǎng)站,國內(nèi)僅有少數(shù)的相關(guān)論文。如此一來國內(nèi)要使這種壓縮模式普及還有的等。正式使用於印刷業(yè)更是要相當(dāng)時間。不過對於網(wǎng)路出版仍是有相當(dāng)大的契機(jī),國內(nèi)仍是可以朝這一方面發(fā)展的。站在一個使用其成果的角度,印刷業(yè)界也許并不需要去了解其高深的數(shù)理理論。但是在運(yùn)用上,為了要使用方便,和預(yù)估其發(fā)展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進(jìn)者有一參考的依據(jù),也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻(xiàn):
1.
Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實(shí)作(上), 峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實(shí)作(下), 峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(shù)(二)圖檔壓縮續(xù)篇,旗標(biāo)出版有限公司。
5.盧永成,民八十七年,使用小波轉(zhuǎn)換及其在影像與視訊編碼之應(yīng)用,私立中原大學(xué)電機(jī)工程學(xué)系碩士學(xué)位論文。
6.江俊明,民八十六年,小波分析簡介,私立淡江大學(xué)物理學(xué)系碩士論文。
7.曾泓瑜、陳曜州,民八十三年,最新數(shù)位訊號處理技術(shù)(語音、影像處理實(shí)務(wù)),全欣資訊圖書。
附錄:
嵌入式零元樹小波轉(zhuǎn)換、 階層式嵌入式零元樹小 波轉(zhuǎn)換、階層式影像傳送 及漸進(jìn)式影像傳送
目前網(wǎng)路最常用的靜態(tài)影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現(xiàn)象最常發(fā)生在利用網(wǎng)路連結(jié)WWW網(wǎng)站時,我們常常都是先接收到文字後,其網(wǎng)頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網(wǎng)路嚴(yán)重塞車,圖形只顯示一點(diǎn)點(diǎn)後就要再等非常久的時間才再有一點(diǎn)點(diǎn)顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網(wǎng)路資源的浪費(fèi)。此缺點(diǎn)之改善,可以使用嵌入式零元樹小波轉(zhuǎn)換(EZW)來完成。
階層式影像傳送系統(tǒng)的主要功能為允許不同規(guī)格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設(shè)計不同的編碼器配合利用之,進(jìn)而增加了其應(yīng)用的 范圍,及減低了所架設(shè)系統(tǒng)的復(fù)雜度,也可以節(jié)省更多的設(shè)備費(fèi)用。利用Shapiro所提出的嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)來設(shè)計階層式影像傳送系統(tǒng)時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術(shù)所設(shè)計的編碼器是根據(jù)影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術(shù)來加以克服之,但是該技術(shù)對於同一影像以不同解析度獨(dú)立編碼時,將使得共同的低通次頻帶(Lowpass Subband)被重復(fù)的編碼與傳送,而產(chǎn)生了相當(dāng)高的累贅(Redundancy)。
基於上述情況,有人將嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)加以修改之,完成了一個新式的階層式影像傳送系統(tǒng)。該技術(shù)為階層式嵌入的零元樹小波轉(zhuǎn)換(Layered Embedded Zerotree Wavelet,簡稱 LEZW技術(shù)。這個技術(shù)使我們所設(shè)計出來的階層式影像傳送系統(tǒng),可以在編碼傳送前預(yù)先指定圖層數(shù)目、每層影像的解析度與碼率。
LEZW技術(shù)是將EZW技術(shù)中的連續(xù)近似量化(SAQ)加以延伸應(yīng)用之,而EZW傳統(tǒng)的做法是將SAQ應(yīng)用於全部的小波轉(zhuǎn)換系數(shù)上。然而在LEZW技術(shù)中,從基層(Base Layer)開始SAQ一次僅用於一個 圖層(Layer)的編碼,直到最高階析度的圖層為止。當(dāng)編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結(jié)果應(yīng)用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設(shè)計階層式影像傳送系統(tǒng)。
LEZW技術(shù)也可以應(yīng)用於漸進(jìn)式傳送,對於一個漸進(jìn)式影像傳送系統(tǒng)而言,控制其解析度將可以改善重建影像的視覺品質(zhì)。而常用的漸進(jìn)式傳送方法有使用向量量化器或零元樹資料結(jié)構(gòu)編碼演算法則。但是向量量化器需要較大的記憶體及對與傳送中的錯誤敏威,而利用EZW技術(shù)所設(shè)計的漸進(jìn)式影像傳送系統(tǒng),可以改善這些缺點(diǎn),所以享有較好的效能。但是它也有缺點(diǎn)就是,應(yīng)用於漸進(jìn)式傳送時是根據(jù)全解析度來做編碼及傳送,因此在低碼率的限制之下時,若用全解析度來顯示影像將使得影像模糊不清。所以在低碼率傳送時的影像以較低的解析度來顯示時,則可以使影像的清晰度有所改善。
所以將LEZW技術(shù)延伸至漸進(jìn)式傳送,在編碼之前可以先設(shè)定每一級(Stage)的解析度與傳送每一級所累加的碼率(Accumulated Rate),然後再編碼與傳送之。該系統(tǒng)在低碼率時用低解析度來顯示影像,在較高碼率時則以高解析度來顯示影像,將改善漸進(jìn)式傳送的視覺品質(zhì)。此系統(tǒng)在編碼傳送的過程中,允許傳送的位元流在任一點(diǎn)位置被中斷停止,而接收端可以由所接收到的資料,將影像重建在資料中斷時的解析度下。
漸進(jìn)式影像傳送與階層式影像傳送的設(shè)計方法是相似的,只不過在傳送方法上兩者有相當(dāng)大的不同。在階層式影像傳送系統(tǒng)中,所有圖層的資料是平行的一起傳送出去的。而漸進(jìn)式影像傳送則是以級對級(Stage-by-Stage)的方式傳送的。因此,利用LEZW技術(shù)所設(shè)計的漸進(jìn)式傳送可看做是單一圖層(Single-Layer)系統(tǒng),其解析度與傳送都是可以控制的。如此網(wǎng)路資源的浪費(fèi),便可得到某種程度上的解決。
【小波轉(zhuǎn)換影像壓縮模式之研究】相關(guān)文章:
臺資模式與溫州模式之碰撞08-12
信息服務(wù)模式研究08-05
電視大眾文化研究視角的轉(zhuǎn)換08-05
舞蹈:長河之波連天涌08-05
噪聲圖像的分形壓縮編碼研究08-06
學(xué)生安全教育模式研究07-30