跳转到内容

引導影像濾波器:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
Nivekin留言 | 贡献
InternetArchiveBot留言 | 贡献
补救3个来源,并将0个来源标记为失效。) #IABot (v2.0.8.6
 
(未显示14个用户的18个中间版本)
第1行: 第1行:
{{vfd|关注度不足, 已掛模版30天|date=2015/08/03}}
{{multiple issues|
{{expand|time=2015-07-02T03:25:44+00:00}}
{{expand|time=2015-07-02T03:25:44+00:00}}

{{notability|time=2015-07-02T03:25:44+00:00}}
{{unreferenced|time=2015-07-02T03:25:44+00:00}}
}}
{{TA
{{TA
|G1=Math
|G1=Math
第15行: 第11行:
在[[圖像處理]]上,'''引導影像濾波器'''({{lang-en|Guided Image Filter}})是一種能使影像[[平滑]]化的非線性濾波器。
在[[圖像處理]]上,'''引導影像濾波器'''({{lang-en|Guided Image Filter}})是一種能使影像[[平滑]]化的非線性濾波器。


與[[雙邊濾波器]](Bilateral Filter)相同,這個影像[[濾波器]]同樣能夠在清楚保持影像邊界的情況下,達到讓影像平滑的效果。
與[[雙邊濾波器]](Bilateral Filter)相同,這個影像[[濾波器]]同樣能夠在清楚保持影像邊界的情況下,<ref name=ref1>[http://www.ncbi.nlm.nih.gov/pubmed/26285153 Gradient Domain Guided Image Filtering.] {{Wayback|url=http://www.ncbi.nlm.nih.gov/pubmed/26285153 |date=20160921210746 }} {{Doi|10.1109/TIP.2015.2468183}}</ref>達到讓影像平滑的效果。


但不同於雙邊濾波器,引導影像濾波器有兩個優點:首先,雙邊濾波器有非常大的[[計算複雜度]],但引導影像濾波器因為並未用到過於複雜的數學計算,有[[線性]]的計算複雜度。再來,雙邊濾波器因為數學模型的緣故,在某些時候會發生[[梯度反轉]]([[gradient reverse]])的狀況,出影像失真;而在引導影像濾波器,因為這個濾波器在數學上以線性組合為基礎出發,輸出圖片(Output Image)必與引導圖片(Guidance Image)的梯度方一致,並不會出現梯度反轉的問題。
但不同於雙邊濾波器,引導影像濾波器有兩個優點:首先,雙邊濾波器有非常大的[[計算複雜度]],但引導影像濾波器因為並未用到過於複雜的數學計算,<ref name=ref1/>有[[線性]]的計算複雜度。再來,雙邊濾波器因為數學模型的緣故,在某些時候會發生[[梯度反轉]](gradient reverse)的狀況,出影像失真;而在引導影像濾波器,因為這個濾波器在數學上以線性組合為基礎出發,輸出圖片(Output Image)必與引導圖片(Guidance Image)的梯度方一致,並不會出現梯度反轉的問題。


==原理==
==原理==


為了達到將影像平滑化、即去除雜訊的效果,我們首先定義輸出的結果圖片是輸入圖片減去雜訊後的結果;同時,為了讓輸出的圖片符合引導圖片的影像邊界,我們將輸出圖片定為引導圖片的線性組合。
為了達到將影像平滑化、即去除雜訊的效果,首先定義輸出的結果圖片是輸入圖片減去雜訊後的結果;同時,為了讓輸出的圖片符合引導圖片的影像邊界,將輸出圖片定為引導圖片的線性組合。


以下為引導影像濾波器的機處模型:
以下為引導影像濾波器的基礎模型:




第34行: 第30行:




定義為[[線性組合]](Linear Combination)的原因在於,一物件的邊界與其[[梯度]](Gradient)相關,而在線性組合的定義下,輸出圖片之梯度必與引導圖片之梯度成對比([[微分]]時高冪次係數保留而常數項則被去除),故可以達到保留梯度的效果、保留影像邊界的目的。
定義為[[線性組合]](Linear Combination)的原因在於,一物件的邊界與其[[梯度]](Gradient)相關,而在線性組合的定義下,輸出圖片之梯度必與引導圖片之梯度成對比[[微分]]時高冪次係數保留而常數項則被去除),故可以達到保留梯度的效果、保留影像邊界的目的。


為了導出上述線性組合的參數,將(1)及(2)相減得到公式(3);同時,定義一個代價方程式([[cost function]])(4):
為了導出上述線性組合的參數,將(1)及(2)相減得到公式(3);同時,定義一個代價方程式([[cost function]])(4):
第44行: 第40行:




在上式中, <math>\epsilon</math> 是一用來懲罰(penalize)過大的 <math>a_{k}</math> 的參數, <math>\omega_{k}</math> 是以第 <math>k</math> 個像素為中心點的[[窗格]](window)
在上式中, <math>\epsilon</math> 是一用來懲罰(penalize)過大的 <math>a_{k}</math> 的參數, <math>\omega_{k}</math> 是以第 <math>k</math> 個像素為中心點的[[窗格]](window)


在這個方程式中可以看到,我們希望同時讓最終的輸出圖片做到讓雜訊減少以及讓引導圖片在輸出圖片的影響減小(引導圖片的係數項)兩件事,遂定義每個像素雜訊和係數項的平方總合為我們的最後須付出的[[價值]]項(cost)。並
在這個方程式中可以看到,希望同時讓最終的輸出圖片做到讓雜訊減少以及讓引導圖片在輸出圖片的影響減小引導圖片的係數項兩件事,遂定義每個像素雜訊和係數項的平方總合為最後須付出的[[價值]]項(cost)。並且,基於讓價值項最小化的原則,可以將(4)以[[線性回歸]](linear regression)的方法找出它的[[線性]]模型,從而求得、使得出它的價值方程式有最小解的到以下兩參數 <math>a_{k}</math> 和 <math>b_{k}</math>:

且,基於讓價值項最小化的原則,我們可以將(4)以[[線性回歸]](linear regression)的方法找出它的[[線性]]模型,從而求得、使得出它的價值方程式有最小解的到以下兩參數 <math>a_{k}</math> 和 <math>b_{k}</math>:




第56行: 第50行:




在這裡, <math>\mu_{k}</math> 和 <math>\sigma^{2}_{k}</math> 分別是引導圖片 <math>I</math> 在窗格 <math>\omega_{k}</math> 的[[平均數]](mean)和[[標準差]](variance),而 <math>\bar{p}_{k} = \frac{1}{\left|\omega\right|}\sum_{i\epsilon\omega_{k}}p_{i}</math> 是在窗格 <math>\omega_{i}</math> 中像素的平均值;這兩項係數,換句話說,即是一以輸入圖片為考慮計算權重之平均濾波器([[weighted mean]])
在這裡, <math>\mu_{k}</math> 和 <math>\sigma^{2}_{k}</math> 分別是引導圖片 <math>I</math> 在窗格 <math>\omega_{k}</math> 的[[平均數]](mean)和[[標準差]](variance),而 <math>\bar{p}_{k} = \frac{1}{\left|\omega\right|}\sum_{i\epsilon\omega_{k}}p_{i}</math> 是在窗格 <math>\omega_{i}</math> 中像素的平均值;這兩項係數,換句話說,即是一以輸入圖片為考慮計算權重之平均濾波器(weighted mean)


==演算法==
==演算法==


依據上式,我們可以列出此濾波器之演算法:
依據上式,可以列出此濾波器之演算法:




第71行: 第65行:
第一部分
第一部分
<math>mean_{I}</math> = <math>f_{mean}(I)</math>
<math>mean_{I}</math> = <math>f_{mean}(I)</math>
<math>mean_{p}</math> = <math>f_{mean}(I)</math>
<math>mean_{p}</math> = <math>f_{mean}(p)</math>
<math>corr_{I}</math> = <math>f_{mean}(I.*I)</math>
<math>corr_{I}</math> = <math>f_{mean}(I.*I)</math>
<math>corr_{Ip}</math> = <math>f_{mean}(I.*p)</math>
<math>corr_{Ip}</math> = <math>f_{mean}(I.*p)</math>


第二部分
第二部分
<math>var_{I}</math> = <math>corr_{I} - meat_{I.} * mean_{I}</math>
<math>var_{I}</math> = <math>corr_{I} - mean_{I.} * mean_{I}</math>
<math>cov_{Ip}</math> = <math>corr_{Ip} - meat_{I.} * mean_{p}</math>
<math>cov_{Ip}</math> = <math>corr_{Ip} - mean_{I.} * mean_{p}</math>


第三部分
第三部分
<math>a</math> = <math>cov_{Ip}./(var_{I} + \epsilon)</math>
<math>a</math> = <math>cov_{Ip}./(var_{I} + \epsilon)</math>
<math>b</math> = <math>mean_{p} - a. * mean+{I}</math>
<math>b</math> = <math>mean_{p} - a. * mean_{I}</math>


第四部分
第四部分
第90行: 第84行:
<math>q</math> = <math>mean_{a.} * I + mean_{b}</math>
<math>q</math> = <math>mean_{a.} * I + mean_{b}</math>


/*<math>f_{mean}</math> 是一個有線性計算複雜度的平均濾波器(mean filter)*/
/*<math>f_{mean}</math> 是一個有線性計算複雜度的平均濾波器(mean filter)*/


==特性==
== 特性 ==
* 邊界保留過濾 (Edge-Preserving Filtering)
引導影像濾波器保留邊界的特性,其實也可以被理解為是保留梯度的特性。由下圖可以看到,可以將一張圖分為細節圖層和基底圖層兩層,基底圖層的能量並無小幅的升降,只有大幅諸入梯度的能量升降;而細節圖層,只有雜訊式的小幅能量升降。而引導影像濾波器所作的,其實就是將細節層和基底層分離並保留基底層,也就是保留梯度而去除雜訊,達到平滑效果


具體而言,可以通過引導影像濾波器的參數<math>\epsilon</math>定義什麼是“平坦區塊(patch)”或“高變化區塊”。若一個區塊的[[變異數]](variance)遠低於參數<math>\epsilon</math>,其通過濾波器後將被平滑;反之,變異數遠高於<math>\epsilon</math>的區塊將被視為邊界而被保留。[[雙邊濾波器]]中的範圍方差(range variance)參數<math>\sigma_r^2</math>的功能和引導影像濾波器的<math>\epsilon</math>相似。它們都定義了怎麼樣的區塊應該被平滑,而怎樣的區塊應該被保留。
引導圖片濾波器保留邊界的特性,其實也可以被理解為是保留梯度的特性。由下圖我們可以看到,我們可以將一張圖分為細節圖層和基底圖層兩層,基底圖層的能量並無小幅的升降,只有大幅諸入梯度的能量升降;而細節圖層,只有雜訊式的小幅能量升降。

而引導圖片濾波器所作的,其實就是將細節層和基底層分離並保留基底層,也就是保留梯度而去除雜訊,大到平滑效果。
* 梯度保留過濾 (Gradient-Preserving Filtering)
使用雙邊濾波器過濾圖片時,經常會在邊界處出現梯度翻轉[[Artifact_(計算機)|偽像]]。這是因為像素值在這些地方變化地很劇烈。這些偽像通常難以被避免,因為不論是任何圖片經常都會包含邊界。

引導影像濾波器在避免梯度反轉方面表現地較佳。此外,在某些情況下,甚至可以確保必定不會發生梯度反轉的現象。

* 結構轉移過濾 (Structure-Transferring Filtering)
由於局部線性模型<math>q = aI + b</math>的線性組合特性,這讓引導影像濾波器擁有可以將引導圖像<math>I</math>的結構轉換至演算法輸出<math>q</math>。這個特性使得一些特殊的濾波應用成為可能,如:feathering、matting以及dehazing等。


==延伸功能==
==延伸功能==


由引導圖片濾波器的特性,我們可以延伸出除了原先的平滑化外的幾項功能
由引導圖片濾波器的特性,可以延伸出除了原先的平滑化外的幾項功能


===細節加強===
===細節加強===


當一影像圖同時為輸出圖片和引導圖片時,可知我們最終得到的會是以該圖片的邊界為依據的基底層和細節層;因此,若要加強依影像之細節,我們可以將細節層的能量放大n倍後再次疊加回基底層,以達到增強細節的效果。
當一影像圖同時為輸出圖片和引導圖片時,可知最終得到的會是以該圖片的邊界為依據的基底層和細節層;因此,若要加強依影像之細節,可以將細節層的能量放大n倍後再次疊加回基底層,以達到增強細節的效果。


===深度圖修整===
===深度圖修整===


無論是利用[[光場]](light field])技術或是[[焦點合成]](focal-stack)所製作的[[深度圖]](depth map),在出製作完成時往往都會有一些[[坑洞]](holo);而這時若使用引導影像濾波器,以原始影像為引導圖片、以深度圖為輸入圖片,便可得到一完整、無坑洞的深度圖。
無論是利用[[光場]](light field)技術或是[[焦點合成]](focal-stack)所製作的[[深度圖]](depth map),在出製作完成時往往都會有一些[[坑洞]](holo);而這時若使用引導影像濾波器,以原始影像為引導圖片、以深度圖為輸入圖片,便可得到一完整、無坑洞的深度圖。

== 實作 ==

* 官方[[MATLAB]]中實作了引導影像濾波器 <ref>{{Cite web |url=https://www.mathworks.com/help/images/ref/imguidedfilter.html |title=存档副本 |access-date=2020-07-03 |archive-date=2022-01-03 |archive-url=https://web.archive.org/web/20220103080911/https://www.mathworks.com/help/images/ref/imguidedfilter.html |dead-url=no }}</ref>
* 官方[[OpenCV]]中實作了引導影像濾波器 <ref>{{Cite web |url=https://docs.opencv.org/master/da/d17/group__ximgproc__filters.html#ga86813d59f8452a9600e979c6287805f5 |title=存档副本 |access-date=2020-07-03 |archive-date=2021-02-25 |archive-url=https://web.archive.org/web/20210225201619/https://docs.opencv.org/master/da/d17/group__ximgproc__filters.html#ga86813d59f8452a9600e979c6287805f5 |dead-url=no }}</ref>

==參考文獻==
{{Reflist}}
*[https://books.google.com.tw/books?id=MPrFBAAAQBAJ&pg=PA1&dq=Guided+Image+Filter&hl=zh-TW&sa=X&ved=0ahUKEwjBreCpzMbKAhWEJ6YKHaYOA2oQ6AEIODAC#v=onepage&q=Guided%20Image%20Filter&f=false Computer Vision -- ECCV 2010: 11th European Conference on Computer ..., 第 1 篇]
[[Category:非線性濾波器]]
[[Category:图像处理]]
[[Category:计算机图形学]]

2022年2月1日 (二) 01:04的最新版本

圖像處理上,引導影像濾波器(英語:Guided Image Filter)是一種能使影像平滑化的非線性濾波器。

雙邊濾波器(Bilateral Filter)相同,這個影像濾波器同樣能夠在清楚保持影像邊界的情況下,[1]達到讓影像平滑的效果。

但不同於雙邊濾波器,引導影像濾波器有兩個優點:首先,雙邊濾波器有非常大的計算複雜度,但引導影像濾波器因為並未用到過於複雜的數學計算,[1]線性的計算複雜度。再來,雙邊濾波器因為數學模型的緣故,在某些時候會發生梯度反轉(gradient reverse)的狀況,出現影像失真;而在引導影像濾波器,因為這個濾波器在數學上以線性組合為基礎出發,輸出圖片(Output Image)必與引導圖片(Guidance Image)的梯度方向一致,並不會出現梯度反轉的問題。

原理

[编辑]

為了達到將影像平滑化、即去除雜訊的效果,首先定義輸出的結果圖片是輸入圖片減去雜訊後的結果;同時,為了讓輸出的圖片符合引導圖片的影像邊界,將輸出圖片定為引導圖片的線性組合。

以下為引導影像濾波器的基礎模型:


(1)  

(2)  


在上述公式中,是第i個輸出的像素是第i個輸入的像素,是第i個輸入像素的雜訊成分,是第i個引導圖片的像素,則是用來衡量輸入權重的參數。


定義為線性組合(Linear Combination)的原因在於,一物件的邊界與其梯度(Gradient)相關,而在線性組合的定義下,輸出圖片之梯度必與引導圖片之梯度成對比(微分時高冪次係數保留而常數項則被去除),故可以達到保留梯度的效果、保留影像邊界的目的。

為了導出上述線性組合的參數,將(1)及(2)相減得到公式(3);同時,定義一個代價方程式(cost function)(4):


(3)  

(4)  


在上式中, 是一用來懲罰(penalize)過大的 的參數, 是以第 個像素為中心點的窗格(window)。

在這個方程式中可以看到,希望同時讓最終的輸出圖片做到讓雜訊減少以及讓引導圖片在輸出圖片的影響減小(引導圖片的係數項)兩件事,遂定義每個像素雜訊和係數項的平方總合為最後須付出的價值項(cost)。並且,基於讓價值項最小化的原則,可以將(4)以線性回歸(linear regression)的方法找出它的線性模型,從而求得、使得出它的價值方程式有最小解的到以下兩參數


(5)  

(6)  


在這裡, 分別是引導圖片 在窗格 平均數(mean)和標準差(variance),而 是在窗格 中像素的平均值;這兩項係數,換句話說,即是一以輸入圖片為考慮計算權重之平均濾波器(weighted mean)。

演算法

[编辑]

依據上式,可以列出此濾波器之演算法:


Algorithm 1. 引導圖片濾波器

輸入: 輸入圖片 ,引導圖片 ,窗格半徑 ,修正項

輸出: 輸出圖片

第一部分

 = 
 = 
 = 
 = 

第二部分

 = 
 = 

第三部分

 = 
 = 

第四部分

 = 
 = 

第五部分

 = 

/* 是一個有線性計算複雜度的平均濾波器(mean filter)*/

特性

[编辑]
  • 邊界保留過濾 (Edge-Preserving Filtering)

引導影像濾波器保留邊界的特性,其實也可以被理解為是保留梯度的特性。由下圖可以看到,可以將一張圖分為細節圖層和基底圖層兩層,基底圖層的能量並無小振幅的升降,只有大振幅諸入梯度的能量升降;而細節圖層,只有雜訊式的小振幅能量升降。而引導影像濾波器所作的,其實就是將細節層和基底層分離並保留基底層,也就是保留梯度而去除雜訊,達到平滑效果。

具體而言,可以通過引導影像濾波器的參數定義什麼是“平坦區塊(patch)”或“高變化區塊”。若一個區塊的變異數(variance)遠低於參數,其通過濾波器後將被平滑;反之,變異數遠高於的區塊將被視為邊界而被保留。雙邊濾波器中的範圍方差(range variance)參數的功能和引導影像濾波器的相似。它們都定義了怎麼樣的區塊應該被平滑,而怎樣的區塊應該被保留。

  • 梯度保留過濾 (Gradient-Preserving Filtering)

使用雙邊濾波器過濾圖片時,經常會在邊界處出現梯度翻轉偽像。這是因為像素值在這些地方變化地很劇烈。這些偽像通常難以被避免,因為不論是任何圖片經常都會包含邊界。

引導影像濾波器在避免梯度反轉方面表現地較佳。此外,在某些情況下,甚至可以確保必定不會發生梯度反轉的現象。

  • 結構轉移過濾 (Structure-Transferring Filtering)

由於局部線性模型的線性組合特性,這讓引導影像濾波器擁有可以將引導圖像的結構轉換至演算法輸出。這個特性使得一些特殊的濾波應用成為可能,如:feathering、matting以及dehazing等。

延伸功能

[编辑]

由引導圖片濾波器的特性,可以延伸出除了原先的平滑化外的幾項功能

細節加強

[编辑]

當一影像圖同時為輸出圖片和引導圖片時,可知最終得到的會是以該圖片的邊界為依據的基底層和細節層;因此,若要加強依影像之細節,可以將細節層的能量放大n倍後再次疊加回基底層,以達到增強細節的效果。

深度圖修整

[编辑]

無論是利用光場(light field)技術或是焦點合成(focal-stack)所製作的深度圖(depth map),在出製作完成時往往都會有一些坑洞(holo);而這時若使用引導影像濾波器,以原始影像為引導圖片、以深度圖為輸入圖片,便可得到一完整、無坑洞的深度圖。

實作

[编辑]
  • 官方MATLAB中實作了引導影像濾波器 [2]
  • 官方OpenCV中實作了引導影像濾波器 [3]

參考文獻

[编辑]
  1. ^ 1.0 1.1 Gradient Domain Guided Image Filtering.页面存档备份,存于互联网档案馆doi:10.1109/TIP.2015.2468183
  2. ^ 存档副本. [2020-07-03]. (原始内容存档于2022-01-03). 
  3. ^ 存档副本. [2020-07-03]. (原始内容存档于2021-02-25).