1 #LyX 1.5.7 created this file. For more info see http://www.lyx.org/
7 \usepackage[final]{graphicx}
13 \font_typewriter default
14 \font_default_family default
20 \paperfontsize default
28 \paperorientation portrait
40 \paragraph_separation indent
42 \quotes_language swedish
45 \paperpagestyle default
46 \tracking_changes false
54 \begin_layout Standard
55 \begin_inset Include \input{bc_start.tex}
69 \begin_layout Standard
70 <Představení práce, motivace a přehled obsahu kapitol.>
74 Vývoj a principy fraktálové komprese obrazu
77 \begin_layout Subsection
81 \begin_layout Standard
82 Základy fraktálové komprese byly položeny v druhé polovině 80.\InsetSpace ~
84 studoval systémy iterovaných funkcí (IFS).
85 IFS je množina bodů v\InsetSpace ~
86 úplném metrickém prostoru definována pomocí souboru
87 kontraktivních zobrazení prostoru do sebe.
88 Mějme soubor zobrazení
89 \begin_inset Formula $f_{i}:X\rightarrow X$
93 \begin_inset Formula $i\in J$
96 a definujme jejich sjednocení
97 \begin_inset Formula $f:2^{X}\rightarrow2^{X}$
101 \begin_inset Formula $f\left(A\right)=\left\{ f_{i}\left(a\right)\mid i\in J,\ a\in A\right\} $
105 \begin_inset Formula $2^{X}$
108 je značena množina všech podmnožin
109 \begin_inset Formula $X$
114 \begin_inset Formula $2^{X}$
117 lze definovat metriku tak, abychom dostali zase úplný metrický prostor
119 \begin_inset Formula $f$
126 \begin_layout Standard
127 ukázáno například v\InsetSpace ~
129 \begin_inset LatexCommand cite
134 pomocí Hausdorffovy metriky
140 To spolu s\InsetSpace ~
141 Banachovou větou o\InsetSpace ~
142 pevném bodě dává, že zobrazení
143 \begin_inset Formula $f$
146 má právě jeden pevný bod, kterým je právě hledaná množina bodů, často nazývaná
147 atraktor nebo fraktál
151 \begin_layout Standard
152 fraktály lze konstruovat i jinými způsoby než pomocí IFS
160 \begin_layout Standard
161 IFS mají několik zajímavých vlastností.
162 Pro získání atraktoru stačí znát zobrazení
163 \begin_inset Formula $f$
166 a iterovat ho na libovolné neprázdné kompaktní podmnožině
167 \begin_inset Formula $X$
171 Navíc vzniklé fraktály můžou mít detailní kresbu při libovolném přiblížení,
172 přestože jejich matematický popis je velmi malý.
173 Mezi nejznámější IFS patří Barnsleyho kapradina, generovaná v
174 \begin_inset Formula $\mathbb{R}^{2}$
177 pomocí čtyř afinních zobrazení.
178 Barnsley zkoumal, zda by nebylo možné proces obrátit\InsetSpace ~
181 najít soubor zobrazení, jehož pevný bod by obrázku byl velmi blízký.
185 \begin_layout Standard
186 Zde se používá takzvaná kolážová věta, uvedená například v\InsetSpace ~
188 \begin_inset LatexCommand cite
193 , která dává horní odhad na odchylku atraktoru od požadovaného obrázku:
195 \begin_inset Formula \[
196 f\mbox{ je zobrazení, které je kontraktivní s faktorem }s<1\mbox{ v metrice }d\mbox{, pak}\]
201 \begin_inset Formula \[
202 d\left(A,\lim_{n\rightarrow\infty}f^{n}\left(A\right)\right)\;\le\;\frac{1}{1-s}\, d\left(A,f\left(A\right)\right)\]
206 Díky tomu stačí hledat zobrazení, která obrázek transformují a přitom ho
211 \begin_layout Standard
212 triviální identické zobrazení sice vždy zkonverguje, ale jinak samozřejmě
213 fungovat nebude, nesplňuje předpoklad kontraktivity
219 Pro jistotu konvergence dokonce stačí, že
220 \begin_inset Formula $\exists k\ f^{k}$
223 je kontraktivní s faktorem
224 \begin_inset Formula $s<1$
228 Ukázalo se, že největší problém je v\InsetSpace ~
229 tom, že na rozdíl od klasických IFS
230 málokterý obrázek lze charakterizovat jako sjednocení několika transformovaných
231 zmenšenin celého obrázku.
232 Bylo sice možné obrázek rozdělit na menší kusy charakterizované IFS, ale
233 tuto metodu se nepodařilo zautomatizovat.
236 \begin_layout Subsection
240 \begin_layout Standard
241 Pro kompresi obrázků také bylo nutné najít lepší model, než množinu bodů
244 \begin_inset Formula $\mathbb{R}^{2}$
249 možností reprezentace obrázků ve stupních šedi je funkce tvaru
250 \begin_inset Formula $g:I^{2}\rightarrow I$
254 \begin_inset Formula $I$
257 je značení pro interval
258 \begin_inset Formula $\left[0,1\right]\subset\mathbb{R}$
262 Zde budeme analogicky hledat soubor operátorů takový, aby jejich sjednocením
264 \begin_inset Formula $F$
268 pevným bodem co nejblíže danému obrázku (jeho funkci).
269 Aby bylo zaručeno, že sjednocení lze provést, v\InsetSpace ~
270 PIFS (partitioned IFS) je
271 prostor obrázku rozdělen na disjunktní části
272 \begin_inset Formula \[
273 \forall i\in J\quad R_{i}\subset I^{2},\qquad\bigcup_{i\in J}R_{i}=I^{2},\qquad\forall i,j\in J\quad i\neq j\rightarrow R_{i}\cap R_{j}=\emptyset\]
277 a operátory jsou tvaru
278 \begin_inset Formula $F_{i}:\left(I^{2}\rightarrow I\right)\rightarrow\left(R_{i}\rightarrow I\right)$
284 \begin_layout Standard
285 PIFS, které zavedl Jacquin, dnes tvoří základ naprosté většiny technik pro
286 fraktální kompresi obrazu.
287 Pro zjednodušení se zde uvažují pouze afinní operátory, kde se navíc vzájemně
288 neovlivňuje transformace polohy s\InsetSpace ~
289 transformací barvy, formálně
290 \begin_inset Formula \[
291 F_{i}g=h_{i},\qquad h_{i}:R_{i}\rightarrow I,\qquad h_{i}\left(\left[\begin{array}{c}
293 y\end{array}\right]\right)=\left(c_{i}\circ g\circ w_{i}\right)\left(\left[\begin{array}{c}
295 y\end{array}\right]\right)\]
300 \begin_inset Formula \[
301 \mbox{pro nějaká afinní zobrazení\quad}w_{i}:R_{i}\rightarrow I^{2}\mbox{\quad a\quad}c_{i}:I\rightarrow\mathbb{R}\]
315 \begin_inset Formula $R_{i}$
318 se volí souvislé části obrazu, typicky čtverce o\InsetSpace ~
320 \begin_inset Formula $2^{k}$
324 nazývají se cílové bloky.
326 \begin_inset Formula $w_{i}$
330 \begin_inset Formula $D_{i}=w_{i}\left(R_{i}\right)$
333 také souvislé části obrazu a nazývají se zdrojové bloky.
337 \begin_layout Standard
347 značení pochází z\InsetSpace ~
381 \begin_inset Formula $w_{i}$
384 určuje, která část obrazu bude zobrazena do cílového bloku a také jak bude
385 otočena a případně symetricky převrácena.
387 \begin_inset Formula $w_{i}$
390 se volí kontraktivní zobrazení, přestože to pro níže uvedené tvrzení o\InsetSpace ~
395 \begin_layout Subsubsection
399 \begin_layout Standard
400 Pro konvergenci a horní odhad chyby PIFS modelu lze zase použít kolážovou
402 Následující důkaz je modifikací důkazu uvedeného v\InsetSpace ~
404 \begin_inset LatexCommand cite
411 \begin_inset Formula \[
412 d_{sup}\left(g_{1},g_{2}\right)=\sup_{\vec{z}\in I^{2}}\left\{ \left|g_{1}\left(\vec{z}\right)-g_{2}\left(\vec{z}\right)\right|\right\} \]
426 \begin_inset Formula $\exists s<1\;\forall i\in J\; c_{i}$
430 \begin_inset Formula $a_{i}:\;\left|a_{i}\right|\le s$
434 \begin_inset Formula $g_{1},g_{2}:I^{2}\rightarrow I\quad$
438 \begin_inset Formula $\forall\vec{z}\in I^{2}\quad\exists!i\in J\quad\vec{z}\in R_{i}\quad$
442 \begin_inset Formula \[
443 \left|\left(F_{i}g_{1}\right)\left(\vec{z}\right)-\left(F_{i}g_{2}\right)\left(\vec{z}\right)\right|\quad\le\quad s\left|\left(g_{1}\circ w_{i}\right)\left(\vec{z}\right)-\left(g_{2}\circ w_{i}\right)\left(\vec{z}\right)\right|\quad\leq\quad s\, d_{sup}\left(g_{1},g_{2}\right)\]
447 Z toho už plyne kontraktivita celého operátoru
448 \begin_inset Formula $F:\; d_{sup}\left(Fg_{1},Fg_{2}\right)\;\le\; s\, d_{sup}\left(g_{1},g_{2}\right)$
451 a díky tomu lze použít kolážovou větu.
454 \begin_layout Standard
455 Ukazuje se ale, že pro použití v\InsetSpace ~
456 implementaci je tento odhad příliš volný,
457 stejně jako použitá metrika nedává dobré vizuální výsledky.
460 \begin_layout Subsubsection
464 \begin_layout Standard
475 \begin_inset Formula $R_{i}$
478 se volí afinní zobrazení
479 \begin_inset Formula $w_{i}$
482 tak, aby mapovalo blok na jeden ze souboru zdrojových bloků, který bývá
483 pevně daný kvůli zjednodušení ukládání a vyhledávání.
484 Tato volba je hlavním zdrojem výpočetní složitosti celé komprese a jejímu
485 urychlení byla věnována značná část výzkumu v oblasti.
486 Obecně je snaha zvolit takový zdrojový blok
487 \begin_inset Formula $D_{i}$
490 , že spolu s\InsetSpace ~
491 optimálním barevným zobrazením
492 \begin_inset Formula $c_{i}$
495 bude pro složený operátor
496 \begin_inset Formula $F_{i}g=\left(c_{i}\circ g\circ w_{i}\right)$
500 \begin_inset Formula $d\left(\ c_{i}\circ g\circ w_{i},\ g\ \right)$
522 \begin_inset Formula $R_{i}$
528 \begin_layout Standard
529 Volba optimálního zobrazení
530 \begin_inset Formula $c_{i}$
533 a tedy i následně volba
534 \begin_inset Formula $w_{i}$
537 je silně závislá na použité metrice.
538 Ve fraktální kompresi se téměř výhradně používá RMSE metrika (zde uvedena
540 nebvyklé spojité podobě):
541 \begin_inset Formula \[
542 d_{RMSE}\left(g_{1},g_{2}\right)=\sqrt{\frac{\iintop_{R_{i}}\left[g_{1}\left(x,y\right)-g_{2}\left(x,y\right)\right]^{2}\,\mathrm{d}x\mathrm{\, d}y}{\iintop_{R_{i}}\,\mathrm{d}x\mathrm{\, d}y}}\]
546 Její hlavní výhody i nevýhody jsou dány tím, že se vždy berou v\InsetSpace ~
548 sobě odpovídající body
549 \begin_inset Formula $g_{1}\left(x,y\right)$
553 \begin_inset Formula $g_{2}\left(x,y\right)$
557 To umožnuje velmi jednoduchou a rychlou práci s\InsetSpace ~
558 metrikou a také optimalizaci
560 ní, na druhou stranu díky tomu pro větší bloky nedává metrika výsledky
561 odpovídající vizuálnímu rozdílu.
564 \begin_layout Standard
565 Při použití RMSE existuje právě jedno
569 \begin_layout Standard
570 platí za předpokladu, že
571 \begin_inset Formula $g\circ w_{i}$
575 \begin_inset Formula $R_{i}$
580 \begin_inset Formula $g$
584 \begin_inset Formula $D_{i}$
588 -- jinak by se jednalo o\InsetSpace ~
589 aproximaci konstantním blokem, volba lineárního
590 koeficientu by byla libovolná a výsledek vždy horší, než při výběru jakéhokoliv
591 nekonstantního zdrojového bloku
597 \begin_inset Formula $c_{i}$
601 \begin_inset Formula $g$
605 \begin_inset Formula $w_{i}$
608 ) snadno spočítat analyticky.
609 Podrobnosti jsou pro diskrétní případ rozebrány v\InsetSpace ~
610 části <odkaz na kapitolu
615 \begin_layout Subsubsection
619 \begin_layout Standard
620 Fraktálová komprese v\InsetSpace ~
621 této podobě stále trpěla jedním skrytým problémem.
622 Při dodržení kontraktivity všech zobrazení
623 \begin_inset Formula $c_{i}$
626 kolážová věta sice zaručovala, že obrázek zkonverguje a nebude se příliš
627 lišit, ale nijak neomezovala počet nutných iteračních kroků.
628 Ukázalo se, že tento problém není jen teoretický\InsetSpace ~
630 při přísnějších omezeních
631 na kontraktivitu bylo pro některé obrázky nutné provádět mnoho desítek
632 iterací než změny přestaly být okem viditelné.
635 \begin_layout Standard
636 Řešení tohoto problému bylo publikováno v\InsetSpace ~
638 \begin_inset LatexCommand cite
643 a podrobněji rozebráno v\InsetSpace ~
645 \begin_inset LatexCommand cite
651 Jedná se jen o\InsetSpace ~
652 drobnou modifikaci barevného zobrazení.
653 Pokud bylo původní optimální barevné zobrazení ve tvaru
654 \begin_inset Formula $c_{i}\left(z\right)=p_{i}\, z+q_{i}$
658 \begin_inset Formula $p_{i}$
662 \begin_inset Formula $q_{i}$
666 \begin_inset Formula $p_{i}$
669 a průměrná barva bloku
670 \begin_inset Formula $R_{i}$
674 Nové zobrazení pak znormalizuje barvu zdrojového bloku
675 \begin_inset Formula $D_{i}$
678 odečtením jeho aktuálního průměru, výsledek vynásobí lineárním koeficienem
680 \begin_inset Formula $p_{i}$
683 a přičte předpočítanou průměrnou barvu bloku
684 \begin_inset Formula $R_{i}$
690 \begin_layout Standard
691 Formálně bude zobrazení vypadat
692 \begin_inset Formula \[
693 \bar{c_{i}}\left(z\right)=p_{i}\left(z-\frac{\iintop_{D_{i}}\bar{g}\left(x,y\right)\,\mathrm{d}x\mathrm{\, d}y}{\iintop_{D_{i}}\,\mathrm{d}x\mathrm{\, d}y}\right)+\frac{\iintop_{R_{i}}g\left(x,y\right)\,\mathrm{d}x\mathrm{\, d}y}{\iintop_{R_{i}}\,\mathrm{d}x\mathrm{\, d}y}\mbox{,}\]
698 \begin_inset Formula $g$
701 značí vstupní obrázek a
702 \begin_inset Formula $\bar{g}$
705 právě dekódovaný obrázek z\InsetSpace ~
707 Je důležité, že zatímco druhý zlomek je uložený v\InsetSpace ~
708 charakteristice zobrazení
709 a je stále stejný, první zlomek se může měnit s\InsetSpace ~
710 každou iterací, takže z\InsetSpace ~
713 \begin_inset Formula $\bar{c_{i}}$
716 chová pokaždé jako jiné zobrazení.
719 \begin_layout Standard
721 rámci jedné iterace je ale
722 \begin_inset Formula $\bar{c_{i}}$
725 stále afinní zobrazení.
726 Navíc lze snadno ukázat, že při použití RMSE metriky optimální afinní zobrazení
728 \begin_inset Formula $c_{i}$
731 vždy zobrazuje průměnou barvu
732 \begin_inset Formula $D_{i}$
736 \begin_inset Formula $R_{i}$
740 \begin_inset Formula $\bar{g}\rightarrow g$
744 \begin_inset Formula $\bar{c_{i}}\rightarrow c_{i}$
751 \begin_layout Standard
752 V tomto přístupu je tedy iterační operátor složitější na vyhodnocení, ale
753 má lepší vlastnosti, například efektivnější ukládání koeficientů zobrazení
754 díky jejich menší korelaci.
756 \begin_inset Formula $q_{i}$
760 \begin_inset Formula $c_{i}$
763 byla většinou v\InsetSpace ~
764 absolutní hodnotě malá čísla, ale mohla se pohybovat ve
766 Průměrná barva bloku se může pohybovat jen v\InsetSpace ~
768 \begin_inset Formula $\left[0,1\right]$
771 a má jasnější význam\InsetSpace ~
772 -- to pomáhá při volbě způsobu kvantizace při uložení
773 do souboru a umožnuje například využít toho, že sousední bloky budou mít
774 pravděpodobně blízkou barvu.
777 \begin_layout Standard
778 Další výhodou je mnohem rychlejší a jistější konvergence.
779 Je vidět, že po každé iteraci mají všechny bloky
780 \begin_inset Formula $R_{i}$
783 správnou průměrnou barvu.
784 Tím se vzhled zdrojových bloků
785 \begin_inset Formula $D_{i}$
788 hned po první iteraci dostane blízko vzorovému obrázku, což se při další
789 iteraci promítne do cílových bloků
790 \begin_inset Formula $R_{i}$
796 \begin_layout Standard
798 výše odkazovaných publikacích je ukázáno, že po takovéto úpravě barevných
799 zobrazení iterování konverguje ke stejnému výsledku a také, že za trochu
800 silnějších předpokladů než zde uvedené bude potřebný počet iterací malý
801 a bude záviset pouze na velikostech zdrojových a cílových bloků.
802 Používá se zde diskrétní model obrázku\InsetSpace ~
803 -- posloupnost reálných čísel, kde
804 cílové bloky jsou tvořeny
805 \begin_inset Formula $2^{b_{i}}$
808 po sobě jdoucími hodnotami a zdrojové bloky o velikosti
809 \begin_inset Formula $2^{d_{i}}$
812 jsou tvořeny několika po sobě jdoucími cílovými bloky.
813 Zmenšování bloků vždy probíhá zprůměrováním
814 \begin_inset Formula $2^{d_{i}-b_{i}}$
817 po sobě jdoucích hodnot.
820 \begin_layout Standard
821 Na rozdíl od konvergence založené na kolážové větě je důkaz proveden bez
822 jakéhokoliv omezení na kontraktivitu barevných zobrazení
823 \begin_inset Formula $\bar{c_{i}}$
826 , což umožnuje mnohem přesnější aproximaci bloků s ostrými přechody bez
827 ztráty jistoty konvergence.
828 Zde se naopak využívá kontraktivity transformací
829 \begin_inset Formula $w_{i}$
835 \begin_layout Standard
839 \begin_inset LatexCommand bibtex
840 options "bibtotoc,plain"