Strona główna · Przetwarzanie obrazów

Rodzaje przestrzeni barw

XYZ i RGB

Trójwymiarowa przestrzeń koloru CIE XYZ jest podstawą wszystkich systemów zarządzania kolorami. Zawiera wszystkie kolory zauważalne przez człowieka. Wiele z nich nie może być wyświetlona na monitorach lub wydrukowana. CIE XYZ została opracowana na podstawie badań ludzkiego oka. Aby wyniki były jak najbardziej obiektywne badaniom poddano grupę ludzi o właściwościach wzroku nie odbiegającą od przeciętnej.

Siatkówka w oku ludzkim składa się z dwóch grup sensorów. Pręcików i czopków. W każdym oku znajduje się około 100 milionów pręcików odpowiedzialnych za luminancję, natomiast 6 milionów czopków mierzy kolor. Jednak tylko 1 milion nerwów przenosi informacje do mózgu. Aby czopki mogły zostać pobudzone, a informacja przesłana do mózgu luminancja musi być na poziomie kilku cd/m2. Trzy rodzaje czopków (razem z pręcikami) tworzą system mierzący. Informacje widmowe są tracone, zostaje tylko informacja na temat trzech kolorów. Można nazwać te kolory jako: niebieski (B), zielony (G) i czerwony (R). W rzeczywistości sensor czerwieni jest sensorem koloru pomarańczowego.

Lab

Przestrzeń barw CIELab powstała w wyniku badań nad postrzeganiem różnicy między barwami przez człowieka. W założeniu, barwy znajdujące się w przestrzeni CIELab w jednakowej odległości ?E od siebie będą postrzegane jako jednakowo różniące się od siebie. Przestrzeń barw CIELab miała być równomierną przestrzenią barw, jednak jest jedynie zalecana jako równomierna przestrzeń barw. Niestety percepcyjnej różnicy barw nie można jednoznacznie określić za pomocą ?E.

CIELab opisuje się za pomocą trzech składowych:
• L - jasność (luminancja)
• a – barwa od zielonej do magenty
• b – barwa od niebieskiej do żółtej

Inne przestrzenie barw

CMYK
CMYK (Cyan, Magenta, Yellow, blacK) – model używany m.in. w poligrafii, zastosowana synteza subtraktywna

HSV i HSB
HSV (Hue – kolor , Saturation – nasycenie , Value - jasność) lub HSB (Hue, Saturation, Brightness) – kolory przedstawione są na okręgu, a ich wartość opisana jest przez stopnie. Centrum barwy czerwonej odpowiada kąt 0° lub 360°. Centrum barwy zielonej odpowiada kąt 120°. Centrum barwy niebieskiej odpowiada kąt 240°. Pozostałe barwy pośrednie dla składowej Hue są odpowiednio rozłożone pomiędzy kolorami czerwonym, zielonym i niebieskim. Aby uzyskać wymaganą barwę (np. w programach graficznych) dużo łatwiej jest operować na wartościach składowych HSV niż np. na RGB czy CMYK.

YUV
YUV - model barw, w którym Y odpowiada za jasność obrazu (luminancję), a pod UV ukryta jest barwa - dwie chrominancje.
Model YUV był wykorzystywany w czasie przechodzenia od telewizorów czarno-białych na kolorowe. Czarno-białe odbiorniki wyświetlały jedynie jasność obrazu, a kolorowe dodawały kolor, co pozwoliło posiadaczom czarno-białych nie pozbywać się odbiorników od razu.

10.12.2008. 20:35

Metody poprawy jakości obrazu

Filtry dolnoprzepustowe

Filtr dolnoprzepustowy służy do przepuszczania części obrazu o niskiej częstotliwości, powoduje natomiast tłumienie lub usuwanie elementów o większych częstotliwościach. Tego typu filtry bardzo często są używane do redukowania i usuwania szumu w obrazie. Jednak nadają się tylko dla szumu o niewielkich rozmiarach (jednopikselowy lub dwupikselowy).

Zalety:
• usunięcie lub tłumienie szumu

Wady:
• efektywne dla szumu o małym rozmiarze
• zmniejszenie ostrości obrazu

Filtry górnoprzepustowe

Do wzmocnienia w obrazie szczegółów o dużej częstotliwości stosuje się filtry górnoprzepustowe. Elementy obrazu o niskiej częstotliwości pozostają niezmienione lub zmienione w bardzo niewielkim stopniu.
Filtrację górnoprzepustową stosuje się gdy zależy nam na dobrym zaakcentowaniu lub zidentyfikowaniu różnych obiektów w obrazie.

Zalety:
• polepszenie ostrości obrazu

Wady:
• wzmocnienie szumu

10.12.2008. 20:28

Filtry różniczkowe

Pierwsza pochodna

Filtry Sobela i filtry Prewita reprezentują rodzinę filtrów różniczkowych pierwszej pochodnej. Używane są do wykrywania krawędzi, więc często nazywane są filtrami konturowymi. Wykrycie krawędzi polega na określeniu zmian w obrazie. Dla obrazu czarno-białego będzie to różnica jasności sąsiednich pikseli (gradient jasności). Natomiast dla obrazu kolorowego używa się różnicy odległości między punktami w przestrzeni trójwymiarowej (na przykład przestrzeni barw CIELab). Im większa zmiana sąsiednich pikseli tym bardziej zaakcentowana jest krawędź.

Zalety:
• wyróżnienie krawędzi w obrazie

Wady:
• skuteczne tylko dla krawędzi jednokierunkowych (na przykład tylko pionowe)
• mało ostre krawędzie

Laplasjany

Do wykrywania krawędzi stosuje się także operatory Laplace'a. Laplasjany wykrywają krawędzie we wszystkich kierunkach. Wielokierunkowość jest najważniejszą cechą tego typu filtrów odróżniającą je od filtrów różniczkowych wykorzystujących pierwszą pochodną. Należy także podkreślić, że metody wykrywania krawędzi korzystające z Laplasjanów dają w rezultacie ostrzejsze krawędzie niż większość innych metod.

Zalety:
• bardzo dobre wyróżnienie krawędzi w obrazie
• ostre krawędzie
• skuteczne dla krawędzi wielokierunkowych

Wady:
• wzmocnienie szumu punktowego

Filtr medianowy

Użycie filtru medianowego jest jedną z najskuteczniejszych metod usuwania szumu. Działanie filtru medianowego sprowadza się do wpisania w miejsce przetwarzanego piksela mediany z wartości pikseli znajdujących się w otoczeniu.

10.12.2008. 20:26

Opis programu Optico

Przeznaczenie aplikacji

Aplikacja przeznaczona jest do badań nad trudnością rozpoznawania znaków w plikach graficznych CAPTCHA w zależności od rodzaju użytych zaburzeń.

Ogólny opis implementacji

Program został zaimplementowany w języku Java w środowisku NetBeans firmy Sun. Zarówno obiekty, na których przeprowadzamy obliczenia, jak i same zadania zostały zaimplementowane jako odpowiednie klasy.
• optico – klasa odpowiedzialna za tworzenie graficznego interfejsu użytkownika
• opticoRecognition – klasa odpowiedzialna za cały proces rozpoznawania znaków

Dane wejściowe i wyjściowe

Danymi wejściowymi jest plik graficzny w formacie JPEG. Dane wyjściowe to rozpoznany ciąg znaków.

Obsługa programu

Założeniem programu jest pełna automatyzacja procesu rozpoznawania znaków, więc obsługa programu jest ograniczona jedynie to wybrania obrazu JPEG i uruchomienie mechanizmu odczytywania znaków.

10.12.2008. 20:22

Sposób działania aplikacji

Można wyróżnić kilka etapów rozpoznawania obrazów programem Optico:
• Przetwarzanie wstępne (filtr medianowy)
• Segmentacja i ekstrakcja cech topologicznych (wykrywanie krawędzi i rogów)
• Klasyfikacja i interpretacja (rozpoznanie znaku)

Po uruchomieniu programu użytkownik ma możliwość wybrania dowolnego obrazu w formacie JPEG. Po zatwierdzeniu wyboru obraz ten widoczny jest w głównym panelu aplikacji. Następnie używając przycisku „Start Optico Recognition!” rozpoczynamy proces automatycznego rozpoznawania znaków. W tym momencie rola użytkownika kończy się. Na początku dane z wczytanego obrazu są umieszczane w trójwymiarowej tablicy RGB. Dwa pierwsze wymiary tablicy odpowiadają za współrzędne piksela, natomiast ostatni wymiar odpowiada za wartości RGB tego piksela. Dalej na podstawie wartości RGB obliczane są wartości przestrzeni barw CIEXYZ oraz CIELab. Przestrzeń barw CIEXYZ jest wykorzystywana tylko do stworzenia wartości CIELab dla wszystkich pikseli obrazu. Test CAPTCHA ma za zadanie odróżnienie człowieka od maszyny, dlatego program używa wartości przestrzeni barw CIELab, która powstała w wyniku badań nad postrzeganiem różnicy między barwami przez człowieka. Następnie tworzona jest tablica różnic między pikselami sąsiadującymi i oddzielonymi jednym pikselem. Różnica między barwami w przestrzeni CIELab, jest miara odległości między dwoma punktami w przestrzeni. Wykorzystując tablicę różnic usuwany jest szum za pomocą filtru medianowego. W dalszej kolejności stosujemy segmentację. Przy pomocy odpowiednich filtrów i masek wykrywane są miejsca szczególne dla znaków (zakończenia, krawędzie, rogi, itp.) a następnie wzajemne położenie zbiorów miejsc szczególnych klasyfikowane jest jako określone znaki. Stosując wzajemne położenie miejsc szczególnych, program wykazuje małą wrażliwość na rotację, wielkość i rodzaj czcionki zastosowanej w obrazie. Po zakończeniu procesu program wyświetla ciąg rozpoznanych znaków.

10.12.2008. 20:19

Podsumowanie i wnioski

Rozwój Internetu w ostatnich kilku latach sprowadzał się do zwiększenia udziału zwykłego użytkownika w procesie kształtowania treści stron internetowych (Web 2.0). Niegdyś hermetyczne strony WWW, dziś zachęcają internautę do pisania artykułów, komentarzy, opinii czy dodawania innego rodzaju treści. Jednak wiele osób zaczęło wykorzystywać możliwość edycji treści strony do własnych celów. Spowodowało to znaczne obniżenie jakości niezabezpieczonych witryn, a administratorów stron zmusiło do wprowadzenia różnych mechanizmów pozwalających na odróżnienie człowieka od maszyny. Jedną z najpopularniejszych tego typu metod jest wprowadzenie CAPTCHA. Często skuteczność zabezpieczeń ma decydujący wpływ na jakość witryny, dlatego bardzo ważne są badania nad graficznymi kodami zabezpieczającymi.
Analizując różne rodzaje zaburzeń utrudniające odczytanie CAPTCHA stwierdzam, że najlepszą jakością charakteryzują się obrazy które:
• używają znaków umieszczonych blisko siebie lub złączonych w sposób, który nie powoduje dla człowieka trudności w odczytaniu obrazu, ponieważ utrudniają segmentację na poszczególne znaki
• używają nielinearnych transformacji, ponieważ czcionka znaków jest za każdym razem inaczej zdeformowana
• używają trójwymiarowych czcionek, ponieważ wykorzystują zdolność człowieka do spostrzegania trójwymiarowych elementów na dwuwymiarowych obrazach
• zawierają poruszające się elementy, ponieważ rozpoznawanie znaków w całej animacji jest bardziej skomplikowane niż przetworzenie pojedynczego obrazu, a przetworzenie pojedynczej klatki animacji jest niewystarczające; poza tym animowana CAPTCHA może wykorzystywać zdolność człowieka do tworzenia wrażenia ruchu na podstawie zestawu obrazów

Bardzo skuteczne staje się połączenie kilku rodzajów zaburzeń. Doskonałe efekty daje umieszczenie znaków blisko siebie z jednoczesnym zastosowaniem nielinearnych transformacji. Używając trójwymiarowych czcionek wykorzystujemy naturalnie wykształconą umiejętność człowieka do widzenia trójwymiarowych elementów na dwuwymiarowych obrazach, co obecnie dla programów OCR jest skuteczną barierą. Dodatkowe zabezpieczenie zapewnia umiejętne użycie animacji w obrazach CAPTCHA.

10.12.2008. 20:16

Literatura

• Tadeusiewicz R., Flasiński M., „Rozpoznawanie obrazów”, PWN, Warszawa 1991
• W. Skarbek, „Metody reprezentacji obrazów cyfrowych”, Akademicka Oficyna Wydawnicza PLJ, Warszawa 1993.
• Jain A. K., “Fundamentals of Digital Image Processing”, Prentice-Hall International Editions, Engelwood Hills, 1989
• R. C. Gonzales, R. E. Woods, “Image Processing”, Addison-Wesley, 1992.
• Sobczak W., Malina W., „Metody selekcji i redukcji informacji”, WNT, Warszawa 1985
• W. K. Pratt, “Digital Image Processing”, John Wiley and Sons, 1991.
• Duda R.O., Hart P.E., Stork D.G., “Pattern Classification”, John Wiley & Sons, 2000
• C. Watkins, A. Sadun, S. Marenka, „Nowoczesne metody przetwarzania obrazu”, WNT, Warszawa 1995.
• Nadler M., Smith E.P., “Pattern Recognition Engineering”, Wiley-Interscience, New York, 1993
• R. Tadeusiewicz, P.Korohoda, „Komputerowa analiza i przetwarzanie obrazów”, Wydawnictwo Postępu Telekomunikacji, Kraków 1997.
• T. Pavlidis, „Grafika i przetwarzanie obrazów”, WNT, 1987.
• M. Ostrowski (red.), „Informacja obrazowa”, WNT, 1992.
• Służek, „Komputerowa analiza obrazów”, Wydawnictwo Politechniki warszawskiej, Warszawa 1991.
• Nieniewski M., „Morfologia matematyczna w przetwarzaniu obrazów”, PLJ, Warszawa 1998.
• B. Dudziński, R. Pająk, „Laboratorium podstaw fotoniki – ćwiczenie PF5”, Warszawa 2003
• Gernot Hoffmann, “CIELab Color Space”

10.12.2008. 19:44

Na tym adresie www odkryjesz rozmaite intrygujące publikacje: pozycjonowanie. Słyszałem, że ta witryna internetowa będzie wyśmienita: Kasyno. Tu na wyjątkową uwagę zasługuje zasługuje grafika i treść: liebherr. Ostatnio przyjaciel namówił mnie do obejrzenia tej strony: htc hd2. Ta strona www na pewno będzię Ci odpowiadać, dlatego przydałoby się ją zobaczyć: zelmer.

Spis treści

Reklama

Ostatnio kumpel namówił mnie, żebym obejrzał tę witrynę: księgowa w lublinie. Tutaj na uwagę zasługuje zasługuje grafika i publikacje: lokata bankowa. Na tej stronie www zobaczysz rozmaite interesujące tematy: biuro rachunkowe Poznań. Nie zapomnij odwiedzić moją zaprzyjaźnioną witrynę: Kredyt gotówkowy. Z tą jesteśmy od kilku miesięcy, więc należałoby ją zobaczyć: Sławomir Żak.

RSS

Strony partnerskie

Sufrując po necie można odkryć bardzo wiele różnorodnych stron internetowych. Uważam, że ta jest pierwszorzędna: Blogi. Nad tym kapitalnym adresem bez wątpienia przesiedzisz bardzo wiele czasu: yerba mate. Tutaj na szczególną uwagę zasługuje zasługuje stylistyka i publikacje: Blog. Z tą współpracujemy od kilkunastu tygodni, dlatego warto ją odwiedzić: Tiger. Buszując po necie da się wyszperać dużo wielorakich stron. Wydaje mi się, że ta Ci spodoba się: wątroba.