201410_PSpaw.pdf 12 Przegląd sPawalnictwa Vol. 86  nr 10/2014 detekcja wad squat   w szynach kolejowych Detection of squat defects in railway Piotr Bojarczak Dr hab. inż. Piotr Bojarczak – Uniwersytet Technologiczno-Humanistyczny w Radomiu. Autor korespondencyjny/Corresponding author: bojarczp@wp.pl Wstęp Stan toru kolejowego, którego elementem są szy- ny kolejowe, ma istotny wpływ na bezpieczeństwo ru- chu pociągów. Z tego względu konieczna jest okreso- wa kontrola jego stanu. Obecnie w Polsce diagnostyka szynowa jest prowadzona wyłącznie z wykorzystaniem techniki ultradźwiękowej [1]. wykorzystywany jest do tego celu zautomatyzowany, ultradźwiękowy wagon de- fektoskopowy. Technika ta umożliwia wykrywanie wad znajdujących się pod powierzchnią główki szyny. Jed- nak okazuje się ona mało skuteczna w przypadku wad powierzchniowych szyn. Takimi wadami są wady typu squat (rys.1), występujące na powierzchni główki szyny. Istnieją co prawda techniki oparte na metodach prądów wirowych [2] umożliwiające wykrywanie tego typu wad, jednak ich praktyczne zastosowanie w warunkach, jakie panują na szlaku kolejowym, jest bardzo trudne, a często wręcz niemożliwe. Jak podano w pracy [3], wady squat w roku 2011 oraz 2012 były powodem odpowiednio 340 oraz 488 złamań oraz pęknięć szyn kolejowych. Stano- wiło to ok. 19% wszystkich złamań i pęknięć powstałych na liniach kolejowych. Zastosowanie technik wizyjnych stanowi alternatywny sposób wykrywania wad tego typu. Streszczenie Stan toru kolejowego ma istotny wpływ na bezpie- czeństwo ruchu kolejowego. Do tej pory na PKP stan toru był diagnozowany wyłącznie na podstawie badań ultradźwiękowych. Pozwala to na wykrywanie wad znaj- dujących się wewnątrz szyny. Metoda ta jest jednak zawodna, gdy wady znajdują się na powierzchni szyny lub bezpośrednio pod jej powierzchnią. wady typu squat należą do grupy wad, które nie mogą być wykryte tra- dycyjną metodą ultradźwiękową. Skłoniło to autora do opracowania wizyjnych algorytmów detekcji tego typu wad. wykorzystano do tego celu bank filtrów Gabora. w celu określenia najbardziej istotnych cech opisują- cych te wady wykorzystano technikę selekcji cech za- leżnych od rodzaju klasyfikatora. Klasyfikacja (detekcja) wad przeprowadzona została wg klasyfikatora SVM. Uzyskano 94% skuteczność klasyfikacji. Słowa kluczowe: squat, detekcja, szyny kolejowe abstract The state of the railway track has a significant impact on the safety of railway traffic. It is an important topic at the time of a steady increase in speed and the load of railway lines. Until now, the state of rails of the Polish Railway Lines has been verified exclusively by the ultra- sonic method. It makes it possible to detect flaws occurring in the cross-section of the rail head. Unfortunately, it is useless when surface flaws are located on or a few millimeters beneath the surface of the rail head. Squat flaws belong to the group of flaws which are not detected by traditional methods. It has led the author to develop and verify algorithms allowing for automatic visual detection of squat flaws. A bank of Gabor filters was used to detect these flaws. In order to select the most informative features describing the squats, sequential feature selection meth- ods based on the wrapper technique were used. Discrimi- nation among areas with squat and areas without squat is performed. by an SVM (Support Vector Machine) classi- fier. In the case of this method, the detection rate was 94%. Keywords: detection, rails 13Przegląd sPawalnictwa Vol. 86  nr 10/2014 Struktura systemu wizyjnego do detekcji wad squat Autor w swoich badaniach, dzięki uprzejmości PKP PLK S.A., wykorzystał pochodzące z bazy zdjęcia toru kolejowego. Zostały one zarejestrowane przez system wizyjny zainstalowany na wagonie defektoskopowym. Obrazy toru kolejowego podlegały wizualnemu spraw- dzeniu przez operatora, czy wykryta przez aparaturę defektoskopową wada nie pochodziła np. od złącza szyn. System pełni więc rolę pomocniczą. Składa się on z szybkich, kolorowych kamer klatkowych umiej- scowionych na wózku jezdnym wagonu defektosko- powego, ksenonowych źródeł światła doświetlających obszar szyn oraz dwóch komputerów wyposażonych w 1Gb Ethernet, służących do rejestracji obrazów wi- deo pochodzących od zainstalowanych kamer (każdy z komputerów obsługuje 1 szynę toru). Zarejestrowa- ny przez niego strumień obrazów składa się z ciągu kolejnych niezachodzących na siebie fragmentów toru o długości 0,5 m każdy. Zarejestrowane w ten sposób zdjęcia podlegały automatycznej analizie mającej na celu detekcję wad squat. Zaproponowany algorytm ich detekcji składa się z następujących bloków: – bloku ROI (Region of Interest) dla szyny, celem któ- rego jest wyodrębnienie z obrazu fragmentu zawie- rającego szynę, – bloku ekstrakcji cech wad squat, celem którego jest wyselekcjonowanie najbardziej reprezentatywnych cech opisujących ten typ wady, – blokU detektora wad squat, celem którego jest de- tekcja obszaru szyny zawierającej tę wadę na pod- stawie uprzednio wydobytych cech. Szczegóły dotyczące bloku ROI wykorzystującego dwuwymiarową transformację falkową są przedsta- wione w [5]. Detekcja wad squat może być potrakto- wana jako proces klasyfikacyjny. Celem tego procesu jest przydzielenie obiektu na podstawie pewnych jego unikalnych cech (u nas występują dwa rodzaje obiek- tów: obszar szyny z wadą squat oraz obszar szyny bez wady squat) do jednej z dwóch grup: grupy zawiera- jącej obiekty z wadami squat lub grupy obiektów nie- zawierających takich wad. Proces ten obejmuje dwa etapy: ekstrakcję cech oraz klasyfikację, która w tym przypadku odpowiada detekcji. Zakwalifikowaniu da- nej przez klasyfikator do pierwszej grupy odpowiada detekcja wady, natomiast zakwalifikowanie danej do drugiej grupy oznacza, że wada nie występuje – brak detekcji wady. Etap ekstrakcji ma na celu wybranie uni- kalnych cech pozwalających na rozróżnienie między dwoma wyżej wymienionymi grupami obiektów. Rys. 1. Postać wad typu squat występująca na powierzchni szyny Fig. 1. Example of squat flaw occurring on the rail surface Ekstrakcja cech wad squat Autor, zainspirowany pracami [5, 6] dotyczącymi wy- korzystania filtrów Gabora w kontroli materiałów tekstyl- nych oraz w rozpoznawaniu obiektów, zaproponował ich użycie do ekstrakcji cech wad squat. Do ekstrakcji cech został użyty bank n filtrów Gabora. w tym celu rama (okienko) o stałym rozmiarze 172x132 (172 – dłu- gość, w której mieści się największa z rozpatrywanych wad, 132 – szerokość główki szyny) jest przesuwana z krokiem co jeden punkt po obrazie wycinka szyny uzy- skanym w etapie ekstrakcji szyny (blok ROI). Dla każ- dego położenia ramy w obrazie przeprowadzana jest filtracja obrazu znajdującego się pod ramą przez bank n filtrów Gabora. następnie każdy z n wyfiltrowanych obrazów poddawany jest nieliniowemu przekształceniu za pomocą funkcji wartości bezwzględnej jego elemen- tów. w następnym kroku dla każdego z uzyskanych w ten sposób obrazów obliczana jest ich wartość śred- nia µi oraz wariancja σi. Po obliczeniu wartości µ oraz σ dla wszystkich n obrazów są one podawane na wej- ście klasyfikatora. Celem jest zaklasyfikowanie obrazu znajdującego się pod aktualnym położeniem ramy na podstawie odpowiadających mu n par (µi, σi) jako na- leżącego do grupy obiektów zawierającej wady squat (detekcja wady) lub do grupy niezawierającej wad squ- at (wada nie występuje). Kluczowymi kwestiami ma- jącymi decydujący wpływ na jakość procesu detekcji tych wad są: wybór właściwej liczby n filtrów Gabora, właściwy dobór parametrów dla każdego z filtrów oraz prawidłowy wybór rodzaju klasyfikatora. Filtry Gabora są próbą naśladowania działania komórek wizyjnych ssaków [7]. w przestrzeni dwuwymiarowej pojedynczy 2D (dwuwymiarowy) filtr Gabora może być opisany na- stępującą zależnością [8]: gdzie: j = -1, (x’, y’) są współrzędnymi obróconymi, σx oraz σy są standardowymi odchyleniami obwiedni Gaussa odpowiednio wzdłuż osi X oraz Y, F jest czę- stotliwością przestrzennego przebiegu sinusoidalnego, natomiast Ɵ jest jego orientacją względem osi X. Amplitudowa charakterystyka częstotliwościowa tego filtru może być uzyskana przez zastosowanie do wyrażenia (1) dwuwymiarowej transformacji Fourie- ra (two dimensional Discrete Fourier Trans form – 2D DFT) [8]: (1) (2) 14 Przegląd sPawalnictwa Vol. 86  nr 10/2014 gdzie: σu = 1/(2πσx), σv = 1/(2πσy), (u’, v’) są współ- rzędnymi częstotliwościowymi obróconymi, u jest częstotliwością oscylacji wzdłuż osi poziomej obrazu (oś X), natomiast v jest częstotliwością oscylacji wzdłuż osi pionowej obrazu (oś Y). wzór (2) przedstawia filtr pasmowy nastrojony na częstotliwość środkową F o paśmie określonym przez σu oraz σv. Dzięki czterem parametrom filtru: F, Ɵ, σx oraz σy możliwe jest dostrojenie filtru do zadanego zakresu częstotliwości, mającego wpływ na rozmiar analizowanych szczegółów w obrazie oraz określenie kierunku występowania szczegółów – parametr Ɵ. Prawidłowy dobór parametrów filtru ma decydujący wpływ na jakość procesu filtracji. Ponieważ rozmiar oraz położenie (kierunek) analizowanych wad typu squat znacząco się zmienia, zastosowano banki (zbio- ry) filtrów Gabora [9]. Pomimo że funkcje filtrów Ga- bora nie spełniają precyzyjnie wymagań dotyczących falek, w literaturze często nazywane są falkami Gabora [9]. Jeśli wzór (3) przedstawia postać falki bazowej Ga- bora [9]: bank filtrów może być określony w oparciu o następu- jącą zależność: (3) gdzie: p jest indeksem skali (rozmiaru) funkcji Gabora, q indek- sem jej orientacji, S całkowitą liczbą skal, natomiast L jest całkowitą liczbą orientacji banku filtrów Gabora. Je- żeli nałożymy pewne ograniczenia na α, σx oraz σy [9]: gdzie: Fh oraz FI są odpowiednio maksymalną oraz mi- nimalną częstotliwością obejmowaną przez amplitudo- we charakterystyki częstotliwościowe odpowiadające bankowi tych filtrów, wówczas amplitudowe charakte- rystyki częstotliwościowe sąsiednich filtrów przylegają do siebie w punktach zdefiniowanych przez hmax(p,q), gdzie hmax(p,q) jest wartością maksymalną amplitudo- wej charakterystyki częstotliwościowej filtru Gabora określonego przez indeksy (p,q). Rysunek 2 przedsta- wia powyższe charakterystyki określone dla FI = 0,013, Fh = 0,1, S = 4 oraz L = 6. Rys. 2. Przekroje amplitudowych charakterystyk częstotliwościo- wych dla 0,5hmax(p,q) dla banku filtrów Gabora zdefiniowanych przez FI = 0,013, Fh = 0,1, S = 4 oraz L = 6 Fig. 2. Half-peak magnitude response of Gabor filters bank for FI = 0,013, Fh = 0,1, S = 4 and L = 6 Po przeanalizowaniu wielu obrazów szyn zawie- rających wady typu squat autor zdecydował się użyć banku filtrów Gabora o następujących parametrach: FI = 0,013, Fh = 0,1, S = 4 oraz L = 6 jako bazy do po- szukiwania optymalnej postaci filtrów Gabora. w wyni- ku tego uzyskano 24 filtry Gabora o częstotliwościach środkowych pasma przepustowego równych 0,013, 0,042, 0,071, 0,1 oraz orientacjach: 0, π/6, 2π/6, 3π/6, 4π/6, 5π/6. Rysunek 2 przedstawia odpowiadające im przekroje amplitudowych charakterystyk częstotliwo- ściowych uzyskanych dla wartości 0,5hmax(p,q). Proces konstrukcji klasyfikatora polega na wygene- rowaniu na podstawie dostępnych danych reprezentu- jących zarówno grupę z wadami, jak i grupę bez wad, hiperpłaszczyzny separującej powyższe dwie grupy w m-wymiarowej przestrzeni cech. Jeżeli maksymalny wymiar przestrzeni cech oznaczymy jako: (4) (5) gdzie: S jest liczbą skal banku filtrów (S = 4), L jest licz- bą orientacji banku filtrów (L = 6), natomiast 2 jest licz- bą cech – (μi, σi) uzyskanych dla każdego filtru Gabora, to zadanie stawiane przed procesem selekcji cech bę- dzie polegało na wyborze ze zbioru Mmax cech podzbio- ru o możliwie najmniejszej ich liczbie zapewniających najlepszą separację powyższych dwóch grup danych (najmniejszą liczbę źle sklasyfikowanych obszarów szyny). Algorytmy selekcji cech są często używane w dzie- dzinie bioinformatyki – stanowią istotne narzędzie diagnostyki medycznej. wykorzystywane są np. do selekcji genów pozwalających na rozróżnienie tkanek zdrowych i zaatakowanych nowotworem [10]. Można podzielić je na dwie grupy: – metody wyboru cech pod względem ich indywidu- alnych właściwości od najlepszej do najgorszej (fil- ter technique feature selection) [11] na podstawie 15Przegląd sPawalnictwa Vol. 86  nr 10/2014 entropii, T-statystyki. wadą tej metody jest to, że podczas wyboru cech nie uwzględnia ona wza- jemnych relacji między nimi, – metody wyboru cech dla konkretnego typu klasyfi- katora (wrapper technique feature selection) [11] uwzględniającego jego błąd klasyfikacji (zdefiniowa- ny jako stosunek liczby źle sklasyfikowanych danych do całkowitej ich liczby). Metody te w trakcie wyboru cech uwzględniają wzajemne relacje. Ze względu na ograniczony zakres artykułu przedsta- wiona zostanie metoda wyboru cech dla konkretnego typu klasyfikatora. Cechy wybrane zgodnie z tą metodą zapewniają najmniejszy błąd klasyfikacji (najlepszą de- tekcję wad squat). w tym celu z ogromnej ilości zdjęć toru zarejestrowanych przez system wybrano te zawie- rające wady squat, a następnie w sposób ręczny wyod- rębniono same wady. Każda z wad mieściła się w obra- zie o rozmiarze 172x132 odpowiadającemu rozmiarowi ramki. w wyniku tego uzyskano 600 przykładów obra- zów wad. Dodatkowo zarejestrowano również 600 obra- zów o rozmiarze 172x32 odpowiadających fragmentom szyn niezawierających wad squat. Zgodnie z [11] proces selekcji cech wymaga, aby dane używane w nim były inne od danych użytych do konstrukcji samego klasy- fikatora. Z tego względu dane zawierające obrazy wad zostały podzielone w sposób losowy na dwie grupy: 300 danych użytych w procesie selekcji cech oraz 300 da- nych użytych do konstrukcji klasyfikatora. Również dane zawierające fragmenty szyny bez wad podzielono w ten sam sposób. Za optymalną metodę selekcji cech uzna- no tę, która zawierała podzbiór o minimalnej liczbie cech zapewniający najmniejszy błąd klasyfikatora, przy czym dane używane do konstrukcji klasyfikatora zawierały cechy wyselekcjonowane przez odpowiedni algorytm selekcji cech. Jako klasyfikator została użyta sieć SVM (Support Vector Machine) ze względu na teoretycznie najmniejszy błąd klasyfikacji [12]. Rysunek 3 przedstawia zależność współczynnika klasyfikacji zdefiniowanego jako: numer cechy Indeks skali filtru - (p) Indeks orientacji filtru - (q) μ lub σ uzyskane dla filtru Gabora zdefiniowanego przez (p,q) 3 1 2 μ 8 1 4 σ 16 2 2 σ 24 2 6 σ 26 3 1 σ 32 3 4 σ tablica I. Sześć najistotniejszych wyselekcjonowanych cech table I. Six selected the most important features optymalne rozwiązanie należy uznać sieć SVM z funk- cją jądra o postaci wielomianu trzeciego stopnia wraz z sześcioma wyselekcjonowanymi dla niej cechami, dla których współczynnik klasyfikacji był największy. (6) od ilości wybranych cech dla sieci SVM z trzema ro- dzajami funkcji jąder: liniowym, gaussowskim oraz wielomianu trzeciego stopnia. w tym przypadku jako Klasyfikator wad squat Jeżeli pojedynczą daną (wycinek szyny) potrak- tować jako punkt x RM w przestrzeni M-wymiarowej (M jest liczbą wyselekcjonowanych cech), to celem klasyfikatora będzie stworzenie w oparciu o dostępne dane, czyli zbiór uczący składający się z z par (xi, di), i = 1…z, hiperpłaszczyzny separującej powyższe dwie grupy danych. Symbol di jest liczbą (etykietą) przyj- mującą wartości +1, gdy xi należy do pierwszej grupy danych, lub -1, gdy xi należy do drugiej grupy danych. w przypadku użytego klasyfikatora opartego na sieci SVM (Support Vector Machine) wygenerowana hiper- płaszczyzna separująca przyjmuje położenie optymal- ne, tzn. zapewniające maksymalny margines separacji [12]. Jest on określany przez maksymalizację odstępu między danymi obu klas położonymi najbliżej siebie. Jeżeli dane nie są separowane liniowo, co oznacza, że nie można poprowadzić hiperpłaszczyzny separu- jącej powyższe dwie grupy danych, przeprowadzane jest nieliniowe rzutowanie M-wymiarowej przestrzeni wejściowej w R-wymiarową przestrzeń cech (nie my- lić z cechami uzyskanymi z algorytmu selekcji cech) za pomocą funkcji φ(x), przy czym R > M [12]. Sys- tem jest nadal liniowy, przy czym zgodnie z [12] rzu- towanie to powiększa wymiar przestrzeni, zwiększając prawdopodobieństwo, że liniowo nieseparowane dane w przestrzeni M-wymiarowej będą liniowo separowa- ne w nowo uzyskanej przestrzeni. w praktyce zamiast funkcji φ(x) stosuje się tzw. funkcję jądra K(x, xi). Funk- cja jądra może przyjmować postać liniową, wielomia- nową bądź też gaussowską. Przy czym w przypadku jądra liniowego separacja odbywa się w oryginalnej M-wymiarowej przestrzeni (nie ma zwiększenia jej Rys. 3. Zależność współczynnika klasyfikacji sieci SVM od liczby wybranych cech Fig. 3. Classification rate for SVM versus the number of selected features ∈ 16 Przegląd sPawalnictwa Vol. 86  nr 10/2014 wymiaru), natomiast dla pozostałych jąder separacja odbywa się w nowej, zwiększonej przestrzeni cech. Jako klasyfikator wykorzystano sieć SVM z funkcją ją- dra o postaci wielomianu trzeciego stopnia – dla niej uzyskano największy współczynnik klasyfikacji (rys. 3). Do jej konstrukcji zostały użyte dane nieuczestniczą- ce w procesie wyboru cech. Dane zawierające wady w ilości 300 zostały podzielone w sposób losowy na dwie grupy. Pierwsza grupa zawierająca 153 danych zosta- ła użyta w procesie uczenia klasyfikatora (konstrukcji hiperpłaszczyzny), natomiast druga grupa zawierająca 147 danych została użyta do testowania działania kla- syfikatora po procesie jego uczenia. w podobny spo- sób podzielono dane bez wad. Każda z podawanych na wejście klasyfikatora danych składała się z wyse- lekcjonowanych cech przedstawionych w tablicy II. Obszar Sklasyfikowany jako obszar współczynnik klasyfikacji z wadą bez wady % z wadą 134 13 94,5 bez wady 4 157 tablica II. Macierz pomyłek dla klasyfikatora przeprowadzającego detekcję wad squat table II. Confusion matrix for the classifier performing the detection of squat defects Literatura [1] P. Lesiak : Mobilna diagnostyka szyn w torze kolejowym; Mo- nografia habilitacyjna, wydział Transportu Politechniki war- szawskiej, 2008. [2] I. Elshafiey, L. Lalita Udpa.: A new eddy current imaging sys- tem for enhancement of nondestructive evaluation; nDT.net, Vol. 9, 2004, Internet http://www.ndt.net/article/mendt03/el- shaf/elshaf.htm [3] M. Migdal: Istotne czynniki warunkujące wybór strategii szli- fowania szyn; VI Konferencja naukowo-Techniczna InFRA- SZYn, 2013. [4] P. Bojarczak : Visual algorithms for automatic detection of squat flaws in railway rails; Insight – non-Destructive Te- sting and Condition Monitoring, The Journal of The British Institute of non-Destrictive Testing. Vol. 6 July, 2013. [5] K. Jain, n. Ratha, S. Lakshmanan: Object detection using Ga- bor Filter; Pattern Recognition. Vol. 30, no. 2, (295-309), 1997. [6] A. Kumar, GKH. Pang: Defect detection in textured materials using Gabor filters; IEEE Transactions on Industry Applica- tions, Vol. 38, no. 2, (425-440), 2002. [7] C. Mandriota, M. nitti, n. Ancona, A. Distante: Filter-based feature selection for rail defect detection; Machine Vision and Application, Springer, Vol.15, (179-185), 2004. [8] J-K. Kamarainen: Feature Extraction using Gabor filters; PhD dissertation, Lappeenranta University of Technology, Finland, 2003. [9] Y. Rubner, C. Tomasi: Perceptual metrics for image databa- se navigation; Kluwer Academic Publishers 2004. [10] I. Guyon, J. weston, S. Barnhill, V. Vapnik: Gene selection for cancer classification using Support Vector Machines; Machine Learning, Kluwer Academic Publishers, (389-422), 2002. [11] Y. Saeys, I. Inza, P. Larranaga: A review of feature selec- tion techniques in bioinformatics; Bioinformatics Advance Access, 2007. [12] B. Scholkopf, A. Smola: Learning with kernels, Support Vec- tor Machines, regularization, optimization and beyond; MIT Press, Cambridge, Massachusetts, London, 2002. Wnioski Zaprezentowany algorytm może stanowić alter- natywny sposób wykrywania wad powierzchniowych typu squat. Zastosowanie banków filtrów Gabora wraz z algorytmami selekcji cech umożliwiło zdefi- niowanie sześciu reprezentatywnych cech opisują- cych wady tego typu. Z kolei użyty klasyfikator SVM umożliwił dyskryminację na podstawie wcześniej określonych reprezentatywnych cech między obsza- rem szyny zawierającym wadę a niezawierającym jej. Zważywszy na licznie występujące na szynie za- brudzenia, uzyskany 94,5% współczynnik klasyfika- cji wydaje się być rezultatem bardzo dobrym. Poniżej zaprezentowano rezultaty działania klasyfi- katora (dla danych testujących, nieuczestniczących w procesie wyboru cech oraz procesie uczenia klasy- fikatora).