첨단컴퓨터의 세계

패턴분류란 주어진 많은 데이터중에 유사한 특성을 가진 것들끼리 묶는 것을말한다. 우리는 일상생활에서 무의식중에 수많은 패턴들을 분류하게 되는데길거리에서 만나는 간판의 글자들, 버스색깔에 따른 일반버스와 좌석 버스의 구별, 심지어 만나는 사람들의 인식까지도 패턴분류의 범주로 볼 수 있다.

따라서대부분의 패턴인식도 패턴분류를 통하여 이루어지는데 앞에서 설명한 음성인식이나 문자인식도 음성이나 글자 영역에서의 패턴 분류라고 할 수 있다. 패턴분류는 물체들의 집단으로부터 일단의 특성에 따라 패턴 분석 단계를 거쳐 경계선에 따른 분류를 하게 된다. 클러스터링이나 패턴 분류는 유사성의 정도에 따라 주어진 데이터 집합을 여러개의 클라스로 나눈다. 클러스터를구하는 방법은 여러가지가 있는데, 통계적인 패턴인식 방법과 같은 전통적인 클러스터링 ISO DATA 방법, 그리고 신경망적인 방법 등이 있다. 통계적인 방법은 통계값에 따라 패턴을 분류하게 되며, ISO DATA 앨고리듬은 반복적으로 자기조직화를 하게 되는데 통계적인 분석에 의한 퓨리스틱 방법을 채택한다.

Kmeans클러스터링 앨고리듬은 클러스터 범위안의 모든 점들로부터 클러스터 중심 까지의 거리를 제곱한 것들의 합을 최소화시키는 방법이다. 그 외에도최근들어 많이 쓰이는 방법으로는 퍼지개념을 적용한 퍼지 c means 앨고리듬 이 흔히 쓰인다. 또한 필자에 의해 고안된 퍼지와 신경망을 효과적으로 융합 한 SONN 모델에 관해서는 진술한 바가 있기 때문에 앞 부분을 참조하기 바란다. 신경망을 통한 패턴분류에 관한 연구나 응용은 점차 확대되고 있는 실정이다 . 신경망을 이용한 패턴분류에서 두드러진 장점으로는 수많은 데이터를 일일이 학습시키지 않고도 어느 정도 정확한 학습이 이루어지며, 이를 통하여 보다 효과적인 패턴 분류가 이루어진다는 점이다. 그러나 훈련시키는 데이터의 갯수가 적을 경우에는 성능이 훨씬 떨어지는 단점도 가지고 있다. 따라서 이러한 제한점을 극복할 수 있는 새로운 신경망에 대한 연구가 기대된다.

패턴분류를위한 신경망중에서 아직까지 언급되지 않은 모델은 ART 모델이나 이것은 1976년 보스턴대학의 스테픈 그로스버그(Gross-berg)가 개발한 모델 로 경쟁 학습의 약점인 안전성을 보강한 모델이다. 이 시스템의 특징 으로는자기조직화를 통한 자율학습이 가능하며 비교적 빠른 학습과 많은 입력에 대한 메모리의 자기 조절기능을 가지고 있다는 점이다. 이 모델이 이진 입력 뿐만 아니라 아날로그 입력에 대해서도 제대로 작동한다는 것 또한 장점중의 하나다. 신경망을 이용한 패턴분류의 응용은 매우 다양하다. 몇가지 예를 든다면 확률적인 신경망을 사용한 패턴분류를 통해 레이더를 이용한 목표물의 정확한 탐지에 이용되며, 패턴분류를 통한 헬리콥터의 고장진단에 이용되기도 한다.

그외에도인공위성 사진을 통한 바다, 공원, 농경지 등의 토양 분류나 문맥 정보를 가진 멀티스펙트럴 데이터의 분류등에 적용된다.

보다구체적인 예는 미국 포드 자동차 회사의 패턴분류를 통한 엔진 결함의 진단 시스템 구현이다. 전자적으로 조정되는 3.0l 6기통 엔진에다 신경망을 이용한 훈련을 거친 결과 테스트 데이터에 대해 1백%의 정확성을 나타낸 바있다. 이 결과는 최고로 숙달된 기술자와 정확성이 같으며 속도면에서 훨씬 뛰어나다는 찬사를 받았다.

또한최근에는 퍼지와의 결합을 통한 패턴분류에 관한 연구가 진행되고 있는데 퍼지개념과 다층 퍼셉트론의 결합을 통한 패턴분류 모델 개발과 더불어 퍼지 경쟁학습을 이용한 클러스터링 방법에 대한 연구가 진행되고 있다.

패턴분류는단순한 것 같으면서도 매우 중요한 역할을 담당한다. 우리가 일상생활에서 만나는 것들이 대부분 패턴분류와 관련이 있으며 보다 정확한 패턴분류를 통해 지능적인 판단이 가능하기 때문이다.