E-Business and Data Mining
인터넷 One-to-One 마케팅 최적화
인터넷 비즈니스가 기능의 시대에서 효율성의 시대로 넘어가면서 고객 프로파일의 효율적 관리를 통한 매출 증대와 고객의 충성도 향상은 대부분 인터넷 관련 사이트의 미래를 결정하는 중요한 지표의 하나가 되었다. 본 연구실에서는 인터넷 마케팅에서 발생하는 최적화 문제들을 도출하여 모델링하고 이를 위한 이론적 실험적 해결책을 제시함으로써 최적의 1-To-1 마케팅 솔루션을 위한 원천 기술을 제공한다. 현재 이메일 마케팅,전자상거래, 검색, 텔레커뮤니케이션즈 마케팅 등의 응용 분야에서 발생하는 최적화 문제들을 연구하고 있다. 사용하는 기법으로는 휴리스틱 알고리즘, 유전 알고리즘, 신경망, Large-Step Markov Chain, Collaborative Filtering,Content-Based Filtering 등을 포함한다. 현재 몇 기업체와 공동 연구를 진행 중이다.
검색 엔진 개선 연구
월드 와이드 웹(WWW)의 폭발적인 사용 증가로 효과적인 정보 검색 방법이 필요하게 되었다. 기존의 검색 엔진은 주로 사용자의 검색어에만 의존하는 방법이었다. 본 연구실에서는 사용자의 검색어 외에 검색어에 잠재적으로 연관된 어휘들을 사용하여 검색의 효율성을 높이는 연구를 하고 있다. 수많은 문서들을 분석해보면, 어휘들간의 연관도가 추출되게 된다. 이러한 정보를 바탕으로 사용자가 잠재적으로 찾고자 하는 문서를 자연스럽게 찾을 수 있다. 또한 기존의 검색 엔진 연구에서 비교적 등한시 되었던 최적화의 방법론을 적용하여 검색에 영향을 미치는 여러 가지 요소들을 최적화 시켜서 궁극적으로 검색의 효율을 높일 수 있다.
E-mail 자동응답 시스템
사용 인구의 폭발적인 증가로 인터넷은 현대인의 필요 불가결한 생활수단이 되고 있다. 특히 E-mail은 기업활동에 있어서 고객들의 의견을 수렴하고 제품을 광고하는 수단으로 큰 비중을 차지하고 있다. 그러나 다양한 고객으로부터 오는 다양한 E-mail들에 대해서 적절한 응답을 위해서는 많은 인력과 비용을 필요로 한다. 본 연구는 이를 해결하기 위해서 데이터 마이닝을 이용한 E-mail 자동응답 시스템을 개발하는 데에 목적을 두고 있다.
정보이론을 이용한 데이터 마이닝
정보이론은 확률변수가 가지는 엔트로피 및 정보량에 기반한 다양한 이론들을 다루는 연구분야이다. 최근까지 정보이론은 데이터 압축 및 통신 분야에 주로 적용되어왔다. 본 연구에서는 이러한 정보이론을 데이터 마이닝의 다양한 분야에 적용해서 효율적인 데이터 마이닝 기법을 개발하는 것을 목적으로 한다. 특히 특징 추출 문제 및 분류 문제에 적용하기 위한 연구를 중점적으로 수행하고 있다.
음악 검색 시스템
전통적으로 데이터베이스(database) 검색은 텍스트(text) 환경에서 이루어져 왔다. 그리고 이 관행은 멀티미디어 데이터(multimedia data)들이 주류를 이루는 현 시점에도 그대로 유지되고 있다. 오늘날, 오디오 데이터베이스(audio database) 검색 역시 일반적으로 텍스트 환경에서 이루어지고 있는데, 이는 오디오 데이터베이스 검색 키(key)를 제목, 가수, 작곡자, 곡의 주제 등의 정적인 정보들로 제한하고 있다. 한편, 수많은 오디오 데이터(audio data)가 출현하고, 그와 함께 그러한 오디오 데이터를 접하는 환경도 다양해지면서, 우리는 정리된 정보 없이 매 순간 다양한 곡들의 단편들을 들으며 살아가고 있다. 동시에, 우리에게 있어 기억에 가장 오래 남는 곡에 대한 정보는 곡의 선율(contour)이 되었다. 이로 인해 우리는 텍스트 정보 없이 기억이 만들어주는 곡의 선율만으로 곡을 직접 검색할 필요성을 느낀다. 지금까지 현실적인 규모를 수용하는 선율 기반의 검색 시스템을 만드는 것은 불가능하다고 판단되었다. 본 연구실은 이러한 기술적인 문제들의 해결 방안과 함께 빠른 시간 내에 곡의 선율만으로 곡을 직접 검색할 수 있는 오디오 데이터베이스 시스템에 대해 연구, 상용화할 수준에 이르렀다.