Mathematical Optimization & Operations Research Lab

실생활 문제를 해결하기 위해서는 우선 그 문제를 제대로, 정량적으로 정의한 ‘수리모형’을 구축해야 합니다. 세상물정을 제대로 반영한 수리모형은 해법의 측면에서 비선형함수와 정수변수 등 다양한 ‘어려운 요소’를 포함하고, 따라서 현존하는 기법으로는 '효율적인 풀이'가 불가하게 됩니다. 이런 ‘비선형, 비볼록 최적화’ 문제의 가장 우수한 해를 효율적으로 찾는 것을 목표로 하는 연구를 ‘전역최적화’라 일컫습니다.

고려대학교 산업경영공학부 정보학연구실(more : Mathematical Optimization & Operations Research Lab)에서는 실생활 문제의 효과적, 효율적이고 정확한 솔루션을 지원할 수 있는 우수한 (기계)학습 및 의사결정 방법론 개발을 목표로 전역최적화(조합최적화 및 비선형계획법) 이론과 알고리즘 개발을 연구합니다. 2015년 이후 정보학연구실의 연구주제는 크게 다음의 두 가지로 요약할 수 있습니다.

1. Boolean Logical 데이터 분석/분류 및 의사결정론 연구

Logical Analysis of Data(이하, LAD)는 불린로직(Boolean Logic)과 조합론 그리고 이산최적화 기반의 데이터분류 방법론입니다. LAD는 해석이 용이한 ‘interpretable knowledge’를 발굴하며, 따라서 그 실용성과 유용성이 우수합니다. 최적화에 기반을 두었기에 발굴한 지식의 데이터분류 정확성 측면에서의 우수성은 말할 나위가 없습니다. 당연한 이치겠지만, 이런 장점을 누리기 위해서는 LAD 연구와 진보를 위한 조합론/조합최적화/정수계획법, 수치해석, convex analysis, matrix/polyhedral theory 등 수리과학 전분야에 걸친 이해와 연구가 필요합니다.

  • 주제 : Polytope Analysis, Convexification, 전역/조합최적화, Pattern Generation, Decision Theory

  • 도구 : Boolean Algebra, Combinatorics, Convex Analysis, Polyhedral Theory, Combinatorial Optimization, Mixed Integer and Linear Programming

  • 응용 : 감독(기계)학습, 데이터 마이닝/분류(Classification), 생물정보학, 의료정보학

2. MDA를 위한 수리적 데이터 분석 및 융합/선택 연구

본인은 수리최적화를 이용한 데이터분석을 (통계적 기법과 구분해) 수리적데이터분석(Mathematical Data Analysis; 이하, MDA)이라 칭합니다. 수리최적화의 경험/경력이 부족하거나 비전문가인 경우, 세상문제에 내재한 난이도를 근거로써 MDA는 ‘세상문제 해결에 사용이 불가하다’ 또는 ‘빅데이터 분석에 유용하지 않다’고 그르게 단정할 수 있습니다. 그러나, 계산의 난이도가 높은 어려운 속성의 문제도 대부분 효율적인 풀이가 가능할 수 있습니다. 이 점은 기존 기법 또는 (메타)휴리스틱적 방법론에 의한 (빅)데이터분석, 의사결정 등의 세상사 해결의 노력이 기회와 가치 손실의 측면에서 얼마나 큰지를 역설하고, 더불어 수리최적화 기반의 우수한 의사결정 방법론 개발에 관한 연구의 필요성을 방증합니다.

MDA 관점에서, 데이터융합/감소는 주어진 데이터 내에 내재한 (분류 측면에서의) ‘진리’와 그 '질'을 훼손함 없이 학습에 필요한 데이터의 양을 감소하는 것을 의미하며, 이를 통해 데이터분석/지식발굴과 연관한 최적화 모형의 크기를 축소하는 것을 주된 목적으로 삼습니다. 실용적으로, 실생활 의사결정문제의 '정확한 해법'을 추구하며, 이로써 우수한 지식의 혜택을 더욱 다양한 영역에서 더 많은 이들이 누릴 수 있도록 기여하는 것을 목표로 합니다.

  • 주제 : Polyhedral Theory, Graph Theoretic Analysis of Data, Topological Data Analysis

  • 도구 : Valid Inequalities, Graphs, Hypergraphs, Topology

  • 응용 : 감독(기계)학습, 데이터분류, 빅데이터 분석