(왼쪽부터 시계 방향으로)김민수 교수, 남윤민 박사, 한동형 박사과정

국내 연구진이 처리속도를 기존 최고 성능 제품보다 최대 20배 향상시킨 세계 최고 성능의 데이터베이스관리시스템(DBMS)을 개발했다.  

한국과학기술원(KAISTㆍ총장 신성철)은 김민수 전산학부 교수 연구팀이 DB 질의 언어인 '구조화 질의어(SQL)' 처리 성능을 향상시켜 세계 최고 수준 DBMS 기술을 개발했다고 23일 밝혔다.

연구팀은 데이터 처리 부분 산업 표준으로 사용하는 SQL 질의를 기존 DBMS와 다른 방법으로 처리, DBMS 성능을 미국 '옴니사이 DBMS' 대비 최대 88배나 높였다.

DBMS는 SQL 질의를 처리할 때 내부적으로 데이터 테이블을 '왼쪽 깊은 이진 트리' 형태로 배치해 처리하는 방법을 사용한다.

지난 수십 년간 상용화한 대부분의 DBMS는 데이터 테이블의 배치 가능한 가지 수가 기하급수적으로 많기 때문에 이를 '왼쪽 깊은 이진 트리' 형태로 배치, SQL 질의를 처리해왔다.

임의의 두 테이블이 기본 키(PK : primary key)와 외래 키(FK : foreign key)라 불리는 관계로 결합(조인 연산)한 경우 SQL 질의를 효과적으로 처리할 수 있다. 여기서 기본 키는 각 데이터 행을 유일하게 식별할 수 있는 열이고, 외래 키는 그렇지 않은 열이다.

하지만 지난 수십 년간 산업에서 사용하는 데이터베이스 구조가 복잡해지면서 두 테이블은 PK-FK 관계가 아닌 FK-FK 관계로 결합하는 복잡한 형태의 SQL 질의가 많아지고 있다.

실제 DBMS 성능을 측정하는 산업 표준 벤치마크인 TPC-DS에서 전체 벤치마크 중 26%가 복잡한 SQL 질의이며, 기계학습과 생물 정보학 등 다양한 분야에서 복잡한 SQL 질의 사용이 점차 증가하는 추세다.

이전에 나온 DBMS는 두 테이블이 주로 PK-FK 관계로 결합한다는 가정하에 개발됐다. 이에 FK-FK 결합이 필요한 복잡한 SQL 질의 처리 속도가 느리거나 처리하지 못하는 경우가 많았다.

연구팀은 이 문제를 해결할 수 있도록 여러 개의 작은 '왼쪽 깊은 이진 트리'를 'n항 조인 연산자'로 묶는 형태로 배치해 처리하는 기술을 개발했다. 이때 각각의 '작은 이진 트리' 안에는 FK-FK 결합 관계가 발생하지 않도록 테이블을 배치하는 것이 핵심이다.

각각의 '작은 이진 트리' 처리 결과물을 'n항 조인 연산자'로 결합해 최종 결과물을 구하는 것도 난제로 꼽히는데, 연구팀은 '최악-최적(worst-case optimal) 조인 알고리즘' 방법으로 이를 해결했다.

'최악-최적 조인 알고리즘'은 그래프 데이터를 처리할 때 이론적으로 가장 우수하다고 알려진 알고리즘이다. 연구팀은 세계에서 가장 먼저 이 알고리즘을 SQL 질의 처리에 적용해 난제를 해결하는 데 성공했다.

KAIST는 연구팀이 새로 개발한 DBMS 기술을 GPU 바탕의 DBMS 개발업체인 미국 옴니사이 제품에 적용한 결과, 기존 옴니사이 DBMS보다 성능이 최대 88배 향상했다고 설명했다.

이어 TPC-DS 벤치마크에서 세계 최고 수준 성능을 가진 기존 상용 DBMS보다 5~20배 빠른 속도를 보였다고 밝혔다.

TPC-DS는 DBMS 성능을 측정하기 위한 산업 표준의 최신 벤치마크이다.

연구팀은 이번 기술이 유명 DBMS인 옴니사이에 적용해 시스템 수준을 확인한 만큼, 상용 직전 수준의 기술이라고 설명하며 고성능 SQL 질의 처리가 필요한 DBMS에 폭넓게 적용 가능할 것이라고 전망했다.

김민수 교수는 "연구팀이 개발한 새로운 기술은 대부분의 DBMS에 적용할 수 있기 때문에 산업적 측면에서 파급 효과가 매우 클 것으로 기대한다"라고 말했다.

 

[AI 초대석] "AI학회는 인재 등용문 역할할 것"...유창동 한국인공지능학회장

[Life & 교육] KAIST, 포스트 코로나 시대 언택트 교육 위한 온라인 포럼 개최

키워드 관련기사
  • '데이터 댐' 구축할 AI 학습 데이터 모은다
  • "'데이터 댐'을 만들자"...문대통령 '디지털 뉴딜' 첫 일정에서 강조
  • "딥러닝으로 스마트해진 방제 작업"…생기원, 방제 드론용 지능형 관리 시스템 개발