상단여백
HOME 산학연관
KAIST, 세계 최고성능 기계학습 시스템 개발 … "구글 압도"

인공지능(AI) 딥러닝 모델들을 처리키 위해 필수적으로 사용되는 기계학습 시스템을 국내 연구진이 세계 최고 수준으로 끌어올렸다.

KAIST는 전산학부 김민수 교수 연구팀이 세계 최고 수준의 '행렬 연산자 융합 기술'(FuseME)을 개발했다고 20일 밝혔다.

연구팀에 따르면 일반적으로 딥러닝 모델은 행렬 곱셈, 행렬 합, 행렬 집계 등 많은 행렬 연산자들로 구성된 방향성 비순환 그래프(DAG; Directed Acyclic Graph) 형태의 질의계획으로 표현돼 기계학습 시스템에 의해 처리된다.

모델과 데이터의 규모가 클 때는 일반적으로 DAG 질의계획은 수많은 컴퓨터로 구성된 클러스터에서 처리하기 때문에 클러스터 사양에 비해 모델과 데이터의 규모가 커지면 처리에 실패하거나 시간이 오래 걸리는 근본적인 문제가 있다.

지금까지는 큰 규모의 모델이나 데이터를 처리키 위해 단순히 컴퓨터 클러스터 규모를 증가시키는 방식을 주로 사용했다.

반면 김 교수팀은 DAG 질의계획을 구성하는 각 행렬 연산자로부터 생성되는 중간 데이터를 메모리에 저장하거나 네트워크 통신을 통해 다른 컴퓨터로 전송하던 것을 저장하지 않거나 다른 컴퓨터로 전송하지 않도록 여러 행렬 연산자들을 하나의 연산자로 융합시켜 세계 최고 성능의 융합 기술인 FuseME(Fused Matrix Engine)을 개발했다.

김 교수팀이 개발한 FuseME 기술은 수십 개 이상의 행렬 연산자들로 구성되는 DAG 질의계획에서 우수 성능을 낼 수 있는 연산자들끼리 서로 융합해 그룹으로 묶었다.

또 클러스터 사양, 네트워크 통신 속도, 입력 데이터 크기 등을 모두 고려해 각 융합 연산자 그룹을 메모리 부족으로 처리에 실패하지 않으면서 이론적으로 최적 성능을 낼 수 있도록 CFO(Cuboid-based Fused Operator) 연산자로 융합시켰다. 

김 교수팀이 FuseME 기술을 종래 최고 기술로 알려진 구글의 텐서플로나 IBM의 시스템DS와 비교 평가한 결과, 딥러닝 모델의 처리 속도는 최대 8.8배 향상됐고 텐서플로나 시스템DS가 처리할 수 없는 훨씬 더 큰 규모의 모델 및 데이터를 처리하는 데도 성공했다.

특히 FuseME의 CFO 융합 연산자는 기존 최고 수준 융합 연산자와 비교해 처리 속도를 최대 238배 향상시키고 네트워크 통신 비용을 최대 64배 감소시키는 사실도 확인했다.

이번 연구에는 김 교수의 제자이자 그래파이(GraphAI) 스타트업의 공동 창업자인 한동형 박사가 제1저자, 김 교수가 교신저자로 참여했으며 지난 16일 미국 필라델피아에서 열린 데이터베이스 분야 국제학술대회인 ACM SIGMOD에서 발표됐다. 논문명 FuseME-Distributed Matrix Computation Engine based on Cuboid-based Fused Operator and Plan Generation  

김민수 교수는 "개발한 새로운 기술은 딥러닝 등 기계학습 모델의 처리 규모와 성능을 획기적으로 높일 수 있어 산업적 측면에서 파급 효과가 매우 클 것으로 기대한다"고 말했다.

충청비즈  cbiz0419@naver.com

<저작권자 © 충청비즈, 무단 전재 및 재배포 금지>

충청비즈의 다른기사 보기
icon인기기사
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
Back to Top