미디어센터 media center

뉴스AI EXPO KOREA 2022. 4.13(수) - 15(금)

카카오브레인, 국내 최대 인공지능 구현한다... ‘구글 TPU’ 활용 슈퍼컴퓨팅 인프라 구축

1엑사 플롭스 뛰어넘는 국내 최대 규모 수준...한국어 초거대 언어모델 ‘KoGPT’ 성능 100배 향상 목표

 

카카오브레인(대표 김일두)이 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위/초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입했다.

이를 통해 한국어 특화 초거대 AI 언어모델 ‘KoGPT’ 의 연구 효율을 기존 대비 100배 이상 높인다는 목표다.

‘구글 TPU’는 구글 클라우드에서 사용할 수 있는 대용량 연산 인프라로 데이터를 빠르게 계산하고 가공할 수 있는 장치다. GPU(Graphic Processing Unit, 3D 그래픽 연산을 위한 전용 프로세서)를 여러 대 컴퓨터에 분할해 설치/사용하지 않고, GPU보다 빠르고 복잡한 연산을 갖춘 상위 시스템을 슈퍼컴퓨터 한 대에 구축해 활용한다.

높은 연산 처리 성능으로 AI 연구모델 연산 속도를 획기적으로 향상시킬 수 있고, 클라우드 방식을 활용함으로써 다수의 연구자들이 유연하게 시스템에 접속/사용이 가능해 연구 효율을 높일 것으로 기대된다..

 



구글 TPU(Tensor Processing Unit)은 언어, 번역, 포토, 검색, 어시스턴트 등 커스텀 머신러닝 ASIC이다


최기영 구글 클라우드 코리아 사장은 “새로운 시대를 여는 한국어 초거대 AI 모델 개발에 구글 클라우드가 함께 할 수 있어 매우 의미 있게 생각한다”라며 “앞으로도 구글 클라우드의 강력한 AI 및 머신러닝 인프라를 기반으로 한국 기업과 연구 기관이 다양한 분야에서 혁신을 가속화할 수 있도록 적극 지원하겠다”라고 강조했다.

카카오브레인 김일두 대표는 “KoGPT를 비롯한 언어모델을 비롯해 향후 공개할 비전 모델 등 초거대 AI의 다양한 모델에 슈퍼컴퓨터를 활용함으로써 연구 효율을 크게 높일 것으로 기대된다" 며 "다양한 언어 모델을 준비해 오픈 소스화함으로써 국내외 AI 생태계를 구축하는데 기여하고자 한다” 고 밝혔다. 

한편, 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 지난 18일 오픈소스로 공개한 ‘KoGPT’는 Open AI의 언어 모델 ‘GPT-3’를 고도화한 한국어 특화 버전이다.

추후 카카오는 한국어 뿐만 아니라 영어, 일본어 모델도 준비해 오픈소스화한다. 베트남어, 말레이시아어 등 동남아시아 언어도 준비해 더 많은 곳에서AI 기술의 혜택을 누릴 수 있도록 할 예정이다.

출처 : 인공지능신문(http://www.aitimes.kr)