미디어센터 media center

보도자료AI EXPO KOREA 2020

74

[인공지능신문] 링크제네시스, 'AI EXPO KOREA 2020'에 참가해 인공지능 기술을 접목한 다양한 제품을 선보인다.
2020.02.18
인공지능 기반 스마트팩토리 및 테스팅 RPA 전문기업, 링크제니시스(대표 정성우)는 2020년 5월 19일(화)부터 21일(목)까지 서울 COEX 에서 열리는 'AI EXPO KOREA 2020'에 참가해 인공지능 기반 영상분석 솔루션인 'VDL'을 비롯하여 인공지능 기술을 접목한 다양한 제품을 선보인다. 'VDL'(Visual Deep Learning)은 인공지능 기반 영상 분석 솔루션으로 검수할 제품을 촬영한 뒤 인공지능을 이용해 불량을 검출하는 소프트웨어다. 사람이 직접 검수하는 것보다 정밀하고 검수 속도가 빠르며, 장시간 운영이 가능해 생산효율성을 크게 높여준다. 非전문가도 손쉽게 조작할 수 있도록 그래픽 기반 인터페이스를 갖춘 것도 장점이다. VDL은 반도체 폴리싱 부품을 제조하는 A사가 검수솔루션으로 채택한 것을 계기로 정확성과 효율성을 증명해냈다. 높은 신뢰성이 요구되는 반도체 공정, 각 부품마다 다른 생산공정을 거치는 자동차 부품 뿐만 아니라 LCD 패널, 식품, 보안, 의약 분야 등 다양한 분야에 적용 가능하다. 내부 관계자에 따르면 "현재 식품, 보안, 배터리 등 다양한 제조기업들의 PoC 관련 문의가 늘어나고 있으며 진행한 PoC에서 유의미한 결과를 확인했다"고 전했다. 한편 링크제니시스는 2003년에 설립되어 스마트팩토리 및 테스팅 RPA S.W 전문 기업으로서 현대자동차, 삼성전자, SK하이닉스 및 SK C&C등 국내의 유수의 대기업등을 고객사로 두고 있으며 2016년 인공지능기술을 융합한 테스팅 RPA 연구개발로 산업통상자원부에서 지원하는 우수기술연구센터에 지정 되어 기술력을 과시했다. 2018년에는 기술 상장 2곳의 평가기관으로부터 평가등급 A, AA의 높은 평가 등급을 받으며 코스닥에 상장하여 초기 공모가 대비 94%의 높을 수익율을 기록했고 최근에는 안양시 우수기업, 고용노동부 강소기업, 청년친화 강소기업에 잇달아 선정되며 안정적인 사업 활동을 영위 하고있다.출처 : 인공지능신문(http://www.aitimes.kr) 최광민 기자
[뉴시스] ‘인공지능(AI) 중심도시 광주’ 비전·전략 선포
2020.01.30
[광주=뉴시스] 구길용 기자 = 광주를 인공지능 중심도시로 육성하기 위한 비전·전략이 선포됐다.광주시는 29일 오후 김대중컨벤션센터에서 ‘인공지능 광주시대를 여는 인공지능 중심도시 광주 비전 선포식’을 개최했다.이날 선포식에는 이용섭 광주시장과 최기영 과학기술정보통신부장관, 지역 국회의원, 시의원, 지역 주요인사 등 700여명이 참석한 가운데 인공지능 중심도시 광주 비전 발표와 산업융합사업단 출범식, 데이터 공유 협력 협약 체결, 광주비전 인공지능 포럼 등이 진행됐다.광주시는 이날 인공지능 광주시대를 열기 위한 비전과 목표, 4대 추진전략 20대 중점과제를 발표했다.또 컨트롤타워 역할을 할 ‘AI산업융합사업단’을 과학기술정보통신부와 공동으로 발족했다.이날 선포식에서 ‘의향 광주를 넘어 AI 광주시대로' 비전과 ‘AI 중심도시 광주(AI Hub City Gwangju)' 목표 아래 3대 가치로 ▲사람중심 ▲공유와 개방 ▲광주형 AI 비즈니스모델 구축 등을 확정했다.4대 추진전략으로 ▲AI 클러스터 조성 ▲광주형 AI비즈니스 생태계 조성 ▲AI인재 양성사다리 구축 ▲시민참여형 AI 도시 만들기를 제시하고 이를 실현하기 위한 20대 중점과제도 발표했다.세계적인 AI 클러스터 조성을 위해 인공지능 집적단지 조성, 데이터센터 구축, AI+ 실증 테스트베드 구축, AI 실증 시범도시 조성, 데이터 산업융합원 설립 등을 추진한다.집적단지는 향후 5년간 4000억여원의 예산을 투입해 첨단3지구 4만6200㎡ 부지에 조성한다.광주형 인공지능 비즈니스 생태계 조성 분야로는 AI 스타트업 육성·지원, AI 기업유치, AI 창업지원 펀드조성, 데이터 생산·가공 및 활용 융합비즈니스 모델 개발, 산업 융합형 AI 기술개발, 글로벌 시장진출 지원 등을 추진한다.AI인재 양성 사다리 구축을 위해 AI대학원(GIST) 개원, AI사관학교 설립, AI 융합대학과정 신설, AI 융합인재 교육, AI 체험 및 학습캠프 운영 등을 추진할 방침이다.시민참여형 AI도시 만들기 분야에서는 My Data 기증운동과 AI 클러스터 포럼 개최, AI 기반 행정서비스 혁신 등을 추진한다. 향후 10년 동안 20대 중점과제가 목표대로 추진되면 개방형데이터센터와 슈퍼컴퓨팅 파워 등 세계적인 수준의 AI 인프라가 광주에 조성되고 AI 창업 1000개, 일자리 창출 7000명, 산업분야별 융복합 AI 인재 5150명 양성 등의 효과가 기대된다.'인공지능 산업융합 사업단'은 인공지능 중심도시 광주 조성을 위한 컨트롤 타워 역할을 하게 되며 2월 중 인력채용과 함께 세부 실행계획을 수립할 예정이다.광주시는 이날 한국전력공사, 한전KDN, 전력거래소, LG전자, 네이버 비즈니스 플랫폼, SKT, KT, LG유플러스, 한국정보화진흥원, 한국인터넷진흥원, 전남대학교병원, 조선대학교병원 등과 업무협약(MOU)을 맺고 각 기관이 보유한 데이터 정보를 공유하기로 했다.최기영 과기정통부장관은 "과기정통부와 광주시가 서로 지혜를 모으고 적극적으로 소통해 인공지능 1등 국가, 대한민국 실현이라는 공동목표를 만들어 가자"고 말했다.이용섭 광주시장은 "2020년은 광주가 의향광주를 넘어 인공지능 광주시대를 여는 원년이 될 것이다"며 "광주시민들의 특별한 DNA를 바탕으로 세계적 수준의 AI집적단지를 조성해 광주가 인공지능 일등국가 대한민국을 견인하겠다"고 강조했다.◎공감언론 뉴시스 kykoo1@newsis.com
[시사오늘] [사색의 窓] 인공지능(AI)과 미래 일자리
2020.01.29
(시사오늘, 시사ON, 시사온=김웅식 논설위원) 이제 인공지능을 거부하기보다는 산업적으로 활용해 생산성을 높이고 경비를 절감하고 새로운 가치를 창조하는 데 이용해야 하는 시점에 와 있다. 인공지능이 인간의 자리를 대체하는 것이 아니라, 인간 혼자 하던 일에 인공지능이 함께함으로써 시너지를 내 더 좋은 결과를 얻도록 하자는 것이다. ⓒ인터넷커뮤니티며칠 전 보도를 통해 인공지능이 ‘우한 폐렴’의 위험성을 한 달여 전에 경고했다는 사실이 밝혀졌다. 65개 언어로 된 언론 보도, 동식물 질병 발생 보고서, 비정상적인 사건 징후를 소개하는 블로그 등을 분석해 예측했다고 한다. 인공지능 알고리즘으로 전 세계 항공 티켓팅 날짜를 분석해 ‘우한 폐렴’의 확산 경로까지 정확하게 알아냈다고 한다. 지금 같아서는 신종 바이러스 감염으로부터 국민의 안전을 지키는 인공지능이 나왔으면 하는 바람이 간절하다. 과학기술 발달에 따라 일자리가 사라지고 새로 생기는 일은 허다하다. 1990년대 초 지역 언론사에 입사했을 때 사무실 한쪽에 납으로 된 글자를 모아놓은 공간이 눈에 띄었다. 납 활자 보관소였다. 납 활자를 뽑아 글자를 만드는 문선공이라는 직업이 있다는 걸 그때 알았다. 그런데 얼마 가지 않아 컴퓨터로 기사 집배신이 이뤄지면서 문선공은 역사 속으로 사라졌다. 오래 전 이야기지만 주산 없이는 은행 일을 못할 정도였다. 주산 실력은 사회생활에서 중요했다. 그래서일까. 초등학교 때 주산 암산 경기대회가 있었고, 몇 명의 학생이 경쟁에서 입상했는가는 학교의 명예를 높이는 데 중요한 기준이 되기도 했다. 그런데 계산기가 나오고 난 뒤 ‘요술’ 같았던 그 주산은 박물관 속 유물이 돼 버렸다. 이세돌 9단이 지난해 인공지능(AI)과 다시 한 번 바둑 대결을 벌였는데, 결과는 2승 1패로 인공지능의 승리였다. 인공지능의 승리로 결판나면서 인공지능 기술이 상당 수준에 도달했다는 것을 인정해야 했다. 인공지능이 특정 분야에서 인간을 뛰어넘을 수 있음을 보여주는 사례는 이어지고 있다. 음악을 작곡하고 글을 쓰는 데서도 인공지능은 인간을 능가하고 있다. 인공지능 의사, 기자, 아나운서가 등장했고 앞으로 많은 분야에 인공지능이 도입될 것이다. 미래 일자리 60%는 지금은 존재하지 않는 새로운 직종일 것이라는 전망이 나온다. 단순 반복적 업무는 인공지능 로봇으로 대체되고 인간은 창의적·감성적인 일자리를 차지하게 될 듯하다. 미국에서는 소설 ‘반지의 제왕’에 버금가는 작문 실력을 갖춘 인공지능이 개발됐다. 개발자들은 이 인공지능의 실력이 뛰어난 나머지 가짜뉴스 양산, 학생들의 과제, 논문 등에 악용될 것을 우려해 시중에 판매하지 않기로 결정했다고 한다. CNN 보도에 따르면, 마이크로소프트와 일론 머스크 테슬라 창립자가 지원하는 비영리 인공지능 연구기업 ‘오픈AI’는 판타지 소설부터 가짜 연예뉴스, 학교 과제까지 작문할 수 있는 인공지능을 개발했다. 이 인공지능은 사용자가 시스템에 문장을 입력하면 해당 문장 다음에 자연스럽게 이어질 문장을 만든다. ‘반지의 제왕’ 속 장면을 담은 문장을 입력하면 그 다음 전개되는 내용을 인공지능이 서술하는 식이다. ‘오픈AI’ 개발자들은 시스템에 ‘레골라스와 김리가 무기를 높이 들고 함성을 지르며 오크족을 향해 진격한다’는 문장을 입력했다. 그랬더니 인공지능은 ‘오크족의 대응은 괴상한 발톱으로 귀를 먹먹하게 할 정도의 맹습을 날리는 것이었다’며 ‘오크족을 공격하기 위해 선두에 선 김리는 “난쟁이여 안심하라”라고 말했다’는 문장을 만들었다.인공지능 로봇이 우리의 일자리를 차지하게 될 것이라는 걱정과 두려움이 전에 없이 퍼지게 되었다. 사회 전반에 인공지능의 활용도가 높아진다는 것은 주요산업뿐 아니라 고용효과가 큰 서비스업에서도 일자리가 줄어들 수 있기 때문이다. 그러나 그런 과정은 생각만큼 빠르게 진행되지는 않을 것이다.이제 인공지능을 거부하기보다는 산업적으로 활용해 생산성을 높이고 경비를 절감하고 새로운 가치를 창조하는 데 이용해야 하는 시점에 와 있다. 인공지능이 인간의 자리를 대체하는 것이 아니라, 인간 혼자 하던 일에 인공지능이 함께함으로써 시너지를 내 더 좋은 결과를 얻도록 하자는 것이다. 저작권자 © 시사오늘(시사ON) 무단전재 및 재배포 금지출처 : 시사오늘(시사ON)(http://www.sisaon.co.kr)
[아시아경제] 중국 인공지능 '또 다른 선택'
2020.01.28
[아시아경제 황준호 기자] "또 다른 선택, 중국 AI."최근 한국전자통신연구원(ETRI)는 올해 7대 인공지능 트렌드 보고서를 통해, '중국 AI의 급부상'과 '미국과 중국 간의 패권 경쟁'이 본격 시작될 것이라며 이같이 밝혔다. 그간 AI를 선도한 미국과는 다른, AI 세계를 구축한 중국을 주목할 필요가 있다는 것이다. 중국, AI 패권 경쟁 중국에는 15대 AI 오픈 플랫폼 기업이 있다. 중국 정부가 'AI 국가대표팀'이라 불리는 기업들로 민관 협동으로 기술 혁신과 기술 사업화에 나서고 있다.예를 들면 '위챗'과 같은 기업이 이에 해당한다. 위챗은 실생활의 행동 흐름을 데이터로 수집해 AI가 스스로 소비자의 욕구를 읽고 행동을 예측할 수 있다.연구원은 "중국은 데이터 양뿐만 아니라 질적인 측면에서도 데이터를 활용해 중국 특유의 AI 색채를 내기 시작했다"며 "중국 정부의 기술 실리주의적 접근은 기술과 시장의 공진화 정책을 낳았다. 많은 나라들이 AI 국가 전략을 추진하고 있지만 중국만큼 단기간에 성과를 낸 나라는 찾기 어렵다"고 밝혔다. 중국 AI '국가 주도', '개인데이터', '정부가 소비자'.중국 AI의 가장 큰 특징은 정부가 AI 산업의 먹이사슬의 위아래로 존재한다는 점이다. 중국 정부가 AI 기업들에게 개인 데이터를 과감히 제공하면서 AI 산업을 키우는 동시에, AI 기업들이 내놓은 제품이나 서비스를 활용하는 최대 소비자로서 존재한다.예를 들어, 얼굴인식 플랫폼을 개발하는 센스타임(SenseTime)은 범죄자 검거에 활용할 수 있는 AI 시스템을 개발했다. 이 과정에서 20억 개의 얼굴 정보를 사용했다. 중국 정부가 보유한 1억7600만 개의 감시 카메라에서 받은 데이터 들이다.만 연구원은 이같은 중국의 강력한 AI 정책과 성공은 주변 강대국들을 자극하고 있다고 봤다. 데이터 패권을 장악해 4차 산업혁명의 주도권을 잡으려는 강대국 간의 군비 경쟁을 촉발할 수 있다고 우려했다. AI 패권 경쟁.. 주변국의 경계중국은 올해까지 AI를 선진국 수준까지 높이는 것이 목표다. 이어 2030년에는 미국을 넘어, 세계 AI 혁신의 중심국가가 되겠다고 발표했다.중국을 가장 경계하는 것은 미국이다. 지난해 10월 미국은 센스타임, 메그 비, 아이플라이텍 등 중국의 대표적 AI 기업들을 거래제한 기업 리스트(Entity List)에 올렸다. 화웨이, 하이크비전 등에 이어 새로운 중국 AI 기업들을 추가했다. 트럼프 행정부는 지난해 2월 '인공지능 분야에서 미국의 리더십 유지'라는 행정명령에 서명하기도했다. 그는 미국 AI 기술 우위를 보호하고 중요한 AI 기술을 경쟁국 및 적대국으로부터 보호 하는 환경을 조성해야한다고 밝혔다. AI 내셔널리즘연구원은 이같은 양 국의 AI 전략 수립과 추진은 자국의 데이터, 서비스 등을 보호하고 타국의 영향력을 줄이려는 새로운 형태의 데이터 민족주의로 발현되고 있다고 봤다.미국과 중국 뿐만이 아니다. 양국의 패권 경쟁 속에서 살아남으려는 유럽은 자체 AI 생태계를 구축하기 위해 각종 정책을 시행하고 있다. 우리나라도 정부가 지난해 AI 국가전략을 발표하고, 국회가 데이터 3법을 통과시키는 등 AI 국가전략을 본격 추진하기 위한 준비작업을 마쳤다.김명준 ETRI 원장은 "이번 보고서는 지난해 12월 정부에서‘AI 국가전략’을 발표함에 따라 AI R&D 전략 수립을 위한 방향 설정을 돕는 것이 목적이다. 국가 차원에서 AI 전략을 지엽적으로 파악하거나 범위를 제대로 설정하지 않으면 글로벌 패권 경쟁에서 도태될 수 있다"고 설명했다. 황준호 기자 rephwang@asiae.co.kr
[매일경제] 피차이 구글 CEO "인공지능, 불·전기보다 영향력 더 심대해"
2020.01.23
피차이 구글 CEO "인공지능, 불·전기보다 영향력 더 심대해""헬스케어, 인공지능 잠재력 가장 큰 분야" 순다르 피차이 알파벳·구글 최고경영자(CEO)가 인공지능(AI)이 불이나 전기보다도 더 영향력이 심대하다고 말했다고 블룸버그·로이터 통신이 22일(현지시간) 보도했다.피차이 CEO는 이날 스위스 다보스에서 열린 세계경제포럼(WEF) 콘퍼런스에서 "인공지능은 우리 인류가 작업하고 있는 가장 영향력이 큰 것들 중 하나"라며 "그것은 불이나 전기보다 더 영향력이 심대하다"고 말했다.인공지능이 몰고 올 여파가 인류 문명에 중대한 전환점이 된 불이나 전기의 발견보다 더 심원할 것으로 진단한 것이다.그는 다만 "인공지능은 기후와 다르지 않다"며 "한 국가 또는 몇 개 국가들만 노력해서는 안전을 확보할 수 없다. 전 세계적인 프레임워크가 필요하다"고 말했다. 그러면서 인공지능을 규제하기 위한 미국과 유럽의 현행 프레임워크는 "훌륭한 출발점"이라며 인공지능이 책임감 있게 개발되려면 많은 나라가 파리기후변화협정과 유사한 국제적 합의를 바탕으로 함께 일해야 한다고 말했다.피차이는 또 얼굴 인식 같은 기술은 실종자를 찾는 등 좋은 일에 쓰일 수 있지만 대중 감시 같은 부정적인 결과를 가져올 수도 있다고 지적했다.그는 아울러 의료(헬스케어) 분야가 향후 5∼10년간 인공지능을 이용해 결과를 향상시킬 수 있는 가장 큰 잠재력을 제공할 것이라고 말했다.그는 구글이 헬스케어 부문에서 의료업체 어센션과 클라우드 컴퓨팅 사업을 하는 것을 놓고 건강 정보 유출 등 프라이버시 침해 우려가 일고 있는 점을 언급한 뒤 "하지만 잠재력을 보라"고 말했다.피차이는 "암은 종종 놓치기도 하는데 그에 따른 결과의 차이는 매우 크다"며 "예를 들어 폐암에서 5명의 전문가는 이런 방식에 동의하고 다른 5명은 다른 방식에 동의할 수 있다. 우리는 이를 개선하기 위해 인공지능을 이용할 수 있다는 것을 안다"고 말했다.그는 그러면서도 사생활 침해에 대한 우려에 주의를 기울이겠다고 덧붙였다.알파벳과 그 자회사인 구글은 인공지능 개발에 가장 적극적인 주요 정보기술(IT) 공룡 중 하나다.일례로 구글은 수년간 자기공명영상진단(MRI) 영상이나 다른 환자 데이터를 자동으로 분석해 질환을 진단하거나 예측할 수 있는 인공지능을 개발하려고 노력해왔다.[연합뉴스]
[첨단 헬로티] 2020년 인공지능 7대 트렌드는?
2020.01.22
[첨단 헬로티] 한국전자통신연구원(이하 ETRI)은 4차 산업혁명의 파동을 분석한 ‘2020년 AI 7대 트렌드’ 보고서를 발간했다고 밝혔다. 부제는 ‘인식을 넘어서’다. 2020년 AI 7대 트렌드 보고서에서 제시한 7대 트렌드는 다음과 같다. 첫 번째, ‘또 다른 선택, 중국 AI’이다. 그간 많은 산업의 기술을 선도하는 것은 미국이었다. 하지만 중국은 정부 주도로 풍부한 ‘데이터 가치사슬’을 창출하며 자신만의 AI 색채를 가진 새로운 길을 만들기 시작했다. 즉, AI 전략이 기술경쟁을 넘어 강대국 간 패권 경쟁을 촉발하고 있다.두 번째, ‘AI 내셔널리즘’이다. 최근 AI와 관련한 자국의 데이터, 서비스 등을 보호하고 타국의 영향력을 줄이려는 새로운 국민(민족)주의가 나타나고 있다. AI 선도 기업과 서비스들은 무역 거래제한 조치, 조세 제도, 개인정보 보호법 등에 의해 국경을 넘는 데 어려움을 겪고 있다. 보고서에서는 AI 기술이 정치 질서와 맞물리며 국가 간 과학기술 격차는 물론 강력한 무기화 가능성을 지적한다. 세 번째, ‘증강 분석과 다크 데이터’이다. AI 기술은 기존에 없던 분석 기법을 통해, 보유하고 있지만 활용하지 못했던 대다수의 데이터 범위와 분석의 한계를 없애고 있다. 인공지능이 인간의 의사결정을 돕고 통찰력과 새로운 가치를 제공하는 것이다. 네 번째, ‘R&D 혁신지능’이다. 자율주행차, 인공지능 의사 왓슨 등을 통해 AI는 산업을 대대적으로 혁신하고 있음을 여실히 보여줬다. 그러나 AI 활용의 더 큰 가치는 연구자로서 인간이 생각하는 방식을 바꿔 R&D 생산성을 향상시킬 수 있다는 데 있다. 다섯 번째, ‘창작지능의 진화’다. AI가 만든 그림, 소설, 영화는 인공지능이 창작까지 할 수 있음을 보였다. 나아가서 단순한 모방 수준이 아니라 인간을 넘어서는 설계, 전략 도출의 가능성에 주목한다. 여섯 번째, ‘AI 호문쿨루스(Homunculus)’다. 인간의 뇌는 감각 기관이 활동할 때 가장 많이 활성화된다. 인간의 지능도 신체의 형태, 기능과 연관을 맺으며 진화해왔다. AI 역시 기술력을 보다 발전시키고 자율성을 확보하기 위해서는 자동차, 드론, 로봇 팔 등 물리적 실체를 통한 외부 환경과의 상호작용 연구의 중요성이 더욱 커짐을 시사하고 있다. 일곱 번째, AI 시대가 요구하는 ‘새로운 컴퓨팅 폼팩터’다. 인텔의 칩셋이 표준형 PC라는 폼팩터를 정의했듯이 AI 또한 GPU, ASIC 등과 깊은 관계를 맺고 있기에 새로운 전용 연산장치들이 어떠한 역할을 하며 시장 구도를 만들어나갈지 주의를 기울여야 한다. ‘2020년 AI 7대 트렌드’ 보고서는 ETRI 홈페이지 공지사항을 통해 볼 수 있다./조상록 기자(mandt@hellot.net)Copyright ⓒ 첨단 & Hellot.net
[정책브리핑] 인공지능강국 실현을 뒷받침하는 소프트웨어 인재양성 본격 추진
2020.01.20
인공지능강국 실현을 뒷받침하는소프트웨어 인재양성 본격 추진- 작년대비 23% 증가한 1,633억 원 예산 투입, 14만 명 교육 지원 - □ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)가 올해부터 소프트웨어(SW)교육에 인공지능(AI)역량을 강화하고, 새로운 혁신SW교육 프로그램 도입과 지역 SW교육도 확대하는 등 SW․AI인재양성을 본격 강화한다. ㅇ 과기정통부는 이러한 내용을 담은 ‘SW인재양성․저변확충 사업’의 시행계획을 확정하고, 1월부터적극 지원에 나선다. ㅇ SW인재양성을 위한 올해 총 예산은 작년대비 23% 증가(384억 원)한 1,633억 원으로, 초․중․고·대학 등 교육과정을 통해 약 14만 명을 교육하고, 프로그래밍 경시대회, 해커톤, 온라인 SW교육 등도 지원할 계획이다. □ 2020년 SW인재양성을 위한 주요사업 내용은 다음과 같다. (1) 먼저, 산업현장 수요에 부합하는 수준 높은 맞춤형 실무인재 양성을 위해 SW중심대학 40개교를 지원(800억 원)하여, SW전공과정과 융합교육을 통한 SW전문․융합인재를 양성한다. (2) AI․4차산업혁명을 선도할 리더급 고급 인재양성을 본격화하기 위해 프랑스 에꼴42*의 혁신적 프로그램을 도입한 이노베이션 아카데미를 작년12월 개소하여, 올해 2월 1기 250명을 시작으로 750명, 향후 매년 500명의 혁신 SW인재를 배출할 계획이다.* 에꼴42는 자기주도 학습의 소프트웨어 교육 프로그램으로, 미국(실리콘밸리), 핀란드, 스페인, 일본 등 전 세계 13국가(17개 도시)에서 운영 ㅇ 또한 최고전문가의 멘토링을 중심으로 심화교육을 지원하는 ‘SW마에스트로’를 지원하고(150명, 86억 원) ㅇ 대학 연구실을 선정하여 SW분야의 원천기술 연구개발(R&D)을 통해 고급 연구 인력을 양성하는 ‘SW스타랩’도 작년 29개 연구실에서 올해 36개까지 확대 지원한다. □ 초․중․고 교육은 그동안의SW기초교육을 넘어 AI 등을 포함한 심화교육을 올해부터 실시한다. ㅇ AI․데이터 특화교육을 제공하는 ‘AI교육 시범학교’를 전국 150개교에서 운영하고, ㅇ AI 등이 포함된 SW 심화과목 개설을 위해 초․중 교과서 2종 및 고교 교과서 4종을 개발하고, SW․AI교육 역량을 갖춘 핵심교원 2,500명 양성을 위한 AI수업설계, 교육과정 분석 등 연수도 추진할 계획이다. □ 또한 도서산간 등 지역 인재를 대상으로 ‘SW 미래채움센터’를 현재 5개에서 10개까지 확대 개소하여, 정보소외계층 SW교육 격차 해소를 지원하고, ㅇ SW․AI 교구재를 활용한 실습형 교육 프로그램(150시간) 개발과청년․경력단절여성․은퇴개발자 등을 대상으로 한 SW 전문강사 인력도 1,000명 양성할 계획이다. □ 한편, 5세대(5G) 이동통신 상용화 이후 핵심서비스로 떠오르는 실감콘텐츠 전문 인재 양성(’20년, 825명)을 위해 대학원생, 재직자, 학부생 대상으로 콘텐츠 개발 교육도 추진한다. ㅇ 실감콘텐츠 연구실(XR랩)을 운영(7개)하여 전문역량을 보유한석·박사급 고급인재(160명)를 양성하고, 콘텐츠 분야 재직자를 대상으로 기업 수요연계 과제 방식의 실무교육(600명) 실시, 대학생 대상으로는 제조·안전 분야 가상현실(VR) 모의실험 콘텐츠 개발 교육(65명)을 실시할 계획이다. □ 과기정통부 송경희 소프트웨어정책관은 “AI시대에 AI를 구현하는 SW의 중요성이 더욱 커지고 있다.”라면서, “SW 인재양성을 통한 AI일등국가 실현을 위해 향후 더욱 지원을 확대할 계획”이라고 밝혔다. "이 자료는 과학기술정보통신부의 보도자료를 전재하여 제공함을 알려드립니다."
[아시아경제] 데이터 3法에 '인공지능 더 똑똑해진다'
2020.01.13
데이터3法 통과빅데이터 양과 질 확보 가능데이터 하위법 개정 등 숙제 [아시아경제 황준호 기자] 데이터 3법이 통과되면서 인공지능(AI)이 더욱 똑똑해질 수 있는 근간이 마련됐다. 가명정보 등 기존보다 더 정확하고 방대한 정보를 활용할 수 있게 되면서, AI의 질적 향상이 기대된다. 정밀 의료, 핀테크 등의 AI 산업에 혁명적 변화가 예상된다. 빅데이터의 질 향상, 인공지능의 고도화지난 9일 개인정보보호법, 신용정보법, 정보통신망법 개정안 등 데이터 3법이 국회 본회의를 통과하면서 가명정보를 빅데이터로 활용할 수 있는 길이 마련됐다. 가명정보는 개인정보 중에 특정인이 거론될 수 있는 정보를 뺀 정보다. 예를 들어, 홍길동, 30세, 남성, 010-0000-0000이라고 하면 개인정보지만 홍XX, 30대, 남성, 010-XXXX-XXXX이라고 하면 가명정보다. 정보의 실체가 더욱 투명해지면서 정보들을 집약한 빅데이터의 정확성도 올라가고 이를 학습하는 AI도 똑똑해진다. AI가 똑똑해진다는 것은 개인 친화적인 AI가 구축된다는 것을 뜻한다. 예를 들어, 특정 인물에게 최적화 된 상품이나 콘텐츠를 추천할 수 있다. 특정 인물의 의료 데이터를 활용한 정밀 의료도 가능해진다. 반대로, 각 특정 데이터들을 모아 하나의 성향을 파악하거나, 문제의 해결책을 내놓는 것도 가능해진다. 산업계에서는 그간 개인정보에 대한 법적 허용 범위가 좁아, AI를 고도화 하는데 애를 먹어 왔다. 우리나라의 AI는 선도국인 미국보다 2년 정도 뒤쳐진 것으로 평가받는다. 정보통신기획평가원(IITP)의 ICT 기술수준조사 보고서에 따르면 우리나라의 AI 기술 수준은 미국의 81.6% 수준이다. 빅데이터는 미국의 83.4%로 주요 국가 중 가장 낮은 수준을 나타냈다. 이제야 4차산업혁명 본격 대응 산업계는 이제야 본격적인 4차산업혁명 대응에 나설 수 있게 됐다고 입을 모은다. 대한상의는 "데이터는 4차 산업혁명 시대의 원유와 같은 것으로 빅데이터, 인공지능 등 신산업 분야의 새로운 사업모델을 개발하는 일은 물론 기업들이 고객 수요와 시장 흐름을 조기에 파악·대응하는데 큰 힘이 될 것으로 기대한다"라고 밝혔다. 본격적인 수혜가 예상되는 분야는 의료, 금융, 통신 등이다. 제약 ·바이오 업계는 AI를 통한 신약 개발에 기대를 걸고 있다. 의료정보, 유전체, 생활 건강 데이터 등 보건·의료 빅데이터를 통해 더욱 똑똑해진 AI를 활용해 신약을 개발하게 할 수 있는 길이 마련됐다고 평가한다. 핀테크 업계도 금융혁신의 물꼬가 트였다는 판단이다. 한국핀테크산업협회는 "국회 본회의에서 '데이터 3법' 통과로 4차 산업혁명의 기반을 만들었다"며 "지금과 같이 핀테크의 법제도적 근간이 확립되고 혁신과 성장이 계속된다면 대한민국의 핀테크 기술 역량과 ICT 인프라를 바탕으로 한 금융산업이 결국엔 대한민국의 미래성장을 견인할 것"이라고 밝혔다. 통신업계에서는 5G B2B산업이 본격 일어날 것으로 예상한다. 5G는 지난해 세계 최초로 상용화한 이동통신망으로 LTE보다 최고 20배 빠른 망이다. 통신업계는 게임, 가상현실(VR)·증강현실(AR) 등 5G 신규 서비스를 통해 일반 소비자를 모으고 있다. 하지만 이들의 궁극적으로 확보하고자 하는 5G 고객은 기업들이다. 자율주행차, 스마트 팩토리, 스마트시티 등 데이터 경제의 대동맥으로 5G를 활용하게 만든다는 게 목표다. AI강국 위해 산적한 숙제 정부는 데이터 3법의 하위법 개정과 함께 지난달 발표한 AI 국가전략을 차질 없이 수행해 나간다는 방침이다. 하지만 가명정보의 처리 방식, 개인정보 유출에 따른 처벌 등을 정하는데 있어, 사회적 합의를 얻기가 쉽지 않을 것으로 예상된다. 시민단체 등에서는 데이터 3법의 국회 통과를 두고 "정보 인권을 도둑맞았다"며 반발하고 있는 상태다. 참여연대와 경제정의실천시민연합 등 시민사회단체들은 성명을 통해 "기업의 이윤 추구를 위해 개인의 신용정보·질병정보 등에 광범위하게 접근하고 관리할 길을 열어줬다"며 "헌법소원과 국민 캠페인 등 가능한 모든 수단을 동원해 정보인권침해 3법의 재개정에 매진할 것"이라고 강조했다. 황준호 기자 rephwang@asiae.co.kr
[인공지능신문] 자연언어처리(NLP) 무엇인가... 그 기술과 시장은?
2020.01.10
l 2019년 11.8조원 규모서 2024년 30.5조원으로 연평균 21.0 % 성장 자연 언어 처리(Natural Language Processing, 이하 NLP)는 컴퓨터와 인간 언어 사이의 상호 작용하는 기술로 인공지능의 핵심 기능 중 하나이다. 1950년대부터 기계 번역과 같은 자연어 처리 기술이 연구되기 시작했다.1990년대 이후에는 대량의 말뭉치(corpus) 데이터를 활용하는 기계학습 기반 및 통계적 자연어 처리 기법이 주류를 이뤘다. 하지만 최근에는 딥러닝과 딥러닝기반의 자연어처리가 방대한 텍스트로부터 의미 있는 정보를 추출하고 활용하기 위한 언어처리 연구 개발이 전 세계적으로 활발히 진행되고 있다.NLP 기술은 기계번역, 대화체 질의응답 시스템 대화시스템, 정보검색, 말뭉치 구축, 시맨틱웹, 텍, 딥러닝, 그리고 빅데이터 분석 분야뿐만 아니라 인간의 언어정보처리 원리와 이해를 위한 언어학과 뇌인지 언어정보처리 분야까지 핵심적인 요소로 작용하고 있다.특히 2018년 구글이 공개한 BERT(버트)는 종래보다 우수한 성능을 발휘한다. BERT는 자연언어 처리 태스크를 교육 없이 양방향으로 사전 학습하는 첫 시스템이기 때문이다. '교육 없음'이란 BERT가 보통의 텍스트 말뭉치만을 이용해 훈련되고 있다는 것을 의미한다. 이것은 웹(Web) 상에서 막대한 양의 보통 텍스트 데이터가 여러 언어로 이용 가능하기 때문에 중요한 특징으로 꼽는다. (본지 보도 참조: 인공지능(AI) 언어모델 ‘BERT(버트)'는 무엇인가?) 또한 NLP에는 자연어 분석, 자연어 이해, 자연어 생성 등의 기술이 사용된다. 자연어 분석은 그 정도에 따라 형태소 분석(morphological analysis), 구문 분석(syntactic analysis), 하나로써 문장의 의미에 기저(基底)하여 그 문장을 해석하는 시멘틱 분석(semantic analysis)과 문장이 실제로 무슨 의미를 내포하는지 결정하는 실용 분석(pragmatic analysis) 등으로 크게 나누어 구분할 수 있다.최근 NLP 솔루션은 전 산업에서 활용돼 혁신을 가속하고 있다. 특히 은행, 금융 서비스 및 보험 등에서는 고객을 유지하고 비용을 절감하며, 수익을 높이고 변화하는 규칙과 규정 등을 준수해야 한다. 이에 솔루션은 기업의 정보 검색, 의도 분석, 고객 서비스 등과 규정 준수 프로세스 자동화 및 응용 프로그램을 효율적으로 수행하고 그에 따르는 위험을 완화하도록 돕고 있다.또 NLP 솔루션을 사용해 프로세스를 자동화하면 은행, 금융 서비스 및 보험 등의 기업은 생산성을 향상시키는 데 도움이 될 뿐만 아니라 해석 프로세스의 오류 발생 가능성을 현저히 낮추고 회사가 구조화되고 구조화되지 않은 데이터를 처리하는 방식을 최적화 한다.이 시장 또한 치열하다. 지난달 30일(현지시간) 발표된 리서치앤마켓의 보고서에 따르면 2019년 102억 달러(약 11조8천억원)에서 2024년 264억 달러(약 30조5천억원) 시장으로 예측 기간 동안 21.0 %의 CAGR로 성장한다고 예상했다.이 시장의 주요 성장 요인으로는 스마트 기기 사용 증가와 클라우드 기반 솔루션 채택 증가, 고객 서비스 개선을 위한 NPL 기반 애플리케이션의 증가, 의료 산업에 대한 기술 투자 증가 등을 꼽았다. 그럼 NLP 시장은 어떻게 구성되는지 살펴보자.우선, 구성 요소별로 솔루션과 서비스로 분류된다. 서비스를 통해 조직은 전문적이고 관리되는 건강한 소비자 관계를 유지할 수 있다. 또 이러한 서비스는 기업이 자원 사용을 최대화하고 활동을 효과적으로 실행해 비즈니스 운영을 향상시키는 데 도움을 준다.또 솔루션은 유형, 배포 모드 등으로 분류된다. 업종별 NLP 시장은 은행, 금융 서비스 및 보험, 소매 및 전자 상거래, 제조, 의료 및 생명 과학, 정부 및 국방, 미디어 및 엔터테인먼트, IT 및 통신, 여행, 연구, 교육, 에너지 및 유틸리티 등으로 구분된다.컴포넌트 세그먼트는 솔루션과 서비스로 구성되며, 솔루션은 소프트웨어 도구와 플랫폼으로 구분되지만 서비스는 관리 서비스와 전문 서비스(지원 및 유지 관리, 컨설팅, 배포 및 통합)로 구분된다.배포 모드 별 NLP 시장은 클라우드 및 온-프레미스로 조직 규모에 따라 시장은 대기업과 중소기업으로, 응용 프로그램 별 NLP 시장은 기계 번역, 정보 추출, 자동 요약, 질문 답변, 텍스트 분류, 감정 분석 및 기타(스팸 인식 및 언어 감지 등)로 분류된다.이처럼 NLP 솔루션의 채택이 증가함에 따라 지원 및 유지 보수와 같은 새로운 서비스의 필요성도 증가할 것으로 예상된다. 또 NLP의 진화는 기업과 소비자 모두에게 여러모로 중요한 영향을 미칠 것이며, 인간 언어의 의미와 뉘앙스를 이해할 수 있는 알고리즘으로 진화하면서 의료 산업이나 법률, 교육계 등 다양한 분야에서 어떤 파급 효과를 가져올 것인지 상상이 가능해진다. 그럼 국내 시장 상황은 어떤가. 시장을 말하기 보다는 국내 NLP 배경을 살펴보자.특히 시장과 NLP 응용 솔루션에 기반이 되는 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 자료 ‘말뭉치(말모둠, 글모둠)’는 양이 클수록 AI가 인식(이해)할 수 있는 자연어의 정확도가 높아지며, AI가 얼마나 많이 학습하느냐에 그 성능을 좌우한다.이에 따라 각국은 국가 경쟁력 차원에서 사업을 추진하고 있으며, 일본의 경우 150억 어절, 중국은 300~800억 어절, 미국은 300억 어절을 구축, 응용 솔루션이나 AI 개발에 힘쓰고 있다.이에 반해 우리는 주요 경쟁국에 비해 1%도 채 안되는 실정이다.국내에서는 지난 1998년부터 정부가 ‘21세기 세종계획’을 통해 ‘세종 말뭉치’를 구축해왔다. 하지만 2007년 이후로 사업이 중단돼 있다. 이런 상태에서 정부도 자연어처리 등 AI의 핵심기술 개발을 위한 국어 자료 구축이 필요하다고 판단해 2017년을 시작으로 지난해 국립국어원 예산 중 말뭉치 구축만을 위한 예산 204억원을 별도로 책정해 10억 어절을 말뭉치로 구축하는 사업을 진행하고 있다.이를 관련 기술 개발 등을 추진하는 기관이나 기업 등에 제공한다. 오는 2022년까지 150억 어절 규모의 말뭉치를 구축하는 것이 목표이다. 꼭 10년 만에 정부 주도의 말뭉치 구축 사업을 재개하는 셈이다.지난해 6월 과기정통부의 소프트웨어 분야의 국가 혁신기술 개발형 연구개발 과제인 혁신성장동력 프로젝트로 추진 중인 엑소브레인 사업에서 한국전자통신연구원(ETRI)은 최첨단 한국어 언어모델 ‘코버트(KorBERT)’를 공개했다. 공개한 모델은 두 종류다. 구글의 언어표현 방법을 기반으로 더 많은 한국어 데이터를 넣어 만든 언어모델과 한국어의 ‘교착어’ 특성까지 반영해 만든 언어모델이다. 이 기술은 지난해 3월 한컴오피스 지식검색 베타버전에 탑재되기도 했다.또 언어처리를 위한 딥러닝 기술을 개발하기 위해서는 텍스트에 기술된 어절을 숫자로 표현해야 한다. 이를 위해 그동안 언어를 활용한 서비스를 개발하는 기관에서는 주로 구글의 다국어 언어모델 버트(BERT)를 사용했다.버트는 문장 내 어절을 한 글자씩 나눈 뒤, 앞뒤로 자주 만나는 글자끼리 단어로 인식한다. 이 방식은 2017년 11월 처음 공개되었을 때 언어처리 11개 분야에서 많은 성능 향상을 이뤄 주목을 받았다.그동안 구글은 40여 만 건의 위키백과 문서 데이터를 사용해 한국어 언어모델을 개발해 왔다. ETRI 연구진은 여기에 23기가(GB)에 달하는 지난 10년간의 신문기사와 백과사전 정보를 더해 45억개의 형태소를 학습시켜 구글보다 많은 한국어 데이터를 기반으로 언어모델을 개발했다.하지만 구글과 ETRI의 언어모델 개발에 활용한 BERT 방식은 현재, 약 512개 이상의 단어가 들어간 문서를 한 번에 처리하지 못한다.또한 단순히 입력한 데이터양만을 늘리는 것은 언어모델 고도화에 한계가 있다. 아울러, 한글은 다른 언어와 달리 어근에 조사가 붙는 교착어로 한국어의 의미 최소 단위인 형태소까지 고려해 한국어특성을 최대한 반영한 언어모델을 만드는데 심혈을 기울였다.특히 ETRI는 한국어에 최적화된 언어모델이 '전처리 과정에서 형태소를 분석한 언어모델', '한국어에 최적화된 학습 파라미터', '방대한 데이터 기반' 등이 구글과 차별성 있는 것이 특징이다.개발된 언어모델은 성능을 확인하는 5가지 기준에서 구글이 배포한 한국어 모델보다 성능이 평균 4.5% 가량 우수했다고 한다. 특히, 단락 순위화(Passage Ranking) 기준에서는 7.4%나 높은 수치를 기록했다.아울러 지난해 6월 공개된 언어모델을 활용하면 서비스 성능 및 경쟁력을 높일 수 있어 딥러닝 연구, 교육 등의 목적으로 대학, 기업, 기관의 개발자들의 많은 활용이 이루어지고 있다. 개발된 언어모델은 대표적인 딥러닝 프레임워크인 파이토치(PyTorch)와 텐서플로우(Tensorflow) 환경 모두에서 사용 가능하며, 공공인공지능 오픈 API‧데이터 서비스 포털(바로가기)에서 쉽게 찾아볼 수 있다. 카카오는 2018년 말부터 딥러닝 기반 형태소(形態素, morpheme) 분석기 '카이(khaiii)'를 오픈소스로 제공하고 있다. 딥러닝을 통해 학습한 데이터를 활용해 형태소를 분석하는 모델이다. 딥러닝 기술 중 하나인 콘볼루션 신경망(CNN, Convolutional Neural Network)을 이용해 음절기반으로 형태소를 분석하는 방법을 채택했다.세종 코퍼스를 기반으로 데이터의 오류를 수정하고 카카오에서 자체 구축한 데이터를 추가해 85만 문장, 1003만 어절의 데이터를 학습하여 정확도를 높였다. 또 딥러닝 과정에서 C++ 언어를 적용해 일반적으로 딥러닝에 쓰이는 GPU(그래픽처리장치)를 사용하지 않고도 빠른 분석 속도를 구현했다.형태소 분석 기술은 2개 이상의 글자로 이루어진 단어 혹은 문장을 입력 시, 의미를 가진 언어 단위 중 가장 작은 단위인 형태소 단위로 자동으로 분리하는 기술이다. 예를 들면, '학교에 간다'라고 입력하면 '학교/명사 + 에/조사 + 가/동사 + ㄴ다/어미' 로 형태소 단위와 품사를 파악해 분류해내는 기술이다.깃허브(GitHub)에서 확인할 수 있으며, 누구나 무료로 이용 가능하며(깃허브 바로가기), 주로 자연어처리 응용 서비스의 기반 기술로 사용되며, 정보 검색, 기계 번역, 스마트 스피커나 챗봇 등 여러 서비스에서 사용할 수 있다. 네이버는 업계에서 가장 먼저 선도적으로 NLP의 중요성을 인식하고 개발과 투자로 축적한 기술력과 서비스 노하우를 바탕으로 네이버 검색이 자연어 처리 분야에서 검색 이용자의 의도를 더욱 잘 이해하는 검색으로 진화하고 있다. 또 모바일 상에서의 검색이 일상화된 이용자들을 위해 AI 기술 기반 검색어 교정 시스템인 ‘AIQSpell’ 개발에 힘써왔다. 딥러닝을 비롯한 최신의 AI 기술을 활용해 기존의 검색어 교정 시스템을 대체했으며, 최근 이에 대한 유의미한 성과가 나타나고 있다.먼저, 오타 질의들에 대한 검색어 교정량이 43% 증가했다. 예를 들어 ‘목포에세 군산깢 가는버’라고 검색을 했을 때 ‘목포에서 군산까지 가는 법’으로 교정하거나, ‘꿰양성 대장염치료제는 업는지’를 검색하면 ‘궤양성 대장염 치료제는 없는지’로 자동 변환하여 제공하는 방식으로, 비교적 긴 질의에서 발생하는 오타를 알맞은 검색어로 교정하는 비율이 대폭 증가했다.특히 맞춤법 오류나 오타 등으로 인해 검색결과가 0건으로 나타나는 ‘검색결과 0건 질의’ 역시 크게 감소했다. 이와 함께 최신 AI 기술의 적용으로 자동완성 서비스 역시 대폭 개선되었다. 지난해 9월 개편된 네이버 자동완성에는 빅데이터 분석기술을 활용한 시스템이 도입되었다.해당 모델은 오타가 발생했을 가능성, 순서가 뒤집혔을 가능성, 그리고 사용자가 많이 찾는 검색어일 가능성 등을 조합해 추천 검색어 후보들의 최종 점수를 계산하여 적절한 검색어를 제공한다.이를 통해 이용자는 단어 순서를 바꾸어 입력해도, 구체적인 검색어가 기억나지 않더라도 기존에 비해 적은 타이핑으로 더욱 정확한 검색 결과를 얻을 수 있다. 또 NLP 연구 성과에서도 지난해 11월 3일에서 7일까지 5일간 홍콩에서 진행된 세계 최고 권위의 자연어처리 분야 학회(EMNLP-IJCNLP 2019)에서 네이버는 주요 성과를 공개했다. 다국어 읽기 이해도를 위한 제한된 데이터 학습으로 충분한 학습데이터가 존재하지 않는 언어에 대해 기계번역 및 자동 레이블링을 통해 데이터를 자동으로 구축하는 방법 등을 소개했다.또 DB 정보가 불명확한 상황에서도 적용가능한 자연질의-SQL 변환 방법을 제안하는 '부족한 자연어 질문에서 의사 SQL 쿼리 생성', 보다 다양한 문장 생성을 위한 모델을 제시하는 '다양한 생성을 위한 혼합 콘텐츠 선택', 사용자 질의 자동완성 품질을 향상시키는 방법을 제시하는 '쿼리 자동 완성을 위한 하위 단어 언어 모델' 등을 발표하기도 했다. 이와는 별도로 컴퓨터가 사람처럼 주어진 문서를 읽고 이해한 후 질문에 대한 정답을 찾아내는 MRC 테스트의 하나로 구글, MS, 페이스북, IBM, 앨런 AI연구소, 카네기 멜론 대학 등 글로벌 IT 기업과 유수의 연구소가 막대한 자금을 투자하며 연구 중인 'SQuAD(The Stanford Question Answering Dataset)' 분야에 국내 딥러닝 기반 QA(Question Answering) 검색 기술을 개발하는 AI 스타트업 포티투마루(대표 김동환)가 지난해 스탠퍼드 대학(Leland Stanford Junior University)에서 주관하는 세계 최대의 기계 독해 경진대회인 SQuAD 2.0에서 스타트업으로는 전 세계 최초로 3위를 기록해 큰 주목을 받기도 했다.지난해 9월 LG CNS는 국내 처음이자 유일하게 AI의 연어 이해를 위한 AI 학습용 표준데이터 ‘코쿼드 2.0(KorQuAD 2.0)’를 공개하고 국내 AI 업계에 무료로 개방했다. ‘코쿼드 2.0’은 한국어 표준데이터를 7만개에서 10만개로 확대하고 단답형에서 장문의 답변이 가능한 AI를 개발할 수 있도록 데이터를 강화한 버전이다.예를 들어, “대한민국의 수도와 그 면적은?” 이라는 질문에 “서울특별시, 605.25km2 입니다” 라고 답하는 AI는 코쿼드 1.0 학습만으로 충분히 개발 가능했다. 하지만 “서울특별시의 특징은?” 이라는 질문에 “도시 중앙으로 한강이 흐르고 북한산, 관악산, 도봉산 등의 여러 산들로 둘러싸인…” 이라는 장문의 답을 이제, 코쿼드 2.0으로 학습을 통해 가능해진 것이다.특히 한국어 표준데이터 코쿼드 2.0은 AI가 표나 리스트 형태에 담긴 정보도 읽어 답변할 수 있게끔 표준데이터 범위도 확대했다. 정보 4만건과 질의응답 세트 10만건으로 구성되어 있다. 10만건의 질의응답 세트 중 약 9만건은 AI 학습용으로 사용되고, 1만건은 개발된 AI의 성능 평가용으로 사용된다.아울러 코쿼드 학습으로 개발된 AI는 코쿼드 홈페이지에 등록해 성능 평가를 받을 수 있으며 리더보드에 등재돼 다른 AI와의 성능 수준을 비교해볼 수도 있다. 성능 평가 결과는 EM(실제 정답과 정확하게 일치하는 비율)과 F1(정답과 유사한 답변을 내놓는 비율) 점수로 나타난다, 사람은 평균 EM(80.17점), F1(91.20점)을 기록한다.현재 리더보드 1위인 네이버가 코쿼드를 사용해 개발한 AI의경우 EM(86.84점), F1(94.75점)을 기록 중이며, 이는 사람보다 높은 답변 수준임을 나타내고 있는 것이다. 한편, AI의 연어 이해를 위한 AI 학습용 표준데이터는 코쿼드 웹사이트(바로가기)에서 다운로드 받을 수 있으며 누구나 활용 가능하다.한편, 가장 최근의 글로벌 NLP 솔루션에서는 최첨단 AI 언어모델 중 하나인 구글 버트(BERT)를 한 시간 내에 훈련시키고, 2밀리초(ms) 만에 AI 인퍼런스를 완료한 최초의 모델로 실시간 대화형 인공지능(AI)을 통해 기업이 고객과 보다 자연스럽게 소통할 수 있는 엔비디아 '언어 이해 모델'을 꼽을 수 있다.대화형 AI 서비스는 몇 년 동안 제한적으로 존재해왔다. 현재까지 방대한 AI 모델을 배치하는 것이 불가능해 챗봇, 지능형 개인 비서, 검색 엔진 서비스가 인간 수준의 이해력 갖춘 채로 작동되기는 매우 어려웠던 것이 사실이다. 엔비디아는 AI 플랫폼에 핵심 최적화 기능을 추가해 이러한 문제를 해결했으며, AI 훈련과 인퍼런스를 기록적인 속도로 수행하고 현재까지 가장 방대한 언어 모델을 구축한 것이다.이 획기적인 성능 수준을 통해 개발자는 전세계 수억 명의 소비자가 사용할 수 있는 대규모 애플리케이션용 최신 언어 이해 기능을 사용할 수 있다.마이크로소프트(Microsoft)와 세계에서 가장 혁신적인 몇몇 스타트업을 포함한 기업들은 초기부터 엔비디아를 채택해 그 성능 향상을 확인했다. 이들은 엔비디아 플랫폼을 활용해 자사의 고객을 위해 매우 직관적이고 즉각적인 반응형 언어 기반 서비스를 개발하고 있다.또 개발자들이 대화형 AI에서 이러한 혁신을 달성하는 데 필요한 소프트웨어를 최적화했다. 주요 플랫폼으로는 파이토치(PyTorch)를 사용한 BERT 트레이닝 코드(깃허브 다운), NCC모델 스크립트 및 텐서플로우(TensorFlow)용 체크포인트, 텐서RT 최적화 BERT 샘플, 더 빠른 트랜스포머(Transformer): C++ API 텐서RT 플러그인 및 텐서플로우 OP, BERT 훈련 및 인퍼런스 용 AMP를 지원하는 MXNet 글루온-NLP(Gluon-NLP), AI Hub의 텐서RT 최적화 BERT 쥬피터(Jupyter) 노트북, 대규모 트렌스포머 모델 훈련을 위한 파이토치 코드, 엔비디아 BERT 추론은 허깅 페이스(Hugging Face), 텐서RT와 BERT를 통한 실시간 자연어 이해 등이 있다.또한 주목해 볼 것은 바이두(Baidu)는 지난해 7월 말 완전히 새로운 NLP 프레임 워크 ‘ERNIE 2.0’을 오픈 소스로 공개했다. 이 프레임 워크는 중국어와 영어로 16 개의 NLP 작업에서 구글의 BERT와 지난해 공개돼 BERT의 성능을 한참 뛰어 넘는다는 XLNet 모델(다운)을 능가했다고 덧붙였다.이 것은 곧바로 현실로 다가왔다. 바이두의 NLP '어니(ERNIE2.0)'가 지난달 초 열린 기계가 인간의 언어를 얼마나 잘 이해하는지 평가하는 대회 'GLUE(General Language Understanding Evaluation)'에서 구글, 마이크로소프트(MS) 등을 누르고 90.1점으로 신기록을 세우며 세계 1위를 차지한 것이다. 구글과 MS는 각각 89.9점과 89.7점을 기록해 2,3위에 올랐다.(아래 도표 참조) 또 BERT와 XLNet의 감독되지 않은 언어 표현 모델은 자연어 추론, 의미론적 유사성, 명명 된 엔터티(Enterty) 인식, 정서 분석 및 질문-응답 일치를 포함하여 다양한 자연어 이해 작업에서 중요한 돌파구를 마련했다. 이는 대규모 코퍼스에 대한 사전 훈련이 자연어 처리에 중요한 역할을 할 수 있음을 나타낸다.예를 들어, BERT는 단어와 문장의 동시 발생 정보를 캡처하기 위해 양방향 언어 모델 작업과 다음 문장 예측 작업을 구성하며, XLNet은 단어의 동시 발생 정보를 캡처하기 위한 순열 언어 모델 작업을 구성한다. 사전 훈련 모델의 훈련 절차는 주로 단어 나 문장의 동시 발생을 모델링하는 몇 가지 간단한 작업을 기반으로 한다.그러나 완전히 새로운 바이두의 NLP 프레임 워크는 언제든지 다양한 사용자 정의 된 작업을 점진적으로 도입할 수 있으며 작업 전체에서 어휘, 구문 및 의미 정보를 인코딩할 수 있는 다중 작업을 통해 학습된다. 또 새로운 작업이 주어지면 프레임 워크는 이전 작업의 매개 변수를 잊지 않고 분산 표현을 점차적으로 훈련시킬 수 있다.이밖에 구글은 지난해 10월 검색서비스에 문장의 의미를 이해하는 인공지능(AI) 기술을 도입한다고 발표했다.인터넷에 있는 대량의 데이터를 이용해 AI가 자연언어를 효율적으로 학습하고 검색 결과의 일부를 강조해 표시하는 기능으로 사용하기 시작했다. 하지만, 검색 결과의 랭킹 표시 방식에도 적용하는 것으로 이 기술을 사용하면 누구나 자신의 최신 질문 응답 시스템을 학습할 수 있다
[첨단 헬로티] AI를 한눈에…국제인공지능대전(AI EXPO KOREA 2020)’ 5월 개최
2020.01.08
[첨단 헬로티] 2020년 5월 19일부터 21일까지 사흘간 서울 삼성동 코엑스에서 제3회 '국제인공지능대전(AI EXPO KOREA 2020)'이 국내외 AI 전문기업과 기관 250여개사가 참가해 총 350부스 규모로 개최될 예정이다. 이번 전시회는 한국인공지능협회, 서울메쎄, 인공지능신문 등 3개 기관이 통합 주최·주관한다. 내년에 개최되는 AI EXPO 2020에 대해 서울메쎄는 "인공지능(AI)의 미래가 우리에게 어떤 의미가 될 것인지, AI가 가져오는 우리 사회와 산업의 혁신은 무엇인지, 관련 AI 최신 기술과 플랫폼·솔루션, AI 기반 비즈니스 모델, 국내외 AI 기업의 비즈니스 전략, 적용 및 도입 전략 등 4차 산업혁명 시대를 혁신으로 이끌 인공지능(AI)의 모든 것을 한눈에 확인하고 공유하고 네트워킹 할 수 있는 장이 될 것이다."고 소개했다. 주요 출품 및 전시품목으로는 “AI Elemental Technologies · H/W · S/W” 분야의 머신러닝, 딥러닝, 뉴럴 네트워크, 강화 학습, 자연어, 음성인식, 이미지인식, AI칩·부품, 컴퓨팅, 플랫폼·솔루션 등과 “AI Applications & Services” 분야로 챗봇 및 어시트턴트, 5G·네트워크, IoT, 자율주행, 의료·헬스케어, 금융, 보안, 제조·유통·소매, AI로봇, 웨어러블, 스마트팩토리, 스마트시티·홈, 드론·UAV, AI콜센터·컨텍센터, 예측유지보수, AI컨설팅 등이다. 부대행사로는 ‘인공지능경진대회’, ‘AI 유저 컨퍼런스’, ‘부대 세미나’, ‘AI스타트업 액셀러레이터(accelerator) 데모데이’ 등 인공지능 관련 다양한 행사가 예정돼 있다. 한편, 올해 7월에 서울 삼성동 코엑스에서 개최된 제2회 국제인공지능대전(AI Expo Korea 2019)’은 과학기술정보통신부, 한국정보화진흥원, 체코투자청, 양재 R&CD 혁신허브, 광주과학기술원(GIST), 광주창조경제혁신센터, 대전지방기상청, 대전창조경제혁신센터, 한국소프트웨어산업협회, 일본인공지능협회, AMII, EEDC 등의 후원과 적극적인 참여로 개최됐다. 또한 SK텔레콤, IBM코리아, 인텔코리아, LG CNS, 트윔, 마인즈랩, 뷰노, 한컴MDS, 솔트룩스, 루닛, 인피닉, 엘젠ICT, 와이즈넛, 티쓰리큐, 위세아이텍, 원더풀플랫폼 등 157개 AI 관련 기업 및 기관이 참여하고 2만 1천 321명이 참관객이 방문해 성공적으로 개최된 바 있다. /김원정 기자(etech@hellot.net)Copyright ⓒ 첨단 & Hellot.net
[G밸리뉴스] 2020년 5월 ‘제3회 국제인공지능대전’ 개최… 인공지능의 모든 것 볼 수 있어
2020.01.08
[G밸리뉴스 김가람 기자] 2020년 5월 19일부터 21일까지 사흘간 서울 삼성동 코엑스에서 제3회 ‘국제인공지능대전(AI EXPO KOREA 2020)’이 국내외 AI전문기업과 기관 250여개사의 참가와 350부스 규모로 한국인공지능협회(회장 김병훈), 국내외 ICT관련 전문 전시기업 서울메쎄인터내셔널(대표 박병호), 인공지능신문 등 3개 기관이 통합 주최·주관한다.또한 AI EXPO KOREA 2020에서는 인공지능(AI)이 미래가 우리에게 어떤 의미가 될 것인지 AI가 가져오는 우리 사회와 산업의 혁신은 무엇인지 관련 AI 최신 기술과 플랫폼·솔루션, AI 기반 비즈니스 모델, 국내외 AI 기업의 비즈니스 전략, 적용 및 도입 전략 등 4차 산업혁명 시대를 혁신으로 이끌 인공지능(AI)의 모든 것을 한눈에 확인하고 공유하고 네트워킹 할 수 있는 장이 사흘간 펼쳐진다.주요 출품 및 전시품목으로는 ‘AI Elemental Technologies·H/W·S/W’ 분야의 머신러닝, 딥러닝, 뉴럴 네트워크, 강화 학습, 자연어, 음성인식, AI칩·부품, 컴퓨팅, 플랫폼·솔루션 등과 ‘AI Applications & Services’ 분야로 챗봇 및 어시트턴트, 5G·네트워크, IoT, 자율주행, 의료·헬스케어, 금융, 보안, 제조·유통·소매, AI로봇, 웨어러블, 스마트팩토리, 스마트시티·홈, 드론·UAV, AI콜센터·컨텍센터, 예측유지보수, AI컨설팅 등과 ‘인공지능경진대회’, ‘AI스타트업 액셀러레이터(accelerator) 데모데이’ 등 인공지능 관련 다양한 행사가 예정돼 있다.우리는 인공지능(AI)이란 새로운 시대를 맞고 있다. 인공지능(AI)은 이제 우리 삶과 사회와 산업 전반을 변화시키고 있는 거대한 흐름이다. 인공지능에서 새로운 가치를 발견하는 것은 그리 녹녹치 않지만 확실한 것은 사회와 산업전반에 큰 영향과 변화가 진행되고 있는 것이다.금융, 신약, 유통 시스템에서부터 자율 주행 차량에서 AI로봇 및 지능형 개인 비서, 스마트홈 장치에 이르기까지 우리 주변의 세계는 근본적인 변화를 겪어 가고 있으며 또한 우리의 삶의 방식을 변화시키고 있다.기업은 인공지능을 통해 ​​제품의 시장 경쟁력과 기회를 창출하기 위한 제품의 차별화와 비용 효율적인 성능을 개선하고 생산성을 높이고 수익을 얻을 수 있다는 인식이 점차 확산됨에 따라 글로벌 기업들은 물론 다양한 산업과 기업에서 인공지능 투자에 총력을 기울이고 있다. 기업들은 각자의 AI 도입 정도와 성숙도에 따라 각기 다른 비용을 투자하고 있으며 이에 따른 성과를 경험하고 있다.출처 : G밸리(http://www.gvalley.co.kr)
[전자신문] 솔트룩스, 국제 인공지능대전서 AI 고객센터 소개한다
2019.09.24
솔트룩스(대표 이경일)는 17~19일 사흘간 코엑스 C홀에서 열리는 '2019 국제 인공지능대전'에 참가해 인공지능(AI) 고객센터 등을 선보인다.솔트룩스는 △AI 고객센터 △챗봇 △데이터과학 △음성인식·합성 등 네 가지 카테고리별 전문 영업대표가 AI 도입에 관심있는 방문객을 만난다. 전시 부스에서 설문 이벤트로 매일 선착순 100명에게 선물을 증정한다.<지난해 인공지능×로봇 서밋에 참가한 솔트룩스 부스. 전자신문DB> 행사 첫날인 17일 오후 3시 AI·데이터 트랜스포메이션 콘퍼런스에서 김일정 솔트룩스 부사장이 금융권 최초로 고객센터 상담사 업무지원에 AI 서비스를 도입사례를 발표한다. 해당 은행은 업계 최초로 지식그래프 기술과 기존 검색·텍스트 마이닝 기술 앙상블 AI 방식으로 구현됐다. FAQ 수준 단순 상담에 그치지 않고 사전에 정의되지 않은 질문에 대해 90% 이상 정확한 답변을 제공한다. 다른 국내기업과 해외기업까지 견학 올 정도 성공사례로 주목받는다.솔트룩스는 19년간 AI 사업 글로벌 경쟁력 확보를 위해 150억건 이상 대규모 데이터를 축적, 자산화했다. 매출 30% 이상을 연구개발에 투자했다.110건 이상 기술 특허출원과 60건 이상 등록특허, 93건 등록 소프트웨어를 보유하고 매년 20% 이상 성장 중이다. 사람 언어를 이해하고 학습하는 AI 플랫폼 '아담' 출시에 이어 사용자와 함께 성장하는 새로운 진화형 AI '에바' 2020년 상용화를 목표로 기술개발과 혁신을 추진한다.박종진기자 truth@etnews.com