본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

AI/Data

다가오는 인공지능 시대! 머신러닝과 딥러닝 이야기

2016.09.07

안녕하세요. LG CNS 대학생 기자단 6기 김용훈입니다.

최근 일본 도쿄대와 IBM의 협력으로 개발된 인공지능 로봇 ‘왓슨(Watson)’이 방대한 양의 의료 논문을 학습하여 한 60대 여성 환자의 백혈병 치료에 큰 기여를 했다는 사실이 밝혀져 많은 관심을 받았는데요.

이와 더불어 올해 초 구글의 인공지능 바둑 프로그램인 알파고와 이세돌 9단의 바둑대결로 인공지능 기술이 더 이상 먼 미래의 일이 아니라는 것을 느낄 수 있었습니다.

이처럼 인공지능 기술은 이제 공상과학 영화뿐만 아니라 현실에서도 접할 수 있는데요. 여러분은 인공지능 기술이 언제부터 등장했는지 알고 계신가요?

인공지능이란 말은 1956년 다트머스 대학에서 열린 콘퍼런스에서 처음 언급되었습니다. 이 후 냉전 시대에 해당 분야에 대한 연구가 활발히 진행되었고, 1997년 IBM이 개발한 딥 블루(Deep Blue)1가 세계 체스 챔피언을 이기며 세계적인 관심을 받게 되었는데요. 인터넷 보급으로 방대한 양의 데이터가 축적되면서 현재 가장 활발하게 연구되는 과학 분야로 발전하게 되었습니다.

이번 시간에는 인공지능에 대한 방대한 내용 중 인공지능의 학습법인 머신러닝(Machine Learning)과 딥러닝(Deep Learning), 그리고 이를 구현할 수 있는 인공지능 엔진에 대해 소개해 드리도록 하겠습니다.

보다 자세한 인공지능에 대한 소개는 LG CNS 블로그를 참고해 주세요.

  • 이세돌과 알파고의 대결을 통해 살펴본 인공지능: http://blog.lgcns.com/1059

머신러닝과 딥러닝

인공지능의 한 분야인 머신러닝은 글자 그대로 기계가 학습을 한다는 것으로 해석할 수 있는데요. 이 기술은 대규모의 빅데이터를 분석해서 앞으로의 미래를 예측할 수 있다는 특징을 갖고 있습니다.

머신러닝은 복잡한 알고리즘이나 프로그래밍을 설계할 수 있으며, 다양한 분야에 응용할 수 있다는 점에서 더욱 주목을 받고 있습니다. 이러한 머신러닝의 알고리즘을 만들기 위해서는 다음과 같은 세 가지 방법이 이용되고 있습니다.

우선 미리 이용자가 만든 데이터를 입력한 뒤 출력까지 이끌어내는 감독(supervised) 학습 방법이 있습니다. 입력된 데이터만큼 정확도가 높아지기 때문에 데이터의 양이 많아질수록 신뢰성 있는 출력값을 낼 수 있다는 특징이 있습니다.

다음으로 출력 없이 입력만으로 패턴을 모델링 하는 비감독(unsupervised) 학습 방법입니다. 이는 컴퓨터가 스스로 학습한 뒤 응용하여 원하는 출력값을 이끌어내는 방법인데요. 높은 수준의 연산 능력이 요구되며, 현재 대부분의 데이터 마이닝(Data Mining) 기법에 사용되고 있습니다.

마지막으로 방대한 양의 데이터를 컴퓨터 스스로 학습한 후에 생기는 피드백을, 다시 학습하여 알고리즘을 생성하는 방법인 강화(reinforcement) 학습이 있는데요. 이세돌 9단과 대결한 알파고에 적용된 학습법입니다.

머신러닝은 위와 같은 과정을 통해 데이터를 학습하여 패턴을 분석한 뒤, 시시각각 변하는 상황에 따라 직접 판단을 할 수 있는 능력을 갖게 되었습니다.

딥러닝은 흔히 머신러닝과 같이 언급되는 경우가 많은데요. 딥러닝이란 여러 층의 인공 신경망 모양으로 구성되어 있으며, 머신러닝에 속해 있는 학습법 중 한 가지입니다. 이를 통해 여러 상황을 직접 학습시키지 않아도 다양한 상황을 스스로 판단을 내릴 수 있다는 점이 큰 특징입니다.

딥러닝이 효과적으로 이용되기 위해서는 앞서 머신러닝에서 말한 것처럼 많은 데이터를 바탕으로 진행되어야 신뢰성 있는 결과를 얻을 수 있는데요. 이 때 얻은 데이터로 일정한 패턴을 파악하여 모양과 형태뿐만 아니라 추상적인 대상까지도 분석할 수 있습니다.

l CVPR 2015 학회에서 발표된 이미지 인식 예시 (출처: http://goo.gl/DOV3wB)

특히 딥러닝 기술은 작년에 열린 세계 최고 권위의 컴퓨터 비전 및 패턴 인식 학회인 ‘CVPR 2015 (Computer Vision and Pattern Recognition 2015)’에서 이미지를 인식하여 문장으로 설명하는 단계에 도달했다는 것을 발표하는 등 현재 여러 나라에서 활발히 연구 중입니다.

이외에도 구글의 알파고나 페이스북의 얼굴인식 등 다양한 분야에서 사용되고 있으며, 향후 자율주행 자동차에 적용하기 위한 물체 인식 기술이나 장애물 센서 분야에서 중요한 역할을 담당할 것으로 예상되고 있습니다.

다양한 머신러닝 엔진

인공지능 산업이 발달함에 따라 다양한 형태의 인공지능 엔진이 개발되었는데요. 인공지능의 개발적인 한계를 극복하기 위한 방법으로 여러 기업들이 오픈소스 형태를 따르게 되었습니다. 지금부터 소개해드릴 사례는 현재 일반인들에게도 공개된 오픈소스형 인공지능 엔진입니다.

① 구글 텐서플로우(Google TensorFlow)

l 텐서플로우 (출처: http://goo.gl/v20XRg)

텐서플로우는 구글이 작년 오픈소스 라이브러리를 공개한 머신러닝 엔진인데요. 현재 많은 사용자들이 이용하고 있는 C++ 언어와 파이선(Phython)을 사용하기 때문에 접근성이 높은 머신러닝 기술입니다.

텐서플로우는 모바일 기기에서도 데이터 분석이 가능하다는 장점과 이를 이용하여 상업적으로 활용할 수 있도록 했다는 것이 큰 특징인데요. 하지만 데이터 부분은 공개된 것이 아니기 때문에 이는 사용자가 직접 시스템을 이해하고 구축해야 한다는 제한이 있습니다.

현재 텐서플로우는 구글 포토와 알파고에 직접 사용되고 있는데요. 최근에는 피아노 곡을 작곡하는데 성공하여 많은 관심을 불러 일으켰습니다. 구글은 텐서플로우 외에도 TPU(Tensor Processing Unit)와 같은 머신러닝을 위한 하드웨어를 개발하는 등 인공지능 개발에 다방면으로 노력하고 있습니다.

② 마이크로소프트 DMTK(Distributed Machine Learning Toolkit)

l DMTK (출처: http://goo.gl/EzyDsJ)

마이크로소프트도 지난해 DMTK(Distributed Machine Learning Toolkit)라는 머신러닝 엔진을 오픈소스로 공개했는데요. 이는 이름 그대로 머신러닝 분산 시스템을 의미하는 것으로 한 번에 여러 노드 위에서 원하는 작업을 할 수 있습니다.

또한 C++ 기반의 소프트웨어 개발 키트를 강점으로 삼고 있기 때문에 인공지능을 구축하려는 사람들에게 편의를 제공하고 있는데요.

공개 당시 MPI 와 ZMQ라는 2개의 라이브러리를 사용할 수 있도록 설정되었고, 소스 코드에는 모델 훈련에 사용되는 중요한 알고리즘들이 포함되어 조 단위의 매개변수를 사용할 수 있다는 장점이 있습니다.

현재 마이크로소프트는 인공지능 기술의 기반이 되는 에저(Azure)라는 클라우드 플랫폼을 개발하여 세계 2위의 시장 점유율을 보이고 있는데요. 앞으로의 행보가 기대됩니다.

③ 페이스북 토치(Facebook Torch)

l 토치 (출처: http://goo.gl/MZe9gF)

페이스북을 이용하면서 자동으로 얼굴을 인식하여 태그되는 경험을 해보신 적이 있나요? 이는 페이스북의 딥페이스라는 기술로 구현된 것인데요. 무려 97.25%의 정확한 인식률을 보이고 있다고 합니다.

토치는 얼굴인식 등으로 인공지능 역량을 인정받은 페이스북이 딥러닝을 활용하여 오픈소스 형태로 공개한 머신러닝 엔진인데요. 특히 페이스북에서는 이미지 분석과 광고 산업에 효과가 있으며, 스타트업 기업들에게 적합한 플랫폼이라는 것을 강조했습니다.

페이스북은 올해 초 토치와 세계적인 게임 엔진인 언리얼(Unreal) 엔진을 결합한 UETorch 라는 새로운 형태의 인공지능 엔진을 발표했는데요. 이를 통해 인공지능으로 구현할 상황을 가상의 게임 환경에 미리 적용하여 기술에 대한 안전성을 더욱 높일 것으로 예상되고 있습니다.

앞으로의 전망

l 인텔 제온 파이 프로세서 (출처: http://goo.gl/cknGzK)

머신러닝 기술이 대중화되면서 고성능 하드웨어에 대한 관심도 높아지고 있는 추세인데요. 그 결과를 반영하듯 인텔에서는 기존 GPU 위주의 인공지능 하드웨어 시장을 공략하기 위해 CPU와 GPU의 장점을 결합한 인텔 제온 파이 프로세서(Intel Xeon Phi coprocessor)를 선보였습니다.

이로 인해 현재 GPU 1위 기업인 엔디비아(NVIDIA)와의 경쟁은 더욱 치열해질 것으로 예상되고 있는데요. 미국 최대의 케이블 TV 업체인 컴캐스트(Comcast)의 경우 머신러닝을 이용한 개인 맞춤형 콘텐츠를 제공하고 있는 등 인공지능은 다양한 산업에 영향을 주고 있습니다.

국내에서는 올해 10월에 LG전자를 비롯한 국내 7개 기업들이 30억원씩 출자하여 설립한 ‘지능정보연구원’이 개원한다고 합니다. 이 연구소는 인공지능 산업을 발전시키는 것을 목표로 앞으로 5년간 750억원 규모의 연구비를 국책사업을 통해 지원받으며, 산업에 직접적으로 적용할 수 있는 인공지능 기술을 중점적으로 연구할 예정입니다.

또한 최근 LG CNS에서는 인간형 로봇인 ‘페퍼(Pepper)’용 앱을 개발할 수 있는 Android용 SDK 개발에 성공하여 페퍼 제조사인 로보틱스에 공급한다고 밝히기도 하였습니다.

  • LG CNS, 인간형 로봇 ‘Pepper’용 Android SDK 개발: http://blog.lgcns.com/1168

이처럼 인공지능이 많은 관심을 받으며 실생활에 가까워진 만큼 위험 요소도 함께 증가하고 있는데요. 예를 들어 자율주행 자동차가 위기 상황을 어떻게 극복할지에 대한 논의나 개인의 프라이버시 침해 등 다양한 관점에서의 문제가 거론되고 있습니다.

인공지능이 발전하여 인간의 편의성을 증대시키는 것은 긍정적이라고 생각하지만 더 심각한 문제를 야기하기 전에 이에 대한 대비책을 마련하는 것도 기술 개발만큼의 깊은 고민이 필요하다고 생각합니다.

현재 세계 시장에 비해서 국내 인공지능에 대한 연구 개발이 충분히 이뤄진 상황은 아니지만, 최근 정부 주도하에 많은 노력들이 있기 때문에 더 큰 발전이 있을 것으로 예상됩니다. 앞으로 우리나라가 인공지능 산업의 선도적인 국가로 성장하길 기대합니다.

  • 딥 블루(Deep Blue): 1초 동안에 10억 가지 방법을 계산할 수 있는 체스 전용 컴퓨터. IBM이 개발하였다. 1997년 5월에 러시아의 체스 세계 챔피언인 갈리 카스펠로프와 대전하여 2승 1패 3무로 승리했다. 컴퓨터가 인간 체스 챔피언을 이긴 것은 사상 최초이다. [네이버 지식백과] [본문으로]

챗봇과 대화를 할 수 있어요