본문 바로가기

블로그

LG CNS 기술블로그 DX Lounge에서 최신 IT 소식을 만나보세요!

AI/Data

딥러닝, 데이터로 세상을 파악하다(1)

2020.03.23

최근 몇 년 전부터 지금에 이르기까지 산업계에서 가장 화두가 되는 단어 중 하나는 바로 AI(Artificial Intelligence), 즉 인공지능입니다.

‘인공지능’이라 함은 넓은 의미에서는 인간의 합리적인 사고나 행동을 모방해 자동화한 프로세스를 일컫는대요. 간단하게 생각하면 숫자와 연산기호 버튼만 눌러서 자동으로 값을 계산해 주는 계산기도 일종의 인공지능이라고 볼 수 있겠습니다. 인간이 매번 필요할 때마다 일일이 셈을 계산하지 않고도 자동으로 계산을 도와주니까요.

하지만 이런 자동화 프로그램은 예전부터 있었으며, ‘인공지능’이라고 거창하게 부르지도 않았습니다. 최근에 학계와 산업계에 불고 있는 AI 열풍은 이렇게 단순히 ‘규칙의 자동화’를 지칭하는 넓은 의미의 인공지능이 아닐 겁니다.

AI, Machine Learning, Deep Learning

요즘 회자하는 AI는 좁은 의미로 딥러닝(Deep Learning) 기반의 인공지능을 일컫는 경우가 대부분입니다.

딥러닝은 인공신경망(Artificial Neural Network)으로 이루어진 모델을 활용해 기계가 의사결정에 필요한 특징을 데이터로부터 알아서 추출하고 최종 판단을 내리는 기계학습(Machine Learning)의 한 방식입니다.

인공신경망은 기계학습의 하위 기법의 하나지만, 빅데이터 붐이 일면서 유행한 회귀 분석(Regression Analysis), 의사결정 나무(Decision Tree) 등의 전통적인 머신러닝 기법과는 조금 차이가 있습니다.

전통적인 머신러닝 기법은 주로 정형 데이터를 다룹니다. 관계형 데이터베이스(Relational Database)나 엑셀 표로 정리되는 테이블 데이터를 생각하시면 되겠습니다. 의사결정에 필요한 데이터를 사람이 정리해 기계에 알려주면 기계는 이 정보를 토대로 판단이나 예측을 하는 경우입니다.

반면 딥러닝은 주로 비정형 데이터를 다룹니다. 비정형 데이터란 지정된 방식으로 정리되지 않은 정보를 말합니다. 간단히 말하자면 이미지, 비디오, 텍스트 문장이나 문서, 음성 데이터 등을 말합니다.

넓은 의미의 AI라고 할 수 있는 기존의 룰 기반 자동화 방법, 그리고 빅데이터 붐을 타고 유행한 전통적인 머신러닝 기법 기반의 AI, 최근에 유행한 딥러닝 기반의 AI 차이점을 가상의 예시를 통해 알아보겠습니다.

[펫 카페 사장의 고민]
예를 들어 여러분이 다양한 종의 강아지와 고양이를 풀어놓고 손님들에게 입장료를 받는 펫 카페를 운영하고 있다고 가정해봅시다.

여러분은 밤에 카페 운영을 마감하고 퇴근하기 전에 가게에 풀어놓았던 강아지와 고양이들을 각자의 우리로 돌려보내야 합니다. 여러분이 퇴근하면 강아지와 고양이들이 서로 싸우기 때문이죠. 하지만 밤이 되면 여러분은 녹초가 되어 일일이 한 마리씩 강아지, 고양이 우리에 넣을 체력이 남아있지 않습니다.

그렇다고 아르바이트를 쓸 만큼 재정이 넉넉하지도 않습니다. 여러분은 어떤 기계가 있어서, 앞에 등장한 생물체가 강아지인지 고양이인지를 자동으로 구별해 우리에 넣어 주기를 원합니다.

l 여러분은 다양한 강아지와 고양이로 힐링 받을 수 있는 꿈의 펫 카페 주인입니다

기계가 자동으로 강아지와 고양이를 구별하게 하려면 어떻게 해야 할까요? 인간이 가지고 있는 강아지와 고양이에 대한 지식을 기계에 전수할 방법을 생각해봅시다. 여러분이 펫 카페를 운영하면서 습득한, 강아지와 고양이를 구별할 수 있는 주요 특징(Feature)을 나열해보겠습니다.

고양이는 대체로 귀가 작고 뾰족하고, 주둥이 길이가 상대적으로 강아지보다 짧은 특징이 있습니다. 또 박스를 던져 주면 고양이는 그 안에 들어가고, 강아지는 박스를 물어뜯고 좋아합니다. 그렇다면 이 정보를 토대로 기계에 규칙을 알려주면 우리 대신 분류를 자동화할 수 있지 않을까요?

룰 기반의 AI

전문가의 지식을 토대로 분류 규칙을 만들어 프로그래밍하면 가장 간단한 형태의 자동화 시스템을 만들 수 있습니다.

‘귀가 빳빳하고 각도가 60 이하면 고양이이다.’, ‘주둥이 길이가 5cm 이하면 고양이이다.’, ‘박스를 줬을 때 들어가면 고양이이다.’ 같은 규칙들을 if-else 구문으로 짜서, 기계에 눈앞의 생물에 대한 귀 각도, 주둥이 길이, 박스 선호도를 전달 인자로 주면 여러분은 가장 단순한 형태의 인공지능을 만들 수 있습니다.

인공지능이라고 부르기엔 조금 거창하지만, 사람이 일일이 해야 하는 일을 기계가 대신 자동으로 할 수 있으므로 넓은 의미에서는 인공지능이라고 할 수 있습니다.

머신러닝 기반의 AI

선형회귀, 의사결정 나무와 같은 전통적인 머신러닝 기법들은 주요 특징만 가지고 분류 규칙을 자동으로 찾아줄 수 있습니다.

단, 전문가가 판단했을 때 분류에 중요한 특징은 지정해 줘야 합니다. 이 경우 ‘귀 각도’, ‘주둥이 길이’, ‘박스 선호도’가 되겠네요. 머신러닝 알고리즘은 고양이와 강아지의 데이터들을 토대로 두 종을 가장 잘 구분할 수 있는 귀 각도 값, 주둥이 길이 값, 박스 선호도 여부의 조합 조건을 찾아낼 것입니다.

고양이와 강아지를 자동으로 분류하기 위한 가장 직관적인 룰 기반 AI 방식과 중요한 특징으로부터 기계가 자동 분류 모델을 만들어내는 머신러닝 기반의 AI 방식에 대해 알아보았습니다. 다음 시간에는 같은 예시와 함께 딥러닝 기반의 AI 방법에 대해서 이어 연재하도록 하겠습니다.

글 l LG CNS AI빅데이터연구소

[참고 문헌]

챗봇과 대화를 할 수 있어요