본문 바로가기

블로그

IT 트렌드의 최신 소식을 만나보세요.

IT Trend

듣고, 맡고, 맛본다! 인간의 감각을 배우는 AI

2022.04.14

신체의 감각수용기 종류로 분류한 시각, 청각, 후각, 미각, 촉각의 다섯 가지 감각을 ‘오감’이라고 말합니다. 시각은 망막, 청각은 달팽이관, 후각은 비점막, 미각은 혀, 촉각은 피부가 수용기이죠. 과거부터 컴퓨터 과학 분야에서 시각과 촉각은 중요한 연구 대상이었습니다. 시각은 인간의 모든 감각수용기 중 약 70%가 눈에 있는 만큼 가장 중요한 감각으로 꼽히기 때문입니다. 인간이 컴퓨터와 원활하게 상호작용하려면 인간이 보는 것을 컴퓨터도 똑같이 보고, 인지할 수 있어야 했으니 말입니다. 

촉각의 경우도 비슷합니다. 촉각의 전달 속도는 70m/s로 매우 빠르고, 빛이나 소리처럼 공중으로 확산해 정보를 퍼뜨리는 속성이 없어서 촉감의 재현으로 컴퓨터가 인간과 상호작용하는 방법은 지금도 널리 사용되고 있습니다. 그렇다면 청각, 후각, 미각은 어떨까요?

아리발레 AI 코 (출처: aryballe)

인간의 감각을 재현하는 기술은 수십 년 동안 개발됐습니다. 그러나 기술력이 뒷받침되지 못했고, 효용성도 찾기 어려웠습니다. 그리하여 그나마 상호작용에 즉각적으로 활용할 수 있는 시각과 촉각에 거의 모든 연구가 집중됐습니다. 실제로 컴퓨터 인터페이스는 인간의 시각을 기준으로 발전했습니다. 그나마 청각이 시각 다음으로 많은 정보를 전달하는 감각이기에 인터페이스로서 가능성을 볼 수 있었던 거죠. 

다만, 전통적인 음성 인식 기술은 특정 음향 신호를 처리하는 단계에 머물렀습니다. 예를 들어, 들리는 노래를 찾아주는 샤잠(Shazam)과 같은 앱은 노래를 정확히 마이크에 인식시킬 수 있는 환경에서는 정확히 노래를 찾지만, 시끄러운 환경에서는 섞인 여러 소리를 구분할 수 없어서 곡을 찾지 못합니다. 인간은 여러 소리가 섞인 환경이라도 필요한 소리를 집중해서 듣고, 찾아서 상호작용할 수 있죠.

코클 (출처: cochi)

서울대 음악오디오연구실 출신들이 모여서 설립한 스타트업 ‘코클(Cochl)’은 비언어적 소리에 인공지능(AI) 기술을 결합한 딥러닝 기계 청각 시스템 (Machine Listening System)을 개발합니다. 보통 컴퓨터 분야에서 청각은 인간과 상호작용하기 위한 수단으로 연구되는 탓에 사람의 목소리와 언어를 컴퓨터가 인지하게 하는 기술에 초점을 두고 있습니다. 

반면, 코클은 기침 소리, 문 여는 소리, 자동차 소리처럼 비언어적 소리에 집중합니다. 실제 인간이 상호작용하는 데에 언어만 사용하지 않기 때문입니다. 가령 잦은 기침 소리는 목이 건조하거나 실내 공기가 좋지 않다는 신호일 수 있습니다. 기침이 지속되는 걸 감지하여 가습기와 공기청정기를 자동으로 작동하고, 질병 우려가 있을 수 있으니 실내 온도를 높일 수 있을 겁니다.

회사에 따르면, 현재 일상생활에서 들리는 약 40가지 소리를 감지할 수 있습니다. ‘코클 센스(Cochl.Sense)’는 소리의 상세 식별을 전달하는 솔루션으로 AI가 소리를 분석하면 어떤 소리를 들었는지 인간이 확인할 수 있게 알려줍니다. 이로써 주변에 어떤 상황이 벌어졌었는지 혹은 지금 무슨 일이 벌어지고 있는지 파악할 수 있습니다. 

이 AI 시스템은 클라우드와 엣지에서 구동해 어느 환경에나 쉽게 적용할 수 있는데요. 2020년에는 독일 자동차 제조사 메르세데스 벤츠(Mercedes Benz)와 기밀유지 협약(NDA)을 맺었습니다. 청각 시스템이 차량과 접목할 부분이 많다는 게 핵심이었습니다. 오늘날 자동차는 점점 외부 소음을 완벽히 차단하는 쪽으로 발전하고 있는데, 차량 내부에서 소리로 외부 상황을 파악할 수 없는 경우라면 AI 청각이 대신 어떤 상황인지 알려줄 수 있겠죠.

후각의 디지털화 역사도 꽤 깁니다. 센서로 냄새를 인식하는 ‘전자 코(Electronic Nose)’는 1980년대부터 개발돼왔습니다. 그러나 컴퓨터가 냄새를 정확하게 측정하는 건 쉽지 않다는 게 일반적인 견해였죠. 최초의 실용적 전화기를 발명한 알렉산더 그레이엄 벨(Alexander Graham Bell)은 “한 냄새가 다른 냄새보다 두 배 강하다는 걸 알 수 있는가? 두 종류의 냄새와 다른 냄새의 차이를 측정할 수 있는가?’라면서 ‘다양한 종류의 냄새에 유사성과 차이점을 측정할 수 있을 때까지는 냄새를 객관적으로 판단하는 기술은 존재하지 않을 것”이라고 말했습니다. 냄새의 특징을 구분할 수는 있으나 정량화하는 건 어렵다는 얘기입니다. 오늘날 AI는 과거에는 불가능해 보였던 이런 문제도 해결하고 있습니다.

아리발레 (출처: aryballe)

아리발레(Aryballe)는 AI 기술로 냄새 분석 기술을 개발하는 프랑스 스타트업입니다. 생화학 센서, 광학, 머신러닝을 하나의 객관적인 솔루션으로 결합해 수집한 냄새 데이터를 분석하는 것이죠. 이를 통해 훈련된 인간이 평가하던 냄새 관련 문제를 AI가 해결하도록 하여 평가에 일관성을 부여하고, 객관적으로 판단할 수 있게 돕습니다. 냄새가 나는 분자들을 감지하고, 이 분자들이 조합되었을 때 어떤 냄새가 나고, 그 냄새를 인간이 맡았을 때 어떻다는 걸 정량적인 데이터로 보여주는 겁니다.

CEO 샘 길라우메(Sam Guilaumé)는 “냄새는 과학적으로 묘사할 수 없는 분야라서 AI가 필요하다”라고 말합니다. 예컨대, 현대의 자동차 실내는 굉장히 다양한 소재가 배치된 작은 공간입니다. 각 소재에서 어떤 냄새가 나고, 그것이 소비자에게 어떤 영향을 끼치는지도 매우 중요하죠. 아리발레의 기술은 인테리어 자재에 대한 일관된 평가를 제공할 뿐 아니라 어떤 냄새를 소비자가 어떻게 느끼는지까지 파악할 수 있도록 도와서 빠르게 소재를 개선하고, 적용할 수 있게 지원합니다.

또한 식품 제조에도 활용할 수 있습니다. 제조된 식품에 대한 객관적인 냄새를 표준화해 고객 경험을 악화할 수 있는 냄새의 식품이 포장 단계로 옮겨지지 않도록 관리하고, 품질을 제어합니다. 이처럼 다양한 분야의 냄새 분자 조합을 데이터로 빠르게 구분할 수 있다면 벨이 불가능하다고 여긴 견해도 차츰 해결할 수 있을 것으로 기대를 모으고 있습니다.

AFS (출처: gastrograph)

마지막으로 미각은 어떨까요? 후각과 마찬가지로 ‘전자 혀(Electronic Tongue)’에 관한 연구도 꾸준히 존재했습니다. 단지 센서 기술로 단맛, 신맛, 짠맛, 매운맛 등 여러 맛을 센서로 구현한 인공 세포막으로 구분하는 정도에 머물렀죠. 센서의 정확도를 높이는 것이 핵심이었습니다. 미각의 지능화는 어떤 맛을 느꼈을 때 인간이 어떻게 느끼는지 파악하는 과정을 포함합니다. 단순히 ‘어떤 음식이 맵다’가 아니라 ‘이 매운 음식을 먹은 인간이 얼마나 맵다고 생각하는가?’를 분석한다는 뜻입니다.

미국 뉴욕 기반 가스트로그래프 AI는 맛, 질감, 향의 모델을 AI로 시뮬레이션하여 향미를 해석하는 시스템을 개발합니다. 회사는 현재까지 1,000개 이상의 맛을 모델링했으며, 맛을 정량적인 데이터로 최적화한 모델을 지속해서 늘리고 있습니다. 이런 모델링으로 향미 데이터를 축적하면 식품 연구에서 사용되는 데이터를 줄이고, 재사용과 재활용을 통해 출시 기간을 단축할 수 있다고 가스트로그래프 AI는 설명합니다.

AFS (출처: gastrograph)

지난해, 가스트로그래프 AI는 시판 중인 몇 가지 비건 아이스크림을 비교하여 시장에서 인기 있는 유제품 아이스크림과 어떤 차이가 있는지 확인했습니다. 분석은 주로 10세에서 50세 사이의 소비자들이 즐길 수 있는 맛에 초점을 맞췄습니다. 선호도가 높은 아이스크림은 농후한 맛과 당류에 집중돼 있었습니다. 또한 흑설탕과 꿀의 향미가 뚜렷할 때 선호도가 더 높아질 것으로 예측했습니다. 이를 향미 분석 AI로 24개 넓은 맛 속성의 스펙트럼을 0 ~ 5의 강도 척도로 순위를 매겨서 특정 맛을 기준으로 속성을 구분합니다. 

그 결과 딜리셔스 데일리 프리 캐슈 밀크 스니커두들(Delicious Daily Free Cashew Milk Snickerdoodle)의 자각 품질(Perceived Quality, PQ)은 7점 만점에 4.19점을 받았습니다. 매그넘 더블 캐러멜 미니스(Magnum Double Caramel Minis)의 PQ는 7점 만점에 4.96점을 받았죠. AI는 땅콩 등 견과류와 씨앗 맛이 증가하면 선호도가 증가할 것으로 예측했는데요. 만약 캐러멜을 줄이고 견과류 맛이 더 풍부했다면 매그넘 더블 캐러멜 미니스의 PQ는 상승했을 겁니다. 이런 과정으로 비건 아이스크림이 유제품 아이스크림의 맛과 비슷해지도록 조정하고, 실험 데이터를 축소해 출시 주기를 단축하는 것입니다.

현재 가스트로그래프 AI는 글로벌 26개 이상 지역과 100개 이상 식음료 범주를 연구해 맛 데이터에 대한 깊은 통찰력을 제공하고 있습니다. 데이터가 정교할수록 더 많은 지역에서 선호하는 맛을 구분하고, 특정 식품을 다른 지역에 출시할 때에 맛을 조정하더라도 적은 리소스로 지역화할 수 있도록 도울 수 있을 겁니다.

이렇듯 AI가 배우는 감각은 여러 분야에서 활용되고 있으며, 굉장히 빠른 속도로 인간에 근접하고 있습니다. 물론 사람의 형태로 감각을 느끼는 건 아니지만, 인간의 감각으로만 할 수 있었던 영역으로 활용이 확장되면서 이전까지 풀지 못한 문제들을 폭넓게 해결하는 기술로 발전하고 있습니다.

글 ㅣ 맥갤러리 ㅣ  IT 저널리스트

*해당 콘텐츠는 저작권법에 의해 보호받는 저작물로 LG CNS 블로그에 저작권이 있습니다.
*해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.

챗봇과 대화를 할 수 있어요