태그검색

찾고 싶은 것이 있나요?

멀티모달AI에 대한 2개의 태그 검색결과가 있습니다.

블로그 소설부터 의상 디자인까지? 초거대 AI, 어디까지 가봤니? 초거대 AI는 무엇을 할 수 있을까요? 빅테크 기업들이 단순히 소설과 칼럼을 쓰기 위해 많은 금액을 투자해 초거대 AI를 구축하지는 않았을 겁니다. 처음에 기업들은 초거대 AI를 활용해 주로 연구를 진행했습니다. 하지만 지금기업은 연구 용도를 벗어나 하나둘 초거대 AI를 사업 모델에 적용하고 있습니다.자체 서비스를 고도화하거나 타 기업과 업무협약(MOU)을 체결해 다양한 산업의 경쟁력을 높이고 있습니다. GPT-3, 다양한 기업의 서비스에 변화 이끌다 초거대 AI의 가능성을 밝힌 모델은 오픈AI의 ‘GPT-3’입니다. 그만큼 활용 사례가 다양한데요. 기업들은 GPT-3로 고객 피드백을 분석하거나 검색 엔진과 챗봇 서비스를 고도화하고 있습니다. 지금까지 공개된 GPT-3 사용 사례 중 중요한 내용을 모아봤습니다. 아이어블, GPT-3로 고객 피드백 분석 고객 피드백을 분석해 고객사의 마케팅 전략을 지원하는 아이어블(Aiable)은 2021년 피드백을 분석하는 업무에 GPT-3를 적용했습니다. 고객이 남긴 앱 리뷰나 설문 조사, 문의 사항, 소셜 미디어, 통화 내용 등에서 얻은 텍스트 형식 피드백을 GPT-3를 사용해 분석하는데요. 여기서 분석한 자료를 다시 텍스트로 처리해 마케팅 전략에 필요한 점을 찾고 있습니다. 예를 들어 “고객이 우리 호텔에서 체크아웃할 때 무엇을 가장 불편해하지?”라고 질문하면 GPT-3를 탑재한 아이어블 플랫폼은 “고객들은 체크아웃하는 시간이 너무 오래 걸린다는 점에 답답함을 느낀다. 특히 체크아웃할 때 자신의 집 주소를 불필요하게 길게 기입하는 걸 안 좋아한다. 그리고 그들은 지금보다 더 다양한 지불 방식을 원한다”라고 대답합니다. 기업 마케터는 이 내용을 사업 전략에 활용할 수 있죠. 알골리아, 고급 검색 솔루션에 GPT-3 통합 검색 엔진 솔루션 기업 알골리아(Algolia)는 자체 개발한 고급 검색 기술에 GPT-3를 통합했습니다. 고객...
블로그 텍스트를 넘어 생체신호까지 학습한다!떠오르는 ‘멀티모달 AI’ 지난 글에서는 기계 언어를 바꾼 ‘초거대 AI’의 등장을 살펴봤습니다. 초거대 AI는 인간의 뇌 구조를 모방해 스스로 사고하고 학습하며 판단할 수 있는 AI인데요. LG AI연구원이 선보인 엑사원은 오픈AI의 GPT-3와 네이버가 출시한 하이퍼클로바, 카카오의 코지피티와는 다릅니다. GPT-3와 하이퍼클로바가 언어모델이라면, 엑사원은 멀티모달 AI죠. 언어뿐만 아니라 이미지도 학습하고 사고하고 판단할 수 있습니다. 최근 초거대 AI는 언어모델을 벗어나 엑사원처럼 ‘멀티모달’ 형태로 발전하고 있습니다. 멀티모달 AI란? 멀티모달 AI는 다양한 모달리티를 동시에 받아들이고 사고하는 AI 모델을 뜻합니다. 기존 초거대 AI가 주로 언어에 초점을 맞춘 언어 모델이었다면, 멀티모달 AI는 여기서 한발 더 나아갑니다. 언어모델이 사고할 수 있었던 텍스트 데이터 외에도 △이미지 △음성 △제스처 △시선 △표정 △생체신호 등 여러 입력 방식을 받아들이고 사고할 수 있죠. 이를 통해 인간과 AI가 더욱 자연스럽게 의사소통할 수 있게 합니다. GPT-3가 영국 가디언지에 칼럼을 쓸 수 있었던 것은 AI가 텍스트를 받아들이고 이를 사고할 수 있었기 때문입니다.멀티모달 AI는 텍스트뿐만 아니라 이미지, 동영상, 생체신호 등을 학습하고 사고할 수 있기 때문에 칼럼 작성 외에 다른 일도 할 수 있는데요. 다양한 이미지를 학습해 인테리어를 디자인할 수 있고, 사람의 대화를 바로 영상으로 만들어 보여줄 수도 있습니다. 이처럼 멀티모달 AI는 텍스트 기반으로 새로운 콘텐츠를 만들어냈던 초거대 AI가 이미지, 음성, 표정, 시선, 제스처 등 다양한 데이터를 토대로 새로운 결과물을 내놓는 방향으로 진화한 버전입니다. 초거대 멀티모달 AI의 시작을 알린 오픈AI의 ‘달리(DALL-E)’ GPT-3로 초거대 언어모델 AI 시대를 알린 오픈AI는 초거대 멀티모달 AI에도 성과를 냈습니다. 오픈AI는 2021년 1월 초거대 멀티 모달 AI인 ‘달리(DALL-E)’를 자사 블로그에 공개했습니다. 달리는 자율주행 로봇 이야기를 담은 2008년 애니메이션 영화 ‘WALL-E’와 초현실주의 화가 살바도르 달리(Salvador Dalí)를 합친 이름입니다. 오픈AI는 “달리가 NLP(Natural Language Processing, 자연어처리)와 이미지 인식 기술을 함께 사용해 전에 학습한 적이 없는 이미지를 새로 ‘창조’해낼 수 있다”고 밝혔습니다. GPT-3가 방대한 양의 언어 데이터를 학습한 후 다양한 방식으로 언어를 사용할 수 있었다면, 달리는 GPT-3가 학습한 텍스트와 더불어 같은 방식으로 이미지를 학습해 새로운 결과물을 냈습니다. 달리는 기존 이미지 생성 기술과 달리 각 이미지 데이터를 큐레이팅, 라벨링 하지 않습니다. 인터넷상에서 수집한 방대한 이미지와 이를 묘사한 캡션들을 학습해 결과물을 내죠. 이를 통해 경험한 적이 없는 이미지 대상도 학습 데이터를 조합해 새로 만들어낼 수 있습니다. 예를 들어 달리는 ‘개를 산책시키는 아기 무’란 이미지를 만들어낼 수 있습니다. 개를 산책시키는 무는 세상에 없죠. 따라서 이러한 이미지를 라벨링 할 수 없고 학습할 수도 없습니다. 하지만 달리는 이 이미지를 조합해 새로운 이미지를 창조해냈습니다. 오픈AI는 블로그를 통해 “달리는 이질적인 아이디어를 결합해 사물을 합성할 수 있는 능력을 갖추고 있다”며 “현실 세계에 존재하지 않는 것도 만들어낼 수 있다”고 밝혔습니다. ‘달리 2(DALL-E 2)’와 구글 ‘이매젠(Imagen)’의 등장 오픈AI는 올해 4월 달리에 이은 ‘달리 2(DALL-E...