태그검색
찾고 싶은 것이 있나요?
Reinforcement Learning에 대한 6개의 태그 검색결과가 있습니다.
- 블로그 자율주행 기술 경쟁의 새로운 핵심, 딥러닝 “사람이 운전하면 자동차가 주행하는 방법을 스스로 깨우친다.” 실리콘밸리의 스타트업인 comma.ai의 창업자인 조지 핫츠(George Hotz)가 딥러닝 기반의 자율주행 자동차를 선보이며 한 말입니다. 딥러닝 기반 인공지능이 탑재된 자동차를 운전자가 주행하면 인공지능이 서서히 사람이 운전하는 방식을 깨우쳐 스스로 주행이 가능한 자동차로 발전해 나간다는 것입니다. 실제 comma.ai는 지난 2016년 3월 이런 방법으로 4주 만에 자율주행 학습이 가능한 인공지능을 만들어 자동차에 탑재했으며 10시간 동안의 학습으로 기본적인 자율주행 기능을 구현해 냈습니다. 고가의 특화 센서를 사용하지 않고...
- 블로그 자율주행 기술 발전에 도움을 주는 인공지능 기술은? 최근 급속히 발전하고 있는 인공지능 분야의 기술 중 자율주행 분야에 적용될 경우 큰 기술 혁신을 만들어 낼 것으로 기대되는 기술은 강화 학습(Reinforcement Learning)입니다. 강화 학습은 인간의 개입이 없이도 반복 학습을 통해 인공지능이 스스로 목적을 달성하는 과정을 터득해 내는 방법입니다. 인간은 단지 인공지능이 달성해야 하는 목적과 시행착오 중 성공과 실패에 대한 보상(Reward) 및 벌칙(Penalty) 값만 정의해 주면 됩니다. 이에 기반해 인공지능은 수십, 수백만 번의 시행착오를 반복하며 보상 값을 극대화하면서 목적을 달성할 방법을...
- 블로그 딥러닝, 자율주행 기술 경쟁의 핵심을 바꾼다 ‘사람이 운전하면 자동차가 주행하는 방법을 스스로 깨우친다.’, 실리콘밸리의 스타트업인 콤마닷에이아이(comma.ai)의 창업자인 조지 핫츠(George Hotz)가 딥러닝 기반의 자율주행 자동차를 선보이며 한 말입니다. 딥러닝 기반 인공지능이 탑재된 자동차를 운전자가 주행하면 인공지능이 서서히 사람이 운전하는 방식을 깨우쳐 스스로 주행이 가능한 자동차로 발전해 나간다는 것인데요. 실제 콤마닷에이아이는 지난 2016년 3월 이러한 방법으로 4주 만에 자율주행 학습이 가능한 인공지능을 만들어 자동차에 탑재했으며, 10시간 동안의 학습으로 기본적인 자율주행 기능을 구현해 냈습니다. 고가의 특화 센서를 사용하지 않고...
- 블로그 보상을 통해 학습하는 머신러닝 기술 1편 2016년 3월, 전 세계가 주목한 세기의 대결이 펼쳐졌습니다. 구글의 딥마인드(DeepMind)에서 만든 인공지능 바둑 프로그램 알파고(AlphaGo)가 바둑 세계 챔피언 이세돌에게 도전장을 내민 것인데요. 바둑은 경우의 수가 약 2×10,170으로 우주 전체 원자 수보다 많은 보드게임입니다. 따라서 당연히 사람들은 이세돌이 승리할 것으로 생각했지만 결과는 놀라웠습니다. 알파고가 이세돌을 4:1로 제압한 것인데요. 컴퓨터가 인간을 이길 수 없는 마지막 보류라고 여겨졌던 바둑마저 컴퓨터에 챔피언의 자리를 내어준 것입니다. 그리고 1년 후 알파고 마스터라는 이름으로 커제와 대결했고 커제는...
- 블로그 강화학습의 진화: 3차원 및 물리환경의 적용 매년 혁신 기술을 선정하는 MIT Tech Review는 강화학습(Reinforcement Learning)을 2017년 10대 미래 혁신 기술(Breakthrough Technology) 중 하나로 선정했습니다. 강화학습은 반복 학습을 통해 인공지능이 문제를 해결하는 방법을 스스로 터득한다는 점에서 기존 인공지능의 구현 방식과 전혀 다릅니다. 기존 기계학습 기반의 인공지능은 목표 달성 과정을 전문가가 일일이 모델링하고 구현해야 했지만, 강화학습 기반의 인공지능은 스스로 현재의 환경을 인식하고 행동하며 목표를 달성해 나갈 수 있습니다. 게다가 강화학습의 방식은 범용적으로 활용할 수 있어, 새로운 환경에서 학습만...
- 블로그 부족한 데이터로 하는 머신러닝! ‘전이 학습’ 인공지능(AI)에 많은 관심을 두지 않는 사람이라도, ‘알파고 제로(AlphaGo Zero)’ 대한 소식은 접하지 않았을까 생각합니다. 알파고는 미지의 영역이라고 여겨진 AI 기술을 본격화하는 계기가 되었기에, 기존 알파고의 강화 버전인 알파고 제로는 대단한 관심사가 될 수밖에 없겠죠. 본래 알파고는 수많은 바둑 기보를 토대로 기본적인 실력을 갖춘 정책망을 서로 대국하게 하는 방식으로 바둑을 익힌 AI입니다. 하지만, 알파고 제로는 기보 데이터를 익히지 않은 상태에서 바둑을 습득했습니다. 인간의 지식을 포함하지 않고도 AI가 발전할 수 있다는 걸...