본문 바로가기

보도자료

LG CNS의 최신 소식을 지금 만나보세요.

보도자료

LG CNS, AI 표준데이터 10만개 무료 공개

인공지능 스피커, 인공지능 챗봇을 만드는데 필수적인 AI 학습용 표준데이터 ‘코쿼드 2.0(KorQuAD 2.0)’ 5일 공개.
지난해 12월 공개한 ‘코쿼드 1.0’ 대비 표준데이터 7만개에서 10만개로 확대, 기존 단답형에서 장문의 답변 가능한 AI 개발할 수 있도록 업그레이드해 국내 AI 기술 발전과 개방형 생태계 조성에 기여.

2019.09.05

■ LG CNS, 국내 처음이자 유일하게 AI의 자연어 이해를 위한 한국어 표준데이터 10만여개 제작해 AI 업계에 무료 개방
   – 언어 AI를 개발하려면 학생들이 공부하는 교과서와 유사한 개념인 AI 학습용 표준데이터 필요
   – 지난해 12월 ‘코쿼드 1.0’ 공개 후 AI 전문가들이 모인 국내 최대 오픈 커뮤니티 ‘텐서플로우 코리아’에서 폭발적 반응 보이며 네이버,
      카카오 등 국내 유수 AI 기술 기업들은 코쿼드 사용해 언어 AI 개발 나서

   – 표준데이터 제작해 자사 AI 개발에만 활용하는 것이 아니라 외부에 개방, AI 연구자들간의 시너지 통한 국내 인공지능 발전에 기여    


■ LG CNS, 5일 강서구 마곡 LG사이언스파크에 국내 AI 전문가 300여명 초청해 AI 커뮤니티 행사 ‘AI Tech Talk(테크톡) for

NLU*’ 열어 ‘코쿼드 2.0’ 공개
   – 한국전자통신연구원(ETRI), 서울대, 카이스트 등에서 연구원 및 교수진이 연사로 참석해 언어 AI 연구 성과 및 최신 기술 트렌드 공유
   – LG CNS의 코쿼드 활용해 AI 모델 성능평가 리더보드 1위에 올라있는 네이버 클로바AI팀이 AI 개발 제작기 발표
   – 한국어 표준데이터는 ‘코쿼드 2.0’ 웹사이트에서 5일부터 누구나 다운로드 가능

————————————————————————————————————————————-

LG CNS는 국내 처음이자 유일하게 AI의 자연어 이해를 위한 한국어 표준데이터 10만여개를 제작해 국내 AI 업계에 무료로 개방한다.

언어 AI 개발을 위해서는 학생들이 공부하는 교과서와 유사한 개념인 AI 학습용 표준데이터가 필요하다.

해외는 美 스탠포드대학, 마이크로소프트 등이 제작한 영문 표준데이터가 존재해 AI 개발에 활용되고 있으나

국내는 한국어 표준데이터가 없어 영문을 번역하거나 자체적으로 데이터를 마련해야 했다.

LG CNS는 지난해 12월 위키백과 정보를 기반으로 AI 학습용 한국어 표준데이터 7만개가 탑재된 ‘코쿼드 1.0’을 제작해 AI 업계에 공개했다. 

공개 후 AI 전문가들이 모인 국내 최대 오픈 커뮤니티인 ‘텐서플로우 코리아’에서는 표준데이터 공개에 대한 폭발적인 반응을 보였다.

또한 네이버, 카카오 등 국내 유수 AI 기술 기업들과 AI 현업 종사자 등 50여개 팀이 코쿼드를 사용한 AI 개발에 나섰다.

LG CNS가 표준데이터를 제작해 자사 AI 개발에만 활용하는 것이 아니라 외부에 개방해 향후 AI 연구자들간의 시너지를 통한

국내 인공지능 기술 발전에 기여한다는데 그 의미가 크다.

LG CNS는 5일 강서구 마곡 LG사이언스파크에 국내 AI 전문가 300여명을 초청해 AI 커뮤니티 행사

‘AI Tech Talk(테크톡) for NLU*’를 열어 ‘코쿼드 2.0’ 출시를 발표했다.

‘코쿼드 2.0’은 ‘코쿼드 1.0’ 대비 한국어 표준데이터를 7만개에서 10만개로 확대하고,

단답형에서 장문의 답변이 가능한 AI를 개발할 수 있도록 데이터를 강화한 버전이다.

예를 들어, “대한민국의 수도와 그 면적은?”이라는 질문에 “서울특별시, 605.25km2 입니다”라고 답하는 AI는 코쿼드 1.0 학습만으로

충분히 개발 가능했지만, “서울특별시의 특징은?”이라는 질문에 “도시 중앙으로 한강이 흐르고 북한산, 관악산, 도봉산 등의

여러 산들로 둘러싸인…”이라는 장문의 답을 위해서는 코쿼드 2.0으로 AI를 학습시켜야 한다.

또한, 코쿼드 2.0은 AI가 표나 리스트 형태에 담긴 정보도 읽어 답변할 수 있게끔 표준데이터 범위도 확대했다.

이번에 출시한 한국어 표준데이터는 ‘코쿼드 2.0’ 웹사이트에서 누구나 다운로드 가능하다.

‘AI Tech Talk(테크톡) for NLU’ 행사에는 한국전자통신연구원(ETRI), 서울대, 카이스트 등에서 연구진 및 교수진이 연사로 참석해

언어 AI 연구 성과 및 최신 기술 트렌드를 공유했다.

LG CNS의 코쿼드를 활용해 개발한 AI 모델의 성능평가를 받고 리더보드에 등재된 50여개 팀 중 현재 1위를 기록 중인

네이버 클로바AI팀이 참석해 AI 개발 제작기를 발표했다.

언어 AI 분야 기업/기관, 현업 종사자, 전공 학생 등이 한자리에 모인 만큼 AI 연구자들간의 기술 교류의 장이 펼쳐지기도 했다.

이번 행사 참가자 모집 공고에는 1시간만에 300여명이 신청해 언어 AI 분야에 대한 실감할 수 있었다.

한편, LG CNS는 행사의 성격에 걸맞게 참여자 이벤트를 통해 구글 클라우드 이용권을 제공하기도 했다.

LG CNS CTO(최고기술책임자) 현신균 부사장은 “응용분야가 무궁무진한 AI 언어 개발 분야에서 내부적으로 쌓은 데이터를

AI 업계 전체에 개방해 국내 AI 연구자들 간 상생을 위한 AI 개방형 생태계 조성에 기여코자 한다”라고 밝혔다.  (끝)

——————————————————————————-
*KorQuAD : Korea Question Answering Dataset (한국어 질의응답 데이터셋)
*NLU : Natural Language Understanding (자연어 이해)

AI Tech Talk for NLU 행사 사진
LG CNS AI커뮤니티 행사에서 이주열 AI빅데이터연구소장이 코쿼드2.0을 소개하고 있다.

챗봇과 대화를 할 수 있어요