"오케이 구글, 기자분들에게 인사해야지."
"안녕하세요 기자여러분, 구글 어시스턴트입니다."
장규혁 구글 본사 테크니컬 프로그램 매니저가 음성으로 호출하자, 구글 어시스턴트가 곧바로 인사를 건넨다. 시연하는 동안 단순히 지시나 질문에 대한 답을 찾아주는 것 뿐만 아니라 질문의 맥락과 상황을 이해하고 척척 답을 하니 SF 영화에 나오는 초지능 컴퓨터의 시대도 머지 않았다는 느낌이 든다. 한국어 지원을 오래 전부터 시작한 애플 시리(Siri)에서도 아직 보지 못한 경험이다.
구글이 최근 인공지능(AI) 음성비서 구글 어시스턴트 한국어 서비스를 시작한 가운데, 구글코리아는 28일 역삼동 구글코리아 오피스에서 국내 기자들을 대상으로 데모 세션을 가졌다.
이날 데모 세션에는 구글 어시스턴트 한국어 버전 개발에 참여한 장규혁 매니저와 전산언어학자인 최현정 연구원이 직접 미국 샌프란시스코 구글 본사에서 날아와 한국어 버전 개발 스토리와 실제 활용 방법에 대해 설명했다.
구글 어시스턴트 한국어 버전 시연과 개발 배경을 설명하고 있는 구글 본사 장규혁 테크니컬 프로그램 매니저(왼쪽)와 최현정 연구원(전산언어학자)
구글 어시스턴트는 스마트폰에서 '오케이 구글'이라고 부르거나 홈버튼을 길에 누르면 실행된다. 장 매니저가 직접 샌프란시스코에서 한국에 도착해서까지의 일정을 중심으로 구글 어시스턴트를 시연하자, 비행기 예약부터 탑승 시간 알람, 날씨와 생활정보, 스케줄 확인, 스포츠와 뉴스 검색, 음식점 검색, 전화걸기, 이메일 보내기, 웹검색 등을 빠르고 정확하게 수행했다. 간단한 음성 번역도 번역기 앱 없이 바로 영어나 일본어, 중국어, 스페인어 등으로 음성+문자로 변환됐다.
애플 시리가 스마트폰 앱내 데이터를 가져오는 것 외에는 웹검색 정보에만 의존한다는 점에서 구글검색, 구글포토, G메일, 유튜브 등 다양한 통합 플랫폼을 가지고 있다는 것이 확실한 장점으로 부각됐다. 음악듣기나 전화번호 안내 등 스마트폰 내 설치된 다양한 앱을 쉽게 구동했다.
무엇보다 구글 어시스턴트는 한국어 이해능력이 뛰어났다.
최 연구원은 "한국어는 제 모국어이기도 하지만 이번에 출시된 9개 언어 중에서도 한국어 적용은 가장 어려웠다"며 "머신러닝 기반의 자연어처리에서 단어 분절도 쉽지 않았고, 중국어나 일본어와 같은 한자권과 달리 영어처럼 띄어쓰기가 있고, 생략도 많고, 신조어도 자주 생겨나 기계가 새로운 주제인지 이어지는 대화인지 이해하기 어려운 경우가 많았다"고 개발당시 고충을 털어놨다.
이를 극복한 구글 어시스턴트의 강점은 바로 전체 대화의 맥락을 이해한다는 것이다. 이를테면 '미국 대통령이 누구야'라고 물어보면 구글 어시스턴트는 '도널드 트럼프'라고 답하고, 다시 '몇살이야'라고 물으면 트럼프의 나이 또는 생년월일을 말해준다.
빠른 음성인식과 관련 정보를 함께 제공하는 키워드로 사용 편의성과 정확도를 높였다. 이메일 보내기도 앱을 열지 않고 음성으로 명령하고 내용도 음성으로 빠르고 정확하게 입력됐다.
우리에게는 익숙한 질의와 답변이지만, 영어는 대화에서 나이를 물어볼때 'How old is he'라고 하기 때문에 누구를 지칭하는지가 분명하다. 한국어 대화에서는 '그는 몇살이야'라고 묻지 않고 '몇살이야'라고 지칭이 생략되는 경우가 많기 때문에 기계가 누구의 나이를 물어보는지 알 수 없는 문제가 생긴다. 구글 어시스턴트는 이런 문제를 전체 대화의 맥락을 통해 사용자의 의도를 파악하고 정확한 답을 제시한다.
지난해 '구글 I/O'에서 처음 공개 된지 1년 여 만에 '가장 과학적 문자이자 가장 어려운 언어'로 평가받는 한국어를 극복한 노하우다.
기계학습 기반의 AI 음성비서 구글 어시스턴트는 다른 음성비서 서비스들과 마찬가지로 사용자가 사용할수록 더 정확하고 똑똑한 답변을 내놓는다. 이때문에 자연스러웠던 구글의 시연은 기자가 직접 사용하자 다소 부자연스러운 모습을 보였다. 더 정확히 말하면 기자가 중구난방으로 질문을 던져 정확한 답을 끌어내지 못한 것이다. 사용방법에 익숙해지는 시간이 필요 할 것 같다.
구글 어시스턴트 체험에는 한국어 버전이 최초로 적용된 LG전자의 스마트폰 V30이 사용됐다. '오케이 구글'이라고 말하자 아무런 반응이 없다. 옆에 있던 직원이 스마트폰에 사용자의 음성을 등록해야 슬립 화면이 열리면서 구글 어시스턴트가 실행된다고 설명해줬다. 어쩔 수 없이 홈버튼을 길게 눌러 실행해야 했다.
샌프란시스코와 서울 간의 거리가 얼마나 되는지, 날씨는 어떤지, 주요 뉴스는 무엇인지 이것저것 물어보자 그에 맞는 정보를 제공하거나 답을 내놨다. 애플 시리는 확인이 어렵거나 알 수 없는 이유로 답을 제대로 하지 못하는 경우가 많았지만 구글 어시스턴트는 다소 부족한 정보라 하더라도 거의 모든 답을 내놨다. 방대한 데이터를 가진 구글 플랫폼과 한국어의 특징을 짚어낸 기술이 장점으로 드러나는 순간이었다.
물론, 한국 환경에 맞는 검색정보는 글로벌 스탠다드인 구글보다 코리아 스탠다드인 네이버가 더 뛰어난 것은 사실이다. 더 많은 국내 정보와 데이터를 나열해 보여준다는 점에서는 국내 검색 및 데이터 플랫폼이 높은 점수를 받을 수 있겠지만, 오직 음성비서를 활용해 별다른 타이핑이나 터치 없이 자연스럽게 필요한 정보만 뽑아내 보여주는 것은 구글 어시스턴트의 강점이다.
네이버의 '클로바'나 카카오의 '카카오아이', 역시 한국어 버전을 개발 중인 것으로 알려진 아마존 '알렉사'와 직접비교하기는 아직 이르지만, 향후 선점효과가 기대된다.
구글 어시스턴트는 현재 안드로이드 스마트폰 6.0 마시멜로 운영체제 이상에만 지원되며 점진적으로 제공 범위를 넓혀 갈 계획이다. 애플 iOS용 앱도 조만간 출시할 예정이다.
[구글 어시스턴트 일문일답]= (장규혁 매니저)구글 어시스턴트는 다른 타사 AI 음성비서와 비슷한 서비라고 보면 된다. 2016년 구글 I/O에서 처음 소개 된지 1년 여 만에 한국어를 포함한 9개국어로 론칭하게 됐다.
사람이 귀로 듣고, 머리가 이해하고, 입으로 말하는 것처럼, 음성비서도 음성을 인식하고, 자연언어를 처리하고, 음성합성으로 결과물을 내놓는 방식이다.
문맥 이해나 사람과의 자연스러운 대화가 구글 어시스턴트의 강점이다. 기본적으로 정보검색, 전화, 문자, 항공편예약, 주변검색 외에도 심심할 때 놀 수 있는 기능들이 모두 담겼다. 머신러닝을 사용하기 때문에 사용자가 사용할수록 발전하고, 한국어 버전도 이제 론칭했기 때문에 사용자가 늘어날수록 더 잘 될 것이다.
= (최현정 연구원) 한국어 뿐만 아니라 전체 9개 언어를 모두 담당했다. 모국어이지만 한국어는 어렵다. 한국어에는 몇가지 특성이 있어 적용하는데 어려웠던 점은 시스템에 작은 단어 단위로 입력해줘야 하는데 한국어는 단어 분절이 매우 어렵다. 반면 영어는 매우 간단하다. 띄어쓰기 뿐만 아니라 머신러닝 후처리도 필요한데 허용범위도 넓고, 일관되지 않은 데이터가 더 어렵게 했다.
한국어도 과거에는 한자나 일어처럼 띄어쓰기가 없었는데 100여년 전 선교사를 통해 영어처럼 띄어쓰기가 적용된 것이다. 그리고 생략이 아주 많이 되는 언어여서 적용이 쉽지 않았지만 구글 어시스턴트는 대화의 맥락을 이해하는 능력이 뛰어나 가능할 수 있었다.
기계는 대화의 내용이 새로운 주제인지 이어지는 대화인지 이해하는 것이 어렵다. 특정 지칭어가 중요하다. 영어는 '콜 존(존에게 전화걸어줘)' '콜 맘(엄마에게 전화걸어줘)'처럼 간단히 관계지칭어를 사용하지만, 한국어에서는 '대구 이모', '피시방 사장님' 등 방식이 다양하다. 한국어의 구문이 그래서 어렵다.
한국어는 언어 중 가장 빨리 바뀌고 독특한 신조어가 하루에도 몇개씩 생기고, 최근에는 한글고 영어가 섞인 용어들도 많이 늘어나는 추세다. 특히 (ㅋㅋㅋ, ㅇㅈ(인정), ㅈㄱㅊㅇㅇ(전 괜찮아요) 등) 자음만 쓰는 경우도 많아 나이든 세대뿐 아니라 기계에게도 어려운 문제다.
▶네이버와 같은 타 플랫폼으로 검색해달라고도 할 수 있나?
= 정책적으로 구글서치만 이용하도록 강제하는 것은 아니지만, 기능들 중에서 사용자 지원이 되지 않는 것도 있지만 네이버 앱 열어줘 하면 실행은 된다. 서비스 연동은 되지 않고 있다.
▶한국어 사투리도 가능한가?
= 구글 어시스트 한국어 버전 연구는 꽤 오래됐다. 이미 대부분의 사투리도 가능하고 기계학습으로 훈련이 가능하다.
▶특정 식당의 영업시간이나 관련 정보는 어떻게 가져오나?
= 데이터 처리에서 구글의 로컬가이드와 같은 사용자 인풋이 활용되기도 하고 해당 홈페이지 등에서 크롤링 되는 정보를 파악해 제공한다.
▶ 카카오아이, 네이버 클로바 등 스마트폰에 사용자 설치가 가능한 국내 다른 음성비서 플랫폼과의 경쟁은?
= 사용자 패턴을 보면 여러가지를 사용하지 않고 사용자 환경에 맞는 것으로 주로 쓰는 경우가 많다. 우리는 사용자 중심의 서비스를 제공 할 것이고, (시스템상)충돌은 거의 없을 것이다.
▶삼성 빅스비와는 어떻게 구분되는지? 구글맵은 국내 기능이 제한적인데 정확도 향상은 어떻게?
= 빅스비와 구글 어시스턴트는 두 개 모두 상호 연동이 가능하다. 버튼에 있어서 물리적으로 다르다. 빅스비는 사이드 버튼, 구글은 홈버튼을 사용한다.
= 구글 스트리트나 지도 정보, 길찾기, 대중교통은 되지만 내비게이션은 안되는데, 맛집의 경우 사용자들이 평가한 별점을 순서대로 보여준다거나 관련 검색정보를 가져오게 된다.
▶아마존은 스마트 글래스에, 다른 파트너 업체들도 헤드폰 등에 적용되는 경우가 있는데, 스마트폰 외에도 데이드림 등 구글 하드웨어 플랫폼에도 적용 될 수 있을까?
= 휴대폰 외에는 구글 홈과 헤드셋 등에 적용되고 있는데, 100퍼센트 확신할 수는 없지만 사용자 요구가 늘어나면 가능할 것이다. 또, 장기적인 추세가 그쪽으로 가고 있어서 디바이스 확장 계획은 아직 없지만 관련 기술을 늘리고 있다.
▶구글 홈 한국 출시는 안 하나?
= 한국에 구글 홈 출시 계획은 현재 없는 것으로 안다. 스마트폰에서만 현재 가능한데, 한국의 경우 안드로이드 스마트폰 사용자 비중이 절대적으로 높다. 그래서 스마트폰에 적용하는 것이 좋다고 봤고, 구글 어시스턴트 한국어 출시가 구글 홈 한국출시와 같은 다음 목표가 된다고 할 수 없다.
▶애플 iOS 앱 출시도 검토하고 있는 것으로 알고 있는데, 언제쯤?
= iOS 용 구글 어시스턴트 앱도 현재 계획중이고, 출시 준비중이다.