아마존 개척한 AI스피커 시장에 구글‧애플 가세정보 습득 넘어 일정관리‧가전제어까지기술고도화‧개발 생태계 확장에 따른 결과‘음성인식’ 차세대 인터페이스로 ‘주목’
글로벌 ICT업체들이 인공지능 스피커 시장에 뛰어들면서 키보드, 마우스, 터치에 이어 ‘음성’이 컴퓨터와 사람을 연결하는 새로운 인터페이스로 자리잡고 있는 모습이다.
7일 업계에 따르면 아마존에 이어 구글, 애플 등 글로벌 ICT업체들은 저마다 자사 인공지능 엔진을 활용할 수 있는 음성인식 스피커를 잇달아 선보이며 시장 공략을 강화하고 있다.
인공지능 기반 음성인식 스피커를 글로벌 시장에서 최초로 선보인 것은 아마존이다. 아마존은 지난 2014년 말 인공지능 ‘알렉사’를 활용할 수 있는 스피커 ‘아마존 에코’를 출시했다. 아마존은 흔히 유통업체로 인식되지만 아마존 웹서비스 등 클라우드 영역에서 절대 강자로 꼽히는 ICT업체기도 하다.
아마존 에코는 출시 당시에는 단순한 가정용 스피커로 인식됐지만 알렉사를 서드파티 업체들이 개발할 수 있도록 개발자 키트를 공개하면서 활용할 수 있는 서비스가 증가하면서 생태계가 확장됐고 스피커 판매량이 증가하는 선순환 구조가 정착됐다.
아마존은 에코 이후 소형 인공지능 스피커 아마존 에코 닷 등을 추가로 출시하며 시장 공략을 지속 강화했다. 현재까지 아마존은 구체적인 판매량을 공개하지 않고 있지만 외신들은 약 500만대 이상 에코 제품군을 판매했을 것이라고 추정하고 있다.
구글 역시 지난해 이 시장에 가세했다. 구글은 지난해 자사 연례 개발자 컨퍼런스인 구글I/O에서 인공지능 기반 음성인식 스피커 ‘구글 홈’을 공개했다.
구글홈은 인공지능인 구글 어시스턴트를 활용할 수 있는 스피커다. 구글의 안드로이드 디바이스 등을 음성만으로 제어할 수 있다. 구글은 지난해 구글 홈 공개영상을 통해 음성만으로 안드로이드 티비를 키고, 음식점을 예약하고 출근 시 모든 가전기기의 전원을 끄는 장면을 연출했다.
지난 5월 개최된 구글I/O 2017에서 구글은 구글홈에 별도 설정 없이 전화를 할 수 있는 기능을 추가했다. 판매국 역시 미국을 벗어나 올해 말 호주, 캐나다, 프랑스, 독일, 일본에서 선보이겠다는 방침을 밝힌 바 있다.
구글은 구글 홈에 적용된 인공지능 비서 구글 어시스턴트의 소프트웨어 개발 키트(SDK), 구글 어시스턴트의 애플리케이션 프로그래밍 인터페이스(API) 등을 공개하며 개발자 생태계 확산에도 주력하고 있다.
애플 또한 인공지능 스피커 시장에 뛰어들었다. 애플은 지난달 열린 개발자 컨퍼런스 ‘WWDC 2017’에서 인공지능 스피커 ‘홈팟’을 공개했다.
애플이 공개한 홈팟은 애플의 음성인식 비서 ‘시리’를 활용할 수 있는 스피커다. 다른 스피커들과 다소 차이가 있다면 스피커 본연의 기능인 음악재생, 특히 음질을 강화했다는 점이다.
애플이 자체 설계한 우퍼가 내장돼 웅장한 사운드를 감상할 수 있다. 자동 룸 센싱 기술로 홈팟이 위치한 곳을 알아서 감지해 최적화된 사운드를 들려준다. 홈팟에는 6개의 마이크가 내장돼 사용자가 가까이 있거나 멀리 있거나, 심지어 음악이 크게 재생되고 있을 때도 음성을 인식해 기기를 제어할 수 있다.
애플은 올해 12월 미국과 호주, 영국에서 홈팟을 공식 출시한다. 한국 출시 일정은 아직 정해지지 않았다.
글로벌 ICT업체들이 잇달아 음성인식 스피커를 선보이는 것은 가정용 허브로서의 기능에 특화된 제품이기 때문이다.
가전기기를 스마트폰이나 태블릿PC 등으로 제어하는 형태의 사물인터넷 시장이 개화되고 있는데 이들 기기를 서로 연동, 통제할 핵심기기로 주목받고 있는 것.
또 이들 업체가 인공지능 기반 음성인식 스피커 시장에 뛰어드는 것은 음성이 스마트폰 터치 이후 차세대 인터페이스로 부상하고 있기 때문이다.
음성의 경우 키보드나 마우스, 터치 인터페이스처럼 굳이 배울 필요가 없는 인터페이스다. 키보드와 마우스, 터치 등은 어린이 혹은 노약자들이 시간을 들여서 배워야 활용할 수 있지만 음성은 굳이 시간을 들여 배울 필요가 없다는 점에서 가장 자연스러운 인터페이스로 꼽힌다.
음성인식은 그간 기술적 장벽으로 인해 사람의 말을 문맥으로 이해하게 하는 것이 어려웠다. 인터페이스로 동작하기 위해서는 의미를 파악해야만 한다. 단순히 음성을 문장으로 인식하는 것이 아닌 사용자가 무엇을 원하는지를 파악하고 서비스를 제공해야 한다.
그간 기술적 문제로 사용자의 의도를 파악하는데까지 어려움이 있었지만 기술 고도화를 통해 문맥을 파악하는 수준에까지 이르렀다.
정보통신정책연구원은 ‘음성인식 AI 비서 시장의 현황과 시사점’ 제하 보고서를 통해 “스마트폰 시장 포화 상황 속 새롭게 주목받고 있는 시장 중 하나는 사물인터넷”이라며 “이를 컨트롤하는 허브 역할을 두고 TV, 셋톱박스 등이 경쟁해왔지만 현재 핵심기기로 가장 주목받는 것은 인공지능 기반 음성인식 스피커”라고 분석했다.
이어 “이런 시도는 시시를 더 많이 판매하기 위한 경쟁으로 이해하기 보단 향후 터치나 텍스트 입력 방식을 대체할 음성 인터페이스의 표준을 선점하기 위한 노력으로 봐야 한다”고 덧붙였다.
뉴스웨이 이어진 기자
lej@newsway.co.kr
저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지
댓글