인터넷

크롬 11 베타 공개, 음성입력 기능 웹 세상을 바꿀까?

뽕다르 2011. 3. 25. 01:58


지난 22일 파이어폭스4가 공식 런칭할때 구글은 크롬 공식 블로그를 통해 크롬11 베타를 조용히 내놓았습니다. 하지만 그 내용 만큼은 조용히 넘어 갈 수 없을것 같습니다. 바로 음석입력 API 때문입니다.

구글은 크롬11에 웹 개발자를 위한 음성입력 HTML5 API 추가 했습니다. 이제 웹 개발자들이 간단하게 HTML로 <input type="text" x-webkit-speech/> 라고 적기만 하면 음성인식 버튼이 생기게 됩니다. 사용자를 그걸 누르고 컴퓨터에다 말만 하면 됩니다. 그럼 음성이 텍스트로 전환되어 빈칸에 나타나게 됩니다.

크롬 11베타라면 한번 테스트해보세요. ^^ 오른쪽 마이크 버튼 클릭!!  크롬 이전 버전은 --enable-speech-input 플래그로 실행하면 됩니다. 정말 위에 저 테그만 집어 넣었을 뿐인데 멋지네요. (사실은 스타일 테그가 쪼금 들어가길 했습니다 ^^) 그냥 네모난 창만을 보고 계신다면 크롬 11 베타를 설치해 보세요 ^^

  


잠깐 테스트 해봤는데 인식률이 정말 놀랍습니다. 아직 인식 언어를 설정하는 기능은 없지만 한글, 영어를 구분해서 인식합니다. 숫자도 구분해서 인식합니다. 인식률도 상당히 높습니다. 노트북의 경우 대부분이 마이크를 내장하고 있는데 그냥 평소 노트북을 사용하는 자세로 조용히 말해도 대부분 인식할 정도입니다. 또박또박 말하지 않고, 사투리가 섞여도 거의 정확히 인식합니다. 길이에 대해서는 정확히 설명되어 있지는 않지만 데모 페이지에서는 10초 정도 되는것 같습니다.


음성입력 API가 앞으로 웹을 어떻게 바꿀까요?

1. 웹 앱에서의 활용 가능성 (크롬 웹스토어)
 

가장 먼저 구글도 언급했듯이 웹 앱에서 음성입력 기능을 활용할 수 있습니다. 간단하게 예를 들자면 트위터나, 페이스북에 음성입력 기능을 더하는겁니다. 그럼 보다 쉽고 빠르게 트윗을 날리고 댓글을 입력할 수 있겠네요. 좀 더 머리를 굴려보면 정말 무궁무진한 가능성이 옅보입니다.

2. 키보드가 사라진다?
 

음석입력 기능이 오피스 프로그램과 만나 각종 문서 작업에서 타이필 하는 시간을 줄여줄 수 있습니다. 특히 구글 독스와 같은 웹 오피스와 간단히 연동할 수 있어 웹상에서 문서작업이 한층 쉬워질것 같습니다. 키보드가 별로 필요가 없겠죠? 그럼 PC ==> 테블릿... 테블릿이 포스트PC 맞네요. ^^

3. 크롬 OS, 음성 명령으로 PC를 조작할 수 있을까? 

구글은 크롬을 기반으로한 크롬OS를 만들고 있습니다. 여기에 음성입력 기능이 연동 된다면 음성입려을 음성명령으로 바뀌 컴퓨터를 켜거나 끄기, 프로그램 실행등 간단하게 PC를 조작할 수 있지 않을까 하는 생각이 듭니다. 지금이야 걸음마 단계지만 앞으로 좀 더 발전하면 정말 영화에서나 볼 수 있던 그런 장면들이 현실이 되것 같습니다. 


그런데 궁금한점이 하나 있습니다. 음성을 텍스트로 변환하기 위해서는 분명 서버가 있어야 하는데 이걸 누가 제공하는가 하는점입니다. HTML5에 들어가는 공식 API라면 앞으로 모든 웹과 모바일에서도 사용이 가능해집니다. 그래서 엄청난 트래픽과 유지비가 들어가는 일입니다. 만약 구글 크롬 독자적인 API라면 구글 서버를 이용할 테지만 다른 웹브라우저에서도 사용가능해 진다면 어떻게 될지 궁금합니다. 아마도 익스플로러는 MS가 음성인식 서버를 운영하겠죠? 

아래 링크를 통해 직접 확인해보세요. 

구글 크롬 공식 블로그Talking to your computer (with HTML!)
크롬 11 베타http://www.google.com/intl/en/landing/chrome/beta/
HTML5 음성입력 데모http://slides.html5rocks.com/#speech-input

* 2017.10.15 업데이트
위에 소개한 음성입력 데모는 현재 동작하지 않고 페이지가 삭제된것으로 보이네요. 대신 아래 링크로 구글의 Web Speech API를 확인해 볼수 있습니다.