크롬 11 베타 공개, 음성입력 기능 웹 세상을 바꿀까?

2011.03.25 01:58


지난 22일 파이어폭스4가 공식 런칭할때 구글은 크롬 공식 블로그를 통해 크롬11 베타를 조용히 내놓았습니다. 하지만 그 내용 만큼은 조용히 넘어 갈 수 없을것 같습니다. 바로 음석입력 API 때문입니다.

구글은 크롬11에 웹 개발자를 위한 음성입력 HTML5 API 추가 했습니다. 이제 웹 개발자들이 간단하게 HTML로 <input type="text" x-webkit-speech/> 라고 적기만 하면 음성인식 버튼이 생기게 됩니다. 사용자를 그걸 누르고 컴퓨터에다 말만 하면 됩니다. 그럼 음성이 텍스트로 전환되어 빈칸에 나타나게 됩니다.

크롬 11베타라면 한번 테스트해보세요. ^^ 오른쪽 마이크 버튼 클릭!!  크롬 이전 버전은 --enable-speech-input 플래그로 실행하면 됩니다. 정말 위에 저 테그만 집어 넣었을 뿐인데 멋지네요. (사실은 스타일 테그가 쪼금 들어가길 했습니다 ^^) 그냥 네모난 창만을 보고 계신다면 크롬 11 베타를 설치해 보세요 ^^

  


잠깐 테스트 해봤는데 인식률이 정말 놀랍습니다. 아직 인식 언어를 설정하는 기능은 없지만 한글, 영어를 구분해서 인식합니다. 숫자도 구분해서 인식합니다. 인식률도 상당히 높습니다. 노트북의 경우 대부분이 마이크를 내장하고 있는데 그냥 평소 노트북을 사용하는 자세로 조용히 말해도 대부분 인식할 정도입니다. 또박또박 말하지 않고, 사투리가 섞여도 거의 정확히 인식합니다. 길이에 대해서는 정확히 설명되어 있지는 않지만 데모 페이지에서는 10초 정도 되는것 같습니다.


음성입력 API가 앞으로 웹을 어떻게 바꿀까요?

1. 웹 앱에서의 활용 가능성 (크롬 웹스토어)
 

가장 먼저 구글도 언급했듯이 웹 앱에서 음성입력 기능을 활용할 수 있습니다. 간단하게 예를 들자면 트위터나, 페이스북에 음성입력 기능을 더하는겁니다. 그럼 보다 쉽고 빠르게 트윗을 날리고 댓글을 입력할 수 있겠네요. 좀 더 머리를 굴려보면 정말 무궁무진한 가능성이 옅보입니다.

2. 키보드가 사라진다?
 

음석입력 기능이 오피스 프로그램과 만나 각종 문서 작업에서 타이필 하는 시간을 줄여줄 수 있습니다. 특히 구글 독스와 같은 웹 오피스와 간단히 연동할 수 있어 웹상에서 문서작업이 한층 쉬워질것 같습니다. 키보드가 별로 필요가 없겠죠? 그럼 PC ==> 테블릿... 테블릿이 포스트PC 맞네요. ^^

3. 크롬 OS, 음성 명령으로 PC를 조작할 수 있을까? 

구글은 크롬을 기반으로한 크롬OS를 만들고 있습니다. 여기에 음성입력 기능이 연동 된다면 음성입려을 음성명령으로 바뀌 컴퓨터를 켜거나 끄기, 프로그램 실행등 간단하게 PC를 조작할 수 있지 않을까 하는 생각이 듭니다. 지금이야 걸음마 단계지만 앞으로 좀 더 발전하면 정말 영화에서나 볼 수 있던 그런 장면들이 현실이 되것 같습니다. 


그런데 궁금한점이 하나 있습니다. 음성을 텍스트로 변환하기 위해서는 분명 서버가 있어야 하는데 이걸 누가 제공하는가 하는점입니다. HTML5에 들어가는 공식 API라면 앞으로 모든 웹과 모바일에서도 사용이 가능해집니다. 그래서 엄청난 트래픽과 유지비가 들어가는 일입니다. 만약 구글 크롬 독자적인 API라면 구글 서버를 이용할 테지만 다른 웹브라우저에서도 사용가능해 진다면 어떻게 될지 궁금합니다. 아마도 익스플로러는 MS가 음성인식 서버를 운영하겠죠? 

아래 링크를 통해 직접 확인해보세요. 

구글 크롬 공식 블로그Talking to your computer (with HTML!)
크롬 11 베타http://www.google.com/intl/en/landing/chrome/beta/
HTML5 음성입력 데모http://slides.html5rocks.com/#speech-input

* 2017.10.15 업데이트
위에 소개한 음성입력 데모는 현재 동작하지 않고 페이지가 삭제된것으로 보이네요. 대신 아래 링크로 구글의 Web Speech API를 확인해 볼수 있습니다.


신고

뽕다르 인터넷 , , , , , , , , ,

  1. 오.... 역시 구글이라는 생각밖에 안 드네요.

  2. 구글 음성인식 기술은 정말 대단하죠..

  3. Blog Icon
    하늘빛

    HTML5를 잘 몰라서 그러는데 원래 HTML5 API는 코드베이스 뭐 그런 거 하나도 없이 저런 식으로 구현되나요? 만약 저 표현이 크로스 브라우징할 수 없는 것이라면 IE가 나홀로 표준을 밀 때랑 똑같이 브라우저별로 코딩해야 하는 불상사가 생길 수도 있겠네요.

  4. 확인해보니 구글에서 저거를 HTML5 API 표준으로 하자고 제안을 했다고 하네요. 확실히 표준으로 되었는지는 잘 모르겠습니다 .^^

  5. Blog Icon
    안개소리

    방금 테스트해 봤는데요, 인식률 엉망인데요? 처음에 기본적인 말 '가나다라' 했더니 잘 됐는데, 그 다음엔 영 엉망입니다. 아직 갈 길이 먼 듯...

  6. 아무래도 노트북은 좀 멀리 떨어져 있고 주위 소음도 있을수 있으니 편차가 클것 같네요. ^^

  7. 일반 데스크톱은 잘 안쓰죠 ㅎㅎ. 하지만 강력한 기능인것이겠네요.
    그런데 왜 크롬 베타11은 여기서 처음 알았는지 모르겠군요 ㅎㅎ. 아무튼 크롬 쓰지만 참 빠르고 편리한 거 같습니다.


    그런데.. 한가지 걱정인것은 일부로 오역할 까 걱정이네요. 번역에서는 일부로 오역하는 일이 있더라구요
    (트랙백 보냈습니다. ^^)

    글 잘보았습니다.

  8. 사실은 별로 쓸모 없는 기능이기는 한데 그걸 또 필수 기능으로 만드는 회사가 진정한 용자죠.

  9. 해드셋이랑 마이크가 잘 팔릴것만 같은 느낌이 ?;

  10. 크롬용 해드셋 나오겠군요. ㅋㅋ

  11. Blog Icon
    -_-

    모바일에선 유용하겠지요. 핸드폰에 마이크가 기본적인 하드웨어로 붙어있으니까요. 하지만 데스크톱에서 마이크 사용하는 사람은 적죠.

  12. 모니터에 마이크 단자가 포함되어 있다면 좋을것 같네요 ^^