MS, 새 음성 인식 기술 '인간과 같은 수준'

마이크로소프트의 음성 대화 연구팀이 ‘인간과 동등한(human parity)’ 수준의 음성 대화 인식 시스템을 만들어 냈다고 18일(현지시각) 공식 블로그를 통해 발표했습니다.

새로운 음성 인식 시스템은 실제 사람이 대화를 하며 단어를 인식하는 것과 비슷하다고 합니다. 일반적으로 사람이 대화를 할 때는 뜻은 같지만 다른 단어를 사용하거나 발음이 다를 수 있습니다. 비슷한 단어를 그룹으로 묶어 일반화하고 정확히 알아들을 수 있도록 신경 언어 모델을 적용했다고 하는데요. 단어 인식 오류율은 5.9%로 사람이 말을 받아 적으며 발생하는 오류율과 같은 수준이라고 합니다. 역대 산업 표준 음성 인식 시스템 가운데 가장 낮은 오류율로 ‘역사적인 업적’이라며 자랑을 했습니다.

이 시스템이 소비자, 비즈니스 제품에 광범위한 영향을 줄 수 있을 거라고 자신하고 있습니다. 우선적으로 윈도우, 엑스박스에 탑재된 마이크로소프트의 가상 음성 비서 코타나, 음성 텍스트 변환기 등에 적용할 계획이라고 합니다.

인간 수준에 도달한 역사적인 사건이라고 주장하고 있지만 실제 인간의 대화를 이해하고 함께 이야기를 나누기까지는 오랜 시간이 더 필요할 겁니다. 이 시스템이 적용된 코타나의 대화의 기술이 얼마나 좋아질는지 살짝 기대가 되기도 합니다.

[리뷰전문 유튜브 채널 더기어TV]

이 기사를 공유합니다

10월 27일 애플 이벤트 확정, 새로운 맥이 온다

ABOUT AUTHOR

황승환 dv@xenix.net

COMMENT 0