서평 : 음성처리와 자연언어처리 개론

음성 인식에 관심이 있어서 한글로 된 서적을 찾다가 고른 책인데 C와 Prolog로 작성된 PC용 소스코드가 포함되어 있다고 해서 기대를 했다.

원저인 Introducing Speech and Language Processing이 2005년 출간이고 차례를 읽어봐도 어느 정도 체계가 잡혀 있다고 생각했는데, 결론부터 이야기 하면 매우 실망.
음성 처리 관련한 개론서로는 적합한지 모르겠지만, 실제 음성 인식까지 비슷하게라도 구현해 보려면 이 책의 내용은 출발점만 제공할 뿐 상당한 연구가 더 필요할 듯.
C와 Prolog로 작성된 소스 코드는 꼭 필요한지 의문이 든다.
이 책을 교재로 강의할 때에는 음성 인식이 학기 목표가 되지는 않을 것 같다. 단지 음성 처리 관련 지식 일반에 대한 이해를 확인하는 수준이 될 것 같다.

음성 인식을 구현까지 가보고자 하는 사람에겐 너무 미흡한 책. 프로그래밍 지식이 없는 언어학, 음성과학 분야 초급자를 위한 교과서라는 서평이 적합한 듯.

실제 읽은 것은 원저가 아니라 2009년에 한국문화사에서 발행한 번역본인 음성처리와 자연언어처리 개론. 다 읽는 데 1주일도 안 걸렸다는 점에서 위안. (반대 급부로 영어 서적과 논문에 대한 부담이 점점 커진다.)

이 다음 단계는 어디서 출발을 해야 하나?

댓글

Taehan님의 메시지…
물리 쪽의 경우에는, 저널들에서 한 2년에 한번씩 분야별로 대가들에 의뢰해서 '리뷰' 형식의 논문(이라기보다 리포트에 가까운)을 싣습니다. 이름값이 있는지라 백그라운드부터 최근 결과와 예상되는 진행방향까지 잘 정리되어 있더군요. 세부 전공을 바꾸게 되는 경우 대개 이런것부터 찾아서 시작합니다.
Yoon Kyung Koo님의 메시지…
@Taehan 저널 같은 것들이 있긴 한 것 같은데 음성 인식을 지금 잘 해보려고 하는 것보다는 핵심 알고리즘을 좀 이해하고 응용을 해볼까 하는 거라서 wikipedia와 open source에서 재출발 ㅎㅎ
이호석님의 메시지…
음성인식은 hidden markov modek을 가장 많이 사용하는 걸로 알고 있는데요 혹시 hmm에 대한 스터디는 끝내셨는지요? 안보셨다면 그것부터 먼저 보심이 어떨지요… 더불어 DTW(Dynamic Time Warping) 도 함께요. n-gram도요
Yoon Kyung Koo님의 메시지…
@이호석 네, HMM, DTW, n-gram에 대한 개관은 이 책에 나와 있습니다. 이 책만으로 이해하기엔 좀 어려워 다른 것들을 좀 찾아보긴 했지만 개념적으로는 이해하고 있습니다.
이호석님의 메시지…
그러셨군요. 저도 요즘 HMM을 좀 알아보려고 하는데 너무 어렵더군요. Hidden 이라 어렵다는 이야기도…ㅎㅎ
꼭 찾으실수 있으실거예요. 수고하세요.
Yoon Kyung Koo님의 메시지…
HMM을 꼭 써야 하나 하는 게 처음의 문제의식이었는데요. 이전 상태와의 관계가 음성과 같은 신호를 분석하는 데 중요하기 때문이란 점은 이해하고 있습니다.