Linuxとかプログラミングとか。

プログラミングとか趣味とかいろいろ発信していく大学生のホームページ。

【kaldi】 【srilm】 one of required modified KneserNey count-of-counts is zero

calendar

現在、大学で音声認識の研究をしていて、音声認識フレームワークであるkaldiの実験で
東京工業大学篠崎研究室にて公開されているCSJ用Kaldiレシピチュートリアルを実装している最中に躓いた箇所があったので報告します。

make_linkf.shを実行した後に、00_0prep_csj2kaldi.shを実行すると、

と何やらエラーが出て停止してしまうのです。(チュートリアル通りやっているのに……)

調べてみると、srilmのngram-countメソッドのエラーらしく、
Kneser-Neyスムージングのカウントの推定に必要なデータ数が少なすぎるため発生している可能性があるとのこと。

本チュートリアルではコーパスとして日本語話言葉コーパスを使用していますが、
チュートリアルということでその中のごく一部のデータセットしか実際に使われません。

もしかしたら全てのデータセットを使えば正常に動作するのかもしれません。

という訳でこのスムージングの方法をカウント数に依存しないWitten-Bellスムージングに変更します。

(kaldi/egs/csj/s5_demo/01_mono/local/csj_train_lms.sh)

この部分を、

に変更します。

上手く実行できました。

この記事をシェアする

コメント

コメントはありません。

down コメントを残す




folder Android

SO-03C Xperia ray をICS化する
more...