はじめに
業務で議事録を録る機会があるんですが、実際に録ってみてると
手が追いつかなかったり後から何いってるか分かんなくなったり
後から議事録のフォーマットに合わせるのが結構めんどくさかったりするので
なんかここら辺自動化できないかなとふと思いまして。
調べてみると議事録作成のフリーソフトとか、
音声認識によって音声を文字に起こせたりできないかなと思っていたのですが、
今の現場的にフリーソフト入れにくかったり、クラウド使えないとかがあるので、
オフラインで音声認識できるライブラリがあれば使えるのではと思った時に
目についたのがJuliusというオフラインでフリーで使えるエンジンでした。
とりあえずJuliusをMacで使うところまでできたので備忘録として記載しておきます。
Juliusの設定
公式のドキュメントは以下なのでとりあえずそちらを見ていただければと思います。
私も初めてなのでとりあえず動かしてみたいなと思って試してみたことを書いておきます。
とはいえ他の方の記事を参考に進めてみただけですが。
参考にさせていただいた記事は以下のQiita記事です。
まずはjuliusをインストール。
$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
ダウンロードしたら以下コマンドを打ってインストールします。
$ tar xvzf julius-4.4.2.tar.gz
$ cd julius-4.4.2
$ ./configure
$ make
$ sudo make install
とりあえずこれでJulius自体はインストールはできているかと思います。
Juliusを使用するには後ディクテーションキットが必要なのでこちらもダウンロードしておきます。
Macなのでコマンドでダウンロードできるとは思いますが、サイト経由でダウンロードしてそちらのやり方を記載しておきます。
以下のサイトから[ダウンロード]-[ディクテーションキット]の最新バージョンをダウンロードします。
ダウンロードしたらそのファイルを解凍し、任意のフォルダに置いておけば準備は完了です。
実際に試してみる
上記の準備ができましたら以下のコマンドを実行します。
$ cd dictation-kit-4.5
$ julius -C main.jconf -C am-dnn.jconf -dnnconf julius.dnnconf -nostrip
これで実際に試せる!と意気込んでいたら以下のエラーが・・・。
ERROR: m_options: wrong argument: "-fvad"
こちらも調べていたらエラー解消のための記事があったのでそちらを参考にすることで解消できました。
Error解消
参考にした記事は以下の記事です。
やったこととしては以下2つです。
・main.jconfファイルの「-fvad 3」をコメントアウト
・julius.dnnconfファイルの「num_threads 2」を削除
こちらでJulius起動のためのコマンドを再度打ったら無事起動ができました!
起動すると以下みたいな画面の表示になります。
試しに何か言ってみると認識してくれます。
今回は試しに「おはようございます」と言ってみました。
滑舌悪い自分でも認識してくれた。
最後に
とりあえず今回はJuliusを動かしてみるところまではできました。
ほぼ人の記事参考にしてましたが動かすことができてよかった。
JuliusはPythonで動かすこととかもできるみたいなので今後はそちらとも絡めて
何か一つのアプリとして使えるようにしてみたい。
最終的にはローカルで使える議事録作成アプリとして使えないかなーと検討中です。
よくわかっていないところも多いので今後も調べてみていきたいと思います。
それでは今日はこの辺で。
それでは〜
コメント