MacでJulius使ってみた

はじめに

業務で議事録を録る機会があるんですが、実際に録ってみてると

手が追いつかなかったり後から何いってるか分かんなくなったり

後から議事録のフォーマットに合わせるのが結構めんどくさかったりするので

なんかここら辺自動化できないかなとふと思いまして。

調べてみると議事録作成のフリーソフトとか、

音声認識によって音声を文字に起こせたりできないかなと思っていたのですが、

今の現場的にフリーソフト入れにくかったり、クラウド使えないとかがあるので、

オフラインで音声認識できるライブラリがあれば使えるのではと思った時に

目についたのがJuliusというオフラインでフリーで使えるエンジンでした。

とりあえずJuliusをMacで使うところまでできたので備忘録として記載しておきます。

Juliusの設定

公式のドキュメントは以下なのでとりあえずそちらを見ていただければと思います。

GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine
Open-Source Large Vocabulary Continuous Speech Recognition Engine - GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition En...

私も初めてなのでとりあえず動かしてみたいなと思って試してみたことを書いておきます。

とはいえ他の方の記事を参考に進めてみただけですが。

参考にさせていただいた記事は以下のQiita記事です。

Mac で完全フリーの音声認識エンジンJuliusを試してみた - Qiita
#はじめに今,音声認識はいろいろなところで使われ始めています.しかし,音声認識をしてみようと思うと意外と難しいのが現状です.1から作るのは無理だし,GoogleやMicrosoftは音声認識は…

まずはjuliusをインストール。

$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

ダウンロードしたら以下コマンドを打ってインストールします。

$ tar xvzf julius-4.4.2.tar.gz
$ cd julius-4.4.2
$ ./configure
$ make
$ sudo make install

とりあえずこれでJulius自体はインストールはできているかと思います。

Juliusを使用するには後ディクテーションキットが必要なのでこちらもダウンロードしておきます。

Macなのでコマンドでダウンロードできるとは思いますが、サイト経由でダウンロードしてそちらのやり方を記載しておきます。

以下のサイトから[ダウンロード]-[ディクテーションキット]の最新バージョンをダウンロードします。

GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine
Open-Source Large Vocabulary Continuous Speech Recognition Engine - GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition En...

ダウンロードしたらそのファイルを解凍し、任意のフォルダに置いておけば準備は完了です。

実際に試してみる

上記の準備ができましたら以下のコマンドを実行します。

$ cd dictation-kit-4.5
$ julius -C main.jconf -C am-dnn.jconf -dnnconf julius.dnnconf -nostrip

これで実際に試せる!と意気込んでいたら以下のエラーが・・・。

ERROR: m_options: wrong argument: "-fvad"

こちらも調べていたらエラー解消のための記事があったのでそちらを参考にすることで解消できました。

Error解消

参考にした記事は以下の記事です。

MacでJulius-v4.5を使って音声認識する - Qiita
目的Macで2019.2にリリースされたJulius-v4.5を使って音声認識した際の備忘録ですjulius-speech/julius: Release 4.5…

やったこととしては以下2つです。

・main.jconfファイルの「-fvad 3」をコメントアウト

・julius.dnnconfファイルの「num_threads 2」を削除

こちらでJulius起動のためのコマンドを再度打ったら無事起動ができました!

起動すると以下みたいな画面の表示になります。

試しに何か言ってみると認識してくれます。

今回は試しに「おはようございます」と言ってみました。

滑舌悪い自分でも認識してくれた。

最後に

とりあえず今回はJuliusを動かしてみるところまではできました。

ほぼ人の記事参考にしてましたが動かすことができてよかった。

JuliusはPythonで動かすこととかもできるみたいなので今後はそちらとも絡めて

何か一つのアプリとして使えるようにしてみたい。

最終的にはローカルで使える議事録作成アプリとして使えないかなーと検討中です。

よくわかっていないところも多いので今後も調べてみていきたいと思います。

それでは今日はこの辺で。

それでは〜

コメント

タイトルとURLをコピーしました