LLM – 音声データから議事録を自動作成(Whisper, ChatGPT)

今回は、LLM(Large Language Model)の中でも非常に人気のOpenAI社のWhisperとChatGPTを使用したツールについてです。これはMP3, WAVなどの音声データから議事録を自動作成するツールで、Beta版について簡単にご紹介しようと思います。

私自身このツールを使っているのですが、なんだかんだ１時間以上かかっていた議事録作成が、手直しを含めて５〜10分程度に削減できるようになりました。

1. 背景

議事録の作成は本当に時間がかかり、面倒な作業だと思います。会議に議事録担当を参加させるのはどうなんだろうと感じることもあります。本当にフォーカスすべきことは恐らく、もっとあるはず。。といったモチベーションから会議での音声データ（iphoneなどで録音が必要ですが）を使って文字書き起こしできないかと日々考えていました。

しかしOpenAI社からWhisperがBetaリリースされたことで、ツールを作成してみました。また、業務で早速使ってみたところ、１時間以上かかっていた議事録作成が、手直しを含めて５〜10分程度に削減できるようになり、とても便利だったので公開しようと思いました。

2. 議事録自動作成ツール

まだBeta版ですが、LLMで非常に注目されているOpenAI社のWhisperとChatGPTを使用して、議事録作成ツールの試作品を作成しました。

このデモ環境はHuggigfaceという環境のPrivate modeを使用しております。しかし、実際に使用する際にはセキュリティなどの観点でAWSなどCloudを使用することでセキュリティ要件を満たすことが可能となります。

1. ログイン

2. メインページ

a. 議事録作成イメージ（日本語）

mp3ファイルを画面左上にドラッグ
Languageで”jp”を選択
“送信”ボタン押下
画面右側上に、音声を書き起こした文章が表示されます。
画面右下に、議事録が作成されます。（SampleではMarkdownで作成、項目もSampleです。）

b. 翻訳での議事録作成イメージ（英語）

日本語のmp3ファイルを使用して、英語の議事録を作成してみます。

mp3ファイルを画面左上にドラッグ
Languageで”en”を選択
“送信”ボタン押下
画面右側上に、音声を書き起こした文章が表示されます。
画面右下に、英語での議事録が作成されます。（SampleではMarkdownで作成、項目もSampleです。）

3. お問合せ

もし実際に触ってみたいなどありましたらSampleページを共有させていただきます。

以下のお問わせフォームより、必要事項をご記入の上ご連絡ください。

(Visited 300 times, 1 visits today)