
みなさま、こんにちは。植木です。
前回に引き続き、JAPAN AIの「SPEECH」機能を紹介します。
前回は、文字起こしや議事録作成といった基本的な機能をご紹介しました。
今回は、エージェント・データ連携やカスタムテンプレート、ファインチューニングの方法など、
SPEECHをさらに便利に活用するための方法を紹介します。
【JAPAN AI】SPEECH 基本ガイド
目次
1. エージェント連携
文字起こし結果を基に、AIエージェントで高度な加工や作業をしたり、
チャットを利用して文字起こし結果を活用したりすることができます。
エージェント連携
文字起こし結果の右側から「AI活用」を選択します。
エージェント連携では、議事録や音声データから任意の形式の加工を行ったり、
スライド作成やメール作成を行うことができます。
CHAT連携
「新しいCHATを始める」をクリックすると、
文字起こし結果が自動的に連携されたCHATルームが作成されます。
例えば、以下のようなことをその場でそのまま実行できます。
- 次回のToDoについて教えてください
- ○○の件についてネクストアクションを教えてください
- ○○部長は△△プロジェクトに対してどのように言及していましたか?
2. データ連携
文字起こし結果を活用したRAG(検索拡張生成)により、
会議データを組織のナレッジとして蓄積・活用できます。
RAGとは
RAG(検索拡張生成)は、LLMが外部の知識ベースから関連情報を検索・参照しながら、
より正確な回答を生成する技術です。
企業独自のデータと組み合わせることで、信頼性の高い回答を生成できます。
自動データセット化
文字起こし結果は自動的にデータセットとして保存されます。
※「データ連携」>「議事録」 から確認できます。
データセット名は、文字起こしを行った際のトークルーム名となります。
データセット選択と検索
JAPAN AI CHATから以下の手順でデータセット化した議事録を参照できます。
- 「データセットを選択」をクリック
- 対象のデータセットを選択し、「反映」をクリック(複数選択可能)
3. カスタムテンプレート作成
標準テンプレートに加え、自社の議事録フォーマットに合わせたオリジナルテンプレートを作成できます。
手順
1. 「プロンプト支援」>「テンプレートを追加」をクリックし、以下を設定します。
| 項目 | 説明 |
| テンプレート名 | テンプレートの名前 |
| テンプレートの説明 | テンプレートの説明 |
| 共有設定 | 組織内の共有設定(共有範囲(部署など)の指定が可能) |
| カテゴリ | テンプレートのカテゴリ |
| テンプレートの用途 | SPEECH で利用する場合は、「議事録加工用」を選択 |
2. 変数作成
・{note}変数(自動設定)
― 文字起こし結果を表す変数として自動設定されます。
・カスタム変数(任意)
― 「会議の目的」など、毎回変わる内容を変数として追加できます。
変数名、表示名、説明を設定し、「テンプレートに挿入」で配置します。
3. プロンプト作成
・AIリクエスト用テンプレート
― 実際にAIに送信されるプロンプトです。
・表示用テンプレート
― テンプレート選択時のプレビューに表示されます。
AIリクエスト用をコピーするか、簡易的な説明を記載します。
■利用イメージ
4. ファインチューニング
専門用語や業界特有の言葉を学習させ、文字起こし精度を大幅に向上させる機能です。
JAPAN AI SPEECHでは、ファインチューニングにより誤り率を大幅に改善できます。
- 金融業界の例:誤り率を5分の1以下に改善
- 不動産業界の例:誤り率を3分の1以下に改善
手順
エンジン作成(単語登録・CSV一括登録)
- 「設定」>「モデル管理」を選択
- エンジン名を入力
- 単語とふりがな(発音)を登録
- 「モデルを作成」をクリック
- ステータスが「作成完了」になれば利用可能(登録する単語が多いと時間がかかります)
※CSV一括登録にも対応しています。
登録単語数は50単語までを目安とし、作成には数十分~数時間かかります。
エンジンの利用(※管理者向け)
① リアルタイム録音・会議の文字起こしで利用する場合
「設定」>「スピーチ」の「音声認識モデル」で、作成したエンジンを選択します。
※組織全体に適用されるのでご注意ください
② 音声・動画ファイルの文字起こしで利用する場合
ファイルをアップロード後に、用語ライブラリーから作成したエンジンを選択します。
5. 管理設定(管理者向け)
「設定」>「スピーチ」から議事録ボットの設定を行えます。
※組織全体に反映されます
| 項目 | 説明 |
| ボット名 | ボットの名前 |
| ボット画像 | テンプレートの説明 |
| 言語 | 日本語、英語、中国語、自動認識から設定 |
| 音声認識モデル | ファインチューニングしたエンジンの設定 |
| 文字起こし後に音声ファイルを削除 | オンにすると、音声ファイルは保存されません。この場合、音声再生ボタンは表示されません。 |
まとめ
JAPAN AI SPEECHは、様々な応用機能を利用することで、
単なる文字起こしツールを超えた活用が可能です。
エージェント連携により文字起こし後の要約・分析を自動化し、
カスタムテンプレートで自社の議事録フォーマットに対応できます。
さらに、ファインチューニングで業界特有の専門用語も高精度で認識するため、
会議データを組織のナレッジとして蓄積・活用し、業務効率を最大化できます。
ぜひ実際の業務フローに組み込んでご活用ください。
他のおすすめ記事はこちら
著者紹介
ICT事業本部 技術本部
先端技術統括部 DXコンサルティング部 デジタルイノベーション課
植木 真
