AI議事録ツールは、この数年で急速に進化してきました。
以前は、会議内容をそのまま全文文字起こしする「音声認識(Speech-to-Text: STT)」中心のツールが主流でしたが、現在ではいわゆる生成AI(Large Language Model: LLM)を活用し、発言内容を整理・要約した実用的な議事録を自動生成できるツールも増えています。
決定事項や議論の要点をまとめたり、タスクを整理したりと、実用的なレベルまで到達しているのが、現在のAI議事録ツールの特徴です。
本記事では、
これらを技術的な観点も交えながら整理していきます。
AI議事録ツールは、大きく次の2つのタイプに分類できます。
Google Meet、Zoom、Microsoft Teams などに代表されるもので、会議ツール自体にAI文字起こしや録音・録画機能が入っているタイプです。
追加ツール不要で、会議内でワンクリックで記録・文字起こしすることができます。
メリット
デメリット
会議ツールに関係なく、”スピーカーの音声を録音”する、もしくは“ボットを会議に参加させる”ことで、録画・文字起こし・AI要約を行うツールです。
会議ツールに依存せず、同じワークフローで使うことができます。
メリット
デメリット
どのタイプが適しているかは、「どのような形式の会議(オフライン、オンライン、社内ミーティング、顧客打ち合わせなど)で、どのツールを使うのか」によって変わってきます。
導入する際は、自社のミーティング事情を踏まえ、どのタイプが合っているのかを考えるのが大切になります。
さて、AI議事録作成までの大まかな仕組みを見ていきましょう。
AI議事録は、大きく「音を聞く部分」と「内容を整理する部分」に分けて考えることができます。
精度の限界を知るには、この役割分担の理解が不可欠です。
なお、本記事でご紹介する仕組みは、あくまでも一般的なものとなっています。
ツールによっては、本記事で紹介している以外の手法を採用しているものもありますので、あらかじめご了承下さい。
大きくわけて、「耳」の役割をするAI(STT)と、「脳」の役割をするAI(いわゆる生成AI、LLM)の2つの異なるAIが連携して作られています。
議事録AIの精度は、SST、LLMそれぞれの精度に依存します。

なお、ツールによって
といった違いがあります。
STTには、下記に示すように、2つの課題があります。
話者分離(Speaker diarization)とは、音声データから「いつ、誰が話したか」を自動で特定し、発話区間と話者ラベル(例:話者A、話者B)を割り当てる技術です。
アプリケーションによって、話者分離の方法が異なります。

この話者分離は、AI議事録の品質を大きく左右する要素です。
これは、Google Meet、Zoom、Microsoft Teams などの会議ツール内蔵タイプによく見られる手法です。
AIを利用せずに、アカウント情報から話者を特定します。
AIは音声からテキストに変換するだけです。
というメリットがある一方、
というデメリットもあります。
これは、サードパーティタイプに多く見られる手法です。
AIが音声からテキストに変換する際に、音声波形の特徴から、話者の違いを特定します。
という点はメリットですが、
など、システムで分離する場合に劣るケースもあります。
話者分離が不十分だと、
といった問題につながるため、ツール選定時に重視したいポイントです。
重要なポイントとして、音声認識AIは発言の意味を解釈しながら聞いているわけではありません。
音声認識AIは、音声の特徴や前の文脈を考慮しながら、最も整合性の高い文字列を確率的に推定しています。
ただし、ここでいう文脈とは音声や文字の並びとしての整合性であり、発言の意味を理解しているわけではありません。
そのため、
といった要素は、音声認識の段階で誤認識されやすくなります。
この、何を話しているか、の聞き取り精度は非常に重要です。
ここで聞き間違えが多くなると、後段の議事録作成作業に大きく影響があるためです。
特に専門用語/独自用語については、AIが学習データとして持っていないケースがほとんどであるため、完全に対応するのは困難です。
対策としては、
などが考えられます。
この点については、別の記事でご紹介できればと思います。
本記事では、AI議事録の基本的な構造と課題について整理しました。
AIが議事録を作成する流れとしては、音声認識(STT) → 生成AI(LLM)というAIの2段階利用が主流となっています。
また、ツールによってどこまでがアウトプットされるかが変わってきます。
そのため、
これらを意識することで、自社に合ったAI議事録ツールを選びやすくなると思います。
是非参考にしてみて下さい。
Tech Funでは、お客様のフェーズに合わせ、生成AI活用に向けた支援を3つのパックでご提供しています。
生成AIに限らず、Web・業務システム開発やインフラ設計など、技術領域を問わずご相談を承っています。「何から始めれば良いか分からない」という段階でも構いませんので、ぜひお気軽にお問い合わせください。