RESEARCH #003 · テキスト解析

議事録から「えー」「あー」を、全部数えてみた。

Counting Filler Words in Meeting Minutes: A Quantitative Note

フィラー率を測定 📝 テキスト解析 貼り付けてその場で ※ 発言の良し悪しは測っていません
AI自由
研究中
Abstract

要旨

会議の発言には「えー」「あのー」「まあ」といったフィラー語(言い淀み)が一定の割合で混ざる。本稿はこれを機械的に数え、発言量で正規化した「フィラー率」を定義する。

フィラーは発言の欠陥ではない。考えながら話している自然な痕跡である。ただ、数えて並べると、会議という場のテクスチャが少しだけ定量化される。下のツールに任意のテキストを貼れば、その場で測れる。

「えー」は減点対象ではない。ただ、数は数えられる。

Method

方法

フィラー語辞書を用意し、入力テキストを走査して出現回数を合計。総文字数で正規化して百分率にする。議事録テキストの解析基盤は、allfesta の議事録自動生成AI 「議事録ゼロ化AI」 の系譜を引いている。

フィラー率
(フィラー語の総出現回数 ÷ 全体の文字数)× 100(%)
辞書
えー/えーと/あー/あのー/そのー/まあ/なんか/ちょっと/やっぱり/一応/というか/結局/逆に/まさに/正直 ほか
正規化
発言量が違っても比較できるよう、長さあたりの密度に直す
対象
任意の発言テキスト(議事録・スピーチ書き起こし・自分の話し言葉メモ など)
Result

結果

これは読むだけの結果ではなく、あなたが測る結果だ。議事録の一節でも、自分のスピーチ原稿でも、貼り付けて「測定する」を押すと、フィラー率と内訳が出る。

0.0%

    // 計算はすべてこのブラウザ内で完結。テキストはどこにも送信されません。

    Conclusion

    結論

    フィラーを数えても、誰の発言が優れているかは分からない。分かるのは、その場の話し方の密度だけだ。

    それでも、感覚で「あの会議は長かった」と言う代わりに、同じ物差しで測れるようになる。allfesta Labs は、こうして感覚を一つずつ数字に置き換え、何が測れて何が測れないのかを、その都度はっきりさせていく。

    ※ フィラー率は話し方の一面を数えた指標です。
    発言の内容・正しさ・価値を評価するものではありません。
    これは allfesta Labs の研究です

    この研究の足回りは、
    本気のAI技術です。

    AI自由研究は、福岡発の AI 会社 allfesta の研究部門です。議事録の解析基盤は、本体の「議事録ゼロ化AI」と同じ系譜で動いています。本体では、地域と行政のための実用的な AI を作っています。

    References

    ネタもと