RESEARCH #019 · 行政文書解析

補助金の文書は、
何%が決まり文句か。

Boilerplate Density in Public Subsidy Documents

13文書 / 福岡県 📄 行政文書解析 決まり文句率 ※ 計算は決定的(AI は操作定義と考察に関与)
AI自由
研究中
Abstract

要旨

福岡県が公開する補助金関連文書 13本(交付要綱・募集案内・リーフレット・申請書類の記載例・実施計画書)を、AI が設計した行政定型句辞書(5カテゴリ・約70語)で採点した。決まり文句率は交付要綱で 11.9%、チラシで 1.8%。同じ補助金の文書でも、約 6.5 倍の開きがあった。

さらに、決まり文句率と一文の長さは負の相関(r = −0.50)を示した。決まり文句で固める文書と、長い一文で攻める文書があり、「読みにくさ」は一つの指標では捉えられない。同じ入力には、必ず同じ結果が返る。

決まり文句は、申請者が最後に読む文書に集まっていた。

Method

方法

福岡県が 2025〜2026 年に公開した補助金関連文書 13 本を PDF から取得し、本文テキストを抽出した。各文書について、行政文書に特徴的な定型表現の辞書とのマッチを取り、その非重複の文字カバレッジを「決まり文句率」とした。

決まり文句率
辞書にマッチした文字の非重複カバレッジ ÷ 本文文字数 × 100。「本文の何%が定型表現の文字でできているか」
辞書の5カテゴリ
①法令調の語尾(〜ものとする/〜しなければならない 等)②条文参照の常套句(次の各号/前項/当該 等)③儀礼的接続(なお、/ただし、/下記のとおり 等)④留保・ぼかし表現(等/その他/必要に応じ/適宜 等)⑤行政文体の硬い接続(において/により/に係る/について 等)
文書グループ
13本を5タイプに分類:要綱(1)/案内・手引き(3)/リーフレット(2)/記載例(2)/実施計画書(5)
副指標
平均文長(句点「。」で区切った一文あたりの文字数)。決まり文句率とは独立した「読みにくさ」の軸として併記
対象範囲
福岡県の3つの補助金/事業(生産性向上・賃上げ/経営革新・賃上げ/地域少子化対策)の公開文書。すべて機械可読な文字 PDF。出典は References に明記
限界
「決まり文句」は行政文体に特徴的な定型表現を辞書で操作的に定義したもの。文章の良し悪し・正確さ・必要性を評価するものではない。定型表現には法的に必要なものも多く含まれる
AIの関与(開示)
本研究では AI が「決まり文句」の辞書(5カテゴリ・約70語)を公用文・行政文書の通念から設計し、研究部が検証して固定した。各文書のカバレッジ計算は完全に決定的。下の AI 所見は算出された統計量から AI が言語化し、研究部が確認したもの

※ 「決まり文句率」は文書の質や誠実さを測るものではない。観測可能な定型表現の密度である。

Result

結果

解析対象
13
文書(福岡県)
決まり文句率 最大
11.9%
交付要綱
率 × 文長 相関
−0.50
負の相関

文書タイプ別に決まり文句率を平均すると、交付要綱が突出して高い。要綱は補助金の効力を法的に定める文書で、案内・手引き、記載例、リーフレットの順に下がっていく。決まり文句は、申請者が最終的に従う「効力を持つ文書」に集中していた。

文書タイプ別の決まり文句率(平均)

縦軸=決まり文句率(%)/横軸=文書タイプ

一方、決まり文句率と一文の長さの関係を見ると、負の相関(r = −0.50)が現れた。決まり文句率が高い交付要綱は一文が短く(平均90字)、決まり文句率が低い実施計画書は一文が極端に長い(最長226字)。読みにくさには、定型句で固める方向と、長い一文で攻める方向の2つがある。

決まり文句率 × 平均文長

横軸=決まり文句率(%)/縦軸=平均文長(字)/点=13文書

文書 13 本を決まり文句率の順に並べると、次のようになる。交付要綱だけが二桁、最も低いのは添付書類の記載例(賃金台帳)とチラシだった。

決まり文句率文書タイプ平均文長

決まり文句率を辞書のカテゴリ別に分解すると、最も寄与が大きいのは「行政文体の硬い接続」(〜において/〜により/〜に係る 等)だった。法令調の語尾や条文参照より、こうした漢語+格助詞の硬い接続のほうが、行政文書の手触りを支配している。

決まり文句率に占めるカテゴリ別の寄与

5カテゴリの文字カバレッジ寄与シェア(全13文書合計)

Tool

あなたの文章も、計ってみる。

仕事のメール・申請書・案内文など、どんな日本語でも貼ると、同じ5カテゴリの辞書で決まり文句率を採点し、どこが定型表現かをハイライトする。同じ文を入れれば、必ず同じ点数が出る

0%
AIによる解釈 — 算出値から生成・研究部が検証

// 計算はすべてこのブラウザ内で決定的に実行。入力テキストはどこにも送信されません。

Conclusion

結論

福岡県の補助金関連文書 13 本において、決まり文句率は文書タイプによって約 6.5 倍の開きがあった。最も高いのは交付要綱——補助金の効力を法的に定め、申請者が最終的に従う文書である。入口のチラシやリーフレットは平易に書かれ、核心の要綱は定型表現で固められていた。

これは、行政文書が「読ませたい文書」と「効力を持つ文書」で文体を切り替えていることを示唆する。また、決まり文句率と一文の長さが負の相関を示したことは、読みにくさが単一の尺度では測れないことを意味する。本研究は文書の良し悪しや必要性を評価するものではない。定型表現の多くは法的・形式的に必要なものでもある。

allfesta Labs は、こうして普段は「お役所言葉」と一括りにされる文体を、辞書とカバレッジで淡々と数に置き換え、何が言えて何が言えないのかをはっきりさせていく。考察の言語化は AI が担い、研究部が検証している。

※ これは定型表現の密度の観察です。
文書の質・正確さ・必要性を評価するものではありません。定型表現には法的・形式的に必要なものが多く含まれます。対象は福岡県の公開 PDF 13 本です。
これは allfesta Labs の研究です

この研究の足回りは、
本気のAI技術です。

AI自由研究は、福岡発の AI 会社 allfesta の研究部門です。本稿のカバレッジ計算は決定的なテキスト統計で、辞書の設計と結果の解釈は AI が言語化し研究部が検証しています(実AIの所在を方法で開示)。本体では、地域と行政のための実用的な AI を作っています。

References

ネタもと