RESEARCH #001 · テキスト解析

博多弁のばいたい、どっち寄りか数える。

Mapping the “bai / tai” Balance of Arbitrary Japanese Text

ばい ⇔ たい で配置 📝 テキスト解析 貼り付けてその場で ※ 出身地は測っていません
AI自由
研究中
Abstract

要旨

博多弁の二大語尾、「〜ばい」と「〜たい」。その文章がどちらに寄っているかを数えて、ばい⇔たいの一本の軸の上に置く。

これは「どの地域の人か」を当てるものではない。あくまで、その文章自体が断定の「ばい」寄りか、説明・納得の「たい」寄りか、という重心を見るだけだ。地図の代わりに、文体の軸を引く。

「〜ばい」と「〜たい」は、同じ博多弁でも役割が違う。

Method

方法

入力テキストを走査し、「ばい」と、文末に立つ博多弁の「たい」を数える。標準語の願望「〜したい」とぶつかる分は、語の直前を見てできるだけ除く。テキスト解析の基盤は、allfesta の 「議事録ゼロ化AI」 の系譜を引いている。

たい ÷(ばい+たい)で 0〜1。0 に近いほど「ばい」寄り、1 に近いほど「たい」寄り
ばい
「ばい」の出現数(断定・新情報を示す語尾)
たい
文末に立つ「たい」。直前が動詞連用形(〜したい 等)の願望は除外を試みる
限界
「ばいばい」「〜ば いい」「重たい」等は誤検出しうる。粗い指標である

役割の目安として、本稿のために手元の用例から作成した参考分布を置く。これは地理的な実地調査ではない。

場面ばい : たい(参考の目安)
断定・宣言(〜ばい!)8 : 2
説明・納得(〜とたい)3 : 7
雑談・相づち5 : 5
商売・呼び込み7 : 3

// 上表は本稿のために手元の用例から作成した参考分布です。地理的な実地調査ではありません。

Result

結果

LINEの文面でも、スピーチ原稿でも、博多弁で書いた文でも貼り付けて「測定する」を押すと、ばい⇔たい軸の上に、その文の位置が出る。

◀ ばい寄り(断定)(説明)たい寄り ▶

    // 計算はすべてこのブラウザ内で完結。テキストはどこにも送信されません。

    Conclusion

    結論

    この軸で分かるのは、文の語尾の重心だけだ。書き手の出身地も、博多弁の正しさも、ここからは分からない。

    「ばい」と「たい」は、同じ土地の言葉なのに役割が違う。片方だけでは博多弁の手触りは出ない。allfesta Labs は、こうして言葉の役割を数で並べ、何が測れて何が測れないのかを、その都度はっきりさせていく。

    ※ これは語尾の重心を粗く測る指標です。
    出身地・居住地・話者の属性を判定するものではありません。
    これは allfesta Labs の研究です

    この研究の足回りは、
    本気のAI技術です。

    AI自由研究は、福岡発の AI 会社 allfesta の研究部門です。テキスト解析の基盤は、本体の「議事録ゼロ化AI」と同じ系譜で動いています。本体では、地域と行政のための実用的な AI を作っています。

    References

    ネタもと