中学生レベル?
ネタ蔵キーワード:日本語 [【特集】言葉はさんかく、こころは四角]
1 月 29th, 2009
仕事関係で、「日本語文章の難易度を計算する方法」ってのが一般にあるのかどうか調べています。
そこで見つけたのが・・・
で「帯1.x (obi-one)」ってソフトウェアのデモページです。
ざっくり言うと・・・教科書コーパス(教科書からランダムにピックアップした文章データ)から得た各文字の難易度モノサシ上で、使われている文字を統計処理して難易度を出す・・・ってものです。
モノサシが教科書コーパスから得た文字だから、あまり内容には左右されないと思いますが、試してみるとなかなかおもしろいです。
ここの記事をいくつかやってみると、大体「中1」か「中2」ですね(w
「ブログ記事なんてみんなそんな感じじゃ?」と思って・・・インターネット上から、理屈っぽいけどまとまった感じのブログ記事を探して、やってみると・・・「大学レベル」とでたりします。
ロジック的にボクが探していたものではなかったのですが、日本語文章を考える上でいろんなヒントを提供してくれている気がします。

