
photo credit: ingasgems
仕事関係で、「日本語文章の難易度を計算する方法」ってのが一般にあるのかどうか調べています。
そこで見つけたのが・・・
「日本語テキストの難易度を測る」
で「帯1.x (obi-one)」ってソフトウェアのデモページです。
ざっくり言うと・・・教科書コーパス(教科書からランダムにピックアップした文章データ)から得た各文字の難易度モノサシ上で、使われている文字を統計処理して難易度を出す・・・ってものです。
モノサシが教科書コーパスから得た文字だから、あまり内容には左右されないと思いますが、試してみるとなかなかおもしろいです。
ここの記事をいくつかやってみると、大体「中1」か「中2」ですね(w
「ブログ記事なんてみんなそんな感じじゃ?」と思って・・・インターネット上から、理屈っぽいけどまとまった感じのブログ記事を探して、やってみると・・・「大学レベル」とでたりします。
ロジック的にボクが探していたものではなかったのですが、日本語文章を考える上でいろんなヒントを提供してくれている気がします。
netazo 雑談 text mining, 日本語

清涼寺の門
仕事絡みのことで、ちょと気分がグラグラしてたので、いつも歩いている奥嵯峨に向かいました。
嵐電・嵐山駅から、まずは清涼寺へ。
大体、朝9時ころだったのですが、ものすごく天気が良くて暑いくらいでした。
この時期、「清涼寺式釈迦」として有名な秘仏・釈迦如来立像は公開されてないし、カッコいい「文殊&普賢」の脇士チームがおかれている霊宝館もクローズされているのは知っていたのですが・・・この仁王門を久しぶりに見たくて行ってみたわけです。
Read more…
netazo 京都, 日本巡り 京都, 仏像, 化野念仏寺, 寺, 日本, 清涼寺, 藤原定家

photo credit: fleshmeatdoll
FriendFeedってサービスを使い始めました。
「へぇ〜」なんつって、いちいち感心しながらいじくり回してみました。
検索機能も充実してて、「こりゃGoogleで検索してるより全然いいな」ってなことで、「仏像」で検索してみると・・・
「六菖綺譚 - 仏像マップ」
ってのが見つかりました。
「仏像の所在をデータベース化する」ってのは、もちろん昔から興味がありました。
自分でやるとしてもかなりの労力・・・「だれもまだやってないし、ま、そのうち・・・」ってな感じで、すごーくテキトーに考えていました・・・
実際、ネット上にはそういうデータがないんで、激しくこの記事に反応。
Read more…
netazo 雑談 Google Earth, google maps, 仏像