赤飯にかかったアレ

雑多なメモ帳

テキストマイニングがしたい! part2.分かち書きと文の文字数の平均とヒストグラムと

このページでは以下のことについて書きます。

MeCabで品詞分解(インストール方法はないよ)

今日 キョウ 今日 名詞-副詞可能
も モ も 助詞-係助詞 も モ も 助詞-係助詞
復 フク 復 名詞-サ変接続
一 イチ 一 名詞-数
は ハ は 助詞-係助詞
ようやく ヨウヤク ようやく 副詞-一般
変色 ヘンショク 変色 名詞-サ変接続
し シ する 動詞-自立 サ変・スル 連用形
始め ハジメ 始める 動詞-非自立 一段 連用形
た タ た 助動詞 特殊・タ 基本形
仔魚 仔魚 仔魚 名詞-一般
を ヲ を 助詞-格助詞-一般
一 イチ 一 名詞-数
匹 ヒキ 匹 名詞-接尾-助数詞
二 ニ 二 名詞-数
匹 ヒキ 匹 名詞-接尾-助数詞
と ト と 助詞-並立助詞
皿 サラ 皿 名詞-一般
に ニ に 助詞-格助詞-一般

 

1文当たりの文字数のヒストグラム

f:id:sekihan_0290:20180715175728p:plain

ほぼこの本の写経です。

Pythonによるテキストマイニング入門

Pythonによるテキストマイニング入門

 
続きを読む