korean:mecab:python_mk_tfidf
差分
このページの2つのバージョン間の差分を表示します。
| 両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン | ||
| korean:mecab:python_mk_tfidf [2021/11/09 23:53] – [TF-IDFの計算と上位10語の表示] yoshi | korean:mecab:python_mk_tfidf [2026/03/16 23:03] (現在) – yoshi | ||
|---|---|---|---|
| 行 89: | 行 89: | ||
| ここから後は,[[korean: | ここから後は,[[korean: | ||
| - | <wrap info> | + | <wrap info> |
| <code python> | <code python> | ||
| # モデルを作成 | # モデルを作成 | ||
| - | vectorizer = TfidfVectorizer(smooth_idf=False, | + | vectorizer = TfidfVectorizer(smooth_idf=False, |
| values = vectorizer.fit_transform(docs).toarray() | values = vectorizer.fit_transform(docs).toarray() | ||
| feature_names = vectorizer.get_feature_names_out() | feature_names = vectorizer.get_feature_names_out() | ||
| 行 186: | 行 186: | ||
| 取得したデータをMeCabで処理しながら,その結果を利用するということが多いかと思いますが,既に出力結果がある場合,また出力結果を修正した正解ファイルがある場合も,簡単に処理することができます.形態素解析の結果には誤りも含まれることがあるため,正解ファイルを利用する,ということもニーズがあると思われます. | 取得したデータをMeCabで処理しながら,その結果を利用するということが多いかと思いますが,既に出力結果がある場合,また出力結果を修正した正解ファイルがある場合も,簡単に処理することができます.形態素解析の結果には誤りも含まれることがあるため,正解ファイルを利用する,ということもニーズがあると思われます. | ||
| - | {{indexmenu_n> | + | {{indexmenu_n> |
korean/mecab/python_mk_tfidf.1636469593.txt.gz · 最終更新: by yoshi
