ユーザ用ツール

サイト用ツール


korean:mecab:python_mk_tfidf

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
korean:mecab:python_mk_tfidf [2021/11/11 23:48] – [TF-IDFの計算と上位10語の表示] yoshikorean:mecab:python_mk_tfidf [2021/11/12 19:38] (現在) – [TF-IDFの計算と上位10語の表示] yoshi
行 93: 行 93:
 <code python> <code python>
 # モデルを作成 # モデルを作成
-vectorizer = TfidfVectorizer(smooth_idf=False, token_pattern='(?u)[\\w\\ue0bc-\\uefff\\uf1000-\\uf66e\\uf784-\\uf800\\uf806-\\uf864\\uf86a-\\uf8f7]+')+vectorizer = TfidfVectorizer(smooth_idf=False, token_pattern='(?u)[\\w\\ue0bc-\\uefff\\uf100-\\uf66e\\uf784-\\uf800\\uf806-\\uf864\\uf86a-\\uf8f7]+')
 values = vectorizer.fit_transform(docs).toarray() values = vectorizer.fit_transform(docs).toarray()
 feature_names = vectorizer.get_feature_names_out() feature_names = vectorizer.get_feature_names_out()
korean/mecab/python_mk_tfidf.1636642096.txt.gz · 最終更新: 2021/11/11 23:48 by yoshi