ユーザ用ツール

サイト用ツール


korean:mecab:khcoder

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
korean:mecab:khcoder [2015/10/17 23:34] yoshikorean:mecab:khcoder [2018/02/28 15:37] (現在) – [共起ネットワークに必要なパッケージ] yoshi
行 120: 行 120:
  
 {{:korean:kh_corres_01.png?direct&300|}} {{:korean:kh_corres_01.png?direct&300|}}
 +
 +各大統領について原点から最も離れている語を拾うと,盧武鉉氏が동북「東北」,李明博氏が선진03「先進」,朴槿恵氏が행복02「幸福」という結果になりました.「東北」は동북아「北東アジア」が分析された結果と思われます.
 +
 +====== メモ ======
 +
 +===== ユーザー辞書の指定 =====
 +
 +[[https://taku910.github.io/mecab/dic.html|単語の追加方法]]などで作成したユーザー辞書を追加して使う場合,KH Coderのインストールフォルダ内にある''dep/handic/dicrc''の<wrap warning>末尾に</wrap>,ユーザー辞書へのパスを追加します.以下の例は,ユーザー辞書''user.dic''が''E:\00Work\02Data\00kodic\dic''にある場合の記述です.
 +
 +<code>
 +userdic = E:/00Work/02Data/00kodic/dic/user.dic
 +</code>
 +
 +この設定は,KH Coderで韓国語を解析する場合にのみ適用されます.
 +
 +===== 抽出する品詞の追加 =====
 +
 +初期設定では,抽出する品詞が普通名詞,固有名詞,形容詞,副詞,動詞に限られており,それ以外の品詞,例えば助詞や語尾などは「その他」に一括して扱われています.これらを別個に抽出したい場合は,品詞を追加して前処理を行います.
 +
 +品詞を追加するには,''config''フォルダ内の''hinshi_mecab_k''という設定ファイルの<wrap warning>末尾に</wrap>記述を加えます.以下はその例です.
 +
 +<code>
 +40,JOSA,"Ending-助詞",
 +41,EOMI,"Ending-語尾",
 +</code>
 +
 +コンマで区切って記述をしますが,最初の数字は品詞IDで,他と重複しない値を設定します.2列目は品詞名,3列目(条件1)は抽出する条件をHanDicの品詞で記述します.条件2は設定していませんので,コンマで終わります.
 +
 +===== Macで使う場合 =====
 +
 +==== 共起ネットワークに必要なパッケージ ====
 +
 +Rの方で''igraph''パッケージの''1.0.1''をインストールしていたのですが,描画に失敗しました.[[https://cran.r-project.org/src/contrib/Archive/igraph/|CRANのigraphアーカイブ]]からバージョンの''0.5.4-4''をダウンロードして,''~/Desktop''に解凍した場合,
 +
 +<code r>
 +install.packages("~/Desktop/igraph/", repos=NULL, type="source")
 +</code>
 +
 +でインストールします.[[http://koichi.nihon.to/cgi-bin/bbs_khn/khcf.cgi?no=1151&reno=1149&oya=1135&mode=msgview|KH Coderの掲示板]]を参考にしました.バージョンの''0.6''以上だと,パッケージインストールの際に''gfortran-4.2''が無いと言われてインストール出来ませんでした.
 +
 +=== 新しいバージョンでエラーが出る場合 ===
 +
 +igraph 1.1.2,ggplot 2.2.1で共起ネットワークを作成する際,
 +
 +<code>
 +Error: StatEdges was built with an incompatible version of ggproto. Please reinstall the package that provides this extension.
 +</code>
 +
 +というエラーが出る場合には,''ggnetwork''をソースからインストールします.
 +
 +<code r>
 +install.packages("ggnetwork", type="source")
 +</code>
 +
 +==== 対応分析に必要なパッケージ ====
 +
 +Rで,''maptools''と''ade4''パッケージをインストールします.
 +
 +==== 階層的クラスター分析に必要なパッケージ ====
 +
 +Rで,''ggdendro''と''amap''パッケージをインストールします.
 +
 +==== ヒートマップ作成に必要なパッケージ ====
 +
 +Rで''pheatmap''をインストールしますが,[[https://cran.r-project.org/web/packages/pheatmap/index.html|CRANのパッケージサイト]]からArchiveへ進み,バージョン''0.7.7''をダウンロードして,インストールします.
 +
 +<code r>
 +install.packages("pheatmap_0.7.7.tar.gz", repos=NULL, type="source")
 +</code>
 +
 +Rから直接最新版をインストールすると,描画に失敗します.
 +
 +====== 参考文献・リンク ======
 +
 +  * [[http://khc.sourceforge.net/kh_tuto.html|KH Coderチュートリアル&ヒント]]
 +  * 樋口耕一(2014)『社会調査のための計量テキスト分析―内容分析の継承と発展を目指して―』,ナカニシヤ出版
  
  {{indexmenu_n>203}}  {{indexmenu_n>203}}
korean/mecab/khcoder.1445092466.txt.gz · 最終更新: 2015/10/17 23:34 by yoshi