ユーザ用ツール

サイト用ツール


korean:mecab:khcoder

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
korean:mecab:khcoder [2015/10/17 23:39] – [対応分析] yoshikorean:mecab:khcoder [2018/02/28 15:37] (現在) – [共起ネットワークに必要なパッケージ] yoshi
行 121: 行 121:
 {{:korean:kh_corres_01.png?direct&300|}} {{:korean:kh_corres_01.png?direct&300|}}
  
-各大統領について原点から最も離れている語を拾うと,16代+各大統領について原点から最も離れている語を拾うと,盧武鉉氏が동북「東北」,李明博氏が선진03「先進」,朴槿恵氏が행복02「幸福」という結果になりました.「東北」は동북아「北東アジア」が分析された結果と思われます. 
 + 
 +====== メモ ====== 
 + 
 +===== ユーザー辞書の指定 ===== 
 + 
 +[[https://taku910.github.io/mecab/dic.html|単語の追加方法]]などで作成したユーザー辞書を追加して使う場合,KH Coderのインストールフォルダ内にある''dep/handic/dicrc''の<wrap warning>末尾に</wrap>,ユーザー辞書へのパスを追加します.以下の例は,ユーザー辞書''user.dic''が''E:\00Work\02Data\00kodic\dic''にある場合の記述です. 
 + 
 +<code> 
 +userdic = E:/00Work/02Data/00kodic/dic/user.dic 
 +</code> 
 + 
 +この設定は,KH Coderで韓国語を解析する場合にのみ適用されます. 
 + 
 +===== 抽出する品詞の追加 ===== 
 + 
 +初期設定では,抽出する品詞が普通名詞,固有名詞,形容詞,副詞,動詞に限られており,それ以外の品詞,例えば助詞や語尾などは「その他」に一括して扱われています.これらを別個に抽出したい場合は,品詞を追加して前処理を行います. 
 + 
 +品詞を追加するには,''config''フォルダ内の''hinshi_mecab_k''という設定ファイルの<wrap warning>末尾に</wrap>記述を加えます.以下はその例です. 
 + 
 +<code> 
 +40,JOSA,"Ending-助詞", 
 +41,EOMI,"Ending-語尾", 
 +</code> 
 + 
 +コンマで区切って記述をしますが,最初の数字は品詞IDで,他と重複しない値を設定します.2列目は品詞名,3列目(条件1)は抽出する条件をHanDicの品詞で記述します.条件2は設定していませんので,コンマで終わります. 
 + 
 +===== Macで使う場合 ===== 
 + 
 +==== 共起ネットワークに必要なパッケージ ==== 
 + 
 +Rの方で''igraph''パッケージの''1.0.1''をインストールしていたのですが,描画に失敗しました.[[https://cran.r-project.org/src/contrib/Archive/igraph/|CRANのigraphアーカイブ]]からバージョンの''0.5.4-4''をダウンロードして,''~/Desktop''に解凍した場合, 
 + 
 +<code r> 
 +install.packages("~/Desktop/igraph/", repos=NULL, type="source"
 +</code> 
 + 
 +でインストールします.[[http://koichi.nihon.to/cgi-bin/bbs_khn/khcf.cgi?no=1151&reno=1149&oya=1135&mode=msgview|KH Coderの掲示板]]を参考にしました.バージョンの''0.6''以上だと,パッケージインストールの際に''gfortran-4.2''が無いと言われてインストール出来ませんでした. 
 + 
 +=== 新しいバージョンでエラーが出る場合 === 
 + 
 +igraph 1.1.2,ggplot 2.2.1で共起ネットワークを作成する際, 
 + 
 +<code> 
 +Error: StatEdges was built with an incompatible version of ggproto. Please reinstall the package that provides this extension. 
 +</code> 
 + 
 +というエラーが出る場合には,''ggnetwork''をソースからインストールします. 
 + 
 +<code r> 
 +install.packages("ggnetwork", type="source"
 +</code> 
 + 
 +==== 対応分析に必要なパッケージ ==== 
 + 
 +Rで,''maptools''と''ade4''パッケージをインストールします. 
 + 
 +==== 階層的クラスター分析に必要なパッケージ ==== 
 + 
 +Rで,''ggdendro''と''amap''パッケージをインストールします. 
 + 
 +==== ヒートマップ作成に必要なパッケージ ==== 
 + 
 +Rで''pheatmap''をインストールしますが,[[https://cran.r-project.org/web/packages/pheatmap/index.html|CRANのパッケージサイト]]からArchiveへ進み,バージョン''0.7.7''をダウンロードして,インストールします. 
 + 
 +<code r> 
 +install.packages("pheatmap_0.7.7.tar.gz", repos=NULL, type="source"
 +</code> 
 + 
 +Rから直接最新版をインストールすると,描画に失敗します. 
 + 
 +====== 参考文献・リンク ====== 
 + 
 +  * [[http://khc.sourceforge.net/kh_tuto.html|KH Coderチュートリアル&ヒント]] 
 +  * 樋口耕一(2014)『社会調査のための計量テキスト分析―内容分析の継承と発展を目指して―』,ナカニシヤ出版 
  {{indexmenu_n>203}}  {{indexmenu_n>203}}
korean/mecab/khcoder.1445092770.txt.gz · 最終更新: 2015/10/17 23:39 by yoshi