ユーザ用ツール

サイト用ツール


jakle:sejong:tagged_corpus

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
jakle:sejong:tagged_corpus [2017/09/12 22:41] – 外部編集 127.0.0.1jakle:sejong:tagged_corpus [2022/04/25 23:28] (現在) yoshi
行 1: 行 1:
 ====== 品詞タグを利用した形態素の検索 ====== ====== 品詞タグを利用した形態素の検索 ======
 +
 +<WRAP important>以下の項目は[[https://okikirmui.github.io/|韓国語コーパスの使い方]]に移行しました.今後更新されません.</WRAP>
  
 ここでは,検索プログラム한마루2.0(以下「한마루」とする)を用いて,21世紀世宗計画の形態素解析済みコーパス(형태분석 말뭉치)を検索する方法について紹介します. ここでは,検索プログラム한마루2.0(以下「한마루」とする)を用いて,21世紀世宗計画の形態素解析済みコーパス(형태분석 말뭉치)を検索する方法について紹介します.
行 6: 行 8:
  
 まず,品詞タグ((検索時に用いることのできる品詞タグは以下の通り. まず,品詞タグ((検索時に用いることのできる品詞タグは以下の通り.
 +
 +^         品詞          ^  記号         品詞        ^  記号   ^
 +|        일반명사          NNG  |      고유명사        NNP  |
 +|        의존명사          NNB  |       대명사        NP   |
 +|         수사          |  NR         동사        |  VV   |
 +|         형용사          VA        보조용언        VX   |
 +|        긍정지정사        |  VCP  |      부정지정사      |  VCN  |
 +|         관형사          MM        일반부사        MAG  |
 +|        접속부사          MAJ  |       감탄사        IC   |
 +|        주격조사          JKS  |      보격조사        JKC  |
 +|        관형격조사        |  JKG  |      목적격조사      |  JKO  |
 +|        부사격조사        |  JKB  |      호격조사        JKV  |
 +|        인용격조사        |  JKQ  |       보조사        JX   |
 +|        접속조사          JC        선어말어미      |  EP   |
 +|        종결어미          EF        연결어미        EC   |
 +|       명사형전성어미        ETN  |     관형형전성어미      ETM  |
 +|        체언접두사        |  XPN  |     명사파생접미사      XSN  |
 +|       동사파생접미사        XSV  |    형용사파생접미사      XSA  |
 +|         어근          |  XR     마침표,물음표,느낌표    SF   |
 +|    쉼표,가운뎃점,콜론,빗금    |  SP     따옴표,괄호표,줄표    |  SS   |
 +|         줄임표          SE    붙임표(물결,숨김,빠짐)  |  SO   |
 +|         외국어          SL         한자        |  SH   |
 +|  기타기호(논리수학기호,화폐기호)  |  SW       명사추정범주      |  NF   |
 +|       용언추정범주        |  NV         숫자        |  SN   |
 +|       분석불능범주        |  NA                         |
 ))を用いて検索する場合,**基本的に文節を単位とする検索のみ可能**であることに注意しましょう.ある1つの単語もしくは形態素を検索式に入力すると,文節内にその単語・形態素を含む場合しか検索されません.例えば,検索ボックスに ))を用いて検索する場合,**基本的に文節を単位とする検索のみ可能**であることに注意しましょう.ある1つの単語もしくは形態素を検索式に入力すると,文節内にその単語・形態素を含む場合しか検索されません.例えば,検索ボックスに
  
行 23: 行 50:
  
 「고향이」など後ろに助詞が続く例や,場合によっては分かち書きがされていない「내고향」などは検索されません. 「고향이」など後ろに助詞が続く例や,場合によっては分かち書きがされていない「내고향」などは検索されません.
 +
 +==== 品詞タグの入力 ====
 +
 +上記では,品詞タグ(''%%/NNG%%'')まで直接検索ボックスに入力しましたが,品詞タグの記号が分からない場合,検索ダイアログのリストから選んで入力することができます.
 +
 +{{:jakle/tagged_tagging.png| tagged_tagging}}
 +
 +上の検索ダイアログ画像で,赤枠で示した部分のリストから該当する項目を選び,隣の「품사 적용」(品詞適用)ボタンを押します.すると検索ボックスのカーソル位置に,スラッシュ(''%%/%%'')も含めた品詞タグが入力されます.
 +
 +動詞や形容詞などの用言を検索する際には,語幹のみ入力して品詞タグを付ける,という点に注意してください.例えば動詞먹다「食べる」は,''%%먹다/VV%%''ではなく,''%%먹/VV%%''のように入力する必要があります((複数の品詞タグを「品詞適用」ボタンで入力する場合,「품사를 연속으로 적용할 수 없습니다.…」(品詞を連続で適用することはできません)といった警告が表示されることがあります.いろいろ試してみたところ,スラッシュから4文字目以降でないと,品詞タグが適用できないようです.つまり, 
 +
 +  * ''%%이/NP는%%''の末尾…適用不可,警告表示
 +  * ''%%이/NNG는%%''の末尾…適用可能
 +  * ''%%이/NP부터%%''の末尾…適用可能
 +  * ''%%이/NNG부터%%''の末尾…適用可能
 +
 +のように,品詞タグのアルファベットや形態素まで含めて,前のスラッシュから4文字目以降でないと,品詞タグをボタンで入力することはできません(あくまで仮説ですが).ともかく,上記の「適用不可」のケースでは,検索ボックスに直接品詞タグを手入力する必要があります.)).
  
 ===== 演算子を用いた検索 ===== ===== 演算子を用いた検索 =====
行 218: 行 262:
  
 {{indexmenu_n>42}} {{indexmenu_n>42}}
- 
-^         品詞          ^  記号         品詞        ^  記号   ^ 
-|        일반명사          NNG  |      고유명사        NNP  | 
-|        의존명사          NNB  |       대명사        NP   | 
-|         수사          |  NR         동사        |  VV   | 
-|         형용사          VA        보조용언        VX   | 
-|        긍정지정사        |  VCP  |      부정지정사      |  VCN  | 
-|         관형사          MM        일반부사        MAG  | 
-|        접속부사          MAJ  |       감탄사        IC   | 
-|        주격조사          JKS  |      보격조사        JKC  | 
-|        관형격조사        |  JKG  |      목적격조사      |  JKO  | 
-|        부사격조사        |  JKB  |      호격조사        JKV  | 
-|        인용격조사        |  JKQ  |       보조사        JX   | 
-|        접속조사          JC        선어말어미      |  EP   | 
-|        종결어미          EF        연결어미        EC   | 
-|       명사형전성어미        ETN  |     관형형전성어미      ETM  | 
-|        체언접두사        |  XPN  |     명사파생접미사      XSN  | 
-|       동사파생접미사        XSV  |    형용사파생접미사      XSA  | 
-|         어근          |  XR     마침표,물음표,느낌표    SF   | 
-|    쉼표,가운뎃점,콜론,빗금    |  SP     따옴표,괄호표,줄표    |  SS   | 
-|         줄임표          SE    붙임표(물결,숨김,빠짐)  |  SO   | 
-|         외국어          SL         한자        |  SH   | 
-|  기타기호(논리수학기호,화폐기호)  |  SW       명사추정범주      |  NF   | 
-|       용언추정범주        |  NV         숫자        |  SN   | 
-|       분석불능범주        |  NA                   | 
- 
  
jakle/sejong/tagged_corpus.1505223702.txt.gz · 最終更新: 2017/09/12 22:41 by 127.0.0.1