ユーザ用ツール

サイト用ツール


jakle:korea:sjriks

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

次のリビジョン
前のリビジョン
jakle:korea:sjriks [2022/03/27 00:21] – 作成 yoshijakle:korea:sjriks [2022/04/25 23:29] (現在) yoshi
行 1: 行 1:
 ====== 現代韓国語用例検索器の使い方 ====== ====== 現代韓国語用例検索器の使い方 ======
 +
 +<WRAP important>以下の項目は[[https://okikirmui.github.io/|韓国語コーパスの使い方]]に移行しました.今後更新されません.</WRAP>
  
 ここでは,高麗大学(고려대학교)[[https://riks.korea.ac.kr/|民族文化研究院(민족문화연구원)]]の[[https://riks.korea.ac.kr/organization/digitalhumanities|デジタル人文学センター(디지털인문학센터)]]を通して公開されている検索ツールのうち,SJ-RIKSコーパスを検索できる[[http://riksdb.korea.ac.kr/|현대한국어 용례검색기(現代韓国語用例検索器)]]の利用方法についてまとめます. ここでは,高麗大学(고려대학교)[[https://riks.korea.ac.kr/|民族文化研究院(민족문화연구원)]]の[[https://riks.korea.ac.kr/organization/digitalhumanities|デジタル人文学センター(디지털인문학센터)]]を通して公開されている検索ツールのうち,SJ-RIKSコーパスを検索できる[[http://riksdb.korea.ac.kr/|현대한국어 용례검색기(現代韓国語用例検索器)]]の利用方法についてまとめます.
行 5: 行 7:
 検索結果の数や例を提示しますが,本文執筆時点での結果であることをお断りしておきます. 検索結果の数や例を提示しますが,本文執筆時点での結果であることをお断りしておきます.
  
-SJ-RIKSコーパスの概要については[[..:korea|高麗大コーパスの使い方]]や김일환·이도길·강범모(2010)などを参照のこと.「検索器」ページの右の方にある「일러두기」にも詳細な説明があり,検索の仕方も含め参考になります.+SJ-RIKSコーパスの概要については[[../korea|高麗大コーパスの使い方]]や김일환·이도길·강범모(2010)などを参照のこと.「検索器」ページの右の方にある「일러두기」にも詳細な説明があり,検索の仕方も含め参考になります.
  
 ===== 検索に先立って ===== ===== 検索に先立って =====
行 15: 行 17:
 > この辺りは割り切って,한마루2.0を使って21世紀世宗計画のコーパスを検索・保存する,というのもアリかもしれません. > この辺りは割り切って,한마루2.0を使って21世紀世宗計画のコーパスを検索・保存する,というのもアリかもしれません.
  
-気をつけないといけないのが,21世紀世宗計画の形態・意味コーパスとは形態素の区切りが異なることです.特に,21世紀世宗計画では割と細かく形態素解析していたのが,直感に合うような形で??,1つの形態素としてまとめられているものが多くあります(김일환·이도길·강범모 2010).その最たるものが接尾辞ですが,例えば「과학적(科学的)」という文節を21世紀世宗計画では「과학/NNG+적/XSN」のように分けていたのですが,SJ-RIKSコーパス(拡張版含む)では「과학적/NNG」として,一つの普通名詞にしています.+気をつけないといけないのが,21世紀世宗計画の形態・意味コーパスとは形態素の区切りが異なることです.特に,21世紀世宗計画では割と細かく形態素解析していたのが,直感に合うような形で,1つの形態素としてまとめられているものが多くあります(김일환·이도길·강범모 2010).その最たるものが接尾辞ですが,例えば「과학적(科学的)」という文節を21世紀世宗計画では「과학/NNG+적/XSN」のように分けていたのですが,SJ-RIKSコーパス(拡張版含む)では「과학적/NNG」として,一つの普通名詞にしています.
  
 上記の点を勘案の上,以下の内容に進んでください. 上記の点を勘案の上,以下の内容に進んでください.
行 61: 行 63:
 上記では「完全一致」検索ということで,検索語と完全に一致する形態素だけが検索されました.それに対し,「전방 일치(前方一致)」は検索語から始まる形態素が検索され,「후방 일치(後方一致)」は検索語で終わる形態素が検索されます.検索語「''%%당하%%''」を例に,候補がどのように変わるか見てみましょう. 上記では「完全一致」検索ということで,検索語と完全に一致する形態素だけが検索されました.それに対し,「전방 일치(前方一致)」は検索語から始まる形態素が検索され,「후방 일치(後方一致)」は検索語で終わる形態素が検索されます.検索語「''%%당하%%''」を例に,候補がどのように変わるか見てみましょう.
  
-^完全一致     ^前方一致     ^後方一致     ^+  完全一致     前方一致     後方一致   ^
 |당하_/XSV  |당하_/XSV  |당하_/XSV  | |당하_/XSV  |당하_/XSV  |당하_/XSV  |
 |당하_01/NNG|당하_01/NNG|당하_01/NNG| |당하_01/NNG|당하_01/NNG|당하_01/NNG|
行 87: 行 89:
 ==== 注意が必要な点 ==== ==== 注意が必要な点 ====
  
-基本的には21世紀世宗計画コーパスが元なので,品詞タグもそれにならっていますが,[[../korea#물결21(Trend21)|高麗大コーパスの使い方]]にも書いたように,接続形語尾(연결어미=EC)と終止形語尾(종결어미=EF)とをまとめて,「어말어미(語末語尾)」=EMとしているなど,いくつかの変更があります.項目を選ぶ際に注意しましょう.+基本的には21世紀世宗計画コーパスが元なので,品詞タグもそれにならっていますが,[[..:korea#물결21(Trend21)|高麗大コーパスの使い方]]にも書いたように,接続形語尾(연결어미=EC)と終止形語尾(종결어미=EF)とをまとめて,「어말어미(語末語尾)」=EMとしているなど,いくつかの変更があります.項目を選ぶ際に注意しましょう.
  
 また,タグ付けのゆれなども散見されますので,用例の確認は必須です. また,タグ付けのゆれなども散見されますので,用例の確認は必須です.
行 111: 行 113:
 形態素の検索,文節の検索とは異なり,連語の検索では検索の範囲を指定します.以下の3種類です. 形態素の検索,文節の検索とは異なり,連語の検索では検索の範囲を指定します.以下の3種類です.
  
-^検索の範囲指定    ^検索される範囲                                                    ^+  検索の範囲指定     検索される範囲   ^
 |인접 구성(隣接構成)|形態素間の距離が1文節以下.分かち書きされていない例も検索されるよう,2つの形態素が同一文節に現れる場合も含まれる.| |인접 구성(隣接構成)|形態素間の距離が1文節以下.分かち書きされていない例も検索されるよう,2つの形態素が同一文節に現れる場合も含まれる.|
 |구 구성(句構成)  |形態素間の距離が1文節以上4文節未満.                                        | |구 구성(句構成)  |形態素間の距離が1文節以上4文節未満.                                        |
 |문장 구성(文構成) |形態素間の距離に制限を置かず,同一文内に現れる2つの形態素を検索する                         | |문장 구성(文構成) |形態素間の距離に制限を置かず,同一文内に現れる2つの形態素を検索する                         |
  
-延世コーパスの[[..:yonsei:written_2|連語の検索]]は1つ目の検索語を1番目として,その直後が2番目,その次が3番目,という数え方でしたが,こちらは1つ目の検索語を0番目として数えることになります.+延世コーパスの[[../yonsei/written_2|連語の検索]]は1つ目の検索語を1番目として,その直後が2番目,その次が3番目,という数え方でしたが,こちらは1つ目の検索語を0番目として数えることになります.
  
-^      コーパス      ^     1文節目       2文節目    3文節目  ^  4文節目  ^  5文節目以降 +^      コーパス      ^^    1文節目      2文節目    3文節目  ^  4文節目  ^  5文節目以降 
-|  연세 문어 균형 말뭉치     検索語1       2어절    |  3어절    4어절     範囲外    | +|  연세 문어 균형 말뭉치  ||    検索語1       2어절   |  3어절    4어절     範囲外    | 
-|    SJ-RIKS      検索語1 인접 구성  |  인접 구성   |     範囲外        範囲外      範囲外    +|    SJ-RIKS     |인접 구성  |  検索語1 検索語2  |  検索語2   |   範囲外   ||| 
-       :::         検索語1       구 구성   |||   範囲外    | +     :::       |구 구성      検索語1      検索語2   |||   範囲外    | 
-       :::         検索語1 문장 구성    |  문장 구성   ||||+     :::       |문장 구성  |  検索語1 検索語2  |  検索語2   ||||
  
 以下,「''%%학교 내%%''」(학교と내の間に半角スペース)という検索語で,それぞれの例を示してみたいと思います. 以下,「''%%학교 내%%''」(학교と내の間に半角スペース)という検索語で,それぞれの例を示してみたいと思います.
行 131: 行 133:
  
   * 학교/NNG 내/VX:   * 학교/NNG 내/VX:
-  * 그러니 **학교에** **갖다낼** 관광버스 삯이 있을 리 없었다.+    * 그러니 **학교에** **갖다낼** 관광버스 삯이 있을 리 없었다.
   * 학교/NNG 내_09/NNB:   * 학교/NNG 내_09/NNB:
-  * 미 대사의 **학교내** 강연회 개최 사실을 알고 +    * 미 대사의 **학교내** 강연회 개최 사실을 알고 
-  * 일곱째, **학교내에서** 단체로 행하는 신체검사, +    * 일곱째, **학교내에서** 단체로 행하는 신체검사, 
-  * 배에다 힘주며 돌아다니던 **학교내의** 주먹들하고는 전혀 어울릴 줄을 몰랐으며,+    * 배에다 힘주며 돌아다니던 **학교내의** 주먹들하고는 전혀 어울릴 줄을 몰랐으며,
  
 「1文節**以下**」ということなのですぐ隣の文節までが範囲になるはずなのですが,形式名詞「내(内)」との共起は同一文節に現れる例しか含まれていませんでした.「○」がついているのは,その文節に検索語2がある例が検索結果に出てきたことを指します.「検索語1と同じ文節」にだけ「○」がついている場合は,隣の文節に検索語2が含まれる例が検索されなかったことを指します. 「1文節**以下**」ということなのですぐ隣の文節までが範囲になるはずなのですが,形式名詞「내(内)」との共起は同一文節に現れる例しか含まれていませんでした.「○」がついているのは,その文節に検索語2がある例が検索結果に出てきたことを指します.「検索語1と同じ文節」にだけ「○」がついている場合は,隣の文節に検索語2が含まれる例が検索されなかったことを指します.
行 159: 行 161:
 |   ''%%차이 크%%''    検索結果なし((「차이가 크지 않았다.」などの例があることは確認済み))  |        |                                                           | |   ''%%차이 크%%''    検索結果なし((「차이가 크지 않았다.」などの例があることは確認済み))  |        |                                                           |
 |   ''%%크 차이%%''       検索結果なし((「큰 차이를」などの例があることは確認済み))            |                                                           | |   ''%%크 차이%%''       検索結果なし((「큰 차이를」などの例があることは確認済み))            |                                                           |
-|   ''%%차이 나%%''        △((共起する形態素により若干の違いが見られました))       |   △    |                                                           |+|   ''%%차이 나%%''        △((共起する形態素により若干の違いが見られました 
 +  * 나/VV:「차이」と「나다」が同一文節に含まれる「차이나는 경우」「조금 차이나지만」のような例のみマッチ 
 +  * 나/EM:「차이가 있나?」のように,隣の文節に「나」が含まれる例がマッチ 
 +  * 나/JX:「차이나 있지.」「차이가 55.2%나 됐다.」のように「차이」を含む文節から隣の文節までに「나」が含まれる例がマッチ 
 +))  |   △    |                                                           |
 |   ''%%나 차이%%''                      ☓                    |   ○    |「1년만 나이차가 **나도** '세대**차이**'를 느낀다는데」の1例                     | |   ''%%나 차이%%''                      ☓                    |   ○    |「1년만 나이차가 **나도** '세대**차이**'를 느낀다는데」の1例                     |
 |   ''%%좋 사람%%''                      ○                    |   ○    |                                                           | |   ''%%좋 사람%%''                      ○                    |   ○    |                                                           |
行 172: 行 178:
  
   * 학교/NNG 내/NP:   * 학교/NNG 내/NP:
-  * 평일의 **학교에서는** **내가** 예상했던 것처럼 +    * 평일의 **학교에서는** **내가** 예상했던 것처럼 
-  * **학교** 분위기는 **내가** 보기에는 이래도 되나 싶을 정도로 한국과 달랐다. +    * **학교** 분위기는 **내가** 보기에는 이래도 되나 싶을 정도로 한국과 달랐다. 
-  * 서로 스스럼없이 대하는 **학교,** 그것이 바로 **내가** 원하는 +    * 서로 스스럼없이 대하는 **학교,** 그것이 바로 **내가** 원하는 
-  * 진학문제로 **학교에** 오셔서야 아버지는 **내가** 명문 고등학교는커녕+    * 진학문제로 **학교에** 오셔서야 아버지는 **내가** 명문 고등학교는커녕
   * 학교/NNG 내/VX:   * 학교/NNG 내/VX:
-  * 그러니 **학교에** **갖다낼** 관광버스 삯이 있을 리 없었다. +    * 그러니 **학교에** **갖다낼** 관광버스 삯이 있을 리 없었다. 
-  * 그러한 요구의 충족을 보장하는 각서를 **학교측으로부터** 받아 **내려고** 하는 것이 +    * 그러한 요구의 충족을 보장하는 각서를 **학교측으로부터** 받아 **내려고** 하는 것이 
-  * 일선 교육청과 **학교현장에서의** 재원누수라도 **막아내야** 한다. +    * 일선 교육청과 **학교현장에서의** 재원누수라도 **막아내야** 한다. 
-  * 집도 짓고, **학교도** 세우고, 물건도 **만들어내는** 길만이 살 길이다.+    * 집도 짓고, **학교도** 세우고, 물건도 **만들어내는** 길만이 살 길이다.
   * 학교/NNG 내_02/VV:   * 학교/NNG 내_02/VV:
-  * "학기 초에 **학교에** **내는** '가정 환경 조사서'에 +    * "학기 초에 **학교에** **내는** '가정 환경 조사서'에 
-  * **학교건립** 성금을 **내고** 방문했던 기억을 떠올렸다. +    * **학교건립** 성금을 **내고** 방문했던 기억을 떠올렸다. 
-  * **학교운영재원의** 60%이상을 학생들이 **내는** 수업료로 충당케 한 것부터가+    * **학교운영재원의** 60%이상을 학생들이 **내는** 수업료로 충당케 한 것부터가
   * 학교/NNG 내_09/NNB:   * 학교/NNG 내_09/NNB:
-  * 지금 **학교** **내의** 징벌만이 아니라 +    * 지금 **학교** **내의** 징벌만이 아니라 
-  * 자유 **대안학교에서는** **학교내** 교사, 학부모, 학생의 역할을 똑같이 중시한다. +    * 자유 **대안학교에서는** **학교내** 교사, 학부모, 학생의 역할을 똑같이 중시한다. 
-  * 사명을 갖고 출발한 민족학급이었지만 **학교** **내·외부적인** 환경은 무척이나 불안정한 상황이었다. +    * 사명을 갖고 출발한 민족학급이었지만 **학교** **내·외부적인** 환경은 무척이나 불안정한 상황이었다. 
-  * 가스정압기가 **학교부지** **내에** 들어선 곳은 13개교이다. +    * 가스정압기가 **학교부지** **내에** 들어선 곳은 13개교이다. 
-  * 최근 몇몇 학교에서는 **학교부지** **내** 가스정압기 설치 과정에 대해 +    * 최근 몇몇 학교에서는 **학교부지** **내** 가스정압기 설치 과정에 대해 
-  * 최근 몇몇 **학교에서는** 학교부지 **내** 가스정압기 설치 과정에 대해 +    * 최근 몇몇 **학교에서는** 학교부지 **내** 가스정압기 설치 과정에 대해 
-  * 각 **학교에** 시한 **내에** 징계할 것을 지시했다. +    * 각 **학교에** 시한 **내에** 징계할 것을 지시했다. 
-  * 내가 속한 작은 공동체 -- **학교** 말이다 -- **내의** 문화 매체에 발표했었다. +    * 내가 속한 작은 공동체 -- **학교** 말이다 -- **내의** 문화 매체에 발표했었다. 
-  * 이번에 설립된 꾸르실료 봉사자 **학교는** 그동안 부족했던 **교구내** 꾸르실료 재교육을 내실화하기 위한 과정으로+    * 이번에 설립된 꾸르실료 봉사자 **학교는** 그동안 부족했던 **교구내** 꾸르실료 재교육을 내실화하기 위한 과정으로
  
 「-(으)ㄹ 수 있다」や「-(으)ㄹ 것이다」のような分析的な形式を検索したい場合は,だいたい3文節までならカバーできるかと思うので,こちらの句構成で検索すればよいかもしれません.ただし,分かち書きの誤りなどがあるので,やはり上記の隣接構成の検索も行っておくのがよいでしょう. 「-(으)ㄹ 수 있다」や「-(으)ㄹ 것이다」のような分析的な形式を検索したい場合は,だいたい3文節までならカバーできるかと思うので,こちらの句構成で検索すればよいかもしれません.ただし,分かち書きの誤りなどがあるので,やはり上記の隣接構成の検索も行っておくのがよいでしょう.
行 206: 行 212:
  
   * 학교/NNG 내/NP:   * 학교/NNG 내/NP:
-  * 평일의 **학교에서는** **내가** 예상했던 것처럼 +    * 평일의 **학교에서는** **내가** 예상했던 것처럼 
-  * 우리 **학교의** 우수성을 널리 알리고 싶다는 교장 선생님의 의무감(?)에 불타는 전화부터, **내가** 억울한 일을 당했으니 +    * 우리 **학교의** 우수성을 널리 알리고 싶다는 교장 선생님의 의무감(?)에 불타는 전화부터, **내가** 억울한 일을 당했으니 
-  * 아직 **학교에** 공식적인 사의를 제출하지는 않았지만 몇사람 관리자들과 친한 교사들은 **내가** 곧 학교를 그만둘 거라는 사실을+    * 아직 **학교에** 공식적인 사의를 제출하지는 않았지만 몇사람 관리자들과 친한 교사들은 **내가** 곧 학교를 그만둘 거라는 사실을
   * 학교/NNG 내/VX:   * 학교/NNG 내/VX:
-  * 국립 예술 **학교를** 만들어 어렸을 때부터 좋은 인재를 골라내 국가가 키워 **내는** 것도 한 방안이다. +    * 국립 예술 **학교를** 만들어 어렸을 때부터 좋은 인재를 골라내 국가가 키워 **내는** 것도 한 방안이다. 
-  * 이러니까 **학교도** 값비싼 물건을 **만들어내는** 공장이 된 것이다. +    * 이러니까 **학교도** 값비싼 물건을 **만들어내는** 공장이 된 것이다. 
-  * **학교에** 돌아가서 학급신문이나 기타 여러가지를 멋지게 만들어 **내야겠다는** 생각을 하게 되었다.+    * **학교에** 돌아가서 학급신문이나 기타 여러가지를 멋지게 만들어 **내야겠다는** 생각을 하게 되었다.
   * 학교/NNG 내_02/VV:   * 학교/NNG 내_02/VV:
-  * 국립중등학교 **#국립학교** 가운데 입학시험을 치는 문법학교(그래머스쿨) #시험으로 선발하고 학비를내는 사립학교로 나뉜다. +    * 국립중등학교 **#국립학교** 가운데 입학시험을 치는 문법학교(그래머스쿨) #시험으로 선발하고 학비를내는 사립학교로 나뉜다. 
-  * 월급을 쪼개어 10만원, 100만원의 **학교발전** 기금을 **냈던** 연세대 동문들은 +    * 월급을 쪼개어 10만원, 100만원의 **학교발전** 기금을 **냈던** 연세대 동문들은 
-  * 아이들을 학교에 보내지 않고 **학교설립비** 충당을 위해 신설된 교육세도 **내지** 않기로 했다.+    * 아이들을 학교에 보내지 않고 **학교설립비** 충당을 위해 신설된 교육세도 **내지** 않기로 했다.
   * 학교/NNG 내_09/NNB:   * 학교/NNG 내_09/NNB:
-  * 교육부문에서는 ▶내국 법인의 **외국인학교** 설립▶해외거주 경험이 없는 내국인의 특구 **내** 외국인학교 입학 +    * 교육부문에서는 ▶내국 법인의 **외국인학교** 설립▶해외거주 경험이 없는 내국인의 특구 **내** 외국인학교 입학 
-  * 이 **학교에서** PTA운동이 불붙기 시작한 것은 70년 9월 이 학교 **내에** 구립 유치원 건설을 둘러싸고 +    * 이 **학교에서** PTA운동이 불붙기 시작한 것은 70년 9월 이 학교 **내에** 구립 유치원 건설을 둘러싸고 
-  * 이 학교에서 PTA운동이 불붙기 시작한 것은 70년 9월 이 **학교** **내에** 구립 유치원 건설을 둘러싸고 +    * 이 학교에서 PTA운동이 불붙기 시작한 것은 70년 9월 이 **학교** **내에** 구립 유치원 건설을 둘러싸고 
-  * 학부모의 **학교선택권을** 확대하기 위하여 학교군 **내의** 몇 학교에 지원하면+    * 학부모의 **학교선택권을** 확대하기 위하여 학교군 **내의** 몇 학교에 지원하면
  
 範囲を限定せずに調べたいなら,この文構成を選ぶのが良さそうです.ただ,2つの形態素に何の関連もない例が多く出てくる可能性があるので注意.漏れがないよう,とにかく広範囲に拾って,無関係なものを除外していく作業をしていくのであれば,この方式が無難です. 範囲を限定せずに調べたいなら,この文構成を選ぶのが良さそうです.ただ,2つの形態素に何の関連もない例が多く出てくる可能性があるので注意.漏れがないよう,とにかく広範囲に拾って,無関係なものを除外していく作業をしていくのであれば,この方式が無難です.
行 249: 行 255:
   * 김일환·이도길·강범모(2010), 'SJ-RIKS Corpus: 세종 형태의미 분석 코퍼스를 넘어서', "민족문화연구" 52호, pp.373-403, 고려대학교 민족문화연구원.   * 김일환·이도길·강범모(2010), 'SJ-RIKS Corpus: 세종 형태의미 분석 코퍼스를 넘어서', "민족문화연구" 52호, pp.373-403, 고려대학교 민족문화연구원.
  
-  * 나/VV:「차이」と「나다」が同一文節に含まれる「차이나는 경우」「조금 차이나지만」のような例のみマッチ 
-  * 나/EM:「차이가 있나?」のように,隣の文節に「나」が含まれる例がマッチ 
-  * 나/JX:「차이나 있지.」「차이가 55.2%나 됐다.」のように「차이」を含む文節から隣の文節までに「나」が含まれる例がマッチ 
  
  
jakle/korea/sjriks.1648308090.txt.gz · 最終更新: 2022/03/27 00:21 by yoshi