====== 検索結果の演算 ======
以下の項目は[[https://okikirmui.github.io/|韓国語コーパスの使い方]]に移行しました.今後更新されません.
ここでは,検索プログラム한마루2.0(以下「한마루」とする)を用いて,21世紀世宗計画のコーパス検索結果を「연산」(演算)処理で取捨選択する方法について紹介します.
===== 演算の基本 =====
何をおいても,検索結果が表示されていることが前提となります.コーパスを開いただけの状態では,「연산」(演算)メニューがアクティブになっていません.
演算に際しては検索式を入力し,該当する例に対して「검색」(検索),「제외」(除外),「포함」(包含)という処理を行います.検索式は「文節の検索」や「品詞タグを利用した検索」と同じように入力します.
> 検索式には「文節の検索」や「品詞タグを利用した検索」と同じ演算子を用いることができますが,範囲を指定する''%%@%%''のみ使用できません.
「検索」など処理の内容は以下の通りです.
-
검색(検索)
-
検索結果全体の内容は維持したまま,検索式にヒットする行をハイライトします.
-
제외(除外)
-
検索結果から,検索式にヒットする行を除外します.
-
포함(包含)
-
検索結果から,検索式にヒットする行だけを残します.
上記のうち,「除外」と「包含」は何らの確認もなく,元の検索結果に直接影響を及ぼします.望ましい結果が得られるか,「検索」処理で一度確認してから,「除外」や「包含」の処理を行うのがよいでしょう.
===== 演算の実際 =====
==== 検索結果を得る ====
まず,検索結果を取得します.ここでは例として,형태분석 말뭉치(形態素解析済みコーパス)のうち,''%%BTAA0001.txt%%''から連番の''%%BTAA0016.txt%%''を対象として,以下の検索(形態素検索)を行い動詞가다「行く」の活用形を取得します.
가/VV#
上記の検索により,対象の16ファイルから233文,240個の例が検索されました.
==== 検索結果の処理 ====
次に,上記の検索結果から「検索語の前2文節以内に対格助詞(''%%JKO%%'')のついた文節がある例」を検索します.
「연산」(演算)メニューから「형태소(의미) 연산」(形態素(意味)演算)を選び,検索式に
#를/JKO|#을/JKO
を入力し,「연산 범위」(演算の範囲)の「이전」(以前:前文脈)に「2」,「이후」(以後:後文脈)に「0」を入力して「검색」(検索)ボタンを押します.
> 演算範囲は文節の数を入力しますが,「以前」「以後」の両方を開けておくか,両方に「0」を入力すると,検索語を対象とすることになります.
{{:jakle/corpus_calc_dialog.png?300| corpus_calc_dialog}}
すると,40個の例がヒットし,行の背景色が変わり,元の検索結果の先頭部分に表示されます.
{{:jakle:corpus_calc_search.png?500|corpus_calc_search}}
演算のダイアログで,「検索」ではなく「除外」を選択すれば40例が削除された結果が残り,「包含」を選択すれば40例だけが結果として残ります.
{{indexmenu_n>43}}