jakle:sejong:raw_corpus
差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン | ||
jakle:sejong:raw_corpus [2017/02/01 09:02] – yoshi | jakle:sejong:raw_corpus [2022/04/25 23:28] (現在) – yoshi | ||
---|---|---|---|
行 1: | 行 1: | ||
====== 文節の検索 ====== | ====== 文節の検索 ====== | ||
- | < | + | <WRAP important> |
ここでは,検索プログラム한마루2.0(以下「한마루」とする)を用いて,21世紀世宗計画の平文コーパス(원시 말뭉치)を検索する方法について紹介します. | ここでは,検索プログラム한마루2.0(以下「한마루」とする)を用いて,21世紀世宗計画の平文コーパス(원시 말뭉치)を検索する方法について紹介します. | ||
行 45: | 行 45: | ||
| | | | ||
- | ==== ? | + | ==== 「?」=1つの音節 ==== |
'' | '' | ||
行 89: | 行 89: | ||
)) | )) | ||
- | ==== %=0または1つの音節 ==== | + | ==== 「%」=0または1つの音節 ==== |
'' | '' | ||
行 127: | 行 127: | ||
* " | * " | ||
- | ==== *=0以上の音節 ==== | + | ==== 「*」=0以上の音節 ==== |
'' | '' | ||
行 168: | 行 168: | ||
> 가까이は助詞ではないため,上記の例の多くは分かち書きの誤りを含んでいることになりますが,実際はこうしたケースが多く含まれています.そのため,例えば가까이の用例を網羅したい場合,'' | > 가까이は助詞ではないため,上記の例の多くは分かち書きの誤りを含んでいることになりますが,実際はこうしたケースが多く含まれています.そのため,例えば가까이の用例を網羅したい場合,'' | ||
- | ==== +=1つ以上の音節 ==== | + | ==== 「+」=1つ以上の音節 ==== |
'' | '' | ||
行 208: | 行 208: | ||
* 1970 년에는 대통령 **교육 문화** 담당 특별 보좌관에 임명되었으며, | * 1970 년에는 대통령 **교육 문화** 담당 특별 보좌관에 임명되었으며, | ||
- | 項目が3つ以上の場合でも同様です. | + | また,「문화」「교육」だけで成り立つ文節が検索対象になるので, |
+ | |||
+ | * 결국 사람들의 대중 문화에 대한 생각을 바꾸어야 하므로 대중 **문화 교육이** 절대적으로 중요하다. | ||
+ | * 대중 **문화 교육은** 어떻게 해야 하나 | ||
+ | * 학생들의 학습 발달 단계와 **문화 교육적** 표현 감각에 맞춰 대중 문화를 도입, 고급 예술 문화에 접목해 나가는 식으로 청소년 문화 활동에 대한 짜임새 있는 학교 교육 활동을 펴 나가자는 것이다. | ||
+ | |||
+ | のような文節は検索されません. | ||
+ | |||
+ | 検索項目の順序については,項目が3つ以上の場合でも同様です. | ||
< | < | ||
行 225: | 行 233: | ||
*을 수% 있* | *을 수% 있* | ||
</ | </ | ||
- | という検索式は「을だけか,을の前に1つ以上の音節がある文節」と「수だけか,수の後ろに1つの音節がある文節」と「있だけか,있の後ろに1つ以上の音節がある文節」がこの順序で並んでいる例が検索されます.例は以下の通り. | + | という検索式は「을だけか,을の前に1つ以上の音節がある文節」と「수だけか,수の後ろに1つの音節がある文節」と「있だけか,있の後ろに1つ以上の音節がある文節」がこの順序で隣り合っている例が検索されます.例は以下の通り. |
* 한의원에서도 교통사고 환자들이 맘놓고 **치료받을 수 있는** 법적 제도적 체계가 하루빨리 마련됐으면 한다. | * 한의원에서도 교통사고 환자들이 맘놓고 **치료받을 수 있는** 법적 제도적 체계가 하루빨리 마련됐으면 한다. | ||
行 239: | 行 247: | ||
> どちらの演算子も,前後に空白(スペース)を入れてはいけません. | > どちらの演算子も,前後に空白(スペース)を入れてはいけません. | ||
- | === &(AND・論理積) === | + | === 「&」=AND・論理積 === |
前後の項目が同時に現れる例を検索します.例えば | 前後の項目が同時に現れる例を検索します.例えば | ||
行 252: | 行 260: | ||
のように「가장」に続いて「많은」が出現する例だけでなく, | のように「가장」に続いて「많은」が出現する例だけでなく, | ||
- | * 다임러 벤츠(daimler benz) 그룹은 독일에서 **가장 규모가 큰 제조업체다. 이같은 강점 외에도 다임러 벤츠는 세계 최고급 자동차 브랜드인 메르세데스 벤츠를 가지고 있다. 이쯤 되면 많은** 사람들은 다임러가 돈을 긁어모으고 있다고 생각할 법하다. | + | * 다임러 벤츠(daimler benz) 그룹은 독일에서 **//가장// 규모가 큰 제조업체다. 이같은 강점 외에도 다임러 벤츠는 세계 최고급 자동차 브랜드인 메르세데스 벤츠를 가지고 있다. 이쯤 되면 |
- | * 그러나 **가장 중요한 것은 - 그리고 안데스의 농민을 소문난 존재로 만든 것은 - 그들이 활용하고 가꾸는 식물들의 엄청나게 다양한 종류이다. 농부들은 식물들의 다양성과 다채로움을 수단으로 하여 다양하고 변화무쌍한 기후와 대화를 나누고 선물을 주고받는다. 예를 들어, 농부들이 건조한 해에 대비하여 좀더 고지대의 밭에 농작물을 심을 때 그들은 그 차크라속에서 어떤 식물들이 예상되는 가뭄에 특히 잘 적응하는 것인지를 안다. 이러한 식물들 덕분에 그 해의 수확은 보다 비가 많은** 계절의 수확과 거의 맞먹는 것으로 된다. | + | * 그러나 **//가장// 중요한 것은 - 그리고 안데스의 농민을 소문난 존재로 만든 것은 - 그들이 활용하고 가꾸는 식물들의 엄청나게 다양한 종류이다. 농부들은 식물들의 다양성과 다채로움을 수단으로 하여 다양하고 변화무쌍한 기후와 대화를 나누고 선물을 주고받는다. 예를 들어, 농부들이 건조한 해에 대비하여 좀더 고지대의 밭에 농작물을 심을 때 그들은 그 차크라속에서 어떤 식물들이 예상되는 가뭄에 특히 잘 적응하는 것인지를 안다. 이러한 식물들 덕분에 그 해의 수확은 보다 비가 |
など,文をまたがった場合も含めて,「가장」の後に「많은」が出現する例を検索します.検索される項目の順序は,並べる順序に準じます.そのため,上記の検索式では「많은」の後に「가장」が出現する例は該当しません. | など,文をまたがった場合も含めて,「가장」の後に「많은」が出現する例を検索します.検索される項目の順序は,並べる順序に準じます.そのため,上記の検索式では「많은」の後に「가장」が出現する例は該当しません. | ||
行 279: | 行 287: | ||
という検索式(「한테の前に0以上の音節があり,後ろに1つの音節がある文節」の後ろに「미스」という文節が現れる)で検索される以下の例 | という検索式(「한테の前に0以上の音節があり,後ろに1つの音節がある文節」の後ろに「미스」という文節が現れる)で検索される以下の例 | ||
- | * **아무한테나 살살 눈웃음치는 미스** 리? 아니면, 호젓한 카페에서 시집 읽을 때가 제일 행복해요, | + | * **//아무한테나// 살살 눈웃음치는 |
では,最初の「아무한테나」以降,「미스」という文節が複数現れますが,検索にマッチするのは太字で示している,最初の「미스」までです. | では,最初の「아무한테나」以降,「미스」という文節が複数現れますが,検索にマッチするのは太字で示している,最初の「미스」までです. | ||
- | === |(OR・論理和) === | + | === 「|」=OR・論理和 === |
前後の項目のどちらかが出現する例を検索します.単独の文節における複数の候補を検索する,という点では,「文節をまたいだ検索」ではないかもしれません. | 前後の項目のどちらかが出現する例を検索します.単独の文節における複数の候補を検索する,という点では,「文節をまたいだ検索」ではないかもしれません. | ||
行 313: | 行 321: | ||
* " | * " | ||
* 이렇게 한 장씩 빼어던지는 지편은 일정한 규칙에 따라, 그 중 **제일 많은** 끗수를 낸 사람이 다른 석 장을 먹게 되는데, 그 4매 1조를 ‘한(一)수’라 하고, 네 사람 중 가장 여러 수를 먹은 사람이 이기게 된다. | * 이렇게 한 장씩 빼어던지는 지편은 일정한 규칙에 따라, 그 중 **제일 많은** 끗수를 낸 사람이 다른 석 장을 먹게 되는데, 그 4매 1조를 ‘한(一)수’라 하고, 네 사람 중 가장 여러 수를 먹은 사람이 이기게 된다. | ||
- | * **가장 두드러진 것은 핸드폰. 폴더형이 보편화하면서 삼성·엘지·현대 등 각사가 출시하는 제품들이 하루가 다르게 무게와 부피가 줄고 있다. 최소형은 지난 3월 삼성전자가 내놓은 `워치폰' | + | * **//가장// 두드러진 것은 핸드폰. 폴더형이 보편화하면서 삼성·엘지·현대 등 각사가 출시하는 제품들이 하루가 다르게 무게와 부피가 줄고 있다. 최소형은 지난 3월 삼성전자가 내놓은 `워치폰' |
- | * 인민재판에 회부돼서 당장 목숨을 잃었거나 모진 벌을 받고 있을 줄 알았는데 인민 총궐기대회에서 **제일 먼저 의용군을 지원해서 많은** 젊은이들로 하여금 감격해서 동조케 했다는 소식이었다. | + | * 인민재판에 회부돼서 당장 목숨을 잃었거나 모진 벌을 받고 있을 줄 알았는데 인민 총궐기대회에서 **//제일// 먼저 의용군을 지원해서 |
カッコの位置を変えて, | カッコの位置を変えて, | ||
行 336: | 行 344: | ||
* ▴구학서 신세계 사장=지표상 소비가 **매우 나쁜** 건 틀림없다. | * ▴구학서 신세계 사장=지표상 소비가 **매우 나쁜** 건 틀림없다. | ||
* 알고 보니 선생님은 **아주 나쁜** 사람이군요. | * 알고 보니 선생님은 **아주 나쁜** 사람이군요. | ||
- | * 향미: | + | * 향미: |
- | * 젊은 남녀가 일생을 좌우할 혼인을 전제로 하여 맞선을 본다는 것은 **매우 조심스러운 일이요, 신중을 기해야 하는 일이다. 쉽게 말해서 이 세상에서 가장 좋은** 사람, 가장 마음에 드는 사람을 찾아내는 일이다. | + | * 젊은 남녀가 일생을 좌우할 혼인을 전제로 하여 맞선을 본다는 것은 **//매우// 조심스러운 일이요, 신중을 기해야 하는 일이다. 쉽게 말해서 이 세상에서 가장 |
- | * **아주 냉철하게 논리적으로 북한과 김정일을 기술했기 때문에 앞으로의 남북관계 일을 하는데 좋은** 참고서가 될 것이다. | + | * **//아주// 냉철하게 논리적으로 북한과 김정일을 기술했기 때문에 앞으로의 남북관계 일을 하는데 |
- | > ブーリアン演算子のうち'' | + | > 上述の通り,ブーリアン演算子のうち'' |
さらに, | さらに, | ||
行 347: | 行 355: | ||
(아주|매우)& | (아주|매우)& | ||
</ | </ | ||
- | という検索式は,「아주か매우という文節」,「좋은か나쁜という文節」,「사람か놈という文節」がこの順序で続く例を指します. | + | という検索式は,「아주か매우という文節」,「좋은か나쁜という文節」,「사람か놈という文節」がこの順序で並ぶ例を指します. |
- | * 노인을 이번 일에서 손 떼게 하려면 ' | + | * 노인을 이번 일에서 손 떼게 하려면 ' |
* 우승 상금과 맞먹는 돈을 하루에 벌 수 있으니까 한턱 쓰는 사람이나, | * 우승 상금과 맞먹는 돈을 하루에 벌 수 있으니까 한턱 쓰는 사람이나, | ||
* 물론 다른 사람이 당신의 기술이나 외모, 재산 등을 평가하는 것은 **// | * 물론 다른 사람이 당신의 기술이나 외모, 재산 등을 평가하는 것은 **// | ||
* 올바른 手順이나 합당한 행마법에서 벗어난, **// | * 올바른 手順이나 합당한 행마법에서 벗어난, **// | ||
- | (書きかけここまで) | + | ==== 文節の範囲を指定した検索 ==== |
+ | |||
+ | ある項目Aを基準として,その前後の範囲を文節数で指定し,指定した範囲内に項目Bが現れる,というような検索を行うことができます.範囲の指定には'' | ||
+ | |||
+ | < | ||
+ | 項目A 3@2 項目B | ||
+ | </ | ||
+ | のような検索式を書きます.項目Aと範囲指定の式,項目Bの間には,それぞれスペースが必要です.範囲指定の数に0を指定すると,そちら側の範囲は除外されます.例えば'' | ||
+ | |||
+ | === 他の演算子との組み合わせ === | ||
+ | |||
+ | 範囲を指定した検索においても,音節を表す演算子やブーリアン演算子を用いることができます.例えば, | ||
+ | |||
+ | < | ||
+ | ?거나 3@ +거나 | ||
+ | </ | ||
+ | という検索式は,「거나の前に1音節ある文節」(='' | ||
+ | |||
+ | * 이 말의 뜻은, 현재 네가 받고 있는 정치는 **좋거나 궂거나** 다 너 스스로가 벌어얻은 것이라 함에 있다. | ||
+ | * 그들은 오염을 **유발하거나 쓰레기가 되거나** 또는 어떤 식으로든 생태계를 손상시키는 제품은 우수한 제품이 아니라는 것을 알아차리고, | ||
+ | * 세간에 **있거나 세간을 떠나 있거나** 인욕(人慾)을 따르는 것도 고통이요, | ||
+ | |||
+ | また,ブーリアン演算子も使用した | ||
+ | |||
+ | < | ||
+ | 절대 @5 (않+|없+|안*) | ||
+ | </ | ||
+ | という検索式は,「절대だけで成り立つ文節」(='' | ||
+ | |||
+ | * " | ||
+ | * 거기서 있었던 일은 **절대 말하지 않는다는** 내용의 각서에 지장을 찍고. | ||
+ | * **절대 진리가 없다면** 진리는 절대로 없다는 이 무섭고도 한심한 이분법! | ||
+ | * 터키식 커피는 **절대 주문하면 안된다는** 점! | ||
+ | * 지금도 생생하게 억양과 음색이 기억이 나고 있는데, 그날 당신은 내게, 천만에요, | ||
+ | * **절대 흥분해서 앞으로 나가면 안** 돼. | ||
+ | * 그녀는 **절대 그보다 더 빠를 수가 없었다.** | ||
+ | |||
+ | ===== 字素の検索 ===== | ||
+ | |||
+ | 1つの音節内での字母を指定して,検索を行うことができます(ガイドp.25「5. 가. 어절 검색 5) 자소 검색식」).1つの音節を'' | ||
+ | |||
+ | なお,字母の代わりに以下のような演算子を用いることができます. | ||
+ | |||
+ | ^ 演算子 | ||
+ | | ? | ||
+ | | | ||
+ | |||
+ | 要するに,'' | ||
+ | |||
+ | いくつか例を挙げます: | ||
+ | |||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | 複数を列挙することも可能です: | ||
+ | |||
+ | * '' | ||
+ | |||
+ | <WRAP center round important 60%> 日本語版のWindows 7上で上記の検索を行ったところ,いずれも検索結果がありませんでした.字母による検索は,韓国語版のWindowsでのみ実行可能なようです. </ | ||
+ | |||
+ | {{indexmenu_n> | ||
jakle/sejong/raw_corpus.1485907376.txt.gz · 最終更新: 2017/02/01 09:02 by yoshi