korean:modu
差分
このページの2つのバージョン間の差分を表示します。
次のリビジョン | 前のリビジョン | ||
korean:modu [2023/10/23 21:25] – 作成 yoshi | korean:modu [2023/12/14 21:46] (現在) – [ノートブック] yoshi | ||
---|---|---|---|
行 1: | 行 1: | ||
====== 国立国語院「모두의 말뭉치」の活用方法 ====== | ====== 国立国語院「모두의 말뭉치」の活用方法 ====== | ||
+ | |||
+ | ===== はじめに ===== | ||
+ | |||
+ | 韓国・[[https:// | ||
+ | |||
+ | このコーパスは,従来「21世紀世宗計画」(以下「世宗計画」)で構築されてきた資料よりも分量がかなり多く,その種類も多様です.ただ,「世宗計画」コーパスとは異なり,JSONという形式で記述されているため,一般の研究者や利用者がちょっと検索してみる,といった使い方に不向きと思われます.「[[https:// | ||
+ | |||
+ | また,データの分量が多いため,機械学習などの用途に向いているようで,「[[https:// | ||
+ | |||
+ | とはいえ,言語研究の立場からは,やはり用例の収集などで利用したいものです.そこで,上記「[[https:// | ||
+ | |||
+ | <WRAP center round important> | ||
+ | 以下の点にご注意ください: | ||
+ | |||
+ | * 各ノートブックの実行により,何らかの損害,被害が生じた場合,須賀井は一切責任を負いません | ||
+ | * このページで共有しているノートブックは,ご自身のGoogle Driveに保存していただき,それを改変していただいて構いません | ||
+ | * ノートブックの実行にはGoogleアカウントが必要です | ||
+ | * コーパスデータ本体は,[[https:// | ||
+ | </ | ||
+ | |||
+ | なお,あくまで「やってみた」という程度なので,コーパスの選択や機能などは,須賀井が思いついた(あるいは必要とする)ものを,できたときにシェアする予定です. | ||
+ | |||
+ | ===== ノートブック ===== | ||
+ | |||
+ | 以下,コーパス別にシェアしておきます.順不同.錯誤があれば,ご指摘ください. | ||
+ | |||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | |||
korean/modu.1698063914.txt.gz · 最終更新: 2023/10/23 21:25 by yoshi