korean:modu
差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン | ||
korean:modu [2023/10/23 21:43] – yoshi | korean:modu [2023/12/14 21:46] (現在) – [ノートブック] yoshi | ||
---|---|---|---|
行 7: | 行 7: | ||
このコーパスは,従来「21世紀世宗計画」(以下「世宗計画」)で構築されてきた資料よりも分量がかなり多く,その種類も多様です.ただ,「世宗計画」コーパスとは異なり,JSONという形式で記述されているため,一般の研究者や利用者がちょっと検索してみる,といった使い方に不向きと思われます.「[[https:// | このコーパスは,従来「21世紀世宗計画」(以下「世宗計画」)で構築されてきた資料よりも分量がかなり多く,その種類も多様です.ただ,「世宗計画」コーパスとは異なり,JSONという形式で記述されているため,一般の研究者や利用者がちょっと検索してみる,といった使い方に不向きと思われます.「[[https:// | ||
- | また,データの分量が多いため,機械学習などの用途に向いているようで,「[https:// | + | また,データの分量が多いため,機械学習などの用途に向いているようで,「[[https:// |
- | とはいえ,言語研究の立場からは,やはり用例の収集などで利用したいものです.そこで,上記「[[https:// | + | とはいえ,言語研究の立場からは,やはり用例の収集などで利用したいものです.そこで,上記「[[https:// |
- | < | + | < |
以下の点にご注意ください: | 以下の点にご注意ください: | ||
行 19: | 行 19: | ||
* コーパスデータ本体は,[[https:// | * コーパスデータ本体は,[[https:// | ||
</ | </ | ||
+ | |||
+ | なお,あくまで「やってみた」という程度なので,コーパスの選択や機能などは,須賀井が思いついた(あるいは必要とする)ものを,できたときにシェアする予定です. | ||
+ | |||
+ | ===== ノートブック ===== | ||
+ | |||
+ | 以下,コーパス別にシェアしておきます.順不同.錯誤があれば,ご指摘ください. | ||
+ | |||
+ | * [[https:// | ||
+ | * [[https:// | ||
korean/modu.1698065039.txt.gz · 最終更新: 2023/10/23 21:43 by yoshi