korean:mecab:detail
差分
このページの2つのバージョン間の差分を表示します。
次のリビジョン | 前のリビジョン | ||
korean:mecab:detail [2015/10/13 22:06] – 外部編集 127.0.0.1 | korean:mecab:detail [2021/01/17 11:40] (現在) – [HanDicの詳細情報] yoshi | ||
---|---|---|---|
行 1: | 行 1: | ||
====== HanDicの詳細情報 ====== | ====== HanDicの詳細情報 ====== | ||
- | ===== バージョン ===== | + | [[https:// |
- | + | ||
- | HanDicのバージョンは現在'' | + | |
- | + | ||
- | * バージョン:0.1(20150525) | + | |
- | * 項目数:105, | + | |
- | * 学習用データ:2, | + | |
- | + | ||
- | <WRAP important> | + | |
- | 以下のセクションは現在更新中です. | + | |
- | </ | + | |
===== 登録項目の元データ ===== | ===== 登録項目の元データ ===== | ||
行 23: | 行 12: | ||
* 韓国人の姓:Wikipediaの[[http:// | * 韓国人の姓:Wikipediaの[[http:// | ||
* < | * < | ||
- | * 鉄道駅名:Wikipediaの[[http:// | + | * 鉄道駅(地下鉄・国鉄):Wikipediaの[[http:// |
- | * 韓国の行政区域名:[[http:// | + | * 韓国の行政区域:[[http:// |
- | * 国名,首都名:Wikipediaの[[http:// | + | * 国名,首都:Wikipediaの[[http:// |
* 外来語表記用例資料:韓国・国立国語院の「외래어 표기 용례 자료」の「중국 인명과 지명」から,人名および都市(一部:都市,省,省都,県,自治区・自治州,州都,直轄市),漢字表記あり | * 外来語表記用例資料:韓国・国立国語院の「외래어 표기 용례 자료」の「중국 인명과 지명」から,人名および都市(一部:都市,省,省都,県,自治区・自治州,州都,直轄市),漢字表記あり | ||
* 山・河川:Wikipediaの[[http:// | * 山・河川:Wikipediaの[[http:// | ||
+ | * 警察署・地方警察庁名:Wikipediaの[[https:// | ||
* その他 | * その他 | ||
- | ネット上のデータについては,誤りなどを見つけ次第修正しています. | + | その他,追加した項目の詳細については[[: |
===== 品詞体系と素性の記述 ===== | ===== 品詞体系と素性の記述 ===== | ||
行 42: | 行 32: | ||
===== 学習用データ ===== | ===== 学習用データ ===== | ||
- | 韓国・[[http:// | + | 韓国・[[http:// |
+ | - 「해남 가는 길」(BREO0088.txt) | ||
- 「함께 걷는 이 길은: 한샘 미네르바문고3」(BRHO0111.txt) | - 「함께 걷는 이 길은: 한샘 미네르바문고3」(BRHO0111.txt) | ||
- 「알기 쉬운 인권 지침」(BRHO0112.txt) | - 「알기 쉬운 인권 지침」(BRHO0112.txt) | ||
行 63: | 行 54: | ||
- 「한국언론의 좌표」(BRHO0433.txt) | - 「한국언론의 좌표」(BRHO0433.txt) | ||
- 「강좌, 민족문학」(BRHO0434.txt) | - 「강좌, 민족문학」(BRHO0434.txt) | ||
+ | - 新聞「조선일보 경제(93)」(BRAA0007.txt) | ||
+ | - 新聞「조선일보 문화(93)」(BRAA0009.txt) | ||
+ | - 新聞「동아일보 문화(2003)」(BRBD0066.txt) | ||
+ | - 雑誌「주간 경향(1994/ | ||
+ | - 「시간속의 도적」(BREO0081.txt) | ||
+ | - 雑誌「금융 97년 1월호」(BRBE0237.txt) | ||
以上のデータから学習用コーパスを作成し,パラメータ学習に利用しました.< | 以上のデータから学習用コーパスを作成し,パラメータ学習に利用しました.< | ||
- | 学習用データについても今後量を増やしていく予定です. | + | その後追加した学習用データについては,[[: |
<wrap hi> | <wrap hi> | ||
行 72: | 行 69: | ||
===== 辞書構築の実際 ===== | ===== 辞書構築の実際 ===== | ||
- | ケーススタディとして,ひらがなをハングルで転写するための変換用辞書を構築しました.具体的な方法については[[..: | + | ケーススタディとして,ひらがなをハングルで転写するための変換用辞書を構築しました.具体的な方法については[[..: |
| |
korean/mecab/detail.1444741597.txt.gz · 最終更新: 2015/10/13 22:10 (外部編集)