korean:mecab:hira2han
差分
このページの2つのバージョン間の差分を表示します。
次のリビジョン | 前のリビジョン | ||
korean:mecab:hira2han [2015/10/12 17:16] – 外部編集 127.0.0.1 | korean:mecab:hira2han [2020/11/07 13:59] (現在) – yoshi | ||
---|---|---|---|
行 1: | 行 1: | ||
====== 変換用辞書の構築について ====== | ====== 変換用辞書の構築について ====== | ||
- | ここでは,[[http:// | + | ここでは,[[https:// |
===== はじめに ===== | ===== はじめに ===== | ||
- | [[https://mecab.googlecode.com/ | + | [[https://taku910.github.io/ |
* 「きゃっ」が「걋」,「ひょん」が「횬」になるなど,ひらがなの数文字がハングル1文字に該当することがある | * 「きゃっ」が「걋」,「ひょん」が「횬」になるなど,ひらがなの数文字がハングル1文字に該当することがある | ||
行 95: | 行 95: | ||
==== dicrc ==== | ==== dicrc ==== | ||
- | 基本的には[[https:// | + | 基本的には[[https:// |
< | < | ||
行 112: | 行 112: | ||
ひらがなのハングル転写について,「외래어표기법」では日本語表記の細則第2項で,「長母音は別に表記しない」としており,「とうきょう」を「도쿄」,「にいがた」を「니가타」とする例を挙げています.この処理を行うには例えば「とう」を「도」と出力し,「にい」を「니」と出力するよう,辞書エントリを作成すればよいのですが,そうすると「ともだち< | ひらがなのハングル転写について,「외래어표기법」では日本語表記の細則第2項で,「長母音は別に表記しない」としており,「とうきょう」を「도쿄」,「にいがた」を「니가타」とする例を挙げています.この処理を行うには例えば「とう」を「도」と出力し,「にい」を「니」と出力するよう,辞書エントリを作成すればよいのですが,そうすると「ともだち< | ||
- | こうした処理の誤りを回避するため,ユーザーが入力する時点で,長音については「ー」を入力してもらうことにしました.発音通りに入力してもらう,ということです.デフォルトの出力形式を'' | + | こうした処理の誤りを回避するため,ユーザーが入力する時点で,長音については「ー」を入力してもらうことにしました.発音通りに入力してもらう,ということです.デフォルトの出力形式を'' |
==== unk.def ==== | ==== unk.def ==== | ||
行 125: | 行 125: | ||
===== 辞書の構築 ===== | ===== 辞書の構築 ===== | ||
- | 以上のファイルをひとつのディレクトリに入れ,'' | + | 以上のファイルをひとつのディレクトリに入れ,'' |
<code bash> | <code bash> |
korean/mecab/hira2han.1444637819.txt.gz · 最終更新: 2015/10/12 17:16 by 127.0.0.1