korean:mecab:hira2han
                差分
このページの2つのバージョン間の差分を表示します。
| 次のリビジョン | 前のリビジョン | ||
| korean:mecab:hira2han [2015/10/12 17:16] – 外部編集 127.0.0.1 | korean:mecab:hira2han [2020/11/07 13:59] (現在) – yoshi | ||
|---|---|---|---|
| 行 1: | 行 1: | ||
| ====== 変換用辞書の構築について ====== | ====== 変換用辞書の構築について ====== | ||
| - | ここでは,[[http:// | + | ここでは,[[https:// | 
| ===== はじめに ===== | ===== はじめに ===== | ||
| - | [[https://mecab.googlecode.com/ | + | [[https://taku910.github.io/ | 
| * 「きゃっ」が「걋」,「ひょん」が「횬」になるなど,ひらがなの数文字がハングル1文字に該当することがある | * 「きゃっ」が「걋」,「ひょん」が「횬」になるなど,ひらがなの数文字がハングル1文字に該当することがある | ||
| 行 95: | 行 95: | ||
| ==== dicrc ==== | ==== dicrc ==== | ||
| - | 基本的には[[https:// | + | 基本的には[[https:// | 
| < | < | ||
| 行 112: | 行 112: | ||
| ひらがなのハングル転写について,「외래어표기법」では日本語表記の細則第2項で,「長母音は別に表記しない」としており,「とうきょう」を「도쿄」,「にいがた」を「니가타」とする例を挙げています.この処理を行うには例えば「とう」を「도」と出力し,「にい」を「니」と出力するよう,辞書エントリを作成すればよいのですが,そうすると「ともだち< | ひらがなのハングル転写について,「외래어표기법」では日本語表記の細則第2項で,「長母音は別に表記しない」としており,「とうきょう」を「도쿄」,「にいがた」を「니가타」とする例を挙げています.この処理を行うには例えば「とう」を「도」と出力し,「にい」を「니」と出力するよう,辞書エントリを作成すればよいのですが,そうすると「ともだち< | ||
| - | こうした処理の誤りを回避するため,ユーザーが入力する時点で,長音については「ー」を入力してもらうことにしました.発音通りに入力してもらう,ということです.デフォルトの出力形式を'' | + | こうした処理の誤りを回避するため,ユーザーが入力する時点で,長音については「ー」を入力してもらうことにしました.発音通りに入力してもらう,ということです.デフォルトの出力形式を'' | 
| ==== unk.def ==== | ==== unk.def ==== | ||
| 行 125: | 行 125: | ||
| ===== 辞書の構築 ===== | ===== 辞書の構築 ===== | ||
| - | 以上のファイルをひとつのディレクトリに入れ,'' | + | 以上のファイルをひとつのディレクトリに入れ,'' | 
| <code bash> | <code bash> | ||
korean/mecab/hira2han.1444637819.txt.gz · 最終更新: 2015/10/12 17:16 by 127.0.0.1
                
                