====== MeCabで韓国語 ======
このページでは,オープンソース形態素解析エンジンMeCabを用いた現代韓国語の解析と,解析用辞書「HanDic」(ハンディク,한딕)について紹介しています([[mecab.ko|한국어 페이지]]).
解析用辞書の公開先を[[https://github.com/okikirmui/handic|GitHub]]に変更しました.[2024/01/13]
===== HanDicに関する情報 =====
* [[.:mecab:summary|HanDicの概要]]
* [[.:mecab:detail|HanDicの詳細情報]]
* [[.:mecab:pos|HanDicの品詞体系]]
* [[.:mecab:changelog|HanDicの変更履歴]]
===== HanDicの使い方 =====
* [[.:mecab:install|HanDicのインストール]]
* [[.:mecab:howto|HanDicの使い方]]
* [[.:mecab:r_howto|HanDicをRとRMeCabで利用する]]
* [[.:mecab:khcoder|HanDicをKH Coderで利用する]]
* [[.:mecab:python|HanDicをPythonで利用する]] [New!]
* [[.:mecab:python_tfidf|HanDicをPythonで利用する:tf-idfの計算]] [New!]
* 関連:[[https://twitter.com/k_news_keywords|twitter「TF-IDFで韓国ニュースのキーワードを抽出」]]で,新聞記事のtf-idf値を計算してキーワードを抽出し,自動ツイートするアカウントを作りました
===== HanDicの出力結果を利用する =====
* [[.:mecab:python_mk_tfidf|HanDicの出力結果をPythonで利用する:tf-idfの計算]] [New!]
===== 辞書構築のケーススタディ =====
* [[.:mecab:hira2han|変換用辞書の構築について]](MeCabによるひらがなのハングル転写)
===== HanDicを利用したツール =====
現在公開中の,MeCabを利用した韓国語学習・教育関連コンテンツです.
* [[https://newskeywords.pythonanywhere.com/|HanDicで韓国語ワードクラウド作成]] [New!]: 入力された韓国語テキストから,ワードクラウドを作成します.計算に使用する品詞や,配色などを選ぶことができます.
* [[https://porocise.sakura.ne.jp/korean/mecab/uploader.html|HanDic Tagger]]: テキストファイルをアップロードして,形態素解析の結果をダウンロードし,保存することができるツールです([[.:mecab:handic_tagger|説明ページ]]).
* [[https://porocise.sakura.ne.jp/korean/mecab/main.html|MeCabを利用した韓国語読解補助ツール]]: 入力された現代韓国語文の形態素解析を行い,単語の学習レベルや漢字表記への変換,ウェブ辞書へのリンクなど,韓国語学習に有益な情報を表示します.使い方は[[korean:mecab:tagger_manual|こちら]].
* [[https://porocise.sakura.ne.jp/korean/mecab/analyzer.html|形態素解析・漢字表記変換など]]: 現代韓国語文の形態素解析を行い,品詞をルビで表示したり,文中の漢字語を漢字表記に変換します.その他の機能も追加する予定です.([2013/03/13] 今後こちらはアップデートを行わず,上の「読解補助ツール」を充実させる予定です)
* [[https://porocise.sakura.ne.jp/korean/hira2han/index.html|MeCabによるひらがなのハングル転写]]: 入力されたひらがなをハングルに転写します.MeCabによる日本語文解析の結果をもとに,ハングル転写を行うこともできます.
===== 発表済みの関連業績 =====
発表・掲載順に列挙します.その他の業績については[[..:author|作者について]]を参照のこと.
- [論文] 須賀井義教・村田寛(2011)「[[http://kurepo.clib.kindai.ac.jp/modules/xoonips/detail.php?id=AA12508620-20110331-0041|15世紀朝鮮語の形態素解析について]]」,『近畿大学教養・外国語教育センター紀要(外国語編)』第1巻第2号,東大阪:近畿大学教養・外国語教育センター,pp.41-56,2011年3月.
- [口頭発表] 須賀井義教(2011)「[[https://porocise.sakura.ne.jp/archive/paper/mecabdic.pdf|MeCabを用いた現代韓国語の形態素解析]]」\\ 2011年6月12日,朝鮮語教育研究会第50回例会(京都女子大学)にて発表.
- [口頭発表] 村田寛・須賀井義教(2012)「[[http://www.aa.tufs.ac.jp/documents/jrp/jrp160_05ja.pdf|中期朝鮮語の形態素解析とその周辺]]」(村田寛先生と共同発表)\\ 2012年3月2日,朝鮮語史資料研究会(東京外国語大学アジア・アフリカ言語文化研究所)にて発表.
- [口頭発表] 須賀井義教(2012)「自動形態素解析を利用した韓国語読解補助ツールの開発」\\ 2012年6月17日,朝鮮語教育研究会第54回例会(キャンパスプラザ京都)にて発表.
- [ポスター発表] 須賀井義教(2013)「[[http://www.anlp.jp/proceedings/annual_meeting/2013/pdf_dir/P5-11.pdf|MeCab用韓国語形態素解析辞書の構築]]」(ポスターセッションP5-11)\\ 2013年3月15日,言語処理学会第19回年次大会(名古屋大学)にて発表.予稿集pp.781-784掲載.
- [論文] 須賀井義教(2013)「MeCab(めかぶ)を用いた現代韓国語の形態素解析」,朝鮮語研究会編『[[http://www.hituzi.co.jp/hituzibooks/ISBN978-4-89476-665-5.htm|朝鮮語研究]]』5,東京:ひつじ書房,pp.283-312,2013年6月.
- [論文] 스가이 요시노리(2013), '자동 형태소 분석 기술을 이용한 한국어 읽기 보조 도구의 개발 -일본어 모어화자를 위한 기능을 중심으로-'(自動形態素解析技術を利用した韓国語読解補助ツールの開発―日本語母語話者のための機能を中心に―), "한국어교육"(韓国語教育)제24권 3호, 서울: 국제한국어교육학회, pp.139-159, 2013년 9월.
- [口頭発表] 스가이 요시노리(2015), "한국어 자동 형태소 분석 사전의 개발"(韓国語自動形態素解析辞書の開発)\\ 2015年2月25日,韓国辞書学会(한국사전학회)第26次全国学術大会(韓国京畿道城南市・NAVER Green Factory)にて発表.発表要旨集pp.58-68掲載.
- [口頭発表] 須賀井義教(2016)「中期朝鮮語形態素解析辞書の開発」\\ 2016年9月10日,朝鮮語教育学会・朝鮮語研究会第5回合同大会(東京大学駒場キャンパス学際ホール)にて発表.
- [論文] 須賀井義教(2017)「中期朝鮮語形態素解析用辞書の開発」,須川英徳編『[[http://bensei.jp/index.php?main_page=product_book_info&products_id=100746|韓国・朝鮮史への新たな視座]]』,東京:勉誠出版,pp.315-333,2017年5月.
- [口頭発表] 스가이 요시노리(2019), '중세 한국어 문헌의 자동 형태소 분석과 계량적 연구:분석 결과의 활용에 대하여'(中世韓国語文献の自動形態素解析と計量的研究:分析結果の活用について)\\ 2019年9月20日,第一届多元文化研究与跨文化教育国际研讨会(山东大学中心校区・知新楼第三会议室)にて発表.
- [口頭発表] 須賀井義教(2020)「中期朝鮮語の計量的分析の試み―クラスター分析による『釈譜詳節』各巻の分類―」\\ 2020年9月5日,第266回[[http://www.tufs.ac.jp/ts/society/tyosengo/|朝鮮語研究会]](オンライン開催)にて発表.
- [論文] 須賀井義教(2022) 「[[https://doi.org/10.50986/koreanlinguistics.9.0_175|中期朝鮮語の計量的分析の試み―クラスター分析による『釈譜詳節』各巻の分類―]]」,『[[https://www.jstage.jst.go.jp/browse/koreanlinguistics/-char/ja|朝鮮語研究]]』9,東京:朝鮮語研究会,pp.175-207,2022年2月.
なお,本ページと関連する成果は
* 2010-2012年度科学研究費補助金(基盤研究(B))「[[http://kaken.nii.ac.jp/d/p/22320115.ja.html|朝鮮語CALL教材作成技法の開発と普及]]」(研究代表者:須賀井義教.研究分担者:油谷幸利,大名力,中西恭子,中村麻結)
* 2013-2014年度科学研究費補助金(若手研究(B))「[[http://kaken.nii.ac.jp/d/p/25770164.ja.html|現代韓国語自動形態素解析のための辞書構築とその応用]]」(研究代表者:須賀井義教)
* 2017-2020年度科研費(基盤研究(C))「[[https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-17K02758/|自動形態素解析を利用した15世紀朝鮮語解析済みコーパスの構築]]」(研究代表者:須賀井義教)
* 2020年度-科研費(基盤研究(C))「[[https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-20K00558/|計量的分析のための15世紀朝鮮語形態素解析済みコーパス構築:仏教諺解を対象に]]」(研究代表者:須賀井義教)
による研究成果の一部です.
===== 参照ウェブサイト =====
本家HP以外に,辞書作成,サーバーへの設置,Perl用モジュールの設置などで参考にしたサイトです.
* [[http://d.hatena.ne.jp/bellbind/20090529/1243615666|cygwin上にmecab&mecab-rubyをインストール]]
* [[http://kubotahi.blogspot.com/2010/12/mecab-on-perl.html|MeCab on Perl]]
* [[http://perl-users.jp/articles/advent-calendar/2010/acme/21|Text::MeCab(日本語変換系Acmeモジュールを支える偉大なモジュール)]]
* [[http://pawa.dojikko.com/pg/perl/2009.html|さくら鯖でText::MeCabをインストールする方法(UTF-8対応)]]
* [[http://www.mwsoft.jp/programming/munou/mecab_command.html|MeCabのコマンドライン引数一覧とその実行例]]
{{indexmenu_n>20}}