ユーザ用ツール

サイト用ツール


korean:mecab:changelog

HanDicの変更履歴

20220130

handic-mecab-20220130_bin.zip / handic-mecab-20220130_src.tar.gz

  • 現況:項目数 116,274,学習用データ 5,025文
  • 学習用データ追加
  • 項目を追加
    • Noun.supplement.csv: 경제고(經濟苦), 긴꼬리딱새, 고라니, 눈꼬리, 달맞이꽃, 과민증(過敏症), 동물학자(動物學者), 배선망(配線網), 지향점(指向點), 무위도식(無爲徒食), 발효조(醱酵槽), 온정주의(溫情主義), 정치권01(政治圈), 절치부심(切齒腐心), 유튜버(YouTuber), 무속인(巫俗人), 방임03(放任), 양모03(養母), 양부06(養父), 양부모(養父母), 누리꾼, 댓글(對글), 댓글창(對글窓), 빙의(憑依), 국가02(國歌), 금붕어(金붕어), 구름다리, 그끄저께, 그끄제, 그그제(’그끄제’의 방언), 괴롬(’괴로움’의 준말), 급행(急行), 근심거리, 근심사(근심事), 밥공기(밥空器), 생선구이(生鮮구이), 고등어구이, 손금01, 인후염(咽喉炎), 당기03(黨紀), 층수(層數), 도어80(door), 동절(冬節), 하절(夏節), 보이스피싱, 비트코인(通貨名として), 증빙(證憑), 환급(還給), 모니터링(monitoring), 수사처(搜査處), 공포01(公布), 전80(前, ·현직), 경무관(警務官), 장성06(將星,“준장/소장/중장/대장”), 재택80(在宅), 등80(登,·하교), 가제08(Gaze), 간담01(肝膽), 개미허리, 건04(件), 관형사(冠形詞), 광어(廣魚), 그글피, 그레이프프루트(grapefruit), 근시03(近視), 글꼴, 금상04(金賞), 까불이, 까짓것, 깔개, 깝질, 남극01(南極), 넓적다리, 넙치, 노대04(露臺), 느낌표(느낌標), 다운로드(download), 담뱃재, 대07(代), 대11(隊), 대장10(隊長), 덧창(덧窓), 도랒, 동급(同級), 동해01(東海), 따개, 따옴표(따옴標), 라이트01(light), 레인지(range), 렌터카(rent-a-car), 마가린(margarine), 마른안주(마른按酒), 말줄임표(말줄임標), 맛버섯, 망치질, 문어02(文語), 물만두(물饅頭), 별걱정(別걱정), 별꼴(別꼴), 별놈(別놈), 별사람(別사람), 보어01(補語), 복자음(複子音), 붕어빵, 비번00(非番), 사잇길, 세이프(safe), 소수04(小數), 송료(送料), 송이03(松耳/松栮), 송이버섯(松耳버섯), 순사질(巡査질), 술기(술氣), 술내, 스탬프(stamp), 실톱, 엊그저께, 엠피스리(MP three), 연12(緣), 오프라인(off-line), 요전번(요前番), 웃사람, 원그래프(圓graph), 원시07(遠視), 웨이트리스(waitress), 육회(肉膾), 일보04(日報), 젖니, 제비01, 제수01(弟嫂), 제수씨(弟嫂氏), 조모01(祖母), 존함02(尊銜), 짜장면, 체적02(體積), 축전02(祝電), 카스텔라(castela), 콘센트(concentric plug), 특급01(特急), 페리01(ferry), 페리보트(ferryboat), 펜션(pension), 평복02(平服), 푸딩(pudding), 풀질, 하이픈(hyphen), 허브티(herb tea), 헌데, 홍삼02(紅蔘), 후면02(後面), 쾌속(快速), 가위질, 관용02(慣用), 금주06(禁酒), 당일치기(當日치기), 디스카운트(discount), 띄어쓰기, 반품02(返品), 수군덕질, 수상13(授賞), 왕진(往診), 일람(一覽), 존대02(尊待), 좌회전(左回轉), 주유05(注油), 착신(着信), 청강02(聽講), 체크아웃(check-out), 품절(品切), 하이킹(hiking), 해열(解熱), 회답(回答), 흙질, 남자아이(男子아이), 눈사람, 여자아이(女子아이), 매해(每해), 매달(每달), 매번(每番), 케익(cake), 맥주잔(麥酒盞), 생사고락(生死苦樂), 선견지명(先見之明), 작심삼일(作心三日), 가격표(價格表), 가루약(가루藥), 각방03(各房), 각인01(各人), 거센소리, 거스름, 격음(激音), 곰국, 과보호(過保護), 금화02(金貨), 까망, 낭하(廊下), 놀이동산, 농음02(濃音), 답서(答書), 더럼, 독학03(獨學), 딴말01, 막냇동생, 맏나물, 맑은국, 무의식(無意識), 미남자(美男子), 미용사(美容師), 발명왕(發明王), 벌꿀, 부침개, 불가능(不可能), 비빔냉면(비빔冷麵), 삼면기사(三面記事), 수사25(數詞), 스케이트장(스케이트場), 실험장(實驗場), 양복지(洋服地), 캠핑, 털가죽, 통역사(通譯士), 파자마, 평음(平音), 폐관02(閉館), 폐회(閉會), 피시방(피시房), 빨랫감, 가다랑어, 가르마, 가마03, 가맹(加盟), 가자미눈, 간고03(艱苦), 간담02(懇談), 간병01(看病), 감수11(感受), 개똥벌레, 갯가재, 거름종이, 건달패(乾達牌), 검열관(檢閱官), 검찰관01(檢察官), 게걸01, 격일(隔日), 격주(隔週), 결번(缺番), 경도07(經度), 경륜03(競輪), 경정09(競艇), 경조13(慶弔), 계부02(繼父), 고국산천(故國山川), 고심분투(苦心奮鬪), 고자질(告者질), 고조14(高潮), 곤약(菎蒻), 곰팡, 곱슬머리, 공작새(孔雀새), 과소02(過小), 과소03(過少), 과소05(過疏), 광견병(狂犬病), 광우병(狂牛病), 괴담(怪談), 구구02(九九), 구구법(九九法), 구김새, 구두창, 구명03(究明), 구역05(嘔逆), 국방색(國防色), 군입질, 굽이굽이, 귀뚜라미, 귀이게, 귀중01(貴中), 귀지01, 그믐께, 그믐밤, 극비리(極祕裡), 근린공원(近鄰公園), 금괴(金塊), 급정거(急停車), 기성복(旣成服), 기성세대(旣成世代), 기승전결(起承轉結), 기와지붕, 기장01, 뇌경색(腦梗塞), 눈가늠, 마른기침, 명일02(命日), 밑거름, 바닷가재, 반딧불이, 배트01, 비단구렁이(緋緞구렁이), 쌍가마01(雙가마), 우라늄광(우라늄鑛), 우량01(雨量), 입구린내, 집짐승, 힘겨룸, 청80(靑, 청와대=당 협의), 전81(全, ·월세), 도미노(domino), 짝퉁, 한류80(韓流), 콘텐트(content), 스타트업(startup), 변리사(辨理士), 브로슈어(brochure), 탑승구(搭乘口), 선대위(選對委), 로스쿨(law school), 무착륙(無着陸), 출발지(出發地), 킥보드(kick board), 카트(cart), 항공료(航空料), 입소문(입所聞), 세리머니(ceremony), 해양법(海洋法), 유불리(有不利), 골든크로스(golden cross), 원팀(one team), 후폭풍(後暴風), 성매매(性賣買), 패싱(passing), 스텔스(stealth), 상임위(常任委), 환노위(環勞委), 문체위(文體委), 법사위(法司委), 보건위(保健委), 복지위(福祉委), 보건복지위(保健福祉委), 산업위(産業委), 산자위(産資委), 중기위(中企委), 산자중기위(産資中企委), 여가위(女家委), 여성위(女性委), 외통위(外統委), 외교위(外交委), 정무위(政務委), 행안위(行安委), 사개특위(司改特委), 예결위(豫決委), 예결특위(豫決特委), 윤리위(倫理委), 윤리특위(倫理特委), 정개특위(政改特委), 운영위(運營委), 과방위(科放委), 과기정위(科技情委), 과기정통위(科技情通委), 교육위(敎育委), 국토위(國土委), 농림위(農林委), 농수위(農水委), 농축위(農畜委), 농식품위(農食品委), 농해수위(農海水委), 탄도02(彈道), 해촉(解囑), 고검04(高檢), 대검02(大檢), 팬덤(fandom), 복당01(復黨), 지인03(知人), 알파02(alpha), 베타01(beta), 감마02(gamma), 델타01(delta), 엡실론(epsilon), 제타(theta), 에타(eta), 세타(theta), 요타(iota), 카파02(kappa), 람다(lambda), 뮤(mu), 크시(xi), 오미크론(omikron), 로04(rho), 시그마(sigma), 타우(tau), 입실론(upsilon), 피11(phi), 키06(khi), 프시01(psi), 제82(制, ·개정), 발안(發案), 청구권(請求權), 인수03(人數), 부령04(部令), 특례시(特例市), 일극(一極), 동남01(東南), 메가시티(megacity), 님비(NIMBY), 선관위(選管委), 시의원(市議員), 인허가(認許可), 교부세(交付稅), 녹취02(錄取), 구의회(區議會), 임시회(臨時會), 맵(map)
    • Noun.supplement.name.csv: 담(譚, 姓), 창흠(名), 윤모(名), 재갑(名), 은별(名), 순칠(名), 권욱(名), 태운(名), 성무(名)
    • Noun.supplement.org.csv: 문화관광부(文化觀光部), 사회과학원(社會科學院), 한국갤럽(韓國갤럽), 로이터통신(로이터通信), 국립감염병연구소(國立感染病硏究所), 대법원(大法院), 엘에이치(LH:한국토지주택공사), 블룸버그(Bloomberg), 롤스로이스(Rolls-Royce), 르노(Renault), 국제앰네스티(國際앰네스티), 파리바게뜨, 네파, 네이처리퍼블릭, 호식이두마리치킨, 풀무원, 한샘, 네네치킨, 탐앤탐스, 한국지식재산보호원(韓國知識財産保護院), 에어서울(Air Seoul), 관훈클럽(寬勳클럽), 록히드마틴(Lockheed Martin), 한국노동조합총연맹(韓國勞動組合總聯盟), 한국노총(韓國勞總), 안보리80(安保理), 국회입법조사처(國會立法調査處), 충북참여자치시민연대(忠北參與自治市民連帶)
    • Noun.supplement.proper.csv: 표준국어대사전(標準國語大辭典), 조선말대사전(朝鮮말大辭典), 여진족(女眞族), 월스트리트저널(Wall Street Journal), 백인종(白人種), 흑인종(黑人種), 뉴욕타임스(New York Times), 한국프레스센터(韓國프레스센터)
    • Noun.supplement.place.csv: 할리우드(Hollywood), 뉴욕시(뉴욕市), 브루클린(Brooklyn), 스태튼아일랜드(Staten Island), 태평양(太平洋), 대서양(大西洋), 지중해02(地中海), 제진(猪津), 전북도(全北道), 전남도(全南道), 경남도(慶南道), 경북도(慶北道), 충남도(忠南道), 충북도(忠北道)
    • Suffix.csv: 군11(群), 거리다/XSV
    • Ending.csv: -습디다, -려다(려고 하다가), -려다가(려고 하다가)
    • Verb.supplement_2.1syl.csv: 봉하다01(封하다), 뜻하다, 밥하다
    • Verb.supplement_3.std.csv: 굴다02(’구르다’의 준말), 갖다주다(’가져다주다’의 준말), 덧나다02, 굴러떨어지다, 끈적이다, 데려다주다, 되새기다02, 떨리다02, 모셔다드리다, 방글거리다, 배이다, 불리다05, 불쑥거리다, 비기다02, 비뚤거리다, 쐬다02, 치이다07, 타다06, 떨다02, 헐다01, 졸립다, 그리하다, 들리다05, 이리하다, 잘못되다, 저리하다, 채다07, 갈리다04, 글썽이다, 긁적이다, 긋다02, 까딱이다01, 다독이다, 불어닥치다
    • Adverb.csv: 그러루, 그끄저께, 그끄제, 그그제(’그끄제’의 방언), 개골개골, 거듭거듭, 겸손히(謙遜히/謙巽히), 경쾌히(輕快히), 고불고불, 곤란히(困難▽히), 괴로이, 그러나저러나, 깔끔히, 꾸불꾸불, 끈적끈적, 나른히, 날카로이, 냉정히01(冷情히), 든든히, 따끔히, 매암매암, 멈칫멈칫, 메슥메슥, 방긋방긋, 방긋이01, 번거로이, 부디부디, 불쑥이, 불쾌히(不快히), 비참히(悲慘히), 살짝살짝, 서운히, 싱긋벙긋, 엊그저께, 예사로이(例事로이), 온종일(온終日), 우뚝이, 우울히(憂鬱히), 유창히(流暢히), 의아히(疑訝히), 익숙히, 점잖이, 종일토록(終日토록), 줄기줄기, 중대히(重大히), 지긋지긋이, 캄캄히, 평범히(平凡히), 하루건너, 하루걸러, 한가히(閑暇히), 호화로이(豪華로이), 매해(每해), 가만가만히, 고생고생(苦生苦生), 궁금히, 까옥까옥, 깜빡깜빡, 답답히, 똑03, 만약(萬若), 문뜩, 부끄러이, 불안히(不安히), 수많이(數많이), 심각히(深刻히), 안전히(安全히), 어떻든지, 여름내, 조심히(操心히), 가뜩02, 가뜩이02, 가소로이(可笑로이), 간간05(間間), 갸름갸름, 건들건들, 겸사겸사(兼事兼事), 고이고이, 고작해야, 곧이, 공교로이(工巧로이), 기우뚱기우뚱, 기웃, 길쭉이, 끼우뚱, 정작01
    • Root.csv: 유창03(流暢), 잠잠(潛潛), 지긋01(집안일이 ~하다), 흥성03(興盛), 들큼, 씽씽02, 알알02, 구수01, 고약01, 풍부02(豊富), 가뜬, 갸륵02, 견실02(堅實), 고불01, 구불, 급급03(急急),
    • Adjective.supplement.csv: 매스껍다, 가소롭다, 건하다01, 공교롭다
    • Noun.misc.csv: 기가헤르츠(gigahertz), 도스80(dose)
    • Conjunction.csv: 그래도
  • 項目を修正
    • Noun.supplement.name.csv: 아리스토텔레스(Aristoteles)の綴を修正, 주07(朱)の同音異義語番号を05に, 주10(周)の同音異義語番号を08に, 中国人名など項目に空白が含まれていたのを削除
    • Noun.C.csv: 정치권(政治權)の同音異義番号を02に
    • Adjective.supplement.csv: 감다の同音異義番号を04に, 모이다の同音異義番号を01に, 즐기다の同音異義番号を02に
    • Noun.supplement.csv: 칠갑01(漆甲)の漢字を追加・同音異義番号を削除, 명04/05(命)の品詞3を入れ替え, 못03の「補充」素性が「漢字」素性として記述されていたのを修正,발명01/02(發明)の品詞3をいずれも「動作」にして「補充」素性に記述を追加, 전갈자리の漢字を修正,미숙01(未熟)の同音異義番号を削除,반올림の漢字情報を修正,벽돌に漢字情報を追加,부정부패の漢字情報を修正, 연어04(鰱魚)に漢字情報を追加, 주03(主)の同音異義語番号を01に, 주04の同音異義語番号を02に+漢字情報(主)を追加, 주05(州)の同音異義語番号を03に, 주18(柱)の同音異義語番号を16に+補充情報(기둥)を追加, 주24(株)の同音異義語番号を22に+補充情報(주식)を追加, 주25(紬)の同音異義語番号を23に, 주27(註)の同音異義語番号を25に, 딸꾹질の品詞3を「動作」に, 탈02に漢字情報(頉)を追加, 별표01の漢字情報を修正(별), 건사01の品詞3に「動作」を追加, 건투の品詞3に「動作」を追加, 과묵(寡默)の品詞3に「状態」を追加, 궁색01の漢字情報を修正(窮), 예매(豫賣)に同音異義番号を02に, 예매01(豫買)の品詞3に「動作」を追加, 무사11(無事)の品詞3に「状態」を追加
    • Verb.supplement_1.5over.csv: 거르다01に補足情報(막걸리를 ~)を追加, 거르다02に補足情報(끼니를 ~)を追加
    • Verb.supplement_3.std.csv: 덧나다の同音異義番号を01に, 메이다の同音異義番号を02に+補足情報(메다)追加, 검다の同音異義語番号を01に, 짙다の同音異義番号を01に
    • Adverb.csv: 이리03(이리 오너라.)/이리04(이리 바쁘다.)の同音異義番号を修正, 지긋지긋02に補足情報(가난이 ~하다)を追加
    • Modifier.csv: 주03(主)の同音異義語番号を01に
    • Noun.misc.csv: 주11(周)の同音異義語番号を09に, 주24(株)の同音異義語番号を22に+補充情報(느티나무 한 ~/그루)を追加, 주26(週)の同音異義語番号を24に
    • Suffix.csv: 주31(主)の同音異義語番号を28に, 주32(酒)の同音異義語番号を29に, 맞다04を形容詞派生接尾辞に
    • Prefix.csv: 주33(駐)の同音異義語番号を30に
    • Noun.A.csv: 주26(週)の同音異義語番号を24に
    • Noun.supplement.org.csv: 주식회사 부산항보안공사(釜山港保安公社)・주식회사 인천항보안공사(仁川港保安公社)の「주식회사 」を削除
    • Root.csv: 지긋02に補足情報(나이가 ~하다)を追加, 갸륵01に補足情報(뜻이 ~하다)を追加
    • Adjective.csv: 대문짝만하다の漢字情報を修正
  • 項目を削除
    • Ending.csv: -ㄴ데다, -ㄴ데다가, -는데다, -는데다가
    • Adverb.csv: 싱싱, 이리05, 잠잠(潛潛), 자세01(仔細), 녹록01(碌碌)
    • Adjective.supplement.csv: 아니다
    • Modifier.csv: 공11
    • Noun.supplement.csv: 앞구르기, 국회의원직(國會議員職), 의원직(議員職), 국회직(國會職), 논03(論), 고정관념(固定觀念), 유창03(流暢), 탄산가스(炭酸gas), 구수01, 고약01, 재확인시키다, 풍부02(豊富), 상한제(上限制), 동부권(東部圈), 조정실장(調整室長), 지부장직(支部長職), 무력시위(武力示威), 무력행사(武力行使), 무료입장(無料入場), 긴급회의(緊急會議), 청구권자(請求權者), 임시직(臨時職), 대통령제(大統領制), 대통령직(大統領職), 대통령학(大統領學)
      • 重複分:미안(未安), 불길02(不吉), 무난(無難), 미묘02(微妙), 선언01(宣言), 시급01(時急), 심심02, 예고(豫告), 위태01(危殆), 유의04(留意), 자신만만(自信滿滿), 한가04(閑暇), 흥미진진(興味津津), 옛날01, 검찰청(檢察廳), 고지식01, 관대04(寬大), 기발03(奇拔)
    • Noun.supplement.name.csv: 신(名,重複)
    • Noun.supplement.place.csv: 소금강(小金剛,重複), 평사리(重複), 화산리(花山里/華山里,重複)
    • Noun.misc.csv: 무08に補足情報(무승부)追加
    • Verb.supplement_1.over5.csv: 물려받다(重複)
    • Root.csv: 미숙01(未熟,重複)
    • Prefix.csv: 시-(用言接頭辞)が誤って登録されていたのを削除
    • Suffix.csv: -이-(用言接尾辞)が誤って登録されていたのを削除
    • Conjunction.csv: 또한

20210116

handic-mecab-20210116_bin.zip / handic-mecab-20210116_src.tar.gz

180428 - 0.6

handic-mecab-0.6_bin.zip / handic-mecab-0.6_src.tar.gz

  • 現況:項目数 114,863,学習用データ 2,700文
  • 学習用データ追加(冒頭の100文)
    • BTHO0129.txt: 삶의 결 살림의 질
  • 項目を削除
    • Verb.supplement_1.over5.csv: 모아지다
    • Noun.supplement.csv: 홀짝이다, 대보름, 대보름날, 생솔가지, 운동권, 다듬이질, 장꾼, 마다02(XRと重複), 공산권, 충전식, 심부전증, 침해죄, 최첨단(最尖端), 마취과(痲醉科), 재승격(再昇格), 성장률(成長率), 바닥권, 미신고자(未申告者), 대주주(大株主), 증가율(增加率), 총학생회(總學生會), 재구성(再構成)
    • Adjective.csv:
    • Modifier.csv:
    • Verb.B.csv: 세워지다, 느껴지다, 알려지다, 높아지다
    • Noun.B.csv: 대도시(大都市), 대기업(大企業)
    • Noun.C.csv: 성적01(性的), 신세대(新世代)
    • Noun.supplement.place.csv: 종로1가など,数字+街を含む地名を削除(途中)
  • 項目を追加
    • Ending.csv: 모(사투리 “면”), 키(하기)
    • Noun.A.csv: 월02(月)
    • Noun.misc.csv: 인조80(人組)
    • Noun.supplement.csv: 3·1절, 절후02(節候), 나발통, 함석, 달집01, 방화죄(放火罪), 산림법(山林法), 원뿔통(圓뿔통), 장터거리(場터거리), 피붙이, 뜸마을, 아랫동, 비손, 짚불, 딱총(딱銃), 불꽃놀이, 액02(厄), 꽃샘, 연녹색/연록색(軟綠色), 연록(軟綠), 만산02(滿山), 정한02(情恨), 개여울, 재취02(再娶), 의붓딸, 의붓아들, 의붓아범, 의붓아비, 의붓어머니, 의붓어멈, 의붓어미, 의붓자식(의붓子息), 선병질(腺病質), 위채, 마소, 반타작(半打作), 청상07(廳上), 標準国語大辞典の〈동물〉カテゴリから968項目, 여필종부(女必從夫), 인종05(忍從), 모티브, 곡마단(曲馬團), 고깔모자, 재주넘기, 읍민(邑民), 곡예사(曲藝師), 명견(名犬), 외발, 요절03(腰折/腰絕), 선전원(宣傳員), 장27(場/시장), 애조02(哀調), 공중그네, 정인04(情人), 제설차(除雪車), 적십자(赤十字), 심부전(心不全), 화기06(花器), 요식02(料食), 시약03(試藥), 팔모정(八모亭), 국교80(國校=국민학교), 구름사다리, 늑목(肋木), 간이링(簡易링), 제당03(製糖), 니켈(nickel), 밀감(蜜柑), 경81(經=경제), 도크(dock), 신고자(申告者), 구주10(舊株), 장세03(場勢), 내강01(內剛), 외유내강(外柔內剛), 외유02(外柔), 첨가제02(添加劑), 활석분(滑石粉), 거래소(去來所), 유종80(油種), 국고국장(國庫局長), 인두세(人頭稅), 광공업체(鑛工業體), 주세법(酒稅法), 청주03(淸酒), 과실주(果實酒), 백송01(白松), 엽록소(葉綠素), 신부전(腎不全), 한계선(限界線), 분단국가(分斷國家), 국고금(國庫金), 일평균(日平均), 당행, 국공채(國公債), 동월02(同月), 하회02(下廻), 전월02(前月)
    • Noun.supplement.name.csv: 소월03(素月), 윤섭, 범직, 칼, 립켄, 마크, 맥과이어, 파이잘, 아브다오, 세달, 대처(Thatcher), 국병, 연란, 숀, 팬
    • Noun.supplement.place.csv: 호서02(湖西), 기호05(畿湖), 해서01(海西), 선달바우산, 레닌그라드, 수안보(水安堡), 코리아(Korea), 서독01(西獨), 엑셀
    • Verb.supplement_1.over5.csv: 신나다
    • Verb.supplement_3.std.csv: 홀짝이다, 맹글다(사투리 “만들다”), 찌다06(솔가지를 ~), 킬킬대다
    • Noun.supplement.proper.csv: 진달래꽃02, 산유화01(山有花),접동새01, 마그레비, 천황배(天皇杯), 우루과이라운드(Uruguay Round), 데미렐, 태릉사격장(泰陵射擊場)
    • Noun.supplement.org.csv: 행정안전부/행안부, 중소벤처기업부/중기부, 과학기술정보통신부/과기정통부, 韓国の政党名72項目, 적십자(赤十字), 행림대(杏林大), 롯데리아, 사조참치, 동신떡갈비, 중대(중앙대 약칭), 대명레저산업, 한국소비자보호원, 소보원(한국소비자보호원 약칭), 유니세프(UNICEF), 유러펀드(Euro Fund), 상공부(商工部), 메츠(Mets), 미국프로테니스협회, 삼성(三星), 현대(現代), 국제테니스연맹, 프뤼겔스, 전일공 (全日空), 경단협(經團協), 해태, 고합, 대우(大宇), 한라(漢拏), 배명, 현대자동차(現代自動車), 교통부(交通部), 안전국(安全局), 企業グループ名38項目, 재무부(財務部), 동자부(動資部), 롯데칠성, 문화방송, 한국방송, 에스비에스(SBS)
    • Noun.numeral.csv: 시오(십리고 시오리고…)
    • Prefix.csv: 먹03(구름)
    • Suffix.csv: 급06(級)
    • Adjective.supplement.csv: 다숩다, 다습다, 애운하다
    • Adverb.csv: 휘뚜루마뚜루, 천상(天常)
    • Symbol.csv: 単位記号などを追加, ▴
  • 項目の修正
    • Noun.supplement.csv, Noun.supplement.place.csv: 관서03(關西)/관북(關北)/관동04(關東)/영서05(嶺西)を固有名詞に修正
    • Noun.supplement.csv: 의붓동생の漢字表記を修正,길쌈の品詞情報を修正(品詞3を「動作」に), 요절01(夭折)の同音異義番号を修正
    • Noun.supplement.place.csv: 경기02(京畿)の同音異義番号を追加
    • Noun.C.csv, Noun.proper.csv: 호남02(湖南)を固有名詞に修正
    • Noun.supplement.org.csv: 간월사지/감산사지の漢字表記を修正
    • Verb.supplement_1.over5.csv: 깁다の活用情報と項目を修正
    • Verb.supplement_3.std.csv: 덧깁다/짜깁다の活用情報と項目を修正.설다の同音異義番号01を追加
    • Adjective.csv: 설다01の同音異義番号を02に修正し,第Ⅱ語基の形に설으を追加(낯설고 물 설은 땅)
    • Adjective.supplement.csv: 물설다の第Ⅱ語基の形に물설으を追加
    • Suffix.csv: 질11(가위질, 손가락질…)の品詞情報を修正(品詞3を「動作」に)
    • rewrite.def: -률04/-율04(率)を一つの項目としてみなすよう記述

170529 - 0.5

handic-mecab-0.5_bin.zip / handic-mecab-0.5_src.tar.gz

本バージョンより,ソースを公開しました.インストールについてはHanDicのインストールを参照してください.

  • 現況:項目数 113,471,学習用データ 2,600文
  • 学習用データ追加(冒頭の100文)
    • BTEO0081.txt: 시간속의 도적
    • BTBE0237.txt: 금융 97년 1월호(雑誌)
  • 項目を削除
    • Verb.supplement_1.over5.csv: 붙여지다, 유명해지다, 따뜻해지다
    • Noun.supplement.csv: 무중력, 불성실, 불필요, 재편성, 지향점, 결정권, 통제권, 중요시
    • Adjective.csv: 에로틱하다
    • Modifier.csv: 독점화
    • Verb.C.csv: 여겨지다
    • Noun.C.csv: 소규모, 국제화
  • 項目を追加
    • Ending.csv: ㄹ테니까/EC, 리만큼/EC, 토록/EC
    • Noun.supplement.csv: 에로틱, 의총05, 극대01, 부제09(部制), 업적주의(業績主義), 불식04(拂拭), 공동선01(共同善)
    • Root.csv: 획일(劃一)
    • Verb.supplement_3.std.csv: 끝내주다/VV
    • Noun.supplement.org.csv: 조선노동당, 조선로동당, 노동당, 로동당, 세계무역기구, 경제협력개발기구, 스탭(staff)
    • Symbol.csv: +/SW, ■/SW
  • 項目の修正
    • Noun.supplement.csv: 살색に漢字表記を追加, 성실02(誠實)の品詞3を「状態」に修正
    • Noun.supplement.csv, Noun.supplement.place.csv: 영동03(嶺東)を固有名詞に修正
    • Noun.B.csv: 수염04の同音異義番号を03に修正
    • Noun.C.csv, Noun.proper.csv: 영남(嶺南)を固有名詞に修正

160508 - 0.4

handic-mecab-0.4_bin.zip

  • 現況:項目数 113,474,学習用データ 2,400文
  • 学習用データ追加(冒頭の100文)
    • BTEO0088.txt: 해남 가는 길
  • 単語を追加
    • Noun.supplement.csv: 동파05, 이동01, 이서03
    • Noun.supplement.place.csv: 충청(忠淸),韓国の空港(Wikipedia 분류:대한민국의 공항),北朝鮮の地名(북한네트/북한 지리を参照,漢字表記含む)
    • Noun.misc.csv: 터02に指定詞がついた形を「指定詞融合」として追加
    • Verb.supplement_3.std.csv: 어떡하다(어떡하/어떡해/어떡하여/어떡허) をVVとして追加
    • Ending.csv: -ㄴ데다, -는데다, -는데다가, -자니を追加
  • 項目の修正
    • Root.csv, Noun.supplement.csv: 다정01(多情)を語根から普通名詞に修正
    • Verb.B.csv: 머무르다の活用情報を修正
    • Noun.B.csv: 배구06の同音異義語番号を05に修正
    • Adverb.csv, Modifier.csv: 그만01を副詞から冠形詞に修正
    • Adjective.supplement.csv: 一部の項目で「表層形」(単語の項目そのもの)が統合型ハングルで,「出現形」が字母で記述されていたのを修正
    • Noun.supplement.place.csv: 外国の河川名などの漢字表記が統合型ハングルで記述されていたのを修正
    • Ending.csv, Ending.Particle.csv, Suffix.csv, Verb.supplement_3.std.csv: 一部の項目で「表層形」が統合型ハングルで記述されていたのを修正
  • 項目の削除
    • Noun.supplement.csv: 농사꾼, 추억거리, 동일계
    • Noun.supplement.place.csv: 都市の一部(市)で重複を削除
    • Verb.supplement_1.over5.csv: 맑아지다を削除

151216 - 0.3

handic-mecab-0.3_bin.zip

151104 - 0.2

handic-mecab-0.2_bin.zip

  • 外来語の追加(国語院外来語資料から一部のみ)
  • 接頭辞を含む語を分析して削除
  • 誤記の修正
  • 項目数 106,823

150518 - 0.1

handic-mecab-0.1_bin.zip

korean/mecab/changelog.txt · 最終更新: 2022/01/30 16:52 by yoshi