====== 大学入試センター試験 韓国語試験問題のXML文書化とその応用 ====== ===== 概要 ===== このページでは,[[http://www.dnc.ac.jp/|独立行政法人大学入試センター]]の実施する「大学入試センター試験」の「外国語」科目のうち,「韓国語」の試験問題をXMLにより電子文書化する試みを紹介します. ここでの内容を個人として自由に利用するのはかまいませんが,無断で再配布したり複製しないでください. なお,ここでの記述は既に拙論「XMLを利用した言語テストのデータ記述とその応用―大学入試センター試験『韓国語』を例に―」『朝鮮半島のことばと社会―油谷幸利先生還暦記念論文集』(東京:明石書店,pp.104-126,2009年11月)に発表しています. 内容に誤りなどがある場合には,管理者までご連絡ください. ===== XMLによる記述の方法 ===== ==== 目的と期待される成果 ==== この試みは,韓国語などの言語テスト過去問題を電子文書化し,検索や閲覧などが自由に行なえるようにすることを目的としています. このような電子文書化によるデータの蓄積は,以下のようなことが可能になると考えられます. * 過去問題を検索することで,過去の出題状況を把握できる * 索引の作成などが可能になる これらは,学習者には学習の効率化,問題の作成者には問題作成の効率化をもたらすといえます. ==== 電子文書化の対象と方法 ==== ここでは試験問題を電子文書化する試みとして,大学入試センター試験の「韓国語」を取り上げました.その理由として,(1)実施回数が少ない,(2)問題の構成が例年一定している,などの点が挙げられます. > 2002年からスタートした韓国語のセンター試験は,2008年12月現在,本試験7回と追試験1回が行なわれています. この試みでは,センター試験を電子文書化する方法として,XML(Extensible Markup Language)を利用します. XMLを利用することで,試験問題の構造をそのまま維持して記述することができ,検索や索引の作成などに,その情報を活用することができると考えるためです. そこで,過去に出題された試験問題の構造を分析し,その構造を大きく3段階のレベルに分類しました. * 「大問」:「第1問」から「第5問」まで,試験問題の中でも最も上位に位置する問題群. * 「中問」:「大問」はいくつかの「中問」から構成される.問題番号は「A」「B」…となる. * 「小問」:「中問」を構成する問題群.最も下位に位置する.問題番号は「問1」「問2」…となる. この構造を模式的に図示すれば,以下のようになります. * 第1問(大問) * A(中問) * 問1(小問) * 問2 * … * B * … * 第2問 * … こうした構造を基本に,問題の内容を電子データ化していきます.使用したタグについては次節を参照のこと. ==== 試験問題記述のXMLタグセット ==== 試験問題の構造を記述するに当たり,以下のタグを定義して用いました.属性のうち,[ ]で囲まれたものは随意的なものです. ^ ^ タグ tag ^ 属性 attribute ^ 備考 ^ |ブロック(箱型)要素 block element|mondai (問題,ルート要素)|year (年度),status (種別),filename (ファイル名)|試験問題の構造に関わる要素| |:::|q (大問)|no (番号),score (配点)| ::: | |:::|subq (中問)|[no (番号)]|:::| |:::|subsubq (小問)|no (番号)|:::| |:::|question (設問)| |:::| |:::|ex (例文)| |:::| |:::|di (会話文)| |:::| |:::|sp (話者)|name (名前)|:::| |:::|txt (読解文)| |:::| |:::|p (段落)| |:::| |:::|item (選択肢)|no (番号),[a (正答)]|:::| |:::|u (下線)|[no (番号)]|試験問題の見栄えに関する要素| |:::|note (注釈)|star (アスタリスク)|:::| |:::|blank (空白)|no (番号)|:::| |空要素 empty element|ref (注釈参照)|star (アスタリスク)|:::| |:::|fig (図表)|src (ソース),summary (要約)|:::| |:::|br (改行)| |:::| 上の表にあるタグのうち,いくつかは包摂関係が決まっています.例えば「subq (中問)」要素は「q (大問)」要素よりも上位に現れることはありません. 実際の記述については,[[https://porocise.sakura.ne.jp/korean/DNC/dnc.dtd|dnc.dtd]]や以下で紹介するファイルなどをご参照下さい. ===== 試験問題ファイル ===== 現時点で電子文書化が終了しているのは2004年実施の本試験~2008年実施の本試験までです.それぞれXMLファイルと,XSL変換により得られたHTMLを自由に閲覧することができます.変換に用いた[[https://porocise.sakura.ne.jp/korean/DNC/mondai.xsl|XSLスタイルシート]]と[[https://porocise.sakura.ne.jp/korean/DNC/dnc.dtd|DTD]]もご参照ください. ==== XML ==== [[https://porocise.sakura.ne.jp/korean/DNC/2002_main.xml|2002年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2002_sup.xml|2002年 追試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2003_main.xml|2003年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2004_main.xml|2004年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2005_main.xml|2005年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2006_main.xml|2006年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2007_main.xml|2007年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2008_main.xml|2008年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2009_main.xml|2009年 本試験]] ==== HTML ==== [[https://porocise.sakura.ne.jp/korean/DNC/2002_main.html|2002年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2002_sup.html|2002年 追試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2003_main.html|2003年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2004_main.html|2004年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2005_main.html|2005年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2006_main.html|2006年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2007_main.html|2007年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2008_main.html|2008年 本試験]], [[https://porocise.sakura.ne.jp/korean/DNC/2009_main.html|2009年 本試験]] ===== ファイルを利用するためのツール ===== 以下のツールはMicrosoft Windows上のInternet Explorer 6.0以降でのみ動作します.ご了承ください. * [[https://porocise.sakura.ne.jp/korean/DNC/re_search.html|正規表現を用いた試験問題の検索]] *大問ごとに複数年度の試験問題を表示 ==== 注意 ==== ツール利用の際に,WindowsXPなどで以下のような画面が現れた場合, {{:sekai:ie_notice_01.png?nolink|}} 情報バーをクリックして「ブロックされているコンテンツを許可」を選択してください. {{:sekai:ie_notice_02.png?nolink|}}