このページでは,独立行政法人大学入試センターの実施する「大学入試センター試験」の「外国語」科目のうち,「韓国語」の試験問題をXMLにより電子文書化する試みを紹介します. ここでの内容を個人として自由に利用するのはかまいませんが,無断で再配布したり複製しないでください.
なお,ここでの記述は既に拙論「XMLを利用した言語テストのデータ記述とその応用―大学入試センター試験『韓国語』を例に―」『朝鮮半島のことばと社会―油谷幸利先生還暦記念論文集』(東京:明石書店,pp.104-126,2009年11月)に発表しています.
内容に誤りなどがある場合には,管理者までご連絡ください.
この試みは,韓国語などの言語テスト過去問題を電子文書化し,検索や閲覧などが自由に行なえるようにすることを目的としています. このような電子文書化によるデータの蓄積は,以下のようなことが可能になると考えられます.
これらは,学習者には学習の効率化,問題の作成者には問題作成の効率化をもたらすといえます.
ここでは試験問題を電子文書化する試みとして,大学入試センター試験の「韓国語」を取り上げました.その理由として,(1)実施回数が少ない,(2)問題の構成が例年一定している,などの点が挙げられます.
2002年からスタートした韓国語のセンター試験は,2008年12月現在,本試験7回と追試験1回が行なわれています.
この試みでは,センター試験を電子文書化する方法として,XML(Extensible Markup Language)を利用します. XMLを利用することで,試験問題の構造をそのまま維持して記述することができ,検索や索引の作成などに,その情報を活用することができると考えるためです. そこで,過去に出題された試験問題の構造を分析し,その構造を大きく3段階のレベルに分類しました.
この構造を模式的に図示すれば,以下のようになります.
こうした構造を基本に,問題の内容を電子データ化していきます.使用したタグについては次節を参照のこと.
試験問題の構造を記述するに当たり,以下のタグを定義して用いました.属性のうち,[ ]で囲まれたものは随意的なものです.
タグ tag | 属性 attribute | 備考 | |
---|---|---|---|
ブロック(箱型)要素 block element | mondai (問題,ルート要素) | year (年度),status (種別),filename (ファイル名) | 試験問題の構造に関わる要素 |
q (大問) | no (番号),score (配点) | ||
subq (中問) | [no (番号)] | ||
subsubq (小問) | no (番号) | ||
question (設問) | |||
ex (例文) | |||
di (会話文) | |||
sp (話者) | name (名前) | ||
txt (読解文) | |||
p (段落) | |||
item (選択肢) | no (番号),[a (正答)] | ||
u (下線) | [no (番号)] | 試験問題の見栄えに関する要素 | |
note (注釈) | star (アスタリスク) | ||
blank (空白) | no (番号) | ||
空要素 empty element | ref (注釈参照) | star (アスタリスク) | |
fig (図表) | src (ソース),summary (要約) | ||
br (改行) |
上の表にあるタグのうち,いくつかは包摂関係が決まっています.例えば「subq (中問)」要素は「q (大問)」要素よりも上位に現れることはありません.
実際の記述については,dnc.dtdや以下で紹介するファイルなどをご参照下さい.
現時点で電子文書化が終了しているのは2004年実施の本試験~2008年実施の本試験までです.それぞれXMLファイルと,XSL変換により得られたHTMLを自由に閲覧することができます.変換に用いたXSLスタイルシートとDTDもご参照ください.
以下のツールはMicrosoft Windows上のInternet Explorer 6.0以降でのみ動作します.ご了承ください.
ツール利用の際に,WindowsXPなどで以下のような画面が現れた場合,
情報バーをクリックして「ブロックされているコンテンツを許可」を選択してください.