CBTの問題不足を解消。「アイテムバンク」大量生産と品質管理の秘訣

「学習アプリのシステムは完成した。しかし、中身に入れる問題が全然足りない」「紙の試験をCBTに移行したら、あっという間に問題が流出して枯渇してしまった」
教育業界のデジタル化が進む中、多くのプロジェクト担当者が直面するのが、この「コンテンツ(問題データ)不足」という課題です。
紙の試験であれば、年に数回、決まったセット数を作れば事足りました。しかし、CBT(コンピュータ試験)やタブレット教材の世界では、求められる問題数が桁違いになります。システム開発ベンダーは「箱」は作ってくれますが、「中身」までは作ってくれません。
本記事では、CBT化の成否を握る「アイテムバンク(問題在庫)」の構築に焦点を当て、数千問規模の問題を短期間で、かつ品質を均質化して大量生産するための「テスト制作の生産管理」について解説します。
なぜ、CBTでは「大量の問題(アイテム)」が必要なのか?

まず、デジタル化すると、なぜこれほどまでに問題数が必要になるのか。その構造的な理由を整理します。
「ランダム出題」と「暗記対策」
CBTの最大のメリットは、いつでもどこでも受験できることです。しかし、一定期間に何度も受験できる環境では、固定された問題セットだとすぐに答えを丸暗記されてしまいます。
これを防ぐには、受験者ごとに異なる問題を出題する「ランダム出題(ガチャ方式)」の実装が不可欠です。
例えば、1回のテストで50問出題する場合、毎回異なるセットを組むためには、その背後に最低でも10倍〜20倍の「プール問題(ストック)」が必要になります。つまり、1つの試験区分につき500〜1,000問の在庫が最低ラインとなるのです。
「アダプティブ学習」の要求
さらに進んだ「アダプティブ学習(適応学習)」では、生徒の正答率に合わせて、次に出す問題の難易度をリアルタイムで変化させます。
間違えた子には、基礎に戻る問題
正解した子には、応用力を問う問題
これを実現するには、「超易しい」から「超難しい」まで、階段状に細かくレベル分けされた膨大な問題バリエーションが求められます。
紙のテキストなら「基本・標準・発展」の3段階で済みましたが、アダプティブの世界では10段階、20段階の粒度が必要になることも珍しくありません。
CBT化における問題数の試算例
具体的に、どれくらいの問題数が必要なのか試算してみましょう。
【中規模のCBT試験の場合】
試験時間:60分
出題数:50問
年間受験回数:月1回×12ヶ月
問題の重複回避:過去3回分は重複させない
必要問題数:50問 × 3セット × 3ヶ月分 = 最低450問
さらに、予備問題や改訂用のストックを含めると、600〜800問程度が現実的な必要数となります。
これがアダプティブ学習システムの場合、難易度別に5段階×各単元となるため、必要数は2,000〜5,000問規模に膨れ上がります。
「素人の大量生産」が招く、品質崩壊のリスク

「数が足りないなら、手の空いている講師やアルバイトに書かせればいい」
そう考えて、数合わせで作問を急ぐと、CBTとしての信頼性を根底から揺るがす事態に陥ります。
難易度のバラつきと「不公平」の発生
ランダム出題において最も重要なのは、「どの問題セットが当たっても、難易度が等価であること(等化)」です。
A君に出たセットは簡単で、B君に出たセットは激ムズだった場合、評価としての公平性が保てません。
しかし、寄せ集めのライターで作問すると、個人の感覚で「これは難易度Bだろう」と判定してしまいます。ある人の「普通」は、ある人の「難問」かもしれません。
この「主観的な難易度のブレ」こそが、アイテムバンク構築における最大のリスクです。
メタデータ(タグ情報)の不備
CBTでは、1問1問に正確な「メタデータ(属性情報)」が付与されていなければなりません。
単元コード
難易度パラメーター
目標解答時間
認知レベル(知識・理解・応用)
これらのタグ付けが適当だと、システム側で「図形問題ばかりが出題される」「計算問題が出ない」といったバグのような出題挙動を引き起こします。
作問とは、単に問題文を書くことではなく、こうした「データベース用の構造化データ」を作ることと同義なのです。
著作権リスクの見落とし
大量生産を急ぐあまり、既存の問題集からの無断転載や、著作権処理が必要な文章の無許可使用といった法令順守リスクが発生することもあります。
特にCBTは多数の受験者が利用するため、一度問題が発生すると影響範囲が大きく、サービス停止や損害賠償のリスクにもつながります。
短期間で数千問を作る「アイテムバンク」構築の品質管理術

では、品質の揃った数千問の問題を、どうやって短期間で用意すればよいのか。エデュコンが実践している、大規模プロジェクトのための制作フローをご紹介します。
1. 「項目反応理論(IRT)」を意識した仕様策定
本格的なCBTでは、「項目反応理論」を用いて、問題の難易度や識別力を統計的に処理します。これに耐えうる問題を作るためには、作成段階から厳格なガイドラインが必要です。
正答率のシミュレーション
「この問題は上位20%の層しか解けない」といった狙いを数値化して発注する
選択肢の設計
誤答(ディストラクター)にも意味を持たせ、「なぜ間違えたか」を分析できるようにする
エデュコンでは、専門スタッフが「ただの問題」ではなく、「統計データとして機能するアイテム」としての仕様書を策定します。
2. 「工場ライン化」された制作体制
数千問を作るには、個人の職人芸ではなく、工場のようなライン生産体制が必要です。
ライター(原案作成)
教科知識を持つ数十名のスタッフをアサイン
チェッカー(事実確認)
別部隊がファクトチェックを行う
ディレクター(品質管理)
全体を統括する専任社員が、難易度やトーン&マナーを統一する
エデュコンには各教科の専任ディレクターが常駐しているため、外部ライターからの納品物をそのまま右から左へ流すことはしません。必ず社内でフィルタリングを行い、「エデュコン品質」に規格化してから納品します。
3. 第三者による「ブラインド解答」で難易度をキャリブレーション
人間が作る以上、難易度の設定ミスは必ず起きます。そこで重要になるのが、予備知識のない第三者が実際に解いてみる「ブラインド解答(試答)」です。
実際に解くのに何秒かかったか?(目標時間とのズレ確認)
想定した難易度と感じた難易度にギャップはないか?
この実測データをフィードバックし、難易度ランクを修正(キャリブレーション)してからデータベースに登録します。このひと手間が、CBT稼働後のトラブルを未然に防ぎます。
4. メタデータの一元管理と品質保証
アイテムバンクの構築では、問題本体だけでなく、メタデータの正確性が生命線です。
エデュコンでは、以下の情報を問題ごとに厳密に管理します。
単元分類コード:学習指導要領に準拠した分類
難易度パラメーター:ブラインド解答による実測値
目標解答時間:実測データに基づく設定
認知プロセス:知識・理解・応用・分析・評価・創造の6段階
著作権情報:使用許諾の有無、出典情報
改訂履歴:いつ、誰が、何を修正したか
これらの情報をデータベースで一元管理することで、システムへの実装がスムーズになり、運用開始後のメンテナンスも容易になります。
事例:エデュコンによるアイテムバンク構築パターン

パターンA:検定試験のCBT移行(年2回→随時実施へ)
課題
年2回のペーパー試験を、テストセンターでの随時実施に変更したい
解決策
過去問のストックだけでは足りないため、過去問の「類題」を大量生産
成果
難易度や出題形式を過去問と完全に一致させた「クローン問題」を2,000問作成。受験機会の拡大により、受験者数が1.5倍に増加
制作期間
6ヶ月(仕様策定1ヶ月、制作4ヶ月、検証1ヶ月)
パターンB:大手塾のタブレット教材開発
課題
中学生向けのAI学習ドリルを開発したが、基礎レベルの問題が不足している
解決策
教科書レベルの基礎問題(計算、単語、一問一答)を5,000問規模で新規作成
成果
基礎固めのための反復練習が可能になり、AIのアダプティブ機能が正常に動作するようになった。生徒の学習継続率が30%向上
制作期間
8ヶ月(仕様策定・サンプル作成2ヶ月、本制作5ヶ月、検証1ヶ月)
パターンC:企業の社内資格試験のオンライン化
課題
全国の拠点で一斉実施していた社内資格試験を、各自のタイミングで受験できるようにしたい
解決策
既存の紙の試験問題を分析し、難易度を3段階に分類。各レベルごとに300問ずつ、合計900問を新規作成
成果
受験機会が年2回から随時に拡大。受験者の利便性が向上し、資格取得率が20%アップ
制作期間
4ヶ月(既存問題分析1ヶ月、制作2.5ヶ月、検証0.5ヶ月)
アイテムバンク構築のスケジュールと予算の目安

大規模なアイテムバンク構築を計画する際、多くの担当者が気になるのが「いつまでに」「いくらで」できるのか、という点です。
制作期間の目安
小規模プロジェクト(500問程度):3〜4ヶ月
中規模プロジェクト(1,000〜2,000問):6〜8ヶ月
大規模プロジェクト(3,000〜5,000問):10〜12ヶ月
※仕様の複雑さ、検証の厳密さにより変動します
費用対効果の考え方
アイテムバンクの構築費用は、一見すると高額に感じるかもしれません。しかし、以下の点を考慮すると、十分な投資対効果があります。
長期使用が可能:一度構築すれば5〜10年使用できる資産
問題流出のリスク軽減:十分な在庫があれば定期的な入れ替えが可能
システム開発費の無駄防止:システムだけあっても問題がなければ稼働できない
品質トラブルの回避:出題ミスや不公平な評価による信頼失墜を防止
結論:システム(箱)を作る前に、コンテンツ(中身)の確保を
デジタル化プロジェクトにおいて、システム開発は予算もスケジュールも明確になりやすいものです。しかし、「問題データ作成」は後回しにされがちで、ローンチ直前になって「中身がない!」とパニックになるケースが後を絶ちません。
アイテムバンクの構築には、システム開発と同じくらい、あるいはそれ以上の期間と労力が必要です。
CBT化成功のチェックリスト
プロジェクトを成功させるために、以下のポイントを確認してください。
必要な問題数を正確に試算できているか
問題制作の開始時期は適切か(システム開発と並行して進めているか)
難易度の均質化のための検証体制があるか
メタデータの管理方法が確立されているか
著作権処理の体制は万全か
運用開始後の問題追加・改訂の計画があるか
システムが完成したその日から、最高品質の教育サービスを提供できるように。大規模な作問・データ制作は、教育専門の「製造ライン」を持つエデュコンにお任せください。
まずは、「いつまでに、どんな問題を、何問必要か」。貴社のプロジェクト計画を、無料相談で共有させていただけませんか?
アイテムバンク構築のプロフェッショナルが、最適な制作計画とお見積もりをご提案いたします。
この記事を書いた人 / 監修
エデュコン教材制作チーム
創業以来、500社以上の教育機関様の教材制作を支援。
入試問題の傾向分析から、最新の学習指導要領(情報Iなど)への対応まで、現場の声を反映した「使いやすく、効果の出る教材」づくりを徹底サポートしています。
教育・IT・編集のプロフェッショナルが集まる専門チームが記事を監修しています。


















