情報処理安全確保支援士試験 令和7年秋期午前Ⅱ モデルインバージョン攻撃
出典:令和7年秋期 午前Ⅱ 問5
分野:セキュリティ / 情報セキュリティ
AIに対するモデルインバージョン攻撃に該当するものはどれか。
- ア:AIモデルに対して入力データを調整しながら出力結果の取得を繰り返し行って解析し,学習に用いた元のデータを推測する。
- イ:AIモデルに対して複数のデータを入力して得られた出力結果を観察することによって,当該AIモデルを模倣し,同等の性能をもつAIモデルを得る。
- ウ:学習時のデータセットに悪意あるデータを混入し,誤った学習をさせる。
- エ:何らかの方法でAIの実行ファイルを入手し,逆アセンブルや逆コンパイルによってAIのソースコードを得る。
TSUNAGARU-ADVICE
まず押さえたいこと
モデルインバージョン攻撃は、AIモデルに対して入力と出力の関係を何度も観察しながら、学習に使われた元のデータを推測する攻撃です。
迷ったときの判断軸
この攻撃の本質は、AIモデルそのものを盗むことでも、学習データを汚染することでもなく、出力結果を手掛かりに学習データの中身を逆算することにあります。模倣モデルを作る攻撃やデータ汚染攻撃とは目的が異なると整理すると判断しやすくなります。
科目Bにつなげるために
科目Bでは、AIへの攻撃を名称で覚えるだけでなく、攻撃者が何を得たいのかで分類できることが重要です。学習データを推測したいのか、モデルを複製したいのか、学習を誤らせたいのかを切り分けて理解しておきましょう。
モデルインバージョン攻撃は、AIモデルに対して入力を工夫しながら推論を繰り返し、得られる出力結果を手掛かりにして、学習に用いられたデータの特徴や元データそのものを推測しようとする攻撃です。
個人情報を含む学習データが復元されたり、属性が推定されたりするリスクがあります。
したがって、アが適切です。
❌他選択肢が誤りの理由イ:AIモデルに対して複数のデータを入力して得られた出力結果を観察することによって,当該AIモデルを模倣し,同等の性能をもつAIモデルを得る。
⇒モデル抽出(モデルスティーリング)に関する説明です。
ウ:学習時のデータセットに悪意あるデータを混入し,誤った学習をさせる。
⇒データポイズニングに関する説明です。
エ:何らかの方法でAIの実行ファイルを入手し,逆アセンブルや逆コンパイルによってAIのソースコードを得る。
⇒リバースエンジニアリングに関する説明です。