ツナガル問題集　情報処理安全確保支援士試験令和7年秋期午前Ⅱ モデルインバージョン攻撃

情報処理安全確保支援士試験令和7年秋期午前Ⅱ モデルインバージョン攻撃

出典：令和7年秋期午前Ⅱ 問5 分野：セキュリティ／情報セキュリティ

AIに対するモデルインバージョン攻撃に該当するものはどれか。

この問題を解く

解説

モデルインバージョン攻撃は、AIモデルに対して入力を工夫しながら推論を繰り返し、得られる出力結果を手掛かりにして、学習に用いられたデータの特徴や元データそのものを推測しようとする攻撃です。

個人情報を含む学習データが復元されたり、属性が推定されたりするリスクがあります。

したがって、アが適切です。

❌他選択肢が誤りの理由
イ：AIモデルに対して複数のデータを入力して得られた出力結果を観察することによって，当該AIモデルを模倣し，同等の性能をもつAIモデルを得る。
⇒モデル抽出（モデルスティーリング）に関する説明です。

ウ：学習時のデータセットに悪意あるデータを混入し，誤った学習をさせる。
⇒データポイズニングに関する説明です。

エ：何らかの方法でAIの実行ファイルを入手し，逆アセンブルや逆コンパイルによってAIのソースコードを得る。
⇒リバースエンジニアリングに関する説明です。

TSUNAGARU-ADVICE

モデルインバージョン攻撃は、AIモデルに対して入力と出力の関係を何度も観察しながら、学習に使われた元のデータを推測する攻撃です。

この攻撃の本質は、AIモデルそのものを盗むことでも、学習データを汚染することでもなく、出力結果を手掛かりに学習データの中身を逆算することにあります。模倣モデルを作る攻撃やデータ汚染攻撃とは目的が異なると整理すると判断しやすくなります。

科目Bでは、AIへの攻撃を名称で覚えるだけでなく、攻撃者が何を得たいのかで分類できることが重要です。学習データを推測したいのか、モデルを複製したいのか、学習を誤らせたいのかを切り分けて理解しておきましょう。