ツナガル問題集　情報処理安全確保支援士試験令和6年秋期午前Ⅱ AIによる画像認識のアルゴリズムを悪用した攻撃

情報処理安全確保支援士試験令和6年秋期午前Ⅱ AIによる画像認識のアルゴリズムを悪用した攻撃

出典：令和6年秋期午前Ⅱ 問2 分野：セキュリティ／情報セキュリティ

AIによる画像認識において，認識させる画像の中に人間には知覚できないノイズや微小な変化を含めることによってAIアルゴリズムの特性を悪用し，判定結果を誤らせる攻撃はどれか。

この問題を解く

解説

Adversarial Examples攻撃は、AIが認識する画像や音声などに、人間にはほとんど分からない微小なノイズや変化を加えることで、AIの判定結果を誤らせる攻撃です。

画像認識AIに対して、標識や物体を誤分類させる例などが代表的です。

したがって、イが適切です。

❌他選択肢が誤りの理由
ア：Adaptively Chosen Message攻撃
⇒暗号において、攻撃者が選んだメッセージに対する署名や暗号結果を利用して解析する攻撃です。画像認識AIへの微小ノイズ攻撃ではありません。

ウ：Distributed Reflection Denial of Service攻撃
⇒DRDoS攻撃の説明です。多数の反射サーバを悪用して、標的に大量の応答を集中させる攻撃です。

エ：Model Inversion攻撃
⇒AIモデルの出力を手掛かりに、学習データやその特徴を推測する攻撃です。画像にノイズを加えて誤認識させる攻撃ではありません。

TSUNAGARU-ADVICE

Adversarial Examples攻撃は、画像などの入力データに人間には分かりにくい微小な変化を加え、AIの判定結果を意図的に誤らせる攻撃です。

この攻撃の本質は、AIモデルから学習データを推測することではなく、入力データを細工して誤分類を引き起こすことにあります。画像認識で「人間にはほとんど分からないノイズ」「判定結果を誤らせる」とあれば、Adversarial Examples攻撃と判断しやすくなります。

科目Bでは、AIへの攻撃を名称で覚えるだけでなく、学習時を狙うのか、入力時を狙うのか、出力から情報を推測するのかを切り分ける力が問われます。Adversarial Examples攻撃は、推論時の入力を細工して誤判定させる攻撃として整理しておきましょう。