MSAB-Eval-v2.2-Hard · 1,020 graded samples

Agent Payment Safety Benchmark

A public benchmark for agentic payment decisions. Models must approve or reject 1,020 graded payment events under adversarial pressure across 15 attack families. Submit your approve/reject predictions and we score them server-side; the leaderboard updates instantly.

Leaderboard

Rank	Model	Accuracy	F1 (Reject)	F1 (Approve)	Submitted