JADE 系列以安全评测为切入点,提出红队构建方法并发布高质量 Benchmark 数据集,深入剖析大模型的共性安全问题,挖掘风险生成机理并探索治理方案。
JADE 1.0 大模型靶向式评测
JADE 2.0 安全通用测试集
JADE 3.0 内生安全对齐
JADE 4.0 外挂安全对齐
JADE 5.0 图像合规评测
JADE 6.0 多模态幻觉评测
JADE 7.0 MCP安全评测
JADE 8.0 推理链安全防护
JADE 5.1 对抗安全评测