AI 透明度通知
Entrust 身份验证服务人工智能(以下简称 AI)透明度通知
本通知旨在为您提供所使用 AI 系统的透明信息,概述该系统的功能、局限性、偏见、数据使用实践及安全措施。 我们希望为您提供所需的知识,助您理解此类 AI 的工作原理、其能力边界以及数据处理方式。 通过提供这种透明度,让您能够就与 AI 技术的互动制定明智的决策。
当您阅读本通知时,请务必仔细核查 AI 提供的重要信息。我们的技术旨在辅助而非取代专家判断。对于可能涉及健康、财务或法律后果的决策,我们强烈建议在采取行动前咨询具备相应资质的专业人士或寻求独立法律意见。
Entrust 身份验证 (IDV) 技术
Entrust 的身份验证 (IDV) 产品使客户能够远程处理、验证和注册用户。 该系统的输入包括身份证明文件的照片/视频以及申请人的照片/视频。 Entrust 的决策引擎利用这些输入返回接受/考虑信号,同时提供相应的上下文以及如何产生结果的详细说明。
IDV 产品由四大核心技术领域驱动,每个领域均依赖于 AI 系统。 这四大领域包括:(1) 面部相似度;(2) 生物特征防欺骗与活体检测(面部图像);(3) 文档自动数据提取;(4) 身份证件防伪技术。 这些领域分别承担数据提取、生物特征匹配、文件验证和生物特征验证的任务,所有这些均需正向结果才能返回接受信号。 虽然为每个技术领域提供服务的多个 AI 系统共同构成 IDV 应用程序,但需要注意的是,IDV 应用程序中也包含大量非 AI 算法。 正是 AI/ML 算法与非 AI 算法(即“传统”计算机代码)的结合,才共同构成 Entrust 的产品。
预期用途和 AI 功能
Entrust 负责任地使用 AI 可实现更快速、更一致的数据处理,从而为最终用户提供更流畅、更安全的体验。 我们的系统旨在尽可能减少对个人数据的人工审核,从而帮助减少不必要的最终用户信息泄露。
AI 广泛用于身份验证 (IDV) 产品组合,以实现以下目标:
- 判断政府身份证件的照片或视频是否真实,或是否存在篡改和/或欺诈迹象。
- 对证件类型进行分类,例如护照或驾驶执照。
- 从证件图像或视频中提取相关信息,例如姓名或出生日期
- 判断最终用户提供的面部生物特征是否真实有效,且是否与身份证明文件所示人员相符。
我们的解决方案旨在识别可能表明真实性或潜在欺诈的模式,帮助组织制定明智的信任与安全决策。 结果应作为风险指标而非最终结论进行解读,并应与其他控制措施和验证程序结合使用。
数据类型
- 政府身份证照片/视频
- 面部生物特征照片/视频
使用的 AI/模型类型
所有应用程序均采用深度学习模型,具体范式视应用程序而定。 这些模型通常经过预先训练,再基于我们自己的数据集进行微调,以优化性能(准确性和公平性)。
- 二元分类模型: 文件欺诈检测与生物特征活体检测采用二元分类模型,评估输入图像/视频为真实(而非以任何欺诈方式篡改,例如深度伪造或故意遮挡等)的概率。
- 多类分类模型: 文档分类采用多类分类模型,根据输入的文档图像返回最可能的文档类型。
- 视觉语言模型 (VLM): 文档提取利用视觉语言模型 (VLM) 实现文档智能处理
- 人脸识别模型: 我们的应用程序采用监督式深度学习模型,对实时拍摄的自拍照或视频与政府签发的身份证明文件中的图像或先前拍摄的自拍照/视频进行人脸比对。 该模型为每张人脸图像生成数值表示(即“嵌入向量”),并通过测量嵌入向量间的相似度判断两张图像属于同一个体的可能性,此过程亦称为基于嵌入向量的 1:1 或 1:N 生物特征验证。
我们如何训练我们的 AI
我们的 AI 模型使用系统化基准测试协议,针对性能(准确性和公平性)进行优化。 这些模型经过训练和微调,然后根据从最终用户数据收集的数据集进行全面基准测试。 我们使用从生产中统一采样的质量检查 (QC) 数据,以获得给定模型真实误判/拒绝率的无偏估计值。 此外,我们采用名为人机协同 (HITL) 的反馈流程,由人工分析师评估模型输出结果,依据 Entrust 负责任的 AI 原则持续优化模型性能。
负责任的数据使用原则
为帮助您了解使用 Entrust 的 AI 系统时如何处理您的数据,请注意以下关键点:
- 我们对 AI 的使用涉及处理最终用户的个人数据。 我们仅在具备有效法律依据的情况下处理此类个人数据。 要了解有关我们使用个人数据的更多信息,请参阅 IDV 产品隐私通知。
- 我们仅允许因工作职责需使用 AI 模型及相关数据的人员进行访问。
- 我们对传输中和存储中的数据进行加密。
偏见
潜在的继承性偏见
与大多数基于真实世界数据训练的 AI 系统类似,我们的模型可能反映出用于训练和改进数据集的继承性偏见。 培训数据的多样性因国家/地区和人口群体而异,这可能导致某些人群或文件类型在性能表现上存在差异。 我们积极监控这些因素,并采取数据再平衡、重新训练和公平性测试等措施,以减少不同用户群体间意想不到的性能差异。
继承性偏见的潜在来源包括:
- 训练数据构成: 早期模型开发中使用的公开可用的数据集可能会夸大某些区域、面部特征或成像条件。
- 图像质量和文档设计:照片质量、印刷标准、全息图或安全特性的差异可能影响不同类型文件的性能表现。
- 采集条件: 照明、相机设备或图像采集方式的差异,可能影响不同环境下的模型结果。
偏见缓解措施
Entrust 的 AI 系统经过开发和持续优化,旨在最大限度减少无意偏见,确保不同人口统计群体和地理区域获得公平结果。 为减轻偏见,我们应用以下方法:
- 在模型训练过程中采用平衡且自适应的采样技术,以确保区域和人口统计特征的多样性。
- 定期开展跨国家/地区、跨洲际及跨性别的性能评估,以识别并解决差异问题。
- 动态采样调整可增加对代表性不足群体的训练重点,以提升准确性。
- 对真实世界特定领域的数据(例如自拍照与文档的对比)进行微调,以增强模型在不同图像类型和条件下的泛化能力。
这些措施可显著缩小性能差异;然而,没有任何 AI 模型可完全摆脱偏见。 我们始终致力于在负责任的 AI 开发过程中保持透明度、持续评估和不断改进。
有关我们承诺以负责任的方式开发创新技术的更多信息,请参阅我们的 ICO 沙盒报告。
局限性
我们的 AI 可能存在某些限制:
- 范围: 我们的 AI 专门用于防范欺诈行为
- 语言: 我们的 AI 支持基于拉丁字母和阿拉伯字母的多语言输入
- 上下文:我们的 AI 会将输入内容评估为欺诈或真实。
- 幻觉: 在极少数情况下,如果源文档中的信息提取不准确,我们的 AI 可能会产生不一致的结果。
人为监督/人机协同
Entrust 利用人机协同 (HITL) 模型为客户提供身份验证服务,这是我们 AI 系统运行的核心。 在此过程中,经过专业培训的分析师会定期审查、验证并优化模型输出结果,以提升其性能表现,并确保其符合 Entrust 负责任的 AI 原则的要求。
在模型投入生产前,专家会通过分析仪表板和受控的 A/B 测试评估其性能,以确保结果符合我们对质量和公平性的标准。 人工审核员还负责监督数据标注与验证工作,确保用于改进系统的训练数据准确且具有代表性。 对于某些产品,当 AI 检测到异常或不确定的输入时,人类专家仍可实时评估结果。
反馈
我们欢迎您提供反馈意见,以便改进我们的 AI 系统。 如需提供潜在错误的详细信息或分享您的体验,请发送邮件至 [email protected]。
客户控制
我们认为,客户应完全了解和控制其数据,帮助他们向最终用户清晰说明其数据如何助力我们改进服务。
我们的身份验证 (IDV) 系统采用机器学习技术,以提升准确性、检测异常情况并优化整体性能。 参与这些流程完全由客户自主决定。 我们的 IDV 基于选择退出原则运行。 如果客户选择退出,其检查结果将被排除在任何机器学习活动之外,包括模型训练。 客户完全控制最终用户数据是否可用于协助开发和优化我们的服务,并可随时通过账户配置进行自定义设置。
如果客户选择退出机器学习,也将被自动排除在我们的质量控制 (QC) 流程之外。 作为我们的标准操作,每月将随机抽查约百分之三 (3%) 的检查结果进行审核,以验证准确性并支持持续改进。 这些质量控制见解有助于增强我们模型的可靠性,但选择退出会使客户的检查结果脱离此反馈循环。
即使客户选择不参与机器学习或质量控制,我们的系统仍可能出于分析、基准测试和统计报告等合法业务目的处理假名化及聚合数据。 汇总的数据不包括任何个人身份信息 (PII)。
持续改进
我们将偏见监测和公平性评估视作持续进行的过程。 我们的 AI 模型会定期进行审查和更新,以提升性能并解决问题。 当发现差异时,我们会调整训练数据、采样策略或校准参数,以提升平衡性和准确性。
这些举措是我们对负责任的 AI 发展更广泛承诺的一部分,旨在确保我们的验证技术在所有用户群体中保持尽可能高的准确性和透明度。 我们每年或在发生重大变更时更新本通知,以确保您获得最新信息。
上次更新时间: 2025 年 10 月 28 日