OpenAI联合创立Appia基金会,旨在开发开放模块化规范,将国际标准和框架转化为AI价值链的实用评估标准。此举构建信任层,让第三方能验证合规性,促进国家和国际机构间的互信。

日益强大的AI模型能增强网络防御、加速科学发现、扩大专业知识的获取。但如果其能力被误解、防护措施不足,或政府缺乏应对所需的信息,也会带来安全与安保风险。要安全、自信地实现这些好处,社会需要具备技术和治理能力的机构来评估、保护和治理日益强大的系统。
为此,OpenAI协助创立了Appia基金会,由Linux基金会托管。Appia将开发开放、模块化的规范,致力于将国际标准和已有框架转化为AI价值链各环节的实用评估标准。其工作有助于建立一个关键缺失的信任层,让第三方能够检查标准符合性——当模型、基础设施和应用由不同组织开发时,可以产生更清晰、更可复用的证据。通过这项工作,Appia将帮助创建一种共享的技术语言,使国家和国际机构能够信任彼此的工作。
我们视这一举措为强化高级AI系统所需机构、标准和评估实践的更广泛工作中的重要下一步。
我们最近发布的前沿AI民主治理蓝图为这项工作提供了路线图。它呼吁建立持久的美国框架、强化AI标准与创新中心(CAISI),并在政府层面制定更全面的韧性战略。该蓝图也认识到前沿风险具有国际性。各国应合作开发兼容的安全框架、建立共享风险发现的信任渠道,并协调应对事件。
国家能力与国际合作应相互强化。CAISI这样的强有力机构可以发展技术专长、评估前沿系统,并支持独立的评估生态系统。一个有能力的国家机构网络可以建立共享方法、认可可信证据,并为政府提供共同应对所需的技术共识。
标准是这一努力的核心,且必须基于可信的评估实践和技术严谨性。在我们的可信第三方评估共享手册中,我们列出了前沿评估日益需要公开的内容:测试的系统、工具访问和评估框架、激发能力的方法、可用资源以及验证结果的检查。我们还通过与美国CAISI和英国AISI的测试合作将这些原则付诸实践,他们在前沿能力评估和生物滥用防护方面的工作带来了系统的具体改进。这项工作为建立可标准化、可比较的性能检查实践奠定了基础。
这些实践补充了OpenAI更广泛的安全基础设施。我们的准备框架是我们定义和管理高级AI系统最严重风险(包括内部实践)的基础。我们的前沿治理框架将相关部分应用于公开的治理文件,聚焦于特定监管义务,包括风险评估、模型报告、安全控制、事件响应以及外部专家意见的整合。这些文档共同将广泛承诺转化为可验证和改进的运营实践。
Appia的工作瞄准下一个挑战:让这些实践在组织、司法管辖区和供应链之间实现互操作。
通过这些论坛,包括现在的Appia,我们的目标是将前沿开发的经验转化为开放的、基于技术的实践,供政府、公司和独立评估者跨司法管辖区使用。
原文链接:OpenAI Blog
本文由前途科技编辑整理
免费获取企业 AI 成熟度诊断报告,发现转型机会
关注公众号

扫码关注,获取最新 AI 资讯
3 步完成企业诊断,获取专属转型建议
已有 200+ 企业完成诊断