二维码
文文衫

扫一扫关注

当前位置: 首页 » 新闻资讯 » 工程百科 » 正文

开源人工智能定义终于有了它的第一个发布候选版本——一个妥协

放大字体  缩小字体 发布日期:2025-04-12 08:02:38    来源:本站    作者:admin    浏览次数:90    评论:0
导读

      让开源和人工智能(AI)站在同一战线上并不容易。只要问问开放源代码促进会(OSI)就知道了。开源定义管理组织OSI两年来

  

  

  让开源和人工智能(AI)站在同一战线上并不容易。只要问问开放源代码促进会(OSI)就知道了。开源定义管理组织OSI两年来一直致力于创建开源人工智能定义。不过,该组织一直在取得进展。它的开源AI Definition现在已经发布了它的第一个候选版本RC1。

  最新的定义旨在澄清围绕开源人工智能经常引起争议的讨论。它规定了人工智能系统必须被视为开源的四项基本自由:未经许可将系统用于任何目的的能力,研究其工作原理的能力,为任何目的修改系统的能力,以及在修改或不修改的情况下共享系统的能力。

  到目前为止,一切顺利。

  

  然而,OSI选择了一个关于训练数据的折衷方案。认识到共享完整的数据集并不容易,目前的定义需要“关于用于训练系统的数据的足够详细的信息”,而不是完整的数据集本身。这种做法旨在平衡透明度与实际和法律考虑。

  事实证明,最后一句话让一些人难以接受。从他们的角度来看,如果所有的数据都不开放,那么基于这些数据的AI大语言模型(LLM)就不可能是开源的。

  OSI将这些观点总结如下:“有些人认为,对所有训练数据的全面、不受限制的访问(没有任何区别)是至关重要的,否则将损害人工智能系统的完全可再现性、透明度和安全性。这种方法将把开源人工智能降级为只能在开放数据上训练的人工智能。”

  他们没有错。

  是的,理想情况下,OSI同意所有的培训数据都应该共享和公开。但是,有四种不同的数据类型:开放数据、公共数据、可获得数据和不可共享数据。“每个国家的法律要求都不一样。所有这些都必须以法律允许的形式分享。”

  简而言之,“数据很难分享。允许对数据进行培训的法律通常会限制数据的再共享,以保护版权或其他利益。隐私规则还赋予人们控制自己最敏感信息的合法能力,比如对自己健康状况的决定。”

  发布候选版本还涉及人工智能系统的其他关键组件。它要求在osi批准的许可下提供用于培训和运行系统的完整源代码。同样,模型参数和权重必须在开放条件下共享。

  OSI执行董事斯特凡诺?马弗利(Stefano Maffulli)强调了这一定义在打击“开放清洗”(open washing)方面的重要性。“开放清洗”指的是企业声称开放,却没有达到真正的开源标准。“如果一家公司说它是开源的,它必须带有开源定义所包含的价值观。否则,它只会令人困惑。”

  在奥地利维也纳举行的欧洲开源峰会上,maulli告诉我,不只是开源纯粹主义者对提议的OSI人工智能定义不满意。另一个“是公司,他们把自己的培训计划、培训方式、收集和过滤数据集以及创建数据集视为商业机密。他们不想释放这些。他们认为我们要求太多了。这是我们在90年代听到的一个古老的争论,当时微软不想发布他们的源代码或构建指令。”

  此外,RC1还有两个新特性。首先,开源AI代码必须足以让下游接收者理解机器语言训练是如何完成的。培训是创新发生的地方,根据OSI的说法,这就是“为什么你没有看到公司发布他们的培训和数据处理代码”。鉴于目前的知识和实践状况,这是有意义地分叉人工智能系统所必需的。

  最后,新文本承认创作者可以明确要求开源人工智能代码、数据和参数的copyleft条款,无论是单独的还是捆绑的组合。这方面的一个例子是,如果“拥有训练代码和数据集权利的联盟决定使用将两者联系在一起的法律条款和类似copyleft的条款来分发捆绑代码和数据。”

  请注意,OSI继续说,“这种法律文件还不存在,但这种情况是合理的,值得考虑。”

  不要认为这个定义已经完成了。它不是。的确,OSI不打算增加新功能。从现在开始,他们和他们的合作伙伴将致力于修复错误。OSI承认可能仍然存在“重大缺陷,可能需要对文本进行重大重写”。但是,主要的焦点将放在附带的文档上。

  此外,OSI“意识到,在我们热衷于解决需要提供数据但模型所有者有充分理由不能提供数据的问题时,我们未能明确‘如果你能共享数据,你就必须共享’的基本要求。”

  如果一切顺利,OSI计划在2024年10月28日的all Things Open会议上发布开源人工智能定义的最终1.0版本。坚持住,伙计们。我们就快到了。

 
(文/admin)
打赏
免责声明
• 
部分文章来源于网络,我们均标明出处,如果您不希望我们展现您的文章,请与我们联系,我们会尽快处理。
0相关评论
 

(c)2023-2023 www.whsdu.com All Rights Reserved

赣ICP备16007947号-10