美国商务部公开征求关于GenAI数据准备意见和建议

数据是人工智能的核心。如果没有良好的数据,开发有用的人工智能模型的可能性微乎其微。考虑到这一点,美国商务部上周发布了一份公开请求,就如何更好地为构建生产式人工智能(GenAI)模型准备众多公共数据集进行意见征求。这份公开请求是为了解决当前人工智能领域面临的一个关键问题:缺乏高质量、多样化的公共数据集。这些数据集对于培养机器学习模型、促进创新和推动人工智能应用的发展至关重要。商务部希望通过这份公开请求收集到各方的意见,以便更好地理解如何建立和管理公共数据集。他们希望听到

美国商务部公开征求关于GenAI数据准备意见和建议

美国商务部于4月17日发布了一份信息征询书(rfi),要求“行业专家、研究人员、民间社会组织和其他公众成员”就如何开发“支持人工智能的开放数据集”提供帮助。

商务部自称为“美国数据机构”,负责收集、存储和分析有关美国的各种数据,包括有关经济、人口和环境的数据。对商业数据中心的快速搜索显示了超过122,000个可公开访问的数据集,其主题从气候和天气到专利再到人口普查信息。

这部分内容旨在随着多年来技术的变化和改进,该部门一直向私营企业和公共机构寻求帮助,以保持其数据管理和数据共享活动达到当前技术标准。通过机器可读格式或通过Web服务和API以电子方式访问数据都是使其数据服务适应时代的例子。

现在,随着GenAI革命的到来,该部门正在寻找最合适的数据定位,以便使用它来构建人工智能模型。

美国商务部首席数据官Oliver Wise在信息征询书中写道:“如今,随着人工智能技术的出现,商务部正面临一场新的技术变革,这些技术为用户提供了更好的信息和数据访问。”“商业对生成式人工智能(GenAI)应用程序特别感兴趣,它可以消化不同来源的文本、图片、音频、视频和其他类型的信息,以产生新的内容。GenAI和其他人工智能技术为商业等数据提供者和包括政府实体、行业、学术界和美国人民在内的数据用户带来了机遇和挑战。”字数不要超过482

“智能”表明,商业部门面临的最大挑战是让人工

“最近的人工智能系统接受了大量数字内容的训练,并根据内容的上下文生成响应。”“然而,这些系统并没有以一种有意义的方式真正‘理解’文本。”

未来的人工智能系统必须能够访问的数据不仅是机器可读的,而且是“机器可理解的”。今天的人工智能系统受限于它们对大量非结构化数据存储的依赖,这些存储依赖于底层数据,而不是基于理解进行推理和判断的能力。

商务部正在寻求帮助,以便在考虑到GenAI技术这些基本限制的情况下共享数据。它正在为可读和可理解的数据寻找新的数据传播标准,包括许可标准。在数据可访问性和检索方面,商务部希望得到关于如何使其数据更易于访问的建议,例如通过API或“网络爬虫”。

特别在如何使用利用元数据的知识图谱来更好地将人类术语与数据联系起来方面有需求。它还希望得到采用标准本体(如Schema.org或NIEM)的方向,以及知识图谱如何帮助“协调和链接”本体和词汇表。

该部门希望社区能够就如何推进这些数据标准化工作提供意见,同时在数据完整性、质量、安全性和道德方面保持最高标准。

Wise要求有兴趣的各方将他们的建议通过电子邮件发送,主题行为“AI-Ready开放数据资产信息征询书”。并希望在七月十六日之前收到有关这些议题的意见或反馈。

以上就是美国商务部公开征求关于GenAI数据准备意见和建议的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1413027.html

(0)
上一篇 2025年2月17日 19:53:35
下一篇 2025年2月17日 19:53:59

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 如何在PHP中使用OAuth进行数据访问

    如何在php中使用oauth进行数据访问 OAuth是一种用于授权的开放标准,允许用户向第三方应用程序授予访问其数据的权限,而不需要将用户名和密码提供给第三方应用程序。在PHP中使用OAuth进行数据访问非常方便,本文将介绍如何使用OAut…

    编程技术 2025年2月22日
    100
  • 创造无限可能的生成式人工智能:跨越智慧边际的突破

    目前,越来越多的中国企业正积极探索生成式ai技术,应用大语言模型来实现更多的创新和效率提升。大多数企业开始使用现成的基础模型进行实验,但对于许多企业来说,更大的价值在于使用自有数据定制或微调模型,以满足企业独特的需求。 参一江湖公众号,提供…

    2025年2月22日 AI智能
    100
  • access是什么软件

    Microsoft Access 是一款关系型数据库管理系统 (RDBMS),用于存储、管理和分析数据。它主要用于数据管理、导入/导出、查询/报表生成、用户界面设计和应用程序开发。Access 优势包括易用性、集成数据库管理、强大灵活、与 …

    2025年2月22日
    100
  • grt币可以长期持有吗

    长期持有 grt 币的潜力取决于 the graph 生态系统的发展、治理参与、质押奖励和未来的应用。然而,投资者应考虑市场波动、竞争、监管不确定性和技术风险等因素,并根据自己的投资目标和风险承受能力做出明智的决定。 GRT 币是否适合长期…

    2025年2月22日
    100
  • link币未来前景如何

    LINK币未来前景:LINK币作为Chainlink预言网络的原生加密货币,在智能合约和数据经济中拥有光明前景:增长的采用率:LINK币被更广泛采用,并与科技巨头合作。DeFi作用:LINK币在DeFi生态系统中至关重要,支持预言机服务。长…

    2025年2月22日
    100
  • link币行情怎么样

    LINK币是Chainlink网络的原生代币,用于奖励为智能合约提供安全可靠数据访问的节点提供者。影响LINK币价值的因素包括:1.供需关系;2.加密货币市场趋势;3.Chainlink网络的增长。此外,LINK币价值还可能会受到竞争对手的…

    2025年2月22日
    100
  • 超融合技术的优点

    超融合技术的优点在于其简化了it基础设施的管理和部署。 这并非空洞的宣传。我曾参与一个小型金融科技公司的项目,他们之前使用的是传统的IT架构,服务器、存储、网络设备各自为政,维护起来极其复杂。 升级一次系统,需要协调多个厂商,耗时耗力,常常…

    2025年2月22日
    100
  • Chainlink联合美国结算所与摩根大通等将基金数据引入链上!LINK暴涨超20%

    美国证券集中保管结算公司(dtcc),作为全球最大的结算系统之一,联合预言机龙头chainlink及包括摩根大通在内的多家美国主要金融机构,成功完成了一项试点项目。此计划旨在促进传统金融基金的代币化。 这项名为Smart NAV的试点项目,…

    2025年2月22日
    100
  • 软件开发人员的网络安全要点

    软件开发的复杂性不断增加,采用混合团队的做法,远程开发和现场开发同时进行。尽管这种模式提高了灵活性、速度和可扩展性,但同时也带来了网络安全挑战。远程工作时,开发人员需要确保与现场工作时相同的安全水平。此外,由于代码在远程设备上构建并与集中存…

    2025年2月22日
    100
  • 内存条的作用

    内存条,简单来说,是电脑的临时存储器。它负责储存电脑正在运行的程序和数据。 没有它,电脑就无法执行任何任务。 这就好比一个厨师在厨房工作:菜谱(程序)和食材(数据)都需要放在案板上(内存条)才能被处理。如果没有案板,厨师根本无法烹饪。 我曾…

    2025年2月22日
    100

发表回复

登录后才能评论