News

Guangdong BAIDU Special Cement Building Materials Co.,Ltd
— 新闻中心 —

缺乏数据阻止了AI All-One Machine的实施,专家建议

数据是人工智能的燃料和力量。从某种意义上说,人工智能的竞争进入了“数据决定性”阶段,任何拥有数据的人都将占据高处。但是,人工智能的当前发展面临数据挑战,例如疲劳培训,质量不稳定,难以确保隐私和安全性,难以确认和衡量数据权。在4月17日举行的第三届数字发展会议和数字经济峰会论坛上,CCF数据开发委员会(中国计算机协会)主任Lu Zhipeng介绍了其团队开发的新数据解决方案,尤其是基于数据元素的数据管理方法。 Lu Zhipeng表示,DeepSeek今年变得流行,提供了平等权利和人工智能的模式,以进入企业和社会。市场上推出了许多DeepSeek多合一机器。一些公司认为可以在Ser上删除DepSeek模型VER是一台多合一的机器,可以开箱即用。结果,在购买后,客户发现未达到说明中的结果,从而导致法律纠纷。如何部署重要的大型模型?数据起着重要作用。高质量的数据集是在AI模型中培训的主要支持,但施工过程很复杂。当前,许多数据集的构建集中在大型公司中,大型公司通常会根据自己的大型模型来构建数据集,从而导致数据集不足,而Architektura和不同数据集之间的标准也不同。缺乏用于开发高质量数据集的统一测量标准。数据集领域生成的数据涉及大量数据和复杂性,这需要出色的数据存储解决方案和强大的计算资源来支持存储,管理和生成数据。 currently,由于强调数据的重要性,因此数据共享确实是指。在2024年,用于模型培训的数据中有60%是合成数据。数据的质量会影响大规模模型开发的效率,因此有必要确保合成数据的可靠性,安全性和准确性。如何解决数据问题? Lu Zhipeng讨论了基于数据组件的数据管理方法。 “数据元素”是由许多相关字段生成的数据集或通过在处理后的数据删除后通过建模而生成的数据功能。数据组件和计算隐私,区块链,数字网络,数据空间等。LuZhipeng说,数据组件不是原始数据,而是主要数据产品。它们具有安全属性,价值特征和质量特征,可以解决数据权利,赞赏,定价,安全性,隐私问题以及数据质量和处理问题的确认。作为数据components realize the separation of data risk and security control, they also improve the data value density and realize the circulation product and large -scale application of data assets.Lu Zhipeng said his team finally formed an all-in-one solution by classifying the business logic of six-quality data construction including the Demand Demand Review and Survey Data Survey, Data Collection and Management, Field of Gloit Construction Data Sets, Construction Construction of Knowledge at the Base of Domain Base, Domain Model Proper Model of Domain and Training人事人员的适当领域模型,模型。在部署和方案微调之后,对逻辑和流利度做出响应的模型有所改善。此外,基于数据元素的数据管理已受到不想共享数据的公司部门的关注,并且支持数据孤岛以支持业务的数字化变化。
Tel
Mail
Map
Share
Contact