科技云报到:以数据“价值三角”为擎,探索数据治理实践路径


科技云报到原创。

过去四十年,经济发展主要来自于土地、劳动力、农业技术、工业技术等要素的充分释放。面向数字经济时代,无论是大模型、自动驾驶还是具身智能、人形机器人,数据已然成为继土地、劳动、资本和技术之后的又一种战略资产和新型生产要素,其打破了传统生产要素的质态,促进各类要素融合创新,成为发展新质生产力的优质生产要素。

随着数据要素的深入应用,各领域对海量数据的挖掘和运用无疑正预示着新一波生产力的增长和智能化浪潮的到来。然而,由于标准缺失、系统壁垒、安全担忧等原因,限制了数据共享与价值释放。

为此,数据治理的重要性日益凸显,成为激活数据价值、实现数据价值转化的关键议题之一。


数据要素市场亟待开发

随着新一代信息技术与数字技术不断发展,数据正成为基础性生产要素,关键价值愈发凸显。根据国家数据局发布的《数字中国发展报告(2023年)》显示,2023年我国数据生产总量达32.85ZB,同比增长22.44%,这标志着数据资源的丰富性和多样性正在不断提升。

尽管当前仍有海量的数据沉淀在各大系统中,但数据要素已成为数据时代的新引擎,其崛起之势已不可阻挡。随着以生成式AI、大数据、区块链、Web3.0等新技术作为基础性和驱动性的技术力量,与制造、医疗、教育、交通、农业等领域深度融合,可以充分释放数据要素价值。

在数据要素流通的过程中,既要解决数据供给侧的“最初一公里”,又要解决数据释放价值的“最后一公里”。目前,数据要素市场尚存两大难题,既要让高质量数据“供得出”,也要让各类数据要素“流得动”。

对于数据本身而言,数据的准确性是保证其价值的关键。然而,在实际应用中,由于数据采集、存储、处理等环节存在不规范操作,导致数据出现错误、遗漏、重复等问题,严重影响了数据的准确性。其次,数据的完整性对于数据分析和决策至关重要。如果数据不完整,可能会导致分析结果出现偏差,从而影响决策的科学性。第三,数据的时效性直接关系到决策的及时性和有效性。如果数据过时,可能会导致决策失误,给企业和社会带来不必要的损失。如果企业在制定营销策略时,使用了过时的市场数据,就会导致营销策略与市场实际需求脱节,影响了企业的市场竞争力。

要想让数据要素发挥最大价值,其中一个关键方向便是推动数据要素的流通。数据要素的流通就如同为产业注入新的活力源泉,它能够打破数据孤岛,让数据在不同的环节、不同的企业之间高效流动起来。当数据不再被局限于某一特定领域或企业内部,而是在更大的范围内实现共享与交互时,其价值将得到进一步的释放。

为了更快培育数据要素市场,不久前国家数据局等17部门印发《“数据要素×”三年行动计划(2024—2026年)》进一步细化了数据要素发展的路径和目标,强调了数据要素在未来经济发展中的战略地位和重要作用。

《行动计划》提出,到2026年底,数据要素应用广度和深度大幅拓展,在经济发展领域数据要素乘数效应得到显现,打造300个以上示范性强、显示度高、带动性广的典型应用场景,涌现出一批成效明显的数据要素应用示范地区。

数据本身是抽象的,只有将其应用于具体的业务场景,才能发挥价值。例如,在零售行业,通过分析消费者的购买行为数据,企业可以更好地了解消费者需求,从而优化产品组合和营销策略;在医疗领域,利用患者的健康数据,可以为患者提供个性化的治疗方案。因此,构建多样化的应用场景,是实现数据价值化的基础。

加快场景化建设步伐,对于推动中国数据要素价值化具有重要意义。通过构建丰富的应用场景,不仅可以充分发挥数据的潜在价值,还可以促进数据的交易和流通,带动相关技术和产业的发展,为经济高质量发展注入新的动力。


数据要素的三次价值释放

数据的生产、应用、流通形成了“价值三角”,三角彼此互为支撑、互相影响。

公开数据显示,中国数据量规模从2022年的23.88ZB,将增长至2027年的76.6ZB,年均增长速度CAGR达到26.3%,登顶全球第一,其中企业数据量占比达到76%。而最新调研显示,企业认为有60%的业务数据是有价值的,但这些数据中仅有56%被实际分析,这意味着仍有更多的数据价值有待挖掘释放。

随着数据要素在产业的应用程度加深,数据要素投入生产的途径可分为三次价值释放过程,即:数据支撑业务贯通、数据推动数智决策、数据流通对外赋能。

数据的一次价值释放体现在支撑政府、企业等组织的业务系统运转,实现业务间的贯通。首先,数据经由各个业务系统的设计产生,经过业务系统的规范,在特定范围内实现标准化数据的不断积累,逐渐汇聚成可利用的资源。其次,这些数据支撑着业务系统的正常运转,通过系统对数据的读写,实现业务初步的标准化、自动化管理和运营。最后,一定程度标准化的数据具备了通用性,数据得以打破线下与线上的界限,打破业务流程间的界限,甚至有打破组织内部业务领域间界限的能力。总之,业务系统搭建起来、数据在系统中运转起来时,数据就已经在生产活动中释放出价值。

在第二阶段中,通过数据的加工、分析、建模,揭示出更深层次的关系和规律,使生产、经营、服务、治理等环节的决策更智慧、更智能、更精准。一方面,通过对大量数据的管理和分析,组织内部的决策者可以实现“用数据说话、用数据决策”,运用数据呈现出的关键指标与信息评估发展态势,即时有效防范、化解风险,创新行动方略;另一方面,数据分析也直接嵌入系统,与业务紧密融合,即时的数据挖掘、分类、预测、聚类等直接向业务赋予智能化的价值。

第三阶段使不同来源的优质数据在新的业务需求和场景中汇聚融合,流通赋能是数据要素价值飞跃的一个关键。一方面,数据具有规模报酬递增效应,越大规模、越多维度的数据融合汇聚创造的价值越大,企业自有数据与外部数据的充分融合可以实现数据应用价值的最大化。另一方面,数据具有的低成本复制性可以改变要素投入生产的结构,更大规模、更广范围的数据要素利用不会增加过多额外成本,但可以产生超额利润。这个阶段数据变成更加像资产一样可以流动起来,这个阶段特点是流通和赋能,是数据更好流动是让数据价值逐步更大发挥的关键。

如何做好让数据更好流动?蚂蚁数科首席技术官王维认为,在整个流动过程中要解决三个关键环节的问题和挑战,他把三个关键环节归纳为“源、建、流”。

dc4416f55db4f316958cb7884ba74da5.jpeg

“源”指数据源。为了获取数据,很多企业和行业会采购、引入、导入或与更多合作伙伴一起共享数据。但在人工智能时代,数据除了对物理世界描述以外,更多的合成数据也层出不穷,数据的形态也多种多样,因此数据源环节更多挑战也扑面而来。

“建”是把原始数据如何更好地加工成可用数据。这个过程中系统、组织、标准、流程需要紧密协同,海量数据和丰富场景为数据平台的安全性、智能性和可靠性带来前所未有的挑战。

“流”指数据流通环节,这个过程需要构建共享平台和机制,不仅促进企业内数据共享内循环,也要激励企业间数据相互交互和融合,实现外循环。同时,还需要依托人工智能、隐私计算、区块链等相关技术,保证全链路的安全可信、智能,进而让数据流动起来,其价值才能够发挥到最大化。


激活数据要素价值潜能

对于如何激活数据要素潜能,王维在近日举行的2024 Inclusion外滩大会上也给出自己的观点。他表示,融合技术创新是数据要素价值释放的基石。作为蚂蚁集团的科技商业化板块,蚂蚁数科将在数据治理、数据安全、数据流通、数据应用等领域持续深耕,将技术与场景结合,提供更多扎实有效的技术产品与服务,促进数据安全高效流通,加速数据要素价值赋能千行百业。

大会期间,蚂蚁数科正式对外发布一站式智能数据开发与治理平台DataFab,助力企业高效管理数据资产。据了解,DataFab平台基于蚂蚁集团在数据中台领域的最佳实践打造,提供从数据引入、架构规范、研发及数据资产管理的一站式服务,助力企业打造标准化、资产化、服务化及智能化的大数据体系与数据中台,高效实现数据资产的生产、治理与价值释放,驱动业务数智化转型与创新发展。

王维介绍,DataFab是汇集了蚂蚁集团整个大数据治理体系的“集大成者”,其数据量级已经超过2000PB。在整个过程中,DataFab已经锤炼出平台高性能、高可用的能力。同时,DataFab平台可以依托于蚂蚁大数据、大模型的基础能力,能够推出更多智能化的能力,让取数、用数变得更加方便、快捷,大大降低企业用数的门槛,节约数据获取、使用和管理成本。

目前,DataFab已经全面支撑了蚂蚁集团旗下数十个业务主体、超过2000PB级的数据。通过海量数据及复杂场景下的实践锤炼,DataFab平台在支撑数据量、系统高可用行及智能化能力方面取得了业务领先的成果。近日,在中国信通院举办的数据中台解决方案测试中,DataFab通过全部283项评测项,达到优秀级标准。

除了DataFab,蚂蚁数科还发布了新一代AI数据标注产品。随着生成式人工智能爆发,高质量数据集成为大模型落地产业的关键瓶颈,围绕大模型的数据供给已然成为一块充满潜力的市场。

4add4c79883105efc17d672e3ab54e8a.jpeg

今年5月,AI数据标注初创企业Scale AI完成10亿美元F轮融资,其估值更是达到138亿美元。但不同于ScaleAI的是,蚂蚁数科提供的不仅是AI数据标注服务,产品线还包含数据加工与合成服务。

众所周知,数据标注在AI模型训练中扮演着极为重要的角色,是构建高效智能系统的第一步。然而,传统数据标注方式往往依赖人工操作,面临成本高、效率低等问题。随着大模型时代的到来,数据量呈指数级增长,企业和组织在非结构化数据的处理上频频遭遇瓶颈。如何在保证标注质量的前提下提升标注效率,已经成为一个亟待解决的行业难题。

蚂蚁数科此次发布的新一代数据标注产品采用了先进的AI算法,具备模块化服务和算法调度能力,能够对“人和任务”进行高效匹配,以降低标注的复杂性。这款产品让企业能够更加灵活地应对多模态大模型和行业定制大模型在数据标注上的需求,以及文本、图像、音频、视频等多种类型的标注需求。根据实测数据显示,使用该AI标注工具后,标注效率提升超过40%。

为了提升产品的专业性,蚂蚁数科还配备了一支近万人的人工标注团队,其中90%以上为垂直专业领域的高阶标注人才。这一策略不但提升了数据服务的质量,也为AI算法的优化提供了现场把控和反馈保障,进一步助力企业在数据使用上取得实质性进展。

数据的力量磅礴苍劲,创新的道路永无止境。数据作为新型生产要素,与云计算、人工智能等技术的共同驱动下,正日益走向成熟应用,从物质生产到终端消费,从城市发展到乡村振兴,数据加速推动了生产生活、经济发展和社会治理方式深刻变革。但即便是前沿如大模型技术,也很难成为激活数据要素潜能的唯一解。为此,蚂蚁数科将持续投入区块链、物联网、隐私计算、AI等多种数字技术创新,以技术为引擎,激发数据要素价值加速释放。


结语

展望未来,随着技术的迭代和应用场景的拓展,数据要素市场将迎来更广阔的前景。但企业要想在未来的市场竞争中脱颖而出,就必须紧跟行业发展趋势,加大相关技术投入,挖掘数据价值,只有这样才能在数据要素市场中抢占先机,实现可持续发展。


【关于科技云报到】

企业级IT领域Top10新媒体,又名科技云报道。聚焦云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。原创文章和视频获工信部权威认可,是世界人工智能大会、数博会、国家网安周、可信云大会与全球云计算等大型活动的官方指定传播媒体之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/148068.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

低代码消息中心——提升应用交互效率的利器

在数字化飞速发展的今天,应用程序已成为我们日常生活与工作中不可或缺的一部分。随着应用功能的日益复杂,用户对于实时、高效的信息交互需求也日益增长。在这一背景下,低代码消息中心应运而生,以其便捷、灵活的特性,为…

LIN总线CAPL函数—— 设置报头同步间隔场长度(linSetBreakLength)

🍅 我是蚂蚁小兵,专注于车载诊断领域,尤其擅长于对CANoe工具的使用🍅 寻找组织 ,答疑解惑,摸鱼聊天,博客源码,点击加入👉【相亲相爱一家人】🍅 玩转CANoe&…

BiGRU——提高基于 RNN免疫反应预测的准确性

导言 论文地址:https://arxiv.org/abs/2208.04314 深度学习在免疫学领域的应用 人们有一种叫做免疫系统的系统来保护自己免受外来有害物质(包括病毒和细菌)的侵害。免疫系统是指包括白细胞在内的人体内各种元素相互配合以保卫身体的系统&a…

【UE5】将2D切片图渲染为体积纹理,最终实现使用RT实时绘制体积纹理【第三篇-着色器光照】

在前两篇文章中,我们分别拆解描述了实现原理,并进行了基础的着色器制作。在这一篇文章中,我们将为它实现光照效果 简单的概述 当光线射入体积时,随着光线射入距离的增加,体积中的介质会对光线产生反射和吸收作用&…

【已解决】ElementPlus 的 el-menu 组件如何用 js 控制展开某个子菜单,并在其他组件中控制使用呢?

文章目录 需求几次探索官网寻找线索(解决办法) 需求 我如何用代码来实现 ElementPlus 的菜单的展开和收缩呢? 几次探索 尝试通过找到节点之后,使用 click 事件,失败了 // 伪代码如下 const handleFindNodeAndClick …

力扣:用队列模拟栈

题目描述 解题 class MyStack {Queue<Integer> queue;int size 0;public MyStack() {queue new LinkedList<Integer>();}public void push(int x) {queue.offer(x);size;}public int pop() {for(int i 0; i < size - 1; i){queue.offer(queue.poll());}size…

LLM - 理解 多模态大语言模型(MLLM) 的 幻觉(Hallucination) 与相关技术 (七)

欢迎关注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://spike.blog.csdn.net/article/details/142463789 免责声明&#xff1a;本文来源于个人知识与公开资料&#xff0c;仅用于学术交流&#xff0c;欢迎讨论&#xff0c;不支持转载。 多模态…

Perfetto-Android开发分析神器(性能、内存、线程调度)

一、Perfetto内存分析 1.1Prefetto内存分析优势 Prefetto相比其他的sysmem、sysinfo或者追踪堆栈的方式进行内存相关问题的追踪具有更强的可视化以及调用层级更加详细的优势&#xff0c;很多时候能精确到某一个结构体&#xff0c;更加便于在内存泄漏环境下的问题定位。 1.1.1…

数据驱动农业——农业中的大数据

橙蜂智能公司致力于提供先进的人工智能和物联网解决方案&#xff0c;帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、埃域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。 橙蜂智农的智慧农业产品涵盖了多方面的功能&…

美信监控易的优势:长期稳定运行

美信监控易作为一款运维产品&#xff0c;其显著的优势在于能够长期稳定运行。在IT运维领域&#xff0c;系统的稳定性是至关重要的&#xff0c;它直接关系到企业的业务连续性和客户满意度。美信监控易通过其自研的数据库和先进的监测技术&#xff0c;确保了系统的高可用性&#…

Mysql高级篇(中)——事务篇

事务篇 一、数据库事务概述&#xff08;1&#xff09;概念&#xff08;2&#xff09;事务的处理原则&#xff08;3&#xff09;事务的特性(ACID)&#xff08;4&#xff09;事务的创建 二、如何使用事务三、事务隔离级别&#xff08;1&#xff09;分类&#xff08;2&#xff09;…

每日一练:二叉树的中序遍历

94. 二叉树的中序遍历 - 力扣&#xff08;LeetCode&#xff09; 一、题目要求 给定一个二叉树的根节点 root &#xff0c;返回 它的 中序 遍历 。 示例 1&#xff1a; 输入&#xff1a;root [1,null,2,3] 输出&#xff1a;[1,3,2]示例 2&#xff1a; 输入&#xff1a;root …

探索Allure Report:提升自动化测试效率的秘密武器

一.使用 Allure2 运行方式-Python # --alluredir 参数生成测试报告。 # 在测试执行期间收集结果 pytest [测试用例/模块/包] --alluredir./result/ (—alluredir这个选项 用于指定存储测试结果的路径) # 生成在线的测试报告 allure serve ./result 二.使用 Allure2 运行…

计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-15

计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-15 1. Towards the holistic design of alloys with large language models Z Pei, J Yin, J Neugebauer, A Jain - Nature Reviews Materials, 2024 利用大型语言模型实现合金的全面设计 摘要 文章讨论了大型…

基于单片机的自行车智能辅助系统设计

文章目录 前言资料获取设计介绍功能介绍设计程序具体实现截图目 录设计获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师&#xff0c;一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 …

构建数据分析模型,及时回传各系统监控监测数据进行分析反馈响应的智慧油站开源了。

AI视频监控平台简介 AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒&#xff0c;省去繁琐重复的适配流程&#xff0c;实现芯片、算法、应用的全流程组合&#xff0c;从而大大减少企业级应用约95%的开发成本。增…

[论文精读]Towards Deeper Graph Neural Networks

论文网址&#xff1a;Towards Deeper Graph Neural Networks | Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining 英文是纯手打的&#xff01;论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和…

在云渲染中3D工程文件安全性怎么样?

在云渲染中&#xff0c;3D工程文件的安全性是用户最关心的问题之一。随着企业对数据保护意识的增强&#xff0c;云渲染平台采取了严格的安全措施和加密技术&#xff0c;以确保用户数据的安全性和隐私性。 云渲染平台为了保障用户数据的安全&#xff0c;采取了多层次的安全措施。…

ROS机器人书的一些思考

思考 写一本书不难&#xff0c;写一本有价值的书很难&#xff0c;在语言大模型如此发展的今天写一本有价值的书&#xff0c;难上加难。 如何能让学生或读者发自内心的渴望打开一本书&#xff0c;尤其是在这个数字媒体技术如此发达的时代。 这个问题从一开始从事相关工作到如…

解决shop-vite项目打包被限制问题

本人网上找了一个好看的项目 shio-vite 项目源码 &#xff0c;并通过其他方式获取到源码&#xff0c;但是打包出现了以下问题。 问题图片一&#xff1a; 问题图片二&#xff1a; 问题图片三&#xff1a; 需要code和解决方式私可以留言哈