“我们积累了很多数据,这些数据很有商业价值,有人上门寻求合作,但我们比较谨慎,一直没有对外合作。”一位大型互联网公司员工表示,“现在政府在大力推动数据要素市场,国有平台可能会率先突破”。
截至目前,今年已有江苏省数据局、四川省数据局、广东省政务服务和数据管理局、天津市数据局等10个数据主管部门正式挂牌。
去年10月份国家数据局正式揭牌,在此前后,多省市数据管理机构相继挂牌,政策条文和管理机构都已成型。
政策推动数据市场的力度不断加大。不过,关于这个市场依然有不少疑问,诸如数据资产大户心态谨慎、数据权属有疑问、入表缺少实践、数据如何流通以及交易如何定价等。
谨慎
人们的衣食住行生老病死和各种交易,都会产生数据,这些数据盘活起来,可以推动效率提升,成为数据资产。
“我们的客户有很多是世界500强,这些企业会生产出很多数据,比如客户购物数据等,他们委托我们对数据进行加工,加工之后,这些数据才会发挥作用。”一家从事数据处理的上市公司工作人员表示,“比如销售数据交给我们,我们经过分析,对平台上的商户很有用,这些商户可以根据这些数据进行有针对性的广告投放,让投放更有效率。”
这已经是比较成熟的模式。在国家提出要建立数据要素市场之前,这个市场早就存在,从数据生产、搜集、加工、销售到存储都有专业公司。
“不过这个市场也有不规范的地方,一些数据来源不明,每年都有因此而进入监狱的。”上述工作人员表示。
这也是数据市场的难题之一,有大量涉及个人隐私的黑产存在。一些头部企业可能挖掘了数据潜力,但也可能不精确,比如在某个平台搜索并下单了某产品,在其他网络还会碰到该平台投放的相同商品广告,这就造成了浪费。一些头部企业拥有大量个人信息,但很难将这些个人信息提取出来,比如社交媒体广告并不精准,需要依赖用户反馈作出调整。
有媒体报道,2018年初腾讯总办会上,公司总裁刘炽平提出一个数据共享计划,通过搭建一个中台集中资源来提升腾讯的算法能力、商业化能力等。字节跳动被认为是将这套体系发挥得最为极致的公司。腾讯数据精华主要在微信。不过与会者最终认为这件事情涉及数据安全,有风险。
这牵涉到数据到底归谁所有的问题。曾经有一个公司在后台修改用户储存的资料,引起轩然大波。一般而言,用户拥有数据隐私。很多平台在用户刷脸时都会调用身份信息,但是这些信息并不归平台所有,用户消费会在购物网站留下记录,用户在某个平台上传播分享沟通信息,也会留下记录,但这些记录都涉及隐私。平台可以掌握用户各种信息,但是这些信息是否能用来商业开发,这一点并不明确。
“我们对此很谨慎,大平台做事情首先要合规,宁可走得慢一点。”上述大型互联网公司员工表示。
价值
除了个人和企业数据,还有一种是公共数据,行政机关以及事业单位、公共事业国企等公共机构在履行职责或者提供公共服务都会产生数据。比如人口统计、各种经济数据、公立医院的病例数据、地铁客流量数据、民政局的结婚离婚数据等等。
目前,地方政府在试探此类数据商业化的可能性。去年年末,湖南衡阳就试图拍卖当地政务数据资产的独家使用权。
当地负责此项业务的工作人员表示,他们探索数据要素资产商业化已有3年时间,主要客户是到当地开拓市场的商业机构,特别是银行、保险等金融机构。
“我们开发了几十个产品,包括交通类的、医疗类的、金融类的,针对某些金融机构开发出风控模型和基础模型,可以给这些金融机构引流,新增贷款,控制不良率,我们可以用对赌的方式来收费。”该工作人员表示。
据了解,当地政务数据主要来源于地方国土局、房产部门、法院、工商、交通、民政等系统,可以查询客户名下是否有车辆,是否有违法记录,查询公积金、养老金、银行贷款、罚款记录等,如果要做抵押贷款,不用再去国土局等部门查询,只用网上登记就可以评估贷款。
金融机构愿意使用这些数据,是因为可以减少调查成本,减少坏账。该工作人员举例,有地方金融机构坏账率原来位居全省前列,现在大幅下降超过九成,所以这些金融机构愿意以新增贷款的千分之二到千分之三支付费用。一些原来单个机构掌握的数据,因为交叉共享,也变得非常快捷高效。
在这个过程中,政府会将数据脱敏,保护客户隐私,只会给出计算结果。
对于衡阳数据资产挂牌底价18.02亿元。上述工作人员解释,这是25年时间的运营权,是按照未来收益法进行评估。据介绍,已经有同类城市实现了协议转让,有一个地方人口和面积只有衡阳一半,30年数据运营权的价格是38亿元;另外一个城市经济总量和衡阳相差不大,10年数据运营权价格为19.8亿元。
据了解,当地政府并没有将独家运营权交给外来主体,而是转让给当地的国资平台。通过转让,地方会多出一份不菲的资产。
这么做的政策依据主要是2022年年底出台的《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(业内称“数据20条”),以及去年8月财政部发布《企业数据资源相关会计处理暂行规定》明确数据资源的确认范围和会计处理适用准则。
财政部文件确认数据可以作为资产入表,地方国资平台是企业运营,入表后就可以增加地方政府净资产。
这也让地方政府增加了化债手段。这是土地财富之外的一个新增量,提高了地方政府化解债务风险的能力。
不过,衡阳当地最终取消了公开招标,工作人员称接到上级通知,上级肯定了当地的做法,但是希望更稳妥推进此事。
脱敏
“数据20条”指出,对数据的利用,要以维护国家数据安全、保护个人信息和商业秘密为前提,尤其对于公共数据,要在保护个人隐私和确保公共安全的前提下加以利用。
脱敏是在数据要素话题中被频繁提到的关键词,就是在保护隐私的情况下开发商业价值。一位从业者表示,微信个人信息要保护,但某条图文下的点赞量基本上可以做到脱敏。脱敏是削减掉用户的个人信息,调取某个群体的共性。
北京市京师(上海)律师事务所数字经济中心主任杨振律师分析,数据的原始形式表现为客观事物未经处理和简化的直接记录,在人们无意识的行为活动中产生。对于这些原始数据提供者而言,作出浏览、关注、点赞、转发之类行为的难度极低,分摊到每单位数据上的成本也可以忽略不计,并且在这一过程中只是生产出了作为行为附属品的分散数据,它们的使用价值并不高;再加上这些数据并不是严格意义上由生产性劳动所创造,因而它们也不具有价值。而原始数据在经过采集、聚合、加工等处理流程后,其可用性大幅提升,演化为能够发挥经济效益的数据资源。
数据脱敏是数据处理过程中的一项技术手段,能够有效规避敏感信息泄露、被窃取、被滥用所带来的不利后果,保障数据安全合规的高效利用和流通。目前,最为常见的隐私计算技术,就是在不暴露数据本身的前提下,实现数据的共享、互通、计算,最终产生超出数据本身的价值,保障数据在流通融合过程中的“可用不可见”。
入表
在数字经济时代,数据已成为继土地、劳动力、资本、技术之外的第五种“生产要素”。随着数据要素市场不断推进,围绕数据资产化的探索明显提速。
数据资产入表是个很重要的历史变化。业内对此看法众多,有一种典型看法是,如果数据并表而没有应用,那就只是增加了资产而已,对应可能还会增加负债。有用的数据要能产生价值,包括自家生产和对外采购,都需要有知识产权,方可以进行售卖,如果通过研发形成数据产品而有人买单,也可以形成资本摊销。在其他场景可重复利用、可变现的数据才有价值。
杨振律师表示,数据要素具有规模报酬递增、非竞争性、低成本复用等特点,具有强大的乘数效应,能够赋能经济社会诸多领域。国家数据局前一段时间发布了《“数据要素×”三年行动计划(2024-2026)征求意见稿》,从其中重点提及领域亦可一窥端倪。
目前来看,有商业潜力的领域主要包括:智能制造、智慧农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、智慧城市、绿色低碳等。
中国电子商会秘书长彭李辉预计,“十四五”期间,我国数据要素市场规模复合增速将超过25%,到2025年规模有望接近2000亿元。
数据要素市场主要由供给方、需求方、服务方、监管方组成。数据供给主要包括政府为主的公共数据、企业数据和个人数据三大类,供给方需为交易标的物质量及合规性负责,中间服务方包括运营方和第三方服务商,可提供技术及流通服务,包括算法、算力服务等,帮助供需两侧做好数据产品的加工等。
关于数据资产纠纷,历史上比较有代表性的案例有“大众点评诉百度地图案”、“微博诉脉脉案”、“腾讯诉搜道公司、聚客通公司案”和“蚂蚁金服诉企查查案”等。
杨振律师认为,因为目前我国尚未在立法层面形成专门的企业数据保护机制,司法实践中对于企业数据权益的保护存在不同观点和路径选择。而在众多典型案例中,不管是当事人还是司法机关,在处理数据权益类纠纷时均倾向于援引《反不正当竞争法》的相关规定处理相关纠纷案件。相关争议点主要聚焦于诉争数据的权益基础确定和认定被诉数据使用行为具有不正当性的界定标准。