大数据资源中心

大数据资源中心是指需要通过快速获取、处理、分析以从中提取有价值的海量、多样化的交易数据、交互数据与传感数据,通过现代信息技术、物联网、云计算、互联网等技术,将无法通过人工在合理时间内完成的信息采集处理管理海量数据,并将其整理成为人类所能解读的信息,找到物与物、人与物、人与人之间的数据关联。发现它们背后的规律,这些数据通过集成共享,交叉复用,形成一种智力资源和知识服务能力,为管理者提供准确、可靠的决策依据,最终来提升城市公共服务能力和管理决策水平。

大数据4V特征
        一般认为,大数据主要具有以下四个方面的典型特征:规模性(Volume)、多样性(Varity)、高速性(Velocity)和价值性(Value),即所谓的“4V”。



1.规模性。大数据的特征首先就体现为“数量大”,存储单位从过去的GB到TB,直至PB、EB。随着信息技术的高速发展,数据开始爆发性增长。社交网络(微博、推特、脸书)、移动网络、各种智能终端等,都成为数据的来源。淘宝网近4亿的会员每天产生的商品交易数据约20TB;脸书约10亿的用户每天产生的日志数据超过300TB。迫切需要智能的算法、强大的数据处理平台和新的数据处理技术,来统计、分析、预测和实时处理如此大规模的数据。

2.多样性。广泛的数据来源,决定了大数据形式的多样性。大数据大体可分为三类:一是结构化数据,如财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;二是非结构化的数据,如视频、图片、音频等,其特点是数据间没有因果关系;三是半结构化数据,如HTML文档、邮件、网页等,其特点是数据问的因果关系弱。

3.高速性。与以往的档案、广播、报纸等传统数据载体不同,大数据的交换和传播是通过互联网、云计算等方式实现的,远比传统媒介的信息交换和传播速度快捷。大数据与海量数据的重要区别,除了大数据的数据规模更大以外,大数据对处理数据的响应速度有更严格的要求。实时分析而非批量分析,数据输入、处理与丢弃立刻见效,几乎无延迟。数据的增长速度和处理速度是大数据高速性的重要体现。

4.价值性。这也是大数据的核心特征。现实世界所产生的数据中,有价值的数据所占比例很小。相比于传统的小数据,大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法深度分析,发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的效果。


现状:
        目前城市信息孤岛、网断联难现象仍然存在。大数据资源中心实际是物联网的具体应用,其障碍主要有三方面:
其一,部门分割,条块分割的小数据中心建设,形成了众多的信息孤岛。
其二,标准建设相对滞后,标准不统一。
其三,业务传感与应用装备建设,各部门各搞各的,甚至一个部门内部也各搞各的,造成“有网无联”。比如,治安一套监控系统、城管一套监控系统、交警一套监控系统。


趋势:
        数据集中已经成为国内电子政务企业信息化建设的主流趋势。数据集中是管理集约化的必然要求。大数据资源中心建设已经成为数据集中趋势下的必然产物。