大数据时代政府统计的发展趋势

大数据时代政府统计的发展趋势
大数据时代政府统计的发展趋势

“北京市第十七次统计

科学讨论会”应征论文

大数据时代政府统计的发展趋势

内容提要:

2013年,“大数据”一词火了,成为互联网、新闻媒体、学术机构、政府企业管理人员等多方关注的热点,它在社交网络平台、公共服务单位、数据密集型企业等方面有了许多比较成功的应用。大数据既能快捷准确地提供社会经济的整体变化用于决策,也能让普通的社会公众获得直接可靠的信息服务。一时间,大数据几乎无所不能,甚至有观点认为,大数据时代将不再需要传统的政府统计调查工作了。

作为社会经济数据的生产部门,统计机构必须正视大数据所带来的冲击。本文基于统计的发展过程,介绍分析了“大数据”的产生技术背景、特点及其发展阶段,随后结合当前政府统计的运行现状和特点,重点分析了大数据时代政府统计面临的主要冲击和未来的发展趋势。通过本文可以更好地认识和理解大数据的基本理论,能为政府统计的远期目标和发展思路提供借鉴。

一、大数据时代

(一)数据的生产

语言和文字是人类文明的起源。有了语言,人类才能够互通信息、知情达意;有了文字,人类的思想和活动才能书写记录、往世流传。人类活动的历史有几百万年,有文字信息记载的文明史只有不到一万年。史前蛮荒漫长的岁月里,许多自然界和人类社会值得记录的信号,并未形成数据,信息是一片空白,人类长久地处于无数据时代。

无论是农业社会还是工业社会,除了书写史志,为了全面掌握国家社会经济的资源,执政者都会耗费人时定期或不定期的对人口、土地、商贸数据进行统计核查。随着现代数学的发展以及博彩、生物、医药等领域的需求,描述统计、推断统计的专业使统计成为一门科学,

统计手段变得精细多样,统计数据和统计资料也不再仅限于官方行政记录。

但是拥有数据仍然是需要成本的,统计工作面临着诸多困难。一般情况下,数据需要专职另行收集、需要规范统一整理才能留存、需要经专业分析处理才能易于理解、需要费力翻阅才能查询、需要费力传递才能传输发布等。即便是在信息技术水平迅猛发展的今天,人们仍在数据采集、存储、分析、共享、传输等方面困难重重。人们处于有限数据的时代,只能掌握社会经济整体的一部分信息,数据缺失是常态。

随着信息技术特别是互联网技术应用的发展,社会管理者、企业和个人越来越离不开信息网络,几乎每个人每一时刻都在产生并向各信息终端、平台传送着各种数据,数据的量、种类和结构很快超过传统信息系统的分析处理和存储传输能力。为了获取这样直观上很庞大的数据中的价值,必须选择另一种方式来处理它。为此,人们把各种资源从客户端剥离,集中在云端以便充分发挥效率,面向客户端提供标准化服务,这种新的信息系统架构就是云计算。

(二)云计算

云计算是虚拟化技术、分布式处理、并行处理和网格计算等技术的发展,或者说是这些计算机概念的商业实现1。云计算使计算分布,而非在用户本地或远程的单独服务器中,云端维护者能自由快速地将资源切换到需要的应用上,根据用户需求调整所访问的计算机和存储系统。对用户来说,云计算可以理解为基于网络的软件、平台、基础设施按需供给、自由扩展、按使用付费的应用模式2。

服务器和存储设备的价格日益低廉、城市化和信息化基础的高速建设使云计算有了实现物力基础条件,而互联网企业、大型社交网络平台、公共服务机构、数据型密集行业等为云计算提供了绝佳的应用展示平台。数据信息很快就爆炸性地增长,人们很快从数据匮乏时代跨入了数据泛滥的时代。

(三)从云计算到大数据

云计算对服务提供方的系统架构方式进行了彻底的改变,但用户不会对各种生僻的计算机技术感兴趣,信息技术的推陈出新不能吸引大众的眼球。

公众关注的是应用,面对日益积累起来的海量数据,一方面,在过去没有数据积累的时代无法实现的应用现在终于可以实现;另一方面,如何从海量数据中高效的获取数据,有效的深加工并最终得到感兴趣的数据变的困难。在欣喜夹杂着困扰中,我们迎来了“大数据”这个新词。

大数据本身并不是一种新的技术或产品,而是人们面对一个体量和类别特别大,需要高速实时处理,而其中无价值数据较多的数据集合时的感官称呼,是一种时代现象。

“大数据”时代是信息化发展到今天所形成的一个特定阶段,这与社会进步和科技发展有着密不可分的关系。大数据涵盖的数据量大,包罗万象,变化速度快,存在的形式多种多样,它不再是狭义理解的阿拉伯数字的反映,而是包括文字、图片、视频等多种信息的集合。

毫无疑问,大数据需要云计算,云计算是大数据的IT基础,而大数据是云计算的应用扩展3。云计算把海量数据和可以自由快速扩展的信息资源集中到了云端,大数据则使从数据当中提取信息的常规方式发生了变化。由于自然语言理解、多媒体内容理解、机器学习等技术的发展,计算机可以更好地完成非结构化海量信息的智能化处理,逐步达到学习和模拟人类智能活动并攫取群体行为信息的效果。用户不再依赖传统模型进行抽样后进行统计推断,而是基于规模庞大的数据,利用既有软件快速有效地分析得出人的行为习惯方式,或总结出社会经济的总量结构信息。

大数据所使用的仍然是云计算的核心技术。以著名的大数据应用框架Google的Hadoop 为例:HDFS实现数据的分布式存储,并且实现冗余备份;Map-Reduce实现计算任务的分布化,尽量使到某个节点的计算任务主要面对存储在本地的数据,以减少跨节点的网络数据传送;海量数据管理技术:BT(BigTable)数据管理技术、开源列式数据管理模块HBase;常用数据分析工具Hive;NoSQL等等4。

(四)大数据时代

大数据时代也有其阶段性5。

企业由于自身业务需求产生大量数据,而需要利用这些数据进行深入分析以优化相关业务,这是企业用自身业务数据指导自己决策。企业经济效益,是推动大数据的最初始和直接的驱动力6。

在互联网企业异军突起的今天,企业有动力、有能力搜集与目标业务直接或间接相关的庞大数据,建立复杂的分析和预测模型输出结果。这个时候,数据就是决策。

在未来,大数据时代,对各种数据产生明确的法律规范,能够准确地进行数据量化与保障,使得数据的质量、价值、安全等得到标准化。这时候,数据获取和数据分析处理的工作将彻底剥离,数据运营商、数据市场、数据产品、数据中介等出现,学术团体、企业和政府将成为数据的最终分析用户,专注于研究各专业领域的分析工具、统计算法、业务预测等。

二、从大数据到政府统计

(一)政府统计的发展现状

统计已不是最初的简单计数活动,而已成为国家搜集资料、弄清国情、指导决策的重要手段和依据。市场经济条件下,各主体能自主决定资源如何支配,政府及经济管理部门需要了解经济的规模、结构、发展水平、效益等动态,更需要统计,政府统计调查是经济社会管理部门最主要的数据获取手段。

综合政府统计机构(统计局)通过调查处理,得到反映经济运行状况的基本数据,主要包括人口及劳动力、GDP、农业、工业、建筑业、贸易业、人民生活、价格等。再从相关部门取得财政、金融、运输、邮电、教育、文化、科技、卫生、环保等反映经济社会发展的统计数据。这些数据再通过公报、年鉴、新闻发布、进度资料等形式进行公布。

目前统计局的统计调查采用了全面定期统计、抽样调查、普查、重点调查、典型调查等方法,基本业务开展仍遵循制度设计、调查采集、数据整理上报、数据发布与开发利用的顺序流程。近年来,统计工作信息化水平有较大提高,伴随着联网直报系统等信息化项目的应用推广,政府统计逐步实现了网络采集传输、集中存储处理、多工具分析。

当前政府统计遇到的问题主要表现在数据质量不高、统计产品短缺陈旧、数据权威性受到威胁等方面,问题根源主要是政府统计的制度、机构长期简单固定,不能适应我国向市场体制转轨时期经济活动快速多变的特点。因此,关于政府统计改革的方向建议多集中于强化质量控制、丰富统计指标、改进统计方法、改善与被统对象关系等方面,加强统计的独立和中立、整合现有数据资源等基本目标缺乏手段,政府统计调查系统仍然是数据特别是宏观经济数据的主要直接生产者7。

(二)大数据时代对现有政府统计的根本冲击

大数据时代,各种信息网络平台全面覆盖,不仅使数据爆炸性增长,而且使巨量数据实时在线可用,大数据时代数据更加准确、质量更高,数据的发布更新实时快捷,分析应用多样灵活、贴近公众需求,数据对社会整体的代表性不断增强。通过攫取海量的数据资源中的蕴含信息,能够初步满足宏观分析、行业研究、微观决策的需要。

本质上,数据的生产和应用方式发生了巨大的变革。每个社会单位都是数据生产者和提供者,数据不再仅仅依赖政府统计系统才能生产出来;数据先天地存储于信息平台的所有者手中,政府统计机构不再是数据的绝对拥有者;大量用户能够方便地使用海量数据供己所需,传统政府统计机构不再是数据的唯一发布者和解释人。这才是最大的危机!

社会生活的支撑、管理、监控越来越依赖于既有的信息平台,通讯、电力、金融、电商、

搜索引擎等信息平台的拥有者也是数据的拥有者,在大数据时代占了先机。如果政府统计继续在现有静态的框架下封闭运行,就无法反映经济社会发展的变化情况,无法实现统计信息、统计咨询和实行统计监督的功能,势必被边缘化。

三、大数据时代政府统计的发展趋势

(一)政府统计的未来角色

大数据时代,政府统计应该成为社会经济发展的权威、全面数据的主要提供者,是政府掌握的有关社会管理和运行的行政记录信息标准规范制定者和数据结果发布者。政府统计应该整合多方行政记录信息,结合自身采集数据补充,构建权威的社会经济数据在线平台。作为数据整合发布维护的部门,政府统计不再是数据的主要直接生产者,不再全面专注于一线的统计采集工作。

数据是政府统计的生命源泉,分析报告是政府统计的成果之一。对分析用户来说,数据不是越多越好,越多的数据容易混淆了相关性和因果性。大数据时代的分析需要深厚地背景知识和海量灵活的统计分析工具,单一机构专职从事分析工作会使思路狭隘、结果偏颇,或者陷于数据泥沼而不能自拔。

社会生活涵盖了无数方面,政府统计不能独自去分析所有的应用方向。可以预见,未来经济分析的职能会被更为专业的经济分析部门取代,政府统计的分析应着重于宏观经济数据的必要基础分析,预测和扩展性的分析应用会组织多方力量在政府统计所掌握的数据基础上进行研究开发。

(二)改进统计工作

为了转换政府统计的角色,需要全面改进当前的政府统计获取、整理和分析客观事物总体数量方面资料的工作过程,重塑统计基础、强化技术支撑、推动应用社会化,全面提升统计能力。

1、多渠道智能获取数据

统计工作必须适应大数据时代的变化和要求,通过有效利用客观存在的海量数据,能够有效降低统计调查成本,减轻被调查者的负担,缓解被调查者配合程度降低的矛盾,能够提高统计数据的即时性,缩短统计数据生产周期,改善统计数据的质量8。

首先是应用行政记录于统计上要有所突破,这是进一步开发应用现有行政资源,涉及到政府机构内部机构间的协调,打破法律、版权等制度性限制,制定标准吸收规范9。

其次是改革现有统计方法制度,允许政府统计利用高科技手段快速直接获取企业信息系

统的原始生产经营相关数据。

经济社会的生活是多种层面的,政府综合统计部门仍然需要直接采集数据,才能全面反映社会经济的总体情况。大数据时代,政府统计直接采集数据有两个基本要求:一是压缩调查规模,数据采集有针对性和数据互补性;二是技术手段稳定多样,智能快速,大大降低人的参与因素和干扰可能。

大数据时代的自动智能数据采集将使得数据生产应主要依赖于机器客观测量,如GPS 定位测量、超市收银管理系统、ETC电子收费系统等等,而不需要调查对象长期、认真的配合10。

当前政府综合统计发展建设的全国联网直报系统等系统很大程度上规范了统计人员的工作方式,但也仅是统计信息化建设在传统统计体制下,严控直接采集数据质量的强化措施,数据生产过程中人的参与程度仍然很高,距离大数据条件下的快速智能的采集还有很大距离。

2、构建真正的大数据平台

大数据的根本意义不在于掌握庞大的静态数据,如果不以云计算架构进行组织部署,那数据就只是分割封闭、相互没有联系的一团乱麻,没有广泛分析利用的可能。

美国的政府网站https://www.360docs.net/doc/af904053.html,便是一个公开数据的大平台。目前在上面约有超过40万种原始数据文件,涵盖了农业、气象、金融、劳资、交通、能源等近五十个分类11。世界银行2010年发起“数据公开”运动,让数据能得到更广泛的应用,带来的社会与经济价值远超于数据出售业态。大数据时代,政府统计应建设容量足够大的IT基础设施,容纳所有采集到的数据信息,将历史和现有原始数据文件整理归集到系统中,构建成在线公开的官方统计数据平台。未来政府统计部门将公平公开地开放数据,所有单位个人都将能从统计机构的网站上免费获取到需要的、标准统一的、格式开放的数据。

3、体现数据的价值

数据只有被人们使用,才会变成有用的信息,统计成果需要新的展现方式和形式。

除了公布原始基础数据,政府统计数据平台应该具备权威客观、公开透明的基本经济指标算法、口径和初步结果,这些成果应该通过标准的官方经济核算应用以信息产品的形式对外提供。

政府统计应该利用专业的技术力量和成果,提高数据挖掘分析能力,对巨量原始数据进行专业化处理,将非标准化数据转换为标准化统计数据,从而打好对数据进行“增值”的基础。

由于有更好的实践、行业、专业的背景,社会经济各领域的重要应用问题是掌握在本领域的专家手中,具有共性的大数据科学问题并不多。在可预见的大数据时代,计算机专家和数据提供方只在具体应用分析过程中起到辅助作用,深层次的分析应用和复杂的研究预测仍然是该领域或行业内部的工作。大量的第三方机构和业内人士会依托政府统计数据平台,分析挖掘数据之间的内在关系,寻找更多有价值的信息,深入开发基于大数据的行业应用。

大数据背景下经济统计的机遇与挑战

大数据背景下经济统计的机遇与挑战 kxgdy 经济统计的发展是建立在社会技术发展基础之上的,不同时期,面对不同的客观需要不断发展自身,以满足人们研究和社会管理的需求。随着大数据时代的到来,面对海量的数据,经济统计必然面临新的机遇和挑战。 经济统计更多的时候作为一门方法学科被应用到经济、社会等问题的研究中。从其发展的历史可以看到,一方面社会管理的需求对其不断提出更高的要求;另一方面随着统计概念在实际社会生活中的推广,也不断丰富经济统计的方法和内容。这两者之间也有着相辅相成的关系,他们的共同作用使得经济统计越来越在政策制定、问题研究中突显出其重要性 随着大数据时代的到来,每天产生的数据越来越多,我们对于数据的接触也越来越方便,可以说我们现在处于一个数据爆炸的时代。这种情况随着对于大量、多样数据的存储技术的进步以及对于信息技术的推广变得越来越严重。在这种情况下,对于经济统计不仅会提出更高的要求,也会给提供更多的机遇。 大数据背景下的经济数据特征分析 1.数据统计刻度变小 由于技术手段的限制,历史上的多数经济统计数据往往以较大的数据可读进行统计,如年、月等。随着大数据时代的到来,我们相信对于经济数据的统计刻度将不断的缩小。实际上,已经存在对于股票交易数据的分时统计了,而对于高频交易而言数据的统计刻度就更加的小了。 2.样本群体扩大

从以往来看,搜集大量样本的相关信息是一种成本巨大的工作,所以统计中的样本替代总体也是在这样的背景下发展起来的。随着互联网的发展和信息技术的普及,对于大样本数据的观测和统计不再是一项难以完成的任务。 3.样本信息扩大 大样本统计的巨大成本使得我们无法更多的获得样本更多的信息,而只能针对一些关键信息进行统计。随着现在对于数据统计成本的降低,我们不但可以对我们关心的关键数据进行采集和统计,而且对于非关键信息也可以进行统计,这样可以为我们的研究工作提供更多的选择空间。当然,这里的信息扩大也涵盖了对于信息多样化扩大的含义,不久的将来对于经济信息的统计将会以更多的形式呈现。 4.数据的优良性得到改善 在现有的经济数据中从在很多的断层和不连续性,很多是由于历史的原因造成的。随着对于数据存储技术的发展,我们可以获得更 多、更优质的数据。其优质性体现在数据的完整性、连续性和标准化上。大数据时代会有更多的数据已更加标准化的形式产生和存储,降 低我们在对于数据筛选和处理过程中所话费的成本。 5.宏观与微观统计关系更加密切 现在看来,对于宏观经济指标体系是通过微观样本统计得来的,但是宏观经济指标体系只关注特定的一些经济指标,而忽略了大多数 微观个体产生的经济信息,且两者之间的关系也相对复杂,我们不能 很直观的从宏观信息中得出关于相关微观个体经济特征的信息。随着 大数据时代的到来,统计样本数量和层次的增加,将会使得宏观统计 更加具有现实的微观基础,使得宏观统计的准确信以及与微观统计的 关联性有更大的提高。 利用现代数据机遇,强化经济统计发展 1.利用现代数理技术,充实经济理论

国家统计局――新中国政府统计历程.

新中国政府统计历程 新中国成立以后,中央人民政府政务院财政经济委员会即成立统计处。1952年8月7日,中央人民政府决定成立国家统计局,着手创建全国统一的统计工作。在国民经济恢复的3年里,组织开展了第一次全国工业普查,摸清了解放初期全国工矿企业的基本情况;根据毛泽东主席的指示,进行了工农业总产值和劳动就业两项调查;在国民经济的主要领域开始建立统计报表制度。统计工作为国民经济恢复和编制“一五”计划作出了重要贡献。 从1953年起,我国进入社会主义建设和社会主义改造时期。为适应国家大规模经济建设的需要,1953年1月,政务院决定加强各级政府及各业务部门的统计机构和统计工作,并统一制定全国性的统计制度和统计方法。从中央到地方各级政府,迅速建立了统计机构,逐步建立健全主要专业统计制度。开展了第一次全国人口普查和其他多项普查;1953年首次发布统计公报。统计工作与计划工作密切配合,按照党的过渡时期总路线的要求,收集统计资料,开展统计分析,为国家编制和检查计划提供了重要依据。 “大跃进”开始后,党的实事求是思想作风被践踏,高指标、浮夸风盛行。在“左”倾错误思想和“全民办统计”、“统计大跃进”的口号指导下,统计工作的集中统一原则遭到破坏,中央及地方统计机构和人员被精简,一些重要统计数字严重不实,统计工作受到重大挫折。在此期间,一些统计人员坚持实事求是,对浮夸风进行了力所能及的抵制。 1961年初,党中央提出“调整、巩固、充实、提高”的方针。1962年4月4日,中共中央、国务院作出《关于加强统计工作的决定》(简称“四四决定”);1963年3月,国务院颁发《统计工作试行条例》。“四四决定”和《条例》的贯彻实施,使统计工作获得很大发展。在此期间,各地区、各部门认真核实了“大跃进”期间主要统计数字,为中央进行经济调整提供了决策依据;深入开展调查研究,及时反映经济调整进程;加强综合平衡分析研究,为调整国民经济比例关系提供参考;大力精简统计报表,加强统计调查管理;加强统计工作的集中领导,全国县以上统计机构全部单设。

促进大数据发展行动纲要

【TechWeb报道】9月6日消息,国务院日前印发《促进大数据发展行动纲要》(下称《纲要》),对大数据开放应用等工作提供指导意见。而根据中国信息通信研究院发布的《2015年中国大数据发展调查报告》显示,2015年中国大数据市场规模将达到115.9亿元,增速达38%。 报告显示,2014年中国大数据市场规模约为84亿元,主要由3部分组成,即大数据软件产值、用于承载大数据应用的硬件产值,以及大数据相关的专业服务产值 2014年大数据软件产值为35.6亿元,占比约42%;大数据硬件产值达28.5亿元,占比约34%;大数据服务产值为19.9亿元,占比约为24%。 此外,预计2016至2018年中国大数据市场规模还将维持40%左右的高速增长。 根据中国政府网消息,日前国务院印发《促进大数据发展行动纲要》,《纲要》提出未来5至10年我国大数据发展和应用应实现的目标,将惠及全民,助力经济转型。 《纲要》部署三方面主要任务。一要加快政府数据开放共享,推动资源整合,提升治理能力。二要推动产业创新发展,培育新兴业态,助力经济转型。三要强化安全保障,提高管理水平,促进健康发展。 根据《纲要》计划,2017年底前跨部门数据资源共享共用格局基本形成;到2018年,开展政府和社会合作开发利用大数据试点,2018年底前建成国家政府数据统一开放平台等;2020年,形成一批具有国际竞争力的大数据处理、分析、可视化软件和硬件支撑平台等产品。 此外,《纲要》提出政府治理大数据工程等十大工程,其中,包括推进政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程等4大“政府大数据”工程;工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程等5大“大数据产业”工程;以及网络和大数据安全保障工程。 《纲要》全文如下: 国务院关于印发促进大数据发展行动纲要的通知 国发〔2015〕50 号

大数据时代的Excel统计与分析定制

大数据时代的Excel统计与分析 第1章大数据分析概述 1.1 大数据概述 1.1.1 什么是大数据 1.1.2 数据、信息与认知 1.1.3 数据管理与数据库 1.1.4 数据仓库 1.1.5 数据挖掘的内涵和基本特征 1.2 制造行业需要分析哪些数据? 1.2.1 产品的良率监控 1.2.2 产品的BOM设计 1.2.3 市场数据监控 1.2.4 财务数据 1.2.5 产品生产数据 1.2.6 设备预防性维护数据 1.2.7 产品需求数据 1.2.8 其他日常数据等 第2章数据挖掘流程 2.1 数据挖掘流程概述 2.1.1 问题识别 2.1.2 数据理解 2.1.3 数据准备 2.1.4 建立模型 2.1.5 模型评价 2.1.6 部署应用 第3章大数据的Excel统计分析 3.1 研究程序与抽样 3.2 频率分布 3.2.1 传统的建表方式 3.2.2 离散变量—单选题频率布 3.2.3 如何用Word编辑频率分布表 3.2.4 绘制频率分布统计图表 3.2.5 离散变量—复选题频率分布 3.2.6 利用RANK()函数处理 3.3 集中趋势 3.3.1 平均值\平均值的优点 3.3.2中位数\ 众数\ 内部平均值\ 最大值\最小值 3.3.3 第几最大值第几最小值

3.3.4 描述统计 3.4 离散程度 3.5 假设检验 3.6 单因子方差分析 3.7 相关分析 3.8 回归分析 3.9 聚类分析 3.10预测分析 第4章大数据的图表分析案例 前言:常见图表分析的三大错误 4.1 用实例说明九大类型图表:饼图、柱状图、条形图、折线图、散点图、雷达图、气泡图、面积图、圆环图的应用场合 4.2 几种专业的图表分析法 4.3九大类型图表的生成实例演练 4.4介绍几种专业的图表分析工具,您需要展示与众不同的专业度 -利用双曲线组合图表显示预计销量和实际销量对比 -利用柱形层叠图显示计划完成度 -利用双侧比较图显示市场调查结果 -利用复合饼图深入分析主要销售组成 -使用断层图分析企业数据 第5章数据分析应用实践 5.1 合理的数据呈现与EXCEL/PPT图表制作 图表制作的关键要素 合适的图表展示合适的数据 正确表达需要的主题 图表与文字的协调 图表的结论 5.2科学的数据分析结果解读 注意因果关系 不要以偏概全 考虑环境影响 兼顾定性研究 第6章数据分析报告与汇报 6.1如何撰写一份优秀的数据分析报告 6.2现场实操演练:分析报告撰写 6.3 汇报的技巧 第7章商业预测技术 预测是企业重要的决策依据,企业通过预测技术可以估计下一季度、年度的市场规模、市场占有率、销售量等。 1. 预测责任者与支持者 2. 预测的组织流程

大数据时代下数据分析的变化

大数据时代下数据分析的变化(一)分析思路 大数据时代的分析常常是直接计算现象之间的相依性。传统的统计分析过程是“定性-定量-再定性”,第一个定性是为定量分析找准方向,主要靠经验判断,一般针对数据短缺的情况下比较重要。现在大数据时代,可以直接通过数据分析做出判断,所要做的是直接从“定量的回应”中找出数量特征和数量关系,然后得出可以作为判断或决策依据的结论。因此大数据时代统计分析的过程可以简化为“定量-定性”。在实证分析上,传统思路通常是“假设-验证”,先根据最终的研究目的提出假设性意见,然后收集分析数据,进而验证假设的成立与否。这种实证分析容易受到数据的缺失、假设的局限性以及指标选择的不当等的影响,得不到正确的结论。尤其是在假设本身的非科学性、非客观性、非合理性的情况下,得出的结论更是毫无用处,甚至歪曲事实本身。在现在的大数据时代,可以从中寻找关系、发现规律而不受任何假设的限制,然后得出结论,分析的思路可以概括为“发现-总结”。 (二)研究对象的变化 首先,从数据来源上看,传统的统计抽样调查方法有一些不足:抽样框不稳定,随机取样困难;事先设定调查目的会限制调查的内容和范围;样本量有限,抽样结果经不起细分;纠偏成本高,可塑性弱。而在大数据时代,更多的是将总体直接作为研究对象,摒弃了抽样样本的研究,传统统计抽样调查方法的不足可以在大数据时代得到改进。其次,对于数据类型而言,传统数据通常是结构型的,即

定量数据加上少量的定性数据,格式化,有标准,可通过常规的统计指标和统计图来表示。而大数据则注重非结构性数据或者半结构、异结构数据,多样化、无标准,很难通过传统的统计指标或统计图表加以表现。 (三)假设检验的变化 传统的统计研究,通常是根据内容提出假设意见,然后根据最初设定的理论模型来检验验证假设的真实效用性。但对于大数据时代而言,信息资源充足,可以采用人工智能对数据信息进行挖掘开发,需要验证的假设比传统经济学研究多出很多,不在一个数量级上。传统的假设验证分析是无法满足大数据时代的需求的。 (四)分析关系的变化

大数据时代统计调查工作的挑战与思考_季晓晶

2013.5 一、问题的提出 大数据(bigdata)泛指伴随社会化数据出现的大量在线文本、图片、流媒体数据。这里的“大”有两方面含义。一是数据量巨大。指在科学技术、计算机仿真、互联网应用、电子商务等诸多应用领域产生的海量数据集。二是以数据为“大”的价值论。即大数据之 “大”更多地反映在其重要性上,而不完全指数量上的庞大。因为可以从这些数据中挖掘出有价值的信息,目前大数据被世界经济论坛的相关报告认定为其价值堪比石油的新财富。随着互联网和移动互联网的发展,无处不在的信息感知和采集终端,将行政管理、生产经营、商务活动等众多领域源源不断产生的海量即时电子化数据,通过“云计算”技术构建了一个与物质世界相平行的数字世界,所以很多专家认为人类已经跨入了大数据时代。作为数据生产的权威机关,这样一个时代的到来给统计调查工作带来了什么样的挑战与启示?统计调查部门和统计调查工作者应该怎样应对才能满足时代提出的需求?对此,笔者拟结合多年基层工作经历进行初步探讨,意在抛砖引玉,以期更多的同仁共同关注、思考大数据时代对统计工作带来的变化和影响。 二、大数据时代的来临及意义 有资料显示,1998年全球网民平均每月使用流量是1MB,2008年是1GB,2014年将是10GB。全网流量累计达到1EB的时间在2001年是一年,在2004年是一个月,在2007年是一周,而2013年仅需一天,即一天产生的信息量可刻满1.88亿张DVD光盘。淘宝网站单日数据产生量超过50TB,存储量40PB。百度公司每天要处理60亿次搜索请求,几十PB数据。一个城市若安装几十万个交通和安防摄像头,每月产生的数据量将达几十PB。数据的规模越大,处理的难度也越大,但对其进行挖掘可能得到的价值更大,这就是大数据热的原因。根据中国互联网络信息中心统计,2012年底我国网民数为5.64亿,手机网民为4.2亿。这些网民每天在网上将产生海量的数据,这些数据记载着他们的思想、行为乃至情感,蕴含着丰富的内涵和很多规律性信息,通过分析相关数据,可以了解大众需求、诉求和意见, 反映舆情民意。大数据的重要价值还在于对其有效的开发和使 用能对社会的发展起到巨大的推动作用。企业和政府的信息系统每天源源不断产生大量数据。根据全球第四大独立软件公司,美国赛门铁克公司的调研报告,全球企业的信息存储总量已达2.2ZB,年增67%。医院、学校和银行等也都会收集和存储大量信息。政府可以部署传感器等感知单元, 收集环境和社会管理所需的信息。2011年,英国《自然》杂志曾出版专刊指出,倘若能够有效地组织和使用大数据,人类将得到更多的机会发挥科学技术 对社会发展的巨大推动作用。 (备注:1024B=1KB 1024KB=1MB 1024MB=1GB 1024GB=1TB 1024TB=1PB 1024PB=1EB 1024EB=1ZB 1024ZB=1YB 1024YB=1BB ) 三、大数据时代统计工作面临的挑战 可以预见,大数据时代的到来,对统计调查部门生产出更高质量的统计产品提供了难得的机遇和更大的可能性,但与此同时,带来更多的则是挑战。这种挑战集中体现在随着大数据时代的到来,统计调查部门应该能够使用更少的投入生产出时效性更强、质量更高的产品。社会各界对统计调查部门新的服务需求和更高的工作要求也将随之形成。基于此,笔者认为在大数据背景下,统计调查工作正面临六大挑战。 一是统计工作方式的挑战。在大数据科技大浪潮的背景下,数字化的行政商业记录、网络在线文本、流媒体数据大大拓宽了统计机构收集数据信息的渠道,统计调查部门的业务工作方式也势必发生改变。在数据收集方面, 会更多的需要从互联网、物联网的数据中进行挖掘收集。如物联网的发展将使工业生产、运输物流、最终消费、服务等各种交易生成直接可用的数据。又如,现行的居民家庭日记帐是通过统一的报表和计量方式将调查对象的收入消费行为转化为可用的数据,在大数据时代将有可能实现通过对超市商场收银系统、ETC电子收费系统、GPS定位测量、银行转账、微信等数据进行挖掘从而收集到需要的数据,不再需要调查对象长期认真的配合。这种数据收集方式可以有效避免人为误差,篡改数据的可能性越来越小,数据质量将更有保 大数据时代统计调查工作的挑战与思考 季晓晶 摘要:大数据(bi g d ata )泛指伴随社会化数据出现的大量在线文本、图片、流媒体数据。因其数据量巨大又可以从中挖掘出有价值的信息, 目前被世界经济论坛的相关报告认定为其价值堪比石油的新财富。随着互联网和移动互联网的发展,无处不在的信息感知和采集终端,将行政管理、生产经营、商务活动等众多领域源源不断产生的海量即时电子化数据,通过“云计算”技术构建了一个与物质世界相平行的数字世界,所以很多专家认为人类已经跨入了大数据时代。作为数据生产的权威机关,这样一个时代的到来给统计调查工作带来了什么样的挑战与启示? 统计调查部门和统计调查工作者应该怎样应对才能满足时代提出的需求?对此,笔者结合多年基层工作经历进行了初步探讨。 关键词:大数据;统计调查工作;思考 问题研究 17

大数据时代统计学重构分析

大数据时代统计学重构分析 重构随着信息科学技术的高速度发展,当代获取和储存数据信息的能力不断增强而成本不断下降,这为大数据的应用提供了必要的技术环境和可能.应用大数据技术的优势愈来愈明显,它的应用能够帮助人类获取真正有价值的数据信息.近年来,专家学者有关大数据技术问题进行了大量的研究工作[1],很多领域也都受到了大数据分析的影响.这个时代将大数据称为未来的石油,它必将对这个时代和未来的社会经济以及科学技术的发展产生深远的意义和影响.目前对于大数据概念,主要是从数据来源和数据的处理工具与处理难度方面考虑,但国内外专家学者各有各的观点,并没有给出一致的精确定义.麦肯锡全球数据分析研究所指出大数据是数据集的大小超越了典型数据库工具集合、存储、管理和分析能力的数据集,大数据被Gartner定义为极端信息管理和处理一个或多个维度的传统信息技术问题[23].目前得到专家们认可的一种观点,即:“超大规模”是GB级数据,“海量”是TB级数据,而“大数据”是PB及其以上级别数据[2]. 一些研究学者把大数据特征进行概括,称其具有数据规模巨大、类型多样、可利用价值密度低和处理速度快等特征,同时特别强调大数据区别于其他概念的最重要特征是快速动态变化的数据和形成流式数据.大数据技术发展所面临的问题是数据存储、数据处理和数据分析、数据显示和数据安全等.大数据的数据量大、多样性、复杂性及实时性等特点,使得数据存储环境有了很大变化[45],而大部分传统的统计方法只适合分析单个计算机存储的数据,这些问题无疑增加了

数据处理和整合的困难.数据分析是大数据处理的核心过程,同时它也给传统统计学带来了巨大的挑战[6].产生大数据的数据源通常情况下具有高速度性和实时性,所以要求数据处理和分析系统也要有快速度和实时性特点,而传统统计分析方法通常不具备快速和实时等特点.基于大数据的特点,传统的数据统计理论已经不能适应大数据分析与研究的范畴,传统统计学面临着巨大的机遇与挑战,然而为了适应大数据这一新的研究对象,传统统计学必须进行改进,以继续和更好的服务于人类.目前国内外将大数据和统计学相结合的研究文献并不多.本文对大数据时代这一特定环境背景,统计学的抽样理论和总体理论的存在价值、统计方法的重构及统计结果的评价标准的重建等问题进行分析与研究. 1传统意义下的统计学 广泛的统计学包括三个类型的统计方法:①处理大量随机现象的统计方法,比如概率论与数理统计方法.②处理非随机非概率的描述统计方法,如指数编制、社会调查等方法.③处理和特定学科相关联的特殊方法,如经济统计方法、环境科学统计方法等[7].受收集、处理数据的工具和能力的限制,人们几乎不可能收集到全部的数据信息,因此传统的统计学理论和方法基本上都是在样本上进行的.或者即使能够得到所有数据,但从实际角度出发,因所需成本过大,也会放弃搜集全部数据.然而,选择最佳的抽样方法和统计分析方法,也只能最大程度还原总体一个特定方面或某些方面的特征.事实上我们所察觉到的数据特征也只是总体大量特征中的一小部分,更多的其他特征尚待发掘.

浅析大数据时代下的统计工作.docx

浅析大数据时代下的统计工作 随着我国大数据时代的到来,呈现给我们的时更加丰富多彩和广阔的世界,同时还改变了我们的工作方式,进一步地促进了人类社会的变革。因此面对如此庞大的大数据时代,从而也就繁衍了数据统计工作,并且如今在大数据时代下的统计工作主要的目的就是在大量的数据信息中收集和整理重要的信息,最终将这些数据信息反映到电子计算机设备中,在通过大量的数据对其进行深入的分析,从而得出来的重要的且具有一定价值的结论,紧接着,再根据这些结论在其中找到相应的规律,最后才能合理的运用总结出来的规律开展相应的工作以及生活。大数据时代下,使得信息化数据信息正在成倍的向上增加,因此在面对这一特殊的情况,统计人员需要不断更新统计工作的方式和方法,为了能够更好地满足大数据时代统计工作的需求。 一、大数据时代统计工作的重要性 大数据时代的到来,带给我们的不仅是工作、生活上的便捷,更重要的是带动了我国全面的发展,与此同时大数据时代也伴随着问题带给我们,一个国家在面对如此庞大的大数据信息网络系统,最重要的就是对其中重要的信息进行相应的统计,由此可见统计工作在大数据时代中的重要性,在大数据时代中,通过统计工作而展开的各项数据进行深入的整理和分析,同时为各项决策方案提供较为全面的真实性的依据,从而进一步的促进国家各个方面的全面发展。 二、大数据时代下给统计工作带来的挑战 (一)对数据源采集的智能化的要求更高如今的大数据时代统计

工作与传统的统计工作进行相应的对比可以发现,传统的统计工作主要是通过数据信息相关的报表来进行数据信息的统计工作的,而且在统计工作调查的过程中仍然存在着许多主观性的因素,当然这些主观上的因素必然会影响到统计报表的准确性。如今伴随着大数据时代的到来,便可以有效地避免此类问题的发生,而且,数据信息统计的来源完全是信息技术的记录形成的,并且其记录的数据一般都是最原始的数据信息,这样做的目的就是为了不采取其他的途径,也能有效的保证各项原始信息数据的质量,进一步的保障了大数据时代下的统计工作的质量。 (二)要求及时更新统计的方法和统计的制度大数据时代下对于统计工作的方法和制度有了一定程度的提升,因此,根据大数据时代对统计工作的方法和制度进行深入的完善以及不断地更新,目的就是为了能时刻的满足大数据时代对统计工作的需求。就好比传统的统计工作中的统计报表基本上都是纸质的报表,是需要一层一层的向上级汇报以及分析的,这样的统计方法不仅延长了统计工作的时间,同时还不能确保报表的质量。因此,随着大数据时代的到来,传统的统计报表的统计方法已经无法满足现阶段的统计工作的需求,那么这个时候就需要统计工作的方法和制度在一定的基础上进行深入的改善和更新,并最终达到完全适应现阶段大数据时代的统计工作需求。 (三)对统计数据的搜集流程带来了巨大的挑战现如今的大数据时代对数据的统计和搜集提出了巨大的挑战,而且传统的数据搜集通常是根据研究项目的目的以及对象展开的,进而对其进行设计相应的

大数据,统计学

大数据时代需要重视统计学 我们现在要开始重视大数据,要重视统计学,因为在数据足够大了之后,我们突然发现一切社会现象到最后都有统计规律,它不像物理学那样可以准确的去描述因果的关系,它从本质上来说就是一个统计的规律。统计学学好了,你再去学别的都战无不胜,因为一切社会现象到最后都是一个统计规律。 为什么要强调统计学呢,因为我们的认知能力中最差的是统计思维。人的大脑有一些功能优良得超过我们的想象,比如我们的语言能力。著名的语言学家乔姆斯基曾说,其实语言不是你学来的,语言是你天生就会的,因为语言太复杂了,要是从出生再学语言根本学不会,等你出生的时候,你的大脑里头已经预装了一套操作系统,语言的操作系统。所以语言我们是天生就会的。 还有,比如我们察言观色的能力,也是天生就会的。但有,一些是我们不会的。一位得诺贝尔经济学的心理学家写过一本书,《思考快与慢》。里面就讲到,我们有很多思维是靠直觉的快思维,这是我们几万年、几十万年、几百万年的自然演化,然后给我们留下来的,就是第六感觉。当你觉得可能有危险的时候,你就会跑掉。但是呢,我们另外一套操作系统是用来做逻辑推理以及进行统计分析的,装得很烂,所以我们天生缺的是逻辑推理能力和统计思维能力。 所以,在大数据的时代,我们最需要补的,其实是我们认知能力中最差的统计思维。如果有在学校的学生,我建议统计学这门课要好好地上。 “大数据”何以成为热门词汇? 为什么突然之间,大数据变成了一个最热门的词汇?

首先是由于IT革命。IT革命之后,我们有了很多处理数据的能力,对计算机数据的处理能力、存储的能力和计算的能力不断的提高。人类储存信息量的增长速度比世界经济增长的速度要快4倍,而且这还是在金融危机爆发之前的世界经济增长的速度。而计算机数据处理能力的增长速度,比世界经济增长的速度要快9倍。 其次,能够被数据化的东西越来越多。最早的时候是数字可以被数据化,所以我们有了阿拉伯的计数,后来又出现了二进位,再后来我们发现文字也可以处理成数据,然后我们发现又图像也可以处理成数据。我不知道欧美同学会《时代大讲堂》位置在哪里,我就赶紧上网查一查地图,方位也可以被数据化;你用微信、微博,跟朋友在网上交流,说明你的社会关系也会被数据化。 所以这就是为什么现在要谈大数据,因为可处理的东西太多了。而当你能够被数据化的东西越来越多。当你能够拿到的数据越来越多时,就跟原来不一样了。原来的统计学得有一个抽样,因为你不可能拿到整体,因为整体太多了,而且无法去计算。而现在,当存储能力无限扩大,处理数据的计算能力不断的进步,致使现在我们所处理的往往不是一个样本数据,而是一个整体的数据。所以这个时候,有很多原来想都不能想的事情,现在你可以去做。 大数据时代的三个规律 规律一:知其然而不必知其所以然外行打败内行 我先讲一个案例就是葡萄酒。葡萄酒怎么品酒?过去是靠品酒方面的专家。他会先闻一闻,什么味道、什么香味,然后看看是不是挂杯,最后告诉你,这个酒大

(完整版)大数据时代对统计学的影响分析

大数据时代对统计学的影响分析 大数据和统计学两者在本质上是相互联系、相互促进,没有数据也不可能完成统计,所以二者缺一不可。在大数据时代,统计学必须与时俱进,跟上时代发展的脚步,勇敢地接受大数据带来的的挑战和变革,才会走得更长远。而大数据也要珍惜统计学,两者是无法离开的,只有在共同学习进步下,才能够实现双赢,成为主宰。 关键词:大数据时代;统计学;影响分析 引言 对于大数据(Big data),可以理解为新模式中具备决策性、洞察力、发现力的一门技术。它主要概括数据的自然增长力和多样化的信息资产。 统计学是大数据里面的一门重要的学科。因为它和大数据有着千丝万缕的关系,所以它被人们广泛使用和学习。它是通过整理分析得出来的科学的数据。具有精准性、客观性即概括性。完成统计学的方法有很多种,如调查法、立案法、实验法等主要广泛应用于社会、科学等方面。 一、大数据和统计学的关系 (一)两者的关系 在当今信息时代,用数字代表的信息越来越多,科技迅速发展,互联网时代高速运转,在许多公司用来统计数据的时候,都用的电子表格,进行整理分析。在把它们汇总起来,就成了统计。数据是统计的本质,统计是数据的概括及意义。数据就像零零碎碎的字母,统计就是英语单词,通过整理分析,把字母拼成一个具有意义的单词,这就是数据和统计的意义。只有相互依存,你中有我我中有你。 (二)大数据和统计学的区别 信息功能不同。大数据的意义是某种事物的代表,有些东西要是用它原本的名称代替可能不太放便,这样一个简便的代号即简便又容易记忆。在工作中,工作人员根据超市销售的数据进行整理分析,在汇总起来就是统计,最终他们看得都是统计整理得出的数,分析的也是统计后的数据。因此,统计学是用样本单位来分析和推断数据总体的特征。由数据控制,我们只能根据获得的数据来推断总体数量。在信息时代,越来越多的东西可以用数据表示,几乎全部的信息资料都

大数据时代下统计学的挑战与发展-精选文档

大数据时代下统计学的挑战与发展 、大数据时代下统计学概念概述 教科书上对统计学给出了这样的定义“有效搜集整理分析 随机性数据, 对考察问题给出推断与预测, 最终为行动提供数据 支持”,这就是统计学。从根本上看,统计学是一门与数据有关 的学科。众所周知, 美国总统奥巴马通过数据团队的帮助得到连 任的机会,阿里巴巴的马云很早就把大数据作为企业发展战略。 随着我们走进大数据时代, 网络科技给搜集数据带来方便, 的设备已经无法容纳大量的数据, 我们对其进行更新, 通过对大 数据的分析,我们为社会传递出有效的、有价值的信息,这一切 为社会的发展起到了不可替代的推动作用。 统计是社会各界乃至各环节不可或缺的因素, 在商品交换过 程中,统计有先导作用,市场经济信息也需要统计学的帮助,大 数据时代, 我们的统计数据不再局限于随机抽样调查, 等高成本的搜集方式, 通过互联网及移动终端, 我们可以获得更 多数据样本, 可以说我们的社会进入高速发展的时期, 大数据时 代下的统计学也进入全新的发展阶段。 二、统计学在大数据时代影响下的变革 1. 从样本的角度看,样本概念得到深化 我们知道统计学离不开样本,有效的样本能够正确反映情 况,大数据时代样本概念与传统不再相同, 通常我们得到诸多网 络数据,一种为静态,即直接在客户端创建的数据,无需提取即 可使用,成本低,另一种为动态数据,即数据随着时间的推移而 变化,最终表现为所有数据的总和, 可见此时的样本不局限于随 机抽样,直接可以做选定分析。 2. 从类型方面看,呈扩大之势 在过去数据通常指结构化数据, 有固定的标准, 大数据时代 数据传统 电话调查

大数据发展存在的主要问题

(一)数据孤岛问题 大数据的基础在于数据,但是如果拿不到底层的数据,数据分析也就无从谈起。随着社交网络、移动互联网和物联网的兴起以及社交媒体的发展导致各种海量数据生成,带来了无限想象力和商业应用价值。 “第一个问题就是没数据,理论上我们中国有很多数据,但实际做数据分析会发现非常困难。”中国科学院院士、北京大数据研究院院长鄂维南表示,数据孤岛是一个严重的问题,从技术层面看,大数据的主要挑战是采集和分析。不同部门的数据储存在不同地方,大数据来源众多、数量巨大、形式各异。大数据最高的层次就是用数据来形成智慧,这需要从中获得一目了然的信息。做数据分析先要整合数据,整合数据需要真正高效、可靠的数据管理和分析平台。 社会大数据是一种社会公共资源,由于政府部门之间、企业之间、政府和企业间信息不对称、制度法律不具体、缺乏公共平台和共享渠道等多重因素,还有多样的设备、各式各样的应用场景,导致大量政府数据存在“不愿公开、不敢公开、不能公开、不会公开”的问题,早就了一个个企业和政府管理部门的数据孤岛。 阻碍数据共享的另一个主要原因是缺乏动力和担心安全。贵阳大数据交易所执行总裁王叁寿透露,不少企业以保护商业机密

或节省数据整理成本等为理由,不愿意交易自身数据。在出行领域,每天有上千万的出行记录和数百辆车的实时地理位置信息被记录在出行软件上。电商行业大量流转的货物,掌握着许多家庭住址。这些大数据涉及到千家万户的财产甚至人身安全,企业不愿意泄露这部分信息。部分政府部门也缺乏数据公开的动力:有的是因懒政而让数据沉睡,有的则是已经利用数据开展商业化应用,因此不愿共享。 “数据孤岛的痛不是技术问题,是利益问题,背后隐藏的利益导致了数据孤岛的产生。”鄂维南坦言。 对于如何打通数据孤岛,加快政府数据开放共享,政府要建立完善大数据发展协调机制,稳步推动公共数据资源开放,将大数据作为一项国家战略。大量的数据仍然掌握在个别企业和政府机构中,要想实现共享和保证信息安全,还要统筹规划大数据基础设施建设,推动制定公共信息资源保护和开放的制度性文件,明确数据开放共享的原则和底线。 中国的大数据才刚刚起步,若想打通城市现存的信息壁垒,就要让城市多方资源联动起来,搭建城市数据共享的平台,从而形成良好的数据开发和使用氛围,激活大数据价值,充分发挥数据资源整合的优质效应。 (二)底层技术差距很大 即便解决了数据共享问题,数据可供随时取用,每天天所产

大数据时代统计学发展的若干问题

大数据时代统计学发展的若干问题 作者:马双鸽,刘蒙阕,周峙利,方匡南,朱建平,谢邦昌 本文是发表在《统计研究》的论文基础上整理的,获国家社会科学基金项目“大数据的高维变量选择方法及其应用研究”( 批准号13CTJ001) 和国家自然科学基金面上项目“广 义线性模型的组变量选择及其在信用评分中的应用”(批准号71471152) 的资助。 一、引言 随着计算机技术,尤其是互联网和多媒体技术的普及与飞速发展,人类社会被呈爆炸性增长的信息所包围。据国际商业机器公司(IBM)资料显示[1],目前数据的生成每日以千万亿字节来计算,全球近90%的数据是在过去两年产生的。大数据时代已经到来。 基于自身态度和学术背景的差异,目前,来自不同领域、学科的学者对大数据的理解并没有一个统一的定义。依照美国咨询公司麦肯锡(McKinsey)[2]的定义,大数据是指那些规模超出了典型的数据库软件工具的能力来进行捕获、存储、管理和分析的数据集。与传统数据相比,大数据的大不仅仅是体量上的扩充,数据的结构、形式、粒度、组织等各方面都更加复杂。凭借存储成本更低、运行效率更高的现代信息

技术,大数据可以认为是一切可记录的数字化信号集合。从数据特征来看,Grobelink. M(2012)提出了著名的“3V”定义,即多样性( Variety) 、规模性( Volume)、高速性 ( Velocity)[3]。在此基础上,国际数据公司(IDC)认为大数据还具有价值密度低的特点(Value),而国际商业机器公司(IBM)则提出大数据的真实性(Veracity)。[1] 近年来,IBM、Oracle、Microsoft、Google、Amazon、Facebook等跨国公司大力推动了大数据处理技术的发展,大数据在自然科学、金融、医疗、移动通信等领域涌现出了大量应用成果[3]。伴随着大数据的广泛应用,越来越多的学者开始关注和讨论大数据问题,形成了一些颇具影响力、有代表性的观点。其中最典型的要属舍恩伯格和库克耶(2013)提出的大数据时代三个重要的思维转变:更多(不是随机样本,而是全体数据)、更杂(不是精确性,而是混杂性)、更好(不是因果关系,而是相关关系)[4]。上述观点在业界、学术界引起很多共鸣,同时也存在很多质疑[5,6]。此观点对于大数据时代统计学的发展方向具有一定的指导性作用,然而却很少有文章在探讨统计学科如何发展的背景下系统地 对其进行反思。因此,本文首先回顾了统计学发展历史,剖析了统计学的发展总是以应用为驱动,并在此基础上讨论了大数据背景下统计学的发展定位,进一步分析统计学与计算机之间的关系,并针对舍氏“三个重要的思维转变”提出自己

2018年度政府信息公开情况统计表

年度政府信息公开情况统计表填报单位(盖章):义乌市交通投资建设集团有限公司

单位负责人:审核人:填报人:联系电话:填报日期:

附件 政府信息公开情况统计指标填报说明 一、主动公开情况 .主动公开政府信息数:指按照《条例》规定,统计年度内主动公开的政府信息总条数。 主动公开政府信息数按条计算。凡公文类政府信息,件公文计为条,部分内容公开的公文也计为条。其他政府信息,份完整的信息(或其中部分公开的信息)计为条。 主动公开政府信息数不重复计算。通过不同渠道和方式公开的同一条政府信息计为条信息;部门联合发布的信息以牵头制作该信息的部门为填报单位;各单位转载、转发的信息不计入本单位统计数量。 .主动公开规范性文件数:指主动公开的规范性文件总条数。 .制发规范性文件总数:指制发规范性文件总件数,应为主动公开数和未主动公开数的合计数。 .政府公报公开政府信息数:指通过政府公报主动公开的政府信息总条数。 .政府网站公开政府信息数:指通过各级政府网站主动公开的政府信息总条数。 .政务微博公开政府信息数:指通过官方政务微博主动公开的政府信息总条数。 .政务微信公开政府信息数:指通过官方政务微信主动公开的政府信息总条数。 .其他方式公开政府信息数:指通过报刊、广播、电视等其他方式主动公开的政府信息总条数。 二、回应解读情况 .回应公众关注热点或重大舆情数:指回应涉及本单位职责的公众关注热点或重大舆情的次数。 回应公众关注热点或重大舆情数不重复计算。以多种形式回应同一热点或舆情的计为次回应;联合发布的回应情况以回应该热点或舆情的牵头负责单位为填报单位;各单位转载、转发的回应情况不计入本单位统计数量。 .参加或举办新闻发布会总次数:指为解读政策、回应社会关切、引导舆论而参加或举办的新闻发布会、媒体通气会等的总次数。 .主要负责同志参加新闻发布会次数:指本单位主要负责同志为解读政策、回应社会关切、引导舆论而参加各类新闻发布会、媒体通气会等的总次数。 .政府网站在线访谈次数:指本单位有关负责同志或新闻发言人为解读政策、回应社会关切、引导舆论在政府网站接受在线访谈的总次数。

(完整版)大数据产业发展规划(2016-2020年)

大数据产业发展规划(2016-2020年) 数据是国家基础性战略资源,是21世纪的“钻石矿”。党中央、国务院高度重视大数据在经济社会发展中的作用,党的十八届五中全会提出“实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,全面推进大数据发展,加快建设数据强国。“十三五”时期是我国全面建成小康社会的决胜阶段,是新旧动能接续转换的关键时期,全球新一代信息产业处于加速变革期,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。抢抓机遇,推动大数据产业发展,对提升政府治理能力、优化民生公共服务、促进经济转型和创新发展有重大意义。为推动我国大数据产业持续健康发展,深入贯彻十八届五中全会精神,实施国家大数据战略,落实国务院《促进大数据发展行动纲要》,按照《国民经济和社会发展第十三个五年规划纲要》的总体部署,编制本规划。 一、我国发展大数据产业的基础 大数据产业指以数据生产、采集、存储、加工、分析、服务为主的相关经济活动,包括数据资源建设、大数据软硬件产品的开发、销售和租赁活动,以及相关信息技术服务。 “十二五”期间,我国信息产业迅速壮大,信息技术快速发展,互联网经济日益繁荣,积累了丰富的数据资源,技术创新取得了明显突破,

应用势头良好,为“十三五”时期我国大数据产业加快发展奠定了坚实基础。 信息化积累了丰富的数据资源。我国信息化发展水平日益提高,对数据资源的采集、挖掘和应用水平不断深化。政务信息化水平不断提升,全国面向公众的政府网站达8.4万个。智慧城市建设全面展开,“十二五”期间近300个城市进行了智慧城市试点。两化融合发展进程不断深入,正进入向纵深发展的新阶段。信息消费蓬勃发展,网民数量超过7亿,移动电话用户规模已经突破13亿,均居世界第一。月度户均移动互联网接入流量达835M。政府部门、互联网企业、大型集团企业积累沉淀了大量的数据资源。我国已成为产生和积累数据量最大、数据类型最丰富的国家之一。 大数据技术创新取得明显突破。在软硬件方面,国内骨干软硬件企业陆续推出自主研发的大数据基础平台产品,一批信息服务企业面向特定领域研发数据分析工具,提供创新型数据服务。在平台建设方面,互联网龙头企业服务器单集群规模达到上万台,具备建设和运维超大规模大数据平台的技术实力。在智能分析方面,部分企业积极布局深度学习等人工智能前沿技术,在语音识别、图像理解、文本挖掘等方面抢占技术制高点。在开源技术方面,我国对国际大数据开源软件社区的贡献不断增大。

大数据时代下统计方法研究

龙源期刊网 https://www.360docs.net/doc/af904053.html, 大数据时代下统计方法研究 作者:孔社霞 来源:《财讯》2018年第03期 大数据统计方法研究企业管理 大数据时代下的统计发展 (1)我国传统的统计方法发展现状 全球经济活动呈现多元化、多样化和复杂化发展。传统的统计方法很难精确、全面获得在经济、信息资源全球化中占据主导地位所需要的各项统计数据信息。 在大数据时代下,数据的容量变得非常巨大,且种类多样,有价值的数据密度相对变低,需要处理数据的速度变快。而我国传统统计存在一些固有的缺陷,影响企业对经济市场的判断。首先,我国传统的统计方法与国际通行的指标体系不接轨,专业统计制度与核算统计制度之间的矛盾日益突出,使得我国统计制度与方法难以保障未来发展中的科学性。其次,现有的统计方法缺乏活力。伴随着信息数据的大量增加,我国统计人员习惯了统计抽样、线性回归分析等方法,但这些方法已经不适合大数据时代的要求。我国统计方法主要以描述为主,不能准确的分析出我国国民经济体系中的每个统计数据指标的关系,对有效信息的抓取也比较困难。最后,统计服务工作滞后,收集的数据质量普遍较低,致使分析出的结果很难对经济发展和人们的日常生活提供有力的保障。因此,我国传统的统计方法在大数据时代的潮流下,需要做出改变。 (2)大数据时代对统计方法的影响 大数据时代对统计方法的影响是多方面的,尤其是对经济统计的影响是非常深远的。首先,大数据时代的到来,改变了数据的收集方式。传统的数据收集方法是进行普查、问卷调查和抽样调查等。面对当今海量的数据形势,传统的数据收集方法已经无法满足客户对数据的收集速度和数量的要求。这就促使了数据的收集和处理方式的转变。使数据的处理模式能够适应当前的海量的数据形势。其次,数据的分析模式发生了改变。传统的数据在收集之后,进行随机的抽样分析。大数据时代的来临,抽样的分析模式已经无法适应时代对数据的准确性的要求。海量数据进行分析的系统模式逐渐形成了全数据的分析模式,使其准确性和时效性得到了很大的提高。最后,数据之间的因果关系淡化。传统的少量数据中存在着明显的因果关系,而大数据时代的到来,数据之间的因果关系淡化,需要用户在进行数据的分析时关注数据的相关的信息关系,从而实现数据的价值化。 统计方法改革的必要性 (1)统计方法的变革是政府工作的需要

大数据发展发展趋势分析报告

大数据发展发展趋势分析报告

2012年,全球数据储存量达到1.8ZB,这是什么概念?它相当于每个中国人,每分钟发3条微博,一共要写2.6976万年才能写完。四年过去了,全球大数据储量是2012年的8倍,而用于存储数据的全球服务器总量还将增长十倍。预计到2020年,全球大数据市场规模将达到1263.21亿美元,据数据显示,目前70%的大企业和56%的中小企业已经部署或是正在计划部署与大数据有关的项目和计划。全球大数据市场结构正在从垄断竞争走向完全竞争的局面。 美国: 美国是大数据发展的领跑者,美国政府一直积极出台大数据相关政策。现今,美国的大数据产业发展广泛渗透到经济、政治、教育、安全和社会管理等领域,步入大规模商业化阶段。大数据已成企业发展的巨大引擎。“Facebook”、“Twitter”项目的成功,标志着信息技术企业加快推动大数据业务的发展,大数据的使用将成为领先企业与其他企业之间最显著的差别。大数据也成为新的盈利模式,正在推动改革企业的决策模式、运营模式和竞争模式,成为企业发展战略的重要组成部分。 政府对大数据政策的支持 在美国总统奥巴马宣誓就职后的第一个工作日就签发了“开放政府”备忘录(Memorandum on Transparency and Open

Government),指导新一届行政当局从开放政府数据源、建设开放型政府入手,以数字革命带动政府变革。“开放政府”的目的简洁明了:改进公众服务,提升公众信任,更有效管理公共资源和增进政府责任。互联网时代的开放型政府,首先必须开放政府数据。紧随其后,总统签发“开放政府数据”行政令(The Open Government Directive),要求在45天内所有政府部门无一例外必须向社会开放3个有价值的数据源。 在大数据法律方面:美国总统要求超前思考“大数据”对人类社会的影响,重点研究现有技术和未来技术会对现行法律带来哪些挑战,哪些法律和政策需要修订或制定以适应变化。为了更进一步发展大数据产业,美国政府发布了《联邦大数据研发战略计划》,以加速其2012年提出的“大数据研发行动”进程。 应用案例: 大数据在公共设施方面的应用 1.在夏威夷四处可见防海啸警报器,但这些警报器里的电池经常被偷,直接导致政府无法准确掌握各个报警器在紧急状况下能否使用,所以他们利用大数据技术,发明了一个“报警器中的报警器”,可以及时获取所有报警器的实时数据,避免了海啸发生前由于数据无法准确掌握造成的重大损失。

相关文档
最新文档