大数据的国内外研究现状及发展动态分析

大数据的国内外研究现状及发展动态分析
大数据的国内外研究现状及发展动态分析

大数据的国内外研究现状及发展动态分析大数据的概念

产生的背景与意义

上世纪60年代到80年代早期,企业在大型机上部署财务、银行等关键应用系统,存储介质包括磁盘、磁带、光盘等。尽管当时人们称其为大数据,但以今日的数据量来看,这些数据无疑是非常有限的。随着PC的出现和应用增多,企业内部出现了很多以公文档为主要形式的数据,包括Word、Excel文档,以及后来出现的图片、图像、影像和音频等。此时企业内部生产数据的已不仅是企业的财务人员,还包括大量的办公人员,这极大地促进了数据量的增长。互联网的兴起则促成了数据量的第三次大规模增长,在互联网的时代,几乎全民都在制造数据。而与此同时,数据的形式也极其丰富,既有社交网络、多媒体等应用所主动产生的数据,也有搜索引擎、网页浏览等被动行为过程中被记录、搜集的数据。时至今日,随着移动互联网、物联网、云计算应用的进一步丰富,数据已呈指数级的增长,企业所处理的数据已经达到PB级,而全球每年所产生的数据量更是到了惊人的ZB级。在数据的这种爆炸式增长的背景下,“大数据”的概念逐渐在科技界、学术界、产业界引起热议。在大数据时代,我们分析的数据因为“大”,摆脱了传统对随机采样的依赖,而是面对全体数据;因为所有信息都是“数”,可以不再纠结具体数据的精确度,而是坦然面对信息的混杂;信息之“大”之“杂”,让我们分析的“据”也由传统的因果关系变为相关关系。

大数据热潮的掀起让中国期待“弯道超越”的机会,创造中国IT企业从在红海领域苦苦挣扎转向在蓝海领域奋起直追的战略机遇。传统IT行业对于底层设备、基础技术的要求非常高,企业在起点落后的情况下始终疲于追赶。每当企业在耗费大量人力、物力、财力取得技术突破时,IT革命早已将核心设备或元件推进至下一阶段。这种一步落后、处处受制于人的状态在大数据时代有望得到改变。大数据对于硬件基础设施的要求相对较低,不会受困于基础设备核心元件的相对落后。与在传统数据库操作层面的技术差距相比,大数据分析应用的中外技术差距要小得多。而且,美国等传统IT强国的大数据战略也都处于摸着石头过河的试错阶段。中国市场的规模之大也为这一产业发展提供了大空间、大平台。大数据对于中国企业不仅仅是信息技术的更新,更是企业发展战略的变革。随着对大数据的获取、处理、管理等各个角度研究的开展,企业逐渐认识数据已经逐渐演变成“数据资产”。任何硬件、软件及服务都会随着技术发展和需求变化逐渐被淘汰,只有数据才具有长期可用性,值得积累。数据是企业的核心资产,可以是也应该是独立于软硬件系统及应用需求而存在的。大数据是信息技术演化的最新产物,确立了数据这一信息技术元素的独立地位。正因为数据不再是软硬件及应用的附属产物,才有了今天爆炸式的数据增长,从而奠定了大数据的基础。

为了充分利用数据资产,大数据产业也呼之欲出。大数据时代来临,使商业智能、信息安全和云计算具有更大潜力。大数据产业链按产品形态分为硬件、基础软件和应用软件三大领域,商业智能、信息安全和云计算主横跨三大领域,将构成产业链中快速发展的三驾马车。就国内而言,商业智能市场已步入成长期,预计未来3年复合年均增长率( CAGR) 为35%,“十二五”期间潜在产值将超300 亿元; 信息安全预计未来3 年CAGR有望保持35% ~40%的快速增长,“十二五”期间潜在产值将超4000 亿元; 云计算刚进入成长期,预计未来5 年CAGR 将超50%,2015 年产业规模预计将达1 万亿元。大数据处理的基础设施数据仓库、以物联网为代表的数据收集环节、实时性强的在线数据分析工具,以及数据可视化的产品呈现,数据挖掘的应用在营销、销售、人力资源、电子商务等各个商业领域广泛开展,大数据为个性化营销和精准化推荐提供了充足的养分和可持续发展的沃土。同时大数据研究会给企业管理变革带来巨大冲击。对现代企业的管理运作理念、组织业务流程、市场营销决策以及消费者行为模式等产生巨大影响,使得企业商务管理决策越来越依赖于数据分析而非经验甚至直觉。大数据将催生由信息驱动的的商业模式,在企业的价值链中发挥中间作用,通过商业交易创建极具价值的“排出数据”;数据驱动的决策制定,利用可控实验,企业能够验证假设、分析结果以指导投资决策及运作改变;利用大数据进一步提高算法和机器分析的作用,避免成本高昂的人工干预,节约成本,提高效益。

国内外研究进展

“大数据”这个概念早在上个世纪的1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,就将“大数据”热情地赞颂为“第三次浪潮的华彩乐章”。2008年9月《科学》(Science)杂志发表了一篇文章“BigData: Science in the Petabyte Era”。“大数据”这个词开始被广泛传播。目前国内外的专家学者对大数据只是在数据规模上达成共识:“超大规模”表示的是GB级别的数据,“海量”表示的是TB级的数据,而“大数据”则是PB 级别及其以上的数据。但对其的准确定义给出的结论不一。美国国家科学基金会( NSF) 则将大数据定义为“由科学仪器、传感设备、互联网交易、电子邮件、音视频软件、网络点击流等多种数据源生成的大规模、多元化、复杂、长期的分布式数据集”。Wiki对大数据的定义为:所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。麦肯锡全球数据分析研究所在2011 年5 月发表的一篇论文中所说:“大数据是指大小超出了典型数据库工具收集、存储、管理和分析能力的数据集。”但它同时指出“大数据”并非总是说有数百个TB 才算得上。根据实际使用情况,有时候数百个GB 的数据也可称为大数据,这主要要看它的第三个维

度,也就是速度或者时间维度。权威IT 研究与顾问咨询公司Gartner 将大数据定义为“在一个或多个维度上超出传统信息技术的处理能力的极端信息管理和处理问题”。IBM公司把大数据概括为规模V olume快速Velocity和多样Variety,即3V,而4V则是3V的基础上多一个Value价值。具体来讲,V olume指数据量极大并仍在持续增大;Velocity指所需的处理速度快,响应时间短;V ariety指数据类型繁多,包括结构化数据、半结构化数据甚至是非结构化数据(以此区分大数据与海量数据两个概念);Value指价值密度低,以视频为例,不间断的监控录像中,有用的数据长度可能仅有一两秒。由以上概念的差异可以看出目前主要从数据来源和数据的处理工具与处理难度两个方面对大数据进行定义。但是这种定义方式会和另一个词发生混淆——海量数据。有文献指出大数据=海量数据+复杂类型的数据,这一公式是否成立还待进一步讨论。如今“海量数据”研究方向主要考虑各种非结构化数据的有效管理、多数据源的集成问题。由此看来能区别两次还需要借助IBM关于大数据4V特征,尤其是其中的Velocity。强调数据是快速动态变化的,形成流式数据则是大数据区别于其他概念的最重要的特征。

国外除在大数据的概念上的研究外,重点放在技术研究。美国政府六个部门启动的大数据研究计划中,除了国家科学基金会的研究内容提到要“形成一个包括数学、统计基础和计算机算法的独特学科”外,绝大多数研究项目都是应对大数据带来的技术挑战,重视的是数据工程而不是数据科学,主要考虑大数据分析算法和系统的效率。在国内,“大数据”尚未直接以专有名词被我国政府提出并给予政策支持。因此国内学者关于大数据概念上的研究并不充分,大多是引用以上定义进行阐释。同时在国内对“海量数据”这一说法认同度较高,更习惯将“大数据”称为“海量数据,并没有将两个词进行明确的区分。国内在大数据研究领域的重点在大数据与云计算、数据挖掘,并行计算和分布式处理,应用式主要集中在地理信息系统。

发展动态

(1)资源的管理与利用。数据作为一种重要的资源,对它价值的挖掘利用具有非常重要的意义,因此一直是该领域的研究重点。研究主要涉及到数字处理、数据分析以及数据挖掘,尤其是从海量、复杂、实时的大数据中挖掘知识,可见,对海量数据价值的挖掘、发现和创造价值一直是当前的研究热点。同时为了更好地建设数据资源,对数据的组织和存储显得尤为重点,于是相应地也成为研究热点,如元数据、数据仓库和数据存储等。

(2)信息服务。数据组织和建设的主要目的便是开展服务。相关研究主要涉及到地理信息系统、互联网、物联网、遥感、数字城市、商业智能等方面。而物联网一直是重点关注

的新产业,对于数字城市及智慧城市的谋划建设更强调数据的价值。此外,统计还发现,中国移动、中国电信以及金融领域更注重从数据分析挖掘中获得智慧价值的利用。

(3)行业调整。Hadoop迈向商业化,开源软件带来更多相关市场机会,将促使一批新型开放平台的诞生。同时大数据将由网络数据处理走向企业级应用,企业逐渐了解到大数据并不仅仅指处理网络数据,行业对大数据处理的需求也会增加,包括数据流检测和分析。大数据将创造出新的细分市场

(4)关键技术。数据的管理和利用离不开技术的支撑,服务质量的提高更离不开技术的保障。近几年的研究主要涉及到云计算、Hadoop、MapReduce、并行、分布式、多线程、网格、可视化等技术。尤其是云计算、MapReduce 以及Hadoop 带来的分布式、并行式算法与“海量数据”有着密切的关系,而事实上这三者针对的具体目标本来就是大规模的数据。

目前存在的主要问题分析

(1)研究方法问题

大数据研究开创了科研的第四范式,与传统的逻辑推理研究不同,大数据研究是对数量巨大的数据做统计性的搜索、比较、聚类和分类等分析归纳,因此继承了统计科学的一些特点。统计学关注数据的相关性或称关联性,所谓“相关性”是指两个或两个以上变量的取值之间存在某种规律性,而不再关注因果关系。因果关系的研究曾经引发了科学体系的建立,近代科学体系获得的成就已经证明,科学是研究因果关系最重要的手段。对于相关性研究是可以替代因果分析的科学新发展还只是因果分析的补充,这是一个大数据学术界讨论比较激烈的问题。

(2)领域融合问题

当前大数据研究的局面是各个学科的科学家都以自己为主处理本领域的海量数据,信息领域的科学家只能起到助手的作用。也就是说,各领域的科学问题还掌握在各学科的科学家手里,计算机科学家所提炼出的具有共性的大数据科学问题并不多。通过对有关文献统计,目前大数据方面已发表论文多有计算机科学方面的研究机构专家学者撰写。大多立足于信息科学,侧重于大数据的获取、存储、处理、挖掘和信息安全等方面,鲜有从管理学的角度探讨大数据对于现代企业生产管理和商务运营决策等方面带来的变革与冲击的研究.缺乏学科之间的交叉与融合,缺乏既拥有清理和组织大型数据的能力又懂得“商业语言”的数据科学家。

国内外大数据产业发展现状与趋势研究

龙源期刊网 https://www.360docs.net/doc/4b16770929.html, 国内外大数据产业发展现状与趋势研究 作者:方申国谢楠 来源:《信息化建设》2017年第06期 大数据作为新财富,价值堪比石油。 进入21世纪以来,随着物联网、电子商务、社会化网络的快速发展,数据体量迎来了爆炸式的增长,大数据正在成为世界上最重要的土壤和基础。根据IDC(互联网数据中心)预测,2020年的数据增长量将是2010年的44倍,达到35ZB。世界经济论坛报告称,“大数据为新财富,价值堪比石油”。随着计算机及其存储设备、互联网、云计算等技术的发展,大数据应用领域随之不断丰富。大数据产业将依赖快速聚集的社会资源,在数据和应用驱动的创新下,不断丰富商业模式,构建出多层多样的市场格局,成为引领信息技术产业发展的核心引擎、推动社会进步的重要力量。 大数据产业发展现状 全球大数据产业发展概况 目前,大数据以爆炸式的发展速度迅速蔓延至各行各业。随着各国抢抓战略布局,不断加大扶持力度,全球大数据市场规模保持了高速增长态势。据IDC预测,全球大数据市场规模 年增长率达40%,在2017年将达到530亿美元。美国奥巴马政府于2012年3月宣布投资2亿美元启动“大数据研究和发展计划”,将“大数据研究”上升为国家意志;2015年发布“大数据研究和发展计划”,深入推动大数据技术研发,同时还鼓励产业、大学和研究机构、非盈利机构与政府一起努力,共享大数据提供的机遇。目前,美国大数据产业增长率已超过71%,大数据在美国健康医疗、公共管理、零售业、制造业等领域产生了巨大的经济效益。英国政府自2013年开始就注重对大数据技术的研发投入,2015年投入7300万英镑用于55个政府的大数据应用项目,投资兴办大数据研究中心,通过大数据技术在公开平台上发布了各层级数据资源,直接或间接为英国增加了近490亿至660亿英镑的收入,并预测到2017年,大数据技术可以为英国提供5.8万个新的工作岗位,或将带来2160亿英镑的经济增长。法国2011年推出了公开的数据平台 date.gouv.fr,以便于公民自由查询和下载公共数据;2013年相继发布《数字化路线图》、《法国政府大数据五项支持计划》等,通过为大数据设立原始扶持资金,推动交通、医疗卫生等纵向行业设立大数据旗舰项目,为大数据应用建立良好的生态环境,并积极建设大数据初创企业孵化器。日本在《日本再兴战略》中提出开放数据,将实施数据开放、大数据技术开发与运用作为2013-2020年的重要国家战略之一,积极推动日本政务大数据开放及产业大数据的发展,零售业、道路交通基建、互联网及电信业等行业的大数据应用取得显著效果。韩国政府高度重视大数据发展,科学、通信和未来规划部与国家信息社会局(NIA)共建大数据中心,大力推动全国大数据产业发展。根据《2015韩国数据行业白皮书》统计显示, 数据服务市场规模占韩国总行业市场规模的47%,位列第一;数据库构建服务以41.8%的占有

关于大数据国内外的发展状态

关于大数据国内外的发展状态 来源:金窝窝 大数据的背景与意义 上世纪60年代到80年代早期,企业在大型机上部署财务、银行等关键应用系统,存储介质包括磁盘、磁带、光盘等。尽管当时人们称其为大数据,但以今日的数据量来看,这些数据无疑是非常有限的。随着PC的出现和应用增多,企业内部出现了很多以公文档为主要形式的数据,包括Word、Excel文档,以及后来出现的图片、图像、影像和音频等。此时企业内部生产数据的已不仅是企业的财务人员,还包括大量的办公人员,这极大地促进了数据量的增长。 关键词:大数据,发展,分析,技术 互联网的兴起则促成了数据量的第三次大规模增长,在互联网的时代,几乎全民都在制造数据。而与此同时,数据的形式也极其丰富,既有社交网络、多媒体等应用所主动产生的数据,也有搜索引擎、网页浏览等被动行为过程中被记录、搜集的数据。时至今日,随着移动互联网、物联网、云计算应用的进一步丰富,数据已呈指数级的增长,企业所处理的数据已经达到PB级,而全球每年所产生的数据量更是到了惊人的ZB级。在数据的这种爆炸式增长的背景下,“大数据”的概念逐渐在科技界、学术界、产业界引起热议。在大数据时代,我们分析的数据因为“大”,摆脱了传统对随机采样的依赖,而是面对全体数据;因为所有信息都是“数”,可以不再纠结具体数据的精确度,而是坦然面对信息的混杂;信息之“大”之“杂”,让我们分析的“据”也由传统的因果关系变为相关关系。 大数据热潮的掀起让中国期待“弯道超越”的机会,创造中国IT企业从在红海领域苦苦挣扎转向在蓝海领域奋起直追的战略机遇。传统IT行业对于底层设备、基础技术的要求非常高,企业在起点落后的情况下始终疲于追赶。每当企业在耗费大量人力、物力、财力取得技术突破时,IT革命早已将核心设备或元件推进至下一阶段。这种一步落后、处处受制于人的状态在大数据时代有望得到改变。大数据对于硬件基础设施的要求相对较低,不会受困于基础设备核心元件的相对落后。与在传统数据库操作层面的技术差距相比,大数据分析应用的中外技术差距要小得多。而且,美国等传统IT强国的大数据战略也都处于摸着石头过河的试错阶段。 中国市场的规模之大也为这一产业发展提供了大空间、大平台。大数据对于中国企业不仅仅是信息技术的更新,更是企业发展战略的变革。随着对大数据的获取、处理、管理等各个角度研究的开展,企业逐渐认识数据已经逐渐演变成“数据资产”。任何硬件、软件及服务都会随着技术发展和需求变化逐渐被淘汰,只有数据才具有长期可用性,值得积累。数据是企业的核心资产,可以是也应该是独立于软硬件系统及应用需求而存在的。大数据是信息技术演化的最新产物,确立了数据这一信息技术元素的独立地位。正因为数据不再是软硬件及应用的附属产物,才有了今天爆炸式的数据增长,从而奠定了大数据的基础。

浅谈大数据发展现状及未来展望

浅谈大数据发展现状及未来展望 中国特色社会主义进入新时代,实现中华民族伟大复兴的中国梦开启新征程。党中央决定实施国家大数据战略,吹响了加快发展数字经济、建设数字中国的号角。国家领导人在十九届中共中央政治局第二次集体学习时的重要讲话中指出:“大数据是信息化发展的新阶段”,并做出了“推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全”的战略部署,为我国构筑大数据时代国家综合竞争新优势指明了方向! 今天,我拟回顾大数据的发端、发展和现状,研判大数据的未来趋势,简述我国大数据发展的态势,并汇报我对信息化新阶段和数字经济的认识,以及对我国发展大数据的若干思考和建议。 一、大数据的发端与发展 从文明之初的“结绳记事”,到文字发明后的“文以载道”,再到近现代科学的“数据建模”,数据一直伴随着人类社会的发展变迁,承载了人类基于数据和信息认识世界的努力和取得的巨大进步。然而,直到以电子计算机为代表的现代信息技术出现后,为数据处理提供了自动的方法和手段,人类掌握数据、处理数据的能力才实现了质的跃升。信息技术及其在经济社会发展方方面面的应用(即信息化),推动数据(信息)成为继物质、能源之后的又一种重要战略资源。 “大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸到科学和商业领域。大多数学者认为,“大数据”这一概念最早公开出现于1998年,美国高性能计算公司SGI的首席科学家约翰·马西(John Mashey)在一个国际会议报告中指出:随着数据量的快速增长,必将出现数据难理解、难获取、难处理和难组织等四个难题,并用“Big Data(大数据)”来描述这一挑战,在计算领域引发思考。2007年,数据库领域的先驱人物吉姆·格

2019国内外大数据行业现状

当前,许多国家的政府和国际组织都认识到了大数据的重要作用,纷纷将开发利用大数据作为夺取新一轮竞争制高点的重要抓手,实施大数据战略,对大数据产业发展有着高度的热情。 美国政府将大数据视为强化美国竞争力的关键因素之一,把大数据研究和生产计划提高到国家战略层面。在美国的先进制药行业,药物开发领域的最新前沿技术是机器学习,即算法利用数据和经验教会自己辨别哪种化合物同哪个靶点相结合,并且发现对人眼来说不可见的模式。根据前期计划,美国希望利用大数据技术实现在多个领域的突破,包括科研教学、环境保护、工程技术、国土安全、生物医药等。 其中具体的研发计划涉及了美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局、地质勘探局等6 个联邦部门和机构。 目前,欧盟在大数据方面的活动主要涉及四方面内容:研究数据价值链战略因素;资助“大数据”和“开放数据”领域的研究和创新活动;实施开放数据政策;促进公共资助科研实验成果和数据的使用及再利用。 英国在2017 年议会期满前,开放有关交通运输、天气和健康方面的核心公共数据库,并在五年内投资1000 万英镑建立世界上首个“开放数据研究所”;政府将与出版行业等共同尽早实现对得到公共资助产生的科研成果的免费访问,英国皇家学会也在考虑如何改进科研数据在研究团体及其他用户间的共享和披露;英国研究理事会将投资200 万英镑建立一个公众可通过网络检索的“科研门户”。 法国政府为促进大数据领域的发展,将以培养新兴企业、软件制造商、工程师、信息系统设计师等为目标,开展一系列的投资计划。法国政府在其发布的《数字化路线图》中表示,将大力支持“大数据”在内的战略性高新技术,法国软件编辑联盟曾号召政府部门和私人企业共同合作,投入3 亿欧元资金用于推动大数据领域的发展。法国生产振兴部部长ArnaudMontebourg、数字经济部副部长FleurPellerin 和投资委员LouisGallois 在第二届巴黎大数据大会结束后的第二天共同宣布了将投入1150 万欧元用于支持7 个未来投资项目。这足以证明法国政府对于大数据领域发展的重视。法国政府投资这些项目的目的在于“通过发展创新性解决方案,并将其用于实践,来促进法国在大数据领域的发展”。众所周知,法国在数学和统计学领域具有独一无二的优势。 日本为了提高信息通信领域的国际竞争力、培育新产业,同时应用信息通信技术应对抗灾救灾和核电站事故等社会性问题。2013 年6 月,安倍内阁正式公布了新IT 战略——“创建

国内外大数据发展现状和趋势(2018)

行业现状 当前,许多国家的政府和国际组织都认识到了大数据的重要作用,纷纷将开发利用大数据作为夺取新一轮竞争制高点的重要抓手,实施大数据战略,对大数据产业发展有着高度的热情。 美国政府将大数据视为强化美国竞争力的关键因素之一,把大数据研究和生产计划提高到国家战略层面。在美国的先进制药行业,药物开发领域的最新前沿技术是机器学习,即算法利用数据和经验教会自己辨别哪种化合物同哪个靶点相结合,并且发现对人眼来说不可见的模式。根据前期计划,美国希望利用大数据技术实现在多个领域的突破,包括科研教学、环境保护、工程技术、国土安全、生物医药等。其中具体的研发计划涉及了美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局、地质勘探局等6个联邦部门和机构。 目前,欧盟在大数据方面的活动主要涉及四方面内容:研究数据价值链战略因素;资助“大数据”和“开放数据”领域的研究和创新活动;实施开放数据政策;促进公共资助科研实验成果和数据的使用及再利用。 英国在2017年议会期满前,开放有关交通运输、天气和健康方面的核心公共数据库,并在五年内投资1000万英镑建立世界上首个“开放数据研究所”;政府将与出版行业等共同尽早实现对得到公共资助产生的科研成果的免费访问,英国皇家学会也在考虑如何改进科研数据在研究团体及其他用户间的共享和披露;英国研究理事会将投资200万英镑建立一个公众可通过网络检索的“科研门户”。 法国政府为促进大数据领域的发展,将以培养新兴企业、软件制造商、工程师、信息系统设计师等为目标,开展一系列的投资计划。法国政府在其发布的《数字化路线图》中表示,将大力支持“大数据”在内的战略性高新技术,法国软件编辑联盟曾号召政府部门和私人企业共同合作,投入3亿欧元资金用于推动大数据领域的发展。法国生产振兴部部长ArnaudMontebourg、数字经济部副部长FleurPellerin和投资委员LouisGallois在第二届巴黎大数据大会结束后的第二天共同宣布了将投入1150万欧元用于支持7个未来投资项目。这足以证明法国政府对于大数据领域发展的重视。法国政府投资这些项目的目的在于“通过发展创新性解决方案,并将其用于实践,来促进法国在大数据领域的发展”。众所周知,法国在数学和统计学领域具有独一无二的优势。 日本为了提高信息通信领域的国际竞争力、培育新产业,同时应用信息通信技术应对抗灾救灾和核电站事故等社会性问题。2013年6月,安倍内阁正式公布了新IT战略——“创建最尖端IT国家宣言”。“宣言”全面阐述了2013~2020年期间以发展开放公共数据和大数据为核心的日本新IT国家战略,提出要把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。日本著名的矢野经济研究所预测,2020年度日本大数据市场规模有望超过1兆日元。 在重视发展科技的印度,大数据技术也已成为信息技术行业的“下一个大事件”,目前,不仅印度的小公司纷纷涉足大数据市场淘金,一些外包行业巨头也开始进军大数据市场,试图从中分得一杯羹。2016年,印度全国软件与服务企业协会预计,印度大数据行业规模在3年内将到12亿美元,是当前规模的6倍,同时还是全球大数据行业平均增长速度的两倍。印度毫无疑问是美国亦步亦趋的好学生。在数据开放方面,印度效仿美国政府的做法,制定了一个一站式政府数据门户网站https://www.360docs.net/doc/4b16770929.html,.in,把政府收集的所有非涉密数据集中起来,包括全国的人口、经济和社会信息。 我国大数据行业仍处于快速发展期,未来市场规模将不断扩大 ?目前大数据企业所获融资数量不断上涨,二级市场表现优于大盘,我国大数据行业的市

大数据发展现状与未来发展趋势研究

大数据发展现状与未来发展趋势研究 朱孔村 (江苏省科学技术情报研究所,江苏南京210042) 【摘要】数据是信息化时代的“新石油”资源,如何利用好这种“新石油”资源需要大数据技术的支持。文章介绍了大数据技术及其发展历程,概括了当前国内外大数据的发展现状并展望了大数据技术和产业方面的未来发展趋势。 【关键词】大数据;现状;趋势 【中图分类号】TP391【文献标识码】A【文章编号】1008-1151(2019)01-0115-04 Research on the Current Situation and Future Development Trend of Big Data Abstract: Data is the “new petroleum” resource of the information age and how to make good use of this “new petroleum” resource needs the support of big data technology. This paper first introduces the big data technology and its development process and summarizes the current development of big data at home and abroad. Finally, the future development trend of big data technology and industry is prospected. Key words: big data; current situation; trend 1 大数据技术概述 1.1大数据技术 随着物联网、云计算、移动互联网等技术的成熟,以及智能移动终端的普及,全社会的数据量呈指数型增长,全球已经进入以数据为核心的大数据时代。大数据并不是一个新的概念,信息技术发展的每一个阶段都会遇到数据处理的问题,人类需要不停的面对来自数据的挑战。为满足商业结构化数据存储的需求而产生了关系型数据库,为满足互联网时代非结构化数据存储需求而产生了NoSQL技术,而大数据技术的产生是为了解决大型数据集分析的问题。 大数据技术目前还没有一个确切的定义,各行各业有着自己的见解,但总体而言,其关键在于从数量庞大、种类繁多的数据中提取出有用的信息。维基百科从数据处理的角度将大数据定义为一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集。国际数据公司(IDC)给出的报告指出,大数据技术描述了一种新一代技术和构架,以很经济的方式、以高速的捕获、发现和分析技术,从各种超大规模的数据中提取价值[1]。 少量的数据看似杂乱无章,但是当数据累积到一定程度时,就会呈现出一种规律和秩序。大数据的价值就在于数据分析,利用大数据分析技术,从海量数据中总结经验、发现规律、预测趋势,最终为辅助决策服务。《大数据时代》的作者克托·迈尔-舍恩伯格认为:“大数据开启了一次重大的时代转型”,他指出大数据将带来巨大的变革,改变人们的生活、工作和思维方式,改变人们的商业模式,影响人们的经济、政治、科技和社会等各个层面。 1.2大数据发展历程 1.2.1萌芽阶段 20世纪90年代,“大数据”这个术语开始出现。1998年SGI首席科学家John Masey在USENIX大会上提出大数据的概念,他当时发表了一篇名为Big Data and the Next Wave of Infrastress的论文,使用了大数据来描述数据爆炸的现象。但是那时的大数据只表示“大量的数据或数据集”这样的字面含义,还没有涵盖到相关的采集、存储、分析挖掘、应用等技术方法与特征内涵 1.2.2发展阶段 从20世纪末到21世纪初期是大数据的发展期,在这一阶段中大数据逐渐为学术界的研究者所关注,相关的定义、内涵、特性也得到了进一步的丰富。2003至2006年,Google 发布的GFS、MapReduce和BigTable三篇论文对大数据的发展起到重要作用。2006至2009年,大数据技术形成并行运算与分布式系统。2009年,Jeff Dean在BigTable基础上开发了Spanner数据库。随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术如数据仓库、专家系统、知识管理系统等开始被应用。 1.2.3成熟阶段 2011年至今,是大数据发展的成熟阶段,越来越多的研究者对大数据的认识从技术概念丰富到了信息资产与思维变革等多个维度,一些国家、社会组织、企业开始将大数据上升为 总第21卷233期大众科技Vol.21 No.1 2019年1月Popular Science & Technology January 2019 【收稿日期】2018-11-06 【作者简介】朱孔村(1985-),男,山东临沂人,江苏省科学技术情报研究所实习研究员,从事电子政务相关工作。 - 115 -

大数据的国内外研究现状与发展动态分析报告

大数据的国内外研究现状及发展动态分析大数据的概念 产生的背景与意义 上世纪60年代到80年代早期,企业在大型机上部署财务、银行等关键应用系统,存储介质包括磁盘、磁带、光盘等。尽管当时人们称其为大数据,但以今日的数据量来看,这些数据无疑是非常有限的。随着PC的出现和应用增多,企业内部出现了很多以公文档为主要形式的数据,包括Word、Excel文档,以及后来出现的图片、图像、影像和音频等。此时企业内部生产数据的已不仅是企业的财务人员,还包括大量的办公人员,这极大地促进了数据量的增长。互联网的兴起则促成了数据量的第三次大规模增长,在互联网的时代,几乎全民都在制造数据。而与此同时,数据的形式也极其丰富,既有社交网络、多媒体等应用所主动产生的数据,也有搜索引擎、网页浏览等被动行为过程中被记录、搜集的数据。时至今日,随着移动互联网、物联网、云计算应用的进一步丰富,数据已呈指数级的增长,企业所处理的数据已经达到PB级,而全球每年所产生的数据量更是到了惊人的ZB级。在数据的这种爆炸式增长的背景下,“大数据”的概念逐渐在科技界、学术界、产业界引起热议。在大数据时代,我们分析的数据因为“大”,摆脱了传统对随机采样的依赖,而是面对全体数据;因为所有信息都是“数”,可以不再纠结具体数据的精确度,而是坦然面对信息的混杂;信息之“大”之“杂”,让我们分析的“据”也由传统的因果关系变为相关关系。 大数据热潮的掀起让中国期待“弯道超越”的机会,创造中国IT企业从在红海领域苦苦挣扎转向在蓝海领域奋起直追的战略机遇。传统IT行业对于底层设备、基础技术的要求非常高,企业在起点落后的情况下始终疲于追赶。每当企业在耗费大量人力、物力、财力取得技术突破时,IT革命早已将核心设备或元件推进至下一阶段。这种一步落后、处处受制于人的状态在大数据时代有望得到改变。大数据对于硬件基础设施的要求相对较低,不会受困于基础设备核心元件的相对落后。与在传统数据库操作层面的技术差距相比,大数据分析应用的中外技术差距要小得多。而且,美国等传统IT强国的大数据战略也都处于摸着石头过河的试错阶段。中国市场的规模之大也为这一产业发展提供了大空间、大平台。大数据对于中国企业不仅仅是信息技术的更新,更是企业发展战略的变革。随着对大数据的获取、处理、管理等各个角度研究的开展,企业逐渐认识数据已经逐渐演变成“数据资产”。任何硬件、软件及服务都会随着技术发展和需求变化逐渐被淘汰,只有数据才具有长期可用性,值得积累。数据是企业的核心资产,可以是也应该是独立于软硬件系统及应用需求而存在的。大数据是信息技术演化的最新产物,确立了数据这一信息技术元素的独立地位。正因为数据不再是软硬件及应用的附属产物,才有了今天爆炸式的数据增长,从而奠定了大数据的基础。

大数据发展背景与研究现状

大数据发展背景与研究现状 (一)大数据时代的背景 随着计算机存储能力的提升和复杂算法的发展,近年来的数据量成指数型增长,这些趋势使科学技术发展也日新月异,商业模式发生了颠覆式变化。《分 MGI)发 “赢 技术使得在线购物的完成率提升了10%到15%。我国信息数据资源80%以上掌握在各级政府部门手里,但很多数据却与世隔绝“深藏闺中”,成为极大的浪费。2015年,国务院印发《促进大数据发展行动纲要》,明确要求“2018年底前建成国家政府数据统一开放平台”;今年5月,国务院办公厅又印发《政务信息系

统整合共享实施方案》,进一步推动政府数据向社会开放。1 大数据可以把人们从旧的价值观和发展观中解放出来,从全新的视角和角度理解世界的科技进步和复杂技术的涌现,变革人们关于工作、生活和思维的看法。大数据的应用十分广泛,通过对大规模数据的分析,利用数据整体性与涌现性、相关性与不确定性、多样性与非线性及并行性与实时性研究大数据在 。2012年Gartner认为,不到两年时间大数据将成为新技术发展的热点,海量和多样化的信息资产使得大数据需要新的处理模式,才能为数据信息使用者提供有效的信息,使得企业洞察危险的能力增强,流程得以优化,决策更加准确。Victor 在其最新着作《大数据时代——生活、工作与思维的大变革》中指出,大数据 1人民网 26个好用大数据的秘诀

时代要想得到有价值的信息,要从总体而不是少量的数据样本分析与实务相关的所有数据。更加注重数据之间的相关关系,乐于加收纷繁复杂的数据,而不再探求难以捉摸的因果关系和追求数据的精确性。欧盟在其公布的《数字议程》中指出公共数据的市场价值约有320亿欧元,公共数据的开放和再利用可以产生新的商业和工作机会。开放行、公共数据,增加政府的开放和透明度可以给 年9 展的进程。2017年8月30日,国家旅游局、银联商务股份有限公司和中国电信集团联合成立“旅游消费但是数据联合实验室”,并发布了首份研究成果《2017年上半年中国旅游消费大数据报告》。三方在各自的领域有深耕多年的技术、大数据能力、市场资源和经验,通过签署站多合作,可以实现资源共享,优势互 3国家十三五规划纲要

大数据处理技术发展现状及其应用展望

. ,.. 大数据处理技术发展现状及其应用展望 一、定义 著名的管理咨询公司麦肯锡曾预测到:“数据,已经渗透到当今每一个行业和业务职能领域, 成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者 盈余浪潮的到来。”这是大数据的最早定义。业界(于2012年,高德纳修改了对大数据的定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,海量数据量。大数据计量单位至少是PB级别;第二,数据 类型繁多。比如,网络日志、视频、图片、地理位置信息等等都是囊括进来。第三,商业价 值高。第四,处理速度快。 在大数据时代,三分技术,七分数据,得数据者得天下。在大数据时代已经到来的时候要用 大数据思维去发掘大数据的潜在价值。Google利用人们的搜索记录挖掘数据二次利用价值, 比如预测某地流感爆发的趋势;Amazon利用用户的购买和浏览历史数据进行有针对性的书 籍购买推荐,以此有效提升销售量;Farecast利用过去十年所有的航线机票价格打折数据, 来预测用户购买机票的时机是否合适。 大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点。对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具 有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 二、大数据的技术 技术是大数据价值体现的手段和前进的基石。我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。 2.1、云技术 大数据常和云计算联系到一起,因为实时的大型数据集分析需要分布式处理框架来向数十、 数百或甚至数万的电脑分配工作。可以说,云计算充当了工业革命时期的发动机的角色,而大数据则是电。 云计算思想的起源是麦卡锡在上世纪60年代提出的:把计算能力作为一种像水和电一样的 公用事业提供给用户。如今,在Google、Amazon、Facebook等一批互联网企业引领下,一 种行之有效的模式出现了:云计算提供基础架构平台,大数据应用运行在这个平台上。 业内是这么形容两者的关系:没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。 那么大数据到底需要哪些云计算技术呢?这里暂且列举一些,比如虚拟化技术,分布式处理技术,海量数据的存储和管理技术,NoSQL、实时流数据处理、智能分析技术(类似模式识

国内外政务大数据应用发展述评_方向与问题_于施洋

国内外政务大数据应用发展述评:方向与问题 * 于施洋① 王建冬**① 童楠楠①② ①国家信息中心信息化研究部 北京 100045②中国人民大学信息资源管理学院 北京 100872 摘 要:关键词:大数据正在成为国家的重要战略资源,已是社会各界关注的焦点。从大数据的概念入手,界定了大数据概念的内 涵、外延,指出政务大数据应用应成为政府管理改革的全新阶段。基于国内外政务大数据发展现状,在评述国内外政府大数据应用发展的基础上,提出中国政务大数据发展需坚持整体性政府、透明化政府和服务型政府三个基本方向,需避免将将大数据等同于开放数据、共享数据和海量数据三大认识误区,需警惕数据权的恶意使用或过度滥用、大数据带来的信息歧视和互联网公司侵害国家数据主权三大潜在问题。 电子政务;政务大数据;大数据应用;信息资源;数据开放 近年来,大数据在全球范围内受到追捧。据国际数据资讯(IDC)公司监测,全球数据量大约每两年翻一番,预计到2020年,全球将拥有35ZB的数据量。据统计,平均每一秒即有200万用户在使用Google搜索,Facebook注册用户超过10亿,每天生成300TB以上的日志数据。同时,传感网、物联网、社交网络等技术迅猛发展,引发数据规模爆炸式增长,大数据时代已经到来。著名的管理和咨询公司麦肯锡(McKinsey)认为,“大数据已经渗透到工业和商业领域的各个方面,成为影响生产的一个重要因素”,大数据的应用涉及经济、文化、教育、医疗、公共管理等各行各业。正是由于大数据的广泛应用及其背后蕴藏的巨大潜力和价值,许多国家纷纷将“大数据”的建设和发展上升为国家战略,积极推动大数据应用的发展。 中国政府虽已发布《促进大数据发展行动纲要》,将数据定性为国家基础性战略资源,但各级政府在推动政务大数据应用方面,仍存在不少问题。所谓政务大数据,是指政府推动大数据应用发展的过程或大数据在公共服务领域的应用实践。本文在评述国内外政务大数据 *基金项目:国家发展改革委重大问题软科学研究项目“大数据与重大政策评估研究”。**通讯作者 收稿日期:2015-11-09 专题报告 应用发展的基础上,界定了大数据的概念内涵和外延,指出中国政务大数据应用发展的方向及应避免的认识误区和需警惕的潜在问题。 一、大数据的概念内涵及其外延 对于大数据概念的界定,目前尚无统一的认识。由于所从事学科领域的差异,国内外学者对“大数据”有不同的看法。一些学者从计算科学角度出发,认为大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。[1]还有学者从信息资源的角度出发,指出大数据是具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。[2]而近年来,从事社会科学领域研究的学者认为,大数据的概念内涵不应仅仅局限在技术层面:大数据可以定义为在合理时间内采集大规模资料、处理成为常规使用者更有效决策的社会过程。[3]基于现有学者对“大数据”的研究,本文从大数据的内涵、外延出发,分别作界定(参见图1)。

电子商务大数据的发展现状与应用

电子商务大数据的发展现状与应用 随着互联网、云计算和物联网的迅速发展,无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据,数以亿计的用户的互联网服务时时刻刻都在产生巨量的交互数据信息。而基于这些,电子商务产业所产生的大量结构化和半结构化的可视化数据,通过数据挖掘和数据分析等手段,经过过程性和综合性的考量,从而帮助电商企业做全局性、系统性的决策,寻找最优化的解决方案和运营决策,这被称为电商大数据。而与电子商务相关的大数据应用均归属于此概念范畴。 电商产业一般可按照交易方式分为:商业机构对商业机构的电子商务B2B(businesstobusiness),商业机构对消费者的电子商务B2C(businesstocustomer),商业机构对政府管理部门的电子商务B2G(BusinesstoGovernment),消费者对政府管理部门的电子商务C2G(customertoGovernment),消费者对消费者的电子商务C2C(customertocustomer)。也可按照其主要细分领域分为B2B电子商务、网络购物、在线旅游、O2O。而目前为电商大数据带来庞大的数据来源主要是B2B电子商务和网络购物,如2014年年底电子商务的交易规模达万亿元,电子商务的数据量与日俱增的同时,电商大数据产业从最初的阶段逐渐进入高速发展期。 1.产业政策及发展现状 (1)产业政策 中国大数据发展的宏观政策环境不断完善。2012年以来,科技部、发改委、工信部等部委在科技和产业化专项陆续支持了一批大数据相关项目,在推进技术研发方面取得了积极效果。《电子商务“十二五”发展规划》、《工业和信息化部关于推进物流信息化工作的指导意见》等相关政策无不在鼓励电商大数据的快速发展,国务院总理李克强在十二届全国人大二次会议上作政府工作报告时,提出要促进互联网金融健康发展、扩大跨境电商试点、加快4G发展等,推进城市百兆光纤工程和宽带乡村工程,大幅提高互联网网速,在全国推行“三网融合”,鼓励电子商务创新发展。 ①国务院日前印发《关于大力发展电子商务加快培育经济新动力的意见》部署进一步促

国内外大数据经典案例研究

国内外大数据经典案例研究

大数据时代的来临使得产生的数据量呈爆炸式增长,各行各业均面临着海量数据的分析、处理问题。如何运用大数据技术从海量数据中挖掘出有价值的信息,将是今后企业发展的一个巨大挑战。点评收集研究了国内外大数据应用的经典案例,希望可以对读者有所启示。 1、塔吉特百货孕妇营销分析 最早关于大数据的故事发生在美国第二大超市塔吉特百货。孕妇对零售商来说是个含金量很高的顾客群体,但是她们一般会去专门的孕妇商店。人们一提起塔吉特,往往想到的都是日常生活用品,却忽视了塔吉特有孕妇需要的一切。在美国,出生记录是公开的,等孩子出生了,新生儿母亲就会被铺天盖地的产品优惠广告包围,那时候再行动就晚了,因此必须赶在孕妇怀孕前期就行动起来。 塔吉特的顾客数据分析部门发现,怀孕的妇女一般在怀孕第三个月的时候会购买很多无香乳液。几个月后,她们会购买镁、钙、锌等营养补充剂。根据数据分析部门提供的模型,塔吉特制订了全新的广告营销方案,在孕期的每个阶段给客户寄送相应的优惠券。结果,孕期用品销售呈现了爆炸性的增长。2002年到2010年间,塔吉特的销售额从440亿美元增长到了670亿美元。大数据的巨大威力轰动了全美。 点评:这个案例说明大数据在企业营销上的成功,利用大数据技术分析客户消费习惯,判断其消费需求,从而进行精确营销。这种营销方式的关键在于其时机的把握上,要正好在客户有相关需求时才进行营销活动,这样才能保证较高的成功率。 2、沃尔玛“啤酒加尿布”经典案例 总部位于美国阿肯色州的世界著名商业零售连锁企业沃尔玛拥有世界上最

大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析。沃尔玛数据仓库里集中了其各门店的详细原始交易数据,在这些原始交易数据的基础上,沃尔玛利用NCR数据挖掘工具对这些数据进行分析和挖掘,可以很轻松地知道顾客经常一起购买的商品有哪些。一个意外的发现是:“跟尿布一起购买最多的商品竟是啤酒!” 这是数据挖掘技术对历史数据进行分析的结果,反映数据内在的规律。沃尔玛派出市场调查人员和分析师对这一数据挖掘结果进行调查分析,经过大量实际调查和分析,揭示了隐藏在“尿布与啤酒”背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。 既然尿布与啤酒一起被购买的机会很多,于是沃尔玛就在其一个个门店将尿布与啤酒摆放在一起,结果是尿布与啤酒的销售量双双增长。 点评:无论“啤酒加尿布”仅仅是一个传说,还是一个真的发生过,它都已经成为大数据技术应用的一个经典案例。这个故事的意义在于将看似不相关的商品数据放在一起进行分析,找到他们之间的相关性,从而进行交叉营销,促进商品的销量。这种思维方式才是成功的关键。 3、试衣间的大数据应用 传统奢侈品牌PRADA正在向大数据时代迈进。她在纽约及一些旗舰店里开始了大数据时代行动。在纽约旗舰店里,每件衣服上都有RFID码,每当顾客拿起衣服进试衣间时,这件衣服上的RFID会被自动识别,试衣间里的屏幕会自动

云南省大数据建设现状研究

- 31 - 第14期 2018年7月No.14July,2018 随着物联网时代的发展和需要,数据成为人类新一代能源物资,成了变革人类生产、生活以及教育方式的科学决策力量。云南省作为边疆少数民族地区,如何通过把握数据时代发展契机来努力实现经济社会跨越式发展以及成为面向南亚东南亚辐射中心[1],是当前云南省大数据建设的一个重要任务。 1 政府高度重视重点行业和领域大数据的开放开发工作 为贯彻落实国务院印发的《促进大数据发展行动纲要》[2] ,结合云南省实际,于2017年6月制定了《关于重点行业和领域大数据开放开发工作的指导意见》(以下简称《意 见》)[3] 。通过率先开放开发12个重点行业和8个重点领域的大数据,积极探索符合云南地区特色的大数据发展模式。 该《意见》以2018年和2020年为时间节点,分别指出大数据开放发展的双重目标,这将为云南省建设发展大数据指明前进方向。另外,《意见》所述内容也已经明确提出了重点领域和行业大数据开放发展的主要任务,且在文末也附了云南省重点行业和领域大数据开放开发工作重点任务分工表,各重点行业和领域应该各司其职,与新时代的发展握手,加快对数据的开放和共享,增强数据的活力,努力实现云南省经济的跨越式发展。 2 大数据建设的基础环境不断优化2.1 云南省信息产业发展良好2.1.1 产业规模不断壮大 根据统计(见图1),截至2015年12月,云南省电子信息产业各类企业将近400户,其中,规模以上企业有124户,占比31%。规模以上企业分为电子信息制造企业以及软件和信息技术服务企业,分别占比15%和85%。可以看出,云南省所有电子信息产业各类企业,特别是规模及以上企业的发展壮大为大数据的建设发展提供强有力的技术支撑。2.1.2 软件和信息技术服务业增速领先西部省区 据工业和信息化部反馈,西部地区软件业务的收入占全国的11.5%,且增速最快的前5名分别是:云南、安徽、海南、贵州以及陕西(见图2),其软件业务收入分别增长40.2%, 33.3%,31.7%,21.9%和21.9%。云南省近几年在政府的带领 下,紧抓信息产业的发展,这为大数据的建设发展、数据资源的共享融通等方面奠定了良好的基础。 图1 2015年云南省电子信息产业发展情况 图2 2017年上半年,软件和信息技术服务业方面 收入增长率前5名对比 2.1.3 制订了清晰明确的信息产业收入目标根据行业统计(见图3),2015年云南省的通信服务业、电子信息制造业、软件和信息技术服务业的收入分别是311 张国丽,黄永仙,舒 茜*,马映梅 (云南师范大学,云南 昆明 650500) 摘 要:开发与挖掘各重点行业和领域的数据,提升大数据的应用价值,是当前大数据建设的重要任务,对促进云南省经济增 长和转型升级具有重要意义。文章从政府视角、大数据建设基础环境以及已有的大数据研究院着手分析云南省大数据建设现状,以期为云南省大数据的建设发展提供相应的理论支撑。关键词:云南省;大数据建设;现状无线互联科技 Wireless Internet Technology 云南省大数据建设现状研究 作者简介:张国丽(1994— ),女,四川广元人,硕士研究生;研究方向:民族教育信息化。*通信作者:舒茜(1994— ),女,云南昭通人,硕士研究生;研究方向:数字化学习环境与技术。

国内外大数据产业发展状况分析

国内外大数据产业发展状况分析 全球大数据产业发展规模 2014年,全球大数据解决方案不断成熟,各领域大数据应用全面展开,为大数据发展带来强劲动力。2014年全球大数据市场规模达到285亿美元,同比增长53.2%。大数据逐渐成为全球IT支出新的增长点。 2014年数据中心系统支出达1430亿美元,比2013年增长2.3%。大数据对全球IT开支的直接或间接推动将达2320亿美元,预计到2018年这一数据将增长3倍。 中投顾问发布的《2016-2020年中国大数据行业投资分析及前景预测报告》从市场结构分析,2014年,全球大数据市场结构从垄断竞争向完全竞争格局演化。企业数量迅速增多,产品和服务的差异度增大,技术门槛逐步降低,市场竞争越发激烈。在全球大数据市场中,行业解决方案、计算分析服务、存储服务、数据库服务和大数据应用为市场份额排名最靠前的细分市场,分别占据35.4%、17.3%、14.7%、12.5%和7.9%的市场份额。云服务的市场份额为6.3%,基础软件占据3.8%的市场份额,网络服务仅占据了2%的市场份额。 我国大数据产业发展提速 1、基础设施建设率先起步 大数据产业“十三五”发展规划正在制定,2016年下半年将发布。这是实施国家大数据战略的又一政策举措。 大数据将是新的生产要素。政策助推知识开始,云计算、大数据、人工智能是大数据这场“新工业革命”的重要推手。其中,数据是重要资源。在此背景下,众多互联网科技企业以及传统生产企业都在积极布局大数据产业。 统计数据显示,2015年国内大数据产业市场规模已达1105.6亿元,较2014年增长44.15%。其中,大数据基础设施建设、大数据软件和大数据应用分别占比64.53%、25.47%和10%。 目前已有42家计算机行业上市公司披露了2016年上半年报业绩预告,平均增速中位数为15%。从细分领域看,大数据与人工智能子板块平均增速中位数为65%。 随着大数据产业的快速发展,受益顺序为基础设施建设率先起步,并带来数据分析、数据源、数据安全环节的发展。在基础设施方面,数据中心、服务器等领域近年来快速增长。其中,中科曙光、浪潮信息等公司服务器业务收入增长明显。 随着基础设施逐渐完善,数据分析成为了可能。数据分析服务在整体产业收入的占比也代表着大数据 中投顾问·让投资更安全经营更稳健

大数据研究综述

大数据研究综述 摘要:从大数据基本理论,大数据存储与分析处理技术和大数据应用研究三个角度说明当前研究热点,重点比较当前大数据处理工具的优缺点,并深入归纳总结了基于数据存储大数据处理技术,对未来研究进行展望。 关键词:大数据,综述,数据处理,数据挖掘 引言 现代社会提到大数据大家都知道这是近几年才形成的对于数据相关的新名词,在1980年,,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。在 20 世纪 80 年代我国已经有一些专家学者谈到了海量数据的加工和管理,但是由于计算机技术和网络技术的限制大数据未能引起足够的重视,它蕴藏的巨大信息资源也暂时隐藏了起来。随着云计算技术的发展,互联网的应用越来越广泛,以微博和博客为代表的新型社交网络的出现和快速发展,以及以智能手机、平板电脑为代表的新型移动设备的出现,计算机应用产生的数据量呈现了爆炸性增长的趋势。2012年末出版的《大数据时代》的作者英国牛津大学网络学院互联网研究所治理与监管专业教授维克托·尔耶·舍恩伯格在书的引言中说,大数据正在改变人们的生活以及理解世界的方式,而更多的改变正蓄势待发。美国总统奥巴马的成功竞选及连任的背后都有大数据挖掘的支撑,美国政府认为,大数据是“未来的新石油”,并将对大数据的研究上升为国家意志,这对未来的科技与经济发展必将带来深远影响[1]。如今,大数据已成为一项业务上优先考虑的工作任务,因为它能够对全球整合经济时代的商务产生深远的影响。大数据的应用范围如此广泛,与大数据相关的很多问题都引起了专家和学者的重视。大数据最基本的问题-大数据的定义目前还没有一个统一的定论,但大数据作为一种基础性资源需要被处理才能显现其潜在的价值,那么如何更好地处理大数据这种基础性资源就显得特别重要,因为这些问题都关系到大数据核心价值的体现。为此,本文从大数据若干个版本的概念出发,调查分析了大数据的研究和应用现状,重点分析了当前主流的大数据处理工具和技术,最后预测了大数据未来的

大数据研究综述

大数据研究综述

————————————————————————————————作者:————————————————————————————————日期: ?

大数据研究综述 摘要:从大数据基本理论,大数据存储与分析处理技术和大数据应用研究三个角度说明当前研究热点,重点比较当前大数据处理工具的优缺点,并深入归纳总结了基于数据存储大数据处理技术,对未来研究进行展望。 关键词:大数据,综述,数据处理,数据挖掘 引言 现代社会提到大数据大家都知道这是近几年才形成的对于数据相关的新名词,在1980年,,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。在20 世纪 80年代我国已经有一些专家学者谈到了海量数据的加工和管理,但是由于计算机技术和网络技术的限制大数据未能引起足够的重视,它蕴藏的巨大信息资源也暂时隐藏了起来。随着云计算技术的发展,互联网的应用越来越广泛,以微博和博客为代表的新型社交网络的出现和快速发展,以及以智能手机、平板电脑为代表的新型移动设备的出现,计算机应用产生的数据量呈现了爆炸性增长的趋势。2012年末出版的《大数据时代》的作者英国牛津大学网络学院互联网研究所治理与监管专业教授维克托·尔耶·舍恩伯格在书的引言中说,大数据正在改变人们的生活以及理解世界的方式, 而更多的改变正蓄势待发。美国总统奥巴马的成功竞选及连任的背后都有大数据挖掘的支撑,美国政府认为,大数据是“未来的新石油”,并将对大数据的研究上升为国家意志,这对未来的科技与经济发展必将带来深远影响[1]。如今,大数据已成为一项业务上优先考虑的工作任务,因为它能够对全球整合经济时代的商务产生深远的影响。大数据的应用范围如此广泛,与大数据相关的很多问题都引起了专家和学者的重视。大数据最基本的问题-大数据的定义目前还没有一个统一的定论,但大数据作为一种基础性资源需要被处理才能显现其潜在的价值,那么如何更好地处理大数据这种基础性资源就显得特别重要,因为这些问题都关系到大数据核心价值的体现。为此,本文从大数据若干个版本的概念出发,调查分析了大数据的研究和应用现状,重点分析了当前主流的大数据处理工具和技术,最后预测了大数据未来

相关文档
最新文档