大数据发展趋势预测

大数据发展趋势预测
大数据发展趋势预测

FRONTIER 前沿97

CCF大专委2017年大数据发展趋势预测

中图分类号:TP399 文献标识码:A doi: 10.11959/j.issn.2096-0271.2017012

周涛(1979-),男,博士,启明星辰教授级高级工程师、大数据实验室副主任,主要研究方向为大数据安全分析、事件关联分析、入侵检测等。

潘柱廷(1969-),男,启明星辰教授级高级工程师、首席战略官,长期从事信息安全技术和战略研究工作。中国计算机学会(CCF )常务理事,CCF大数据专家委员会委员兼副秘书长,CCF计算机安全专家委员会常务委员,中国互联网协会常务理事,云安全联盟CSA中国区理事。

杨婧(1983-),女,博士后,中国科学院计算技术研究所工程师,中国计算机学会大数据专家委员会秘书处。主要研究方向为数据科学、最优化查询、大数据应用等。在SIGMOD、SSTD、DASFAA、APWEB、WWW Journal等国际一流期刊和会议上发表论文20余篇。

程学旗(1972-),男,中国科学院计算技术研究所研究员、博士生导师、副所长,中国科学院网络数据科学与技术重点实验室主任。中国计算机学会理事、大数据专家委员会秘书长,中国中文信息学会常务理事、信息检索与内容安全专委会副主任。主要研究方向为数据科学、大数据引擎系统、Web搜索与挖掘、大数据安全。

Developing tendency prediction of

big data in 2017 from CCF TFBD

2017012-1

BIG DATA RESEARCH 大数据98

1 引言

2016年中国大数据技术大会(BDTC)于2016年12月8日在北京召开,在此次大会上发布了CCF大数据专家委员会(以下简称大专委)关于未来一年的大数据发展趋势预测,已成为每年大会的保留节目,也成为大专委的一项品牌活动。2017年的趋势报告一经发布,就引发了业界的广泛关注和持续传播。

本次大数据发展趋势预测经历了候选项征集和正式投票两个环节,最终形成的预测选项包括67项发展趋势选项和9项专项调研选项,投票范围面向大专委的正式委员和通讯委员。本次活动共收到有效投票82份,通过对这些投票的汇总、整理和解读,形成了本次对外发布的年度预测,这是大专委群体智慧的结晶。

任何形式的解读都难免掺杂解读者主观因素的影响。下面根据2016年的投票结果,对比往年的趋势预测情况,尽量从客观的角度对本次活动形成的趋势预测选项进行解读,以便读者对各个趋势选项进行理解。

2 2017年大数据发展十大趋势2.1 趋势一:机器学习继续成为大数据智能分析的核心技术

在2016年的调查问卷中,将往年“深度学习继续成为大数据智能分析的核心技术”候选项的主题词,由“深度学习”调整为“机器学习”。做出这一调整的理由是深度学习只是机器学习领域的一个分支,虽然近年来在应用领域发展迅速,但其在算法层面上相对于传统神经网络算法并无本质上的创新;用机器学习取代深度学习,更能体现大数据智能分析的实质。

这一调整的效果立竿见影,该项得到了超过半数的投票专家的认可,使其成为得票最高的趋势选项。大数据的核心价值在于蕴含在大数据之中的、深层次的信息和知识,而如果没有机器学习技术分析大数据,对大数据核心价值的利用将无从谈起。随着机器学习与数据科学家们的关系越来越紧密,掌握机器学习的基础技能对数据科学领域的职业发展而言将成为一种必需技能。在大数据时代,依靠大数据管理和高性能计算的支持,机器学习将成为大数据智能分析的核心技术。

2.2 趋势二:人工智能和脑科学相结合,成为大数据分析领域的热点

近年来,随着深度学习技术在图像处理、自然语言处理等领域的成功应用,人工智能又迎来了新一轮的发展浪潮。2016年3月,G o ogle公司的围棋A I软件“AlphaGo”战胜了顶尖职业棋手李世石九段,人类失守被视为“人类最后的智力骄傲”的围棋领域,引发了全社会的高度关注。此外,2016年恰逢“人工智能60周年”,在计算机领域的各项活动中人工智能都受到了广泛宣传。在此背景下,该候选项成为得票的榜眼就不难理解了。

脑科学是以人类大脑为研究对象的学科,在人工智能的研究中有一个流派,倾向于认为对大脑的恰当模拟会是制造出人工智能的关键。但事实上,直到今天,人们对人脑工作原理的了解仍然处于初级阶段,更谈不上对它的精确模拟了。目前,“类脑计算”最成功的例子就是深度学习,如果说基于对脑科学如此初级的认识,就产生了这样积极的效果,那么在对脑科学持续

2016016-98 2017012-2

FRONTIER 前沿99

研究的基础上进一步优化人工智能理论及应用,其效果就更值得期待。

2.3 趋势三:大数据安全与隐私令人忧虑

这是十大趋势中唯一影响大数据发展的制约因素。回顾历年的趋势预测可以发现,安全和隐私几乎每年都会排在第3、第4的位置。对安全和隐私的担忧使得数据开放步伐放慢,使得大家顾虑大数据的深度应用可能会带来负面价值,使得其成为大数据发展的重要威胁,这是需要解决的一个问题。

事实上,在信息系统建设中安全滞后于业务的发展,已经成为了一种惯例。系统的建设者首先要解决的是业务问题,在安全问题威胁到业务系统的正常运行时,才会考虑解决与之相关的安全问题。回顾大数据生态系统的发展历程,发现这种规律仍然存在。以Hado op为例,早期的Hadoop版本中没有考虑对计算节点的认证、对数据的访问控制,而是仅仅考虑了分布式计算架构的核心问题。但随着Hadoop 生态系统的逐渐完善,目前已经可以通过Kerberos对节点和用户进行身份认证;通过Apache Ranger和Apache Sentry对数据进行细粒度的访问控制;采用Apache Knox作为集群的统一安全访问入口;通过Apache Eagle进行异常行为检测和性能监控等。此外,对大数据的脱敏和匿名化技术也逐渐发展成熟。相信随着大数据应用越来越广泛、整个生态系统发展会越来越完善,对大数据安全和隐私的担忧可以通过技术手段逐渐化解。

2.4 趋势四:多学科融合与数据科学兴起

该选项同样是历年趋势预测的常客。大数据技术是多学科多技术领域的融合,大

数据应用更是与多领域交叉融合,这种交叉

融合催生了数据科学的产生和兴起。可以看

到很多数据相关的专门实验室、专项研究院

所相继出现,许多高校开展了以大数据技术

及应用为特色的学位教育,数据科学作为一

门新兴学科得到了持续发展。

数据科学的发展,反过来又促进了多

学科的融合。许多学科研究的方向表面上

看大不相同,背后却有相同的数据科学和

计算科学的基础。例如医学和语言学是两

个完全不同的学科,但如果在大数据的基

础上借助人工智能实现智能诊疗和机器翻

译,所采用的底层技术很大程度上是相通

的。预期未来许多前沿学科的发展,都要

依赖于本学科领域知识、数据科学与计算

科学之间的融合。

2.5 趋势五:大数据处理多样化模式

并存融合,流计算成主流模式之一

目前,大数据技术的应用已经从互联

网行业逐渐扩展到各个传统行业,早已不

再是什么“新”技术。作为一个可供佐证的

论据,美国咨询公司Gartner在2015年底

发布的新兴技术成熟度曲线中,首次缺失

了大数据的身影。Gartner对此的解释是

大数据的应用已经渗透到各行各业,应用

模式也已成熟,不再是新兴技术。

由于大数据应用场景复杂多样,在不

同的环境中,对数据产生速度、存储容量、

一致性、实时性、容错性等方面的要求千

差万别,很难有一个数据处理平台能满足

所有场景的需求,这就导致了大数据处理

模式多样化的现状。仅以NoSQL数据库为

例,截至目前开源NoSQL数据库项目已超

过225个,每个项目都有不同的数据处理

模式。即使在同一个大数据业务系统建设

中,为了适应不同的业务需求而综合采用

2017012-3

BIG DATA RESEARCH 大数据100

SQL、NoSQL和NewSQL等“混搭”的处理架构也已成为常态。

在众多处理模式中,流计算的发展格外引人注目。随着大数据应用场景对实时性的要求越来越高,流计算有可能超越传统Hadoop平台的批处理模式,成为主流的大数据计算模式。从开源生态圈来看,可供选择的流计算工具越来越丰富,Spark Streaming、Storm、Flink、Apex 等工具快速迭代,Heron等新型工具不断涌现,Kafka也推出了流计算模块Kafka Stream;从架构来看,Kappa架构逐渐被接受,批处理成为了流计算的特例。

2.6 趋势六:数据的语义化和知识化是数据价值的基础问题

数据语义化和知识化是首次进入十大发展趋势预测的选项。数据语义化是指用特有的属性格式化文档内容,使得机器可以理解其内容;数据知识化是指挖掘和展示数据中的信息和知识。从Linked of Data的发展(目前为百亿三元组量级),到Google知识图谱和多种自然语言问答应用的出现,可以推断广大网络/移动用户在大数据时代获取信息时,越来越需要数据和信息的知识化组织和语义关联,也说明普通的个人用户从大数据中获得知识和价值是一个基本需求。

2.7 趋势七:开源成为大数据技术生态主流

大数据技术生态是伴随着Hadoop的开源起步的,预测开源会继续成为技术生态的主流形式。开源技术的蓬勃发展,大大降低了大数据的应用门槛,有力推动了基于大数据的业务模式在各行各业落地,也给传统数据管理厂商带来了严峻的挑战。

目前,大数据生态圈的发展势头迅猛,每当现有的技术不能满足新的应用模式时,总会产生多个与之相关的开源项目,从而带动新一轮的技术升级。在参与者方面,专业大数据企业、互联网企业、高等院校、科研机构,乃至某些政府机构和部门,都成了开源软件的贡献者。另外也看到,来自中国的开源软件及贡献者越来越多地进入了全球大数据生态圈,也促进了大数据技术在国内的发展。

2.8 趋势八:政府大数据发展迅速

政府大数据同样是首次进入十大发展趋势预测的选项,反映了大数据专家委员会的专家们对政府引导大数据应用的期待。政府的各级职能部门在日常管理中积累了大量的数据,特别是一些管理机构独有的、与人民生活密切相关的数据。笔者预测,一些拥有大数据的政府部门会利用积累的数据,采用大数据技术进行分析,提升社会治理水平。

另一方面,政府的数据是利用全社会的公共资源采集、存储和管理的,也是一种公共资源,也应当在经过必要的技术处理后为全社会所共享。目前,部分省市已经开放了多种类型的城市数据,中国政府已经有了数据整合的计划,相信这种趋势会越来越明显。

2.9 趋势九:推动数据立法,重视个人数据隐私

数据立法从另外一个角度上体现了专家们对大数据带来的隐私问题的担忧。人们在享受互联网上各项服务时,越追求服务的便捷化、个性化,就需要提供越多的个人数据,个人面临的数据隐私风险就越

2016016-100 2017012-4

FRONTIER 前沿101

严重。可以说,个人数据隐私与个性化服务之间本身就是一对矛盾。

单凭技术手段解决个人数据隐私问题是远远不够的,必须采用技术和管理并重的方式,这就需要推动相关的数据立法。要从数据的全生命周期进行综合考虑,从法律层面对数据的采集、传输、流转、交易、使用和销毁等环节做出明确约束,使得个人数据隐私保护有法可依。

2.10 趋势十:可视化技术和工具提升大数据分析工具的易用性

可视化也连续多年成为十大发展趋势预测的选项,2016年还占据了榜首的位置。2017年的投票关注度虽有所下降,但还是幸运占据了十大趋势的最后一席。

可视化是通过把复杂的数据转化为可以交互的图形,帮助用户更好地理解分析数据对象,发现、洞察其内在规律。它使得大数据能够为更多人理解、使用,使得大数据的使用者从少数专家扩展到更广泛的民众。笔者认为可视化技术,尤其是交互式可视化分析技术,是将人的直观分析能力与机器的强大计算能力相结合的有效方式,是提升大数据分析工具易用性的重要手段。

3 大数据发展专项调研分析

3.1 最令人瞩目的应用领域

大数据的发展最直接的推动力来自于应用,大专委5年来都做了“最令人瞩目的应用领域”的专项调研,结果见表1。这5年以来,互联网和金融一直是排在前三的领域。尤其近4年的调研,互联网、金融和健康医疗一直排在前三甲。2017年排在其后的城镇化和制造业等领域,得票数与前三相去甚远。而健康医疗超越金融排在第2位,其原因可谓多样。这也许和互联网金融及其所面临的风险有某种关联度,反映出专家们对应用领域的关注度有了一些微调。

3.2 在数据资源流转上会有什么举措

表2是从2015年开始做的关于“数据资源流转”的专项调研。做研究和应用都有一个切实难题就是“没有数据”“数据从哪里来”。可以看到,2017年的结果有一个有

表1 大数据应用最令人瞩目领域调查结果对比

序号2013年2014年2015年2016年2017年

1医疗互联网、电子商务互联网、电子商务互联网、电子商务互联网、电子商务

2金融金融金融金融健康医疗

3电子商务健康医疗健康医疗健康医疗金融

4城市管理舆情分析、情报分析城镇化、智慧城市城镇化、智慧城市城镇化、智慧城市

5社会安全、犯罪调查舆情分析、情报分析制造业、工业大数据

表2 数据资源流转举措调查结果对比

序号2016年2017年

1会自己收集大量数据会自己收集大量数据

2会利用数据提供服务会利用数据提供服务

3会买数据集会只下载和获得免费数据集

4会只下载和获得免费数据集会买数据集

5没有数据流转考虑;会免费提供数据集;会提供数据流转和交易的中介

服务;会卖数据;会进行国际数据交换

会免费提供数据集

2017012-5

BIG DATA RESEARCH 大数据102

意思的小变化,“会买数据集”退到第4位,而且票数和前面3项的差距也较大。这解释为当前大家对数据流转和数据交易并不抱太大的期望值,数据的流转并没有真正形成一个良好的环境和市场。因此,大家转而倾向于自己搜集数据、下载并获得的免费数据,而不寄希望于通过交易和价值交换带来有用的数据集,尤其对量较大的数据集的期望值在降低。当然,“会免费提供数据集”能够排到第5位,也让大家嗅到了一点共享的气息。

这条预测反映的问题其实还是比较严重的。数据只有流转起来才能产生巨大价值,促进并解决这一窘境,对整个大数据领域和数据领域来说极为重要。

3.3 与大数据最匹配的概念

本项也是从2016年开始做的专项调研,见表3。从调研结果来看,与大数据最匹配的概念受2017年度热门话题影响较大。2016年专家们认为最匹配的概念是“互联网+”,2017年排名前三的选项中,有两项都与智能计算相关。很明显,大家对2017年的预测延续了2016年的热门话题“人工智能”。

3.4 我国大数据发展的最主要推动者

本项关注到底是什么样的力量在推动大数据的技术、产业、应用的发展,见表4。2015年调研结果是大型互联网公司、政府机构和大学科研院所等。在2016年做的第二次调研中,科研院所从名单中消失了,大家认为大学和科研院所并没有直接带来资本力量和各种资源。或许受到国家提出的“双创”概念影响,2016年创业公司成为一个大家寄希望的推动者,但2017年创业公司从这个名单中消失了。这个推动者名单中,只剩下大型互联网公司和政府机构,其他的票数都很少。这个专项调研结果与大数据发展趋势十大预测中第8条“政府大数据发展迅速”相符。互联网应用对大数据的推动力量是毋庸置疑的,真正新的推动力量只有政府机构这个选项。大家期望政府在治理理念上的变化、治理方法上的更新,带来对大数据应用的真实需求。

3.5 大数据发展阶段判断

本项借用G a r t n e r技术成熟度曲线中对技术发展阶段的划分,评估大家对大数据的当前发展阶段的看法,见表5。从这6个阶段的投票分布来看,整体上大专

表3 与大数据最匹配的概念调查结果对比

序号2016年2017年

1互联网+智能计算或认知计算2云计算云计算

3智慧城市机器人和人工智能4物联网、移动互联网物联网、智慧城市5大众创业万众创新、工业互联网(工业

4.0)、智能生活设备、一带一路

表4 我国大数据发展的最主要推动者调查结果对比

序号2015年2016年2017年

1大型互联网公司大型互联网公司大型互联网公司2政府机构政府机构政府机构

3国内大学和科研院所创业企业

4公共服务机构

5创业企业

表5 大数据发展阶段判断调查结果对比

发展阶段2015年2016年2017年极为初级17%33%16%

即将快速增长31%40%24%

爆发增长中10%9%23%达到一个顶峰,上升乏力18%4%7%

达到一个顶峰,将下降和幻灭5%0%4%

稳步成长中20%14%26% 2016016-102

2017012-6

FRONTIER 前沿103

委的专家们对大数据的发展前景还是持乐观态度,也就是第2、第3和第6阶段占到主流,超过了70%的比例。而且有相当多的专家(26%)认为大数据已经过了幻灭期而进入稳定增长时期,也就是低风险而高价值创造的时期。虽然大数据的泡沫破裂期是不是真的度过,在大专委的专家中还有一定分歧,但总体来说对大数据前景的看好还是毋庸置疑的。

4 结束语

纵观本次2017年度大数据发展趋势预测,可以看到如下特点。

●与纯粹技术相关的预测条目比例高。往年预测中有很多关于产业、资本、政策、生态、人才教育、职业等方面的条目,本次预测的十大趋势中,有7项是关于具体技术的,包括机器学习、人工智能、学科融合、处理多样性、流计算、语义化、开源、可视化等,这预示着专家们更寄希望于从技

术本身寻求突破。

●政策法规的动力和规范作用受到关

注。从第8和第9条预测可以看出,大专委

的专家们除了关注技术突破,还期望在政

策和法规上能给予大数据发展有效的帮

助。换句话说,大家在技术之外的发展诉

求中,在市场力量和政府力量的天平中,更

偏重于谋求政府的力量给予支持。当然,

这也得益于最近一年政府方面在大数据方

向上的明确态度,也得益于全国人民代表

大会常务委员会对于《中华人民共和国网

络安全法》的通过和颁布。

●对安全和隐私问题的关注成为常

态。可以看到,大数据安全和隐私问题条

目每年都在预测中出现,在大数据实际应

用中这也成为了严重的制约因素。对这一

问题的解决,需要采用技术和管理相结合

的手段。为此,一方面大数据生态圈的安全

工具越来越丰富,另一方面对数据立法的

期待也出现在了本次预测选项中。 □

2017012-7

大数据专业发展前景如何

大数据是目前最火热的一个词了,想必所有人,只要你接触网络,那你就应该听说过这个词。然而更多的人也只是听说过而已,对大数据并没有过多的了解,前几天我好多朋友就问我,大数据这么火,那它到底是做什么呢,这么火热的大数据前景究竟怎么样?今天我们就来探讨一下。 一、大数据的前景中国拥有世界上五分之一的人口,很多行业内专业人士断定中国在未来将成为大数据最重要的市场。中国的发展正在处于快速的上升期,中国产生的数据将是巨大的,而巨大的数据对大数据的发展将起到促进的作用,而大数据在中国市场的发展也将领先。如今,大数据作为中国官方重点扶持的战略性新兴产业,已逐步从概念走向落地“大数据”和“虚拟化”两大热门领域得到了广泛关注和重视,90%企业都在实用大数据。大数据将给中国的企业带来更广泛的发展机会,是值得大家重视的一个市场。 二、大数据发展的几大方向

方向一:大数据分析领域快速发展数据蕴藏价值,但是数据的价值需要用IT技术去发现、去探索,数据的积累并不能够代表其价值的多少。方向二:分布式存储有了用武之地大数据的特点就是数量多且大,这就使得存储的管理面临着挑战,这个问题就需要新的技术来解决,分布式存储技术将作为未来解决大数据存储的重要技术。方向三:大数据与云技术的结合如果再找一个可以跟大数据并驾齐驱的IT热词,云计算无疑是跟大数据关系非常大的一个词语。方向四:大数据将成为企业IT核心随着大数据价值逐渐被发展,大数据将成为企业IT的核心,毕竟在这个以盈利为主导的行业环境中,谁能够为企业带来更多的价值就将会更重要。 三、大数据就业前景好,工资高。大数据技术人才在中国市场目前非常紧缺,因此企业也是开出了高薪聘请这类高端人才。北大青鸟佳音校区为您提供一个好的平台,让你深入接触大数据,实现你的高薪就业梦,北大青鸟佳音校区为您扬帆起航。

2019年大数据测试答案

智慧健康医疗 1、CAD在医疗健康领域的英文全称是()Computer Aided Diagnosis 2、不属于AI健康医疗生态系统的是()制药生态 3、不属于慢性疾病的是()艾滋病 4、AI院前管理包括()预测和干预 5、AI医疗健康技术体系的基础层不包括()芯片 6、AI医疗健康发展的核心要素是()数据 7、我国首次研发的AI医疗系统是面向()中医 8、第3次AI浪潮的到来主要依赖于()深度学习 9、目前AI医疗健康市场最成熟的是()辅助医疗影像诊断 10、我国慢性疾病增加,与老龄化加剧的关系()强相关 11、AI医疗健康的核心技术体系主要包括()传感器技术存储技术传输技术 12、AI辅助诊断属于()院中管理 13、婴幼儿时期的环境暴露不会影响个体后期的身体健康。错误 14、以下不属于大数据时代特征的是()数据处理速度迅速提升 15、以下哪一项不是人工智能发展的必要条件()机器学习 16、以下哪一项不属于健康医疗大数据来源()购物数据 17、以下不属于机器学习研究范畴的是()专家系统 18、以下属于人工智能在医疗领域应用的是()多选疾病预测辅助诊断药物个性化推荐 19、以下对大数据描述正确的是()大数据本质在于数据的关联分析 20、以下不属于弱人工智能特点的是()自适应能力 21、人工智能技术发展出现几次低潮的原因包括()多选算法研究瓶颈计算能力瓶颈数据有限 22、以下说法正确的是()人工智能就是深度学习 23、以下说法正确的是()健康医疗领域数据存在孤岛现象 24、以下说法正确的是()即使在大数据时代,统计分析仍然具有重要的作用 25、以下关于人工智能、机器学习和深度学习说法正确的是() 机器学习或深度学习是实现人工智能的一种方法

大数据发展趋势答案

大数据发展趋势势 2011年,IBM的“沃森”超级计算机在美国著名智力竞赛节目《危险边缘》上击败两名人类选手而夺冠。(3分) ? A. 是 ? B. 否 北京航空航天大学创办了国内第一个“大数据科学与应用”软件工程硕士专业。(3分) ? A. 是 ? B. 否 人工智能够和人一样进行感知、认知、决策、执行的人工程序或系统。(3分) ? A. 是 ? B. 否

大数据开发的根本目的是以数据分析为基础,帮助人们做出更明确的决策,优化企业和社会运转。(3分) ? A. 是 ? B. 否 机器学习就是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测。(3分) ? A. 是 ? B. 否 目前,我国政府、企业和行业信息化系统建设往往缺少统一规划和科学论证,系统之间缺乏统一的标准,形成了众多“信息孤岛”。(3分) ? A. 是 ? B. 否 当前,企业提供的大数据解决方案大多基因Hadoop开源项目。(3分)

A. 是 ? B. 否 由于大数据处理多样性的需求,目前出现了多种典型的计算模式,包括大数据查询分析计算、批处理计算、流式计算、图计算等。(3分) ? A. 是 ? B. 否 大数据分为“结构化数据“与”非结构化数据”。(3分) ? A. 是 ? B. 否 大数据成熟催化了人工智能的进步,深度学习带来算法上的突破则带来了人工智能浪潮。(3分)

A. 是 ? B. 否 知识图谱是一种基于图的数据结构,由节点和边组成。(3分) ? A. 是 ? B. 否 大数据的发展趋势中的智能化关键技术包括感知技术、自然语言技术、交互技术以及决策等。(3分) ? A. 是 ? B. 否 2012年7月国务院发布的《“十二五”国家战略性新兴产业发展规划》中明确提出支持海量数据存储、处理技术的研发和产业化。(3分) ?

(完整word版)中国移动探索大数据和人工智能参考答案

探索大数据和人工智能参考答案 1、下列选项中,不是大数据发展趋势的是? A.大数据分析的革命性方法出现 B.大数据与云计算将深度融合 C.大数据一体机将陆续发布 D.大数据未来可能会被淘汰 2、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。 A. 首席数据官 B. 首席科学家 C.首席执行官 D.首席架构师 3、在Spark的软件栈中,用于机器学习的是 A. Spark Streaming B. Mllib C. GraphX D. SparkSQL 4、MPP是指? A. 大规模并行处理系统 B. 受限的分布式计算模型 C.集群计算资源管理框架 D.分布式计算编程框架 5、以下哪个场景可以称为大数据场景? A.故宫游客人数 B.故宫门票收入 C.美团APP的定位信息 D.文章内容 6、以下应用没有使用你的地理位置信息的是? A. 美团 B. 滴滴 C. 高德地图 D. Word 7、Hadoop是()年诞生的? A. 1985-1985 B. 1995-1996 C. 2005-2006 D. 2015-2016 8、HBASE的特点不包括哪些? A. 面向行 B.稀疏性 C. 多版本 D.高可靠性 9、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?

A. Reduce B. Hash C. Clean D. Loading 10、Flume采用了三层架构,分别为agent,collector和() A. Map B. storage C. Shuffle D. Hash 11、在Spark的软件栈中,用于交互式查询的是 A. SparkSQL B. Mllib C. GraphX D. Spark Streaming 12、下列选项中能够正确说明大数据价值密度低的是? A. 100TB数据中有50TB有效数据 B. 1TB数据中有1KB有效数据 C. 100PB数据中有100PB有效数据 D. 10EB数据中有10EB有效数据 13、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。 A. AlphaGo B. 深蓝 C. 图灵机模型 D. 深度学习机器人 14、下列选项中,不是人工智能的算法中的学习方法的是? A. 重复学习 B. 深度学习 C.迁移学习 D.对抗学习 15、对抗学习中两个网络互相竞争,一个负责生成样本,那么另一个负责做什么? A. 判别样本 B. 计算样本 C. 统计样本 D. 生成样本 16、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是? A. AI B. BI C. AL D. AF 17、下列选项中,哪项是由谷歌开发的人工智能算法框架? A. Kafka

大数据发展趋势标准答案

大数据发展趋势答案

————————————————————————————————作者:————————————————————————————————日期:

大数据发展趋势势 2011年,IBM的“沃森”超级计算机在美国著名智力竞赛节目《危险边缘》上击败两名人类选手而夺冠。(3分) ? A. 是 ? B. 否 答题情况:正确选项:A你答对了! 北京航空航天大学创办了国内第一个“大数据科学与应用”软件工程硕士专业。(3分) ? A. 是 ? B. 否 答题情况:正确选项:A你答对了! 解析:暂无解析! 人工智能够和人一样进行感知、认知、决策、执行的人工程序或系统。(3分) ? A. 是 ?

答题情况:正确选项:A你答对了! 解析:暂无解析! 大数据开发的根本目的是以数据分析为基础,帮助人们做出更明确的决策,优化企业和社会运转。(3分) ? A. 是 ? B. 否 答题情况:正确选项:A你答对了! 机器学习就是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测。(3分) ? A. 是 ? B. 否 答题情况:正确选项:A你答对了! 解析:暂无解析! 目前,我国政府、企业和行业信息化系统建设往往缺少统一规划和科学论证,系统之间缺乏统一的标准,形成了众多“信息孤岛”。(3分) ?

? B. 否 答题情况:正确选项:A你答对了! 解析:暂无解析! 当前,企业提供的大数据解决方案大多基因Hadoop开源项目。(3分) ? A. 是 ? B. 否 答题情况:正确选项:A你答对了! 解析:暂无解析! 由于大数据处理多样性的需求,目前出现了多种典型的计算模式,包括大数据查询分析计算、批处理计算、流式计算、图计算等。(3分) ? A. 是 ? B. 否 答题情况:正确选项:A你答对了!

国内外大数据发展现状和趋势(2018)

行业现状 当前,许多国家的政府和国际组织都认识到了大数据的重要作用,纷纷将开发利用大数据作为夺取新一轮竞争制高点的重要抓手,实施大数据战略,对大数据产业发展有着高度的热情。 美国政府将大数据视为强化美国竞争力的关键因素之一,把大数据研究和生产计划提高到国家战略层面。在美国的先进制药行业,药物开发领域的最新前沿技术是机器学习,即算法利用数据和经验教会自己辨别哪种化合物同哪个靶点相结合,并且发现对人眼来说不可见的模式。根据前期计划,美国希望利用大数据技术实现在多个领域的突破,包括科研教学、环境保护、工程技术、国土安全、生物医药等。其中具体的研发计划涉及了美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局、地质勘探局等6个联邦部门和机构。 目前,欧盟在大数据方面的活动主要涉及四方面内容:研究数据价值链战略因素;资助“大数据”和“开放数据”领域的研究和创新活动;实施开放数据政策;促进公共资助科研实验成果和数据的使用及再利用。 英国在2017年议会期满前,开放有关交通运输、天气和健康方面的核心公共数据库,并在五年内投资1000万英镑建立世界上首个“开放数据研究所”;政府将与出版行业等共同尽早实现对得到公共资助产生的科研成果的免费访问,英国皇家学会也在考虑如何改进科研数据在研究团体及其他用户间的共享和披露;英国研究理事会将投资200万英镑建立一个公众可通过网络检索的“科研门户”。 法国政府为促进大数据领域的发展,将以培养新兴企业、软件制造商、工程师、信息系统设计师等为目标,开展一系列的投资计划。法国政府在其发布的《数字化路线图》中表示,将大力支持“大数据”在内的战略性高新技术,法国软件编辑联盟曾号召政府部门和私人企业共同合作,投入3亿欧元资金用于推动大数据领域的发展。法国生产振兴部部长ArnaudMontebourg、数字经济部副部长FleurPellerin和投资委员LouisGallois在第二届巴黎大数据大会结束后的第二天共同宣布了将投入1150万欧元用于支持7个未来投资项目。这足以证明法国政府对于大数据领域发展的重视。法国政府投资这些项目的目的在于“通过发展创新性解决方案,并将其用于实践,来促进法国在大数据领域的发展”。众所周知,法国在数学和统计学领域具有独一无二的优势。 日本为了提高信息通信领域的国际竞争力、培育新产业,同时应用信息通信技术应对抗灾救灾和核电站事故等社会性问题。2013年6月,安倍内阁正式公布了新IT战略——“创建最尖端IT国家宣言”。“宣言”全面阐述了2013~2020年期间以发展开放公共数据和大数据为核心的日本新IT国家战略,提出要把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。日本著名的矢野经济研究所预测,2020年度日本大数据市场规模有望超过1兆日元。 在重视发展科技的印度,大数据技术也已成为信息技术行业的“下一个大事件”,目前,不仅印度的小公司纷纷涉足大数据市场淘金,一些外包行业巨头也开始进军大数据市场,试图从中分得一杯羹。2016年,印度全国软件与服务企业协会预计,印度大数据行业规模在3年内将到12亿美元,是当前规模的6倍,同时还是全球大数据行业平均增长速度的两倍。印度毫无疑问是美国亦步亦趋的好学生。在数据开放方面,印度效仿美国政府的做法,制定了一个一站式政府数据门户网站https://www.360docs.net/doc/e710410610.html,.in,把政府收集的所有非涉密数据集中起来,包括全国的人口、经济和社会信息。 我国大数据行业仍处于快速发展期,未来市场规模将不断扩大 ?目前大数据企业所获融资数量不断上涨,二级市场表现优于大盘,我国大数据行业的市

2017公需科目《大数据前沿技术及应用》第八章答案

2017 年公需科目《大数据前沿技术及应用》 第八章:大数据发展趋势答案 1、大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断某件事情必然发生。(3 分) A. 是 B. 否正确选项:B 2、大数据的发展趋势中的智能化关键技术包括感知技术、自然语言技术、交互技术以及决策等。(3 分) A. 是 B. 否正确选项:A 3、大数据分为“结构化数据“与”非结构化数据” 。(3 分) A. 是 B. 否正确选项:A 4、2011 年,IBM 的“沃森”超级计算机在美国著名智力竞赛节目《危险边缘》上击败两名人类选手而夺冠。(3 分) A. 是 B. 否正确选项:A 5、2012 年 7 月国务院发布的《“十二五”国家战略性新兴产业发展规划》中明确提出支持海量数据存储、处理技术的研发和产业化。(3 分) A. 是 B. 否正确选项:A 6、机器学习就是通过算法,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测。(3 分) A. 是 B. 否正确选项:A

7、由于大数据处理多样性的需求,目前出现了多种典型的计算模式,包括大数据查询分析计算、批处理计算、流式计算、图计算等。(3 分) A. 是 B. 否正确选项:A 8、大数据开发的根本目的是以数据分析为基础,帮助人们做出更明确的决策,优化企业和社会运转。(3 分) A. 是 B. 否正确选项:A 9、人工智能够和人一样进行感知、认知、决策、执行的人工程序或系统。(3 分) A. 是 B. 否正确选项:A 10、知识图谱是一种基于图的数据结构,由节点和边组成。(3 分) A. 是 B. 否正确选项:A 11、大数据成熟催化了人工智能的进步,深度学习带来算法上的突破则带来了人工智能浪潮。(3 分) A. 是 B. 否正确选项:A 12、当前,企业提供的大数据解决方案大多基因 Hadoop 开源项目。(3 分) A. 是 B. 否正确选项:A 13、北京航空航天大学创办了国内第一个“大数据科学与应用”软件工程硕士专业。(3 分) A. 是 B. 否正确选项:A 14、数据结构”是指不存储数据库之中的,包括电子邮件、文本文件、图像、视频等数据。(3 分)

大数据发展现状与未来发展趋势研究

大数据发展现状与未来发展趋势研究 朱孔村 (江苏省科学技术情报研究所,江苏南京210042) 【摘要】数据是信息化时代的“新石油”资源,如何利用好这种“新石油”资源需要大数据技术的支持。文章介绍了大数据技术及其发展历程,概括了当前国内外大数据的发展现状并展望了大数据技术和产业方面的未来发展趋势。 【关键词】大数据;现状;趋势 【中图分类号】TP391【文献标识码】A【文章编号】1008-1151(2019)01-0115-04 Research on the Current Situation and Future Development Trend of Big Data Abstract: Data is the “new petroleum” resource of the information age and how to make good use of this “new petroleum” resource needs the support of big data technology. This paper first introduces the big data technology and its development process and summarizes the current development of big data at home and abroad. Finally, the future development trend of big data technology and industry is prospected. Key words: big data; current situation; trend 1 大数据技术概述 1.1大数据技术 随着物联网、云计算、移动互联网等技术的成熟,以及智能移动终端的普及,全社会的数据量呈指数型增长,全球已经进入以数据为核心的大数据时代。大数据并不是一个新的概念,信息技术发展的每一个阶段都会遇到数据处理的问题,人类需要不停的面对来自数据的挑战。为满足商业结构化数据存储的需求而产生了关系型数据库,为满足互联网时代非结构化数据存储需求而产生了NoSQL技术,而大数据技术的产生是为了解决大型数据集分析的问题。 大数据技术目前还没有一个确切的定义,各行各业有着自己的见解,但总体而言,其关键在于从数量庞大、种类繁多的数据中提取出有用的信息。维基百科从数据处理的角度将大数据定义为一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集。国际数据公司(IDC)给出的报告指出,大数据技术描述了一种新一代技术和构架,以很经济的方式、以高速的捕获、发现和分析技术,从各种超大规模的数据中提取价值[1]。 少量的数据看似杂乱无章,但是当数据累积到一定程度时,就会呈现出一种规律和秩序。大数据的价值就在于数据分析,利用大数据分析技术,从海量数据中总结经验、发现规律、预测趋势,最终为辅助决策服务。《大数据时代》的作者克托·迈尔-舍恩伯格认为:“大数据开启了一次重大的时代转型”,他指出大数据将带来巨大的变革,改变人们的生活、工作和思维方式,改变人们的商业模式,影响人们的经济、政治、科技和社会等各个层面。 1.2大数据发展历程 1.2.1萌芽阶段 20世纪90年代,“大数据”这个术语开始出现。1998年SGI首席科学家John Masey在USENIX大会上提出大数据的概念,他当时发表了一篇名为Big Data and the Next Wave of Infrastress的论文,使用了大数据来描述数据爆炸的现象。但是那时的大数据只表示“大量的数据或数据集”这样的字面含义,还没有涵盖到相关的采集、存储、分析挖掘、应用等技术方法与特征内涵 1.2.2发展阶段 从20世纪末到21世纪初期是大数据的发展期,在这一阶段中大数据逐渐为学术界的研究者所关注,相关的定义、内涵、特性也得到了进一步的丰富。2003至2006年,Google 发布的GFS、MapReduce和BigTable三篇论文对大数据的发展起到重要作用。2006至2009年,大数据技术形成并行运算与分布式系统。2009年,Jeff Dean在BigTable基础上开发了Spanner数据库。随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和知识管理技术如数据仓库、专家系统、知识管理系统等开始被应用。 1.2.3成熟阶段 2011年至今,是大数据发展的成熟阶段,越来越多的研究者对大数据的认识从技术概念丰富到了信息资产与思维变革等多个维度,一些国家、社会组织、企业开始将大数据上升为 总第21卷233期大众科技Vol.21 No.1 2019年1月Popular Science & Technology January 2019 【收稿日期】2018-11-06 【作者简介】朱孔村(1985-),男,山东临沂人,江苏省科学技术情报研究所实习研究员,从事电子政务相关工作。 - 115 -

2017贵州大数据考试题目和答案

2017贵州大数据考试题目和答案

? 1.大数据元年是指(单选题1分)得分:1分 o A.2010年 o B.2011年 o C.2012年 o D.2013年 ? 2.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》提出,到2020年,统筹区域布局,依托现有资源建成()区域临床医学数据示范中心。(单选题1分)得分:1分 o A.100个 o B.200个 o C.300个 o D.400个

? 3.近几年,我国电子信息产业一直保持了()以上的年增长速度,成为国民经济各个领域中间的佼佼者。(单选题1分)得分:1分 o A.7% o B.8% o C.9% o D.10% ? 4.宁家骏委员指出,过去我们研制一个新型号的航天器,平均需要多长时间?(单选题1分)得分:1分 o A.1-2年 o B.3-4年 o C.5-6年 o D.7-8年

? 5.具体来说,摩尔定律就是每()个月,产品的性能将提高一倍。(单选题1分)得分:1分 o A.6 o B.12 o C.16 o D.18 ? 6.以下说法错误的是哪项?(单选题1分)得分:1分 o A.大数据是一种思维方式 o B.大数据不仅仅是讲数据的体量大 o C.大数据会带来机器智能 o D.大数据的英文名称是large data ?7.第一个提出大数据概念的公司是(单选题1分)得分:1分

o A.微软公司 o B.脸谱公司 o C.谷歌公司 o D.麦肯锡公司 ?8.大数据要求企业设置的岗位是(单选题1分)得分:0分 o A.首席分析师和首席工程师 o B.首席信息官和首席工程师 o C.首席分析师和首席数据官 o D.首席信息官和首席数据官 ?9.世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的?(单选题1分)得分:1分 o A.1946年 o B.1947年

大数据发展背景与研究现状

大数据发展背景与研究现状 (一)大数据时代的背景 随着计算机存储能力的提升和复杂算法的发展,近年来的数据量成指数型增长,这些趋势使科学技术发展也日新月异,商业模式发生了颠覆式变化。《分 MGI)发 “赢 技术使得在线购物的完成率提升了10%到15%。我国信息数据资源80%以上掌握在各级政府部门手里,但很多数据却与世隔绝“深藏闺中”,成为极大的浪费。2015年,国务院印发《促进大数据发展行动纲要》,明确要求“2018年底前建成国家政府数据统一开放平台”;今年5月,国务院办公厅又印发《政务信息系

统整合共享实施方案》,进一步推动政府数据向社会开放。1 大数据可以把人们从旧的价值观和发展观中解放出来,从全新的视角和角度理解世界的科技进步和复杂技术的涌现,变革人们关于工作、生活和思维的看法。大数据的应用十分广泛,通过对大规模数据的分析,利用数据整体性与涌现性、相关性与不确定性、多样性与非线性及并行性与实时性研究大数据在 。2012年Gartner认为,不到两年时间大数据将成为新技术发展的热点,海量和多样化的信息资产使得大数据需要新的处理模式,才能为数据信息使用者提供有效的信息,使得企业洞察危险的能力增强,流程得以优化,决策更加准确。Victor 在其最新着作《大数据时代——生活、工作与思维的大变革》中指出,大数据 1人民网 26个好用大数据的秘诀

时代要想得到有价值的信息,要从总体而不是少量的数据样本分析与实务相关的所有数据。更加注重数据之间的相关关系,乐于加收纷繁复杂的数据,而不再探求难以捉摸的因果关系和追求数据的精确性。欧盟在其公布的《数字议程》中指出公共数据的市场价值约有320亿欧元,公共数据的开放和再利用可以产生新的商业和工作机会。开放行、公共数据,增加政府的开放和透明度可以给 年9 展的进程。2017年8月30日,国家旅游局、银联商务股份有限公司和中国电信集团联合成立“旅游消费但是数据联合实验室”,并发布了首份研究成果《2017年上半年中国旅游消费大数据报告》。三方在各自的领域有深耕多年的技术、大数据能力、市场资源和经验,通过签署站多合作,可以实现资源共享,优势互 3国家十三五规划纲要

大数据时代题目及答案(三套试题仅供参考)

大数据时代题目及答案(三套试题仅供参考)

第一套试题 1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单选题,本题2分) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、大数据的最显著特征是(A)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是执行方法。(单选题,本题2分) A:数据存储和备份规范 B:数据管理和维护 C:数据价值发觉和利用 D:数据应用开发和管理 14、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题2分) A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参考 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护 15、下列关于计算机存储容量单位的说法中,错误的是( C)。(单选题,本题2分) A:1KB<1MB<1GB B:基本单位是字节(Byte) C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符, 16、下列关于聚类挖掘技术的说法中,错误的是(B)。(单选题,本题2分) A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

大数据发展发展趋势分析报告

大数据发展发展趋势分析报告

2012年,全球数据储存量达到1.8ZB,这是什么概念?它相当于每个中国人,每分钟发3条微博,一共要写2.6976万年才能写完。四年过去了,全球大数据储量是2012年的8倍,而用于存储数据的全球服务器总量还将增长十倍。预计到2020年,全球大数据市场规模将达到1263.21亿美元,据数据显示,目前70%的大企业和56%的中小企业已经部署或是正在计划部署与大数据有关的项目和计划。全球大数据市场结构正在从垄断竞争走向完全竞争的局面。 美国: 美国是大数据发展的领跑者,美国政府一直积极出台大数据相关政策。现今,美国的大数据产业发展广泛渗透到经济、政治、教育、安全和社会管理等领域,步入大规模商业化阶段。大数据已成企业发展的巨大引擎。“Facebook”、“Twitter”项目的成功,标志着信息技术企业加快推动大数据业务的发展,大数据的使用将成为领先企业与其他企业之间最显著的差别。大数据也成为新的盈利模式,正在推动改革企业的决策模式、运营模式和竞争模式,成为企业发展战略的重要组成部分。 政府对大数据政策的支持 在美国总统奥巴马宣誓就职后的第一个工作日就签发了“开放政府”备忘录(Memorandum on Transparency and Open

Government),指导新一届行政当局从开放政府数据源、建设开放型政府入手,以数字革命带动政府变革。“开放政府”的目的简洁明了:改进公众服务,提升公众信任,更有效管理公共资源和增进政府责任。互联网时代的开放型政府,首先必须开放政府数据。紧随其后,总统签发“开放政府数据”行政令(The Open Government Directive),要求在45天内所有政府部门无一例外必须向社会开放3个有价值的数据源。 在大数据法律方面:美国总统要求超前思考“大数据”对人类社会的影响,重点研究现有技术和未来技术会对现行法律带来哪些挑战,哪些法律和政策需要修订或制定以适应变化。为了更进一步发展大数据产业,美国政府发布了《联邦大数据研发战略计划》,以加速其2012年提出的“大数据研发行动”进程。 应用案例: 大数据在公共设施方面的应用 1.在夏威夷四处可见防海啸警报器,但这些警报器里的电池经常被偷,直接导致政府无法准确掌握各个报警器在紧急状况下能否使用,所以他们利用大数据技术,发明了一个“报警器中的报警器”,可以及时获取所有报警器的实时数据,避免了海啸发生前由于数据无法准确掌握造成的重大损失。

“互联网+”与大数据时代机遇与挑战试题与答案20178月

《“互联网+”与大数据时代的机遇与挑战》在线考试 时间限制:90分钟 一、单项选择题(共20小题,每小题2分) 1.()以满足消费者在互联网中的消费需求为主要目标,其商业模式以眼球经济为主。 A. 产业互联网 B. 消费互联网 C. 移动互联网 D. 桌面互联网 2.以下哪项新兴经济形态对双方来说都是共赢()。 A. 生态经济 B. 平台经济 C. 共享经济 D. 网红经济 3.根据本讲,以下不属于“十三五之歌”的特点的是()。 A. 贴近西方受众 B. 符号接近性 C. 着重对外交问题阐述立场和主张 D. 解释性叙事 4.本讲提到,政府提出的“放管服”中的“放”是指要()。 A. 促进公平竞争 B. 降低准入门槛 C. 强化监管

D. 提高服务效率 5.根据本讲,不属于开放数据的特征的是() A. 机器不可读 B. 开放的 C. 结构化的 D. 有高利用价值的 6.本讲提到,新技术或者新业态在实施的过程中,其实是()的重新布局。 A. 制度 B. 利益 C. 产业 D. 规则 7.()是以信息物理系统为核心,以智能工厂为载体,以数据互连互通为主线,以产品生产管理与服务等产品生命周以定制化、分散化生产方式为主要特征。 A. 智能生产 B. 智能制造 C. 智能加工 D. 智能售后 8.流通型电子商务产业生态的核心是() A. 互联网金融 B. 电子商务平台 C. 网上支付和网上物流环节的完善 D. 线上和线下电子商务的融合发展 9.互联网信息化的发展的动力是()

A. 技术创新 B. 原创性创新 C. 机制创新 D. 模式创新 10.信息的目的性与特定社会活动相关性又称为()。 A. 信息异构 B. 信息冗余 C. 职能型 D. 职属性 11.根据本讲,2012到2016年间全世界网民数量增加的后25亿人主要以()为主。 A. 意见领袖 B. 有影响力的人 C. 中产阶级 D. 草根和青年网民 12.本讲提到,()从中科院高能物理所发出我国第一封电子邮件,揭开了中国人使用Internet的序幕。 A. 1978年 B. 1987年 C. 1990年 D. 1991年 13.根据本讲,从政策角度,互联网发展带来的新挑战不包括()。 A. 对监管政策的挑战 B. 对法律制度的挑战

浅析大数据的特点及未来发展趋势

浅析大数据的特点及未来发展趋势 摘要:随着二十一世纪的到来,人们已经进入了信息化的时代。计算机技术水平越来越先进,给人们的生活带来了极大的便利。在信息化的时代,人们每天接触的信息量成千上万。获取有用的数据,不仅可以有效缩短时间,而且可以满足具体需求。大数据技术正是适应现代社会的发展,从数据量巨大、结构复杂、类型众多的数据中,快速获取有价值的信息。因此本篇文章主要分析了大数据的特点,通过进一步探讨,并对其未来的发展趋势进行展望。 关键词:大数据;特点;发展趋势 大数据是继互联网、云计算技术后世界又一热议的信息技术,近几年来发展十分迅速。大数据技术的出现,给人们的生活带来了极大的便利。我们将生活中的东西数据化之后,就可以采用数据的格式对其进行存储、分析,从而获得更大的价值。 一、大数据技术的特点分析 1)开源软件得到广泛的应用 近几年来,大数据技术的应用范围越来越广泛。在信息化的时代,各个领域都趋向于智能化、科技化。大数据技术研发出来的分布式处理的软件框架Hadoop、用来进行挖掘和可视化的软件环境、非关系型数据库Hbase、MongoDb 和CounchDB等开源软件,在各行各业具有十分重要的意义。这些软件的研发,与大数据技术的发展是分不开的。 2)不断引进人工智能技术 大数据技术主要是从巨大的数据中获取有用的数据,进而进行数据的分析和处理。尤其是在信息化爆炸的时代,人们被无数的信息覆盖。大数据技术的发展显得十分迫切。实现对大数据的智能处理,提高数据处理水平,需要不断引进人工智能技术,大数据的管理、分析、可视化等等都是与人密切相关的。现如今,机器学习、数据挖掘、自然语言理解、模式识别等人工智能技术,已经完全渗透到了大数据的各个程序中,成为了其中的重要组成部分。 3)非结构化的数据处理技术越来越受重视 大数据技术包含多种多样的数据处理技术。非结构化的处理数据与传统的文本信息存在很大的不同,主要是指图片、文档、视频等数据形式。随着云计算技

大数据职业发展方向

大数据职业发展方向 一、大数据的概念及特点: 大数据本身就是一个很抽象的概念,提及大数据很多人也只能从数据量上去感知大数据的规模,大数据被定义为“代表着人类认知过程的进步,数据集的规模是无法在可容忍的时间内用目前的技术、方法和理论去获取、管理、处理的数据。 大数据不是一种新技术,也不是一种新产品,而是一种新现象,是近来研究的一个技术热点。大数据具有以下4个特点,即4个“V”: (1) 数据体量(Volumes) 巨大。大型数据集,从TB级别,跃升到PB级别。 (2) 数据类别(Variety) 繁多。数据来自多种数据源,数据种类和格式冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。 (3) 价值(Value) 密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅一两秒钟。 (4) 处理速度(Velocity) 快。包含大量在线或实时数据分析处理的需求,1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。 二、大数据处理流程: 从大数据的特征和产生领域来看,大数据的来源相当广泛,由此产生的数据类型和应用处理方法千差万别。但是总的来说,大数据的基本处理流程大都是一致的。整个处理流程可以概括为四步,分别是采集、导入和预处理、统计和分析,最后是数据挖掘。 三、大数据分解结构: 第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。我会从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。 第二层面是技术,技术是大数据价值体现的手段和前进的基石。我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。 第三层面是实践,实践是大数据的最终价值体现。。

大数据发展趋势

大数据发展趋势大数据的黄金时代

回顾我国大数据产业保持高速发展态势,各级政府和企业大力推进,技术创新取得明显突破,大数据应用推进势头良好,产业体系初具雏形,支撑能力日益增强。未来大数据产业发展将迎来“黄金时代”,产业集聚将进一步特色化发展,创新驱动仍将是产业发展主基调,大数据融合应用进程加速,为做大做强数字经济、带动传统产业转型升级提供新动力。 商业智能 企业决策正在经历的转变将延续到未来。处理大数据的目标使效率越来越高,成本不断减少,从而造就了基于大数据的商业智能,对中小企业甚至初创公司来说更为重要。这一趋势将延续到未来及以后,处理大数据的成本将继续降低,但以下情况除外: o使用云端商业智能的费用将提高。 o数据分析将提供更好的数据可视化模型和自助式软件。 o向新市场和新地区扩张的决策将基于大数据。 2018年的云趋势 ?创造利基 2018年,更多的人将熟悉云应用,专业化和利基工作将得到发展,就像在所有其他行业里一样,从而带来额外的研究选择和更多的业内竞争。拥有零售、区域性增长等专长的数据科学家将逐渐成为常态。 ?混合云

虽然云提供了便利的大数据存储和处理解决方案,但愿意把“所有”数据都放到云端的企业少之又少。2018年,混合云的使用应该会大幅增长,因为混合云兼具二者的优点,本地数据管理可以与云的便利性结合起来。 ?其他部门也将使用云 通常来说,IT部门是其他部门使用云的“中间人”。然而,云技术的使用已经变得非常简单。现在,销售和营销、人力资源等其他部门也能直接使用云。随着更多的人可以访问敏感信息,安全将成为一个重要问题。 2018年的数据分析 ?数据分析将包含可视化模型 2017年,对2800名商业智能专家的一项调查预测,数据可视化和数据发现将成为一股重要趋势。数据发现的范畴已经扩大,不仅包括对数据分析和关系的理解,还包括呈现数据的方式,以挖掘更深层次的商业洞见。其结果就是,作为一种把数据变成可用洞见的方法,可视化模型越来越受欢迎。日益改善和演变的可视化模型已经成为从大数据中获取洞见的必要组成部分。 人脑能高效地处理视觉图像。在这个过程中,大脑使用了潜意识,让决策者可以通过迅速扫描图像来处理信息。可视化图表利用了大脑的图像识别能力,出色的可视化模型将成为处理庞大数据集的更好选择,也是2018年重要的大数据趋势之一。

大数据发展背景及研究现状

(一)大数据时代的背景 随着计算机存储能力的提升和复杂算法的发展,近年来的数据量成指数型增长,这些趋势使科学技术发展也日新月异,商业模式发生了颠覆式变化。《分析的时代:在大数据的世界竞争》是2016年12月麦肯锡全球研究院(MGI)发表的一份报告。五年前MGI就指出大数据分析在基于定位的服务、美国零售业、制造业、欧盟公共部门及美国健康医疗领域有很大的增长潜力。数据正在被商业化,来自网络、智能手机、传感器、相机、支付系统以及其他途径的数据形成了一项资产,产生了巨大的商业价值。苹果、亚马逊、Facebook、谷歌、通用微软以及阿里巴巴集团利用大数据分析及自己的优势改变了竞争的基础,建立了全新的商业模式。稀缺数据的所有者利用数字化网络平台在一些市场近乎垄断,只需用独特方式将数据整合分析,提供有价值的数据分析,几乎可以“赢家通吃”。2011年全球的数据储量就达到,与2011年相比2015年大数据增长了近4倍,未来十年,全球数据存储量还将增长十倍,大数据成为提升产业竞争力和创新商业模式的新途径。大数据在企业中得到了充分的应用并实现了巨大的商业价值。梅西百货的SAS系统可以根据7300种货品的需求和库存实现实时定价。零售业寡头摩尔玛通过最新的搜索引擎Polaris,利用语义数据技术使得在线购物的完成率提升了10%到15%。我国信息数据资源80%以上掌握在各级政府部门手里,

但很多数据却与世隔绝“深藏闺中”,成为极大的浪费。2015年,国务院印发《促进大数据发展行动纲要》,明确要求“2018年底前建成国家政府数据统一开放平台”;今年5月,国务院办公厅又印发《政务信息系统整合共享实施方案》,进一步推动政府数据向社会开放。1 大数据可以把人们从旧的价值观和发展观中解放出来,从全新的视角和角度理解世界的科技进步和复杂技术的涌现,变革人们关于工作、生活和思维的看法。大数据的应用十分广泛,通过对大规模数据的分析,利用数据整体性与涌现性、相关性与不确定性、多样性与非线性及并行性与实时性研究大数据在公共交通、公共安全、社会管理等领域的应用。大数据与云计算、物联网一起使得很多事情成为可能,将会是新的经济增长点。大数据随着以数据科学为核心的计算机技术的迅猛发展,推动了社会科学与自然科学等跨科学研究的发展。因此对内蒙古乃至全国的大数据研究具有深刻而广泛的意义。 (二)国内外相关研究现状 大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。2大数据充斥着人类经济社会的角角落1人民网 2 6个好用大数据的秘诀

大数据考试答案解析

1、当前大数据技术的基础是由( C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是 ( C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度

D:颗粒度 5、数据清洗的方法不包括( D)。(单选题,本题2分) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是( A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算

9、大数据的最显著特征是( A)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地 点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 12、当前社会中,最为突出的大数据环境是(A )。(单选题,本题2分) A:互联网 B:物联网 C:综合国力

相关文档
最新文档