集团大数据平台整体方案项目概述

集团大数据平台整体方案项目概述
集团大数据平台整体方案项目概述

集团大数据平台整体方案项目概述

1.1建设背景

1.1.1集团已有基础

经过十几年的信息化建设,集团已经积累了覆盖邮务、速递物流、金融三大板块的海量生产和经营数据,这些数据分布在集团各类应用系统和数据库中,支撑着集团业务的发展。

集团初步搭建了由名址系统、量收系统、速递平台系统、数据分析平台组成的初步的数据仓库,为数据分析挖掘工作打下了一定的技术基础。

组建了专业的组织架构促进企业数据管理与应用的规范化与制度化。

集团已成立数据中心,集团数据中心和各省的数据分析团队已经进行了多个专题的数据分析与成果应用的尝试。

1.1.2痛点及需提升的能力

集团拥有丰富的客户资源,海量的数据积累。在大数据时代,要充分挖掘数据价值,跟上时代的步伐。

板块间数据存在壁垒,共享不足,无法实现集团企业数

据的充分有效利用。

数据存在冗余、分散、安全性差、一致性差等问题,应建立有效的数据管控体系,打破信息孤岛、实现企业信息数据共享、提升数据价值。

非/半结构化数据利用不足,需利用大数据技术加强应用。

1.1.3大数据趋势

随着移动互联网、云计算、物联网和大数据技术的广泛应用,现代社会已经迈入全新的大数据时代。掌握大数据资产,进行智能化决策,已成为企业胜出的关键。

越来越多的企业开始重视大数据战略布局,重新定义自己的核心竞争力,从数据中揭示规律,了解过去、知悉现在、洞察未来,数据驱动企业运行与决策的科学性,构建智慧企业,打造核心竞争力。

数据的爆炸式增长以及价值的扩大化,将对企业未来的发展产生深远的影响,数据将成为企业的核心资产。如何应对大数据,挖掘大数据的价值,让大数据为企业的发展保驾护航,将是未来信息技术发展道路上关注的重点。

1.2建设目标

1.2.1总体目标

根据集团信息化规划,遵循“互联网+”的理念,建设集团大数据平台,实现集团数据资源的集中及整合,构建集团统一的数据模型,提高企业数据的处理效率与共享程度。实现对集团企业内部数据和外部数据的分析挖掘,对内对外提供数据服务。为全网提供决策支持、产品创新、交叉营销、服务支撑、风险管控以及流程优化等支撑服务。

集团大数据平台将在Hadoop和云计算等技术的基础上,对现有量收系统、数据分析综合服务平台的历史数据、数据模型、报表应用等进行移植,全面整合集团业务数据。数据来源涵盖集团所有的生产和管理系统,并可接入同业及相关市场甚至互联网信息,建立从业务层到管理层到决策层的智能分析体系,模拟量化风险和收益,实现对集团各种业务数据进行分类、管理、统计和分析等功能,给各级管理人员提供各类准确的统计分析预测数据,使其能够及时掌握全面的经营状况,为宏观决策提供支持;为基层业务人员提供详尽的数据,供其对各自的工作目标、当前和历史状况进行准确的把握,对业务活动进行有效支撑;满足集团经营管理及决策支持,建设国内一流,世界领先的大数据平台。

1.2.2分阶段建设目标

●第一阶段目标

利用大数据技术,搭建大数据平台,实现统一数据交换、数据管控、企业级数据分析、数据可视化展现服务等功能。完成邮务和速递数据资源的归集、加工和整理,取代现有的量收系统,集成现有的数据分析综合服务平台,搭建高性能、扩展性强的数据计算和数据分析环境。建立集团统一的数据模型,实现数据的标准化和规范化。对集团各板块及外部的结构化数据、半/非结构化数据进行采集和存储,围绕“服务支撑、风险管控、流程优化、交叉营销、产品创新、决策支持”六个重点应用方向进行大数据成果应用。

●第二阶段目标

全方位整合集团数据资源,利用专业的数据分析工具,提升数据分析质量与效率,完善数据分析应用模型及相关指标,深入推广六个重点应用方向,逐步提供面向移动互联网的快速服务,不断优化生产工作流程,实现降本增效,为科学运营和决策提供支撑。

1.3与相关系统的关系

1.3.1数据分析综合服务平台

数据分析综合服务平台是依托集团综合网,实现邮务数据集中及整合,为集团公司和各省分公司提供企业数据分析

挖掘服务,对内对外提供数据服务的信息系统。

该系统使用Oracle数据库,目前数据量已达到9TB,平均日增长量约22GB。目前该系统已经对接了13个业务系统(集邮系统、报刊系统、电商平台-机票、网运系统、邮资封片卡系统、短信平台、农资分销系统、贺卡兑奖平台、营业系统、投递系统、客管系统、订单系统、国际业务平台),实现了31个省的邮务类数据的上传及下载。系统实现将数据由全国中心推送至省中心;实现已有专题分析的固化,包括报刊、约投挂号、国内国际小包专题分析结果的固化展现;实现将接入系统的数据按照业务规则进行后台加载、评估、清洗、重构,并按照客户维度进行数据整合;提供对内对外数据服务,支持客户数据的上传和结果下载、邮编匹配、地址清洗匹配等功能。

数据分析综合服务平台是大数据平台的子集,数据分析综合服务平台的数据是大数据平台的数据集市之一。

1.3.2量收系统

量收系统是通过从集团生产经营业务系统及其他相关系统中自动采集、汇总、上传业务量、业务收入信息(简称量收信息),进行稽核、查询、分析、预警等应用的信息管理系统。

该系统使用Teradata的数据仓库和Oracle的数据库,数据使用空间已接近15TB。目前该系统已经对接了8个业务系统(速递平台、集邮系统、营业系统、订单系统、报刊系统、农资分销系统、邮资机管理系统、电商平台),此外,通过营业系统还接入商函、国际普邮、电子商务、短信等业

务数据。现有使用用户2.9万个,提供近500张报表的查询,实现集团业务量收入的统计分析,为企业的经营管理起到了很重要的作用,但随着管理要求的不断提高,量收系统的能力已捉襟见肘。集团大数据平台建成后,将替代量收系统。

1.3.3金融大数据平台

大数据平台从金融大数据平台获取金融客户、市场营销等数据分析结果以及相关数据,与金融大数据平台互为数据源,用于支撑集团邮务、速递物流和金融板块对数据分析的需求。

1.3.4各生产系统

大数据平台从各生产系统获取交易数据、基础数据等,对数据进行分析挖掘,将分析成果反馈回各生产系统用于支撑生产运营。

1.3.5C RM

CRM系统实现以客户为中心的集团与板块间的协同管控,以及集团各环节间客户营销及服务的协同管理。大数据平台将实现CRM系统的部分数据分析功能。

1.4公司介绍和优势特点

1.4.1I DEADATA

北京爱狄特信息科技有限公司(IDEADATA)成立于2011年3月,总部设在北京,在南京及沈阳等地设有技术研发中心和办事机构。公司注册资金2080万,是北京市高新技术企业。

公司专注于企业级数据(仓)库和大数据领域的技术和应用,业务和技术能力发展迅速,核心和骨干成员均具有领域内资深的业务经验、技术能力以及落地实践,对基于从集群到云平台、从传统数据库到MPP以及Hadoop的各种数据管理和应用平台架构及演进路线图均有深刻的理解和积累。

公司通过不断的实践积累,独立研发了包括结构化、半结构化/非结构化数据结构在内的一系列从数据获取(抽取)、数据管理到数据应用的多项拥有自主知识产权的产品和服务,包括数据平台交互系统、数据BI分析系统、智能地址匹配系统、互联网信息获取与分析系统(iRIS)、自然语言处理(iNLP)和机器学习挖掘算法等方面。另外,公司积极与国内外大数据领域先进的解决方案、平台和工具厂商包括Teradata、南大通用、IBM、星环科技(Transwarp)、Trinity 和SAS等都有深入和紧密的合作关系及基础。

在质量管理体系上,公司以GB/T19001-2008《质量管理体系-要求》为标准,进行周密的质量管理体系策划,建立了完整的质量管理体系,获得了认证中心颁发的质量管理体系认证证书。公司在组织结构中设立了过程管控委员会,专职负责贯彻实施公司质量方针、质量目标,维护ISO9001质量管理体系有效运行,控制产品质量,实现产品和服务质量的持续改进。

公司财务及营运状况良好,具有一般纳税人资格,具备独立、完整的会计核算和内部控制体系,配备专业的会计核算与管理人员,财务核算制度健全,能够据以如实核算,准确及时的反映生产经营成果。公司严格执行企业会计准则和《企业会计制度》的有关规定,以权责发生制为记账原则,以实际成本为计价基础,财务报表在所有重大方面均能公允反映公司的财务状况以及经营成果和现金流量。

公司始终坚持“服务的价值在于帮助客户成功”的理念,为客户提供的产品和服务追求“专业、专注、极致、价值”。

1.4.2T RANSWARP

星环信息科技(上海)有限公司(以下简称“星环公司”)是一家高科技大数据公司。公司致力于大数据基础软件的研发,目前拥有超过300人的Hadoop专业团队,大部分来自于IBM、Intel、Microsoft、Oracle、EMC等知名企业,

其中技术研发人员占80%以上。无论是团队规模,还是人员的整体能力,在全球大数据平台领域都处于领先位置。

在国际知名咨询机构Gartner发布的2016版数据仓库及数据管理解决方案市场的魔力象限报告中,来自中国的公司星环科技(Transwarp)是唯一一家上榜的中国公司,也是魔力象限远见者(Visionaries)领域中全球最具有前瞻性的公司。

图2-1 Gartner 2016数据仓库魔力象限评测结果

星环科技从事大数据核心平台的研发与服务,基于TDH 大数据平台软件全国产化,将大数据技术与传统数据仓库结合,已经为国内多家金融银行机构提供专业化的数据仓库服

务,包括江苏银行、恒丰银行、民生银行、中泰证券等。

星环公司已经在国内建立200多个大数据应用案例,覆盖行业包括金融、运营商、互联网、政府、能源、制造业、军工、教育、交通运输、公安等行业,目前是国内市场落地案例最多、应用范围最为广泛的大数据平台提供商,星环公司已经成为全球瞩目的大数据平台商。

1.4.3 我们的优势

北京爱狄特信息科技有限公司与星环信息科技(上海)有限公司紧密协作,参与集团大数据平台项目建设,与其他友商相比具有以下四方面的优势特点: 我们的优势

234完全支持传统数仓的企业级Hadoop 产品国内最多的大数据

平台项目建设落地案例(超过200)

1

项目成员大部分有邮政项目经验,熟悉邮

政数据和业务流程;其中,核心骨干成员

也包括量收一期、二期等项目的总体架构

师、项目经理和核心开发人员。产品和实施本地

化,源码自主安

全可控。

图2-2公司优势

(1) 大数据平台产品技术优势

SQL on Hadoop技术领先国内外厂商。SQL 99、SQL 2003标准的全面兼容性,支持PL/SQL、分布式事务、分布式内存OLAP/Cube等平台特性,为企业级数仓建设奠定坚实的平台基础。

国内首家实现并成功运用Hadoop on Docker分布式容器集群管理平台技术。Transwarp Operating System (TOS)是为大数据应用量身订做的云操作系统,支持一键部署TDH,基于优先级的抢占式资源调度和细粒度资源分配,让大数据应用轻松拥抱云服务。

(2)具有基于Hadoop平台成功建设企业级数仓的丰富经

星环Hadoop平台产品已在国内100多个大数据项目建设中得以应用,行业覆盖金融、运营商、互联网、政府、能源等行业,其中有多个基于Hadoop平台完全实现企业级数仓系统的成功案例,在企业级数仓平滑可靠迁移及替换国外MPP数仓系统、高性价比提升企业数仓性能方面,积累了丰富的实践经验。作为Hadoop 创新应用的开拓者,星环公司目前已成为在国内市场落地案例最多、应用范围最为广泛的大数据平台提供商。

(3)大数据分析挖掘团队的专业实施经验优势

爱狄特公司在大数据可视化交互展现和多维分析查询、大数据分析挖掘、自然语言处理(iNLP)、地址清洗匹配服务

等方面积累了自有的产品技术并成功运用到集团、金融保险、IT等行业。经历多年大数据实战项目的锻炼,培养建立起了一支专业的大数据分析挖掘团队,能够运用多种分析挖掘工具和并行化算法库,从大数据中挖掘客户价值,为集团、金融、IT等行业的经营分析、决策支持提供专业的技术支持服务。

(4)集团项目实施经验优势

爱狄特公司有多名核心技术骨干人员参与过集团的量收系统、全国名址、EMS平台、综分平台等大型项目的总体架构设计、应用系统开发、数仓建设及系统运维等工作,熟悉现有数仓系统的数据模型、ETL流程及汇总处理程序、数据接口格式及应用集成要求等,对现有数仓的迁移及大数据平台应用做了充分的PoC实验验证,明悉迁移工作中的难点及重点问题并有针对性的风险防范及管控措施加以解决。因而,我方的集团项目实施经验结合极具优势的大数据平台产品技术,我方有充分的信心,在短时间内高质量、高可靠地完成本项目任务。

方案-大数据平台项目建设方案

大数据平台项目建设方案(本文为word格式,下载后可编辑使用)

一、项目背景 “十三五”期间,随着我国现代信息技术的蓬勃发展,信息化建设模式发生根本性转变,一场以云计算、大数据、物联网、移动应用等技术为核心的“新 IT”浪潮风起云涌,信息化应用进入一个“新常态”。***(某政府部门)为积极应对“互联网+”和大数据时代的机遇和挑战,适应全省经济社会发展与改革要求,大数据平台应运而生。 大数据平台整合省社会经济发展资源,打造集数据采集、数据处理、监测管理、预测预警、应急指挥、可视化平台于一体的大数据平台,以信息化提升数据化管理与服务能力,及时准确掌握社会经济发展情况,做到“用数据说话、用数据管理、用数据决策、用数据创新”,牢牢把握社会经济发展主动权和话语权。 二、建设目标 大数据平台是顺应目前信息化技术水平发展、服务政府职能改革的架构平台。它的主要目标是强化经济运行监测分析,实现企业信用社会化监督,建立规范化共建共享投资项目管理体系,推进政务数据共享和业务协同,为决策提供及时、准确、可靠的信息依据,提高政务工作的前瞻性和针对性,加大宏观调控力度,促进经济持续健康发展。 1、制定统一信息资源管理规范,拓宽数据获取渠道,整合业务信息系统数据、企业单位数据和互联网抓取数据,构

建汇聚式一体化数据库,为平台打下坚实稳固的数据基础。 2、梳理各相关系统数据资源的关联性,编制数据资源目录,建立信息资源交换管理标准体系,在业务可行性的基础上,实现数据信息共享,推进信息公开,建立跨部门跨领域经济形势分析制度。 3、在大数据分析监测基础上,为政府把握经济发展趋势、预见经济发展潜在问题、辅助经济决策提供基础支撑。 三、建设原则 大数据平台以信息资源整合为重点,以大数据应用为核心,坚持“统筹规划、分步实施,整合资源、协同共享,突出重点、注重实效,深化应用、创新驱动”的原则,全面提升信息化建设水平,促进全省经济持续健康发展。

大数据平台建设方案

大数据平台建设方案 (项目需求与技术方案) 一、项目背景 “十三五”期间,随着我国现代信息技术的蓬勃发展,信息化建设模式发生根本性转变,一场以云计算、大数据、物联网、移动应用等技术为核心的“新 IT”浪潮风起云涌,信息化应用进入一个“新常态”。***(某政府部门)为积极应对“互联网+”和大数据时代的机遇和挑战,适应全省经济社会发展与改革要求,大数据平台应运而生。 大数据平台整合省社会经济发展资源,打造集数据采集、数据处理、监测管理、预测预警、应急指挥、可视化平台于一体的大数据平台,以信息化提升数据化管理与服务能力,及时准确掌握社会经济发展情况,做到“用数据说话、用数据管理、用数据决策、用数据创新”,牢牢把握社会经济发展主动权和话语权。 二、建设目标 大数据平台是顺应目前信息化技术水平发展、服务政府职能改革的架构平台。它的主要目标是强化经济运行监测分析,实现企业信用社会化监督,建立规范化共建共享投资项目管理体系,推进政务数据共享和业务协同,为决策提供及时、准确、可靠的信息依据,提高政务工作的前瞻性和针对性,加大宏观调控力度,促进经济持续健康发

展。 1、制定统一信息资源管理规范,拓宽数据获取渠道,整合业务信息系统数据、企业单位数据和互联网抓取数据,构建汇聚式一体化数据库,为平台打下坚实稳固的数据基础。 2、梳理各相关系统数据资源的关联性,编制数据资源目录,建立信息资源交换管理标准体系,在业务可行性的基础上,实现数据信息共享,推进信息公开,建立跨部门跨领域经济形势分析制度。 3、在大数据分析监测基础上,为政府把握经济发展趋势、预见经济发展潜在问题、辅助经济决策提供基础支撑。 三、建设原则 大数据平台以信息资源整合为重点,以大数据应用为核心,坚持“统筹规划、分步实施,整合资源、协同共享,突出重点、注重实效,深化应用、创新驱动”的原则,全面提升信息化建设水平,促进全省经济持续健康发展。

某大型企业大数据平台整体解决方案

某大型企业数据平台整体解决方案

目录 1项目概述 (15) 1.1建设背景 (15) 1.1.1集团已有基础 (15) 1.1.2痛点及需提升的能力 (15) 1.1.3大数据趋势 (16) 1.2建设目标 (16) 1.2.1总体目标 (16) 1.2.2分阶段建设目标 (17) 1.3与相关系统的关系 (18) 1.3.1数据分析综合服务平台 (18) 1.3.2量收系统 (19) 1.3.3金融大数据平台 (20) 1.3.4各生产系统 (20) 1.3.5CRM (20) 1.4公司介绍和优势特点 (20) 1.4.1IDEADATA (20) 1.4.2TRANSWARP (22) 1.4.3我们的优势 (24) 2业务需求分析 (27) 2.1总体需求 (27)

2.2.1数据采集 (29) 2.2.2数据交换 (29) 2.2.3数据存储与管理 (29) 2.2.4数据加工清洗 (30) 2.2.5数据查询计算 (31) 2.3数据管控 (32) 2.4数据分析与挖掘 (32) 2.5数据展现 (33) 2.6量收系统功能迁移 (34) 3系统架构设计 (35) 3.1总体设计目标 (35) 3.2总体设计原则 (35) 3.3案例分析建议 (37) 3.3.1中国联通大数据平台 (37) 3.3.2恒丰银行大数据平台 (49) 3.3.3华通CDN运营商海量日志采集分析系统 (63) 3.3.4案例总结 (69) 3.4系统总体架构设计 (70) 3.4.1总体技术框架 (70) 3.4.2系统总体逻辑结构 (74)

3.4.4系统接口设计 (83) 3.4.5系统网络结构 (88) 4系统功能设计 (91) 4.1概述 (91) 4.2平台管理功能 (92) 4.2.1多应用管理 (92) 4.2.2多租户管理 (96) 4.2.3统一运维监控 (97) 4.2.4作业调度管理 (117) 4.3数据管理 (119) 4.3.1数据管理框架 (119) 4.3.2数据采集 (122) 4.3.3数据交换 (125) 4.3.4数据存储与管理 (127) 4.3.5数据加工清洗 (149) 4.3.6数据计算 (150) 4.3.7数据查询 (170) 4.4数据管控 (193) 4.4.1主数据管理 (193) 4.4.2元数据管理技术 (195)

大数据成功案例

1.1 成功案例1-汤姆森路透(Thomson Reuters) 利用Oracle 大 数据解决方案实现互联网资讯和社交媒体分析 Oracle Customer: Thomson Reuters Location: USA Industry: Media and Entertainment/Newspapers and Periodicals 汤姆森路透(Thomson Reuters)成立于2008年4月17 日,是由加拿大汤姆森 公司(The Thomson Corporation)与英国路透集团(Reuters Group PLC)合并组成的商务和专 业智能信息提供商,总部位于纽约,全球拥有6万多名员工,分布在超过100 个国家和地区。 汤姆森路透是世界一流的企业及专业情报信息提供商,其将行业专门知识与创新技术相结合,在全世界最可靠的新闻机构支持下,为专业企业、金融机构和消费者提供专业财经信息服务,以及为金融、法律、税务、会计、科技和媒体市场的领先决策者提供智能信息及解决方案。 在金融市场中,投资者的心理活动和认知偏差会影响其对未来市场的观念和情绪,并由情绪最终影响市场表现。随着互联网和社交媒体的迅速发展,人们可以方便快捷的获知政治、经济和社会资讯,通过社交媒体表达自己的观点和感受,并通过网络传播形成对市场情绪的强大影响。汤姆森路透原有市场心理指数和新闻分析产品仅对路透社新闻和全球专业资讯进行处理分析,已不能涵盖市场情绪的构成因素,时效性也不能满足专业金融机构日趋实时和高频交易的需求。 因此汤姆森路透采用Oracle的大数据解决方案,使用Big Data Appliance 大 数据机、Exadata 数据库云服务器和Exalytics 商业智能云服务器搭建了互联网资讯 和社交媒体大数据分析平台,实时采集5 万个新闻网站和400 万社交媒体渠道的资 讯,汇总路透社新闻和其他专业新闻,进行自然语义处理,通过基于行为金融学模型多维度的度量标准,全面评估分析市场情绪,形成可操作的分析结论,支持其专业金融机

兖矿集团大数据平台建设

兖矿集团大数据平台建设 完成单位:兖矿集团有限公司 兖州煤业股份有限公司 兖矿集团信息化中心 西安兖矿科技研发设计有限公司 一、项目承担单位基本情况 兖矿集团是以煤炭、煤化工、电解铝及机电成套装备制造、金融投资等为主业的省属国有企业。兖州矿区开发建设始于1966年,1976年7月成立兖州矿务局,1996年3月整体改制为国有独资公司,1999年5月成立兖矿集团。 二、大数据平台建设背景 近年来,兖矿集团作为传统能源企业必须对企业管理方式、运营方式、发展方式、业务流程进行颠覆性创新。企业的战略转型,信息化是重要支撑,加强企业管控必须有可靠的内、外部数据支持,因此在集团层面进行数据整合、统一数据标准成为迫切的需求。 三、大数据平台建设基本情况 (一)项目建设思路及目标 兖矿集团大数据平台建设,以兖矿集团改建国有投资公司

战略发展规划为指导,首先对兖矿集团信息化进行高阶诊断及业务流程优化,针对集团公司在计划、财务、投资等业务管理领域的信息化建设现状进行诊断分析。 然后根据信息化建设高阶诊断结果,列出兖矿集团信息化建设与业务流程优化问题清单。依据问题清单对集团各业务部门流程进行优化,在此基础上,建设大数据软件平台,利用大数据技术对重点流程进行分析,为兖矿集团公司改革提供支持。 (二)项目建设主要内容 矿集团信息化经过多年的发展,各业务应用系统已经基本建设完成,具备了良好的数据基础。针对数据没有整合,业务流程没有优化这些需求,兖矿集团大数据平台的实施主要按照信息化高阶诊断与业务流程优化、大数据软件平台实施两大部分内容开展。 1、信息化高阶诊断与业务流程优化 通过信息化高阶诊断旨在发现现有信息化管控模式、业务能力是否能够支撑集团公司战略转型,存在哪些问题,并提出整改方案。 诊断过程主要按照现状调研、问题诊断、领先实践对比分析、提出改进方案、对改进方案进行优先级排序五个步骤进行。 现状调研以现场访谈与问卷调查为主,对18个集团总部部

集团大数据平台整体方案业务需求分析

集团大数据平台整体方案业务需求分析 1.1总体需求 大数据平台应支持集团总部、省和地市三级使用方式。使用单位还包括下属单位和控股公司等。大数据平台要求使用Hadoop系统应实现主流数据仓库的功能,同时支持与现有系统Oracle数据库及Teradata数据仓库的无缝连接。 大数据平台需支持多应用管理,即支持对应用的服务级别管理(SLA)。能够实现应用的访问资源控制,支持资源隔离。同时支持多租户功能,例如多租户管理、租户的操作员管理、租户的分等分级分组管理、租户的度量管理、租户的角色管理、租户应用授权、租户数据隔离、租户的资源隔离等功能。 大数据平台应具有统一运维监控方面,可以图形化的实现安全管理、用户管理、监控运维、服务调度、应用部署、资源管理、作业编排、服务接口等。 大数据平台应同时支持作业调度管理,即实现统一的作业调度与编排管理功能,支持使用工作流的可视化的方式对工作任务进行统一编排和调度。同时支持作业的资源管理、流程管理、任务管理、数据管理、应用管理、租户管理、多

ETL 调度任务的部署和并行处理等功能。 集团大数据平台的建设内容包含: Str/UnStr Cloud TOS (SLA )SOA R 、SQL Parser TDH Hadoop JDBC 、ODBC Map Reduce 、Spark 基础 平台架构计算 逻辑平台UI 主数据交互(ERP MDM )营销数据(ACRM 交互)综分平台融合 六大重点应用 量收业务分析(逻辑)迁移 量收接口迁移(对外接口) 四大核心功能量收数据迁移外围数 据量收(存量)业务 系统总部、省、地三级 多终端应用 图3-1大数据平台建设内容 重点建设内容包括: 1) 基础平台建设 2) 量收迁移 3) 六大重点应用 4) 与CRM 、综分、MDM 等系统的融合 5) 基于大数据平台的数据应用。 1.2 数据管理 集团大数据平台的数据管理,包含数据采集、数据交换、数据存储与管理(包含结构化数据管理、半/非结构化数据管理、数据存储等)、数据清洗加工、数据计算和查询等方面

智慧城市运行大数据平台项目概述

智慧城市运行大数据平台项目概述 1.1项目名称 项目名称:西安市城市运行大数据平台。 1.2项目建设单位及负责人、项目责任人 项目建设单位:西安城市一卡通有限责任公司 负责人:马敏 项目责任人:陈凌霞 1.3可研报告编制单位 可研报告编制单位:陕西省信息化工程研究院 1.4可研报告编写依据 (1)《关于加强信息资源开发利用工作的若干意见》(中办发〔2004〕34号); (2)《国家信息化领导小组关于推进国家电子政务网络建设的意见》(中办发〔2006〕18号); (3)《关于<印发国家电子政务总体框架>的通知》(国信〔2006〕2号); (5)《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》;

(8)《关于信息安全等级保护工作的实施意见》(公通字〔2004〕66号文); (9)《GBT17859计算机信息系统安全等级保护标准》; (10)《信息系统安全等级保护实施指南(征求意见稿)》。 (11)《陕西省工业和信息化厅专题会议纪要》(第7次,2012年7月24日); (12)《陕西省工业和信息化厅关于成立西咸大数据处理与服务产业园区筹建工作组的通知》(陕工信发〔2012〕339号) (13)《促进大数据发展行动纲要》(国发〔2015〕50号)(14)《关于促进云计算创新发展培育信息产业新业态的意见》(国发〔2015〕5号) (15)《陕西大数据产业发展战略》 (16)《沣西新城大数据处理与服务产业园发展规划》 (17)《大数据与云计算产业发展五年行动计划》 (18)《大数据与云计算产业示范工程实施方案》 1.5项目建设目标、规模、内容、建设期 1.5.1建设目标 依托西安城投集团及下辖一卡通、燃气、供水等18个企业的信息化建设成果,先期以西安城市一卡通为基础面向集团18个子公司的现有各类业务系统数据进行整合归集,

生产企业大数据平台建设项目建议书

大数据平台建设项目建议书

目录 第一章、项目背景..................... 错误!未定义书签。第二章、项目思路..................... 错误!未定义书签。第三章、建设内容与方案............... 错误!未定义书签。第四章、时间进度..................... 错误!未定义书签。第五章、项目预算..................... 错误!未定义书签。第六章、企业效益及社会效益........... 错误!未定义书签。第七章、结论......................... 错误!未定义书签。

第一章、项目背景 企业对信息化工作历来较为重视,也是省内较早开始实施信息化的大型企业。目前已经建成财务系统、生产调度系统、农务系统、供应链系统等:调度系统,2015年公司共投资了175万元,按集团分步建设、逐步投入的规划,完成了系统基本硬件与亚控平台软件的结合,构建了一个以明阳糖厂生产调度指挥中心为核心,生产信息能够上至集团,下至车间的生产调度网络系统。 农务系统,2005年开始实施,经过多次升级,现涵盖了计划、报蔗、派车、质检、过磅、结算、短信管理、移动应用等一系列模块,覆盖公司4家直属糖厂和大桥制糖公司,实现了农务统一的信息化管理。 供应链系统,利用用友NC供应链系统,以公司存货管理为核心的采、供、销、存供应链管理平台,实现物资、仓储、供应、销售、物流一体化业务协同处理平台,建立了公司对各直属厂工作的监督平台,总部可以实时对下属各公司的工作进行监督,实时对各公司的具体业务执行情况进行查看,及时的对下属公司进行指导和监督。 尽管在两化融合及企业信息化方面已取得了相当的成效,但在实际应用过程中仍然存在一些较为显著的问题。 (一)总部与下属糖厂未实现完全的集约管理 a)企业在原先六家糖厂的基础上,又收购了三博公司五家糖厂。三博五厂 由上海迁回南宁,在宜州设立管理下属五厂的二级管理总部。 b)从系统部署上分析,企业总部与原先六厂为一套架构,而三博总部与下 属五厂为一套架构,各自独立,暂未整合为一体。 c)为了保证各糖厂生产的稳定,企业总部与下属六厂之间仅在NC供应链、 OA、财务、人力等系统方面实现了集约管理,农务管理系统、生产调度 系统以及化验系统均由各厂自建,因此出现各厂建设系统的厂家不同, 使用的系统版本不同等现象。三博总部与下属五厂的关系亦如此。(二)总部及各厂之间的数据共享有限 a)由于大多数生产相关的系统均为各厂自建,因此不管是企业总部,或者

集团大数据平台整体方案项目概述

集团大数据平台整体方案项目概述 1.1建设背景 1.1.1集团已有基础 经过十几年的信息化建设,集团已经积累了覆盖邮务、速递物流、金融三大板块的海量生产和经营数据,这些数据分布在集团各类应用系统和数据库中,支撑着集团业务的发展。 集团初步搭建了由名址系统、量收系统、速递平台系统、数据分析平台组成的初步的数据仓库,为数据分析挖掘工作打下了一定的技术基础。 组建了专业的组织架构促进企业数据管理与应用的规范化与制度化。 集团已成立数据中心,集团数据中心和各省的数据分析团队已经进行了多个专题的数据分析与成果应用的尝试。 1.1.2痛点及需提升的能力 集团拥有丰富的客户资源,海量的数据积累。在大数据时代,要充分挖掘数据价值,跟上时代的步伐。 板块间数据存在壁垒,共享不足,无法实现集团企业数

据的充分有效利用。 数据存在冗余、分散、安全性差、一致性差等问题,应建立有效的数据管控体系,打破信息孤岛、实现企业信息数据共享、提升数据价值。 非/半结构化数据利用不足,需利用大数据技术加强应用。 1.1.3大数据趋势 随着移动互联网、云计算、物联网和大数据技术的广泛应用,现代社会已经迈入全新的大数据时代。掌握大数据资产,进行智能化决策,已成为企业胜出的关键。 越来越多的企业开始重视大数据战略布局,重新定义自己的核心竞争力,从数据中揭示规律,了解过去、知悉现在、洞察未来,数据驱动企业运行与决策的科学性,构建智慧企业,打造核心竞争力。 数据的爆炸式增长以及价值的扩大化,将对企业未来的发展产生深远的影响,数据将成为企业的核心资产。如何应对大数据,挖掘大数据的价值,让大数据为企业的发展保驾护航,将是未来信息技术发展道路上关注的重点。

企业大数据案例分析(公司大数据、集团大数据)

企业大数据案例分析

目录 1中国联通大数据平台 (4) 1.1项目概述 (4) 1.2项目实施情况 (5) 1.3项目成果 (10) 1.4项目意义 (11) 2恒丰银行大数据平台 (12) 2.1项目概述 (12) 2.2项目实施情况 (15) 2.3项目成果 (21) 2.4项目意义 (21) 3华通CDN运营商海量日志采集分析系统 (24) 3.1项目概述 (24) 3.2项目实施情况 (24) 3.3项目成果 (28) 3.4项目意义 (28) 4案例总结 (30)

1中国联通大数据平台 联通XX公司公司按照工信部的的要求(见《工业和信息化部、国务院国有资产监督管理委员会关于开展基础电信企业网络与信息安全责任考核有关工作的指导意见》和《工业和信息化部办公厅关于印发<2013年省级基础电信企业网络与信息安全工作考核要点与评分标准>的通知》),于2013年启动IDC/ISP日志留存系统的建设,其中XX 公司侧的集中留存系统软件由联通研究院负责开发。为了满足海量数据条件下的处理效率的要求,XX公司侧集中留存系统软件除研究院自主开发外,基于Hadoop的数据存储部分计划进行外包,通过软件技术服务,来进行系统优化和维护支撑。 1.1项目概述 目前,联通XX公司公司全国IDC出口的访问日志预计两个月产生的数据量约20 PB至30PB,每秒写入大概6千万至7千万条数据,在如此巨大的数据量下,原有Ter adata和Oracle已经不能满足快速读写的性能要求了。同时为了实现快速检索以及分析处理的性能要求,需要引入分布式大数据平台,利用分布式文件存储系统,提高数据的存储入库能力,利用Hadoop/HBase架构克服磁盘I/O瓶颈导致的数据读写延迟;基于联通IDC出口流量详单数据进行快速存储和检索以及分析处理,同样要求数据处理平台具备快速读写的高性能。 中国联通公司全国IDC日至留存项目对分布式集群的要求非常高: (1)日志数据量非常大,存储的总日志数据量将达到20PB-30PB。 (2)要求集群的数据吞吐量非常高,每秒的日志写入量将达到6千万至七千万条,

大数据中心建设的策划方案

大数据中心建设的策划方案 大数据中心建设不仅对广电网络现有的广播电视业务、宽带业务的发展产生积极作用,同 时为广电的信息化提供支撑,下面由学习啦为你整理大数据中心建设的策划方案的相关资料, 希望能帮到你。 大数据中心建设的策划方案范文一大型承载企事业、集团、机构的核心业务,重要性高, 不允许业务中断, 一般按照国标 A 级标准建设, 以保证异常故障和正常维护情况下, 正常工作, 核心业务不受影响。 数据中心机房基础设施建设是一个系统工程,集电工学、电子学、建筑装饰学、美学、暖 通净化专业、计算机专业、弱电控制专业、消防专业等多学科、多领域的综合工程。 机房建设的各个系统是按功能需求设置的,主要包括以下几大系统:建筑装修系统、动力 配电系统、空调新风系统、防雷接地系统、监控管理系统、机柜微环境系统、消防报警系统、 综合布线系统等八大部分。 一、建筑装修系统是整个机房的基础,它主要起着功能区划分的作用。 根据用户的需求和设备特点,一般可以将机房区域分隔为主机房区域和辅助工作间区域, 主机房为放置机架、服务器等设备预留空间,辅助工作间包括光纤室、电源室、控制室、空调 室、操作间等,为主机房提供服务的空间。 此外,数据中心机房装修需要铺抗静电地板、安装微孔回风吊顶等,确保机房气密性好、 不起尘、消防、防静电、保温等,以为工作人员提供良好的工作条件,同时也为机房设备提供 维护保障功能。 二、供配电系统是机房安全运行的动力保证。 计算机机房负载分为主设备负载和辅助设备负载。 主设备负载指计算机及网络系统、计算机外部设备及机房监控系统,这部分供配电系统称 为 “设备供配电系统,其供电质量要求非常高,应采用 UPS 不间断电源供电来保证供电的稳 定性和可靠性。 辅助设备负载指空调设备、动力设备、照明设备、测试设备等,其供配电系统称为“辅助 供配电系统,其供电由市电直接供电。 机房内的电气施工应选择优质电缆、线槽和插座。 插座应分为市电、UPS 及主要设备专用的防水插座,并注明易区别的标志。 照明应选择机房专用的无眩光高级灯具。 三、空调新风系统是运行环境的保障。 由于数据中心机房里高密度存放着大量网络和计算机设备,不仅产生大量的集中热量,而 且对环境中的灰尘数量和大小有很高的要求,这就对空调系统提出了更高的要求。 保证设备的可靠运行,需要机房保持一定的温度和湿度。 同时,机房密闭后仅有空调是不够的,还必须补充新风,形成内部循环。 此外, 它还必须控制整个机房里尘埃的数量, 对新风进行过滤, 使之达到一定的净化要求。

大数据平台项目方案

xxx有限公司 大数据平台项目方案 文件编号: 受控状态: 分发号: 修订次数:第 1.0 次更改持有者:

大数据平台建设方案 (项目需求与技术方案) 一、项目背景 “十三五”期间,随着我国现代信息技术的蓬勃发展,信息化建设模式发生根本性转变,一场以云计算、大数据、物联网、移动应用等技术为核心的“新 IT”浪潮风起云涌,信息化应用进入一个“新常态”。***(某政府部门)为积极应对“互联网+”和大数据时代的机遇和挑战,适应全省经济社会发展与改革要求,大数据平台应运而生。 大数据平台整合省社会经济发展资源,打造集数据采集、数据处理、监测管理、预测预警、应急指挥、可视化平台于一体的大数据平台,以信息化提升数据化管理与服务能力,及时准确掌握社会经济发展情况,做到“用数据说话、用数据管理、用数据决策、用数据创新”,牢牢把握社会经济发展主动权和话语权。 二、建设目标 大数据平台是顺应目前信息化技术水平发展、服务政府职能改革的架构平台。它的主要目标是强化经济运行监测分析,实现企业信用社会化监督,建立规范化共建共享投资项目管理体系,推进政务数据共享和业务协同,为决策提供及时、准确、可靠的信息依据,提高政务工作的前瞻性和针对性,加大宏观调控力度,促进经济持续健康发展。 1、制定统一信息资源管理规范,拓宽数据获取渠道,整合业务信息系统数据、企业单位数据和互联网抓取数据,构建汇聚式一体化数据库,为平台打下坚实稳固的数据基础。 2、梳理各相关系统数据资源的关联性,编制数据资源目录,建立信息资源交换管理标准体系,在业务可行性的基础上,实现数据信息共享,推进信息公开,建立跨部门跨领域经济形势分析制度。 3、在大数据分析监测基础上,为政府把握经济发展趋势、预见经济发展潜在问题、辅助经济决策提供基础支撑。

集团公司大数据平台整体建设方案

集团公司大数据平台整体建设方案

目录 1项目概述 (11) 1.1建设背景 (11) 1.1.1集团已有基础 (11) 1.1.2痛点及需提升的能力 (11) 1.1.3大数据趋势 (12) 1.2建设目标 (12) 1.2.1总体目标 (12) 1.2.2分阶段建设目标 (13) 1.3与相关系统的关系 (13) 1.3.1数据分析综合服务平台 (13) 1.3.2量收系统 (14) 1.3.3金融大数据平台 (15) 1.3.4各生产系统 (15) 1.3.5CRM (15) 1.4公司介绍和优势特点 (15) 1.4.1IDEADATA (15) 1.4.2TRANSWARP (17) 1.4.3我们的优势 (18) 2业务需求分析 (21) 2.1总体需求 (21) 2.2数据管理 (22) 2.2.1数据采集 (23) 2.2.2数据交换 (23) 2.2.3数据存储与管理 (23) 2.2.4数据加工清洗 (24) 2.2.5数据查询计算 (24) 2.3数据管控 (25) 2.4数据分析与挖掘 (26)

2.6量收系统功能迁移 (27) 3系统架构设计 (28) 3.1总体设计目标 (28) 3.2总体设计原则 (28) 3.3案例分析建议 (29) 3.3.1中国联通大数据平台 (29) 3.3.2恒丰银行大数据平台 (36) 3.3.3华通CDN运营商海量日志采集分析系统 (48) 3.3.4案例总结 (53) 3.4系统总体架构设计 (54) 3.4.1总体技术框架 (54) 3.4.2系统总体逻辑结构 (57) 3.4.3平台组件关系 (59) 3.4.4系统接口设计 (64) 3.4.5系统网络结构 (68) 4系统功能设计 (70) 4.1概述 (70) 4.2平台管理功能 (70) 4.2.1多应用管理 (70) 4.2.2多租户管理 (74) 4.2.3统一运维监控 (75) 4.2.4作业调度管理 (94) 4.3数据管理 (96) 4.3.1数据管理框架 (96) 4.3.2数据采集 (98) 4.3.3数据交换 (101) 4.3.4数据存储与管理 (102) 4.3.5数据加工清洗 (120) 4.3.6数据计算 (121)

政务大数据平台建设方案.pdf

第一章需求分析和项目建设的必要性1.1 项目建设目标、内容 1.1.1 项目建设目标 电子政务公共数据开放共享平台项目建设目标是,依托统一的“云”数据中心建设统一的公共数据开放共享平台。集中机关各部门业务应用进行,制定相关的数据规范和信息交换标准,使机关各部门业务系统依托统一的开放平台进行开发建设。确保部门之间系统之间的互联互通、数据共享,为大数据分析提供数据依据。 1.1.2 项目建设内容 电子政务公共数据开放共享平台项目建设内容包含:一套标准规范、两个数据门户、四大应用平台、四大基础数据库和一个应用支撑平台。 具体建设内容包括: 1、一个应用支撑平台 为了对需要调用电子政务公共数据开放共享平台信息资源的政府部门应用系统进行有效管理,面向各类电子政务应用,规划建设统一的应用支撑平台,统一标准规范,通过用户管理、应用管理、服务管理等核心组件,可以对接入系统有效管理、实现统一认证及单点登录、统一消息服务。

2、两个数据门户 针对政府部门用户建设信息资源政务门户,针对企业、公众用 户建设信息资源开放门户。 3、四大应用系统 建设承载电子政务公共数据汇聚平台、数据治理平台、数据运 营平台和数据应用平台。 4、四大基础数据库 通过电子政务信息资源梳理,制定四大基础数据库的建库、入 库和管理规则,建立四大基础数据库管理平台,提供基础库内容管 理、数据处理、共享和应用功能。 四大基础数据库包括人口库、法人库、经济库和地理库。 5、一套标准规范 形成标准规范体系,包括管理制度、标准规范、数据标准等。 1.2 编制依据 1、中办、国办《2006-2020年国家信息化发展战略》; 2、国办《关于促进电子政务协调发展的指导意见》; 3、国务院《促进大数据发展行动纲要》; 4、《国家电子政务总体框架》; 5、《国家电子政务“十二五”规划》(工信部规〔2011〕567号); 6、《关于印发“十二五”国家政务信息化工程建设规划的通知》(发改高技〔2012〕1202号);

大数据平台开发与案例分析

关于举办“Hadoop与Spark大数据平台开发与案例分析”高级工程师 实战培训班的通知 地点北京上海 时间12月20-22 01月09-12 一、课程介绍 1.需求理解 Hadoop 设计之初的目标就定位于高可靠性、高可拓展性、高容错性和高效性,正是这些设计上与生俱来的优点,才使得Hadoop 一出现就受到众多大公司的青睐,同时也引起了研究界的普遍关注。 对电信运营商而言,用户上网日志包含了大量用户个性化需求、喜好信息,对其进行分析和挖掘,能更好地了解客户需求。传统经营分析系统小型机加关系型数据库的架构无法满足对海量非结构化数据的处理需求,搭建基于X86的Hadoop 平台,引入大数据处理技术的方式,实现高效率、低成本、易扩展的经营分析系统混搭架构成为电信运营商最为倾向的选择。本课程将全面介绍Hadoop平台开发和运维的各项技术,对学员使用该项技术具有很高的应用价值。2.培训课程架构与设计思路 (1)培训架构: 本课程分为三个主要部分: 第一部分:重点讲述大数据技术在的应用,使学员对大数据技术的广泛应用有清晰的认识,在这环节当中会重点介绍Hadoop技术在整个大数据技术应用中的重要地位和应用情况。 第二部分:具体对hadoop技术进行模块化分拆,从大数据文件存储系统技术和分布式文件系统平台及其应用谈起,介绍Hadoop技术各主要应用工具和方法,以及在运维维护当中的主流做法,使学员全面了解和掌握Hadoop技术的精华。 第三部分:重点剖析大数据的应用案例,使学员在案例当中对该项技术有更深入的感观印象 (2)设计思路:

本课程采用模块化教学方法,以案例分析为主线,由浅入深、循序渐进、由理论到实践操作进行设计。 (3)与企业的贴合点: 本课程结合企业转型发展及大数据发展战略,围绕企业大数据业务及行业应用市场拓展发展目标,重点讲授Hadoop的应用技术,提升企业IT技术人员的开发和运维能力,有很强的贴合度。 二、培训对象 各地企事业单位大数据产业相关人员,运营商 IT信息化和运维工程师相关人员,金融业信息化相关人员,或对大数据感兴趣的相关人员。 三、培训目标 掌握大数据处理平台(Hadoop、Spark、Storm)技术架构、以及平台的安装部署、运维配置、应用开发;掌握主流大数据Hadoop平台和Spark实时处理平台的技术架构和实际应用;利用Hadoop+Spark对行业大数据进行存储管理和分析挖掘的技术应用;讲解Hadoop生态系统组件,包括Storm,HDFS,MapReduce,HIVE,HBase,Spark,GraphX,MLib,Shark,ElasticSearch等大数据存储管理、分布式数据库、大型数据仓库、大数据查询与搜索、大数据分析挖掘与分布式处理技术 四、培训大纲 (1)课程框架 时间培训内容教学方式 第一天上午 第一部分:移动互联网、大数据、云计算相 关技术介绍 第二部分:大数据的挑战和发展方向 理论讲授+案例分 析 下午 第三部分:大数据文件存储系统技术和分布 式文件系统平台及其应用 第四部分:Hadoop文件系统HDFS最佳实战 理论讲授+案例分 析+小组讨论 第二天上午第五部分:Hadoop运维管理与性能调优 第六部分:NOSQL数据库Hbase与Redis 理论讲授+案例分 析+实战演练

大数据中心建设方案a

信息化系统建设方案 1.平台简介 工业产品环境适应性公共技术服务平台是面向工业企业、高校、科研机构等 提供产品/材料环境适应性技术服务的平台。平台服务内容主要包括两部分,一是产品环境适应性测试评价服务,一是产品环境适应性大数据服务。测试评价服务是大数据的主要数据来源和基础,大数据服务是测试评价服务的展示、延伸和增值服务。工业产品环境适应性公共技术服务平台服务行业主要包括汽车、光伏、 风电、涂料、塑料、橡胶、家电、电力等。 平台的测试评价服务依据ISO 17025相关要求开展。测试评价服务涉及2 个自有实验室、8个自有户外试验场和超过20个合作户外试验场。见图1

图1环境适应性测试评价服务实验室概况 平台的大数据服务,基于产品环境适应性测试评价获取的测试数据以及相关信息,利用数据分析技术,针对不同行业提供产品环境适应性大数据服务,包括但不限于: (1)产品环境适应性基础数据提供; (2)产品环境适应性调研分析报告; 3)产品环境适应性分析预测; 4)产品环境适应性技术规范制定; 2.信息化系统概述 信息化系统由两个子系统构成,即产品环境适应性测试评价服务管理系统和产品环境适应性大数据服务数据库系统。两个系统紧密关联,大数据系统的主要数据来源于测试评价服务产生的测试数据和试验相关信息,大数据服务是测试评价服务的展示、延伸和增值服务。 信息化系统的整体框架详见图2. 3.产品环境适应性测试评价服务管理系统 建设内容 (1)测试评价业务的流程化和信息化实现从来样登记、委托单下达、测试评价记录上传、报告审批、印发到样品试毕处理、收费管理等全流程电脑信息化管理;同时实现电子签名、分类统计、检索、自动提醒、生成报表等功能。 (2)实验室/ 试验场管理信息化 实现主要实验室/ 试验场样品、设备、标准、人员的信息化管理;实现主要仪器设备的数据自动采集和远程传输;实现主要试验场的远程视频监控。 (3)多方远程通讯 以广州为总部,实现广州总部与主要试验场之间的远程通讯,提供异地账户登录,满足异地多方人员(如委托方、委托方供应商、广州总部、户外试验场、外聘专家等)开展影音交流和现场办公; 总体要求

大数据成功案例

1.1成功案例1-汤姆森路透(Thomson Reuters)利用Oracle大 数据解决方案实现互联网资讯和社交媒体分析 ?Oracle Customer: Thomson Reuters ?Location: USA ?Industry: Media and Entertainment/Newspapers and Periodicals 汤姆森路透(Thomson Reuters)成立于2008年4月17日,是由加拿大汤姆森公司(The Thomson Corporation)与英国路透集团(Reuters Group PLC)合并组成的商务和专业智能 信息提供商,总部位于纽约,全球拥有6万多名员工,分布在超过100个国家和地区。 汤姆森路透是世界一流的企业及专业情报信息提供商,其将行业专门知识与创新技术相结合,在全世界最可靠的新闻机构支持下,为专业企业、金融机构和消费者提供专业财经信息服务,以及为金融、法律、税务、会计、科技和媒体市场的领先决策者提供智能信息及解决方案。 在金融市场中,投资者的心理活动和认知偏差会影响其对未来市场的观念和情绪,并由情绪最终影响市场表现。随着互联网和社交媒体的迅速发展,人们可以方便快捷的获知政治、经济和社会资讯,通过社交媒体表达自己的观点和感受,并通过网络传播形成对市场情绪的强大影响。汤姆森路透原有市场心理指数和新闻分析产品仅对路透社新闻和全球专业资讯进行处理分析,已不能涵盖市场情绪的构成因素,时效性也不能满足专业金融机构日趋实时和高频交易的需求。 因此汤姆森路透采用Oracle的大数据解决方案,使用Big Data Appliance大数据机、Exadata数据库云服务器和Exalytics商业智能云服务器搭建了互联网资讯和社交媒体大数据分析平台,实时采集5万个新闻网站和400万社交媒体渠道的资讯,汇总路透社新闻和其他专业新闻,进行自然语义处理,通过基于行为金融学模型多维度的度量标准,全面评估分析市场情绪,形成可操作的分析结论,支持其专业金融机构客户的交易、投资和风险管理。

生产企业大数据平台建设项目建议书v

生产企业大数据平台建设项目建议书v 文档编制序号:[KK8UY-LL9IO69-TTO6M3-MTOL89-FTT688]

大数据平台建设项目建议书 目录 第一章、项目背景 企业对信息化工作历来较为重视,也是省内较早开始实施信息化的大型企业。目前已经建成财务系统、生产调度系统、农务系统、供应链系统等: 调度系统,2015年公司共投资了175万元,按集团分步建设、逐步投入的规划,完成了系统基本硬件与亚控平台软件的结合,构建了一个以明阳糖厂生产调度指挥中心为核心,生产信息能够上至集团,下至车间的生产调度网络系统。 农务系统,2005年开始实施,经过多次升级,现涵盖了计划、报蔗、派车、质检、过磅、结算、短信管理、移动应用等一系列模块,覆盖公司4家直属糖厂和大桥制糖公司,实现了农务统一的信息化管理。 供应链系统,利用用友NC供应链系统,以公司存货管理为核心的采、供、销、存供应链管理平台,实现物资、仓储、供应、销售、物流一体化业务协同处理平台,建立了公司对各直属厂工作的监督平台,总部可以实时对下属各公司的工作进行监督,实时对各公司的具体业务执行情况进行查看,及时的对下属公司进行指导和监督。

尽管在两化融合及企业信息化方面已取得了相当的成效,但在实际应用过程中仍然存在一些较为显着的问题。 (一)总部与下属糖厂未实现完全的集约管理 a)企业在原先六家糖厂的基础上,又收购了三博公司五家糖厂。三博 五厂由上海迁回南宁,在宜州设立管理下属五厂的二级管理总 部。 b)从系统部署上分析,企业总部与原先六厂为一套架构,而三博总部 与下属五厂为一套架构,各自独立,暂未整合为一体。 c)为了保证各糖厂生产的稳定,企业总部与下属六厂之间仅在NC供 应链、OA、财务、人力等系统方面实现了集约管理,农务管理系 统、生产调度系统以及化验系统均由各厂自建,因此出现各厂建 设系统的厂家不同,使用的系统版本不同等现象。三博总部与下 属五厂的关系亦如此。 (二)总部及各厂之间的数据共享有限 a)由于大多数生产相关的系统均为各厂自建,因此不管是企业总部, 或者是三博总部在获取各糖厂生产相关数据上均较为困难。 b)企业总部通过制定报表模板、开发报表同步功能的方式,定期的获 取下属六家糖厂的生产相关报表,但这些报表的数据容量有限、 数据呈现较为固定,无法为总部经营决策提供实时、灵活的数据 依据。

大数据中心建设方案

工业产品环境适应性公共技术服务平台信息化系统建设方案

1. 平台简介 工业产品环境适应性公共技术服务平台是面向工业企业、高校、科研机构等提供产品/材料环境适应性技术服务的平台。平台服务内容主要包括两部分,一是产品环境适应性测试评价服务,一是产品环境适应性大数据服务。测试评价服务是大数据的主要数据来源和基础,大数据服务是测试评价服务的展示、延伸和增值服务。工业产品环境适应性公共技术服务平台服务行业主要包括汽车、光伏、风电、涂料、塑料、橡胶、家电、电力等。 平台的测试评价服务依据ISO 17025相关要求开展。测试评价服务涉及2个自有实验室、8个自有户外试验场和超过20个合作户外试验场。见图1 图1环境适应性测试评价服务实验室概况 平台的大数据服务,基于产品环境适应性测试评价获取的测试数据以及相关信息,利用数据分析技术,针对不同行业提供产品环境适应性大数据服务,包括但不限于: (1)产品环境适应性基础数据提供; (2)产品环境适应性调研分析报告; (3)产品环境适应性分析预测; (4)产品环境适应性技术规范制定;

2. 信息化系统概述 信息化系统由两个子系统构成,即产品环境适应性测试评价服务管理系统和产品环境适应性大数据服务数据库系统。两个系统紧密关联,大数据系统的主要数据来源于测试评价服务产生的测试数据和试验相关信息,大数据服务是测试评价服务的展示、延伸和增值服务。 信息化系统的整体框架详见图2. 3. 产品环境适应性测试评价服务管理系统 建设内容 (1)测试评价业务的流程化和信息化 实现从来样登记、委托单下达、测试评价记录上传、报告审批、印发到样品试毕处理、收费管理等全流程电脑信息化管理;同时实现电子签名、分类统计、检索、自动提醒、生成报表等功能。 (2)实验室/试验场管理信息化 实现主要实验室/试验场样品、设备、标准、人员的信息化管理;实现主要仪器设备的数据自动采集和远程传输;实现主要试验场的远程视频监控。 (3)多方远程通讯 以广州为总部,实现广州总部与主要试验场之间的远程通讯,提供异地账户登录,满足异地多方人员(如委托方、委托方供应商、广州总部、户外试验场、外聘专家等)开展影音交流和现场办公; 总体要求 (1)人机界面采用WINDOW界面,直观简单易学; (2)数据或信息一次录入,多系统共用; (3)人员身份识别; (4)检测报告唯一性识别; (5)不合格自动提醒报警; (6)短信通知,软件将重要事项,如不合格记录及时发送至指定人员手机上。(7)数据溯源,所有修改行为均留记录; (8)提供多层密码、权限,避免越权操作

集团大数据平台项目实施整体方案

集团大数据平台项目实施整体方案 1.1项目实施总体目标 我方承诺按照集团集团公司对项目建设的要求,认真研究调研,制定切实有效的实施方案,并根据实际情况,提交相应实施方案文档,其中技术文档内容主要包括项目需求分析文档、系统设计及技术文档、开发测试及部署规划、试点及系统上线规划及具体内容等。管理文档主要包括人员及组织管理、环境及资源需求计划、设备规划及使用、项目进度计划及里程碑管理、过程质量及风险控制计划以及培训交接计划等。 我方将根据项目进度,及时分配调度充足人员入场,在甲方监督下,在符合相关监管部门的审计制度和集团内控审计要求的前提下,根据甲方工程实施计划及进度要求,完成大数据平台的搭建、应用开发、联调测试、集成部署和培训等方面的工作。 1.2项目管理 项目管理由我方项目经理以及集团项目经理在所计划实施的项目过程中执行。

工作范围 ●确定项目计划、进行项目计划控制; ●监控项目状态、产生定期的项目状态报告; ●负责项目期间的沟通管理,召集并主持定期的项目状况会议; ●对项目范围、成本、风险、人力、干系人等进行全过程的管控; ●其它与项目相关的事务。 我方的责任 ●负责与本公司内部有关的协调工作; ●负责与集团的项目经理合作,共同负责项目中的协调 工作; ●与集团的项目经理协调配合,完成以上项目管理工作。集团的责任 ●负责与本公司内部有关的协调工作; ●负责与我方的项目经理合作,共同负责项目中的协调 工作; ●与我方的项目经理协调配合,完成以上项目管理工作。

1.3业务确认 工作范围 ●业务需求确认,对大数据平台的业务需求结合当前实 际业务情况进行确认。 工作完成后需提交的结果 ●集团大数据平台需求列表 我方的责任 ●指定相关业务/技术顾问和用户的相关业务部门进行 业务确认、分析 ●执行以上陈述的工作,并提交阶段性工作结果 集团的责任 ●指定参与业务需求确认的项目组和业务部门的相关人 员 ●协调业务需求确认确认过程中的业务人员、时间安排 等有关事项 ●对集团大数据平台业务需求列表进行确认 1.4数据调研 工作范围

相关文档
最新文档