MPP数据库将支撑起大数据时代

MPP数据库将支撑起大数据时代
MPP数据库将支撑起大数据时代

新型MPP数据库将支撑起大数据时代

大数据这个领域过去5年发展很快、热度很高,但是总的来说目前还在起步阶段。本次研讨会我会先谈谈数据,以及大数据对数据处理技术的压力,然后为大家分享一下为什么这几年数据处理技术上的创新很多。

1. 数据价值的发现与使用

在大数据的4个V中,最显著的特征应该是Value(价值)。不管数据多大,是什么结构,来源如何,能给使用者带来价值的数据是最重要的数据。

我跟数据打了20多年的交道,从来没感觉到搞数据的地位有今天这么高。整个社会对数据的认知变了,大数据最大的贡献至少是让社会各个层面开始认识到数据的重要性,包括最高领导和底层的老百姓。

目前大家基本达成共识:数据像石油、煤一样是宝贵的资产,其内在的价值非常巨大。另外一个显著的贡献无疑是互联网企业对于数据的巧妙使用和价值体现。

2. 数据处理技术的回顾

互联网的数据“大”是不争的事实,现在分析一下数据处理技术面临的挑战。目前除了互联网企业外,数据处理领域还是传统关系型数据库(RDBMS)的天下。传统RDBMS的核心设计思想基本上是30年前形成的。过去30年脱颖而出的无疑是Oracle公司。全世界数据库市场基本上被Oracle,IBM/DB2,Microsoft/SQL Server 垄断,其他几家市场份额都比较小。SAP去年收购了Sybase,也想成为数据库厂商。有份量的独立数据库厂商现在就剩下Oracle和Teradata。开源数据库主要是MySQL,PostgreSQL,除了互联网领域外,其他行业用的很少。这些数据库当年主要是面向OLTP交易型需求设计、开发的,是用来开发人机会话应用为主的。这些传统数据库底层的物理存储格式都是行存储,比较适合数据频繁的增删改操作,但对于统计分析类的查询,行存储其实效率很低。在这些成熟的数据库产品中,有2个典型特例:一个是Teradata,一个是Sybase IQ。

Teradata一开始就使用MPP(Massive Parallel Processing)架构,以软硬一体机的产品方式提供给客户,其定位是高端客户的数据仓库和决策分析系统,Teradata在全世界的客户只有几千个。在这个数据分析高端市场上,Teradata一直是老大,在数据分析技术上Oracle和IBM打不过Teradata。Sybase IQ是一款最早基于列存储的关系型数据库产品,其定位跟Teradata类似,不过是以软件方式销售的。Teradata和Sybase IQ在数据分析应用上的性能其实都比Oracle,DB2等要普遍好。

3. 数据增长加速,数据多样化,大数据时代来临

如果说现在是大数据时代了,其实是数据来源发生了质的变化。在互联网出现之前,数据主要是人机会话方式产生的,以结构化数据为主。所以大家都需要传统的RDBMS来管理这些数据和应用系统。那时候的数据增长缓慢、系统都比较孤立,用传统数据库基本可以满足各类应用开发。

互联网的出现和快速发展,尤其是移动互联网的发展,加上数码设备的大规模使用,今天数据的主要来源已经不是人机会话了,而是通过设备、服务器、应用自动产生的。传统行业的数据同时也多起来了,这些数据以非结构、半结构化为主,而真正的交易数据量并不大,增长并不快。机器产生的数据正在几何级增长,比如基因数据、各种用户行为数据、定位数据、图片、视频、气象、地震、医疗等等。

所谓的“大数据应用”主要是对各类数据进行整理、交叉分析、比对,对数据进行深度挖掘,对用户提供自助的即席、迭代分析能力。还有一类就是对非结构化数据的特征提取,以及半结构化数据的内容检索、理解等。

传统数据库对这类需求和应用无论在技术上还是功能上都几乎束手无策。这样其实就给类似Hadoop的技术和平台提供了很好的发展机会和空间。互联网公司自然就选择能支撑自己业务的开源技术了,反过来又推动了开源技术的快速发展。

4. 新的数据处理技术、产品和创新

为了应对数据处理的压力,过去十年间在数据处理技术领域有了很多的创新和发展。除了面向高并发、短事务的OLTP内存数据库外(Altibase, Timesten),其他的技术创新和产品都是面向数据分析的,而且是大规模数据分析的,也可以说是大数据分析的。

在这些面向数据分析的创新和产品中,除了基于Hadoop环境下的各种NoSQL外,还有一类是基于Shared Nothing架构的面向结构化数据分析的新型数据库产品(可以叫做NewSQL),如:Greenplum(EMC收购),Vertica(HP 收购),Asterdata(TD 收购),以及南大通用在国内开发的GBase 8a MP Cluster等。目前可以看到的类似开源和商用产品达到几十个,而且还有新的产品不断涌出。一个有趣的现象是这些新的数据库厂商多数都还没有10年历史,而且发展好的基本都被收购了。收购这些新型数据库厂商的公司,比如EMC、HP,都希望通过收购新技术和产品进入大数据处理市场,是新的玩家。SAP除了收购Sybase外,自己开发了一款叫HANA的新产品,这是一款基于内存、面向数据分析的内存数据库产品。

这类新的分析型数据库产品的共性主要是:

架构基于大规模分布式计算(MPP);硬件基于X86 PC 服务器;存储基于服务器自带的本地硬盘;操作系统主要是Linux;拥有极高的横向扩展能力(scale out)和内在的故障容错能力和数据高可用保障机制;能大大降低每TB数据的处理成本,为“大数据”处理提供技术和性价比支撑。

总的来看,数据处理技术进入了一个新的创新和发展高潮,机会很多。这里的主要原因是一直沿用了30年的传统数据库技术遇到了技术瓶颈,而市场和用户的需求在推动着技术的创新,并为此创造了很多机会。在大数据面前,越来越多的用户愿意尝试新技术和新产品,不那么保守了,因为大家开始清晰地看到传统技术的瓶颈,选择新的技术才有可能解决他们面临的新问题。

现在的总体趋势是在数据量快速增长、多类数据分析并存的需求压力下,数据处理技术朝着细分方向发展,过去30年一种平台满足所有应用需求的时代已经过去。我们必须开始根据应用需求和数据量选择最适合的产品和技术来支撑应用。世界数据处理市场格局正在发生革命性的变化,传统数据库(OldSQL)一统天下变成了OldSQL+NewSQL+NoSQL+其他新技术(流、实时、内存等)共同支撑多类应用的局面。在大数据时代,需要的是数据驱动最优平台和产品的选择。

5. MPP关系型数据库与Hadoop的非关系型数据库

大数据存储技术路线最典型的共有三种:

第一种是采用MPP架构的新型数据库集群,重点面向行业大数据,采用Shared Nothing 架构,通过列存储、粗粒度索引等多项大数据处理技术,再结合MPP架构高效的分布式计算模式,完成对分析类应用的支撑,运行环境多为低成本PC Server,具有高性能和高扩展性的特点,在企业分析类应用领域获得极其广泛的应用。

这类MPP产品可以有效支撑PB级别的结构化数据分析,这是传统数据库技术无法胜任的。对于企业新一代的数据仓库和结构化数据分析,目前最佳选择是MPP数据库。

图 1 MPP架构图

第二种是基于Hadoop的技术扩展和封装,围绕Hadoop衍生出相关的大数据技术,应对传统关系型数据库较难处理的数据和场景,例如针对非结构化数据的存储和计算等,充分利用Hadoop开源的优势,伴随相关技术的不断进步,其应用场景也将逐步扩大,目前最为典型的应用场景就是通过扩展和封装Hadoop来实现对互联网大数据存储、分析的支撑。这里面有几十种NoSQL技术,也在进一步的细分。对于非结构、半结构化数据处理、复杂的ETL 流程、复杂的数据挖掘和计算模型,Hadoop平台更擅长。

第三种是大数据一体机,这是一种专为大数据的分析处理而设计的软、硬件结合的产品,由一组集成的服务器、存储设备、操作系统、数据库管理系统以及为数据查询、处理、分析用途而特别预先安装及优化的软件组成,高性能大数据一体机具有良好的稳定性和纵向扩展

性。

6. 数据仓库的重要性

在互联网高速发展之前,无论是电信运营商,还是大银行,保险公司等都花费了巨额资金建立了自己的企业级数据仓库。这些仓库主要是为企业决策者生成企业的一些关键指标(KPI),有的企业有几千张、甚至上万张KPI报表,有日表,周表,月表等等。这些系统有

几个主要特征:

技术架构主要基于传统RDBMS + 小型机 + 高端阵列 (就是大家说的IOE),当然数据库

有部分DB2,Teradata等。

报表基本都是固定的静态报表,产生的方式是T+1 (无法即时产生)。

数据量增长相对缓慢,DW的环境变化很少。

最终用户只能看汇总的报表,很少能够基于汇总数据做动态drilldown (钻取)。

多数领导基本上认为花了很多钱,但看不出是否值得做,有鸡肋的感觉。最后大家对大

量的报表都视而不见了。

这类系统属于“高富帅”,是有钱的企业给领导用的。

最后,目前多数企业和部门根本就没有数据仓库。其实大家对传统数据的分析还没做得

太好、还没有普及,现在又遇上了大数据。

数据仓库对企业是真正有用的,其关键还是如何把数据用好。

7. 数据处理技术的核心问题到底是什么?

其实我们一直面临着数据处理中最核心、最大的问题,那就是性能问题。性能不好的技术和产品是没有生命力的。数据处理性能问题不是因为大数据才出现,也不会有了大数据技术而消失。处理性能的提升将促进对数据价值的挖掘和使用,而数据价值挖掘的越多、越深

入,对处理技术要求就越高。

目前的数据仓库只能满足一些静态统计需求,而且是T+1模式;也是因为性能问题,运营商无法有效构造超过PB级别的大数据仓库,无法提供即席查询、自助分析、复杂模型迭代分析的能力,更无法让大量一线人员使用数据分析手段。

今天如果做“大数据”数据仓库,运营商面临的挑战比上个10年要大的多。目前没有单一技术和平台能够满足类似运营商的数据分析需求。可选的方案只能是混搭架构,用不同的分布式技术来支撑一个超越PB级的数据仓库系统。这个混搭架构主要的核心是新一代的MPP并行数据库集群+ Hadoop集群,再加上一些内存计算、甚至流计算技术等。

大数据需要多元化的技术来支撑。当前数据处理对企业的挑战越来越大,主要是下面几

个原因:

第一个原因是数据量已经是上一代的一个数量级了,1个省份级运营商1年就可超越1PB

结构化数据。

第二个原因是“大数据”关注的更多是用户行为、群体趋势、事件之间的相关性等,而不仅仅是过去的KPI,。这就对数据分析平台对数据的分析能力和性能提出了新的要求和挑

战。

图 2 未来大数据处理的核心技术

8. 总结—新型MPP数据库的价值

技术:基于列存储+MPP架构的新型数据库在核心技术上跟传统数据库有巨大差别,是为面向结构化数据分析设计开发的,能够有效处理PB级别的数据量。在技术上为很多行业用户解决了数据处理性能问题。

用户价值:新型数据库是运行在x-86 PC服务器之上的,可以大大降低数据处理的成本(1个数量级)。

未来趋势:新型数据库将逐步与Hadoop生态系统结合混搭使用,用MPP处理PB级别的、高质量的结构化数据,同时为应用提供丰富的SQL和事务支持能力;用Hadoop实现半结构化、非结构化数据处理。这样可同时满足结构化、半结构化和非结构化数据的处理需求。

下图是南大通用正在做的大数据处理平台架构图,将逐步把MPP与Hadoop技术融合在一起,为用户提供透明的数据管理平台。

图 3 MPP与Hadoop技术融合的产品架构图

Oracle数据库云化整合方案

Oracle数据库云化整合方案整合最佳实践:借助 Oracle Database 进入云时代

目录 概要 (2) 企业云之旅 (3) 通过标准化降低复杂性 (4) 整合降低成本并提高可管理性 (5) 通过Oracle Database 12c 实现整合 (6) 新式多租户架构的主要优势 (6) 选择整合方式 (8) PDB 如何解决IT 复杂性问题 (8) 选择合适的隔离级别 (9) 隔离及其对整合的影响 (9) 可插拔数据库整合 (10) 数据库整合 (13) 整合多个CDB (15) 模式整合 (17) 云池设计 (19) CPU (19) 内存 (21) 存储 (22) 互补性负载 (23) Oracle Enterprise Manager 12c Cloud Management Pack (25) Consolidation Planner (25) 执行所有供应活动的Database Provisioning 控制台 (26) 计费 (26) 总结 (27)

概要 传统上,IT 组织将各个数据库和应用程序部署在专用服务器基础架构上,以支持不同的部门或业务线(LOB)。技术与业务职能部门之间的这种细分式协调不仅导致技术基础架构利用率极低,而且管理这种部署的管理资源利用率也很低。此外,这种孤岛式部署还抑制了IT 组织快速响应不断变化的业务需求的能力。 为应对这些挑战,许多组织正利用企业私有云来实现成本节省,同时提高业务敏捷性。这种向云计算模型的转移涉及到多项变革。整合是这一历程中的关键步骤之一,它可以提高资源利用率,降低资本支出和运营支出,从而帮助组织提高运营效率。实现这些节省的关键是实现标准化以及减少需要管理的不同环境的数量。 Oracle Database 12c 为整合应用程序负载提供了巨大优势。这些优势包括: 1. 简化管理—减少需要管理的不同环境的数量。 多合一管理。 2. 简化供应和打补丁 3. 易于整合—无需更改应用程序即可实现整合。 在本文中,我们将介绍这些功能并说明Oracle Database 12c 如何帮助执行整合以及加快您的云之旅。

云时代的大数据

简介 本书以云计算为基石,从概念、研究、应用角度出发,系统地介绍了数据爆炸时代下的大数据。首先介绍了云计算及大数据的基础知识,让读者对云计算及大数据有概要认识;然后根据需要介绍了Hadoop软件下的MapReduce、HDFS及HBase这几个组件;接着全面、系统地介绍了云时代下的大数据,主要包括大数据的链接、聚类、项集、系统、相似项挖掘及数据量化等内容,让读者挖掘云时代大数据体系下的效益、价值及研究方向。 序言 几年之内,云计算已从新兴技术发展成为当今的热点技术。从2003年谷歌公开发布的核心文件到2006年 AmazonEC2(亚马逊弹性计算云)的商业化应用,再到美国电信巨头AT&T (美国电话电报公司)推出的SynapticHosting(动态托管)服务,云计算从节约成本的工具到盈利的推动器,从ISP(网络服务提供商)到电信企业,已经成功地从内置的IT系统演变成公共的服务。 随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系数据库中用于分析时会花费过多的时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百甚至数千台计算机分配工作。 “大数据”这个术语最早期的引用可追溯到Apache的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌MapReduce和GoogleFile System(GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。 在当今的IT行业中都需要对数据进行分析,而数据分析都需要数据源,大数据尤甚。互联网公司通过搜索引擎、访问记录、App追踪等技术手段可以获得大量的用户浏览信息,但这些信息的收集、存储、提取、访问等环节都不可能向大众公开,相关数据的使用规则目前还缺乏法律规范。对普通人而言,获得公开、免费、准确的数据来源似乎成为一种奢望,但企业和政府的数据公开的步伐已经迈出。各行各业都需要大数据,如医疗上的各种疾病数据,农业上的作物、天气、病虫害、土壤资料等数据,工业制造上的原材料、加工流程、设备信息、产品规格等数据,金融行业的客户资料、金融产品等数据,教育领域的学生、学校、教师、教材等数据,国防领域的卫星、海域等数据,环境保护中的空气污染物、水源质量分析等实时数据……不论政府、企业还是个人,对大数据的需求也涉及经济社会的各个方面。 互联网和移动互联网已经给电信、零售、媒体等行业带来了深刻变革,如果进入大数据时代,那么还有更多行业会迎接洗礼。目前智能制造、互联网金融、数字化诊疗已经崭露头角。个人用户对大数据的需求可能带来数据接收方式的变化,各类智能终端将再次迎来发展机遇。除了功能越来越强大的智能手机之外,眼镜、汽车、手表,甚至自行车都有可能成为接收数据的新型智能终端。 根据云时代的大数据发展趋势,笔者编著了本教材,让读者认识到什么是云,什么是大数据,以及云与大数据的关系,在各企业领域中怎样应用云时代的大数据。本书主要内容有:第1章:介绍了云时代概述,主要包括“云”基本介绍、云产生的背景、云计算特点及云计算的关键性技术等内容。 第2章:介绍了大数据概述,主要包括大数据基本概念、大数据的发展趋势、大数据的挑战、现状与展望及大数据行业应用和未来热点等内容。 第3章:介绍了数据挖掘,主要包括数据挖掘的定义、起源、功能、实现方法、应用及

POLARDB数据库,阿里云的自信源自哪里

POLARDB数据库,阿里云的自信源自哪里 “你好,我是阿里云数据库团队负责人,我叫鸣嵩(曹伟)。”初次见面的印象,让笔者觉得鸣嵩并不像一个IT男,形象阳光、精神抖擞、嘴角带着一点点微笑。就在笔者还在回味《复联3》中小蜘蛛和奇异博士有关“花名”的梗时,鸣嵩让我有了新的认识。 采访过程中,鸣嵩的语速一直很快,语言简练,思维清晰,不断出现的术语和数据说明了他的专业性,喜欢列举实例。整个人总是带着一股浓郁的自信。好像,每一个阿里人都是那么的自信。 那些在一线才知道的 一位工作在云数据库一线的开发和运维人员,在云栖社区做了以下分享: “我在4天前,手工做了一个备份,数据库比较大,3T,你们说差不多要70个小时备份,这个…有没有什么办法加快一点,我老板还着急要数据呢” “你好,我们公司有个数据库,想迁到阿里云RDS 上,对RDS的产品品质我们很满意,只是我们的数据库有10T,请问一下,支持这么大的实例么?” “你好,我用了你们的MySQL数据库,最近几天在做活动,主库压力比较大,只读实例就延迟了,现

在看过去貌似很难跟上,有什么办法么?” 这些抱怨也好,吐槽也罢,都来自云数据库用户的真实案例,总结起来,传统的云数据库由于自身架构原因,会遇到很多问题: 读写实例和只读实例各自拥有一份独立的数据,用户购买只读实例,不仅需要付出计算的成本,也需要付出存储资源的成本;新建一个只读实例需要重新拷贝数据,考虑到网络限流,速度不会很快;传统备份技术,由于涉及到拷贝数据,并上传远程存储,速度因此也受网络影响等等。 随着数据库数据量的增大,各行各业对云数据库业务的需求增加,这些问题就会不断加剧。鸣嵩说:“这些困扰大家已久的问题,PolarDB都可以从本质上解决,而不是想个trick绕过去。” 核心优势有5个 PolarDB是阿里云数据库团队过去3年间自主研 发的一个企业级数据库。鸣嵩总结了其5大核心优势。 第一,兼容性。PolarDB兼容了当下最主流的、开发者最喜欢用的MySQL和PostgreSQL两种数据库生态,这意味着MySQL和PostgreSQL的老用户,在一行代码不用改的前提下,可以把业务从原来的开源数据库迁移到阿里云的企业数据库平台上。

POLARDB数据库,阿里云的自信源自哪里.docx

POLARDB数据,阿里云的自信源自哪里 “你好,我是阿里云数据人,我叫嵩(曹)。”初次面的印象,笔者得嵩并不像一个IT 男,形象阳光、精神抖、嘴角着一点点微笑。就在笔者在回味《复3》中小蜘蛛和奇异博士有关“花名”的梗,嵩我有了新的。 采程中,嵩的速一直很快,言,思清晰,不断 出的和数据明了他的性,喜列例。整个人是着一 股郁的自信。好像,每一个阿里人都是那么的自信。 那些在一才知道的 一位工作在云数据一的开和运人,在云栖社 区做了以下分享: “我在 4 天前,手工做了一个份,数据比大,3T, 你差不多要 70 个小份,个?有没有什么法加快一点,我老板着急要数据呢” “你好,我公司有个数据,想迁到阿里云 RDS 上, RDS的品品我很意,只是我的数据 有 10T,一下,支持么大的例么?” “你好,我用了你的MySQL数据,最近几天 在做活,主力比大,只例就延了,

在看过去貌似很难跟上,有什么办法么?” 这些抱怨也好,吐槽也罢,都来自云数据库用户 的真实案例,总结起来,传统的云数据库由于自身架 构原因,会遇到很多问题: 读写实例和只读实例各自拥有一份独立的数据, 用户购买只读实例,不仅需要付出计算的成本,也需 要付出存储资源的成本;新建一个只读实例需要重新 拷贝数据,考虑到网络限流,速度不会很快;传统备 份技术,由于涉及到拷贝数据,并上传远程存储,速 度因此也受网络影响等等。 随着数据库数据量的增大,各行各业对云数据库业 务的需求增加,这些问题就会不断加剧。鸣嵩说:“这 些困扰大家已久的问题, PolarDB都可以从本质上解决,而不是想个 trick 绕过去。” 核心优势有 5 个 PolarDB是阿里云数据库团队过去 3 年间自主研发 的一个企业级数据库。鸣嵩总结了其 5 大核心优势。 第一,兼容性。 PolarDB兼容了当下最主流的、开 发者最喜欢用的MySQL和PostgreSQL两种数据库生态,这意味着 MySQL和 PostgreSQL的老用户,在一行代码 不用改的前提下,可以把业务从原来的开源数据库迁移到 阿里云的企业数据库平台上。

传统软件迈向“云时代”之路

传统软件迈向“云时代”之路 以某套传统管理软件为例,阐述了其如何适应“云时代”要求而进行“云化”转型的过程,提出了传统软件向SaaS软件转型的三步曲:第一步,采用传统软件结合云计算IaaS的模式;第二步,实现多租户单实例的应用架构;第三步,实现高性能应用。改造后的传统管理系统可向各类企业提供统一的“云门户”,快速形成满足企业信息化需求的开放式集成化SaaS管理系统。 1 引言 随着软件工业的迅速发展,实现各种功能的软件层出不穷,企业可选择的软件产品也是琳琅满目。在信息社会下,企业为了经营需要,必须购买相应的专业软件产品。为了支撑这些软件的运行,企业除了需要添置个人电脑、服务器和网络设备之外,往往还需要配备相关的IT系统维护人员。随着企业的不断成长壮大,业务需求越来越多并向精细化发展,传统的IT系统不能再像以前那样通过信息化为企业减少成本带来价值,反而导致了IT系统不实用、管理困难、成本超支等问题。广大的中小企业,面对传统的软件模式带来的高昂支出望而却步,不仅影响了自身的信息化发展,也使传统软件厂商的市场开拓陷入困境。而云计算的诞生,使整个IT产业重新找到了发展方向,在短短的两三年间就产生了巨大的影响力。 云计算是一种企业基于互联网获取相关IT服务的增加、使用和交付的模式,企业可通过网络以按需、易扩展的方式获得所需IT服务。毫不夸张地说,现在全世界正在步入一个“云”的时代,硬件供应商、软件开发商、系统集成商、服务提供商纷纷试水云计算领域,整个IT产业将面临新一轮的洗牌和产业调整,这是让所有IT人不断创造、创新的一个大舞台。 2 云计算服务层次简述 云计算有3种服务层次:IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务),国内云计算的投入大多集中在IaaS及SaaS层面。SaaS的核心概念是软件的服务化,即将软件看作一种服务,而不是一种商品。SaaS软件相对于传统软件,将原本由软件使用者承担的软硬件、网络、系统维护的费用,变为支付给SaaS服务提供商的租用费用。 SaaS软件可给企业用户带来许多优点:无需安装、拿来即用,用户也无需维护;先天防毒,给用户省去不少麻烦;使用风险较低,相对于传统软件的一次性投入,成本大大降低;只要有网络的地方就可使用,而且用多用少完全由用户自己决定。SaaS也给软件商带来了新的机遇,可以减少软件商的销售成本,还能降低维护软件和客户服务的成本。更重要的是,SaaS带给软件厂商一种稳健的商业经营模式,可以让软件商和客户之间形成良性的循环,真正达到软件开发商和软件使用者双赢的目标。 3 传统软件向SaaS软件转型的三步曲 传统软件向SaaS软件转型的过程中,遇到的重要挑战就是多租户的思维转变。传统软件的销售模式决定了软件的每一个运行实例单独服务于一个客户,因此对于性能、可配置性、伸缩性方面的处理策略都是针对单一客户设计的;而对于SaaS应用,为了最大化SaaS的规模效应,一般采用的都是多个租户共享一个运行实例的架构,即多租户架构。但是要将传统软件产品改造成具备可配置性、高性能和可伸缩性的高成熟度的SaaS应用,从开发成本、复杂性和团队开发能力来考虑,并不是一件容易的事。 本文提出传统软件向SaaS软件转型的三步曲,进行分步式实施改造。 3.1 第一步,采用传统软件结合云计算IaaS的模式 现阶段云计算尚属新生事物,出于对安全性、保密性等因素的考虑,虽然对SaaS应用的需求很旺盛,但真正愿意马上使用SaaS软件来替代传统应用的用户并不多。在这种情况下,软件服务提供商需要为每个客户定制一套软件,并为其部署在云端,每个客户使用一个独立的数据库实例和应用服务器实例。通过云计算的IaaS服务,可以将硬件资源的利用最大化,降低硬件及运行维护成本。考虑到每个客户都有定制化的需求,软件的可配置性是这

相关主题
相关文档
最新文档