京东服务器测试白皮书

京东服务器测试白皮书
京东服务器测试白皮书

京东服务器测试白皮书

京东商城文件系统团队

版本号:V0.1

目录

京东服务器测试白皮书 (1)

1引言 (3)

2 网络拓扑 (3)

4 测试流程 (5)

5测试压力变化模型 (6)

6 测试类型描述 (7)

6.1性能测试 (7)

6.1.1服务器测试 (7)

6.1.2单台服务器 (7)

6.1.4 N台服务器 (7)

6.1.5单级目录项数目 (8)

6.1.5多级目录深度 (8)

6.2压力测试 (8)

6.2.1服务器测试 (8)

6.2.1单台服务器 (8)

6.2.3 N台服务器 (8)

6.3容错测试 (9)

6.3.1服务器断电 (9)

6.3.2数据重建与一致性 (9)

6.3.3 磁盘空间不足 (9)

6.4稳定性测试 (9)

6.5数据迁移测试 (9)

7 测试环境描述 (10)

7.1 测试与监控 (10)

7.1.1 测试工具 (10)

7.1.2 监控指标 (10)

7.1.3 监控软件 (10)

7.2 样本数据 (10)

7.2.1大文件与小文件 (10)

7.2.2大文件数据样本 (10)

7.2.3小文件数据样本 (11)

7.3.1测试结果 (11)

8厂商服务器评比 (12)

8.1服务器评比规则 (12)

8.2服务器厂商硬件对比 (13)

8.3服务器厂商测试数据对比 (13)

8.4 计算规则 (15)

8.4对比结果 (16)

9 参考文献 (16)

1引言

为了清楚厂商服务器是否满足存储产品需求,需要对其服务器进行测试。通过测试获得各个厂商服务器在功能,稳定性,扩展性,高性能,能耗等方面数据,为”JDFS”分布式文件系统选择“性价比“最高的服务器提供数据依据。为了提供一套选择服务器的标准,需要重点关注一些点,将这些点作为选择服务器的标准。

在对服务器进行总体评价时,综合了性能、功能和价格三方面因素,依据《网络世界》所做的用户调查结果,分别给予不同权重,性能占60%,功能占30%,而价格则占10%。

通常情况下,厂商可以提供服务器安装“JDFS”(EMC等厂商除外),因此下面的测试标准是可以通用的,如果不能安装“JDFS”,也可以将其解决方案与其他厂商安装了“JDFS”的服务器进行对比。

2 网络拓扑

网络拓扑图代表了厂商服务器与客户机通过交换机连接的物理架构图,在左边为厂商服务器,此处以2台代表多台,右边为京东客户端服务器,以4台代表多台,中间通过1000MB,10000MB交换机将服务器与客户端连接起来。服务器与客户端机器均安装了“JDFS”。

网络拓扑示意图

3测试类型

4 测试流程

要获得厂商服务器性能,功能等数据,需要对这些服务器进行测试,下面为整体测试顺序图,每个厂商要完成测试简略图和测试详细图中的每个阶段,才算测试完毕。

测试简略图

测试详细图

单个TC流程图

单个TC流程图说明:

1、环境搭建,为测试提供硬件环境;

2、务器客户端服务器缓存,测试前保持机器的安静;

3、好测试的样本数据;

4、服务端监控设备,为测试数据收集做准备;

5、测试程序,该过程会产生大量的测试数据;

6、监控设备收集到测试数据;

7、集到的数据进行分析加工。

5测试压力变化模型

随着单位时间流量的不断增长,被测系统的压力不断增大,服务器资源会不断被消耗,TPS 值会因为这些因素而发生变化,而且符合一定的规律。京东商城性能测试压力变化模型如图4-1 所示:

上图说明:

a 点:性能期望值

b 点:高于期望,系统资源处于临

c 点:高于期望,拐点

d 点:超过负载,系统崩溃

6 测试类型描述

6.1性能测试

性能测试主要测试服务器大文件顺序读,大文件顺序写,大文件随机读,大文件随机写,小文件顺序读,小文件顺序写,小文件随机读,小文件随机写,大小文件混合读写,及其服务器在集群模式下的性能表现,同时也为服务器线性扩展提供数据依据。

性能测试对应图4-1的a-b之间,狭义的性能测试,是指以性能预期目标为前提,对系统不断施加压力,验证系统在资源可接受范围内,是否能达到性能预期。

6.1.1服务器测试

在不安装JDFS的情况下,对单台服务器进行性能测试。

6.1.2单台服务器

在客户端机器数量有限的情况下,测试单台服务器进行文件读写(包括混合读写,顺序读写,随机读写,下同)可以支持的客户机数量,为线性扩展服务器与客户端提供数据依据,同时即使每个厂家仅提供一台测试服务器,也可以进行产品对比。

6.1.3 N台服务器

测试多台服务器对应多台客户端机器模式下的文件读写性能测试,从而确定

服务器在集群模式下的性能表现;确定多台机器可以支持的客户端数目;与1,2台性能测试数据进行对比,计算服务器与客户端是否做到了线性扩展(主要针对JDFS特点)

6.1.4单级目录项数目

在3.1.1到3.1.4的每种测试的时候验证单级目录支持的目录项,因为存储节点不一样,”JDFS”查询效率也不一样。单级目录目录项梯度测试为:100,500,1000,5000,10000,10 0000

6.1.5多级目录深度

在3.1.1到3.1.4的每种测试的时候验证多级目录支持的目录深度查询,理论上仅仅测试3,1,1即能满足要求。目录深度梯度为:1,5,10,20,50

6.2压力测试

压力测试对应图4-1中b 点到d 点之间,狭义的压力测试,是指超过安全负载的情况下,对系统不断施加压力,是通过确定一个系统的瓶颈或不能接收用户请求的性能点,来获得系统能提供的最大服务级别的测试。

6.2.1服务器测试

在不安装JDFS的情况下,对单台服务器进行压力测试。

6.2.2单台服务器

测试1台服务器能够支持的并发压力数,在拐点处记录其并发数,CPU,内存,网络资源情况。

6.2.3 N台服务器

测试2台服务器能够支持的并发压力数,在拐点处记录其并发数,CPU,内存,

网络资源情况。

6.3容错测试

6.3.1服务器断电

在一个节点挂掉的环境下,进行读写数据,服务器正常工作是否受影响,性能是否受影响,受多大影响。

6.3.2数据重建与一致性

在挂掉一块磁盘后,进行数据恢复,测试该磁盘恢复数据所需要的时间和磁盘恢复速度及数据恢复的完整性。

6.3.3 磁盘空间不足

磁盘空间存储容量达到90%后速度会很慢,测试此时的集群性能情况。

6.4稳定性测试

稳定性测试对应图1-1中a 点到b 点之间,狭义的稳定性测试,是指被测试系统在特定硬件、软件、网络环境条件下,给系统加载一定业务压力,使系统运行一段较长时间,以此检测系统是否稳定,进行7x24小时不间断的压力测试,保证系统的稳定性。

6.5数据迁移测试

模拟线上卷数据迁移,测试该集群迁移数据所需要的时间和迁移速度及数据迁移后的完整性验证。

7 测试环境描述

7.1 测试与监控

7.1.1 测试工具

分布式集群测试工具有很多,采用iozone或者自己写脚本。不管采用哪种方式,尽量每个厂家均采用iozone或者脚本测试。

7.1.2 监控指标

需要包括的指标包括如下几点:

1、网络;

2、CPU;

3、内存;

4、I/O

7.1.3 监控软件

监控软件有:ibmonitor,top,iostat等。

7.2样本数据

7.2.1大文件与小文件

不同的存储系统对大文件与小文件有不同的划分,针对“JDFS”文件系统,大小文件界定如下:

1、大文件:小于1MB的数据定为小文件;

2、小文件:大于1MB的数据定为大文件。

7.2.2大文件数据样本

7.2.3小文件数据样本

7.3测试结果显示

1、相同服务器,不同客户端,不同并发

2、性能,并发拐点时的数据统计

8厂商服务器评比

对各个厂商服务器测试后,需要进行评比。这样就需要制定评比规则,来评比各个厂商的硬件配置,测试数据。并且为这些评比项设置不同的权重。找出性价比最高的服务器。

8.1服务器评比规则

服务器测试后,需要进行各个方面的参数比较,各个厂家提供的服务器配置等均不一致,这样评比的结果是没有意义的,因此首先应该确保服务器配置大致一致,或者可以推算大致一致。要满足这个条件:1、厂商服务器送来前,要求他们提供服务器满足台数,存储密度等要求;2、厂商服务器配置有多种,通过一定规则也可以进行对比,大致规则如下:

CPU:一般均为intel,型号比较固定,大致可以推算;

内存:一般服务器内存为16GB,32GB,同等类型内存进行比较,并且比较服务器最大支持内存值;

硬盘:厂商一般提供硬盘为20TB,30TB,50TB等,可以比较30TB的存储密度情况下的值;

网卡:网卡决定了网络吞吐量,一般服务器网口一般2,4等,选择网卡大概一致进行评比;

主板:

PCIE:

价格:

功耗:

8.2服务器厂商硬件对比

8.3服务器厂商测试数据对比

下面以没有安装JDFS的单台服务器,以安装了JDFS服务器为例,说明如何对服务器进行对比。如果没有特别指明是否安装了“JDFS”,默认为安装。不管1台服务器或者N台服务器,测试数据均以下面表格方式进行统计。

假设2台磁盘密度共为6T,网卡共为4口,交换机为1000MB的为例对比结果如下:

8.3.1两台服务器1000并发

1、大文件读

2、大文件写

3、小文件读

4、小文件写

5、大小文件混合读

6、大小文件混合写

2、一定数据量重建时间

3、稳定性测试

4、单级一定目录项

5、一定目录深度

8.4 计算规则

在厂商服务器分数计算上,遵循性能60%,功能30%,价格10%的权重规则,满份100分。

在N台服务器,一定存储密度,一定并发下,计算各个厂商的分数。

厂商分数=性能(60%)+功能(30%)+价格(10%);

性价比=价格/性能;

性能=大小文件读写(55%)+数据重建(10%)+稳定性(25%)+单级目录数目(5%)

+目录深度(5%);

注:数据重建,稳定性,单级目录数目,目录深度与并发数没有关系,与服务器台数有关系,为了体现性能参数的完整性,不管并发多少,我们均在性能计算内加入这几个参数。

数据重建:以最高的厂商为满分,其他厂商减去相应分数;

单级目录项数目:以最大目录项数目的厂商为满分,其他厂商减去相应分数;目录深度:以最大目录深度的厂商为满分,其他厂商减去相应分数

功能:因每个厂商提供服务器功能均差不多,且能支持分布式文件系统基本操作,所以这部分值均不变且为满分30分,如果的却不满足某些功能再减去相应分数;价格:暂定满分为10分,以价格最低的厂商为满分,其他厂商扣去相应分数。

8.5对比结果

厂商1 =性能(60%)+功能(30%)+价格(10%);

厂商2 =性能(60%)+功能(30%)+价格(10%);

如:2台服务器对比

9 参考文献

【1】Amazon云计算服务及EC2与S3的性能对比分析

【2】淘宝性能测试白皮书;

【3】服务器基准测试方法与误区;

淘宝测试架构白皮书

淘宝测试架构白皮书 2010 淘宝-技术研发部-市场产品技术-测试-系统测试-测试架构

目录 淘宝测试架构产生的原因 (3) 测试架构 (3) 测试架构流程综述 (5) 测试架构师工作职能 (6) 测试架构师的角色 (8) 测试架构师的招聘要求 (9) 编后注 (9) 感谢 (10) 作者 (10) 版本 (10)

淘宝测试架构产生的原因 在软件的生产环节中,会产生许多和测试相关的问题,相应的也会出现很多的解决方法,在一个肩负102 年使命的公司中做测试工作,在102 年宏大的软件生命周期中,测试问题解决方法也会以爆炸性的速度增加,结果会导致解决方法的数量是惊人的,方式却又是多样的,行为时分散的。一种声音会出现,停止解决不断出现的问题,我们需要一种系统的解决方案使测试更加专业,更加适应一个长期发展,不断创新的软件环境。这种系统的解决方案就是测试架构产生的雏形。 测试架构提供了在技术上结构化指导测试的方法,它的出现: ●为测试管理者和测试人员找到技术上的解决方案 ●优化测试流程 ●标准化测试工作,探索新的测试技术 ●团队中测试技术信息的对称 ●更好的保证各个测试团队的沟通工作 ●对测试技术及工具的开源提供框架和方法 ●找出有效,高效的测试方法 ●分析,指出并控制产品潜在风险 测试架构 在淘宝,测试架构被定义为工具箱:一个测试管理人员,PTM,测试工程师的工具箱。 它将为我们实现更为专业的测试提供技术意见。具体体现在以下几个方面 1. 测试策略 a) 前瞻性的提出未来测试的方向 b) 指导测试人员怎样测试 c) 建议测试管理者应该进行哪些方面的测试 d) 帮助分析测试范围 e) 针对每个不同的项目,在技术上分析测试进度并跟踪控制测试进度 2. 测试管理者的工具箱 a) 提供一切管理者所需要的: ●Test goal ●Test Scope ●Test Focus ●Risk ●Master test plan ●Planning guidelines ●Estimation guidelines ●Planning tools ●....... 3. 测试工程师的工具箱 a) 提供一切测试工程师所需要的: ●Test documentation ●Test tools and infrastructure ●Test design guidelines

产品白皮书

Ibot8.0产品白皮书 第 1 页共47 页

目录 1.前言 (6) 1.1.目的范围 (6) 1.2.产品定位 (6) 1.3.名词术语 (6) 2.公司简介 (8) 2.1.小I简介 (8) 2.2.小I发展历程 (8) 3.产品概述 (11) 3.1.智能机器人 (11) 3.2.产品架构 (11) 3.1.1.机器人前端平台 (12) 3.1.2.智能服务引擎平台 (12) 3.1.3.机器人统一管理平台 (14) 3.1.4.知识库组织说明 (14) 3.3.产品演进路径 (17) 3.4.技术特点 (17) 3.5.技术指标 (18) 3.6.扩展接口 (19) 3.7.优势特性 (19) 4.产品主要功能 (22) 4.1.基础智能问答 (22) 4.2.前端用户功能 (23) 4.2.1 Web机器人功能 (23) 4.2.2微信机器人功能 (28) 4.2.3IM机器人功能 (31) 4.2.4短信机器人功能 (33) 4.3.后台主要管理功能 (35) 4.3.1知识管理功能 (35) 4.3.2服务管理功能 (36) 4.3.3渠道管理功能 (36) 4.3.4素材管理功能 (37) 4.3.5语音管理功能 (38) 4.3.6运维管理功能 (38) 4.3.7系统管理功能 (39) 5产品实施 (39) 5.1.实施流程 (39)

5.2.知识建设 (39) 5.2.1 语言知识库构建 (40) 5.2.2 业务知识库构建 (41) 5.3.二次开发 (42) 5.4.系统部署 (44) 5.4.1 常规部署 (45) 5.4.2 扩展部署 (45) 5.4.3 集群部署 (47)

NovAtel 的 ARTK 性能对比测试白皮书

NovAtel的ARTK性能对比测试白皮书 介绍 GNSS定位技术正在被越来越多的测量用户所采用,而测量用户倾向于利用高精度的RTK定位功能使得生产效率最大化。测量用户使用RTK功能时关注以下三个方面性能: ?RTK解算精度‐‐可靠的厘米级精度对于测量领域来说是必要的 ?RTK解算可靠性‐‐对于测量领域工作RTK固定解是可靠的 ?RTK初始化时间‐‐更快进入RTK固定解可以节约测量人员的时间 本文介绍了在多种典型测量应用环境下,对多家GNSS厂商的接收机进行的一系列 GPS+GLONASS的性能测试。由于测量用户厘米级精度的要求,所以下面报告中仅展示了RTK固定解的解算结果。 测试配置和方法 我们对此RTK测试方法进行精心的设计,尽可能确保测试的公平性: ?所有的接收机接收同样的RTK差分数据 ?所有的接收机采用同一GNSS天线,并且多次测量过程中天线架设在相同位置 ?每台接收机的GNSS天线信号增益都经过校准 ?GNSS天线信号均在同一精确时刻连接或断开 RTK差分数据通过GPRS/NTRIP发送给移动站接收机,这种方式可进行长基线RTK测试。测试系统搭建如下图所示: 1 / 8

2 / 8 此RTK测试是模拟测量用户在野外作业环境的操作。由于测量用户在穿越桥梁、建筑物周围和其他遮挡物的时候经常会遇到GNSS信号丢失的情况。因此,在此RTK测试中设计了每隔一定时间强制GNSS信号丢失——90到695秒时间内保持GNSS信号连接和5到25秒GNSS天线断开。这样就使得每台接收机都能进入固定的RTK解算模式,并在限定的时间内采集数据,直到固定解丢失,这正是测量用户作业时的一种典型工况。 中等基线—开阔环境 我们选择了14KM基线作为中等基线测试。基准站和移动站接收机天线都架设在楼顶,多路径影响很小,是一个比较理想的测试环境。开阔环境下中等基线测试结果见下文。

精准测试白皮书v3.0-2019最新版

精准测试白皮书 V3.0 (2019版)

目录 第一章精准测试诞生的背景 (1) 第二章精准测试的定义 (4) 第三章精准测试的基础架构介绍 (5) 3.1 精准测试的技术架构 (5) 3.2 软件示波器 (7) 3.3精准测试的双向追溯 (10) 双向追溯技术正向追溯 (11) 双向追溯技术反向追溯 (12) 数据追溯技术-追溯测试用例的全景调用 (13) 数据追溯技术-针对多系统多模块(微服务)的追溯 (14) 3.4 分布式结构下的数据穿透 (14) 第四章精准测试的核心组件与功能 (16) 4.1 风险控制 (17) 4.1.1 七种测试覆盖率 (17) 4.1.2 新增代码覆盖率 (19) 4.1.3测试覆盖率范围筛选与再统计 (20) 4.2 工作协同 (21) 4.2.1 打通开发与测试的隔阂 (21) 4.2.2 源码动静态数据的统一 (22) 4.2.3 缺陷最后执行时序分析 (25)

4.2.4 智能缺陷定位 (26) 4.3 敏捷迭代 (29) 4.3.1 敏捷迭代下多版本白盒测试数据的聚合 (29) 4.3.2 聚类分析 (30) 4.3.3 漏洞检出 (32) 4.3.4 精准测试与自动化测试对接 (34) 4.3.5 最小测试用例集 (34) 4.4 团队管理 (35) 4.4.1 精准测试的企业私有云可信化报表 (35) 4.4.2 精准测试的企业私有云-测试效率的直观展示 (37) 4.4.3 精准测试的企业私有云-测试用例排行图 (39) 4.5 知识库累积 (41) 4.5.1 精准测试数据的价值 (41) 4.5.2 精准测试智能回归测试用例智能选取 (41) 4.5.3 精准测试在回归测试中的性能评估 (43) 第五章精准测试的管理报表分析 (43) 5.1 项目指标 (44) 5.1.1 程序代码信息汇总 (45) 5.1.2 程序覆盖率指标 (45) 5.2测试用例-按日趋势图 (47) 5.2.1测试用例汇总信息 (47)

产品方案技术白皮书模板

一、背景概述 (2) 1、研发背景 (2) 2、产品定位 (2) 二、产品方案功能介绍 (2) 1、设计理念 (2) 2、系统拓扑图 (2) 3、系统构架描述 (2) 4、系统功能介绍 (2) 5、产品方案规格 (2) 四、产品方案应用介绍 (3) 1、应用模式 (3) 2、应用流程 (3) 3、应用环境 (3) 五、产品方案特性介绍 (3) 1、技术特性 (3) 2、应用特性 (3) 3、系统特性 (3) 六、产品方案技术介绍 (3) 1、相关技术 (3) 2、技术指标 (4) 七、产品方案测评数据 (4) 八、实施运维方式说明 (4) 九、售后服务方式说明 (4)

一、背景概述 1、研发背景 介绍用户需求背景、该产品所在行业信息化建设背景、产品所涉及的相关政策简述等,以说明该产品的研发背景,以及满足的客户需求。 2、产品定位 为了满足客户以上需求,该产品具有什么功能,能够解决什么问题。 二、产品方案功能介绍 1、设计理念 该产品方案的设计思路。 2、系统拓扑图 使用统一的图标,制作系统拓扑图。 3、系统构架描述 按照系统的构成,分类对系统进行描述。 4、系统功能介绍 详细阐述系统的主要功能。 5、产品方案规格 产品方案不同的规格介绍,或者对产品方案技术规格的介绍。

四、产品方案应用介绍 1、应用模式 该产品方案包括的应用模式类型,或者针对不同类型客户的解决方案。 2、应用流程 该产品方案的应用流程。 3、应用环境 描述该产品所运行的应用环境。 五、产品方案特性介绍 1、技术特性 主要是性能先进性、功能齐全性、系统兼容性、技术稳定性等。 2、应用特性 主要是部署灵活性、可扩展性、管理方便性、易用性等。 3、系统特性 对系统的主要特性进行描述,根据产品不同和竞争优势的不同而不同。 六、产品方案技术介绍 1、相关技术 主要应用技术的介绍,以及该技术的优势。

eSight 产品技术白皮书

华为eSight 产品技术白皮书 文档版本 01 发布日期 2016-05-30 华为技术有限公司

版权所有? 华为技术有限公司2015。保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。 商标声明 和其他华为商标均为华为技术有限公司的商标。 本文档提及的其他所有商标或注册商标,由各自的所有人拥有。 注意 您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。 由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。 华为技术有限公司 地址:深圳市龙岗区坂田华为总部办公楼邮编:518129 网址:https://www.360docs.net/doc/db16961042.html,

目录 1 执行摘要 (4) 2 简介 (5) 3 解决方案 (7) 3.1 eSight系统介绍 (7) 3.1.1 关键技术特点 (7) 3.2 统一监控、诊断和恢复解决方案 (12) 3.2.1 性能采集和预测分析 (12) 3.2.1.1 整体方案介绍 (12) 3.2.1.2 关键技术点介绍 (13) 3.2.1.3 功能约束 (13) 3.2.1.4 典型场景应用 (14) 3.2.2 告警信息采集和通知 (14) 3.2.2.1 整体方案介绍 (14) 3.2.2.2 关键技术点介绍 (15) 3.2.2.3 功能约束 (16) 3.2.2.4 典型场景应用 (17) 3.2.3 网络故障诊断(智真会议) (17) 3.2.3.1 整体方案介绍 (17) 3.2.3.2 关键技术点介绍 (17) 3.2.3.3 功能约束 (18) 3.2.3.4 典型场景应用 (18) 3.2.4 通过设备配置备份数据快速修复故障 (20) 3.2.4.1 整体方案介绍 (20) 3.2.4.2 关键技术点介绍 (20) 3.2.4.3 功能约束 (21) 3.2.4.4 典型场景应用 (21) 3.3 安全管理解决方案介绍 (21) 4 结论 (22) A 缩略语 (23)

大数据支持京东破译“千人千面”

大数据支持京东:破译“千人千面” 用户画像背后需要有复杂的大数据模型的支撑。高水平的大数据平台,不仅仅在于数据量的积累,更重要的是背后的分析模型。 当京东的客服接线员刚刚拿起电话的时候,他就已经能够掌握到打进电话的用户的情绪状态,性格和心理,能够提前做好准备来应对,为用户更好地服务,这不是在假设,京东正在朝着这样的服务迈进,而帮助京东向此迈进的,是背后强大的大数据平台。 “千人千面”的背后是大数据的支持 “千人千面”是互联网时代到来以后,尤其是大数据催使商家提供个性化定制服务之后,各大电商都在追求的目标。过去的这几年,是3C产品(Computer,Communication, Consumer Electronics)的更新迭代是最频繁的几年,这为曾经专注于3C产品的京东赚足了眼球,也赢得了体量庞大的用户数量。 “基于大数据分析的‘用户画像’技术,一直以来都是京东大数据部门的重点研究方向。”京东大数据事业部总经理王晓介绍说。与其他的平台型电子商务平台区别的是,京东拥有电子商务全过程价值链的用户数据。“这样的全过程价值链数据质量是比较高的。”王晓介绍,所谓全过程价值链的用户数据,是指包括浏览、交易、客服、配送和物流等所有有关数据都可以引入用户画像的建模过程,这样一来可以精确描绘用户的全方位特征。“京东目前已经设立了300多个标签,用来定义用户的特征,覆盖用户基本属性、购买能力、行为特征、社交特征、心理特征、兴趣偏好等多个方面。”王晓说。“‘千人千面’在我的理解中就是在大数据的指导下,网站对用户提供个性化的精准营销的重要方法,京东历来都十分重视用户体验,其实这背后的重点还是用户画像技术。”针对为不同行为习惯和兴趣爱好,在标签定向中已经显示出有明确差异的用户,京东采用的是差异化的投放营销方式。王晓介绍,用户画像使得搜索、推荐、广告等营销系统能更加智能地服务用户,同一个搜索词在不同用户不同时刻搜索时,可能有完全不同的购物意图,针对用户的属性特征、性格特点或行为习惯,结合用户行为的上下文分析,陈列或推荐符合该用户偏好的商品,也能很大程度上提高用户购买转化率和重复购买率。 用户画像背后需要有复杂的大数据模型的支撑。高水平的大数据平台,不仅仅在于数据量的积累,更重要的是背后的分析模型。早在2013年下半年,京东的一位大数据研发高层在接受媒体访问时曾这样说:“符合以下两点要求的数据,才能被称之为大数据:第一就是体量要足够大,一般认为BI(Business Intelligence)无法处理的数据才能叫大数据;第二就是数据

信息安全等级保护检查工具箱技术白皮书

信息安全 等级保护检查工具箱系统 技术白皮书 国家信息技术安全研究中心

版权声明 本技术白皮书是国家信息技术安全研究中心研制的信息系统安全等级保护 检查工具箱产品的描述。与内容相关的权利归国家信息技术安全研究中心所有。白皮书中的任何内容未经本中心许可,不得转印、复制。 联系方式: 国家信息技术安全研究中心 地址:北京市海淀区农大南路1号硅谷亮城 2号楼C座4层 电话:0

简介 国家信息技术安全研究中心(以下简称,中心)是适应国家信息安全保障需要批准组建的国家级科研机构,是从事信息安全核心技术研究、为国家信息安全保障服务的事业单位。 中心成立于2005年,是国家有关部门明确的信息安全风险评估专控队伍、等级保护测评单位、国家网络与信息安全应急响应技术支撑团队和国家电子政务非保密项目信息安全专业测评机构。 中心通过系统安全性检测、产品安全性检测、信息安全技术支持、信息安全理论研究、远程监控服务等项目,为国家基础信息网络和重要信息系统及社会各界提供多种形式的信息安全技术服务。 为提高我国基础信息网络和重要信息系统的安全防护水平,中心自主研发了一系列安全防护和检测工具产品。主要有:恶意代码综合监控系统、信息系统等级保护检查/测评工具箱、安全内网管控系统、网上银行安全控件、系统安全检测工具集、网络数据流安全监测系统、商品密码安全性检测工具集、漏洞扫描评估系统等。 中心还积极承担国家“863”、国家发改委专项和密码发展基金等国家重点科研项目;积极承担国家下达的多项信息安全标准制定和研究任务;紧密跟踪国内外信息安全发展,采取多种形式为国家有关部门和行业提供信息安全咨询和培训服务。 经过多年的发展,中心服务的足迹遍及30余个省市自治区,为政府机关、电信、电力、金融、海关、铁路、广电、税务等行业部门的数百个单位、上千个重要信息系统提供了信息安全产品、咨询和测评服务。

LBPM产品介绍白皮书

白皮书

文档控制/Document Control 文档属性 模板修改记录 文档修改记录 审阅记录 分发

目录 第一章传统BPM面临的问题和挑战 (3) 1.1IT需要支撑业务在频繁的调整和优化 (3) 1.2传统BPM严重割裂业务 (3) 1.3对于复杂的中国特色企业管理的有效支撑 (3) 1.4高可扩展性和高性能的挑战 (4) 1.5移动端的挑战 (4) 第二章LBPM解决之道 (4) 2.1提出非常6+1接口规范来规约业务系统(去业务化解决方案) (4) 2.2不干预任何业务以避免割裂业务 (5) 2.3长期关注复杂的中国特色企业管理 (5) 2.4从底层架构就支持业务流程的高可扩展和高性能 (5) 2.5充分支持跨浏览器 (6) 第三章为何要使用LBPM? (6) 3.1快速应对市场和业务的频繁变化和调整 (6) 3.2业界性价比最高的BPM (7) 3.3多种手段提升业务系统与LBPM之间高效通讯 (7) 3.4完善的监控机制来保障快速跟踪和分析问题 (8) 第四章LBPM产品核心架构概述 (9) 4.1LBPM流程虚拟机 (10) 4.2LBPM流程引擎 (10) 4.3LBPM流程应用 (10) 4.4LBPM流程扩展服务 (10) 4.5LBPM集成引擎 (11) 第五章LBPM产品功能概述 (11) 5.1流程建模平台 (11) 5.1.1对接业务系统全局配置 (12) 5.1.2创建流程模板 (12) 5.1.3节点绑定业务表单 (13) 5.1.4业务字段映射配置 (13) 5.1.5节点的事件监听器配置业务逻辑 (14) 5.2流程运行平台 (15) 第六章LBPM流程分析平台 (16) 附录A 非常6+1参考 (17) 附录B BPM思想流派参考 (17)

御界高级威胁检测系统技术白皮书-腾讯企业安全

御界高级威胁检测系统 技术白皮书

目录 第一章系统简介 (4) 1.前言 (4) 2.核心能力 (4) 第二章系统架构 (5) 1.架构设计 (5) 2.产品部署模式 (6) 高扩展性 (6) 多模块自由组合 (6) 低成本 (6) 3.产品型号 (7) 第三章系统特点 (7) 1.攻击链条检出 (7) 2.发现APT (8) 3.异常流量感知 (8) 4.勒索病毒检测 (9) 5.威胁情报 (9) 6.漏洞攻击检测 (9) 第四章核心功能模块 (9) 1TFA检测引擎 (9) 入侵特征模型检测模块 (9) 异常流量模型检测模块 (9)

异常域名检测模块 (10) 网络攻击检测模块 (10) 2文件还原模块 (10) 3文件分析检测模块 (10) 哈勃动态行为沙箱 (11) TAV杀毒引擎 (11)

1.前言 随着移动设备的普及和云基础设施的建设,企事业单位积极拥抱数字化,加之万物互联IoT潮流的到来,网络安全在当前这个时间点需要重新定义。经典的攻击方式还未落幕,层出不穷的高级攻击方式已经上演,在安全形势不断恶化的今天,即使部署了各式样的安全产品,也无法做到预防所有的威胁。 在网络边界处阻止所有的威胁固然是我们最希望看到的情况,但是这种同步的拦截方式受限于较高的性能要求和较少的信息量,很难独立成为一个完整的企业安全解决方案。御界高级威胁检测系统(以下简称御界)在网络边界处采用镜像流量,旁路检测的方式,旨在发现企业受到的恶意攻击和潜在威胁。 2.核心能力 御界基于腾讯反病毒实验室的安全能力,依托腾讯在云和端的大数据,形成了强大且独特的威胁情报和恶意检测模型,凭借基于行为的防护和智能模型两大核心能力,高效检测未知威胁。也正因为丰富的数据和海量运算能力,在发现威胁之后的溯源上御界的数据平台也能提供一流的服务。 真正高质量的攻击,比如APT攻击,大多是以新面貌呈现,基于特征或者是黑样本库黑网址库的防御方式在对抗新的威胁之时远不如动态分析来的直接和有效。恶意代码层面可以通过变形和加密来做对抗,远控地址和远程IP也是全新的,攻击的入口也不尽相同,可以是邮件收发和消息处理等用户行为,也可以是通过系统或者软件漏洞进入,但是入侵,潜伏,远程连接,远程控制等过程从行为上看是有很大的相似和关联性的,基于行为的检测方案比基于特征的检测方案站在更高的维度上。智能模型也需要以行为传感器为基础,综合考量网络流量中的各种信息,协议,地址,端口,流量,连接频率等各种信息,来完成异常流量、异常行为的发现。

服务器产品技术白皮书-Loongson

深度操作系统 服务器产品技术白皮书 武汉深之度科技有限公司

目录 一、概述 (2) 二、深度操作系统服务器版 (3) 三、技术指标 (4) 四、应用需求 (6) 4.1 通用服务器应用 (6) 4.2 小型机替换 (6) 4.3 国产化应用 (7) 五、产品特点 (9) 六、技术特色 (10) 七、产品对比 (11) 八、应用场景 (13) 九、典型案例 (14) 9.1 国家工商总局法人库项目 (15) 9.2 国家工商总局商标局灾备项目 (16) 9.3国土资源部信访系统 (17) 9.4典型用户 (18) 十、产品资质 (19)

一、概述 深度操作系统将全球领先的技术和创新带入政府信息化建设和企业级信息技术基础架构,是当今国内增长最快的操作系统之一。许多政府和企业用户由于其易用性和可扩展性而选择深度操作系统,信息部门和运维部门则更重视深度操作系统提供给桌面终端的稳定性、安全性和灵活性。因为完全开放源代码和自下而上的自主研发,深度操作系统可以快速、轻松的增强和定制,而无需依赖国外厂家的产品维护周期。 深度操作系统服务器版提供对国产处理器与服务器的良好兼容,全面支持国产主流数据库、中间件和应用软件,并通过了工信部安全可靠软硬件测试认证,符合“自主可控”战略目标的要求,可以为国内电子政务、信息化管理等应用提供全国产一体化的架构平台。 深度操作系统服务器版通过对全生态环境的支撑,以及多应用场景解决方案的构建,能够满足企业级用户对服务器高稳定性、高可靠性、高可用性的要求。

二、深度操作系统服务器版 深度操作系统服务器版软件,是深度科技发布的符合POSIX系列标准和兼容LSB标准的服务器操作系统产品,广泛兼容各种数据库和应用中间件,支持企业级的应用软件和开发环境,并提供丰富高效的管理工具,体现了当今Linux服务器操作系统发展的最新水平。 深度操作系统服务器版软件,以安全可靠、高可用、高性能、易维护为核心关注点:基于稳定内核,对系统组件进行配置和优化,提升系统的稳定性和性能;在加密、认证、访问控制、内核参数等多方面进行增强,提高系统的整体安全性;提供稳定可靠的业务支撑,以及高效实用的运维管理,从容面对快速的业务增长和未来挑战。 产品分类产品名称 服务器操作系统产品深度操作系统服务器版软件(x86_64平台) 深度操作系统龙芯服务器版软件(龙芯平台,3B2000/3B3000等)深度操作系统申威服务器版软件(申威平台,1600/1610/1621等) 服务器应用软件产品 深度日志分析软件 深度高可用集群软件

APP网络性能测试白皮书

APP网络性能测试白皮书 资源类性能中,磁盘、内存、CPU是本地资源,但是除了这些之外,还有一个特别的存在——网络,之所以特别是因为它是外部资源。对于移动互联网来说,优化网络的性能非常重要。而我们优化网络性能无非看三个问题:业务成功率、业务网络时延、业务宽带成本。 基本概念 业务成功率 有两个真实的场景是用户可能遇到的:一个是点外卖时进了电梯,一个是听演唱会时上传照片。就大家的体验来说,这是最有可能发送失败的场景。刚好,这两个场景分别代表两种典型的网络差的场景,进电梯代表弱信号网络,而演唱会则代表拥塞网络,处理不当都会直接影响业务的成功率。 弱信号,可以简单看成当手机信号只有一两格的时候,这时不仅仅是信令(无线网络其实通信的都是一个个信令)发出去困难,而且还有可能导致不断切换网络、切换基站。App 能做的,就是在应用层做重试,因为很有可能这个弱信号是一时的。 另外一个是拥塞网络,简单地理解就是,堵车、排队,数据包排队,信令也在排队。这时App不断重试,只会使得拥塞更为严重。最多能做的就是让自己的非核心业务不要捣乱,不要也去排队,让核心业务的数据量更少,协议来回更少。 业务网络延时 比起成功率,网络延时虽然影响没这么直接,但是慢带来的不爽,也是会流失用户的。这个慢就必须从一个数据包的发送历程开始说起,如图所示。以下我们来对业务网络延时的原因作逐个分析。

DNS解析,简单来说就是域名换IP。这一步看似简单却是充满陷阱,10分钟的DNS Cache过期时间,200~2000ms不等的DNS解析耗时,就像猪一样的队友,坑了无数应用。解决无非有三个策略:IP直连、域名重用、HttpDNS(简单来说就是利用自定义的协议获取域名对应的IP地址,甚至是列表)。 建立连接,大多数应用都是基于TCP的,所以无非就是三次握手建立TCP连接。这一步的耗时,如果是长连接的话,就是一次消耗,短连接则是每次都会有这个消耗。要维护长连接就必须要心跳包,心跳包多,会耗电,特别是当心跳间隔等于移动网络状态机Active-Idle切换间隔时,简直就是悲剧,同时对于移动网络来说还会增加信令通道的负担;心跳包少了,会让连接在NAT中超时,导致长连接断开。在建立连接的过程中,TCP会进行一些商定,其中影响网络时延最明显的就是窗口。 接收窗口,用于拥塞控制。以发送图片为例,服务器的接收窗口就像你告诉客户端,我的池子有多大,你就放多少水给我,客户端放多少水涉及同一时间发送多少TCP数据包,当前的带宽有没有被充分利用,直接影响发送的速度。而让窗口太少的原因无非几个:①服务器的ReceiveBuffer太小;②因为慢启动,而包又太小,刚刚连接,慢启动会逐步放大窗口,没有等放大完,数据就发完了;③Window size scaling factor失效,这里最有可能的原因是网络代理,失效的结果就是窗口最大只有65536字节。 业务宽带成本 如果说一定要考虑流量的原因,除了流量大对业务成功率和网络时延的影响外,就应该是宽带成本了。对于视频、图片这些富媒体业务,每天在宽带成本上的投入,跟烧钱没什么区别。如何节省这些成本,同时也为用户带来好处呢?策略有压缩、增量、去重复三种。 先说压缩,图片用WebP压缩、PNG压缩,还可以用progressive jpeg的不同程度压缩来替代大中小图,视频用H264、H265压缩,文本用gzip压缩和其他ZIP压缩方案。

微波射频测试技术白皮书

微波射频测试技术白皮书 第一部分:微波技术发展的挑战 微波射频电路是整个电子系统的重要组成部分,主要完成发射和接收信号的功率控制和频率搬移,对整个电子系统灵敏度,动态范围等指标有决定性的影响。典型的微波射频电路包含天线,放大器,滤波器,频率合成器,传输线等有源和无源电路。随着系统功能和性能要求的提高,电子系统对这些电路的要求越来越高,而且很多性能指标的要求还是互相制约的,例如为提高系统的传输效率和抗干扰能力,无线通信采用了复杂调制技术,从MSK调频到PSK调相再到多载波的OFDM调制方式,这会造成信号的功率动态范围越来越大,对于放大器而言就要求尽量宽的线性范围,同时系统对放大器的效率有严格要求以保证功率利用率指标,这对于传统放大器技术来讲是很难满足的。这个技术挑战大大推动了功率放大器线性化技术的出现和发展。现在射频微波应用领域的发展动态有以下典型的几个特点: 特点1:新型的半导体材料的应用 无论在大功率器件还是降低器件噪声性能上,由于新半导体材料的使用让电路的性能得到提高,例如:GaN材料大大提高了功率管的输出功率, 而磷化铟材料大大降低了微波放大器的噪声系数。 图1:微波集成电路技术 特点2:频率资源的扩展 通过获得更宽的频率资源来获得系统性能的增益是很多电子系统采用的技术,例如LTE中的频率聚合技术,通过毫米波工作频段的使用来提高传输速率并降低干扰等。毫米波的应用从简单的汽车防撞雷达扩展到宽带通信等领域。无线通信的信号带宽从几百KHz扩展到了超过100MHz的带宽。 特点3:数字技术和射频技术的结合 数字预失真功率放大器是数字信号处理技术和射频微波技术结合最好的代表。通过数字技术来扩展单一功率放大器的线性范围,线性化技术也被认为是射频技术的核心内容。 特点4:多通道技术 无论是军用相控阵雷达还是无线通信中的智能天线都是通过采用多通道技术来实现空间波束的控制和合成,通道数量从几个通道到上万通道不等,这对于射频微波电路的研制开发来讲是机遇也是很大的技术挑战。

AS8000技术白皮书

AS8000技术白皮书 1. 产品简介 浪潮AS8000存储系统是浪潮云时代DaaS存储产品的先导者,它传承了浪潮活性存储的产品设计理念,增加了云存储的技术内容,根据客户不同数据保护需求推出的业界领先的数据保护应用平台。在统一的管理系统中为客户提供异构虚拟化整合、业务连续保护、自动精简、无中断异构平台数据迁移、数据自动分层、持续数据保护、本地/异地容灾等高级功能,最大限度的保障用户数据安全,为不同需求的用户提供了多种级别的解决方案。 2. 产品优势 2.1 先进的系统架构设计 AS8000采用了全冗余架构、全模块化设计,无单点故障,保障业务系统持续运行; 标配两个DSE(Data System Engine)(active-active)引擎,可扩展为群集体系架构,实现多路径故障无缝自动切换、路径IO负载均衡的组网模式,并且随着节点的增加,系统性能线性增加; 丰富的扩展接口能够满足不同业务需求,充分保证了硬件的灵活性、可靠性

和扩展性; 实时监控设备运行状态,全方位的故障诊断机制,一目了然的硬件报警措施,极大的降低管理难度; 支持系统掉电保护 2.2 自动精简配置 存储资源的分配不再受存储物理空间大小的限制,实现100% 的随需分配; 当物理存储资源不足时,可在线实时扩容;降低初期IT 投入成本的同时,大幅度提高了资源使用效率。 2.3 容灾镜像保护 支持基于IP、FC的同步异步数据镜像,在异构存储间建立起本地或远程的数据容灾功能,打造数据级跨应用级容灾方案,实现数据零丢失; 支持多站点间的数据同步异步传输,建立大规模的全局数据容灾系统。 2.4 灵活的快照策略保护 可以基于虚拟系统或主机触发快照生成,用于备份、测试、数据挖掘等应用;增量的快照相比传统快照,空间缩减80%以上,有效降低系统负载。 2.5 持续数据保护 提供持续数据保护,可以将生产数据恢复到保护周期内的任意时间点,完全解决了连续快照方式只有有限时间点的弊端,实现真正意义上的持续数据保护。 2.6 便捷的管理 集中管理平台,对异构厂商存储设备实现统一管理; 支持FC SAN、IP SAN、NAS不同存储架构不同协议接入; 实时监控设备运行状态,全方位的故障诊断机制,一目了然的硬件报警措施,

网络攻防实验平台白皮书

网络攻防实验平台技术白皮书

1.1攻防实验平台 1.1.1攻防实验平台功能 1.提供综合模式的安全攻防实验沙箱环境,模拟攻防环境包括攻击主机、目标 主机、操作系统、应用系统、漏洞等真实环境: 涵盖主流操作系统如windows2003、windows2008、linux等; 涵盖及主流web应用系统、数据库系统等; 涵盖主流漏洞如owasp top 10和各种常见系统或应用漏洞、后门; 涵盖主流防御技术如防火墙、IPS/IDS、WAF等。 2.全程自主操作的攻防演练,安全攻防实验沙箱反映真实的攻防场景,所有的 实验过程中,不设置既定输入和输出,实验环境的状态体现真实系统和应用按操作者(或攻击者)的操作所形成的效果,完全展现操作者(或攻击者)的思路和成效。 3.实验包封装,把一个攻防实验所需要的所有组件,包括运行环境、主服务程 序、标准化的攻击主机配置、技术帮助文档等封装成一个完整的实验包,可以方便地进行管理和加载。 4.可通过B/S架构的管理平台,管理和加载实验包,生成/恢复实验场景。 5.通过把试卷和实验包相结合,可以创建操作考试,对操作结果进行测试和评 分。 1.1.2攻防实验平台实验(考核)模块 1.1. 2.1主机安全实验模块 ●通过对操作系统、数据库、网络服务等安全的配置实验,提供对网络环 境中主流主机节点的实训安全实验。 ●覆盖主流操作系统(Windows 2003 Server、Linux)的安全配置合规性检 查分析和合规性加固配置操作实验。

●主流数据库(SQL Server、MySQL)的安全配置合规性检查分析和合规 性加固配置操作实验。 ●实现对不同操作系统平台下的主流网络服务如FTP、WEB、Email、DNS、 DHCP、AAA等的安全配置合规性检查分析和合规性加固配置操作实 验。。 1.1. 2.2网络防御技术实验模块 ●实现网络设备如路由器、交换机的安全基线; ●实现二、三层威胁防御,包含MAC泛洪、ARP欺骗、IP欺骗、STP DOS 攻击、DHCP饥饿攻击、非授权DHCP干扰、冗余网关攻击等; ●实现接入安全,如802.1x、NAC等; ●通过实际操作与配置,掌握防火墙、IPS、WAF等常用防御产品功能与 应用; ●理解典型网络安全架构部署,根据实际需求选择相应产品构建基本防御 体系。 1.1. 2.3通信加密实验模块 ●部署CA体系及信任架构 ●操作证书申请、管理及应用的PKI技术应用的全过程 ●实现PKI体系证书在Word、email、web等应用程序中的具体应用 ●在主流操作系统、主流网络设备、安全设备之间实现IPsec ●配置实现PPTP VPN ●配置实现L2TP over Ipsec VPN ●配置实现GRE over Ipsec VPN ●配置实现SSL VPN,利用SSL VPN实现单点登录 1.1. 2.4网络攻防实验模块 ●覆盖主流主机、操作系统、应用系统、漏洞的最新网络攻防技术实验,

AS3000技术白皮书

AS3000技术白皮书 1. 产品简介 AS3000是浪潮面向金融电信、勘探勘测、空天信息、生物工程、气象、能源等海量数据业务的广大客户,自主研发的拥有完全自主知识产权的海量存储系统平台。AS3000同时支持NAS、IPSAN、FCSAN功能,融合iSCSI、FC、Infiniband 及10Gb万兆主机接口,囊括了目前主流的存储网络架构及主机连接方式。AS3000海量存储系统平台能高效、合理整合用户目前的存储网络架构,统一部署和集中管理,降低能耗,降低整体拥有成本(TCO)。在提供网络存储系统各项功能的基础上,融合数据保护,是高可靠、高性能、智能化兼具的新一代存储系统平台。 2. 产品优势 海量存储,融合创新 ◆多控制器体系架构,各控制器间可实现负载均衡,避免单控制器故障带来的 风险和性能的瓶颈 ◆支持NFS/CIFS等多种文件共享协议,可安装部署于Windows、Linux、Unix 等多种操作系统并存的复杂网络环境中,无需为各种文件协议单独设置存储,可轻松实现跨操作系统的数据存储与共享 ◆支持NAS/IPSAN/FCSAN,支持IP/FC-SAN和NAS同时运行,满足客户在 不同时间、不同地点、不同业务对存储的不同需求 ◆支持丰富的主机连接接口,支持iSCSI、FC、InfiniBand及万兆主机连接, 无缝接入用户现有环境,同时可以为用户提供高带宽的IB及万兆网络连接,满足客户对高带宽及高性能的差异化需求

◆全面支持SSD/FC/SAS/SATA磁盘,模块化的容量扩展模式 数据持续保护,业务运行无忧 ◆支持数据卷隔离映射功能、数据快照功能、快照回滚、远程卷复制(同步/ 异步)、远程数据复制及恢复、逻辑分区动态扩容 ◆支持Active-Active、Active-Standby等控制器工作模式,保障整体系统的高 可用,确保数据存取及业务运行万无一失 ◆系统可用性达到99.999% 模块化设计,人性化管理 ◆AS3000各主要部件均采用模块设计,客户按需选择,维护、升级、管理简 单方便 ◆支持自动构建RAID、各RAID级别间可在线迁移不影响正常数据应用 ◆完备监控管理方式,当系统出现异常时,除了通过机器指示灯报警外,可通 过邮件方式将异常状况及时通知管理员 ◆集中部署,统一管理 绿色节能 ◆全系统选取节能降耗的处理器、芯片组、风扇和散热片等部件,提高系统的 能效利用率 ◆采用独特的机箱结构设计,优化散热,降低能耗 ◆支持Maid磁盘节能技术,降低磁盘能耗,节约开支 ◆支持自动精简技术,大大提高存储资源利用率 3. 产品技术规格

京东大数据的思考和探索

龙源期刊网 https://www.360docs.net/doc/db16961042.html, 京东大数据的思考和探索 作者:刘彦伟 来源:《软件和集成电路》2018年第08期 京东大数据平台是京东大数据业务的基础服务平台,为京东大数据业务的实现提供一站式、自助式的大数据处理全流程解决方案。涵盖数据接入、存储、处理、分析、挖掘、可视化、机器学习等产品和服务,致力于大幅降低大数据消费门槛,帮助京东大数据业务快速落地,助力京东实践以数据为驱动的业务变革与发展。京东在大数据方向上的思考和探索非常多,今天主要和大家分享实时数仓、存储计算分离与容器化。 我针对京东大数据的业务场景和特点,对实时数仓这个领域大概做了三个分类,即实时应用、实时分析、实时数仓。关于实时应用,比如,实时大屏、京东聊吧等,京东内部用的实时报表,为京东的高层或京东业务人员提供决策支持类系统,就是非常典型的实时应用。这些实时应用类业务的技术,在业内发展得比较成熟,比如Storm、Flink、SparkStreaming等的技术框架已经非常成熟,京东基于技术框架再去落地这些应用。这些应用的特点是:门槛高。正因为用了这些比较流行的实时计算框架,京东在数据时效性上可以达到秒级的延迟。 关于实时分析,实时分析是实时应用里一个非常典型的产品。大家在访问京东App、京东网站时,当你浏览一些商品之后,京东能够根据你的实时浏览行为,为你推荐需要的产品,因为每个人在京东看到的商品或广告不一样。实时主要是体现在数据时效性上,通过实时OLAP 分析平台,可以让我们的业务人员或分析师看到分钟级或秒级延迟数据。通过技术手段提升OLAP引擎的数据时效性,从而解决实时分析对数据分析场景的支持。实时分析的场景具有不确定性,分析人员需要获取什么样的数据相对不确定。分析人员需要的订单类型数据可能基于地域分析,也可能基于渠道分析,也可能基于不同时间窗口分析。总之,需求相对不确定。数据相对确定,要么基于订单数据分析,要么基于流量数据分析。实时分析需要研发人员和研发资源的参与,研发人员需要构建OLAP产品底层的模型,研发资源的投入永远不够。京东的业务非常广泛,除了物流、配送、供应链等核心业务之外,还有大量长尾需求。对于长尾需求在实时性上的需求没办法满足,因为没有这么多研发资源投入进来去帮他们构建实时应用或实时OLAP的基础产品。随着实时分析的广泛应用,各个部门对实时计算的需求非常迫切,为了更好地满足客户的需求,我们提出了实时数仓概念。 实时数仓概念是相对于传统数据仓库而言,通过技术手段把传统数据仓库升级为实时数仓,可以达到分钟级时延,实时数仓可以满足有长尾需求的所有用户。实时数仓平台是通用型解决方案,京东的任意一个业务部门可以基于体系内的引擎,通过流式计算引擎的方式,实时写入实时数仓平台中。通过实时数仓的构建,京东所有业务人员的采销、运营都具备了获取实时数据的能力,有了实时数仓的体系之后,业务人员上线业务的第一天,就能看到他实时的数据。所以,我们认为,实时数仓可以改变整个大数据体系的未来。实时数仓通过实时数据总线,将存在数据库里的数据、放在服务器上的日志型数据、结构化数据、非结构化数据等,全部接入流式计算引擎中,流式计算引擎将数据分发到不同存储中。第一类是在线存储,第二类

浪潮InCloud Rail1000超融合一体机白皮书

【浪潮超融合架构一体机】 浪潮超融合架构一体机 InCloud Rail1000——将计算、网络连接和存储资源组合到一个一体化设备中, 从而创建一个由浪潮提供的简单、易于部署的一体化解决方案。 要点 ●基于浪潮InCloud Sphere服务器虚拟化 及InCloud Storage 存储虚拟化可快速实 现IT计算、存储和网 络资源池化 ●通过自动化部署引擎 实现系统的自动化安 装和部署,实现基于策 略和模板的自动化管 理 ●实现千兆和万兆网络 的灵活切换,实现高速 网络互连 ●可实现系统内的快速 扩容,支持多个 InCloud Rail的自动 化堆叠

【浪潮超融合架构一体机】 产品特点 自动化 INCLOUD RAIL 依托InCloud Manager 强大的管理运维功能,可以很方便的实现向导式自动化部署以及维护和管理,20分钟完成系架构统部署。 强管理 INCLOUD RAIL 融合InCloud Manager,突破传统系统架构,可提供功能强大、经生产验证的高性能虚拟化层。它支持多个虚拟机共享硬件资源,并灵活的调度各个虚拟机资源,解除了传统架构下的应用和硬件紧耦合的状态。 高性能 INCLOUD RAIL 融合浪潮分布式存储系统,单节点存储IOPS 达到20000+。 可重构 INCLOUD RAIL 采用浪潮新一代硬件重构和软件定义理念和设计,通过计算虚拟化和分布式存储技术实现计算和存储的融合,打破了传统架构服务器和存储的传统架构设计。 整体性 INCLOUD RAIL 是超融合的一体化架构产品,融合浪潮软件定义计算软件、软件定义存储软件和浪潮重构硬件,构建云数据中心的一体化交付解决方案。 弹性化 通过增加INCLOUD RAIL 设备实现计算、存储、网络的线性扩展,并且可以快速融入到现有环境中。 规格配置 类型 2U4N 融合架构系统 处理器 每节点支持2个英特尔? 至强? 处理器E5-2650 v3CPU 高速缓存 15MB QPI 总线速率 7.2GT/s 内存 每节点16个内存插槽,128G-192G 内存, 支持高级内存纠错,内存镜像,内存热备等高级功能 磁盘 每节点标配4块1.2TB 7200转SAS 硬盘,64G SATADOM 卡,VMware 产品配置1块SSD;浪潮虚拟化产品配置两块SSD,去除300G 系统盘 网络控制器 每节点配置1个高性能千兆以太网控制器(双口)和1个万兆以太网控制器(双口),支持虚拟化加速,网络加速,负载均衡,冗余等高级功能 电源 标配大功率高效白金级电源,1+1冗余,支持PMbus,睿能SmartPower 功耗管理技术 软件定义计算 支持浪潮服务器虚拟化InCloud Sphere 和VMware vSphere 软件定义存储 基于X86架构的浪潮自研分布式存储软件InCloud Storage,极大提高存储读写IOPS;支持VMwareVSAN 云管理平台 选择配置浪潮云管理平台InCloud Manager,实现业务的自动感知,资源的智能 管理和服务的自动化交付 用户收益 ● 降低复杂性:出厂预 装,自动化部署,实现 服务的灵活交付。 ● 降低TCO:2U4N 标 准节点降低空间和能 耗,软件定义的存储减 少存储设备的投入和 维护。 ● 可靠性:强大的容错机 制和企业级高可用性 保证系统的不间断进 化。 ● 线性扩展:利用软件定 义的计算和存储可以 轻松实现系统随不断 增长的业务需要弹性 扩充。 关键技术 ● 集成InCloud Manager 的全局管 理、智能交付、业务审 批等云管理功能。 ● IT 资源虚拟化:基于 服务器虚拟化的 INCLOUD RAIL 可快 速实现IT 资源虚拟 化。 ● 高速网络互连: INCLOUD RAIL 可实 现千兆和万兆网络的 灵活切换,实现高速的 网络互连。 ● 弹性的基础架构: INCLOUD RAIL 可 实现系统内的快速 扩容,可横向扩展至 64个物理节点

相关文档
最新文档