数据处理习题 doc
数据处理习题
1. 用碘量法测定铜合金中铜,7次测定结果为60.52,60.61,60.50,60.58,60.35,60.64,60.53(%)。分别用3S法、Grubbs法和Dixon法检验该测定结果中有无应舍弃的离群值?
2. 测得巨峰葡萄可溶性固形物含量为(%):23、18、21、18、25、20、22、24、19、22,求其平均数、极差、标准差、方差、变异系数。
3. 对鲜枣果实Vc含量测定10次,得结果为(mg/100g):450、495、410、440、485、420、495、435、455、475,试检验H0:=456,并估计平均数的95%的置信区间。
4. 在生产正常时,某钢铁厂的钢水平均含碳量为4.55%,某一工作日抽查了5炉钢水,测定含碳量分别为4.28%,4.40%,4.42%,4.35%,4.37%。试问这个工作日生产的钢水质量是否正常? (单样本t检验)
5.某厂生产一种铍青铜,铍的标准含量为2.oo%,工厂实验室对一批产品进行抽样检验,得到铍含量的分析结果为1.96%,2.20%,2.04%,2.15%,2.12%。试问这批产品的铍含量是否合格? (单样本t检验)
6. 工厂实验室对电镀车间的镀镍电解液进行常年分析,发现如果其他成分符合要求,那么在生产正常的情况下,电解液内硫酸镍的含量(g/L)符合正态分布N(220,112)。已知某周的分析结果为240,232,244,204,226,210。试问这一周内电解液中的硫酸镍含量是否正常? (单样本t检验)
7. 两个实验室用同种方法分析一种黄铜合金(H90)中的铜含量(%)所得结果为(两样本t检验)
A:91.08,89.36,89.60,89.91,90.79,90.80,89.03。
B:91.95,91.42,90.20,90.46,90.73,92.31,90.94。
试问A、B两个实验室的分析结果有无显著性差异?
8.4位分析者用同一种方法测定某种试样中的铬含量(%),得到表1所示数据。试分析4位分析者的测定结果之间是否存在显著性差异?
(单因素4水平5重复)
9.灯泡厂用4种不同成分的灯丝制成4批灯泡,每批灯泡随机抽取5只进行寿命试验,试验结果见表2。试问灯泡寿命是否随灯丝不同而有显著性差异?
10.为研究催化剂对化学反应的影响,用4种不同的催化剂分别进行实验,每种催化剂试验4次,得到结果见表3所示。试分析4种催化剂对合成反应产率的影响是否存在显著性差异。(单因素4水平4重复)
11.为了比较不同品种与不同肥料对作物产量的影响,选用4种品质和4种肥料进行无重复两因素交叉分组试验,所得作物产量的试验结果见表4。试问品种因素和肥料因素对作物产量是否有影响? (二因素无重复)
12.为研究反应物浓度和反应温度对某一化工过程产率的影响,选取3种浓度和4个不同温度进行有重复两因素交叉分组试验,每种情况试验两次,结果见表5。(二因素3重复)
13.用火焰原子吸收分光光度法测定镍电解液中的微量杂质铜时,为考察乙炔流量和空气流量对铜(324.7nm)吸光度的影响,乙炔流量取4个水平,空气流量取5个水平。交叉分组后,每个组合做两次试验,得吸光度见表6。试问乙炔流量、空气流量以及它们的交互作用对铜的吸光度有无显著影响?
14.改革“潘生丁”环合反应新工艺,其主要目的是利用尿素与双乙烯酮来代替旧工艺中的硫脲及乙酰乙酸乙酯,其指标是6—甲基脲嘧啶的收率。根据经验确定因素及水平如下。
A反应温度:A1 l00℃,A2 110℃,A3 120℃。
B反应时间:B1 6h,B2 8h,B3 10h。
C摩尔数比:C1 1:1.2,C2 1:1.6,C3 1:2.0。
选用L9(34)正交表(见表7),9次试验的收率分别为40.9%,58.2%,71.6%,40.0%,73.7%,39.0%,62.1%,43.2%和57.0%。试用直观分析法和方差分析法确定因素的主次,并求出因素水平的较好组合。
4
15. 选取影响果冻品质的四个主要因素:果汁添加量、复配胶添加量、白砂糖添加量和柠檬酸添加量,利用L9(34)正交试验确定果冻最佳配方,试进行统计分析,确定各因素对果冻感官质量影响的大小顺序,显著性,各因素的最优水平及最优水平组合。
16. 研究一种果酱,采用加糖量、柠檬酸加入量、香精加入量三因素三水平正交试验,L9(34)正交试验,产品重复3次,各次评分,试作方差分析。
17.为了改进长效磺胺精制成品的质量,对以下条件进行试验。
溶媒A:①自来水;②洗炭水。
加保险粉方法B:①滤前加;②滤后加。
中和速度C:①快;②慢。
脱色前处理D:①过滤;②不过滤。
滤液升温处理E:①加沸30min;②不加沸。
脱色pH F:①不调;②调pH 9.3。
加炭温度G:①40℃;②80℃。
指标:质量外观分为5级,最好为5,最差为1。
溶液色:测定值低为好。
用L8(27)安排试验,试验方案和结果如表8所示。试用综合评分法和综合平衡法求各因素的最优水平组合。设溶液色和外观的权分别为1和2。
18.为了改进阿糖胞苷合成工艺,研究人员选取如下因素和水平进行试验。
催化剂用量A(m0l):①0.134;②0.077。
氧化剂用量B(m0l):①4.47;②3.56。
加氧化剂方式C:①35~40℃分两次加;②60℃滴加。
杂质去除方法D:①离子交换树脂法;②草酸沉淀法。
除考查4个因素外,还考查交互作用A×B、A×C、B×C、A×D、B×D 和C×D,选用正交表L16(215),表头设计见表9。
15
41.2,17.3,40.0,27.5,44.5,31.6,44.2,17.2,35.8,26.5。试找出因素(包括交互作用)的主次,并求各因素的最优水平组合。
19.杏仁蛋白的最佳碱溶酸沉法提取工艺的确定。
为了对碱溶提取工艺进行深入研究,结合单因素试验,选择pH、料液比、提取温度3因素进行二次回归正交旋转组合设计。
试验因素取值范围:
pH:7.3~10.7,料液比:1:8.6 ~1:15.4,提取温度:24.2 ℃~56.8℃指标:蛋白提取率。
试验测定结果如下:
89.2 82.61 70.19 60.61 63.48 51.56 65.5 44.86 57.93 74.48 66.89
64.29 67.5 83.83 71.64 74.9 72 69.78 64.98 78.31 70.07 76.29
75.59
要求:1.计算零水平、变化区间;2.列出因素水平表;3.用DPS完成统计分析。
20.某试验选用烘烤时间、烘烤温度、喷射距离为试验因素,以比容、弹性为试验指标, 研究各因素对指标的影响。
各试验因素取值范围如下:
烘烤时间(min): 5.3 ~8.7 烘烤温度(℃): 153 ~187
喷射距离(mm): 38 ~55 指标:比容(ml/g),弹性。
请利用DPS系统完成:
(1)用二次通用旋转法设计实验(列出编码计算过程和因素水平编码表);(2)列出实验方案及结果表;(3)画出要定义的数据块;(4)写出DPS操作步骤命令。(5)对实验结果进行统计分析,并报告分析结果。
试验结果
21. 用文冠果籽为原料, 通过二次正交旋转试验研究利用超声波辅助提取文冠果籽油。
选用料液比、提取温度、提取时间、超声波频率为试验因素以出油率为试验指标, 研究各因素对出油率的影响。
各试验因素取值范围如下:
料液比/g·mL-1 1:7 ~1:11
提取温度/℃55 ~75
提取时间/min 20 ~40
超声波频率/kHz 20 ~100
出油率测定数据如下:
48.41,50.84,46.67,49.37,51.78,53.10,49.81,47.89,46.15,50.06,44.01,48.65,49.10,50.23,46.54,48.76,45.12,48.95,50.59,46.55,45.36,51.56,48.15,48.05,49.33,50.95,49.41,51.61,52.74,53.78,51.76,52.68,50.74,48.19,51.03,51.28
请利用DPS系统完成:
(1)用二次正交旋转法设计实验(列出编码计算过程和因素水平编码表);
(2)列出实验方案及结果表;
(3)用笔画出要定义的数据块;
(4)写出DPS操作步骤命令。
(5)对实验结果进行统计分析,并报告分析结果。
22.试验测得不同温度下氟化镁的热容量(C)如表10所示。
行检验。
23.试验测得硝酸钾在不同温度下的溶解度S(在100g水中达到饱和状态时所溶解的克数)如表11所示。试求出硝酸钾溶解度S随温度变化的关系式并进行检验(α=0.01)。(一元线性回归)
24.在某化学反应体系中,反应时间t与反应物A的浓度[A]有密切关系,试
验得到数据见表12。求出[A]与t的关系。(提示:[A]=a e bt )
25.为研究籼稻产量y(斤/亩)与每亩穗数x1(万)和每穗实粒数x2之间的关系,在7块籼稻田测得数据见表13。
①建立变量y关于变量x1和x2的线性回归方程;
②在x1=32,x2=66时,预测产量y;
③比较x1和x2的标准相关系数。
26.根据表14所示几组数据,利用主成分方法建立y与x l、x2、x3的回归方程(取两个主成分)。(多元分析→有偏回归分析→主成分回归)
27.对两种月饼样品的感官质量进行模糊评定。
设月饼的感官质量评定的指标域为:U={色泽u
1,形态u
2
,滋味u
3
}
评语域为:V={优V
1,中V
2
, 差V
3
}
权重集合为A={a1,a2,a3}={0.30,0.25,0.45}
聘用10名品评员的评定结果统计表如下,请对两种月饼样品的感官质量进行综合评定,判断二者感官质量的优劣。
完成以下内容:
1)构造样品1、样品2的模糊评判矩阵R ,并写出样品1、样品2的综合评判模型矩阵合成运算表达式
2) 写出样品1、样品2的模糊评判数据编辑格式
3)在DPS系统中按模糊评判数据编辑格式,对两种样品的感官质量进行综合评定,分析判断二者感官质量的优劣,并报告评判结果。
28.设花茶的感官质量评定的指标集为:
U={外形u1,香气与滋味u2,水色u3,叶底u4}评语集为:V={1级V1,2级V2, 3级V3,4级V4}
权重集合为A={a1,a2,a3}={0.2,0.6,0.1,0.1}
聘用10名品评员对花茶的评定结果统计表如下,请问花茶为几级茶?
EXCEL数据处理题库题目
E X C E L数据处理题库题 目 The pony was revised in January 2021
Excel数据处理 ==================================================题号:15053 注意:下面出现的所有文件都必须保存在考生文件夹下。 提示:[答题]按钮只会自动打开题中任意一个文件。 在[D:\exam\考生文件夹\Excel数据处理\1]下, 找到文件或文件: 1. 在考生文件夹下打开文件, (1)将Sheet1工作表的A1:E1单元格合并为一个单元格,内容水平居中; (2)在E4单元格内计算所有考生的平均分数 (利用AVERAGE函数,数值型,保留小数点后1位), 在E5和E6单元格内计算笔试人数和上机人数(利用COUNTIF函数), 在E7和E8单元格内计算笔试的平均分数和上机的平均分数 (先利用SUMIF函数分别求总分数,数值型,保留小数点后1位); (3)将工作表命名为:分数统计表
(4)选取"准考证号"和"分数"两列单元格区域的内容建立 "带数据标记的折线图",数据系列产生在"列", 在图表上方插入图表标题为"分数统计图",图例位置靠左, 为X坐标轴和Y坐标轴添加次要网格线, 将图表插入到当前工作表(分数统计表)内。 (5)保存工作簿文件。 2. 打开工作簿文件, 对工作表"图书销售情况表"内数据清单的内容按主要关键字 "图书名称"的升序次序和次要关键字"单价"的降序次序进行排序,对排序后的数据进行分类汇总,汇总结果显示在数据下方, 计算各类图书的平均单价,保存文件。 题号:15059 注意:下面出现的所有文件都必须保存在考生文件夹下。 提示:[答题]按钮只会自动打开题中任意一个文件。 在[.\考生文件夹\Excel数据处理\1]下,找到文件或exc文件:
数据分析期末试题及答案
数据分析期末试题及答案 一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解: 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系 上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出 表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系
上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。 上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系 。 x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次方(3 3 由图可知,他们之间呈正线性关系 所以可以采用如下的线性回归方法分析。
2.线性回归 先用强行进入的方式建立如下线性方程 设Y=β0+β1*(Xi1)+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差 R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。 建立总体性的假设检验 提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。
数据分析基础测试题含答案
数据分析基础测试题含答案 一、选择题 1.已知一组数据a,b,c的平均数为5,方差为4,那么数据a﹣2,b﹣2,c﹣2的平均数和方差分别是.() A.3,2 B.3,4 C.5,2 D.5,4 【答案】B 【解析】 试题分析:平均数为(a?2 + b?2 + c?2 )=(3×5-6)=3;原来的方差: ;新的方差: ,故选 B. 考点:平均数;方差. 2.甲、乙、丙三个不同品种的苹果树在同一地区进行对比试验,从每个品种的苹果树中随机各抽取10棵,对它们的产量进行统计,绘制统计表如下: 品种甲乙丙 平均产量/(千克/棵)9090 方差10.224.88.5 若从这三个品种中选择一个在该地区推广,则应选择的品种是() A.甲B.乙C.丙D.甲、乙中任选一个【答案】A 【解析】 【分析】 根据平均数、方差等数据的进行判断即可. 【详解】 根据平均数、方差等数据的比较可以得出甲品种更适在该地区推广. 故选:A 【点睛】 本题考查了平均数、方差,掌握平均数、方差的定义是解题的关键. 3.某射击俱乐部将11名成员在某次射击训练中取得的成绩制成如图所示的条形统计图,由图可知,11名成员射击成绩的众数和中位数分别是()
A.8,9 B.8,8 C.8,10 D.9,8 【答案】B 【解析】 分析:中位数,因图中是按从小到大的顺序排列的,所以只要找出最中间的一个数(或最中间的两个数)即可,本题是最中间的那个数;对于众数可由条形统计图中出现频数最大或条形最高的数据写出. 详解:由条形统计图知8环的人数最多, 所以众数为8环, 由于共有11个数据, 所以中位数为第6个数据,即中位数为8环, 故选B. 点睛:本题主要考查了确定一组数据的中位数和众数的能力.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求.如果是偶数个,则找中间两个数的平均数. 4.已知一组数据a、b、c的平均数为5,方差为4,那么数据a+2、b+2、c+2的平均数和方差分别为() A.7,6 B.7,4 C.5,4 D.以上都不对 【答案】B 【解析】 【分析】 根据数据a,b,c的平均数为5可知a+b+c=5×3,据此可得出1 3 (-2+b-2+c-2)的值;再由 方差为4可得出数据a-2,b-2,c-2的方差. 【详解】 解:∵数据a,b,c的平均数为5,∴a+b+c=5×3=15, ∴1 3 (a-2+b-2+c-2)=3, ∴数据a-2,b-2,c-2的平均数是3;∵数据a,b,c的方差为4, ∴1 3 [(a-5)2+(b-5)2+(c-5)2]=4,
点云数据处理
c++对txt文件的读取与写入/* 这是自己写程序时突然用到这方面的技术,在网上搜了一下,特存此以备后用~ */ #include
数据挖掘考试题库【最新】
一、填空题 1.Web挖掘可分为、和3大类。 2.数据仓库需要统一数据源,包括统一、统一、统一和统一数据特征 4个方面。 3.数据分割通常按时间、、、以及组合方法进行。 4.噪声数据处理的方法主要有、和。 5.数值归约的常用方法有、、、和对数模型等。 6.评价关联规则的2个主要指标是和。 7.多维数据集通常采用或雪花型架构,以表为中心,连接多个表。 8.决策树是用作为结点,用作为分支的树结构。 9.关联可分为简单关联、和。 10.B P神经网络的作用函数通常为区间的。 11.数据挖掘的过程主要包括确定业务对象、、、及知识同化等几个步 骤。 12.数据挖掘技术主要涉及、和3个技术领域。 13.数据挖掘的主要功能包括、、、、趋势分析、孤立点分析和偏 差分析7个方面。 14.人工神经网络具有和等特点,其结构模型包括、和自组织网络 3种。 15.数据仓库数据的4个基本特征是、、非易失、随时间变化。 16.数据仓库的数据通常划分为、、和等几个级别。 17.数据预处理的主要内容(方法)包括、、和数据归约等。 18.平滑分箱数据的方法主要有、和。 19.数据挖掘发现知识的类型主要有广义知识、、、和偏差型知识五种。 20.O LAP的数据组织方式主要有和两种。 21.常见的OLAP多维数据分析包括、、和旋转等操作。 22.传统的决策支持系统是以和驱动,而新决策支持系统则是以、建 立在和技术之上。 23.O LAP的数据组织方式主要有和2种。 24.S QL Server2000的OLAP组件叫,OLAP操作窗口叫。 25.B P神经网络由、以及一或多个结点组成。 26.遗传算法包括、、3个基本算子。 27.聚类分析的数据通常可分为区间标度变量、、、、序数型以及混合 类型等。 28.聚类分析中最常用的距离计算公式有、、等。 29.基于划分的聚类算法有和。