简明统计分析软件主要可以帮助用户计算各种数据的的变化,产生的影响、未来的发展变化,例如研究某药物对血红蛋白含量是否有影响,研究经济市场数据对未来的影响,研究数学变化的数据、函数变化、商业数据等,涵盖的行业非常广泛;在分析行业中,常见资料的一般性统计分析都可以通过简单的数据以及计算工具得出结果,但是高深的、复杂的统计分析就需要使用专业的统计分析工具才能得到合理的结果,这款简明统计分析软件适用范围广、计算结果准确可靠,是计算专业领域数据的必备工具。
软件功能
随机变量的模拟
目的是帮助使用者理解变异的客观性和抽样误差的不可避免性。通过比较抽样结果与理论结果,使用者可以发现尽管存在变异和抽样误差,但随机变量的分布是可知的;通过大量反复模拟,可帮助使用者理解常见分布类型的特点和规律。
正态分布
设置总体均数和标准差以后,模拟从该无限总体中随机抽样。统计抽样所得的变量值(X)的均数、标准差、中位数、最小值、最大值、四分位数间距等指标;编制频数表、绘制直方图;统计抽样所得的变量值小于等于任意界值的频率并计算理论概率。
偏态分布
设置总体中位数和总体四分位数间距及偏度系数(-1,1)以后,模拟从该无限总体中随机抽样。统计抽样所得的变量值(X)的均数、标准差、中位数、最小值、最大值、四分位数间距等指标;编制频数表、绘制直方图;统计抽样所得的变量值小于等于任意界值的频率。
t分布
设置自由度以后,模拟从该无限总体中随机抽样。统计抽样所得的t值的均数、标准差、中位数、最小值、最大值、四分位数间距等指标;编制频数表、绘制直方图;统计抽样所得的变量值小于等于任意界值的频率并计算理论概率。
卡方分布
设置自由度以后,模拟从该无限总体中随机抽样。统计抽样所得的卡方值的均数、标准差、中位数、最小值、最大值、四分位数间距等指标;编制频数表、绘制直方图;统计抽样所得的变量值小于等于任意界值的频率并计算理论概率。
F分布
设置分子和分母的自由度以后,模拟从该无限总体中随机抽样。统计抽样所得的F值的均数、标准差、中位数、最小值、最大值、四分位数间距等指标;编制频数表、绘制直方图;统计抽样所得的变量值小于等于任意界值的频率并计算理论概率。
二项分布
设置总体率和样本含量以后,模拟从该无限总体中随机抽样。统计抽样所得的阳性数X的均数、标准差、中位数、最小值、最大值、四分位数间距等指标;编制频数表、绘制直方图;统计抽样所得的变量值小于等于任意界值的频率并用直接概率法计算理论概率。
r分布
设置总体相关系数和样本含量以后,模拟从该无限总体中随机抽样。统计抽样所得的样本相关系数r的均数、标准差、中位数、最小值、最大值、四分位数间距等指标;编制频数表、绘制直方图;统计抽样所得的变量值小于等于任意界值的频率并计算理论概率(z变换后进行u检验)。
2 抽样误差及中心极限定理的模拟
样本均数的模拟抽样
目的是帮助使用者理解样本均数的分布规律。可模拟从正态分布(任意正态分布)、偏态分布(自由度为1的卡方分布)、均匀分布(0,1)中随机抽样。使用者设置总体参数及样本含量(n)、重复次数(K)以后,可获得抽取的每个数据(X)及每个样本的均数、标准差、标准误;K个样本均数的均数和标准差及其理论值;K个样本均数的频数表。
样本率模拟抽样
目的是帮助使用者理解样本率的分布规律。可模拟从二项分布中随机抽样。使用者设置总体参数(π)及样本含量(n)、重复次数(K)以后,可获得抽取的每个样本的阳性数、阳性率;K个样本率的均数和标准差及其理论值;K个样本率的频数表。
软件特色
简明实用
本软件的统计分析方法均选自国内经典的统计学教材,软件的整体结构、数据格式等均符合非统计学专业人员的思维习惯,采用菜单操作。无须培训,只要具备最基本的统计学知识,即可独立使用。
自动选择方法
使用者只要知道自己需要做什么(如统计描述、参数估计、假设检验、相关回归、研究设计等)以及资料的类型(数值变量或分类变量),不需要选择检验方法,该软件可根据资料的设计类型和分布特点自动选择合适的统计分析方法。使用者只需要选择合适的菜单,并在软件的“提示”下一步一步地输入数据,即可得到详细的分析结果,而且,为了帮助使用者选择合适的有用信息,软件还会给出简明的提示信息,根据提示信息,就可得到自己需要的结果。
适用范围广
常见资料的常用统计方法(除多元统计分析以外)均包括在内。
既可对原始数据进行统计分析,也可对中间结果进行统计分析。即原始数据不详时,仅知道均数和标准差(或标准误)时,也可进行统计分析(非常适合对文献资料的统计结果进行验证)。
本软件可进行“统计模拟”,既可帮助非统计学专业人员学习、理解统计学原理和方法,也可辅助专业人员进行统计教学;
本软件有专门的“研究设计”模块,可估计样本含量和检验效能。
结果准确可靠
在进行参数统计之前,首先进行“使用条件”检查。对不符合条件者,自动选择非参统计。
另外,该软件在统计分析前进行逻辑检查,如果资料不符合逻辑,则停止运行,并提示使用者改正。
经大量验证,所得统计结果准确可靠。
使用方法
简明统计软件分析步骤如下:
由于研究目的是进行统计描述,所以首先选择菜单“统计描述”。由于资料属于数值变量,所以选择“数值变量资料”。如下图。
由于资料属于原始数据资料,而不是频数表资料,所以在接下来的窗口中选择“原始数据”,点击“确定”按钮。
由于样本含量为11,所以在样本含量一栏目输入“11”,点击“确定”按钮。
输入各个数据,如下图。
检查无误后,点击“确定”按钮,即可得到所需的统计结果,如下图。
简明统计软件分析步骤如下:
由于研究目的是进行总体均数估计,属于“参数估计”,由于资料属于数值变量,所以选择“数值变量资料”中的“总体均数估计”。如下图。
由于已知样本均数和标准差,而不是已知原始数据,或其它,所以在接下来的窗口中选择“已知平均数和标准差”,点击“确定”按钮。如下图。
输入各个数据,如下图。
简明统计软件分析步骤如下:
由于研究目的是进行总体均数估计,所以首先选择菜单“参数估计”,由于资料属于二项分布,所以选择“二项分布资料”。如下图。
输入“阳性数(X)”和“总例数(n)”,其它各项可用默认值,一般不必修改,如下图。
检查无误后,点击“确定”按钮,即可得到所需的统计结果。如下图。
由于要进行“假设检验”,而且资料属于“单向有序分类”的“计数资料”,所以选择菜单如下图。
输入“欲比较的组数”和“等级类别数”。本例有2组,有4个等级。如下图。
输入数据如下图。千万不要输错位置!!
单击“确定”按钮,得到分析结果如下图。根据提示,可认为2种药物疗效的差别有统计意义。
由于要进行“生存分析”分析,而且资料属于“原始数据”,所以选择菜单如下图。
输入“资料组数”。本例共有2组。如下图。
输入各组的样本含量。本例两组的样本含量分别为9,8。输入如下图。
输入数据如下图。注意:截尾数据用1表示。说明:简明统计软件中的“死亡”泛指您所研究的各种结局;若未出现或不知道是否出现该结局,则谓之“终检”或“截尾”。比如:研究是否死于某病时,死于该病谓之“死亡”,因其它原因死亡或失访谓之“终检”或“截尾”;研究疾病治愈后是否复发时,该疾病复发谓之“死亡”,因其它原因死亡或失访谓之“终检”或“截尾”;研究节育器是否失落时,失落谓之“死亡”,患者因其它原因死亡或失访谓之“终检”或“截尾”。等等。
单击“确定”按钮,得到分析结果如下图。根据提示,可认为两组的总体生存率不相等。细心的读者会发现,简明统计软件不仅进行了假设检验,而且还计算了各组不同时点的的生存率及其标准误。
相关介绍
统计描述
所谓统计描述,就是对一批同质数据的特征进行描述。数据的基本特征有两个,一个是集中趋势,即平均水平,另一个是离散程度,即变异情况。
描述一组同质观察值的平均水平或中心位置的指标有均数、几何均数、中位数、众数、调和均数等。这些集中趋势指标反映一组同质数据的平均水平或中心位置。描述离散程度的指标有全距、四分位数间距、方差、标准差、变异系数等。最常用的指标是均数和标准差。
生存资料的效应变量有两个,一个是生存时间,一个是结局(是否死亡,是否复发)。如第一个数据200,表示两层含义:该患者的结局是复发了,时间是200天。
生存资料存在截尾数据。在追踪随访的过程中,难免发生失访现象,比如,第二个数据155+,就是一个截尾数据,表示最后一次观察到这名患者是在第155天,这时候他还沒有复发,但此后就联系不上了(或者死于车祸、自杀、被害,或者出国、调往外地,等等,因某种原因失去了联系)。截尾数据又称截尾值,删失值或终检值。这类数据提供的信息不完全,不知道最后是否出现了要研究的结局(本例是复发),但是,它又提供了部分信息,起码可以告诉我们在此时间内没有出现要研究的结局。截尾数据一般在数据后加一个“+”号,以便与完全数据(即观察到要研究的结局的数据)相区别。
生存资料的分布类型复杂。生存资料一般是通过随访获得的,观察时间较长,混杂因素多,所以一般呈偏态分布,不服从正态分布。
对生存资料的分析,一般包括计算生存率(survival rate,是指病人经过t个单位时间以后仍存活的概率),若有一组以上生存资料,可对生存率进行假设检验。
生存率的计算有两种方法:一种是乘积极限法(Product-limit method),又称Kaplan-Meier法;另一种是寿命表法(life table method),仅用于大样本生存资料。
生存率的假设检验常用log-rank 检验,也称时序检验。
样本含量估计
输入所需的参数,可估计出样本含量。
包括:样本均数与总体均数比较、两个样本均数比较、配对设计两样本均数比较、总体均数的估计、总体率的估计、两样本率比较、相关系数的假设检验及比较、两生存率比较等,共10种估计样本含量的方法。
检验效能计算
输入所需的参数,可估计检验效能。
包括:样本均数与总体均数比较、两个样本均数比较、配对设计两样本均数比较、两样本率比较、相关系数的假设检验及比较、两生存率比较等,共7种计算检验效能的方法。
选定检验方法,计算检验统计量 根据资料类型和设计类型,选用适当的检验方法,计算相应的统计量。如配对设计的两样本均数的比较用配对t检验;完全随机设计的两样本均数比较时,选用成组设计的两样本均数比较的t检验。简明统计软件可自动选择统计分析方法,使用者不必自己选择,但必须知道资料类型和设计类型。
确定P值,作出统计推断 根据算得的样本统计量计算P值。P值是指在H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
∨ 展开