stata15.1是一款功能强大的数据统计分析软件,拥有专业的图形分析功能、数据编辑功能和数据统计分析功能等,将复杂的数据创建成图形,从而进行分析,这样更加直观,方便用户清晰的查看数据的变换,stata15.1扩展了回归模型,新的潜在类别分析功能和贝叶斯前缀指令,能够创建非线性混合效应模型、空间自回归模型和有限混合模型等,小编带来的是stata15.1中文破解版,附有安装教程,需要的朋友赶快下载吧!
stata15.1安装破解教程
1.下载软件,得到安装文件、破解文件和序列号等文件
2.首先双击SetupStata15.exe,进入stata15.1安装界面,单击【next】
3.阅读软件的许可协议,勾选【I accept...】同意协议继续安装
4.输入用户信息
5.选择安装可执行文件类型,我们选择【Stata/SE】
6.选择stata15.1安装位置,默认的为C盘,选择其他文件夹单击【browse】修改
7.选择默认的工作向导文件存放位置,我们选择默认
8.准备安装,单击【next】开始安装stata15.1
9.耐心等待,安装完成
10.弹出激活界面,Name和Organization栏下可输入任意英文,然后输入下面的序列号,点击【下一步】:
Serial number: 401506209499
Code: uk4n 5fLi 6wk3 n7q4 kv6h s2ea 719
Authorization: gc83
11.先取消“Register Stata online”前面的勾选,然后点击【完成】;
12.自动弹出Check for updates窗口,先勾选“Diable automatic update checking”,然后点击【OK】;
13.在主程序的Command栏下面输入:db update 并按回车键;
14.弹出update窗口,先勾选“From alternate location:”选项,然后点击【Browse】按钮,找到软件包内的stata15update_win文件夹,单击选中后点击【确定】;
15.显示正在安装更新…
16.提示更新已成功安装,点击【确定】;
17.重新打开Stata15.1软件,能够看到已是简体中文语言;
Stata15新功能:
1.扩展回归模型
我们称之为ERMS 扩展回归模型。四个新的命令适合
-线性回归分析,
-区间回归包括 tobit模型,
-概率,
-有序概率模型
可任意组合成:
-内生变量
-非随机处理任务
-内源性(Heckman-style)样本的选择
这些新的命令让人惊喜,因为可以在任何一个方程中加入内生变量,包括处理赋值和概率选择方程。内生变量并不局限于连续性。它们可以是二进制或序数。不管是外生的还是内生的,它们都可以与其他变量相互作用。它们甚至可以互相作用,形成平方项或立方项!
这些新的ERM命令—eregress,eintreg,eprobit, 和eoprobit注定会流行起来,因为他们解决了研究人员的很多问题。首先, 可能有一个内生变量, 因为许多模型都省略了与模型中的变量相关的变量。其次,数据经常被删剪,而删剪不是随机的。ERM 样本选择选项允许您对选择过程进行建模, 并对其进行调整。或者, 如果您正在使用非随机处理效应模型, 则可以用 ERM处理分配选项。或者, 可以结合处理分配和选择选项, 其中一些是由于后续的行为而损失的拟合内生处理分配模型。
2、潜在类别分析(LCA)
潜在的均值未被观测。分类也就是分组。潜在类是数据中未观测到的组。你可能有关于消费者的数据,并且根据消费者对产品的潜在兴趣将他们分成三组。但是,在数据中没有指定每个消费者所属组的变量。拟合模型后,你可以
-使用新的estat lcprob命令估计属于每一类的消费者比例;
-使用新的estat lcprob命令估计每个类中Y1、Y2、Y3、Y4的边际均值(均值就是示例所示的概率);
-使用新estat lcprob命令来评价适合度;
-使用现有的predict命令获取分类成员的预测概率和观测结果变量的预测值。
3、贝叶斯前缀指令
新的bayes:前缀命令使你能够适应比以前版本更广泛的贝叶斯模型。原来也可以拟合贝叶斯线性回归, 但是现在可以通过输入文字就可以:在这个模型中, 为变量 id的每个值添加随机截距。
新的bayes:前缀命令在许多Stata评估命令之前工作,并提供超过50种可能性的模型。支持的模型包括多级、面板数据、生存和样本选择模型!
新命令支持所有Stata的贝叶斯的功能。你可以从之前的模型参数的分布中选择,也可以使用之前默认的。当闭合形式解决方案用于Gibbs方法时,可以使用默认的自适应 Metropolis–Hastings 抽样, 或Gibbs抽样, 或两种方法的组合。在bayesmh命令的基础上可以使用STATA的任何其他功能。可以更改回归系数的缺省先验分布,比如,使用prior()选项:
4、线性动态随机一般均衡(DSGE)模型
DSGEs是经济学中的一个时间序列模型。它们是传统预测模型的替代品。两者都试图解释总的经济现象, 但 DSGEs 允许对来自经济理论模型的基础上做这个。建立在经济理论基础上的方程很多。这些方程的关键特征是, 未来变量的期望值会影响今天的变量。这是区别 DSGEs 与矢量回归或状态空间模型的一个特性。另一个特点是, 从理论推导出来的参数通常可以用这个理论来解释。
在DSGE模型中有三种变量:
-控制变量和方程,如p没有冲击,并且是由方程组决定的。
-状态变量 (如 y) 具有隐含的冲击, 在时间段开始时是预先确定的。
-冲击是驱动系统的随机错误。
在任何情况下, 以上dsge 命令可以定义一个模型并拟合。
如果我们有一个关于 beta 和kappa之间关系的理论, 比如它们是相等的, 我们可以用现有的命令test来测试它。
新的 postestimation命令estat policy和estat transition报告策略和转换矩阵。如果键入
显示将控制变量作为状态变量的线性函数。如果有五个控制变量和三个状态变量, 则每个控件将被报告为三个状态的线性函数。在上面的简单例子中, 预测 p 的线性函数将显示为现在的 y 函数。
同时,报告转换矩阵。而策略矩阵将 p 报告为函数y, 而转换矩阵则报告 y 如何通过时间演变为p。可以使用Stata的现有预测命令来生成预测。可以使用Stata现有的irf命令来绘制脉冲响应函数。
5、web动态的Markdown文档
你有没有听过Markdown?它是一种创建 html 文档的流行方式。html 文件是繁琐的。Markdown简单直观,想法很简单。可以创建一个文件, 其中包含所需的可读格式的文本, 然后通过它运行一个命令来创建一个HTML文件。
Stata现在支持Markdown, 我们已经添加了标签 (功能) 到Markdown, 允许包括输入文件中的Stata命令。你所包含的命令将被运行和显示, 或者以秘密方式运行, 以及提取输出的部分供文档使用。
6、非线性混合效应模型
非线性混合效应模型也被称为非线性多级模型和非线性层次模型。可以用两种方式来考虑这些模型。可以把它们看成包含随机效应的非线性模型。或者可以把它们看成线性混合效应模型, 其中一些或所有的固定和随机效应都是非线性的。不管哪种方式, 总的误差分布假设成Gaussian分布。
这些模型在人口药代动力学, 生物鉴定和研究生物学和农业成长过程中很流行。比如,采用非线性混合效应模型对机体的药物吸收、地震强度和植物生长进行了模拟。
新的评估命令被命名为 menl。它实现了 popular-in-practice Lindstrom–Bates 算法, 是基于对固定和随机效应的非线性均值函数进行线性化。支持最大似然和受限最大似然估计方法。
Menl易于使用。可以直接输入单个方程。大括号{ },用于将要匹配的参数括起来:
除了标准功能外, postestimation特征还包括对随机效应及其标准误差的预测,对模型中定义的感兴趣参数的预测, 作为其他模型参数和随机效应的参数、聚类相关矩阵的整体评估等。
7、空间自回归模型(SAR)
Stata适合空间自回归 (SAR) 模型, 也称为同步自回归模型。新的spregress,spivregress, 和spxtregress命令允许因变量的空间滞后、自变量的空间滞后和空间自回归误差。空间滞后是时间序列滞后的空间模拟。时间序列滞后近年来成为变量值。空间滞后是附近地区的值。
该模型适用于区域数据, 也称为区域性数据。观测结果被称为空间单位, 可以是国家、州、区、县、市、邮政编码或城市街区,或者它们可能根本就不是地理位置。它们可能是社交网络的节点。空间模型评估直接影响—区域对自身的影响,并估算邻近地区的间接或溢出效应。
有一个全新的 [SP] 手册专门介绍Stata的新SAR功能。这些命令被称为Sp命令。它们可以与以下一起工作:
-shapefiles通过 web 获取你选择数据,或者
-没有shapefiles 和数据,只包含位置的坐标,或者
-没有 shapefiles没有位置会出现社会网络数据。
8、区间删失参数生存时间模型
Stata新的stintreg 命令加入 streg, 用于拟合参数生存模型。stintreg拟合区间删失数据模型。在区间删失数据中,故障时间并不确定。众所周知, 受试者还没有失败的时候, 以及后来他们已经失败的时候。
stintreg拟合指数,Weibull, Gompertz, 对数正态分布、对数逻辑和广义的gamma生存时间模型。支持比例风险和加速故障时间度量。功能包括
-分层估计
-灵活的辅助参数建模
-robust, cluster–robust, bootstrap,和jackknife的标准误差
除了基本功能, postestimation功能还包括plots of survivor,, hazard, 和cumulative hazard函数;平均数和中位数时间预测;Cox–Snell and martingale-like残差值等。
9、有限混合模型(FMMs)
新的fmm:当数据来自未观测到的亚群时, 前缀命令拟合模型。它可以与17 个Stata评估命令一起使用。
大多数用户使用fmm来拟合模型中的参数 (系数、位置、方差、比例等) 在不同亚群之间的变化。在这些模型中,未观测到的亚群称为类。比如说你感兴趣的拟合模型。每个分类在总人口的比例中,Postestimation 命令可用于 (1) 评估,(2) 报告类内结果变量的边际均值,(3) 预测类成员的概率和预测结果。
10、混合Logit模型
Stata已经拟合多项Logit模型。Stata15能使它们拟合混合形式, 包括随机系数。
随机系数对拟合多项式逻辑模型具有特殊的意义。它们是围绕Independence of the Irrelevant Alternatives (IIA)假设一种方式。这一假设表明, 如果你选择步行去工作, 当你的选择是步行, 乘坐公交车, 或自驾, 你仍然选择步行, 即使你没有选择不可再用的一个选项。如果选项是在步行或开车之间,你仍然会选择步行。人类有时行为不同。
IIA假设在协变量的条件下, 选择是独立的。如果违反这种假设, 选择将是相关的。随机系数允许选择相关性。研究人员经常在随机效用模型和离散选择分析的中使用混合模型。Stata新的asmixlogit Logit命令支持各种随机系数分布, 并允许包含特定案例变量的模型。
11、非参数回归
Stata现在适合非参数回归。在这些模型中, 不指定函数形式。指定变量并指定想要匹配的变量:
匹配项是g()。该方法不假定 g () 是线性的
12、聚类随机设计和回归模型的功耗分析
Stata现有的power命令执行功率和样本(PSS) 分析。其功能包括PSS线性回归和集群随机设计 (CRDs)。现在可以添加你自己的功率和样本大小的方法。
线性回归的新方法包括
-power oneslope,在一个简单的线性回归中对斜率测试执行pss。根据给定的其他研究参数计算样本的大小或功率
-power rsquared,在多元线性回归中执行R-squared检验的PSS。R-squared检验是对测定系数 (R-squared) 的 f 检验。测试可以用来测试所有系数的意义, 也可以用来测试其中的一个子集。在这两种情况下, power rsquared计算样本大小或功率或目标R-squared给其他参数研究。
-power pcorr,在多元线性回归中执行PSS的部分相关测试。部分相关检验是平方偏多相关系数 f的 检验。该命令根据其他研究参数计算样本大小或功率或目标平方偏相关系数。
Stata 15现在还支持集群随机化设计:
在 CRD中, 组的受试者 (集群) 是随机的而不是个体, 这意味着样本大小的作用是通过数字集群和集群大小来发挥的。样本大小确定包括给定集群大小的数量或给定集群的大小。CRD命令计算 (1) 的一个集群的数目, (2)的集群大小, 或 (3)的功率, 或最小的可检测到的效果大小给定的其他参数。这些命令可以根据不相等的集群大小调整选项。
-当指定新的选项集群时, 现有的5个 power方法将扩展到支持CRDs。它们是
-对于两个样本方法, 还可以针对两个组中的不相等的集群进行调整。
与所有其他功率方法一样, 新方法允许指定参数的多个参数值, 并自动生成表格和图形结果。
另一个新功能是可以添加自己的PSS方法。这是很容易做到的。编写一个计算样本大小、功率或效果大小的程序。power命令将为您完成其余部分。它将处理选项中多个值的支持, 并且自动生成图形和结果表。
13、Word和PDF文档
现在, 使用Stata嵌入的结果生成 Word 和 PDF档就像制作 Excel 工作表一样容易。大多数使用者喜欢Stata 14中的putexcel,如果你也是他们中的一员,你会爱上新的putpdf和putdocx命令。他们像putexce一样工作。可以编写do-file来创建包含最新结果、表格和图表的整个Word 或 PDF报表。可自动执行可重复的报告。
新的 putdocx 命令将段落、图像和表格写入 word 文档 (. docx 文件)。图像包括Stata图形和组织的标志。也可以设置文本对象的格式。包括字体大小、粗体、倾斜、自定义表等。
14、图形颜色透明度/不透明度
到现在为止, 在另一个上面画一个物体, 上面的物体盖住下面的物体。在计算机图形学的行话中, Stata颜色完全不透明, 或者, 如果你喜欢不完全透明。Stata15允许控制其颜色的不透明度。
不透明度指定为一个百分比。默认情况下, Stata的颜色是100% 不透明的。
每当指定一个颜色时都可以指定不透明度,例如在mcolor ()选项中控制标记的颜色。你可以指定green%50,而不是green。你可以指定"0 255 0%50".而不是"0 255 0%50"(相当于绿色)。可以自行指定%50, 使默认颜色50%不透明。但是, 不要指定%0。这是完全透明的, 也是无形的。
这里是一个图表,使用70 %的不透明度:
15、ICD-10-CM/PCS支持
Stata 15支持 ICD-10-CM 和 ICD-10-PCS, 由 NCHS 和CMS 提供的美国 ICD-10 代码。Stata 15支持从2016版本开始(从2015年10月开始) 的代码, 当它们被授权在美国使用, 并支持所有后续版本。
Stata在 1998年开始支持ICD, 从 ICD-9-CM 16版本开始, 并支持之后的每 ICD-9 版本。自2003年以来, Stata也支持 ICD-10 代码版本。
1998年以来, Stata的ICD命令从仅仅是一个自动的有效代码和简短短语列表, 成为ICD代码的整个数据管理系统。该系统甚至包括在一个数据集中管理多个ICD版本的能力!
16、联邦储备经济数据(FRED)支持
圣路易斯联邦储备局向注册用户提供超过47万的美国和国际经济和金融时间序列。注册是免费的并且很容易做。这项服务叫FRED。它包括来自84个来源的数据, 包括美联储、宾州世界表、欧统局和世界银行。
Stata 15中,你可以使用Stata的GUI来访问和下载FRED数据。可以按类别、发布或来源进行搜索或浏览。可以单击选择感兴趣的系列。选择1或选择100。当您点击下载"时, Stata将下载它们并将它们合并到一个内存中的单个自定义数据集中。
Stata命令行界面也提供了这些相同的功能。命令是import fred。当追踪月报表需要自动更新27个不同系列时, 该命令非常方便。
Stata可以访问FRED和ALFRED。ALFRED是FRED的历史档案数据。
17、其他
在Stata功能页面中了解更多上述功能, 还有以下功能:
-贝叶斯多级模型
-门限回归
-具有随机系数的面板数据tobit
-区间测量结果的多层回归
-删失结果的多级Tobit回归
-面板数据的协整测试
-时间序列中多断点的测试
-多组广义 SEM
-异方差的线性回归
-Heckman风格的样本选择Poisson模型
-具有随机系数的面板数据非线性模型
-贝叶斯面板数据模型
-随机系数的面板数据区间回归
-SVG的导出
-贝叶斯生存模型
-零膨胀有序概率
-添加您自己的电源和样本大小的方法
-贝叶斯样本选择模型
-支持瑞典语
-对DO文件编辑器的改进
-流随机数生成器
-对于java插件的改进
-Stata / MP更多的并行化
stata15怎么做回归
生成一个自变量和一个因变量
点击Statistics|linear model and related|linear regression菜单
在弹出的regress中设置相关变量,然后再点确定。如下图:
在结果界面中,_cons为.5205279表示回归截距,说明回归方程具有统计学意义。R-squared和Adj R-squared分别为0.9905和0.9893,说明回归方程拟合效果很好
回归拟合图。点击Statistics|linear model and related|Regression diagnostics|Added-variable plot
在弹出的avplot/avplots中,选择“all variables”,点确定
结果如下图
stata15怎么导入数据
数据导入方法一:
直接复制粘贴
绝对简单明了,不需要任何技术,缺点就在于当数据比较多的时候,拉框选择还是一件很麻烦的事情,有些数据在excel中可能是显示小数点后两位,但实际储存的并不止这么多。如果是复制粘贴了,可能只粘贴过去小数点后两位,这样就损失了一部分精度。最不推荐。
数据导入方法二:
命令:use
1.insheet using filename, [option]
这个命令是专门用来导入像excel之类的以电子表格形式存储的数据。在导入之前,首先要把excel文件转存为STATA可以识别的格式。其中我最常用的就是另存为csv逗号分隔符格式。
然后在STATA中使用insheet读取csv文件,在option中指定为comma告诉STATA你读取的是csv文件。
这种方法有个不足在于如果你的数据中包含中文而且里面含有逗号时无法识别,解决的办法是不要用逗号标示分隔符了,在excel中另存为txt(制表符分隔),这样就不会与逗号相混淆了。然后再在insheet命令中在option里指定是tab,就完事了。
2.infile using filename
这个infile命令分两类,一种是处理固定格式(fixed format)的txt或raw,另一种是处理自由格式(free format),当然你在用这个命令里还需要定义一个dictionary,这个dictionary是用来描述数据的组织方式的,需要自己根据要导入的数据文件自己编写代码,然后嵌套到数据文件txt的前面去,或者是单独地存为一个dct文件,并且告诉STATA你要导入的数据在保存在哪里。
3.xmluse
这个命令首先要把xls文件另存为xml格式,然后用xmluse命令去读取,当然在读取时你也要在option中声明你的xml文件是excel保存的而不是STATA保存的,这样就不会弄错。
如果你的xls文件中如果有汉字的话,STATA读取后对应的变量会出现乱码,这一点用insheet就不会有这个问题。
4.odbc
这个命令是专门读取数据库文件的,并且支持SQL命令,这样如果你的数据比较多的话,可以先用SQL语句进行筛选,然后而导入。当然这个命令也能导向excel文件。
数据导入方法三:
点击“File”→“Open”,找到文件“.dta”,局限比较大,主要是表格类型只支持.dta格式。
数据导入方法四:
点击“File”→“import”,可以导入xls,txt等其他格式的数据,同样是对于导入文件的格式有要求。
以上就是小编为你带来的Stata数据导入方法教程,小编个人比较建议的是调用STATA的内部数据导入命令,到时考虑新手用户的使用难度,可以选择更为简单的导入操作。
stata15怎么导出到EXCEL
首先,在Stata中输入代码(ssc install asdoc, replace)安装外部命令asdoc。
安装完成后,打开我们的数据,小编这里以Stata自带的数据auto为例。
下面,小编做一个mpg和weight变量对price变量的回归分析,并把结果直接导出到Word里。输入命令:asdoc reg price mpg weight 。如图所示,Stata会自动生成一个名为“Myfile.doc”的文件。
点击打开Myfile.doc文件,可以看到,我们想要的回归分析结果已经导出到该Word文档里了。
∨ 展开