stata初级入门2-数据篇.ppt

上传人:牧羊曲112 文档编号:6521323 上传时间:2023-11-08 格式:PPT 页数:32 大小:647KB
返回 下载 相关 举报
stata初级入门2-数据篇.ppt_第1页
第1页 / 共32页
stata初级入门2-数据篇.ppt_第2页
第2页 / 共32页
stata初级入门2-数据篇.ppt_第3页
第3页 / 共32页
stata初级入门2-数据篇.ppt_第4页
第4页 / 共32页
stata初级入门2-数据篇.ppt_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《stata初级入门2-数据篇.ppt》由会员分享,可在线阅读,更多相关《stata初级入门2-数据篇.ppt(32页珍藏版)》请在三一办公上搜索。

1、Stata 入门2数据篇,2023年11月8日星期三,计量经济学软件应用课程讲义,1,一、数据录入,直接录入打开dta数据文件导入其它格式的数据文件其它方式,2023年11月8日星期三,计量经济学软件应用课程讲义,2,1直接录入,(1)直接在stata中录入(适用于小样本少变量数据):打开程序,调用数据编辑窗口,直接录入数据,如excel中操作。调用数据窗口方式:(a)在command窗口中输入edit命令;(b)点工具栏上的(2)在excel中录入后,直接复制到stata数据编辑窗口中。(3)键盘直接输入:在command窗口,用input命令。划线部分输入,.drop _all.input

2、 x y x y 1.1 2 2.3 4 3.5 6 4.7 8 5.9 10 6.end,2023年11月8日星期三,计量经济学软件应用课程讲义,3,2.数据文件的读取,(1)Stata数据文件,后缀.dta直接双击菜单操作:在工具栏上直接点击 或File Open:,2023年11月8日星期三,计量经济学软件应用课程讲义,4,use 命令,语法格式:use filename,clear nolabel,读取整个数据文件use varlist if in using filename,clear nolabel,从数据文件中仅读取几个变量范例:use C:Program Files(x86)

3、Stata12auto.dta,clearuse C:Program Files(x86)Stata12auto.dta,clear nolabeluse make price using C:Program Files(x86)Stata12auto.dta,clear,(2)其它格式的数据文件,Excel数据:*.xls,*xlsx。这是stata12新增的功能。用spreadsheet建立的ASCII(txt)数据:*.raw,*.txt,*.csv,用insheet命令。固定列宽的ASCII(txt)数据:*.dct,用infix命令以dictionary格式建的ASCII(txt)数

4、据:*.dct,*.raw,用infile命令。无格式的ASCII(txt)数据:*.txt,*.raw,用infile命令。SAS XPORT数据:*.xpt,用fdause命令。ODBC数据源:包括access数据源,*.mdb,dBase数据源,*.dbfxml数据:*.xml,菜单操作:fileimport,2023年11月8日星期三,计量经济学软件应用课程讲义,7,3.其它方式,(1)用StatTransfer 软件转换可以用statTranser 9软件将各种格式的数据转换成dta格式数据前提是你安装了这个软件(2)安装外挂命令程序包,如usespss.ado程序包就是一个用于读取

5、spss生成的格式数据的程序包。在search all中敲入搜索关键词:找到可能你需要的程序包,而后安装即可。这个方法安装的外挂命令,不会在菜单中出现,需要你记住命令名。,2023年11月8日星期三,计量经济学软件应用课程讲义,8,二、数据的保存或导出,1保存用save/save as 2导出从file菜单中export选项下选择你想保存的格式;用outfile,outsheet,fdasave,xmlsave命令,2023年11月8日星期三,计量经济学软件应用课程讲义,9,三、数据操作,变量名、标签等属性变量属性显示和修改变量的数据类型和长度变量生成和变量值修改缺失值的处理变量的剔除和保留数

6、据的排序字符变量和数值变量的相互转换,2023年11月8日星期三,计量经济学软件应用课程讲义,10,1.变量属性,如名称、标签、值标签,变量名:由英文字符、数字、中文字符组成。字母大小写表示的含义不同!标签:对变量含义的解释值标签:用于对分类变量值的含义进行解释如foreign有domestic和foreign,在数据量化上,可用0代表domestic,1代表foreign。,2023年11月8日星期三,计量经济学软件应用课程讲义,11,2.变量属性的显示,菜单操作:DataDescribe Data in MemoryDescribe命令,语法格式:describe var1 var2 用于

7、,可显示1个,或多个。如describe foreign,2023年11月8日星期三,计量经济学软件应用课程讲义,12,3.变量属性的修改,变量名更改:rename命令,常用语法格式:rename old_var new_var,如rename income inc.变量标签(label)的定义:label命令,语法:label var varname“#”,如label var foreign“car type”。除用于定义变量的标签外,其还可用于定义数据的标签,如label data“auto in American”分类(或指示)变量的值标签定义:亦label命令,要完成分类变量值的标签

8、定义有两步,如把变量foreign取值为0,定义为domestic,取值为1,定义为foreign,并用origin表示该变量值标签定义结果:label define origin 0“domestic”1“foreign”label values foreign origin,2023年11月8日星期三,计量经济学软件应用课程讲义,13,4.变量的数据类型和长度,整数数值型:(1)byte,(2)int,(3)long。小数数值型:(1)float,(2)double。数值型数据一般定义为float型,除非你有特别定义。字符串型:string,2023年11月8日星期三,计量经济学软件应用课

9、程讲义,14,数值型数据,字符型数据,数值变量和字符变量的转换,encode命令:将字符变量转换为数值变量。格式:encode varname if in,generate(newvar)label(name)noextend菜单:Data Create or change data Other variable-transformation commands Convert variables from string to numeric范例:encode make,generate(make2)decode命令:将数值变量转换为字符变量格式:decode varname if in,gen

10、erate(newvar)maxlength(#)菜单:Data Create or change data Other variable-transformation commands Convert variables from numeric to string范例:deocde price,genrate(price2),包括数值数据的字符转换,destring命令:将字符变量转换为数值变量语法:destring varlist,generate(newvarlist)|replace optionsoptions:ignore(“chars”)删除字符变量中的非数值字符,force将

11、非数值字符转换为缺失值tostring命令:将字符变量转换为数值变量语法:tostring varlist,generate(newvarlist)|replace,5.新变量生成,generate/egen命令:gen命令格式:generate type newvar=exp if in范例:gen id=.egen命令格式:它是gen的更高级应用,egen type newvar=fcn(arguments)if in,options范例:egen mmpg=mean(mpg),2023年11月8日星期三,计量经济学软件应用课程讲义,18,菜单操作:Data Create or chang

12、e data Create new variableData Create or change data Create new variable(extended),6.变量值的修改,replace命令格式:replace oldvar=exp if in,nopromote范例:如replace id=1,7.缺失值的处理,在现有的调查中,经常用88,99,888,999,.等来表示不知道或不清楚。在stata中如何一般用”.”来表示该变量的观测缺失值。将变量缺失值转化为数值,用mvencode命令格式:mvencode varlist if in,mv(#|mvc=#mvc=#.else=

13、#)override 范例:mvencode rep78 if foreign=0,mv(998)将变量的某些数值转化为缺失值,用mvdecode命令格式:mvdecode varlist if in,mv(numlist|numlist=mvc numlist=mvc.)范例:mvdecode rep78,mv(998=.999=.a),2023年11月8日星期三,计量经济学软件应用课程讲义,21,菜单操作:Data Create or change data Other variable-transformation commands Change missing values to nu

14、meric或Change numeric values to missing,8.变量(观测值)的剔除,保留,显示,drop/keep命令:格式:(1)变量:drop/keep varlist;(2)观测值:drop/keep if exp范例:drop pop*,drop if medage 32菜单操作:(1)变量:Data Variables Manager;(2)观测值:Data Create or change data Keep or drop observationsClear命令list命令:格式:list varlist if in,options,9.数据的排序,Sort命

15、令语法:升序sort varlist in,stable。选项stable指如果两个观测值相同,则保持其顺序不变。降序gsort-varname-varname,generate(newvar)mfirst。选项mfirst表示将缺失值放在前面。,菜单操作:(1)只完成升序:Data Sort Ascending sort(2)升、降序皆可:Data Sort Ascending and descending sort范例:,2023年11月8日星期三,计量经济学软件应用课程讲义,25,四、分类数据的处理,变量:连续变量、分类变量将连续变量转化为指示变量如generate priceg=(pr

16、ice=6000)将连续变量转化为分类变量语法:generate newvar=recode(varname,num1,num2,num3,.,numk)将分类变量转化为指示变量语法:xi i.varname,五、数据集的合并和附加,1.数据集的合并:merge命令语法:(1)按指定的关键变量进行1对1匹配合并(One-to-one merge on specified key variables)merge 1:1 varlist using filename,options(2)按指定的关键变量进行多对一匹配合并(Many-to-one merge on specified key var

17、iables)(外部数据文件的关键变量值唯一值)merge m:1 varlist using filename,options,菜单操作:Data Combine datasets Merge two datasets范例:use c:program files stata12auto1.dtamerge 1:1 id using c:program files stata12auto2.dta,2023年11月8日星期三,计量经济学软件应用课程讲义,28,2.数据集的附加:append命令语法:append using filename filename.,options菜单操作:Data Combine datasets Append datasets范例:use c:program files stata12auto3.dtaappend using c:program files stata12auto4.dta,2023年11月8日星期三,计量经济学软件应用课程讲义,29,2023年11月8日星期三,计量经济学软件应用课程讲义,30,六、虚拟变量的生成,xi前缀+i.varname在stata中,你要想,2023年11月8日星期三,计量经济学软件应用课程讲义,31,本讲练习,2023年11月8日星期三,计量经济学软件应用课程讲义,32,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号