R语言课程设计.docx

上传人:小飞机 文档编号:4889021 上传时间:2023-05-21 格式:DOCX 页数:15 大小:157.99KB
返回 下载 相关 举报
R语言课程设计.docx_第1页
第1页 / 共15页
R语言课程设计.docx_第2页
第2页 / 共15页
R语言课程设计.docx_第3页
第3页 / 共15页
R语言课程设计.docx_第4页
第4页 / 共15页
R语言课程设计.docx_第5页
第5页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《R语言课程设计.docx》由会员分享,可在线阅读,更多相关《R语言课程设计.docx(15页珍藏版)》请在三一办公上搜索。

1、成绩:统计计算与软件期末大作业大作业题目:任课老师: 姓 名: 学 号: 班 级:摘要在纳税单位的选择上,有家庭和个人两种选择方法,选择不同的纳税单位会对国家财政收入、 纳税人税负造成不同影响。目前我国个人所得税制以个人为纳税单位,按其收入类别进行划分,在 进行合理扣除后乘以相应税率计征。而在国外,一些国家允许将家庭作为个人所得税的纳税单位, 具有一定的借鉴意义。本文结合我国国情,探索个人所得税的影响因素。当前,我国个人所得税的 纳税单位为个人,针对不同类型的收入分别采用统一的扣除标准和税率,随着我国经济的快速发展, 人们的收入水平也随之不断提升。在现行的个人所得税制度下,个人作为纳税义务主体

2、,必须按照 相关税法对个人收入缴纳所得税,这就导致个人获取的实际收入会有所减少。关键词:个人所得税;回归分析;聚类分析;时间序列分析AbstractThere are two ways to choose tax paying units: family and individual. Different tax units will have different effects on national fiscal revenue and taxpayers tax burden.At present, the individual income tax system of our coun

3、try takes the individual as the tax unit, divides it according to its income category, and multiplies the tax rate by the corresponding tax rate after the reasonable deduction.In foreign countries, some countries allow the family to be the individual income tax unit, which has certain reference sign

4、ificance.This paper explores the influence factors of personal income tax in combination with the national conditions of our country. At present, the tax unit of personal income tax in China is individual, and a unified deduction standard and tax rate are applied to different types of income. With t

5、he rapid development of Chinas economy, peoples income level is also rising.Under the current personal income tax system, individuals as income tax entities must pay income tax according to the relevant tax laws, which leads to a decrease in personal income.Key words: personal income tax; regression

6、 analysis; cluster analysis; time series analysis一. 数据预处理首先,将个人所得税收表保存为CSV (逗号分隔)格式,之后用函数将数据读入到R的内 存中。为了方便之后的操作,对各列进行命名,其中NY代表年度时间,CSJMNRJKZPSR,CZDWZGNPJGZ, CZJMCXCKYE, DQSCZZ, DECYZJZ, CZFSYDWCYRYS, DFCZSR, GRSDS, YBYSSR, ZFXJJSR分别代表城市居民年人均可支配收入、城镇单位职工年平均工资、城镇居民储蓄存款余额、地区生产总值、第二产业增加值、城镇非私营单位从业人员数、地方

7、财政收入、个人所得税、般预算收入、政府性基金收入。同时给出各类别下的样本量个数。从原始数据中可知样本量为16,不是很多,如果再进行分块,可能由于样本量的限制无法得到最好的结果,因此,下文中的训练集和测试集均选用原始数据来充当。 XX=read. csv F:/XX. csv) suuim己t;FCS E酒 RJK ZPSRCZDWZGNPJGZCZJMCXCKYEMin.1993Min.:12O19 Min.:162 0:Hin.:20401st Qu.2QQ21stQu.:1348 1st Qa.:26910 1st QJ.;3430Median2006Me dian :19351 Medi

8、an:3632:L Median :5562Mean2006Mean:2:?979Me am:3953() Mean :61113 rd Qu 20103rd3134 3rd Qu.:5201:L 3rd Qm-:3512Max.2013Max-:42C4D Max.:6D6D:I Mslk -:12254DQSCZZDECYZJZCZFSYDWCYRYSDFCZSRMin.21331755Min.;331Q631Min.;1755512Min. ; 15513551st Qa.34S12B921st :134S633B1st :20553691st Qa.: 2S62266Median603

9、13614Median =24415160Median :2236902Median : 4767231Mean71221186Mean:2 6632067Mes n:2351238Mean: 73103593rd Qa.39432453rd ?5a. =370371233rd. ?加.:236D73D3rd. Qa. : 12534130Max.154201434Max.:52273431Max.:3263483Mhk. :20831374GRSDSY2Y55RMin.133621Min.1761499Min.1198891st Qa.1765021bt Qu.2604824 1st Qu.

10、257442Median254892Me di an4270831 Median4364Q0Mean292415Meain545566 Mean24507943rd 以.4147083rd Qu.7S7-6493 3rd Qu.4411432Mas.&户 rMas. :Max.946333Q二. 建模应用:财政收入的数据分析2.1分类与预测:回归分析回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量之间的关系。这种技 术通常用于预测分析以及发现变量之间的因果关系。本次运用了 lm函数进行回归建模。 lia.nodell y (liu . ruodell)U5JMNRJKEPSR

11、十 CZF5YDWGYRY5 十 CZJMCXCKXE 十 + DFCZSR + YBYSSR + ZFXJJSRf data = XX)-Residraals :3Q Max7804 4-S299Min IQ Mediajn-36672 -10615-12 ccefficients (Intercept)3.71862Se+04 DEZYZJZ i.siaioe-oa(Im.modell)上输出参数估计值CSJMNRJKZPSR2.1989035+01DFCZSR1.958680e-02CZF5YDWCYRY5 -.70Q542e-02 YBYSSR 5.392323e-02 ccnfint

12、(lm.modeLIr2.5 % 37.5 韦speed NA NA fitt.ed(liii.KodeLl)12Farin=Frspeedrr r lavel =CZJMCXCKEDQ5CZZ1-O9a36e+Dl -1.525S78e-02 ZFXJJ5R NA 和即m勰省则计算所有参数的置信区间0.95)#列出拟合模型的预测值3456781170292.8205073.720-65 93.5140311.4157730.3174770.519 6954.0 231001.5910111213141530 9155.43354-68. 339846.-647216-6.4449547.94

13、60594.3486718.7 anoiza (lm.mcdell)左生成一个拟合模型的方差会析表 Analysis of Variaiiice IableRespanse: GRSDSDf11111117CZFSYDWCirRYS CZJMCXCKjfE DQSCZZ DECYZJZ DFCZ5R YBYSSR ResidualsS. SqEean SqF value2- ISS-Se+ll2 laec+n25-92DS9.5852e+099.5e51e+D911.91933-3355e+083.3355e+D80.41484.17S3e+054.1789e+D50.0005l-5533e+

14、091.5533e+D91.931-64-4085e+094.40S5e+D95.43212.e484e+092.84E4e+D93.5420E- 6292e + Q9B 0417e4D8Q0.D01D.01Pr(F7.944e-07禹片片 0.01D66 0.54D08 0.93245 0.20718 0.05174 . 0.1018-6Signif. codes:D.05D-1Residual stanlaxdan 7 degrees Multiple R.-squared :0.97E4r Adjusted LR-squared: 0.9527F-statistiG: 41-32 on

15、7 and 7 DFf p-value: 3.60Ee-05realdusls (Lit.modeLL)#列扫模型的残差4E2 33.52 661792.51990131-36671.73125-7391.54720111-19443.712431063.0052512113372.33833-13-B3 9.35S7114-450.31D73 10 17903.36716 15-12.33731-22 . 57280 AZC ( Lit. .modeLL )养输史&二=值11 35 6.715312550.0618 6-21002.32 3433053.31077Multiple R-squ

16、ared和Adjusted R-squared这两个值,常被叫做“拟合优度”和“修正拟合 优度”,是指回归方程对样本的拟合程度,越接近“1”,拟合程度越高。显然,这个回归模型的拟 合优度为0.9764,拟合程度一般。而标准化残差则可以认为是模型用城市居民年人均可支配收入、 城镇非私营单位从业人员数、城镇居民储蓄存款余额、地区生产总值、第二产业增加值、地方财政 收入、政府性基金收入预测个人所得税的平均误差。各个变量的P值都大于0.05,即各个变量都显 著不为零。ft R Graphics: Device 2 (ACTIVE)图1inooinoO吕导 0 0000.S-Enp-SCDKFitted

17、 va uesResrauaIs vs FittedNormiaIQ-QTheo retie a Quanti es50000300000450000-101Scale-Location0一:1OResiduals vs Leverage140pCD l%l 图 u E1-OJ。左上图是残差对拟合偷血/。 wdooks d刷窑泪1500003000004500000.0 0.2 0.4 0.6 0.8关系,Leverage变量存在相关关系右上图为残差QQ图,然图 于判断模型残差是否等同方差,图上的点呈随机分布状态,故模型残差满足同方差假设;右下图是残差与杠杆图。2.2聚类分析:2.2.1层次聚

18、类算法主对示例数据集XX进行等差抽样1NF CSJMNRJKZPSR CZDWZGNPJGZ CZJMCXCKYEDQSCZZ21331758DECYZJZ9310631CZFSYDICYRYS1S7654619 3912019162022040.IS5200315003282373727.3337536166143532-6122369029200722469401S75589.517140322328257805219042013201134433577310032.2124234330457697-633102356DFCZSRGRSDS YBYSSRZFXJJSR118E1388133

19、621 176149911938953005475153080 2777072577-6S98389925255316 523786231520-631315351387462098 97547685556619繇对聚类结果进行剪技养利.乓务枝函数“t浅巳)中的参效c控割输日景类皓果 cj.t-reelc=4 )1 S 3 13123: cjtcc4)1 B9131234 cj.t-ree ric3r lc=4 )153131234暮利.二翦枝函数t注己)中的参叛H控割输巳窦美釜果 cuit-ee (tic3.r hT: )1593.31234 cut-ree (tic2 rIi=4 )159

20、131112 cut-ree (tic3rIi=4)159J. 31 Z 3 X绘剖奈类袖,井使.巨NQt.三ZEtJ)在震焚树中立看囊交培果Cluster Dendrogramr-字cn直至从图2可以看点,在聚类树的最下端,每个样本独自为一类,越往上,一条分支里的样本多, 所有的样本聚为一类。2.2.2其他聚类分析函数dist(x)hclust (*3 average)A mnlCRVF-|=J Elciupi0iparnx = n, K = 2j)Componert 1CJvrpcwwtsFAiin 1CKi % c/ Ihc ikiiiiI vuriLilhly(聚类概率分布)图3SC

21、口 CrapfiTRs UeM-TF !s iinoLjerir plot or pamji: = x.0 2so胄aswcTlhi f0X3Avt3i#IbCuMKC widfh 0 &l(聚类结果)图4三. 时间序列分析3.1导入时间序列对象 t3(data=XXf 3tart=L399f ed=2OLSf frequeuey=L) Time Series:Start = 1333EW = 2Q13Frequency = 13.2绘制原始时间序列图 sales-Ljead . csv (F : /R/XX . csvw f ?ieade=T ) f2 sa2.e5_tiiue plot.

22、ts (5dLe5_tiir.etin.en, ylat:= rriuoeyn)R R Graphics: Device 2 ACTIVE2468101214time图5由图5可见原始时间序列图呈单调递增趋势。3.3时间序列检验分析 #对序列做自相关检验 acf(sales_time,lag.max = 35) #对序列做偏自相关检验 pacf(sales_time,lag.max = 35) #对序列做单位根检验 unitrootTest(sales_time)Error in unitrootTest(sales_time):could not find function unitroot

23、Test” #对序列做白噪声检验 Box.test(sales_time,lag=1,type = Ljung-Box)Box-Ljung testdata: sales_timeX-squared = 11.082, df = 1, p-value = 0.0008715图6C k urapnics: uevice z ivtjSeries sales timeLLO会对序列做一阶差分 diff(sales_timer139=1 differencas=l)Tiir.e Series :Start = 2End = 15Frequency = 1|11948727 -1314 1-623 1

24、8811403 15642-618 2548 22933048 378013 SeiS 3995 difsales=diff(sales_time) plot. ts (dif salesftime n f ylab=Frnion已y)3.4.1对序列一阶段差分后绘制时序图与偏自相关图、自相关图。ft rt urapnics: uevice 匕K 代 urapnics: uevice hl i ivizjSeries diff salesLLO0.05,说明残差为白噪声序列,所以该模型通过白噪声检验。.研究结论本文旨在分析个人所得税的影响因素,主要运用了回归分析与时间序列分析的方法,又通过分 析相关数据图,研究出个人所得税受影响的情况。分别找到了影响几种税收的主要因素。城市居民 年人均可支配收入、城镇单位职工年平均工资、城镇居民储蓄存款余额、地区生产总值、第二产业 增加值、城镇非私营单位从业人员数、地方财政收入、一般预算收入、政府性基金收入对个人所得 税都有一定影响。参考文献:1 李子奈潘文卿,计量经济学2 张良均 谢佳标杨坦肖刚,R语言与数据挖掘3 王燕,应用时间序列分析

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号