《数据模型与决策.docx》由会员分享,可在线阅读,更多相关《数据模型与决策.docx(15页珍藏版)》请在三一办公上搜索。
1、P45.1.21.2Newtowne有一副珍贵的油画,并希望被拍卖。有三个竞争者想得到该幅油画。第一个竞拍者将于 星期一出价,第二个竞拍者将于星期二出价,而第三个竞拍者将于星期三出价。每个竞拍者必须在当天 作出接受或拒绝的决定。如果三个竞拍者都被拒绝,那个该油画将被标价90万美元出售。Newtowne 拍卖行的主任对拍卖计算的概率结果列在表1.5中。例如拍卖人的估计第二个拍卖人出价200万美元的 概率p=0.9.(a)对接受拍卖者的决策问题构造决策树。(b)对最优决策进行求解。出价(万美元)第一个竞拍者(星期一)第二个竞拍者(星期二)第三个竞拍者(星期三)1000.00.00.72000.50
2、.90.03000.50.00.04000.00.10.31.3答案:Newtowne拍卖行的最优决策是:1、买家1:如果出价300万,就接受,如果出价200万,就拒绝;2、买家2:如果出价400万,就接受,如果出价200万,也接受。20020010090400904001009040090300200100904009040010090400902.9在美国有55万人感染HIV病毒。所有这些人中,27.5万人是吸毒者,其余的人是非吸毒者。美国总人口为2.5亿。 在美国有10000万人吸毒。HIV感染的标准血液检测并不总是准确的。某人感染HIV,检测HIV为肯定的概率是0.99.某 人没有感染
3、HIV,检测HIV为否定的概率也是0.99。回答下列问题,清晰的说明你需要作出的任何假设。(A) 假设随机选择一个人进行HIV标准血液测试,测试结果是肯定的。这个人感染HIV的概率是多少?你的答案令 人吃惊吗?(B) 假设随机选择一个吸毒者进行HIV标准血液测试,测试结果是肯定的。这个人感染HIV的概率是多少?第一问:答:设:P (x)为随机抽取一个人为HIV感染者的概率;P(y)为从美国人中随机抽取一个人检测HIV为肯定的概率。那么:假设随机选择一个人进行HIV标准血液测试,测试结果是肯定的,这个人感染HIV的概率:P(X|Y)二 P (Y|X)P (X) /P (Y)P(Y|X) =0.9
4、9P (X) =550000/250000000*100%=0.0022P (Y) = P (X) *0.99+(1-P (x) )*0.01=0.012156因此:假设随机选择一个人进行HIV标准血液测试,测试结果是肯定的,这个人感染HIV的概率P (X | Y)为 17.92%。第二问:答:设P (X)为随机抽取一个吸毒者为HIV感染者的概率;P (Y)为从吸毒者中随机抽取一个人检测HIV为肯定的概率。那么假设随机选择一个吸毒者进行HIV标准血液测试,结果是肯定的,这个人感染HIV的概率表示为:P(X|Y)= P(Y|X)P(X)/P(Y)P(Y|X)=0.99P(X)=275000/10
5、000000*100%=0.0275那么假设随机选择一个吸毒者进行HIV标准血液测试,结果是肯定的,这个人感染HIV的概率P(X|Y) 为 74.59%。2.16在一个小型造船厂每月制造的木质航海船的树木是一个随机变量,它服从下表中所给出的概率分布。假设航海船的制造商已经固定了每月的造船费用为3万美元,每只船的附加的建造费用为4800美元。造船的数目概率20.1530.2040.3050.2560.0570.05(A) 计算每月制造船的费用的均值和标准离差。(B) 制造航海船的月费用的均值和标准离差是多少。(C) 如果每月的固定费用从3万每月增加到5.3万美元,在问题(B)中,答案会怎样变化?
6、请仅利用(B)中计算 的结果,重新计算答案。(D) 如果每支船的建造费用从4800美元增加到7000美元,但每月的固定费用仍是3万美元,在问题(B)中,你的答 案会如何变化?请仅利用(A )和(B)中计算的结果,重新计算你的答案。答案:均值=2 X 0.25+3 X 0.20+4 X 0.30+5 X 0.25+6 X 0.05+7 X 0.05=3澎:顽兄,骨,觑:醉血禽:/4君-辫;十次1 -。彳代PVWGS/1才)3保甬电:M 缪二/少皿二佐由松广v r,麻省理工学院的退休金计划有两个基金,即固定收入基金和可变收人基金,设V表示固定收入堵金的年收益率,设V表示可变收人基金用年膜益华。诙A
7、 服从个均值叫=7%和标鹿离弟& = 2%的正态分布,而F服从一个均值斗二 13%和标存篱差 = 8%的正态分布口设CORR (X. F)=-。一轧 某一个教 授巳经段说辎舞退休盆为固定收人基金.投宜了 的退休金为可查收人基 金日(-)这个拽授的调休金自勺年收揣率的阳里也是藩少?(IU这个教授的退休借的年收苍率的拆帝离凰姑多少?M这个教授的退休金的年收益率的分布是多少?(il)这个我授的谓休金的年收监.率在1095梆15%之间的概率是多少?(1) 此教授退休金购买的基金为Z=30%X + 70%Y。由于 XN(0.07,0.02), YN(0.13,0.08)E(X)=0.07, E(Y)=0
8、.13。因此 E(Z)= 30%E(X) + 70%E(Y)=0.021 + 0.091=0.112(2) 教授退休金年收益率标准离差。z。2二(0.3。)2+(0.7。)2+2X0.3X0.7X。X。XCORR (X, Y)将相关数值代入。2=0. 000036+0.003136-0: 0002:688。2=0.0029032z。z =0.054(3) 教授退休金年收益率的分布服从正态分布ZN (0.112 , 0.054)(4) 教授年收益在10%和15%之间的概率P设K为服从一个均值u z=0.112和标准差。z =0.054的正态分布那么:P (0.1WKW0.15) =P (ZW(0
9、.15-u )/。)- P (ZW(0.1-u )/。) 将相关数值代入公式:Z ZZ ZP (0.1WKW0.15)=P (ZW(0.15-0.112) /0.054) - P (ZW(0.1-0.112) /0.054)=P (ZW0.704) - P (ZW-0.22)检查表A.1在表中得到数字:P (0.1WKW0.15) =0.758-0.4129=0.3451因此,教授年收益在10%和15%之间的概率为34.51%。P193 4.4 一个制造立体声音响系统的公司宣称,其个人CD播放机在利用碱性电池的情况下能够连续播放近8小时。为了给出这 个干劲冲天,共测试了 35个利用新的碱性电池
10、的CD播放机,并记录播放机电池的使用时间,平均时间是8.3小时, 寿标准利离差是1.2小时。(A)构造一个新的利用新的碱性电池的CD播放机电池使用的平均时间的95%的致信区间。(B)为了估计利用新的碱性电池的CD播放机电池使用的平均时间位于正或负10分钟范围内,以及99%的置信水平, 确定所要求的样本大小。答案:样本数大于30的为大样本。律刨伽子折为十牝*仃心如辨叮十e 丫二3十。碱 ,.卞引罚奶、ei二寸、作知M沮二5弓松虹豚无二敝/小耕x.罚R瘀X.Q .彳二开。,为归氏二尹。祚。1,声沙-P195 4.17在一家百货商店的两个分店,民意调查者随机地在第一个分店抽取了100个顾客,在第二个
11、分店抽取了 80个顾客,所 有的调查都是在同一天进行的。在第一个分店,平均每个顾客的消费金额是41.25美元,样本标准离差是24.25美元。 在第二个分店,平均每个顾客的消费金额是45.74美元,样本标准利差是34.76美元。(A)构造两个分店中每个分店每个顾客消费金额均值的一个95%的置信区间。(B)构造两个分店中每个顾客消费金额均值差异的一个95%的置信区间。(1)答第一个分店每个顾客消费金额均值的一个95%的置信区间应为:X - X 丁 , X +,L 雷X为第一个分店随机抽取顾客消费额均值,X =41.5,样本大小为n, nx=100;同时,当B95%时C1.96, 则。表示样本的标准
12、离差。=24.25。将以上数值代入,则:X第一个分店每个顾客消费金额均值的一个95%的置信区间应为:1 .96 X 24 .25 八 *1.96 X 24.25 41 .25 -_ 一 ,41 .25 +_ 一_771(36 .497 ,46 .003 同理,第二个分店每个顾客消费金额均值的一个95%的置信区间将表示为:,b y- -45 .75138.133,53.3671.96 X 34 .761.96 X 34 .76,45 .75 + =(2)答两个分店顾客消费金额均值之差的一个95%的置信区间应表示为:- 亲b2 _C2b2X- Y_ C = + 里,X- Y+ C = + yV n
13、ny七nyn = 100n = 80将相关数值代入:1+ 1008042& 34.7&41.25-45.751.96 :+ 1008074.252 347&,41.25-45.75+1.96,-9.311 ,0.3101 练习6.3 美国国税局(1RS)的其中-项关键任务就是确保每个人支付其所要求的税 额。这项任务卜分砸谁.这是因为有成百万的貌税人以及切杂的美国税码! 审实上. IRS仅楼查r由纳佼人型交的所有豹税申报单的一小部分。这取决于 大多数纳税人呈交一个真实的纳税申报单的动机.斐么他们是诚实的.要么 他们如果在税收方而I出现欺我行为而被发现,担心受到法律的制栽。由于审 计纳税申报单是一
14、项劳动密集型(所以成本而)的工作.因此IRS需要开发 简单的税则,用来自动境定-张纳税,申报单是杏痘该被全而审计。例如.IHS 可以利用如下燃则:如果一张指定的纳税申报版上纳税人的也收入殂过20万美元.并且其所 支付的税低于5 000美元,那么纳税人的纳税申报印就应该被审iL为了开发更有效的规则. IRS根据他们纳税申报单上一些很小顼目对应的 数字,利用回卯模型预测一股欠多少税款。衣6. 3说明了 24张纳税申报中 的数字。电子表格文件IRSPREDICT. xU包含了我6.31中的所有明奴表6.31绿习6.3中24张纳税申报单的纳说申报敷字豹税申报 欠税脱前总收入(类元)细目单A扣除 部分(
15、美元地目单c收 入部分(美元)场目单(:部分扣 除百分比()家庭办公 室指标单号(美元)137 056128 55517 95224 720190230 002105 33229 69614 35045131604368 55717 33225 2$0$01422 345100 05218 22122 213321517 05678 65718 73726 023641635 6741 12 57525 76922 387801725 67882 00613 14625 51075J829 56711 i 0401507319 967540922 04078 86。1747X22 878150
16、1025 639102 2432057821 893240ti945946 g21 76920 8181101246 7891409181164916 191750132IO5O82 8372646614 4324511439678133 67415 380130475601536720123 49827 54626573641161593270 38321 14716 731320172224488 87331 65821 0532501825 67090 10!16 8791769330t1924 5687260323879125 9471002023897914672302024 695
17、S02129 789147 04228 33220 85018r2224 37899 25825 8021941938t2332 47812302117 29716 88970i241125354 7822141890脆500(a)根据表6,31中所提出的自变构造一个能罅用于预测纳税人欠税的线性回归模塑。对你的模型的有效件进行评价。(b) it立一个新的回归模55.描述问顾(a)的有关内容。e 何藏(B)的模型存在异方差性的证据恐?漪足正态假设吗?模型回以系 数的95%的置信区间足多少?3) 一名纳税人税前总收入是13万美元.细目单A中的扣除簌为34 500美 元.绍目帅C中收入为的2.6万美
18、元.拥有一个家庭办公室.以及细目 误C中扣除百分比为25% 你对这个纳税人所欠税籁的顼测依是名少?解:(a)对于表6.31提出的自变量,设:Y:欠税($)X1:税前总收入($)X2:细目单A扣除部分X3:细目单C收入部分($)X4:细目单C部分扣除百分比(%)X5:家庭办公室指标则预测纳税人欠税的回归模型为:Y= aX1 + bX2 + cX3 + dX4 + eX5 + e根据计算机的回归计算结果,代入系数得:Y= 0.292X1- 0.012X2 + 0.188X3 + 104.625X4 - 3784.564X5 + 3572.406曰1口妹;+Multiple R0.937041964
19、R Square0.878047641Adjusted R Square0.844171986标准误差3572.406308.观W值241000050000-500050000100000右妾公垢dfSSMSF回归分析5 1.65E+093.31E+0825.919721.23631E-07残差计18 2.3E+0823 1.88E+0912762087Coefficients标准误差_t StatP-valueLower 95%Upper 95%下限 95.0上限 95.0%-21522.86987 4693.424 -21522.9 4693.4240.231657433 0.354253
20、 0.231657 0.354253-0.350439471 0.326316 -0.35044 0.326316-0.163493227 0.538966 -0.16349 0.53896614.09575311 195.1539 14.09575 195.1539-7623.125201 53.99562 -7623.13 53.99562Intercept-8414.7227796239.235-1.348680.194165税前总收入($)0.2929550870.02917710.040778.39E-09细目单A扣除部分($)-0.0120617160.161062-0.07489
21、0.941129细目单C收入部分($)0.1877365280.1671791.1229680.276207细目单C部分扣除百分比(%)104.624828443.090162.4280440.02589家庭办公室指标-3784.5647911827.084-2.071370.052973显然,从回归统计结果上看,这些自变量的组合对欠税预测值Y的影响并不显著。(b)利用后向消元法,逐个消去P值小于0.5的自变量后重新回归计算,得新的比较好的 回归模型为:Y:欠税($)X1:税前总收入($)X4:细目单C部分扣除百分比()X5:家庭办公室指标Y= aX1+ dX4 + eX5 + e根据计算机的
22、回归计算结果,代入系数得:Y= 0.293X1 + 94.564X4 - 3387.18 X5 + 3510.828SUMMARY OUTPUT回归统计Multiple R0.932271R Square0.869129Adjusted R Square 0.849498 标准误差 3510.828 观测值24方差分析dfSSMSF Significance F回归分析31.64E+095.46E+0844.2739 5.12E-09残差202.47E+0812325910总计231 88E+09Coefficient标准误差_t StatP-value Lower 95%Upper 95%下
23、限 95.0上限 95.0% Intercept-4656.49 2824.734 -1.64847 0.114877 -10548.8 1235.805 -10548.8 1235.805税前总收入($)0.293198 0.028668 10.22751 2.16E-09 0.233398 0.352997 0.233398 0.352997细目单C部分扣除百分比(粉4.56454 36.80787 2.569139 0.018307 17.78466 171.3444 17.78466 171.3444 家庭办公室指标-3387 18 1594 774 -2 12392 0 046341
24、 -6713 82 -60 5371 -6713 82 -60 5371(C)(1)为了检验(B)的模型的异方差性,观察计算机输出的残差图:税前总收入($) Residual Plot1000050000 *100品0 * 150000200000-10000税前总收入($)细目单C部分扣除百分比(%) Residual Plot1000040*608010-10000细目单C部分扣除百分比(%)由于残差分布并没有显著地随着自变量的增大而增大,因此认为(b)中构造的模型没有呈 现异方差性的证据。(2)绘制残差的直方图,观察得基本呈现钟状,因此认为满足正态性假设。直方图率 20, L,11,11
25、, 1 口频率频-6981.872294-3488.4519394.9684154563498.38877其他口频率121092频率接收(3)模型Y=aX1+ dX4 + eX5+ 8回归系数的95%的置信区间为:a 0.233398 , 0.352997d 17.78466059 , 171.3444212e -6713.817765 ,-60.53712371(D)将题设数据代入模型,则得对该纳税人欠税额的预测值:y = 0.293X1 + 94.564X4 - 3387.18 X5 + 3510.828=0.293 X 130000 + 94.564 X 25 - 3387.18 X 1
26、 + 3510.828=38090 + 2364.1 - 3387.18 + 3510.828=40577.75 ($)P4147.8嫉习己8天然最佳禅冻食品公司生产四种不同的混合阵环速朗疏菜书这些混合理食蔬菜 由5韩不同的毓菜组成:胡.胡卜、菇、黄辣椒、范茎IT蓝和玉米公司制造 这四种不同混合蔬菜* 1。盎司的袋装进行销辔.这些潟合蔬菜是油批.小黄 鱼 ,烤烧野餐”、“焦情磨茹r和,微隅松臆”,井旦对此利的页械每 坡)分别是0.&美元、0.20美元、0. 18美元和0.次美元,胡萝卜、蘑菇、 青辣椒、花茎甘蓝和玉米的月供应舅样别是野H 150 OCO盎司、#0000盎司. 135 000盎司
27、、14COOO盎司和150 000措司混台蔬菜的成升显示在表7, 39 中口例如,一袋油妹小黄鱼混合藏矣含有2.5症司胡萝卜、3.0需司蘑 菇、5器司肓辣椒和LD孺司花羊甘蓝,但是没有靠来公司训以销皆其生 产的所有程合蔬菜产品.靠*由天M佳寿涨童品松司生产的产品成务”袖蚱小黄鱼-胡萝卜2.52.0侦2.53. 00,04-D9-0育球椒2. 32,052.5花茎甘量2.03.0J 02. 5玉米0.030a 1. 5如)构造一个绣性扰化模理,决定最优产晶的混合蔬菜也就是峰.髭种混合 蔬菜坐产小步搓可以使孙利而献最大化)C(b)求解税性优化模型【用计算机求解)P最优产品的混合蔬菜是什虹?如)骨辨
28、椒的额外卷司僚是忏会中解:(a)线性优化模型的构造见附件xls文件;蔬菜生产计划料量:盎司/月胡萝卜150000蘑菇80000青辣椒135000花茎甘蓝140000变量油炸小黄鱼烤烧野餐热情蘑菇微渴松脆贡献:兀/袋$0.22$0.20$0.18$0.18的数量(袋)26666.6666718333.33012666.67函数利($)11813.33333条件矩阵炸小黄鱼烧野餐情蘑菇渴松脆卜2.52.00.02.53.00.04.00.0椒2.52.03.02.5甘蓝2.03.03.02.5玉米1500000.03.00.02.5约束函数关系右边值消耗(胡萝卜)135000=150000消耗(蘑
29、菇)80000=80000消耗(青辣椒)135000=135000消耗(花茎甘蓝)140000=140000消耗(玉米)86666.66667=150000运算结果报告单元格名字初值终值利($)油炸小黄鱼11813.33311813.333单元格名字初值终值的数量(袋)油炸小黄鱼26666.66626666.666的数量(袋)烤烧野餐18333.33318333.333的数量(袋)热情蘑菇的数量(袋)微渴松脆12666.66612666.66663333单元格名字单元格值公式状态型数值7消耗(胡萝卜)约束函数7=$50$27限制值1508消耗(蘑菇)约束函数8=8$!0$28限制值9消耗(青辣
30、椒)约束函数9=$50$29限制值0消耗(花茎甘蓝)约束函数0=33限制值18333.3333的数量(袋)热情蘑菇3=0限制值3的数量(袋)微渴松脆126636=866限制值12666.666敏感性报告单元格名字终值递减成本目标式 系数允许的 增量允许的 减量的数量(袋)油炸小黄鱼26666.6601E0.的数量(袋)烤烧野餐18333.330.0.的数量(袋)热情蘑菇-0.12666600.1266661E的数量(袋)微渴松脆12666.6600.0485710.013333单元格名字终值阴影价格约束 限制值允许的 增量允许的 减量消耗(胡萝卜)约束函数1351501E15消耗(蘑菇)约束函数800.0226668027142.8580消耗(青辣椒)约束函数1350.1351510555.55消耗(花茎甘蓝)约束函数1400.14015833.3318333.33消耗(玉米)约束函数86666.661501E63333.33(b )用计算机求解,得最优产品的混合蔬菜结果是生产:26666 袋;18333 袋0袋12666 袋;油炸小黄鱼 烤烧野餐 热情蘑菇 微渴松脆 (c)青辣椒的额外盎司值(影子价格)是:$0.016