《《计算机数据》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《计算机数据》PPT课件.ppt(64页珍藏版)》请在三一办公上搜索。
1、,第3章 计算机数据,当次贷危机改变世界-中国怎么办,该书用利益分析法剖析次贷危机的,对未来的经济走势进行了分析和展望,并对如何捍卫民族财富、使财富增值和解决经济难题、实现民族复兴提出了一些针对性的解决方案和建议,问题三:大学生如何学习?(学会自学)转变学习态度(学习热情和兴趣是可以培养的)转变学习方法(更多时候你是一个人在战斗)转变学习内容(要全方位的学习),思考,面试最看重什么?,做人、做事专业、动手学习、适应团队、交际英语、创新,1.子曰:学而时习之,不亦说(yu)乎?有朋自远方来,不亦乐乎?人不知而不愠(yn),不亦君子乎?2.曾子曰:吾日三省(xng)吾身:为人谋而不忠乎?与 朋友交
2、而不信乎?传不习乎?3.子曰:温故而知新,可以为师矣。4.子曰:学而不思则罔,思而不学则殆。5.子曰:由,诲女知之乎!知之为知之,不知为不知,是知也。,论语十则论学习态度和学习方法,6.子曰:见贤思齐焉,见不贤而内自省也。7.子曰:三人行,必有我师焉;择其善者而从之,其不 善者而改之。8.曾子曰:士不可以不弘毅,任重而道远。仁以为己 任,不亦重乎?死而后已,不亦远乎?9.子曰:岁寒,然后知松柏之后凋也。10.子贡问曰:有一言而可以终身行之者乎?子曰:其 恕乎!己所不欲,勿施于人。,提高交际能力:个人形象(穿着得体、精神状态、学会微笑)学会倾听(不好意思,我插一句)学会说话(真诚、得体、幽默、积
3、极乐观、深度)学会做事(认真、用心、不要拖、尽量完美)打电话、写邮件、QQMSN交流、演讲、写作、嘴里 不要含口香糖做一个牛人,你就有更多的话语权,送给学生的话,3.1 数据表示3.2 数据存储3.3 数据运算3.4 数据压缩*3.5 数据纠正*3.6 数据备份*3.7 数据恢复*3.8 数据仓库*3.9 数据挖掘*,计算机数据,谁能更好地抓住数据、理解数据、分析数据,谁就能在下一波的社会竞争中脱颖而出,大数据:正在到来的数据革命 数据之美爆发:大数据时代预见未来的新思维,计算机之父是谁?计算机鼻祖是谁?,冯诺依曼,约翰阿坦那索夫,莫奇利和埃科特,帕斯卡,莱布尼茨,契克卡德,阿兰图灵,伏羲八卦
4、,3.1 数据表示,1.数据表示的由来手指、石子、绳结、算筹、珠盘、算盘 这种表示数据的方法缺点是什么?计算机的发明(0、1)这种表示数据的方法缺点是什么?云存储 通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统,2.数字系统(数码系统)非位置化数字系统:每个符号有一个值,与位置无关 sk-1s2s1s0.s-1s-2s-l 非进位计数制 它的值:n=sk-1 s1 s0 s-1 s-2 s-l 例如:罗马数字系统的符号取值,重复相加、(小值)右加左减、加线乘千MDC=1600 XIX=1
5、9 XVIII=18 2009=MMIX 20091209=?,位置化数字系统:符号所占据的位置决定其表示的值(sk-1s2s1s0.s-1s-2s-l)b 进位计数制 b基数s位权 它的值是:n=(sk-1bk-1+s2b2+s1b1+s0b0+s-1b-1+s-2b-2+s-lb-l)例如:12 Decimal表示12 Binary表示(1100)2或者1100B Octal表示(14)8或者14O Hex表示(C)16或者CH A,B,C,D,E,F-数码,3.各种进制转换,10,2,8,16,整数除2余数逆序排列,小数乘2整数顺序排列,从低到高分组不足加零,8进制与16进制用2进制过渡
6、,负数先补码再转换,ASCII及进制转换软件,10-2相互转换:(10-8/10-16)整数除以2余数逆序排列:用2去除十进制整数,可以得到一个商和余数,再用2去除商,又会得到一个商和余数,如此进行,直到商为零时为止,然后把先得到的余数作为二进制数的低位有效位,后得到的余数作为二进制数的高位有效位,依次排列起来小数乘以2取整顺序排列:用2乘十进制小数,可以得到积,将积的整数部分取出,再用2乘余下的小数部分,又得到一个积,再将积的整数部分取出,如此进行,直到积中的整数部分为零,或者整数部分为1,此时0或1为二进制的最后一位。或者达到所要求的精度为止,2-8相互转换:(2-16)把要转换的二进制从
7、低位到高位每3位或4位一组,高位不足时在有效位前面添“0”,然后把每组二进制数转换成八进制或十六进制即可8-16相互转换:先转换成二进制,再转换成其它进制负数的转换方法:先把负数用补码表示,再按照上面正数的方法进行转换,【思考】用程序实现分数转换成二进制(精确到小 数点第二位)?,【演示】ten-two1.c,【思考】有没有比上面的方法更快的?可以试试用凑数法。比如十进制数220转换成二进制,先按照27、26、25、24、23、22、21、20数字排序,即128、64、32、16、8、4、2、1,要凑220,把要用到的数字位置表示1,否则表示0,如128、64、16、8、4要用到,其它数字不用
8、,所以220(11011100)2例如:2012、0.625、0.8转换成16进制,4.数据的表示单位位(bit):最小的数据单位,是二进制的一个数位字节(Byte):用来表示存储空间大小的最基本单位1Byte=8bits1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB 1PBPetabyte1024TB 1EBExabyte1024PB 1ZBZettabyte1024EB 1YBYottabyte1024ZB,为什么硬盘没有500G,下载没有10M,字(Word):字长是指计算机在进行处理时一次 作为一个整体进行处理的二进制数的位数,具有 这一长度的二进制数则
9、被称为该计算机中的一个字 计算机按照字长进行分类,可以分为8 位机、16 位机、32位机和64位机等字长越长,那么计算机所表示数的范围就越大,处理能力也越强,运算精度也就越高,3.2 数据存储,为什么二进制能够表示出各种信息,1775年4月18日,美军派出的侦察员在教堂的塔上点一个灯笼意味着英军从陆地进攻,两个灯笼从海上进攻。如果英军从陆地和海上同时进攻,怎么办?,为什么要用二进制存储数据电路简单,易于表示可靠性高运算简单逻辑性强,数据类型(多媒体)数字文本音频图像视频,1.数值型数据的存储定点数、浮点数定点数的表示:所有数的小数点位置固定不变数据本身所代表的值叫做真值 0/00正数、1/11
10、负数定点小数:将小数点固定在最高数据位的左边定点整数:将小数点固定在最低数据位的右边,原码:正数的最高位为0,其它位保持不变;负 数最高位为1,其它位保持不变 例如:13原码00001101,-13的原码10001101优点:转换非常简单,正负号将最高位置0或1缺点:加减运算不方便,符号位不能参与运算,并且0的原码表示方法:+0的是00000000,-0的是10000000,反码:正数的最高位为0,其它位保持不变;负 数则最高位为1,其它位按位求反例如:13的反码是00001101,-13的反码是11110010符号位虽然可以作为数值参与运算,但计算完后,仍需要根据符号位进行调整0的反码表示方
11、法:+0的是00000000,-0的是11111111,补码:正数的最高位为0,其它位保持不变;负数则 最高位为1,其它位按位求反后再加1计算机表示整数最普遍的系统就是二进制补码记数法例如:13是00001101,-13是11110011补码的符号可以作为数值参与运算,且计算完后,不 需要根据符号位进行调整0的补码表示方法是唯一的00000000,余码记数法:每一个数值都是由相同长度的位模式 表示的为了表示正的或负的整数,将正整数(称为一个偏 移量 2m-1-1,m是内存单元存储指数的大小)添加到 每个数字中,将它们统一移到非负的一边 余7代码转换表:(162m,正整数就是2m-1-17),浮
12、点数的表示:小数点在数据中的位置可以左右 移动的数据N=2E D 其中,2是基数,E是阶码(指数),D是尾数,IEEE单/双精度:符号1/1指数8/11尾数23/52例如:写出十进制数5.75的余127码(单精度)表示法 S=0 5.75=(101.11)2=(1.0111)222 E=2+127=(10000001)2 010000001,例如:写出十进制数-161.875的余127码(单精度)表示法 S=1 161.875=(10100001.111)2=(1.0100001111)227 E=7+127=(10000110)2 110000110,【例题】下面这个程序输出是多少?#inc
13、ludevoid main()float a,c,f,h;double b,d,e,g;a=2.2f;b=(double)a;printf(b=%d n,b);c=2.25f;d=(double)c;printf(d=%d n,d);e=10.56;f=(float)e;printf(f=%f n,f);g=10.123456789;h=(float)g;printf(h=%f n,h);,b=-1610612736d=0f=10.560000h=10.123457,【演示】data.c,【思考】C和JAVA中的数据如何表示,如何输入和输出?,阿丽亚娜五号火箭的悲剧,2.文本存储计算机中,对非
14、数值的文字和其他符号进行处理时,要对文字和符号进行数字化,即用二进制编码来表示文字和符号用位模式来表示符号:log2n=N(n模式长度,N符号个数)不同的位模式集合被设计用于表示文本符号,每一 个集合称为代码,表示符号的过程称为编码,ASCII(美国信息交换标准码):ASCII编码系统有128(27)个字符,如下页ANSI编码是一种扩展的ASCII码,使用8个比特来表示每个符号。ANSI码开始的128个字符的编码和ASCII码定义的一样,只是在最左边加了一个0。例如,在 ASCII编码中,字符“a”用1100001表示,而在ANSI编码中,用01100001表示ANSI码还可以表示另外的128
15、个符号,如版权符号、英镑符号、希腊字符等世界上还存在着另外一些对ASCII码进行扩展的编码方案,ASCII码通过扩展甚至可以编码中文、日文和韩文字符。不过令人遗憾的是,正是由于这些编码方案的存在导致了编码的混淆和不兼容性,Unicode(统一码、万国码、单一码):Unicode采用16位编码,每一个字符需要2个字节。编码范围从0000hFFFFh,Unicode最多可表示65536个不同字符开始的128个字符编码0000h007Fh与ASCII编码字符一致。从原理上来说,Unicode可以表示现在正在使用的任何语言中的字符。对于国际商业和通讯来说,这种编码方式是非常有用的,因为在一个文件中可能
16、需要包含有汉语、英语和日语等不同的文字。并且Unicode还适合于软件的本地化,也就是针对特定的国家修改软件。使用Unicode,软件开发人员可以修改屏幕的提示、菜单和错误信息来适合于不同的语言和地区,GB2312-80:GB2312-80标准含有6763个汉字,682个西文字符、图符。GB2312-80标准将汉字分成94个区,每个区又包含94个位,每位存放一个汉字,每个汉字就有一个区号和一个位号,所以也经常将国标码称为区位码。例如:汉字“青”在39区64位,其区位码是3964在计算机系统中,由于机内码的存在,输入汉字时就允许用户根据自己的习惯使用不同的输入码,进入计算机系统后再统一转换成机内
17、码存储【思考】还有哪些编码?文本有哪些格式?文本处 理工具有哪些?哪种输入法最快?,GB2312-80 GBK 1.0 GB18030-2000 GB18030-2005,3.音频存储声音的表示方法是以一定的时间间隔对音频信号进行采样,并将采样结果进行量化,转化成数字信息通常使用采样频率、采样位数和采样声道数来表示声音,如常用44100Hz、16位、立体声来录制声音,音质类似CD质量常见的声音格式有CDA、WAV、APE、FLAC、WMA、MP3(MPEG Layer 3)【思考】音频有哪些格式?有哪些播放器?各种格式如何进行转换?,4.图像存储位图图像(bitmap)也称为点阵图像或者绘制图
18、像,由无数像素点组成,这些点可进行不同的排列和染色以构成图像。但位图图像尺寸太大,不方便在互联网上传播,而且放大时,给人的感觉较粗糙矢量图是根据几何特性来绘制图形,矢量可以是一个点或一条线,矢量图只能靠软件生成,文件占用空间较小。这种类型的图像文件包含独立的分离图像,可以无限制地重新组合。矢量图形最大的优点是无论放大、缩小或旋转等都不会失真,缺点是难以表现色彩层次丰富的逼真图像效果,表3.3 常见的图像格式,真彩色使用24位来编码一个像素,用三原色RGB(红red、绿green、蓝blue)来表示各种颜色,真彩色可以编码16777216(224)种颜色,表3.4 部分真彩色,索引色(调色板色)
19、思想:为节约存储,把图像中使用的颜色与一个颜色表对应起来,索引色常使用16色、32色、64色、128色或256色等,但最多不得超过256色。图像互换格式GIF使用索引色模式【思考】有哪些制图工具?抓图工具?格式如何转换,5.视频存储视频是图像在时间上的表示(帧),是随空间(单个图像)和时间(一系列图像)变化的信息表示。每一幅图像或帧被转化成一系列位模式并存储常见的视频格式有:vob、mkv、mpeg、avi、mov、asf、wmv、3gp、flv、rmvb、rm、mp4【思考】视频有哪些格式?有哪些播放器?如何进 行转换?,1.逻辑运算,3.3 数据运算,0假、1真非(NOT):是输入的反转与
20、(AND):输入都为1才是1,否则是0或(OR):输入都为0才是0,否则是1异或(XOR):输入相同是0,否则是1如果a=10011000,b=00101010,则not a=?,a and b=?,a or b=?,a xor b=?,2.移位运算,逻辑移位运算:逻辑右移:右边丢弃左边补0逻辑左移:左边丢弃右边补0循环右移:把每一位向右移动一个位置,最右位成 为最左位循环左移:把每一位向左移动一个位置,最左位成 为最右位,算术移位运算:假定位模式为二进制补码表示的带 符号整数算术左移:对整数乘以2,丢弃符号位,接受右边 的位为符号位,有可能发生上溢或下溢,结果是非 法的算术右移:对整数除以2
21、,保留符号位【例题】如果a=10011000,进行这六种移位结果是?,3.算术运算(1)整数的加减运算可以对整数用二进制补码形式进行加减运算。对于减法,可以转换为加法,如,这里的表示B的补码二进制加法运算规则和十进制加法运算规则类似,把两个数从右到左对齐各列,然后先加右边的列,如果有进位,放到下一列相加,不过最后一列的进位会被丢弃。加减运算看似简单,往往容易出错,要考虑加减结果是否上溢和下溢,【方法一】a=a+bb=a-ba=a-b【方法二】a=abb=aba=ab,【面试题】把a和b两个值进行交换,不用中间变量,【演示】dataexchange.cdataexchange.java,(2)整
22、数的加减运算以浮点数格式存储的实数的加、减法被简化为小数点对齐后以符号加绝对值格式存储的两个整数的加法和减法它包含五个步骤来完成:实数表示增加隐含对齐尾数相加规范化,【例题】A=5.75,B=161.875,R=A+B?第一步,浮点数表示。就是把每个实数用余127码(单精度)表示法A=5.75=(101.11)2=(1.011122)2 S1=0E1=2+127=129=(10000001)2,M1=01110000000000000000000B=161.875=(10100001.111)2=(1.010000111127)2S2=0,E2=7+127=134=(10000110)2,M2
23、=01000011110000000000000,第二步,增加隐含。就是在每个实数的尾数前面增加隐含的1(它只是假设的,没有被存储),让尾数变成了24位,相应的指数加1,而符号位不变S1=0E1=129+1=130=(10000010)2M1S2=0E2=134+1=135=(10000111)2M2,第三步,对齐尾数。把实数指数小的变成和实数指数大的一样大。实数A的指数比实数B的指数小5,所以要把实数A的尾数移动5位S1=0E1=10000111M1=00000S2=0E2=10000111M2,第四步,相加。就是把第三步中的M1和M2相加S=0E=10000111,第五步,规范化。就是把M
24、中的隐含1去掉,变成23位,相应指数减1,然后把得到的数据转换成实数S=0E=10000110 所以,R=A+B=(1.0100111101)22134-127=(10100111.101)2=167.625,显示计算机是如何计算A=5.75,B=161.875,R=A+B?,R=(1.0100111101)22 134127167.625,【例题】显示计算机是如何计算A=5.75,B=7.0234375,R=AB?,R=(1.0100011)2(-2 127127)-1.2734375,压缩类型:无损压缩、有损压缩压缩类似:文字、文本、图像、音频、视频,3.4 数据压缩*,引言块编码线性块编
25、码循环码校验和,3.5 数据纠正*,GHOSTWindows系统还原,3.6 数据备份*,回收站、格式化EASYRECOVERY、FINALDATA,3.7 数据恢复*,数据仓库是决策支持系统(dss)和联机分析应用 数据源的结构化数据环境研究和解决从数据库中获取信息的问题它的特征在于面向主题、集成性、稳定性和时变性,3.8 数据仓库*,Data Mining一种透过数理模式来分析企业内储存的 大量资料,以找出不同的客户或市场划分,分析出 消费者喜好和行为的方法 数据挖掘能做以下7种事情:分类、估值、预言、聚集相关性分组或关联规则描述和可视化复杂数据类型挖掘(Text,Web,图形图像,视频,音频等),3.9 数据挖掘*,作业题,P451.名词解释:数制、定点数、浮点数2.填空题:(1)(10)3.选择题:(1)(10)4.简答题:(3)、(4)、(5),课外作业题,1.数字、文字、图像、音频和视频是怎么压缩的?2.数据错误是怎么检查出来的,然后是怎么纠正的?3.实验:GHOST使用方法,