CMD中CODEPAGE的概念及.ppt

上传人:小飞机 文档编号:6503160 上传时间:2023-11-07 格式:PPT 页数:71 大小:205.49KB
返回 下载 相关 举报
CMD中CODEPAGE的概念及.ppt_第1页
第1页 / 共71页
CMD中CODEPAGE的概念及.ppt_第2页
第2页 / 共71页
CMD中CODEPAGE的概念及.ppt_第3页
第3页 / 共71页
CMD中CODEPAGE的概念及.ppt_第4页
第4页 / 共71页
CMD中CODEPAGE的概念及.ppt_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《CMD中CODEPAGE的概念及.ppt》由会员分享,可在线阅读,更多相关《CMD中CODEPAGE的概念及.ppt(71页珍藏版)》请在三一办公上搜索。

1、CMD中CODE PAGE的概念及其设置值:,Chcp,Displays the number of the active console code page,or changes the consoles active console code page.Used without parameters,chcp displays the number of the active console code page.,Syntax,chcp nnn,Parameters,nnn:Specifies the code page.The following table lists each cod

2、e page supported and its country/region or language:,Code page Country/region or language,437 United States,850 Multilingual(Latin I),852 Slavic(Latin II),855 Cyrillic(Russian),857 Turkish,860 Portuguese,861 Icelandic,863 Canadian-French,865 Nordic,866 Russian,869 Modern Greek,什么是code page,怎么修改windo

3、ws cmd中的codepage,如果你的cmd无法正常显示中文,或者其他字符,通过chcp 来修改,参数是nnn代表3个数字.简体中文的codepage是:936 西文是:1252,Code page 的历史:,1.Codepage的定义和历史,字符内码(charcter code)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码,内码分为,单字节内码-Single-Byte character sets(SBCS),可以支持256个字符编码.,双字节内码-Double-Byte character sets)(DBCS),可以支持65000个字符编码.主要用来对大字符集的东方文

4、字进行编码.,codepage 指的是一个经过挑选的以特定顺序排列的字符内码列表,对于早期的单字节内码的语种,codepage中的内码顺序使得系统可以按照此列表来根据键盘的输入值给出一个对应的内码.对于双字节内码,则给出的是MultiByte到Unicode的对应表,这样就可以把以Unicode形式存放的字符转化为相应的字符内码,或者反之,在Linux核心中对应的函数就是utf8_mbtowc和utf8_wctomb.,在1980年前,仍然没有任何国际标准如ISO-8859或Unicode来定义如何扩展US-ASCII编码以便非英语国家的用户使用.很多IT厂商发明了他们自己的编码,并且使用了难

5、以记忆的数目来标识:,例如936代表简体中文.950代表繁体中文.,1.1 CJK Codepage,同 Extended Unix Coding(EUC)编码大不一样的是,下面所有的远东 codepage 都利用了C1控制码=80.=9F 做为首字节,使用ASCII值=40.=7E 做为第二字节,这样才能包含多达数万个双字节字符,这表明在这种编码之中小于3F的ASCII值不一定代表ASCII字符.,CP932,Shift-JIS包含日本语 charset JIS X 0201(每个字符一个字节)和 JIS X 0208(每个字符两个字节),所以 JIS X 0201平假名包含一个字节半宽的字

6、符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同EUC-JP编码区别的是,Shift-JIS没有包含JIS X 202中定义的5802个汉字.,CP936,GBK 扩展了 EUC-CN 编码(GB 2312-80编码,包含 6763 个汉字)到Unicode(GB13000.1-93)中定义的20902个汉字,中国大陆使用的是简体中文zh_CN.,CP949,UnifiedHangul(UHC)是韩文 EUC-KR 编码(KS C 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节(在C1中),CP950

7、,是代替EUC-TW(CNS 11643-1992)的 Big5 编码(13072 繁体 zh_TW 中文字)繁体中文,这些定义都在Ken Lunde的 CJK.INF中或者 Unicode 编码表中找到.,注意:Microsoft采用以上四种Codepage,因此要访问Microsoft的文件系统时必需采用上面的Codepage.,1.2 IBM的远东语言Codepage,IBM的Codepage分为SBCS和DBCS两种:,IBM SBCS Codepage,37(英文)*,290(日文)*,833(韩文)*,836(简体中文)*,891(韩文),897(日文),903(简体中文),904

8、(繁体中文),IBM DBCS Codepage,300(日文)*,301(日文),834(韩文)*,835(繁体中文)*,837(简体中文)*,926(韩文),927(繁体中文),928(简体中文),将SBCS的Codepage和DBCS的Codepage混合起来就成为:IBM MBCS Codepage,930(日文)(Codepage 300 加 290)*,932(日文)(Codepage 301 加 897),933(韩文)(Codepage 834 加 833)*,934(韩文)(Codepage 926 加 891),938(繁体中文)(Codepage 927 加 904),936(简体中文)(Codepage 928 加 903),5031(简体中文)(Codepage 837 加 836)*,5033(繁体中文)(Codepage 835 加 37)*,*代表采用EBCDIC编码格式,由此可见,Mircosoft的CJK Codepage来源于IBM的Codepage,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号