[心缘地方]同学录 |
首页 | 功能说明 | 站长通知 | 最近更新 | 编码查看转换 | 代码下载 | 常见问题及讨论 | 《深入解析ASP核心技术》 | 王小鸭自动发工资条VBA版 |
发表人 | 主题:xxxxxxxxxx |
嘎嘎,是我 身份:admin 发帖:1438 登陆次数:3287 |
1F
发表于 2007/5/18 17:23:33
codepage=936 简体中文GBK codepage=950 繁体中文BIG5 codepage=437 美国/加拿大英语 codepage=932 日文 codepage=949 韩文 codepage=866 俄文 codepage=65001 unicode UFT-8 ANSI code page 1252 is used for American English and most European languages; OEM code page 932 is used for Japanese Kanji. -------------------------------------------------------- .1 cjk codepage 同 extended unix coding ( euc )编码大不一样的是,下面所有的远东 codepage 都利用了c1控制码 { =80..=9f } 做为首字节, 使用ascii值 { =40..=7e { 做为第二字节,这样才能包含多达数万个双字节字符,这表明在这种编码之中小于3f的ascii值不一定代表ascii字符. cp932 shift-jis包含日本语 charset jis x 0201 (每个字符一个字节) 和 jis x 0208 (每个字符两个字节),所以 jis x 0201平假名包含一个字节半宽的字符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同euc-jp编码区别的是, shift-jis没有包含jis x 202中定义的5802个汉字. cp936 gbk 扩展了 euc-cn 编码( gb 2312-80编码,包含 6763 个汉字)到unicode (gb13000.1-93)中定义的20902个汉字,中国大陆使用的是简体中文zh_cn. cp949 unifiedhangul (uhc) 是韩文 euc-kr 编码(ks c 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节( 在c1中 ) cp950 是代替euc-tw (cns 11643-1992)的 big5 编码(13072 繁体 zh_tw 中文字) 繁体中文,这些定义都在ken lunde的 cjk.inf中或者 unicode 编码表中找到. 注意: microsoft采用以上四种codepage,因此要访问microsoft的文件系统时必需采用上面的codepage . --------------------------------------------------- ms 用的 codepage 是 CJK Codepage,跟linux的是不一样的 ------------------------------------------- 同 Extended Unix Coding ( EUC )编码大不一样的是,下面所有的远东 codepage 都利用了C1控制码 { =80..=9F } 做为首字节, 使用ASCII值 { =40..=7E { 做为第二字节,这样才能包含多达数万个双字节字符,这表明在这种编码之中小于3F的ASCII值不一定代表ASCII字符. CP932 Shift-JIS包含日本语 charset JIS X 0201 (每个字符一个字节) 和 JIS X 0208 (每个字符两个字节),所以 JIS X 0201平假名包含一个字节半宽的字符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同EUC-JP编码区别的是, Shift-JIS没有包含JIS X 202中定义的5802个汉字. CP936 GBK 扩展了 EUC-CN 编码( GB 2312-80编码,包含 6763 个汉字)到Unicode (GB13000.1-93)中定义的20902个汉字,中国大陆使用的是简体中文zh_CN. CP949 UnifiedHangul (UHC) 是韩文 EUC-KR 编码(KS C 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节( 在C1中 ) CP950 是代替EUC-TW (CNS 11643-1992)的 Big5 编码(13072 繁体 zh_TW 中文字) 繁体中文,这些定义都在Ken Lunde的 CJK.INF中或者 Unicode 编码表中找到. ----------------------------------------------------- 哎,看了BlueDestiny(never-online, come back to cpp)的文章 俄文站点我知道怎么做了,可是实在不懂俄文, 做了utf8的,毛病是搜索时,关键字不能带有汉字: “机”(post和get都一样) 否则常常出错,用了server.urlencode还是一样常出错 还是utf-8的兼容性不好! utf8毛病多多, 看来还是要用本国的codepage好! ---------------------------------------------------- 檔名含有~, +, %時,使用FileSystemObject之FileExists問題 |
CopyRight © 心缘地方 2005-2999. All Rights Reserved |