[心缘地方]同学录
首页 | 功能说明 | 站长通知 | 最近更新 | 编码查看转换 | 代码下载 | 常见问题及讨论 | 《深入解析ASP核心技术》 | 王小鸭自动发工资条VBA版
登录系统:用户名: 密码: 如果要讨论问题,请先注册。
发表人 主题:xxxxxxxxxx
嘎嘎,是我
身份:admin
发帖:1435
登陆次数:3223
1F 发表于 2007/5/18 17:23:33
codepage=936 简体中文GBK
codepage=950 繁体中文BIG5
codepage=437 美国/加拿大英语
codepage=932 日文
codepage=949 韩文
codepage=866 俄文
codepage=65001 unicode UFT-8

ANSI code page 1252 is used for American English and most European languages; OEM code page 932 is used for Japanese Kanji. 

--------------------------------------------------------
.1 cjk codepage 
同 extended unix coding ( euc )编码大不一样的是,下面所有的远东 codepage 都利用了c1控制码 { =80..=9f } 做为首字节, 使用ascii值 { =40..=7e { 做为第二字节,这样才能包含多达数万个双字节字符,这表明在这种编码之中小于3f的ascii值不一定代表ascii字符. cp932 
shift-jis包含日本语 charset jis x 0201 (每个字符一个字节) 和 jis x 0208 (每个字符两个字节),所以 jis x 0201平假名包含一个字节半宽的字符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同euc-jp编码区别的是, shift-jis没有包含jis x 202中定义的5802个汉字. 

cp936 
gbk 扩展了 euc-cn 编码( gb 2312-80编码,包含 6763 个汉字)到unicode (gb13000.1-93)中定义的20902个汉字,中国大陆使用的是简体中文zh_cn. 

cp949 
unifiedhangul (uhc) 是韩文 euc-kr 编码(ks c 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节( 在c1中 ) 

cp950 
是代替euc-tw (cns 11643-1992)的 big5 编码(13072 繁体 zh_tw 中文字) 繁体中文,这些定义都在ken lunde的 cjk.inf中或者 unicode 编码表中找到. 

注意: microsoft采用以上四种codepage,因此要访问microsoft的文件系统时必需采用上面的codepage . 
---------------------------------------------------
ms 用的 codepage 是 CJK Codepage,跟linux的是不一样的
-------------------------------------------

同 Extended Unix Coding ( EUC )编码大不一样的是,下面所有的远东 codepage 都利用了C1控制码 { =80..=9F } 做为首字节, 使用ASCII值 { =40..=7E { 做为第二字节,这样才能包含多达数万个双字节字符,这表明在这种编码之中小于3F的ASCII值不一定代表ASCII字符. 

CP932 

Shift-JIS包含日本语 charset JIS X 0201 (每个字符一个字节) 和 JIS X 0208 (每个字符两个字节),所以 JIS X 0201平假名包含一个字节半宽的字符,其剩馀的60个字节被用做7076个汉字以及648个其他全宽字符的首字节.同EUC-JP编码区别的是, Shift-JIS没有包含JIS X 202中定义的5802个汉字. 

CP936 

GBK 扩展了 EUC-CN 编码( GB 2312-80编码,包含 6763 个汉字)到Unicode (GB13000.1-93)中定义的20902个汉字,中国大陆使用的是简体中文zh_CN. 

CP949 

UnifiedHangul (UHC) 是韩文 EUC-KR 编码(KS C 5601-1992 编码,包括2350 韩文音节和 4888 个汉字a)的超集,包含 8822个附加的韩文音节( 在C1中 ) 

CP950 

是代替EUC-TW (CNS 11643-1992)的 Big5 编码(13072 繁体 zh_TW 中文字) 繁体中文,这些定义都在Ken Lunde的 CJK.INF中或者 Unicode 编码表中找到. 
-----------------------------------------------------
哎,看了BlueDestiny(never-online, come back to cpp)的文章
俄文站点我知道怎么做了,可是实在不懂俄文,
做了utf8的,毛病是搜索时,关键字不能带有汉字: “机”(post和get都一样)
否则常常出错,用了server.urlencode还是一样常出错
还是utf-8的兼容性不好!


utf8毛病多多,
看来还是要用本国的codepage好!
----------------------------------------------------

檔名含有~, +, %時,使用FileSystemObject之FileExists問題



 
标题:
消息图标:                                             
                                            
正文:



* UBB 代码开启

 
CopyRight © 心缘地方 2005-2999. All Rights Reserved