网页编码之GB2312、GBK与UTF-8的区别

这篇文章主要介绍了网页编码之GB2312、GBK与UTF-8的区别,,需要的朋友可以参考下

首先,我们要明白,GB2312、GBK和UTF-8都是一种字符编码,除此之外,还有好多字符编码。只是对于我们中国人的网站来说,用这三种编码 比较多。简单的说一下,为什么要用编码,在计算机内,储存文本信息用ASC II码,每一个字符对应着唯一的ASCII码。最初计算机是由美国发明的,他们也用的是键盘和上面的字母,所以他们的字符ASCII好解决。但是我们中国 的就不同了,每个汉字要对应唯一的ASCII码。这样,就出来了国家制定的字符编码标准:GB2312、GBK等。其他国家,其他语言也有他们对应的编码 标准。 GB 就是国标的意思,GB2312和GBK主要用于汉字的编码,而UTF-8是全世界通用的。意思就是说,如果你的网页主要面对使用汉语的中国人的话,使用 GB2312和GBK非常好,文字储存体积要小,有一些优点。如果你的网页要面向世界的话,你再用GB2312和GBK作为网页编码的话,有些电脑上的浏 览器没有这种编码,你的网页汉字内容就会变成无法识别的乱码。 它们通常用在网页的meta标签内,例如:,表示这个页面使用的是GB2312编码。这个信息是给浏览器看的,浏览器会优先考虑使用从网页头部提取出来的编码信息对网页进行解码。当然, 我们也可以强制浏览器使用某种编码解释网页,这样我们就看到了传说中的乱码。

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:

GBK、GB2312--Unicode--UTF8

UTF8--Unicode--GBK、GB2312

对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。

如果是中文的网站 推荐GB2312 GBK有时还是有点问题 为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便 UTF-8可以看作是大字符集,它包含了大部分文字的编码。

使用UTF-8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字*而不会出现乱码。*

gb2312是简体中文的码

gbk支持简体中文及繁体中文

big5支持繁体中文

utf-8支持几乎所有字符

中国大陆最常用的就是GBK18030编码,除此之外还有GBK,GB2312,这几个编码的关系是这样的。 最早制定的汉字编码是GB2312,包括6763个汉字和682个其它符号 95年重新修订了编码,命名GBK1.0,共收录了21886个符号。 之后又推出了GBK18030编码,共收录了27484个汉字,同时还收录了藏文、蒙文、*尔文等主要的少数民族文字,现在WINDOWS平台必需要支持GBK18030编码。

GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码 gbk编码是对G B2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有G B2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码. gb18030编码是在gbk编码基础上的扩充,因为汉字更多,仅仅使用两位编码已经不能 容纳要求的汉字,所以采用了2\4位混和的办法,可以支持更多的汉字编码。并且保留了原有的gbk 2字节编码兼容G B2312和gbk编码的文件。大概容纳55657个编码(包含特殊字符) unicode编码(也就是UTF编码):俗称万国码,致力于使用统一的编码准则表达各国的文字。 为表达更多的文字,utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以 3字节的方式处理中文,带来了兼容性的问题,原有的gbk,G B2312,gb18030编码文件都不能正常的处理,还有很长的路要走。

gbk和gb2312的区别有哪些

首先大家要了解什么是gbk?什么是gb2312?我们要知道他们都是一种字符编码,当然字符编码还有很多种。

而字符编码我们可以这样理解:

在计算机中存放的都是0和1的二进制值。

8个位对应一个字节,常用16进制来表示。

那么我们如果想要在计算机上看到我们想要的字符显示,而不是各种0和1的数字该怎么实现呢?

这里我们就需要使计算机把其所存储的对应的16进制的数值,转化为对应的字符,包括英文和中文等其他语言的字符,然后输出到屏幕上。

所以编码也就是,定义了一套规则,去指定哪些数值,对应着哪些字符。

那么字符编码,就是定义了一套规则,指定了计算机中存放的这么多值中的哪个值,对应了电脑屏幕显示出来的哪个字母。

综上所述,大家应该都能理解GBK和GB2312是一种字符编码了吧。

下面我们再具体说说他们的区别与相同点:

相同点:

1、GBK和GB2312 都是16位的!

2、它们通常用在网页的meta标签内。

不同点:

1、GBK字符编码支持简体中文和繁体中文!

GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。

2、GB2312只支持简体中文!

《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。

如果你的网页主要面对使用汉语的中国人的话,使用 GB2312和GBK非常好,文字储存体积要小,有一些优点。如果你的网页要面向世界的话,你再用GB2312和GBK作为网页编码的话,有些电脑上的浏览器没有这种编码,你的网页汉字内容就会变成无法识别的乱码。

本文来自脚本之家,原文链接:https://www.jb51.net/web/706993.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:SEO优化专员,转转请注明出处:https://www.chuangxiangniao.com/p/901227.html

(0)
上一篇 2025年1月4日 02:16:43
下一篇 2025年1月4日 02:17:30

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 梦幻西游网页版怎么抽红色伙伴?

    一、梦幻西游网页版怎么抽红色伙伴? 梦幻西游网页版抽红色伙伴是等级达到200级才能抽。,获得红色伙伴几率较高,但是仙玉消耗也较多,而且有几率抽取到金色伙伴。 金色伙伴*1 0.1% 红色伙伴*1 7% 橙色伙伴*1 0.5% 紫色伙伴碎片*…

    游戏 2025年1月6日
    100
  • 梦幻西游网页版超详细攻略?

    一、梦幻西游网页版超详细攻略? 1、首先大家对于进入游戏之后不知道怎么选角色: 游戏选角问题,无所谓啦,3个角色,3个皮而已,攻击方式和输出几乎一样,所以不用太在意,选择自己喜欢的皮囊就行,有趣的灵魂不存在的。 2、关于输出的问题: 输出=…

    游戏 2025年1月6日
    300
  • 梦幻西游网页版凌霄殿攻略?

    一、梦幻西游网页版凌霄殿攻略? 关于这个问题,梦幻西游网页版中凌霄殿是一个比较难的副本,需要一定的策略和团队配合才能顺利通过。以下是一些攻略建议: 1. 选择合适的队伍:凌霄殿中有很多BOSS,每个BOSS都有自己的特点和弱点,因此需要针对…

    游戏 2025年1月6日
    200
  • 梦幻西游网页版天佑星攻略?

    一、梦幻西游网页版天佑星攻略? 1. 天佑星阵容推荐:成周妖皇+东海龙王+小夫子+太白金星+丝娘子 2. 宠物带上法宠和物宠就可以了。 3. 天佑星平民阵容:不渝,龙鲤龙王,菱心强推也是可以的,对面第一下打到宝宝就好了。 希望这个建议对你有…

    游戏 2025年1月6日
    300
  • 在浏览器上查看Axure RP网页原型效果方法介绍

    使用Axure RP成功绘制了网页原型图,想在保存导出之前进行预览,看一看具体展示效果,应该如何操作呢?如何在浏览器中预览axure网页原型效果?请看详细说明。 准备工具:http://www.ucbug.com/soft/80501.ht…

    2025年1月4日
    100
  • 网页简单布局之结构与表现原则分享

    一般来说html结构 css表现 javascrip行为,网页布局要考虑到结构,表现,行为分离原则,首先重点放在结构和语义化上面,再考虑CSS,JS等,便于后期维护和分析。 结构与表现相关内容简介 html结构 css表现 javascri…

    2025年1月4日 编程技术
    200
  • 网页编码为什么不用gbk或者gb2312而用utf-8

    GBK的文字编码是双字节来表示的,至于UTF-8编码则是用以解决国际上字符的一种多字节编码,正如标题所言,下面为大家详细介绍下到底是为什么呢。 能选择的话还是应该用UTF-8 事实上Windows系统自己的程序已经全面转向Unicode,而…

    编程技术 2025年1月4日
    200
  • 文章网页排名与什么有关 质量还是流量

    文章排名与什么有关, 是文章质量,还是文章流量,还是文章浏览量,还是用户跳出率,还是原创文章,还是关键词密度,还是网站权重,还是外链数量,还是外链质量,是文章字数,还是文章排版,带着一系列问题,让我们一探究竟。 一、与文章质量有关,文章排名…

    网站运营 2025年1月4日
    200
  • 小白必看技术:懒猫聊动态网页和静态网页的特点

    小白必看技术,懒猫聊动态网页和静态网页的特点,绝大多数同学们做seo的静态网站触碰的多,由于搜索引擎更擅于爬取静态网站,针对动态网站搜索引擎不太友善,终究转变性太强,动态网站做seo必须采用伪静态技术性,由于动态网页在网络环境中并并不是具体…

    建站经验 2025年1月4日
    200
  • zblog标签页权重大于网页权重

    zblog标签页权重大于网页权重。这个现象是阳光经过多日观察得出的结论。标签页比文章单页权重高。 我网站上面一共是700多篇文章,如果不添加标签的话,那么全部收录也就700多个网页,实际情况收录了2060个网页,这里面有大量的标签页。 标签…

    网站运营 2025年1月4日
    200

发表回复

登录后才能评论

联系我们

156-6553-5169

在线咨询: QQ交谈

邮件:253000106@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

联系微信