加入收藏 | 设为首页 | 会员中心 | 我要投稿 聊城站长网 (https://www.0635zz.com/)- 智能语音交互、行业智能、AI应用、云计算、5G!
当前位置: 首页 > 运营中心 > 建站资源 > 经验 > 正文

GBK编码/UTF-8编码是什么?有什么异同?

发布时间:2023-08-18 14:03:56 所属栏目:经验 来源:
导读:作为一名开发者,不可避免的要了解各种编程语言和编码知识。其中针对在网页上设定字符编码的一种做法就是将其称之为页面编码英语(简称为Web页码化) ,它是一项基础的信息处理技巧之一。本文我们讲下GBK编码是什么?
作为一名开发者,不可避免的要了解各种编程语言和编码知识。其中针对在网页上设定字符编码的一种做法就是将其称之为页面编码英语(简称为Web页码化) ,它是一项基础的信息处理技巧之一。本文我们讲下GBK编码是什么?UTF-8编码是什么?以及两者的区别。

一、什么是网页编码

我们在网页上看到的所有文字其实都是由2进制0和1组成,”编码方式“通俗的讲就是将这些2进制数字转换成我们看得懂的文字。国内一般用的是“GBK”和“GB2312”,而“utf-8”是大部分国家通用的编码方式。

二、GBK编码是什么

GB就是国标的意思,GB2312和GBK主要用于汉字的编码。也就是如果你的网页主要面对使用汉语的中国人的话,使用GB2312和GBK非常好,文字储存体积较小。如果你的网页是面向全球的话,再用GB2312和GBK作为编码,有些电脑上的浏览器没有这种编码,你的网页汉字内容就会变成无法识别的乱码。

编码代码通常用在网页的meta标签内,例如:meta charset="utf-8",表示这个页面使用的是utf-8编码。这个信息是给浏览器看的,浏览器会优先考虑使用从网页头部提取出来的编码信息对网页进行解码。当然,我们也可以强制浏览器使用某种编码解释网页,这样我们就看到了传说中的编码。

不过,现在建设网站优先选用国际通用的UTF-8编码,毕竟其它编码格式的建站CMS已经很少有人更新与使用了,UTF-8编码是主流。

三、UTF-8编码是什么

UTF-8是Unicode TransformationFormat-8bit,在互联网上使用最广的一种Unicode的实现方式。它是用于解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如果是UTF8编码,在外国人的英文浏览器上也能显示中文,他们无需下载中文语言支持包。

UTF-8版本虽然具有良好的国际兼容性,但中文需要比GBK/BIG5版本多占用50%的数据库存储空间,对国际兼容性有特殊要求的用户建议使用。若一个网站上含有较多中文,那么使用 GBK 编码可以有效缩小存储在数据库中的文件大小;而如果网站主要面向英语用户,则应采用 UTF-8 进行编码以达到相同效果,降低数据库空间的使用量。

四、Unicode是什么

Unicode是Universal Multiple-Octet Coded Character Set”,简称 UCS。由于以前很多国家都有自己的编码标准,结果互相之间谁也不懂谁的编码,谁也不支持别人的编码。这时,一个叫 ISO (国际标谁化组织)的国际组织决定着手解决这个问题。他们采用的方法很简单:废了所有的地区性编码方案,重新创造一个包括了地球上所有文化、所有字母和符号的编码,也就是Unicode。

这种编码非常大,大到可以容纳世界上任何一个文字和标志。所以只要电脑上有Unicode这种编码系统,无论是全球哪种文字,只需要保存文件的时候,保存成Unicode编码就可以被其他电脑正常解释。

四、GBK与UTF8有什么区别

1、UTF-8是一种国际化的编码方式,包含全世界所有国家需要用到的字符(简体中文字、繁体中文字、英文、日文、韩文等语言),也兼容 ASCII 码。

2、GBK包含全部中文字符,是在国家标准GB2312基础上扩容后兼容GB2312的标准,专门用来解决中文编码,是双字节的,无论中英文都是双字节。

3、UTF-8编码是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的网站用UTF-8更节省空间。

另外,如果是外国人访问你GBK编码的网页,需要下载中文语言包支持。而访问UTF-8编码的中文网页则不出现这问题,可以直接访问显示中文字体。这样一来,就可以避免出现文件不兼容的情况。

(编辑:聊城站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!