如何在php开发中设置中文编码

介绍

本篇文章为大家展示了如何在php开发中设置中文编码,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

<强>数据库中的字符集编码问题

流行的关系数据库系统都支持数据库字符集编码,也就是说在创建数据库时可以指定它自己的字符集设置,数据库的数据以指定的编码形式存储。当应用程序访问数据时,在入口和出口处都会有字符集编码的转换。对于中文数据,数据库字符编码的设置应当保证数据的完整性.GB2312, GBK, utf - 8等都是可选的数据库字符集编码;当然我们也可以选择ISO8859-1(8位),只是我们得在应

用程序写数据之前先将16位的一个汉字或Unicode拆分成两个8位的字符,读数据之后也需要将两个字节合并起来,同时还要判别其中的SBCS字符,因此我们并不推荐采用ISO8859-1作为数据库字符集编码。这样不但没有充分利用数据库自身的字符集编码支持,而且同时也增加了编程的复杂度。编程时,可以先用数据库管理系统提供的管理功能检查其中的中文数据是否正确。

php程序在查询数据库之前,首先执行mysql_query (xxxx"“集名称);其中xxxx是你网页的编码(charset=xxxx),如果网页中charset=utf8,则xxxx=utf8,如果网页中charset=gb2312,则xxxx=gb2312,几乎所有WEB程序,都有一段连接数据库的公共代码,放在一个文件里,在这文件里,加入mysql_query(“组名称xxxx")就可以了。

设置名称显示客户端发送的SQL语句中使用什么字符集,因此,设置名称& # 39;utf - 8 # 39;语句告诉服务器”将来从这个客户端传来的信息采用字符集utf - 8”。它还为服务器发送回客户端的结果指定了字符集(例如,如果你使用一个选择语句,它表示列值使用了什么字符集)。

<强>定位问题时常用的技巧
定位中文编码问题通常采用最笨的也是最有效的办法——在你认为有嫌疑的程序处理后打印字符串的内码。通过打印字符串的内码,你可以发现什么时候中文字符被转换成Unicode,什么时候Unicode被转回中文内码,什么时候一个中文字成了两个Unicode字符,什么时候中文字符串被转成了一串问号,什么时候中文字符串的高位被截掉了……

取用合适的样本字符串也有助于区分问题的类型。如:“aa aa啊? @aa"等中英相间,GB, GBK特征字符均有的字符串。一般来说,英文字符无论怎么转换或处理,都不会失真(如果遇到了,可以尝试着增加连续的英文字母长度)。

<强>

这个标签的作用是声明客户端的浏览器用什么字符集编码显示该页面,xxx可以为GB2312, GBK, utf - 8(和MySQL不同,MySQL是UTF8)等等,因此,大部分页面可以采用这种方式来告诉浏览器显示这个页面的时候采用什么编码,这样才不会造成编码错误而产生乱码。但是有的时候我们会发现有了这句还是不行,不管xxx是哪一种,浏览器采用的始终都是一种编码,这个情况我后面会谈到。

请注意& lt; meta>是属于HTML信息的,仅仅是一个声明,仅表明服务器已经把HTML信息传到了浏览器。

这个函数头()的作用是把括号里面的信息发到http标头。如果括号里面的内容为文中所说那样,那作用和标签基本相同,大家对照第一个看发现字符都差不多的。但是不同的是如果有这段函数,浏览器就会永远采用你所要求的xxx编码,绝对不会不听话,因此这个函数是很有用的。为什么会这样呢?那就得说说http标头和HTML信息的差别了:

http标头是服务器以http协议传送HTML信息到浏览器前所送出的字串。而标签是属于HTML信息的,所以头()发送的内容先到达浏览器,通俗点就是头()的优先级高于& lt; meta>(不知道可不可以这样讲)。假如一个php页面既有标题(“内容类型:text/html; charset=xxx"),又有,浏览器就只认前者http标头而不认元了。当然这个函数只能在php页面内使用。

同样也留有一个问题,为什么前者就绝对起作用,而后者有时候就不行呢?这就是接下来要谈的Apache的原因了。

Apache根目录的设计文件夹里,有整个Apache的配置文档httpd。参看。

用文本编辑器打开httpd。相依,第708行(不同版本可能不同)有AddDefaultCharset xxx, xxx为编码名称。这行代码的意思:设置整个服务器内的网页文件http标头里的字符集为你默认的xxx字符集。有这行,就相当于给每个文件都加了一行标题(“内容类型:text/html;charset=xxx")。这下就明白为什么明明& lt; meta>设置了是utf - 8,可浏览器始终采用gb2312的原因。

如果网页里有头(“内容类型:text/html;charset=xxx"),就把默认的字符集改为你设置的字符集,所以这个函数永远有用。如果把AddDefaultCharset xxx前面加个“#”,注释掉这句,而且页面里不含头(“- type…“),那这个时候就轮到元标签起作用了。

如何在php开发中设置中文编码