科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道Web服务器中文URL测试和研究

Web服务器中文URL测试和研究

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

本文是Web服务器中文URL测试和研究。

2006年12月5日

关键字: URL Web服务器

  • 评论
  • 分享微博
  • 分享邮件
    ZDNetChina服务器站 x86服务器技巧

    经测试和研究,有如下规则:

  1.IE访问WEB的简单顺序为:IE<->WebServer<->文件系统

  即IE向WebServer发送URL请求,该请求是通过某种编码做了encode的,WebServer接到请求后对其进行解码,然后再用解码后的地址到文件系统获取请求的内容返回到客户端的IE。

  从以上顺序可以看出,如果要正常使用中文路径的URL,必须保证:1,IE端到WebServer端的URL请求的编码和解码的字符集必须一致,2,WebServer到文件系统获取中文路径内容使用的字符集也要跟文件系统的文件名的编码一致。

  2.ext2、ext3等文件系统(ufs文件系统估计也是)不像ntfs或者fat32文件系统,前者文件名是用原码的,不作任何编码,而后者是通过Unicode编码的,故而在win机器上的WebServer到文件系统获取中文路径的文件的问题不大,但是在Linux/Unix上,就必须保证使用正确的字符编码才能正确访问中文路径了。

  3.IE默认是通过UTF8发送URL请求的,如果不想用UTF-8,即必须修改IE的配置,具体方法是IE选项->高级->不选总是以UTF-8发送URL。

  4.ftp协议一般都是通过GBK编码作为路径编码传输文件的,故而要正确访问ext2、ext3经过ftp传输的中文路径文件,必须使用GBK才能正确访问到,我用zh_CN.GB18030编码可以成功访问。

根据以上等出结论,对Tomcat和Apache做了测试结果如下:

  Tomcat在Linux/Solaris上:

  1.将启动tomcat进程的用户的编码设置为zh_CN.GB18030,这样可以保证Tomcat服务器正确访问文件系统的中文路径的文件,我测试了其它字符集,即不能正常访问到;

  2.修改Tomcat配置,指定请求解码字符集(URIEncoding="UTF-8"),那么,IE如果用UTF-8发送URL请求的话是可以正确访问到中文路径的内容的;

  3. 修改Tomcat配置,指定请求解码字符集(URIEncoding="GBK"),那么,IE如果用UTF-8发送URL请求的话将不能正确访问到中文路径的内容,可以将IE设置为“不总是以UTF-8发送URL请求”,即此时可以正确访问。

  注意:如果请求的是jsp等java内容,还必须对程序做修改,使其使用正确的编码和解码字符集做get和put操作,才能正常,这个由开发人员完成测试。

  Apache在Linux/Solaris上:

  1.尚未找到Apache修改请求解码字符集设置的地方,或者根本apache本来就没得修改,已经写死在apache程序里面,除非修改程序才能修改指定URL请求的解码字符集,在这种情况下,将IE设置成了“不总是以UTF-8发送URL请求”,那么也是可以正确访问中文路径的内容的。

  综上所述,如同只是单独使用Tomcat,那么可以根据实际情况选择某种方式;如果使用Apache或者apache结合tomcat,那么只能迁就Apache,故而必须要求客户端将IE修改成了“不总是以UTF-8发送URL请求”才能正常使用中文路径URL。由于IE默认情况下就是配置成用UTF-8发送请求,故而后者比较麻烦!

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章