程序生成word文档出现各种乱码
先简单介绍生成word文档的方法,虽说简单,但不是最完美,因为打开后与你手动创建的word文档还是有区别的。
先看代码:
<?php $html = <<<EOF <html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40"> <head></head> <body> EOF; $html .= <<<EOF <h1><center>祖国,我爱你</center></h1> <br /> <h2 style="margin-left:21.0pt;">详情</h2> <p style="margin-left:42.0pt;"><b>编号</b> : 00000111</p> <p style="margin-left:42.0pt;"><b>名称</b> : 中国红十字会</p> EOF; $html .= '</body></html>'; //$html = mb_convert_encoding($html,"GB2312","UTF-8"); $filename = strip_tags('祖国,我爱你'); $filename = str_replace(array('?', '!' , '\\', '/', '.', ' '), array(''), $filename); $filename = mb_convert_encoding($filename, "GB2312", "UTF-8"); header ('Content-Disposition: attachment; filename="'.$filename.'-'.date('Ymd', TIMESTAMP).'.doc"' ); header ('Content-Length: '.strlen($html)); header ('Content-type: application/msword'); echo $html; ?>
上面的程序的文件编码为“UTF-8”,经过验证可以实现文档下载功能,也不会出现乱码。
接着就开始谈谈注意事项:
1. 内容不需要进行转换编码。如果内容进行过转码,保存的文件名中包含“啊”这个汉子的时候,全部文档内容会变为韩文,很奇怪。
2. 文件名(也就是上面的$filename)要进行转码,转换为GB2312,应该GBK也是可以的。记得要吧文件名的特殊字符去掉哦,因为windows中文件名称是有规定的,所以在浏览器提示下载的时候,文件名可能会显示乱码,文件内容也可能出现异常。