程序生成word文档出现各种乱码

先简单介绍生成word文档的方法,虽说简单,但不是最完美,因为打开后与你手动创建的word文档还是有区别的。

先看代码:

<?php
$html = <<<EOF
		<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40">
		<head></head>
		<body>
EOF;

$html .= <<<EOF
	<h1><center>祖国,我爱你</center></h1>
	<br />
	<h2 style="margin-left:21.0pt;">详情</h2>
	<p style="margin-left:42.0pt;"><b>编号</b> : 00000111</p>
	<p style="margin-left:42.0pt;"><b>名称</b> : 中国红十字会</p>
EOF;

$html .= '</body></html>';

//$html = mb_convert_encoding($html,"GB2312","UTF-8");

$filename = strip_tags('祖国,我爱你');
$filename = str_replace(array('?', '!' , '\\', '/', '.', ' '), array(''), $filename);
$filename = mb_convert_encoding($filename, "GB2312", "UTF-8");

header ('Content-Disposition: attachment; filename="'.$filename.'-'.date('Ymd', TIMESTAMP).'.doc"' );
header ('Content-Length: '.strlen($html));
header ('Content-type: application/msword');

echo $html;
?>

上面的程序的文件编码为“UTF-8”,经过验证可以实现文档下载功能,也不会出现乱码。

接着就开始谈谈注意事项:

1. 内容不需要进行转换编码。如果内容进行过转码,保存的文件名中包含“啊”这个汉子的时候,全部文档内容会变为韩文,很奇怪。

2. 文件名(也就是上面的$filename)要进行转码,转换为GB2312,应该GBK也是可以的。记得要吧文件名的特殊字符去掉哦,因为windows中文件名称是有规定的,所以在浏览器提示下载的时候,文件名可能会显示乱码,文件内容也可能出现异常。

30
May 2010
AUTHOR WiFeng
CATEGORY Web
COMMENTS No Comments

添加新评论 »

   点击刷新验证码