docx文件的读取
docx文件实际上是由许多XML文件构成,个中内容就存在于word/document.xml内里。
我们找到一个docx文件,运用zip文件翻开(或许把docx后缀名改成zip,然后解压)(引荐进修:PHP视频教程)
在word目次下有document.xml,docx文件的内容就存在于document.xml内里,我们读取这个文件就能够了.
代码以下:
function parseWord($file) { $content = ""; $zip = new ZipArchive ( ); if ($zip->open ($file) === TRUE ) { for($i = 0; $i < $zip->numFiles; $i ++) { $entry = $zip->getNameIndex ( $i ); if (pathinfo ($entry,PATHINFO_BASENAME) == "document.xml") { $zip->extractTo (pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ($file, PATHINFO_FILENAME ), array ( $entry ) ); $filepath = pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ( $file, PATHINFO_FILENAME ) . "/" . $entry; $content = strip_tags ( file_get_contents ( $filepath ) ); break; } } $zip->close (); return $content; } else { echo 'no'; } }
值得注意的是:
第一 $file文件不能与当前代码在统一目次文件下,$file存放在零丁的文件夹
以上就是PHP怎样猎取docx内里内容的细致内容,更多请关注ki4网别的相干文章!