Sig’s Book Diary

関心本の収集

.docx文書の扱い

original: http://sigs-view.blogspot.com/2007/05/docx.html


添付ファイルで.docxの拡張子を持つ文書が送られてきた。これが何か気がつかなかったが、どうやら、Word2007の新しい書式の文書であるらしい。まことに、Microsoftの陰謀であるように思えるが、ともあれ、読まなければならなかったので、ネットで調べてみた。
まず、わかったことは、Microsoftはコンバータを含むパッチを用意していてダウンロードできるようだが、これは、Windows用のものだけということ。あいにく、私は、Macユーザだ。今使っているマシンは、MacBookParallels DesktopをつかってWindowsXPを仕込んでいるが、こちらは、フリーソフトしか入っていない。
次に、Mac用にはDashboard Widgetやネット上のコンバータ、また、アプリケーションがあることがわかったが、これらは、いずれも、英文の文書を対象としているようで、ダウンロードして20文書はフリーで使用できるというふれこみのものを試したが、文字化け。
ついに探し当てたのが、以下のITmedia Bizの記事。要点は、
1、拡張子を.zipに変換し、
2、解凍ソフトで解凍すると、
3、階層をなすXMLファイル群がでてきて、
4、このうちのDocument.xmlにテキスト部分だけが(書式なしに)含まれている
5、これをxmlエディタで読む、あるいは、Safariで読む
となんとか読めるということがわかった。

ITmedia BIZ:Office 2007のファイルを何とか開く:http://www.itmedia.co.jp/bizid/articles/0611/30/news026.html