2014/12/15

【OS X】webarchiveを展開する「textutil」コマンド

OSXの標準ブラウザ Safari でwebサイトを保存するとき、webアーカイブ形式を指定できます。
拡張子も「.webarchive」。

これ、サイトが一つのファイルにまとまるのは便利なんですけど、パッケージになっているわけでもないので、
まとまってくれない方がいいなーと思うこともしばしば。


この .webarchive を展開できる
textutil」というコマンドがあったので、
それについてです。


ターミナルで「textutil」と打ち込んで実行してみると、
下記のようなヘルプが閲覧できます。

または、appleの開発者サイトにマニュアルがあります。
https://developer.apple.com/library/mac/documentation/Darwin/Reference/ManPages/man1/textutil.1.html
基本的に同内容ですが、こちらのほうがレイアウトも若干見やすく、
ちょっと例文も載っています。

今回は、もとサイトのファイルをバラバラに取得できるようにするのが目的なので、流れとしては「webarchive -> html」とか「webarchive -> rtfd -> パッケージの中身を見る」とかになるかと思います。

フォーマット変換には、-convert オプションを使います。
指定できるフォーマットは下記

  • txt, rtf, rtfd, html, doc, docx, odt, wordml, or webarchive
使う時はこのような感じ(▼)

textutil -convert html /path/to/file.webarchive
textutil -convert rtfd /path/to/file.webarchive

ほかにも docx や odt なんかも行けるんですね。
ちなみに、普通にhtmlに展開すると、元ファイルと同階層にわーっと画像とか出て来ますので、出力先フォルダを指定した方が良いと思います。 -output オプションを使います。

textutil -convert html -output /path/to/output/folder/file.html /path/to/file.webarchive

フォルダまでではなく、ちゃんとアウトプットファイルまで指定します。

例。
途中のフォルダ作ってくれるかなと思ったんですが、ダメでしたw
結果。
また、指定したフォーマットと出力するファイルの
拡張子をちゃんと確認してから実行しませう。

あとはこれをAutomatorでコンテキストメニュー(右クリックメニュー)に追加すれば、なにかと便利かなと思います。



■参考

webarchive形式
http://ja.wikipedia.org/wiki/Webarchive

textutil
https://developer.apple.com/library/mac/documentation/Darwin/Reference/ManPages/man1/textutil.1.html


(▼過去記事)

【Automator】OSXの右クリックをつよくする
http://sproutmel.blogspot.com/2014/03/osx.html

【Automator】続・右クリックネタ - テキストを囲む
http://sproutmel.blogspot.com/2014/03/blog-post.html

0 件のコメント:

コメントを投稿