wgetでページ内の画像ファイルを取得し同一ディレクトリに格納
例)
wget -nd -k -p -e robots=off -P /hoge/hoge/output/dir/ http://www.movion.net/
オプション説明
- -nd :ディレクトリを掘らない
- -k : 絶対パスなどを相対パスに変換(が、謎)
- -p :HTML内の画像を取得
- -e robots=off : robots.txtを無視
- -P 出力ディレクトリ : 指定したディレクトリに出力
最後のURLは取得するページのURLです。
ま、いまどきのサイトはこれだけでは確実に不十分です。というかwgetでは無理が有ります。(cssのimportやcss内の画像は取得してくれないので)
以下のソフトでwgetよりは多く取得できる模様。