wget コマンドで Web サーバからファイルを一括取得する




wget コマンドを使って Web サーバからファイルを一括取得する方法は次の通り。

# wget -r http://www5.ocn.ne.jp/~m-shin/

これにより、index.html からリンクを再帰的に辿り、存在するファイルを取得する。

その結果、カレントディレクトリに www5.ocn.ne.jp/~m-shin ディレクトリが作成されて、
その中に取得したファイルが元々の階層構造通りに保存される。


ちなみに、特定のディレクトリのみを取得したい場合は次の通り。

# wget -r -np -l 1 http://www5.ocn.ne.jp/~m-shin/apache/apache.html

これにより、apache.html からリンクを辿り、apache ディレトリ以下のファイルのみを取得する。


wget は基本として、リンクを辿ってファイルを取得するので、
リンクされていないファイルは所得することはできない。