Wget

Per scaricare siti in locale sul proprio computer o per scaricare file molto lunghi, esiste una utility in Linux molto potente "wget". Il suo utilizzo e' il seguente

 $ wget [opzioni] URL 

le opzioni piu' utili sono:

  • -r : scarica anche tutti i collegamenti del sito, da solo puo' essere pericoloso, perche' potrebbe scaricare tutto internet se ogni pagina e' collegata ad un'altra senza fine...
  • -np : da usare insieme a -r per evitare che scarichi collegamenti che si riferiscono a pagine superiori nell'albero delle directory del sito.
  • -c : continua scaricare un download interrotto.
  • -k : converte i link tra le pagine scaricate in modo che possano essere utilizzate in locale (puo' succedere che alcuni siti siano progettati in maniera tale che scaricati in locale i link non funzionino piu').

Esempi:

 $ wget -r -np www.linux.it/guide/ 

 $ wget -r -np -k www.linux.it/guidaincasinata/index.html 

 $ wget www.musica.it/celentano.mp3 

 $ wget -c www.musica.it/celentano.mp3

 $ wget -r --follow-tags=a --reject '*.js,*.css,*.ico,*.txt,*.gif,*.jpg,*.jpeg,*.png,*.mp3,*.pdf,*.tgz,*.flv,*.avi,*.mpeg,*.iso' --ignore-tags=img,link,script   www.musica.it