Vyhledávání na webu

10 příkladů příkazů Wget (Linux File Downloader) v Linuxu


V tomto článku se podíváme na nástroj wget, který načítá soubory z World Wide Web (WWW) pomocí široce používaných protokolů, jako je HTTP , HTTPS, FTP a FTPS.

Wget je bezplatný nástroj příkazového řádku a síťový nástroj pro stahování souborů, který přichází s mnoha funkcemi, které usnadňují stahování souborů, včetně:

  • Stahujte velké soubory nebo zrcadlte kompletní web nebo FTP stránky.
  • Stáhnout více souborů najednou.
  • Nastavte šířku pásma a rychlostní limit pro stahování.
  • Stahování souborů přes proxy.
  • Může obnovit přerušená stahování.
  • Rekurzivně zrcadlit adresáře.
  • Běží na většině operačních systémů podobných UNIXu a také na Windows.
  • Bezobslužný provoz/provoz na pozadí.
  • Podpora trvalých připojení HTTP.
  • Podpora SSL/TLS pro šifrované stahování pomocí knihovny OpenSSL nebo GnuTLS.
  • Podpora stahování IPv4 a IPv6.

Syntaxe příkazu Wget

Základní syntaxe Wget je:

wget [option] [URL]

Nejprve pomocí následujícího příkazu zkontrolujte, zda je nástroj wget již ve vašem Linuxovém boxu nainstalován či nikoli.

rpm -q wget         [On RHEL/CentOS/Fedora and Rocky Linux/AlmaLinux]
dpkg -l | grep wget [On Debian, Ubuntu and Mint]

Nainstalujte Wget na Linux

Pokud Wget není nainstalován, můžete jej nainstalovat pomocí výchozího správce balíčků systému Linux, jak je znázorněno na obrázku.

sudo apt install wget -y      [On Debian, Ubuntu and Mint]
sudo yum install wget -y      [On RHEL/CentOS/Fedora and Rocky Linux/AlmaLinux]
sudo emerge -a net-misc/wget  [On Gentoo Linux]
sudo pacman -Sy wget           [On Arch Linux]
sudo zypper install wget      [On OpenSUSE]    

Volba -y zde použitá má zabránit potvrzovacím výzvám před instalací jakéhokoli balíčku. Další příklady a možnosti příkazů YUM a APT naleznete v našich článcích o:

  • 20 Linuxových příkazů YUM pro správu balíčků
  • 15 Příklady příkazů APT v Ubuntu/Debian & Mint
  • 45 Příklady příkazů Zypper pro správu OpenSUSE Linux

1. Stáhněte si soubor pomocí Wget

Příkaz stáhne jeden soubor a uloží jej do aktuálního adresáře. Během stahování také zobrazuje průběh stahování, velikost, datum a čas.

wget http://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.gz

--2021-12-10 04:15:16--  http://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.gz
Resolving ftp.gnu.org (ftp.gnu.org)... 209.51.188.20, 2001:470:142:3::b
Connecting to ftp.gnu.org (ftp.gnu.org)|209.51.188.20|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 3565643 (3.4M) [application/x-gzip]
Saving to: ‘wget2-2.0.0.tar.gz’

wget2-2.0.0.tar.gz      100%[==========>]   3.40M  2.31MB/s    in 1.5s    

2021-12-10 04:15:18 (2.31 MB/s) - ‘wget2-2.0.0.tar.gz’ saved [3565643/3565643]

2. Wget Stáhnout soubor s jiným názvem

Pomocí možnosti -O (velká) stáhne soubory s různými názvy souborů. Zde jsme uvedli název souboru wget.zip, jak je uvedeno níže.

wget -O wget.zip http://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.gz

--2021-12-10 04:20:19--  http://ftp.gnu.org/gnu/wget/wget-1.5.3.tar.gz
Resolving ftp.gnu.org (ftp.gnu.org)... 209.51.188.20, 2001:470:142:3::b
Connecting to ftp.gnu.org (ftp.gnu.org)|209.51.188.20|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 446966 (436K) [application/x-gzip]
Saving to: ‘wget.zip’

wget.zip      100%[===================>] 436.49K   510KB/s    in 0.9s    

2021-12-10 04:20:21 (510 KB/s) - ‘wget.zip’ saved [446966/446966]

3. Wget Stáhnout více souborů pomocí protokolu HTTP a FTP

Zde vidíme, jak stáhnout více souborů pomocí protokolu HTTP a FTP současně pomocí příkazu wget.

wget http://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.gz ftp://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.gz.sig

--2021-12-10 06:45:17--  http://ftp.gnu.org/gnu/wget/wget2-2.0.0.tar.gz
Resolving ftp.gnu.org (ftp.gnu.org)... 209.51.188.20, 2001:470:142:3::b
Connecting to ftp.gnu.org (ftp.gnu.org)|209.51.188.20|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 3565643 (3.4M) [application/x-gzip]
Saving to: ‘wget2-2.0.0.tar.gz’

wget2-2.0.0.tar.gz      100%[==========>]   4.40M  4.31MB/s    in 1.1s    

2021-12-10 06:46:10 (2.31 MB/s) - ‘wget2-2.0.0.tar.gz’ saved [3565643/3565643]

4. Wget Stáhnout více souborů ze souboru

Chcete-li stáhnout více souborů najednou, použijte volbu -i s umístěním souboru, který obsahuje seznam adres URL ke stažení. Každá adresa URL musí být přidána na samostatný řádek, jak je znázorněno.

Například následující soubor „download-linux.txt“ obsahuje seznam adres URL ke stažení.

cat download-linux.txt 

https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso
https://download.rockylinux.org/pub/rocky/8/isos/x86_64/Rocky-8.5-x86_64-dvd1.iso
https://cdimage.debian.org/debian-cd/current/amd64/iso-dvd/debian-11.2.0-amd64-DVD-1.iso
wget -i download-linux.txt

--2021-12-10 04:52:40--  https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso
Resolving releases.ubuntu.com (releases.ubuntu.com)... 91.189.88.248, 91.189.88.247, 91.189.91.124, ...
Connecting to releases.ubuntu.com (releases.ubuntu.com)|91.189.88.248|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 3071934464 (2.9G) [application/x-iso9660-image]
Saving to: ‘ubuntu-20.04.3-desktop-amd64.iso’

ubuntu-20.04.3-desktop-amd64   4%[=>      ] 137.71M  11.2MB/s    eta 3m 30s
...

Pokud má váš seznam adres URL konkrétní vzor číslování, můžete přidat složené závorky a načíst všechny adresy URL, které se vzoru shodují. Pokud si například chcete stáhnout řadu linuxových jader od verze 5.1.1 do 5.1.15, můžete provést následující.

wget https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.1.{1..15}.tar.gz

--2021-12-10 05:46:59--  https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.1.1.tar.gz
Resolving mirrors.edge.kernel.org (mirrors.edge.kernel.org)... 147.75.95.133, 2604:1380:3000:1500::1
Connecting to mirrors.edge.kernel.org (mirrors.edge.kernel.org)|147.75.95.133|:443... connected.
WARNING: The certificate of ‘mirrors.edge.kernel.org’ is not trusted.
WARNING: The certificate of ‘mirrors.edge.kernel.org’ is not yet activated.
The certificate has not yet been activated
HTTP request sent, awaiting response... 200 OK
Length: 164113671 (157M) [application/x-gzip]
Saving to: ‘linux-5.1.1.tar.gz’

linux-5.1.1.tar.gz      100%[===========>] 156.51M  2.59MB/s    in 61s     

2021-12-10 05:48:01 (2.57 MB/s) - ‘linux-5.1.1.tar.gz’ saved [164113671/164113671]

--2021-12-10 05:48:01--  https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.1.2.tar.gz
Reusing existing connection to mirrors.edge.kernel.org:443.
HTTP request sent, awaiting response... 200 OK
Length: 164110470 (157M) [application/x-gzip]
Saving to: ‘linux-5.1.2.tar.gz’

linux-5.1.2.tar.gz     19%[===========]  30.57M  2.58MB/s    eta 50s

5. Wget Resume Uncompleted Download

V případě stahování velkého souboru se někdy může stát, že se stahování zastaví, v takovém případě můžeme obnovit stahování stejného souboru, kde bylo přerušeno pomocí volby -c.

Ale když začnete stahovat soubory bez zadání -c, možnost wget přidá na konec souboru příponu .1, což je považováno za nový stažení. Při stahování velkých souborů je tedy dobrým zvykem přidat přepínač -c.

# wget -c https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso

--2021-12-10 05:27:59--  https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso
Resolving releases.ubuntu.com (releases.ubuntu.com)... 91.189.88.247, 91.189.91.123, 91.189.91.124, ...
Connecting to releases.ubuntu.com (releases.ubuntu.com)|91.189.88.247|:443... connected.
HTTP request sent, awaiting response... 206 Partial Content
Length: 3071934464 (2.9G), 2922987520 (2.7G) remaining [application/x-iso9660-image]
Saving to: ‘ubuntu-20.04.3-desktop-amd64.iso’

ubuntu-20.04.3-desktop-amd64.iso        5%[++++++> ]   167.93M  11.1MB/s               
^C
[root@tecmint ~]# wget -c https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso
--2021-12-10 05:28:03--  https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso
Resolving releases.ubuntu.com (releases.ubuntu.com)... 91.189.88.248, 91.189.91.124, 91.189.91.123, ...
Connecting to releases.ubuntu.com (releases.ubuntu.com)|91.189.88.248|:443... connected.
HTTP request sent, awaiting response... 206 Partial Content
Length: 3071934464 (2.9G), 2894266368 (2.7G) remaining [application/x-iso9660-image]
Saving to: ‘ubuntu-20.04.3-desktop-amd64.iso’

ubuntu-20.04.3-desktop-amd64.iso        10%[+++++++=====> ] 296.32M  17.2MB/s    eta 2m 49s ^

6. Celá webová stránka Wget Mirror

Chcete-li stáhnout nebo zrcadlit nebo zkopírovat celý web pro offline prohlížení, můžete použít následující příkaz, který vytvoří místní kopii webu spolu se všemi aktivy (JavaScript, CSS, obrázky).

wget --recursive --page-requisites --adjust-extension --span-hosts --convert-links --restrict-file-names=windows --domains yoursite.com --no-parent yoursite.com

Vysvětlení výše uvedeného příkazu.

wget \
     --recursive \ # Download the whole site.
     --page-requisites \ # Get all assets/elements (CSS/JS/images).
     --adjust-extension \ # Save files with .html on the end.
     --span-hosts \ # Include necessary assets from offsite as well.
     --convert-links \ # Update links to still work in the static version.
     --restrict-file-names=windows \ # Modify filenames to work in Windows as well.
     --domains yoursite.com \ # Do not follow links outside this domain.
     --no-parent \ # Don't follow links outside the directory you pass in.
         yoursite.com/whatever/path # The URL to download

7. Wget Stáhnout soubory na pozadí

Pomocí volby -b můžete odeslat stahování na pozadí ihned po zahájení stahování a zápisu protokolů do souboru wget.log.

wget -b wget.log https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso

Continuing in background, pid 8999.
Output will be written to ‘wget.log’.

8. Wget Nastavit limity rychlosti stahování souborů

S volbou --limit-rate=100k je rychlost stahování omezena na 100k a protokoly budou vytvořeny pod wget.log, jak je uvedeno níže.

wget -c --limit-rate=100k -b wget.log https://releases.ubuntu.com/20.04.3/ubuntu-20.04.3-desktop-amd64.iso

Continuing in background, pid 9108.
Output will be written to ‘wget-log’.

Prohlédněte si soubor wget.log a zkontrolujte rychlost stahování wget.

tail -f wget-log 

 5600K .......... .......... .......... .......... ..........  0%  104K 8h19m
 5650K .......... .......... .......... .......... ..........  0%  103K 8h19m
 5700K .......... .......... .......... .......... ..........  0%  105K 8h19m
 5750K .......... .......... .......... .......... ..........  0%  104K 8h18m
 5800K .......... .......... .......... .......... ..........  0%  104K 8h18m
 5850K .......... .......... .......... .......... ..........  0%  105K 8h18m
 5900K .......... .......... .......... .......... ..........  0%  103K 8h18m
 5950K .......... .......... .......... .......... ..........  0%  105K 8h18m
 6000K .......... .......... .......... .......... ..........  0% 69.0K 8h20m
 6050K .......... .......... .......... .......... ..........  0%  106K 8h19m
 6100K .......... .......... .......... .......... ..........  0% 98.5K 8h20m
 6150K .......... .......... .......... .......... ..........  0%  110K 8h19m
 6200K .......... .......... .......... .......... ..........  0%  104K 8h19m
 6250K .......... .......... .......... .......... ..........  0%  104K 8h19m
...

9. Wget Stáhněte si soubory chráněné heslem přes FTP a HTTP

Chcete-li stáhnout soubor z FTP serveru chráněného heslem, můžete použít možnosti --ftp-user=uživatelské jméno a --ftp-password=heslo, jak je uvedeno na obrázku.

wget --ftp-user=narad --ftp-password=password ftp://ftp.example.com/filename.tar.gz

Chcete-li stáhnout soubor ze serveru HTTP chráněného heslem, můžete použít možnosti --http-user=username a --http-password=password, jak je uvedeno na obrázku.

wget --http-user=narad --http-password=password http://http.example.com/filename.tar.gz

10. Wget Ignore Kontrola SSL certifikátu

Chcete-li ignorovat kontrolu certifikátu SSL při stahování souborů přes HTTPS, můžete použít možnost --no-check-certificate:

wget --no-check-certificate https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.1.1.tar.gz

--2021-12-10 06:21:21--  https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/linux-5.1.1.tar.gz
Resolving mirrors.edge.kernel.org (mirrors.edge.kernel.org)... 147.75.95.133, 2604:1380:3000:1500::1
Connecting to mirrors.edge.kernel.org (mirrors.edge.kernel.org)|147.75.95.133|:443... connected.
WARNING: The certificate of ‘mirrors.edge.kernel.org’ is not trusted.
WARNING: The certificate of ‘mirrors.edge.kernel.org’ is not yet activated.
The certificate has not yet been activated
HTTP request sent, awaiting response... 200 OK
Length: 164113671 (157M) [application/x-gzip]
Saving to: ‘linux-5.1.1.tar.gz’
...

11. Verze Wget a nápověda

Pomocí možností --version a --help můžete podle potřeby zobrazit verzi a nápovědu.

wget --version
wget --help

V tomto článku jsme probrali Linux příkazy wget s možnostmi pro každodenní administrativní úlohy. Do man wget, pokud se o tom chcete dozvědět více? Laskavě sdílejte prostřednictvím našeho pole komentářů, nebo pokud nám něco uniklo, dejte nám vědět.