Вэб хуудас болон файлуудыг татаж авахын тулд wget линукс командыг хэрхэн ашиглах талаар

Wget хэрэгсэл нь Линуксийн тушаалын мөрийг ашиглан веб хуудас, файлууд болон зургийг татаж авах боломжийг олгодог.

Та хэд хэдэн сайтууд дээр олон файлыг татаж авахын тулд нэг wget командыг ашиглан вэбсайтаас татаж авах эсвэл оролтын файлыг тохируулах боломжтой.

Гарын авлагын хуудас wget тушаалыг хэрэглэгч системээс гадагш гарсан байсан ч ашиглаж болно. Үүнийг хийхийн тулд та nohup тушаалыг ашиглах болно.

Wget хэрэгсэл холболт уналтанд орсон ч гэсэн татаж авч дахин оролдох болно.

Та wget ашиглан вэбсайтуудыг бүхэлд нь татан авч, вэбсайтыг офлайнаар харах боломжтой холбоосыг локал эх сурвалж руу чиглүүлэх боломжтой.

Wget-ийн боломжууд дараах байдалтай байна:

Wget ашиглан вэбсайтыг хэрхэн татах талаар

Энэ гарын авлагад би өөрийн блогоо яаж татаж авахыг үзүүлнэ.

wget www.everydaylinuxuser.com

Энэ нь mkdir тушаалыг ашиглан өөрийн машин дээр өөрийн хавтасыг үүсгээд дараа нь cd тушаал ашиглан фолдер руугаа шилжих нь зүйтэй юм.

Жишээлбэл:

mkdir everydaylinuxuser
cd everydaylinuxuser
wget www.everydaylinuxuser.com

Үр дүн нь index.html гэсэн ганц файл байна. Энэ файлын агуулга нь Google-ээс татагдсан хэвээр байгаа тул энэ файл нь нэлээн хэрэггүй бөгөөд зураг болон загварын хэв маяг Google-ээр явагдаж байна.

Дараах тушаалыг ашиглаж болох сайт болон бүх хуудсыг татаж авах:

wget -r www.everydaylinuxuser.com

Энэ нь дээд тал нь 5 түвшинд хүртэл рекурс татан авдаг.

5 түвшин гүн нь сайтаас бүх зүйлийг авахад хангалттай биш байж болох юм. Та -l шилжүүлэлтийг ашиглахдаа хүссэн түвшнийхээ тоог дараах байдлаар тохируулж болно:

wget -r -l10 www.everydaylinuxuser.com

Хэрэв та хязгааргүй рекордыг хүсэж байгаа бол дараах аргыг ашиглаж болно:

wget -r -l inf www.everydaylinuxuser.com

Та мөн inf нь 0-ийг сольж болно. Энэ нь ижил зүйл гэсэн үг.

Өөр нэг асуудал хэвээр байна. Та бүх хуудсуудыг дотооддоо олж авч болох боловч хуудсан дахь бүх холбоосууд нь тэдний анхны газар руу чиглэж байна. Тиймээс хуудаснууд дээрх холбоосуудын хооронд байршлыг тогтоох боломжгүй.

Та энэ хуудсыг тойрон гарах бүх холбоосуудыг доорх байдлаар байршуулсан холбоосыг хөрвүүлэх -k шилжүүлэгчийг ашиглан энэ асуудлыг тойрон гарч болно:

wget -r -k www.everydaylinuxuser.com

Хэрэв та вэбсайтын бүрэн толин тусгалыг авахыг хүсвэл дараахь шилжүүлэлтийг ердөө л хэрэглэж болох бөгөөд -r -k болон -l свичүүдийг хэрэглэх шаардлагагүй болдог.

wget -m www.everydaylinuxuser.com

Тиймээс хэрэв та өөрийн вэбсайттай бол энэ нэг энгийн тушаалыг ашиглан бүрэн нөөцлөлтийг хийж болно.

A wget тушаалыг ажиллуулаарай

Та wget-ыг файлын татаж авах үед төгсгөлийн командаар ажиллах боломжтой болно.

Дараах тушаалыг ашиглана уу:

wget -b www.everydaylinuxuser.com

Та мэдээж унтраадаг. Дараах тушаалыг ашиглахаар сайтын толин тусгалыг ар талд далдлах wget тушаалыг ажиллуулахын тулд дараах тушаалыг ажиллуулна:

wget -b -m www.everydaylinuxuser.com

Үүнийг дараах байдлаар хялбарчилж болно:

wget -bm www.everydaylinuxuser.com

Бүртгэл

Хэрэв та wget тушаалыг ар талд ажиллуулж байгаа бол дэлгэцэн дээр илгээдэг хэвийн зурвасуудыг харахгүй болно.

Та сүүлчийн тушаалыг ашиглан ямар ч үед явцыг шалгаж болох лог файл дээр илгээсэн эдгээр бүх мэдэгдлүүдийг авч болно.

Wget тушаалаас бүртгэлийн файл уруу мэдээллийг ажиллуулахдаа дараах тушаалыг ашиглана:

wget -o / path / руу / mylogfile www.everydaylinuxuser.com

Эсрэгээр нь, ямар ч бүртгэл хийлгүйгээр дэлгэц дээр гарах гарц байхгүй. Бүх гаралтуудыг орхихын тулд дараах тушаалыг ашиглана:

wget -q www.everydaylinuxuser.com

Олон сайтаас татаж авах

Та янз бүрийн сайтуудаас татаж авахын тулд оролтын файлыг тохируулж болно.

Өөрийн дуртай засварлагч эсвэл муурны тушаалаар файлаа нээгээд файлын мөр бүр дээр татаж авах сайтууд эсвэл холбоосуудыг жагсаахыг зүгээр л эхлүүлээрэй.

Файлыг хадгалаад дараа нь дараах wget тушаалыг ажиллуулна:

wget -i / path / руу / inputfile

Өөрийн вебсайтаа нөөцлөхөөс гадна галт тэрэгнээс уншиж татаж авахын тулд ямар нэгэн зүйл олж авахаас гадна вэбсайтыг бүхэлд нь татаж авахыг хүсэхгүй байх магадлалтай.

Та зурагтай нэг URL татаж авах, эсвэл zip файл, ISO файл эсвэл дүрс файл зэрэг татаж авах файлуудыг татаж авах магадлалтай байдаг.

Үүнийг санахын тулд та дараах оролтыг цаг хугацаа шаардсан гэж оруулаад оруулах хэрэгтэй болно:

Хэрэв та үндсэн URL үргэлж ижил байхыг мэдэж байгаа бол оролтын файлд дараахь зүйлийг зүгээр л зааж өгч болно:

Дараа нь wget тушаалын үндсэн хэсэг болгон суурь URL-ыг өгч болно:

wget -B http://www.myfileserver.com -i / path / to / inputfile

Сонголтуудыг дахин оролдож үзнэ үү

Хэрэв та оролтын файл дотор татаж авах файлын дараалал үүсгэж, шөнөжингөө өгвөл эхний файл дээр гацаж байгаа эсэхийг олохын тулд та шөнөжингөө доош унаж байгаа файлуудаа татаж авахын тулд компьютерээ шөнийн турш ажиллуулах болно. шөнөжин дахин оролдож байна.

Дараах шилжүүлэлтийг ашиглан дахин сэргээх тоо зааж өгч болно:

wget -t 10 -i / path / to / inputfile

Та дээрх тушаалыг -T шилжүүлэгчийн хамтаар ашиглахыг хүсэж болох бөгөөд ингэснээр завсарлах хугацааг дараах байдлаар тодорхойлж болно:

wget -t 10 -T 10 -i / path / to / inputfile

Дээрх комманд нь 10 удаа дахин оролдох ба файл бүр дэх холбоос бүрийн хувьд 10 секундын турш холбогдохыг оролдох болно.

Зөвхөн танай холболтод зориулж удаан глобал холболттой холболт дээр 4 гигабайт файлыг хэсэгчлэн татаж авахад нэлээн харамсалтай байна.

Та дараах тушаалыг ашиглан татаж авахаа зогсоосон газраа дахин wget ашиглана:

wget -c www.myfileserver.com/file1.zip

Хэрэв та серверт цохиж байгаа бол хост хэт их таалагдахгүй бөгөөд хүсэлтийг нь хааж эсвэл зүгээр л ална.

Та буцаж ирэх бүрийг хэр удаан хүлээлгэхийг тодорхойлсон хүлээх хугацаа зааж өгч болно:

wget -w 60 -i / path / to / inputfile

Дээрх команд нь татаж авах бүрт 60 секунд хүлээх болно. Хэрэв та нэг эх сурвалжаас олон файл татаж авах бол энэ нь ашигтай байдаг.

Зарим вэбсайтууд давтамжийг илрүүлж магадгүй бөгөөд таныг хаах болно. Та хүлээх хугацааг санамсаргүй байдлаар хийж болно. Ингэснээр та програмыг дараах байдлаар ашигладаггүй байна:

wget - random-wait -i / path / to / inputfile

Татаж авах хязгаарыг хамгаалах

Олон тооны интернетийн үйлчилгээ үзүүлэгчид танай өргөн зурвасын хэрэглээнд зориулсан татан авалтын хязгаарыг ашигладаг, ялангуяа хотоос гадуур амьдардаг.

Та татаж авах хязгаарыг бүү хатуу болгосноор квотоо нэмэхийг хүсч болно. Үүнийг дараах байдлаар хийж болно:

wget -q 100m -i / path / to / inputfile

-q тушаал ганц файлтай ажиллахгүй гэдгийг анхаарна уу.

Тэгэхээр 2 гигабайт хэмжээтэй файл татаж авах юм бол, -q 1000m файлыг татаж авахыг зогсоохгүй.

Квотыг зөвхөн сайтаас татаж авах эсвэл оролтын файл ашиглаж байх үед л хэрэглэнэ.

Аюулгүй байдлыг хангах

Зарим сайтууд таныг нэвтрэхийг хүссэн агуулга руу нэвтрэхийн тулд нэвтрэх шаардлагатай.

Та хэрэглэгчийн нэр, нууц үгийг тодорхойлохын тулд дараах холболтуудыг ашиглаж болно.

wget --user = yourusername --password = yourpassword

Хэрэв хэн нэгэн нь ps тушаалыг ажиллуулбал олон хэрэглэгчийн систем дээр анхаараарай. Тэдгээр хэрэглэгчийн нэр болон нууц үгээ харах боломжтой болно.

Бусад Татаж авах Тохиргоо

Анхдагчаар -r шилжүүлэгч нь агуулгааа рекурсив татаж аваад сангуудыг үүсгэх болно.

Та дараах бүх шилжүүлгийг ашиглан бүх файлуудыг нэг хавтас руу татаж авах боломжтой:

wget -nd -r

Үүний эсрэг зүйл бол дараах тушаалыг ашиглаж дууссан сангуудыг үүсгэхийг албадах явдал юм:

wget -x -r

Файлуудын тодорхой төрлийг хэрхэн татаж авах

Хэрэв та сайтаас рекурс татаж авахыг хүсч байгаа бол та зөвхөн mp3 файл эсвэл дүрс гэх мэт тодорхой файлын төрлийг татаж авахыг хүсэж байгаа бол дараахь синтаксыг ашиглаж болно:

wget -A "* .mp3" -r

Үүнийг буцаах нь зарим файлуудыг үл тоомсорлох явдал юм. Магадгүй та файлуудыг татаж авахыг хүсэхгүй байгаа байх. Энэ тохиолдолд та дараах синтаксийг ашиглана:

wget -R "* .exe" -r

Клигет

Клигет гэж нэрлэгдэх Firefox add-on байдаг. Та Firefox-г дараах байдлаар нэмж болно.

Https://addons.mozilla.org/en-US/firefox/addon/cliget/ хаягаар орж "Firefox дээр нэмэх" товчийг дарна уу.

Суулгах товчийг дарахад харагдана. Та Firefox-г дахин эхлүүлэх шаардлагатай болно.

Cliget ашиглахын тулд татаж авахыг хүссэн хуудас эсвэл файл руу очиж, зөв ​​дарна уу. Контекст цэс cliget гэж нэрлэгдэх бөгөөд "wget ​​рүү хуулж", "curl хүртэл хуулж" хийх боломжтой болно.

"Copy to wget" сонголтыг дарж терминалын цонхыг нээж, дараа нь зөв дарж, paste хийнэ. Зохих wget тушаал цонхноос хаагдах болно.

Үндсэндээ энэ тушаалыг өөрөө бичиж авдаг.

Хураангуй

Wget тушаал нь асар олон тооны сонголтууд болон сэлгэлтүүд юм.

Тиймээс дараах тушаалыг terminal цонх уруу бичээд дараах тушаалыг ажиллуулах хэрэгтэй:

хүн wget