技(jì )術文(wén)檔 2021年11月19日
當您存檔某些資源或将它們用(yòng)于教育目的時,将網頁(yè)另存為(wèi) PDF 會派上用(yòng)場。
但是,如何在 Linux 中(zhōng)将網頁(yè)轉換為(wèi) PDF?
您可(kě)以選擇使用(yòng)每個 Linux 發行版上的 Web 浏覽器 (GUI) 來輕松解決問題,也可(kě)以使用(yòng)終端将網頁(yè)轉換為(wèi) PDF 文(wén)件。
在這裏,我将提到兩種幫助您完成工(gōng)作(zuò)的方法。
即使我在本教程中(zhōng)使用(yòng) Mozilla Firefox,您也可(kě)以使用(yòng)任何适用(yòng)于 Linux的最佳浏覽器執行相同的操作(zuò)。
1. 加載您要轉換的網頁(yè)。
2. 前往浏覽器菜單找到“打印”選項或使用(yòng)鍵盤快捷鍵“ Ctrl+P”。
3. 默認情況下,它應該讓您将其另存為(wèi) PDF。您需要點擊“保存”,然後選擇目的地并保存網頁(yè)。
這種簡單方法的一個主要問題是它包含頁(yè)面上的所有(yǒu)元素。這可(kě)能(néng)包括注釋、頁(yè)腳等。您可(kě)以使用(yòng) PDF 編輯器删除部分(fēn)内容,但這是一項額外任務(wù)。
更好的選擇是使用(yòng)浏覽器擴展程序,例如Print Friendly。它允許您在下載 PDF 之前編輯和删除部分(fēn)網頁(yè)。
您可(kě)能(néng)已經知道可(kě)以在 Linux 終端中(zhōng)浏覽互聯網,甚至可(kě)以使用(yòng)命令行下載文(wén)件。考慮到您可(kě)以在終端中(zhōng)執行更多(duō)操作(zuò),包括将網頁(yè)下載為(wèi) PDF,這并不奇怪。
一個漂亮的開源命令行工(gōng)具(jù)wkhtmltopdf和wkhtmltoimage可(kě)以幫助您将任何 HTML 網頁(yè)轉換為(wèi) PDF 或圖像文(wén)件。
它利用(yòng) Qt WebKit 渲染引擎來完成任務(wù)。您可(kě)以浏覽其GitHub 頁(yè)面以獲取更多(duō)信息。
您應該能(néng)夠從 Linux 發行版的默認存儲庫安(ān)裝(zhuāng)它。對于基于 Ubuntu 的發行版,您可(kě)以輸入以下命令:
sudo apt install wkhtmltopdf
無論您要将其轉換為(wèi) PDF 還是圖像文(wén)件,使用(yòng)起來都非常簡單:
要将網頁(yè)轉換為(wèi) PDF,請輸入:
wkhtmltopdf URL/domain filename.pdf
例如,它的外觀如下:
wkhtmltopdf linuxmint.com mint.pdf
您可(kě)以選擇使用(yòng)完整的 URL 作(zuò)為(wèi)“ https://linuxmint.com ”或使用(yòng)如上例所示的域名(míng)。
生成的文(wén)件默認保存在主目錄中(zhōng)。
轉換網頁(yè)時,您還會獲得一些令人興奮的選項。
舉例來說,你可(kě)以申請一個灰度過濾PDF文(wén)件,使頁(yè)面的多(duō)個副本在同一個文(wén)件,并排除圖像轉換過程中(zhōng)。
灰度過濾器可(kě)能(néng)不适用(yòng)于每個網頁(yè),但您可(kě)以使用(yòng)以下命令嘗試:
wkhtmltopdf -g google.com googlepage.pdf
要在同一個 PDF 文(wén)件中(zhōng)制作(zuò)多(duō)個頁(yè)面副本,命令是:
wkhtmltopdf --copies 2 linuxmint.com mint.pdf
而且,如果您想從網頁(yè)中(zhōng)排除圖像,隻需鍵入:
wkhtmltopdf --no-images linuxmint.com mint.pdf
此外,如果要将網頁(yè)轉換為(wèi)圖像,則命令如下所示:
wkhtmltoimage linuxmint.com mint.png
請注意,與使用(yòng)浏覽器的 GUI 方法不同,通過終端使用(yòng)這些工(gōng)具(jù)有(yǒu)其局限性。它似乎沒有(yǒu)成功轉換使用(yòng)任何 <iframe> 代碼片段的網頁(yè)。
關鍵詞: