पीडीएफ इमेज का उपयोग करते हुए उबंटू में पीडीएफ फाइल से एम्बेडेड छवियों को कैसे निकालें
जबकि हम पहले से ही जानते हैं कि उबंटू में मौजूदा पीडीएफ फाइलों को कैसे संपादित किया जाए, ऐसे समय होते हैं जब पीडीएफ फाइल में निहित सभी या कुछ छवियों का उपयोग करना आवश्यक होता है। मैन्युअल कॉपी-पेस्टिंग निश्चित रूप से एक विकल्प है, लेकिन यह समय बचाने वाला नहीं है, खासकर जब पीडीएफ फाइल में बड़ी संख्या में छवियां होती हैं।
एक टूल मौजूद है, जिसे पीडीएफ इमेज कहा जाता है, जो पीडीएफ फाइलों से छवि निष्कर्षण बनाता है। इस लेख में हम आसानी से समझने वाले उदाहरणों का उपयोग करके इस टूल पर चर्चा करेंगे। ध्यान दें कि लेख में उपयोग किए गए सभी उदाहरण टूल के संस्करण 0.24.5 का उपयोग करते हुए उबंटू 14.04 एलटीएस पर परीक्षण किए जाते हैं।
पीडीएफ इमेज क्या है?
जैसा कि पहले से ही चर्चा की गई है, PDFImages एक कमांड लाइन उपकरण है जिसका उपयोग आप पीडीएफ फाइल से छवियों को निकालने के लिए कर सकते हैं। टूल का मैन पेज कहता है कि यह इनपुट पीडीएफ फ़ाइल पढ़ता है, इसे स्कैन करता है, और पीडीएफ फाइल में मुठभेड़ की प्रत्येक छवि के लिए एक पोर्टेबल पिक्समैप (पीपीएम), पोर्टेबल पिक्समैप (पीबीएम), या जेपीईजी फ़ाइल बनाता है।
डाउनलोड करो और इंस्टॉल करो
यदि उपकरण आपके उबंटू बॉक्स पर पहले से इंस्टॉल नहीं है, तो आप निम्न आदेश का उपयोग करके इसे डाउनलोड और इंस्टॉल कर सकते हैं:
sudo apt-poppler-utils स्थापित करें
पीडीएफ इमेज के अलावा, पैकेज "पॉपप्लर-यूटिल" में पीडीएफ दस्तावेज़ों से जानकारी प्राप्त करने, उन्हें अन्य प्रारूपों में परिवर्तित करने, या उन्हें छेड़छाड़ करने के लिए कई अन्य कमांड लाइन सुविधाएं भी शामिल हैं।
प्रयोग
कमांड लाइन टूल पीडीएफ इमेज, अपने सबसे बुनियादी रूप में, दो तर्कों की आवश्यकता है: इनपुट पीडीएफ फ़ाइल और उस निर्देशिका का पथ जिसमें आप छवियों को सहेजने के लिए टूल चाहते हैं। उदाहरण के लिए, मेरे मामले में मैंने "christmas_story.pdf" नाम की पीडीएफ फ़ाइल से छवियों को निकालने का प्रयास किया और उन्हें "pdfimages" नामक निर्देशिका में सहेज लिया।
pdfimages /home/himanshu/Downloads/christmas_story.pdf / home / heanshu / डाउनलोड / pdfimages /
उपरोक्त आदेश ने निम्न निर्देशिका को लक्षित निर्देशिका में उत्पादित किया है:
एलएस / होम / हिमांशु / डाउनलोड / पीडीएफमेज / -000.ppm -001.ppm -002.ppm -003.ppm -004.ppm -005.ppm -006.ppm -007.ppm
जैसा कि आप उपरोक्त आउटपुट में देख सकते हैं, फ़ाइलों का नाम एक हाइफ़न (-) के साथ शुरू होता है जिसके बाद एक संख्या होती है। उन लोगों के लिए सोचें कि नाम हाइफ़न के साथ क्यों शुरू होता है, टूल आपको हाइफ़न से पहले किसी भी शब्द को उपसर्ग करने के लिए लचीलापन देता है ताकि आप आउटपुट छवियों के लिए कस्टम नाम बना सकें। आदेश चलाने के दौरान आप गंतव्य निर्देशिका के पथ पर उस विशेष शब्द को जोड़कर ऐसा कर सकते हैं।
उदाहरण के लिए, मैंने गंतव्य निर्देशिका के पथ पर "छवि" शब्द जोड़ा:
pdfimages /home/himanshu/Downloads/christmas_story.pdf / home / heanshu / डाउनलोड / pdfimages / image
और इस मामले में उत्पादित आउटपुट फाइलों का नाम निम्नलिखित है:
ls / home / heanshu / डाउनलोड / pdfimages / image-000.ppm image-001.ppm image-002.ppm image-003.ppm image-004.ppm image-005.ppm image-006.ppm image-007.ppm
यह उल्लेखनीय है कि टूल के मैन पेज के मुताबिक, पीडीएफ फाइल में प्रत्येक छवि के लिए दो छवियां बनाई जाती हैं, जिनमें से एक खाली है जबकि दूसरा उपयोग योग्य है। मेरे मामले में, अजीब क्रमांकित छवियां खाली थीं:
आगे बढ़ते हुए, आप आउटपुट छवि फ़ाइल प्रारूप को "पीपीएम" से "जेपीईजी" में भी बदल सकते हैं, जिसे आप -j
विकल्प का उपयोग करके कर सकते हैं। ध्यान रखें, हालांकि, इस विकल्प के साथ, डीसीटी प्रारूप में केवल छवियों को जेपीईजी फाइलों के रूप में सहेजा जाता है - सभी गैर-डीसीटी छवियों को सामान्य रूप से पीबीएम / पीपीएम प्रारूप में सहेजा जाता है।
आप यह भी निर्दिष्ट कर सकते हैं कि आप कौन से पेज स्कैन करना चाहते हैं। इस तरह आप केवल उन छवियों को आउटपुट में प्राप्त करेंगे जो इन पृष्ठों पर हैं। इस विकल्प को सक्षम करने के लिए, आपको क्रमशः प्रारंभ और समाप्ति पृष्ठों को निर्दिष्ट करने के लिए -f
विकल्प (पृष्ठ संख्या के बाद) और -l
(पृष्ठ संख्या के बाद) का उपयोग करना होगा।
उदाहरण के लिए, मैं चाहता था कि उपकरण केवल पीडीएफ फ़ाइल के पहले पृष्ठ पर मौजूद छवियों को निकालने के लिए, इसलिए मैंने निम्न आदेश का उपयोग किया:
pdfimages -f 1 -l 1 /home/himanshu/Downloads/christmas_story.pdf / home / heanshu / डाउनलोड / pdfimages /
और गंतव्य निर्देशिका में, केवल दो छवियां (रिक्त समेत चार में से कुल) का उत्पादन किया गया था:
एलएस / होम / हिमांशु / डाउनलोड / पीडीएफमेज / -000.ppm -001.ppm -002.ppm -003.ppm
निष्कर्ष
पीडीएफ इमेज निश्चित रूप से एक आसान उपकरण है यदि आपके काम में पीडीएफ फाइलों और उनके पास मौजूद छवियों से निपटना शामिल है, और जैसा कि आपने अब तक देखा होगा, सीखना आसान है और उपयोग करने में आसान है। टूल के बारे में अधिक जानने के लिए, अपने मैन पेज पर जाएं।