इस हफ्ते, स्पॉटिफी ने "लापरवाह" ऑडियो फाइलों का परीक्षण शुरू किया। लेकिन "लापरवाह" ऑडियो क्या है, बिल्कुल, और डिजिटल ऑडियो संपीड़न कैसे काम करता है?

ऑडियो संपीड़न कैसे काम करता है?

ऑडियो संपीड़न में लक्ष्य एनालॉग ध्वनि को सटीक रूप से पुन: पेश करने के लिए आवश्यक बिट्स की संख्या को कम करना है। पहली प्रक्रिया जिसे हम देखेंगे उसे "हानिकारक" कहा जाता है। कमजोर संपीड़न एक-तरफा तकनीक है जो अंतरिक्ष को बचाने के लिए गैर-महत्वपूर्ण डेटा को फेंकता है। ये तकनीक एमपी 3, एएसी और डब्लूएमए फाइलों में समान रूप से प्रदर्शित होने वाली ऑडियो फ़ाइलों को संपीड़ित करने के लिए उपयोग की जाने वाली सबसे आम विधियां हैं। दो जगहें हैं जो हानिकारक कोडेक्स बिट्स को बचाने के लिए लगती हैं: बिट दर और मनोविज्ञान।

बिट दर

बिट दर ऑडियो के एक सेकंड को एन्कोड करने के लिए उपयोग की जाने वाली बिट्स की मात्रा को मापती है। उदाहरण के लिए, यदि हम कम गुणवत्ता वाले, 8 किलोबिट-प्रति-सेकंड (केबीपीएस) एन्कोडिंग का उपयोग करते हैं, तो हमारे एल्गोरिदम ऑडियो के प्रत्येक सेकेंड का वर्णन करने के लिए केवल 8 किलोबिट डेटा का उपयोग करने तक ही सीमित है। यह केवल कुछ सौ पिक्सेल के साथ एक पूर्ण रंगीन तस्वीर का वर्णन करने की कोशिश की तरह है। आपको व्यापक स्ट्रोक मिल सकते हैं, लेकिन कुल मिलाकर आप एक गंभीर रूप से अपमानित छवि को देख रहे होंगे। यदि हम उच्च गुणवत्ता वाले बिट रेट का उपयोग करते हैं जैसे कि 1 9 2 केबीपीएस, हमारे पास सुदृढ़ विवरण को कवर करने के लिए बहुत सारे कमरे हैं। हमारे फोटोग्राफिक उदाहरण पर लौटने के लिए, अब हमारे पास छवि में विभिन्न रोशनी, अंधेरे और रंगों का वर्णन करने के लिए पर्याप्त पिक्सल हैं। एक उच्च बिट दर अपने आप पर रिकॉर्डिंग की गुणवत्ता निर्धारित नहीं करती है, लेकिन कम बिट दर आउटपुट गुणवत्ता को गंभीर रूप से सीमित कर सकती है।

मनो

मनोविज्ञान इस बात का विज्ञान है कि मस्तिष्क कैसे ध्वनियों को समझता है। मनुष्यों को ध्वनि समझने के तरीके में ज्ञात quirks में हेरफेर करके, संपीड़न एल्गोरिदम चालाक रूप से उन विवरणों को हटा सकते हैं जो अधिकांश मानव कान याद नहीं करेंगे। लक्ष्य "गोल ऑफ" जानकारी है जो ट्रैक की अनुमानित ऑडियो गुणवत्ता को नहीं बदलेगा, समझदारी से केवल महत्वहीन जानकारी को हटा देगा।

उदाहरण के लिए, आपको पता हो सकता है कि मानव सुनवाई की सामान्य सीमा 20 हर्ट्ज और 20kHz के बीच है। जाहिर है, उस सीमा के बाहर लगता है हटाया जा सकता है। इसके अलावा, मानव सुनवाई की सबसे विस्तृत श्रृंखला 100 हर्ट्ज और 4kHz के बीच है, और उन आवृत्ति श्रेणियों के बाहर शांत आवाज़ को हटाने से रिकॉर्डिंग की गुणवत्ता को न्यूनतम नुकसान होता है। हम अत्यधिक विपरीत आवाजों के साथ एक समान चाल कर सकते हैं। यदि एक ही समय में एक बहुत जोरदार ध्वनि और एक बहुत ही शांत ध्वनि खेलती है, तो शांत ध्वनि को अपने आप की तुलना में समझना बहुत कठिन होता है। प्रक्रिया में बिट्स को बचाने, शांत ध्वनि को हटाने के लिए एनकोडर्स इस "ध्वनि मास्किंग" का लाभ उठाते हैं।

फ्रीक्वेंसी यह भी प्रभावित कर सकती है कि हम ध्वनि को कितनी अच्छी तरह समझते हैं। उदाहरण के लिए, एक सतत, कम आवृत्ति ड्रम बीट मेलोडिक उपकरणों के अधिक नाज़ुक, उच्च आवृत्ति हार्मोनिक्स को डूबने के लिए प्रेरित होती है। और ध्वनि मास्किंग विशेष रूप से 15kHz से अधिक प्रभावी है, जहां मानव सुनवाई आमतौर पर शुरू करने के लिए कम संवेदनशील होती है।

एमपी 3 जैसी सामान्य ऑडियो संपीड़न योजनाएं संभवतः मूल रिकॉर्डिंग के प्रति वफादार बने रहने का प्रयास करते समय संपीड़न संभावनाओं की पूरी श्रृंखला का लाभ उठाती हैं। बेशक, कुछ लोग इन आवृत्तियों को हटाने की तरह महसूस करते हैं रिकॉर्डिंग को गंभीर नुकसान होता है। यही कारण है कि लापरवाह संपीड़न मानकों मौजूद हैं।

"लापरवाही" ऑडियो क्या है?

लापरवाही ऑडियो संपीड़न का लक्ष्य मूल ऑडियो को छूने के दौरान फ़ाइल आकार को कम करना है। ये कोडेक्स पूरी तरह से परिवर्तनीय डेटा संपीड़न विधियों पर ध्यान केंद्रित करते हुए उपर्युक्त स्थायी संपीड़न तकनीकों का उपयोग नहीं करते हैं। अंतर्निहित जानकारी की अखंडता को संरक्षित करते समय वे अनावश्यक डेटा को हटाने के लिए ज़िप जैसे फ़ाइल-संपीड़न एल्गोरिदम से उधार हानि रहित संपीड़न तकनीकों का उपयोग करते हैं। दो लोकप्रिय लापरवाही ऑडियो कोडेक्स - एफएलएसी और ऐप्पल लॉसलेस (एएलएसी) - ज़िप संपीड़न के आधार पर दोनों उपयोग योजनाएं।

डेटा संपीड़न पर ध्यान केंद्रित करने का मतलब केवल उन विवरणों को संरक्षित करना है जो एमपी 3 और अन्य हानिकारक मानकों को समाप्त कर देंगे। यदि आपके पास तेज कान और उच्च गुणवत्ता वाले सुनने के सेटअप हैं, तो अंतर स्पष्ट हो सकता है।

लापरवाह संपीड़न न केवल सुनने के लिए अच्छा है, हालांकि: यह भी एक महान भंडारण उपकरण है। जैसे आप 72 डीपीआई जेपीजी एन्सल एडम की तस्वीरों की एकमात्र डिजिटल प्रतिलिपि नहीं बनना चाहते हैं, हम नहीं चाहते हैं कि केवल 128 केबीपीएस एमपी 3 "ब्लू के प्रकार" हों। एफएलएसी जैसे लापरवाही मानक हमें संभावित रूप से दूर फेंकने के बिना कुशलता से ऑडियो स्टोर करने की अनुमति देते हैं मूल्यवान डेटा। वे ऑडियो को आसान बनाने के लिए रीमेस्टरिंग और पुनर्वितरण भी करते हैं, क्योंकि असंगत स्वामी के साथ शुरू करने का मतलब उच्च गुणवत्ता वाला उत्पाद है।

निष्कर्ष: क्या आप अंतर बता सकते हैं?

लापरवाही ऑडियो प्रारूप बेहतर ध्वनि रिकॉर्डिंग के लिए अनुमति देते हैं। लेकिन कभी-कभी उच्च गुणवत्ता वाले एमपी 3 और लापरवाही फ़ाइल के बीच अंतर लगभग अपरिहार्य होते हैं, खासकर अनियंत्रित कान के लिए। यदि आप देखना चाहते हैं कि क्या आपके हेडफ़ोन (और कान) अंतर को बताने के लिए उत्सुक हैं, तो एनपीआर में एक मजेदार परीक्षण है; बस ध्यान रखें कि सस्ते हेडफ़ोन और लैपटॉप स्पीकर लापरवाह ऑडियो और एमपी 3 के बीच सूक्ष्म मतभेदों को पुन: उत्पन्न करने में सक्षम नहीं होंगे। कोडेक्स के अधिक गंभीर विश्लेषण के लिए, SoundExpert की एन्कोडर रेटिंग देखें।