यह लियो लेविन द्वारा अतिथि पोस्ट है।

Google के शीर्ष स्पैम सेनानी, मैट कर्ट्स ने हाल ही में स्पैमर के साथ Google की लड़ाई की स्थिति के बारे में एक लंबी ब्लॉग प्रविष्टि पोस्ट की है।

पोस्ट में, कर्ट्स ने कहा कि, जबकि Google की अनुक्रमणिका में स्पैम पांच साल पहले आधा से भी कम था, हाल के महीनों में Google की अनुक्रमणिका में स्पैम बढ़ गया है और कुछ प्रश्नों के लिए, यह अधिक ध्यान देने योग्य बन गया है।

कर्ट्स के मुताबिक, यह परिवर्तन सिर्फ इस तथ्य के कारण नहीं है कि उच्च खोज इंजन रैंकिंग के लिए अपना रास्ता धोखा देने की कोशिश करने से पहले और अधिक स्पैमर हैं, लेकिन चूंकि Google के हालिया कैफीन अपडेट में सर्च इंजन पहले से कहीं अधिक सामग्री अनुक्रमणित करता है, स्पैम सहित।

हालांकि, उन्होंने इस उपहास के खिलाफ लड़ने के लिए Google की योजना की रूपरेखा तैयार की और इसे और अधिक गंभीर समस्या बनने से रोक दिया। विशेष रूप से, उन्होंने Google में तीन बदलावों की रूपरेखा दी है कि उन्हें उम्मीद है कि Google के परिणामों की गुणवत्ता में सुधार होगा और सभी के लिए खोज अनुभव में सुधार होगा।

पहला परिवर्तन, जिसे Google ने हाल ही में लॉन्च किया है, को स्पैमर पर ही लक्षित किया गया है और यह "एक नया डिज़ाइन-स्तरीय वर्गीकरण " है जो एक पृष्ठ पर स्पैममी सामग्री का पता लगाने का बेहतर काम करता है। इसमें पाठ में दोहराए गए शब्दों के साथ-साथ कुछ प्रकार की टिप्पणी स्पैम जैसी चीजें शामिल हैं।

दूसरा सुधार, जिसे वर्तमान में मूल्यांकन किया जा रहा है, उन साइटों पर लक्षित एक एल्गोरिदमिक परिवर्तन है जो अन्य पृष्ठों से सामग्री की प्रतिलिपि बनाते हैं, आमतौर पर अनुमति के बिना। ये साइटें अक्सर बहुत कम मूल सामग्री के साथ सामग्री के बड़े ब्लॉक की प्रतिलिपि बनाती हैं लेकिन वे कभी-कभी सामग्री को उत्पादित करने वाली साइटों से पहले, बहुत अच्छी तरह रैंक करते हैं।

हालांकि, यह तीसरा और अंतिम परिवर्तन है जिसने सबसे अधिक चर्चा की है। कर्ट्स के मुताबिक, Google तथाकथित "सामग्री खेतों" या ऐसी साइटों की रैंकिंग को कम करने के तरीकों की तलाश कर रहा है जो आमतौर पर बड़ी मात्रा में सामग्री का उत्पादन करते हैं, आमतौर पर संविदात्मक श्रम के माध्यम से जो अक्सर संदिग्ध गुणवत्ता के होते हैं। इसमें डिमांड मीडिया जैसी कंपनियां शामिल हैं, जो eHow, Livestrong के साथ-साथ अन्य साइटों को संचालित करती हैं।

कर्ट्स के अनुसार, Google ने इन सामग्रियों के खेतों के प्रभाव को कम करने के लिए 2010 में दो बदलाव किए लेकिन समझते हैं कि लोग भी अधिक मजबूत कार्रवाई करने के लिए कह रहे हैं। हालांकि, साइटें विवादास्पद रही हैं, भले ही उनके पास अक्सर निम्न गुणवत्ता वाली सामग्री हो, लेकिन उन्हें पारंपरिक वेब स्पैम नहीं माना जाता है।

यह देखते हुए कि डिमांड मीडिया के पास सिर्फ एक आईपीओ था जिसकी कीमत 1.5 अरब डॉलर थी, यह देखना आसान है कि कंपनी अपनी सामग्री "खेती" के माध्यम से कितनी बढ़ती जा सकती है। क्या देखा जाना बाकी है कि यदि Google परिणामों में अपने प्रसार को बाधित कर पाएगा, खासतौर पर लंबी पूंछ की खोजों के लिए यह लक्ष्य रखता है।

हालांकि यह स्पष्ट है कि, उद्योग में एक दशक के बाद भी, Google अभी भी अपने सूचकांक में सामग्री गुणवत्ता के मुद्दों के साथ कुश्ती कर रहा है और स्पैमर, स्क्रैपर्स और सामग्री किसानों को खाड़ी में रखने के लिए संघर्ष कर रहा है।

भले ही उसने पिछले दशक में निश्चित रूप से प्रगति की है, फिर भी स्पष्ट रूप से काम करने का एक बड़ा सौदा है और Google इसे करने के बारे में सोच रहा है।

हम जो कुछ भी कर सकते हैं वह वापस बैठना है, देखें कि क्या होता है और उम्मीद है कि वैध, उच्च-गुणवत्ता वाली साइटें अनजाने में मिश्रण में पकड़ी नहीं जाती हैं।