सेमल्ट एक्सपर्ट बताता है कि वेब डेटा स्क्रेपिंग को कोर्ट के फैसले से कैसे वैध बनाया गया

हालांकि साइट के मालिकों की स्पष्ट अनुमति के बिना वेबसाइटों से डेटा खंगालना अवैध हो सकता है, एक जज ने हाल ही में कुछ विशेष परिस्थितियों में अन्यथा फैसला सुनाया है। हाईक लैब्स ने हाल ही में लिंक्डइन पेजों से डेटा निकालने से रोकने के लिए लिंक्डइन के खिलाफ मुकदमा दायर किया।

यह ज्यादातर लोगों के लिए एक अशिष्ट आघात के रूप में आया था कि लिंक्डइन को स्टार्टअप को अपने वेब पृष्ठों पर मुफ्त पहुंच देने के लिए कहा गया था। HiQ ने अपने एल्गोरिदम का उपयोग यह पता लगाने के लिए किया कि लिंक्डइन उपयोगकर्ता अपने सार्वजनिक प्रोफ़ाइल में किए गए परिवर्तनों के आधार पर नौकरी की तलाश कर रहा है।

एल्गोरिदम लिंक्डइन वेब पृष्ठों से निकाले गए डेटा पर चलता है। जैसा कि अपेक्षित था, लिंक्डइन को यह पसंद नहीं आया और hiQ को आगे डेटा निष्कर्षण से रोकने के लिए काउंटरमेसर लगाए गए। तकनीकी बाधाओं के अलावा, जोरदार शब्दों में कानूनी चेतावनी भी जारी की गई थी।

स्टार्टअप के पास कानूनी रूप से इस मुद्दे को उठाने के अलावा कोई विकल्प नहीं था। hiQ को कानूनी निवारण की तलाश थी। कंपनी चाहती थी कि लिंक्डइन ने अपने तकनीकी अवरोधों को दूर करने का आदेश दिया। hiQ भी लिंक्डइन पर अपनी डेटा निष्कर्षण प्रक्रिया को वैध बनाना चाहता था।

सौभाग्य से स्टार्टअप के लिए, यह वही मिला जो वह चाहता था। हुकूमत हाईक के पक्ष में थी। लिंक्डइन को आदेश दिया गया था कि वह अपने (लिंक्डइन) वेब पेजों को खंगालने से हाईक में बाधा डालने वाले सभी काउंटरमैनों को हटा दे और हाईक फ्री हैंड दे क्योंकि एक्ट पूरी तरह से कानूनी है। जज ने इस बात पर अपना फैसला सुनाया कि हाईक वह कौन सा डेटा खंगालना चाहती है, जो पब्लिक व्यू के लिए दिखाया गया है।

न्यायाधीश ने न केवल प्रतिवादी को हाईक के खिलाफ लगाए गए सभी निवारक तंत्र को हटाने का आदेश दिया, बल्कि उन्होंने यह भी आदेश दिया कि प्रतिवादी को भविष्य में इस तरह के कृत्यों से बचना चाहिए।

खुले वेब डेटा को बढ़ावा देना

जबकि सत्तारूढ़ अभी भी एक अस्थायी निषेधाज्ञा है, यह सुनकर हर्ष होता है कि कानून खुले वेब डेटा और इंटरनेट पर सूचना तक मुफ्त पहुंच का समर्थन करता है क्योंकि यह निर्णय इसकी पुष्टि करता है। भले ही अंतिम निर्णय प्रतिवादी के पक्ष में हो जाए, लेकिन यह तथ्य पहले ही स्थापित हो चुका है।

न्यायाधीश ने लगभग सभी लिंक्डइन के तर्कों को बंद करके इस नीति को बढ़ावा दिया। जबकि लिंक्डइन ने यह स्थापित करने की कोशिश की कि वादी अपनी गोपनीयता भंग कर रहा था, न्यायाधीश ने इस तथ्य के साथ काउंटर किया कि प्रतिवादी भी डेटा बेच रहा है।

जब तर्क में पानी नहीं था, तो प्रतिवादी ने यह भी कहा कि कंप्यूटर धोखाधड़ी और दुर्व्यवहार अधिनियम (CFAA) के उल्लंघन में hiQ का कृत्य था क्योंकि स्टार्टअप ने अवैध रूप से डेटा की कटाई करने के लिए अपने सर्वर तक पहुँचा था। फिर, तर्क को पंचर कर दिया गया। यह इस आधार पर अस्वीकार कर दिया गया कि hiQ केवल सार्वजनिक, गैर-संरक्षित पृष्ठों पर सामग्री को स्क्रैप कर रहा था।

न्यायाधीश ने मामले को व्यवसाय के घंटों के दौरान खुले स्टोर में चलने के रूप में बदल दिया। ऐसे व्यक्ति को अतिचार नहीं कहा जा सकता। तो, hiQ अतिचार नहीं था। दिलचस्प बात यह है कि जज यह समझाने के लिए आगे बढ़े कि उनका फैसला जनता के हित में क्यों है।

संक्षेप में, अदालत ने स्वीकार किया कि डेटा को क्रॉल, निकालने और विश्लेषण करने की अनुमति देना सार्वजनिक हित में है। इसलिए, सूचना के मुक्त प्रवाह में बाधाओं को दूर करने के लिए प्रोत्साहित करना एक हानिकारक नीति होगी।

आपको शासन से क्या सीखना चाहिए

जबकि आपके पास लिंक्डइन से सीधे डेटा निकालने के कारण नहीं हो सकते हैं, आपको सत्तारूढ़ से सीखना चाहिए। सभी वेबसाइटों के robots.txt फ़ाइल को पढ़ने और सम्मान करने से सुरक्षित खेलना बेहतर है। याद रखें, सत्तारूढ़ अभी भी एक अस्थायी निषेधाज्ञा है। यह अंततः लिंक्डइन के पक्ष में जा सकता है।

जबकि सत्तारूढ़ आपको सीधे प्रभावित नहीं कर सकता है, यह खुशी की बात है कि एक संघीय अदालत जनता के लिए वेब को खुले रखने की नीति को लागू करती है। तो, जानकारी उपलब्ध होनी चाहिए और उन लोगों के लिए सुलभ होनी चाहिए जो इसका अच्छा उपयोग खोज और कर सकते हैं।

वेब डेटा सभी के लिए अत्यंत उपयोगी है, विशेष रूप से मीडिया विश्लेषकों, डेवलपर्स, डेटा वैज्ञानिकों और कुछ अन्य पेशेवरों के लिए। जैसे, सत्तारूढ़ एक स्वागत योग्य विकास है।