🧠 स्केल एआई डेटा लीक के अंदर: जब गूगल डॉक्स एक उल्लंघन बिंदु बन गया
एक साधारण सी शेयरिंग गलती ने Google, Meta और xAI के गोपनीय AI प्रोजेक्ट्स को कैसे उजागर कर दिया
🖊️ शुभ्रा • 26 जून 2025 • साइबर सुरक्षा और AI
क्या होगा अगर Google Bard और xAI के Project Xylophone जैसे AI मॉडल्स के पीछे के राज़ बस एक क्लिक की दूरी पर हों—कोई भी उन्हें देख या संपादित कर सके?
🔗 अंग्रेज़ी में पढ़ें
AI डेटा-लेबलिंग क्षेत्र की एक प्रमुख कंपनी, ScaleAI द्वारा डिजिटल सुरक्षा में की गई एक चौंकाने वाली चूक में ठीक यही हुआ। जून 2025 में, Google Docs के ज़रिए हज़ारों गोपनीय दस्तावेज़ सार्वजनिक रूप से सुलभ—और संपादन योग्य—पाए गए, जिससे Google, Meta और OpenAI जैसे शीर्ष क्लाइंट्स की संवेदनशील जानकारी, साथ ही मानव ठेकेदारों की निजी जानकारी भी उजागर हो गई।
यह कोई बेहद साधारण हैकर्स का काम नहीं था। यह एक बेहद साधारण सी चीज़ का नतीजा था: गलत तरीके से कॉन्फ़िगर किया गया दस्तावेज़ साझाकरण। और इसके परिणाम? बड़े—और दूरगामी।
🔍 Scale AI क्या है?
स्केल एआई सैन फ्रांसिस्को स्थित एक डेटा एनोटेशन और एआई इंफ्रास्ट्रक्चर कंपनी है जिसकी स्थापना 2016 में एलेक्ज़ेंडर वांग और लुसी गुओ ने की थी। यह उच्च-गुणवत्ता वाले लेबल वाले डेटा और मॉडल मूल्यांकन उपकरण प्रदान करती है जो उन्नत एआई सिस्टम को सशक्त बनाने में मदद करते हैं। इसके प्रमुख ग्राहकों में Google, Meta, OpenAI और यहाँ तक कि अमेरिकी रक्षा विभाग भी शामिल हैं। कंपनी "ह्यूमन-इन-द-लूप" दृष्टिकोण पर निर्भर करती है, जिसमें मशीन लर्निंग को मानव समीक्षकों के साथ मिश्रित किया जाता है - जिससे इसके डेटा प्रबंधन की सुरक्षा अत्यंत महत्वपूर्ण हो जाती है।
वास्तव में क्या हुआ?
📌 लीक की उत्पत्ति
स्केल एआई अपने ठेकेदारों के साथ वर्कफ़्लो और डेटा समीक्षाओं को प्रबंधित करने के लिए Google डॉक्स का उपयोग कर रहा था। दुर्भाग्य से, कई दस्तावेज़ "लिंक वाला कोई भी व्यक्ति देख/संपादित कर सकता है" सेटिंग का उपयोग करके साझा किए गए थे - बिना किसी एक्सेस प्रतिबंध के।
❗ इसका मतलब था कि लिंक पर आने वाला कोई भी व्यक्ति सामग्री को पढ़ सकता था - और यहाँ तक कि उसे बदल भी सकता था।
🧨 क्या उजागर हुआ?
प्रमुख ग्राहकों की आंतरिक फ़ाइलें
* Google Bard से संबंधित परीक्षण सामग्री
* Meta AI चैटबॉट्स के लॉग और मूल्यांकन
* xAI के "प्रोजेक्ट ज़ाइलोफ़ोन" पर आंतरिक नोट्स
* संकेत, फ़ीडबैक नोट्स, मॉडल मूल्यांकन
2. ठेकेदारों का व्यक्तिगत डेटा
* नाम और ईमेल पते
* वेतन दरें और कार्य गुणवत्ता स्कोर
* "निम्न-गुणवत्ता" या "उपयुक्त नहीं" जैसे प्रदर्शन चिह्न
यह उजागर डेटा केवल तकनीकी नहीं था—यह मानवीय दृष्टि से भी गंभीर था, और कुछ मामलों में, प्रतिष्ठा को नुकसान पहुँचाने वाला भी।
🧩 लीक का पता कैसे चला
24 जून, 2025 को, बिज़नेस इनसाइडर ने बताया कि कंपनी को सूचित करने के दो दिन बाद भी, Scale AI के कई दस्तावेज़ सार्वजनिक रूप से उपलब्ध थे।
कोई हैकिंग नहीं हुई—सिर्फ़ लिंक शेयरिंग में लापरवाही बरती गई।
🧯 तत्काल परिणाम
* Meta और OpenAI ने कथित तौर पर Scale AI के साथ अनुबंधों को रोक दिया या उनका पुनर्मूल्यांकन किया।
* सार्वजनिक संपादन पहुँच ने दस्तावेज़ों में छेड़छाड़ या तोड़फोड़ की चिंताएँ बढ़ा दीं।
* स्केल एआई ने सार्वजनिक लिंक अक्षम कर दिए और एक आंतरिक जाँच शुरू कर दी।
* इस घटना ने एआई पाइपलाइन में विक्रेता सुरक्षा को लेकर व्यापक बहस छेड़ दी।
📅 मुख्य समयरेखा
* 🗓️ 24 जून, 2025 - बिज़नेस इनसाइडर ने लीक की जानकारी प्रकाशित की
* 🛑 उसी दिन - स्केल एआई ने सार्वजनिक लिंक अक्षम कर दिए और आंतरिक ऑडिट शुरू किया
* ⏳ लीक हुए दस्तावेज़ कम से कम 48 घंटों तक लाइव और संपादन योग्य थे
🚨 यह लीक इतना गंभीर क्यों है
🔐 1. कॉर्पोरेट गोपनीयता भंग
आंतरिक एआई विकास दस्तावेज़—कुछ संपादन योग्य—उजागर हुए, जिससे आईपी चोरी और हेरफेर का जोखिम पैदा हुआ।
👥 2. व्यक्तिगत डेटा उल्लंघन
ठेकेदारों के नाम, ईमेल, प्रदर्शन स्कोर—संभवतः जीडीपीआर, सीसीपीए और अन्य गोपनीयता कानूनों का उल्लंघन करते हैं।
🎯 3. सोशल इंजीनियरिंग का खतरा
लीक ने हमलावरों को ये विकल्प दिए:
* असली नाम और भूमिकाएँ जिनका वे नकल कर सकते थे
* फ़िशिंग संदेशों का संदर्भ
* AI अनुसंधान एवं विकास पारिस्थितिकी तंत्र में संभावित प्रवेश बिंदु
🏢 4. विक्रेता विश्वास में कमी
प्रमुख ग्राहकों ने काम रोक दिया, जिससे महत्वपूर्ण AI आपूर्ति श्रृंखलाओं में तृतीय-पक्ष सुरक्षा मानकों पर संदेह पैदा हो गया।
⚠️ 5. खराब सुरक्षा स्वच्छता
यह एक रोके जा सकने वाला उल्लंघन था—जो क्लाउड-आधारित सहयोग उपकरणों में सबसे आम चूकों में से एक के कारण हुआ।
🗣️ "यह सिर्फ़ गोपनीयता की चूक नहीं थी—यह एक खाका है कि कैसे तृतीय-पक्ष की लापरवाही से AI आपूर्ति श्रृंखला को नुकसान पहुँचाया जा सकता है।"
इन्फोसेक विश्लेषक, जून 2025
🛡️ मिनी सुरक्षा चेकलिस्ट
❌ संवेदनशील जानकारी के लिए कभी भी "लिंक वाला कोई भी व्यक्ति" का प्रयोग न करें।
✅ आंतरिक या क्लाइंट दस्तावेज़ों के लिए केवल आमंत्रण-आधारित पहुँच का उपयोग करें।
✅ साझा किए गए लिंक और दस्तावेज़ों का नियमित ऑडिट करें।
✅ सुरक्षित साझाकरण प्रथाओं पर टीमों को प्रशिक्षित करें।
✅ लॉगिंग और समाप्ति नियंत्रण वाले एंटरप्राइज़ दस्तावेज़ टूल पर विचार करें।
💭 महत्वपूर्ण विचार
स्केल एआई गूगल डॉक्स डेटा लीक साबित करता है कि उन्नत एआई कंपनियाँ भी बुनियादी परिचालन चूक का शिकार हो सकती हैं। ऐसी दुनिया में जहाँ एआई राष्ट्रीय सुरक्षा से लेकर दैनिक जीवन तक, हर चीज़ को नया रूप दे रहा है, तृतीय-पक्ष डेटा अनुशासन वैकल्पिक नहीं है—यह महत्वपूर्ण है।
🗣️ चर्चा संकेत
💬 आपकी क्या राय है?
आपके विचार या इसी तरह के उदाहरण साझा करने के लिए आपका स्वागत है।
© 2025 शुभ्रा सफ़ी। सर्वाधिकार सुरक्षित।
इस सामग्री के किसी भी भाग का अनधिकृत उपयोग, पुनरुत्पादन या पुनर्वितरण निषिद्ध है।

Comments
Post a Comment