Is Aardvark the End of Human Security Researchers? OpenAI’s GPT-5 Agent Just Changed Everything
क्या Aardvark मानव सुरक्षा शोधकर्ताओं का अंत है? OpenAI का GPT-5 एजेंट ने अब सब कुछ बदल दिया है

तो OpenAI ने अभी Aardvark लॉन्च कर दिया है—GPT-5 से चलने वाला एक AI जो कोड में सुराग ढूँढना नहीं, बल्कि मानव शोधकर्ता की तरह सोचता है। यह आपकी दादी का स्टैटिक एनालाइज़र नहीं है; यह पूरी रिपोजिटरी मैप करता है, खतरे के मॉडल बनाता है, और फ्लैग लगाने से पहले सैंडबॉक्स में एक्सप्लॉइट को मान्य करता है। झूठी चेतावनियों में भारी कमी आ सकती है।
और ऐसा कर पाना: यह Codex का उपयोग करके कोड का समाधान करता है, फिर सुनिश्चित करता है कि समाधान से कुछ और न टूटे। साथ ही, इसने पहले ही ओपन-सोर्स प्रोजेक्ट्स में असली कमज़ोरियाँ पाई हैं—कुछ को CVE मिला है। अगर यह पैमाने में आ गया, तो हम शायद आखिरकार 'बाएँ सुरक्षा' स्थानांतरित कर पाएँगे बिना शोर में डूबे।
ओपन-सोर्स के लिए मुफ्त AI सुरक्षा? मैं ले लूंगा। हम सीमित संसाधनों और कम सम्मान वाले हैं। अगर Aardvark एक असली CVE पकड़ सकता है और एक ठीक ठाक पैच सुझा सकता है, तो मैं LLM को चूम लूंगा। लेकिन मैं अभी भी डरा हुआ हूँ। क्या होगा अगर यह नियंत्रण से बाहर हो जाए और मेरी रिपोजिटरी में स्वचालित बैकडोर कमिट कर दे?
बिना मानव समीक्षा के स्वतः कमिट एक बड़ा 'नहीं' है। बिल्कुल रोक। यह लोकतंत्र नहीं है; आपकी रिपोजिटरी प्रायोगिक AI एजेंट के खेलने के लिए मैदान नहीं है। इसे सुझाव देने दो। कमिट नहीं। मर्ज नहीं।
OpenAI द्वारा FOSS के लिए 'निःशुल्क' स्कैनिंग प्रदान करना उदार है, लेकिन हमें पारदर्शिता की आवश्यकता है। AI के निष्कर्षों की जांच कौन करता है? क्या होगा अगर यह किसी सुविधा को कमजोरी के रूप में गलत नाम दे दे? जिम्मेदारी की श्रृंखला तेजी से अस्पष्ट हो जाती है। और याद रखें—ये उपकरण उतने ही अच्छे हैं जितना डेटा जिस पर वे प्रशिक्षित हैं।
तो अब हम सुराग खोजने का काम उस AI को सौंप रहे हैं जिसे सिर्फ वही पता है जो OpenAI के प्रशिक्षण डेटा ने सिखाया है। मुझे इस 'गलत-नकारात्मक' एक्सप्लॉइट को डिबग करने का इंतजार है क्योंकि मॉडल को उस दुर्लभ कर्नेल मॉड्यूल पर प्रशिक्षित नहीं किया गया था। चरम दक्षता।
AI के 'मानव की तरह सोचने' का रूपक आकर्षक है लेकिन खतरनाक है। हम एक सांख्यिकीय कोड को मानव बनाने का जोखिम ले रहे हैं। Aardvark त्रुटियाँ कम कर सकता है, लेकिन न्याय के प्रति उसकी कोई परवाह नहीं होगी। यह एक उपकरण है, एक सहयोगी नहीं।
मैं हमेशा 92% समस्या पकड़ने को शून्य मानवीय समीक्षा से तरजीह दूंगा। इससे शायद हम तीन बजे सुरक्षा रिपोर्ट की जाँच करने के बजाय विशेषताएँ बनाने पर ध्यान केंद्रित कर पाएँ।
हम प्राइवेट बीटा में दाखिला ले रहे हैं। अगर यह हमारे ऐप सुरक्षा समीक्षा समय में आधा कमी करता है, तो यह सोने के बराबर कीमती होगा।