Google ने अपने AI प्लेटफॉर्म में बड़ा अपडेट करते हुए नया Gemini 3 सीरीज़ मॉडल पेश कर दिया है। कंपनी का कहना है कि यह अब तक का सबसे ज़्यादा भरोसेमंद और समझदार AI सिस्टम है। फिलहाल यह फीचर सभी यूज़र्स के लिए Gemini ऐप में उपलब्ध कराया जा रहा है और इसे सर्च सब्सक्रिप्शन में भी जोड़ा गया है।
कंपनी के अनुसार, नया Gemini 3 Pro मॉडल पहले की तुलना में तेज़, ज्यादा सटीक और सीधे जवाब देता है। Google DeepMind की सीनियर डायरेक्टर Tulsee Doshi का कहना है कि यह मॉडल इंटरनेट सर्च का अनुभव पूरी तरह बदल देगा और जानकारी को यूज़र्स के लिए और आसान बनाएगा।
क्या है खास Gemini 3 Pro में?
नए मॉडल की सबसे बड़ी खासियत यह है कि यह एक ही बार में टेक्स्ट, फोटो और ऑडियो समझने की क्षमता रखता है।
यानी यूज़र चाहे रेसिपी की फोटो अपलोड करें या कई वीडियो क्लिप दें, मॉडल उन्हें एक संगठित और समझने लायक फ़ॉर्मेट में बदल सकता है।
उदाहरण के तौर पर—
- किसी डिश की फोटो को पूरा रेसिपी फॉर्मेट में बदल सकता है
- कई लेक्चर वीडियो देखकर इंटरएक्टिव फ़्लैश कार्ड तैयार कर सकता है
कंपनी का कहना है कि यह मॉडल सिर्फ जवाब देने के लिए नहीं, बल्कि पूरे कंटेंट को बेहतर ढंग से व्यवस्थित करने का काम भी करेगा।
कहां-कहां मिलेगा नया मॉडल?
Google ने बताया कि Gemini 3 Pro का असर कई प्रोडक्ट्स में दिखने लगा है।
- Gemini ऐप के अंदर Canvas वर्कस्पेस में यूज़र्स इससे ज्यादा एडवांस प्रोग्राम बना सकेंगे।
- Gemini Labs में चल रहे नए इंटरफेस टेस्ट में यह मैगज़ीन-स्टाइल लेआउट और डायनामिक UI बनाने में मदद करेगा।
- गूगल सर्च के AI Mode में नतीजे अब तस्वीरों, टेबल और ग्रिड जैसे विज़ुअल तरीके से दिखाई देंगे।
कंपनी ने अपनी “क्वेरी फैन-आउट” तकनीक को भी अपग्रेड किया है, जिसके जरिए AI सवालों को छोटे हिस्सों में बांटकर ज्यादा गहराई से जानकारी ढूंढ सकेगा।
क्या बदलेगा ChatGPT जैसा अनुभव?
The Verge की रिपोर्ट के मुताबिक, Google ने दावा किया है कि Gemini 3 Pro, ChatGPT की तरह यूज़र की खुशामद नहीं करेगा।
कंपनी का कहना है कि मॉडल के जवाब सीधे, साफ और ज्यादा समझदार होंगे। यानी यह यूज़र को वही जानकारी देगा जो जरूरी है, न कि वो जो वे सुनना चाहते हैं।
कैसे करेगा मदद?
IT हाउस के अनुसार, Gemini 3 Pro की नई एजेंट-लेवल क्षमताएं भी काफी मजबूत हैं।
इसकी मदद से यूज़र—
- ईमेल व्यवस्थित कर सकते हैं
- ट्रिप सर्च कर सकते हैं
- टिकट या होटल बुकिंग जैसे काम AI से करवा सकते हैं
Google ने बताया कि यह फीचर Gemini ऐप में टेस्टिंग मोड में उपलब्ध है और आने वाले समय में इसे और बढ़ाया जाएगा।
हू यानपिंग ई-रैम्बलर के अनुसार:
[जेमिनी 3 ने 12 सिग्नल जारी किए]
— संशयवाद का खंडन: क्या एक वृद्धिशील प्रतिमान AGI तक पहुँच सकता है?
जबकि लेकुन यांग, रिचर्ड सटन और अन्य लोगों ने दावा किया कि वर्तमान तकनीकी दिशाएँ एक मृत अंत थीं, और कई लोगों का मानना था कि प्रतिमान की दक्षता स्थिर हो गई थी, जेमिनी 3 ने बुद्धिमत्ता में एक महत्वपूर्ण छलांग के साथ संशयवादियों को चुप करा दिया।
हर कोई जानता था कि Google कोई बड़ी धूम नहीं मचाएगा, लेकिन इस बार रिलीज़ विशेष रूप से महत्वपूर्ण थी: ARC-AGI-2, ह्यूमैनिटीज़ लास्ट एग्जाम और स्क्रीनस्पॉट-प्रो जैसे नए बेंचमार्क परीक्षणों में इसके स्कोर GPT-5.1 से कई गुना अधिक हैं, जो OpenAI के वृद्धिशील सुधारों से कहीं अधिक है, जिससे यह आभास होता है कि Google ने समय से पहले GPT-6 जारी कर दिया है। इसने AIME 2025 में 100% का पूर्ण स्कोर भी हासिल किया।
परीक्षण और चर्चा के दौरान, जेमिनी 3 द्वारा जारी 12 सिग्नल निकाले गए:
1. कोड, दृश्य समझ, गणित, बुद्धिमान एजेंट और उपकरण उपयोग क्षमताओं का एक नया मूल बनाते हैं। बुद्धिमत्ता का स्तर प्रयोग करने योग्य वितरण की ओर बढ़ रहा है बजाय उस पीढ़ी के जिसने अभी तक लूप को बंद नहीं किया है, विशेष रूप से यह सिद्धांत कि यदि कोड सामान्य है, तो बुद्धिमत्ता भी सामान्य होगी;
2. AIME 2025 (अमेरिकी गणित आमंत्रण प्रतियोगिता) कुछ हद तक सामान्य बेंचमार्क है, लेकिन परीक्षा में पूर्ण स्कोर को AGI के पहले पूर्वावलोकन के रूप में समझा जा सकता है। AGI आया है या नहीं यह इस बात पर निर्भर करता है कि AGI को कैसे परिभाषित किया जाता है। मेरा हमेशा से मानना रहा है कि AGI समय का एक बिंदु या एक पैमाना नहीं है। AGI कई पहलुओं से और अनगिनत बार आता है। ज्ञान से तर्क तक, प्रश्नोत्तर से धारणा और कार्रवाई तक, AGI से ASI तक, परीक्षण संगठन और उद्योग लगातार रोडमैप को आगे बढ़ा रहे हैं, लेकिन अगर रोडमैप मानक को
बढ़ाता रहता है, तो इसका मतलब है कि AGI तक पहुंचना हमेशा मुश्किल होगा।
4. चिप्स, ऑपरेटिंग सिस्टम, ब्राउज़र, क्लाउड प्लेटफ़ॉर्म, बड़े मॉडल, इंटेलिजेंट एजेंट, सॉफ़्टवेयर, ऐप्स, डेवलपमेंट इकोसिस्टम और करोड़ों उपयोगकर्ताओं को शामिल करने वाली एक पूर्ण-स्टैक, पूर्ण-पारिस्थितिकी तंत्र क्षमता न केवल प्रतिस्पर्धा को लाभ पहुँचाती है, बल्कि उच्च-स्तरीय बुद्धिमत्ता के निर्माण को भी सुगम बनाती है।
5. ARC-AGI-2 और ह्यूमैनिटीज़ लास्ट एग्जाम जैसे अधिक चुनौतीपूर्ण नवोन्मेषी बेंचमार्क में जेमिनी 3 के उत्कृष्ट प्रदर्शन ने उद्योग के विश्वास और आशा को काफ़ी बढ़ा दिया है। स्केलिंग नियम न केवल प्रभावी बना हुआ है, बल्कि नेटवर्क प्रभाव, स्केल सिंगुलैरिटी और समग्र इष्टतमता जैसे पारिस्थितिकी तंत्र सिद्धांत भी प्रभावी हैं। स्केलिंग नियम की प्रभावशीलता में कोई उल्लेखनीय कमी नहीं आई है; बल्कि, इसकी क्षमता अभी-अभी उजागर होने लगी है। पर्याप्त कम लागत वाली कंप्यूटिंग शक्ति का अभाव, अक्षय उच्च-गुणवत्ता वाले प्रशिक्षण डेटा की कमी, और शक्ति संबंधी समस्याओं से होने वाली परेशानियाँ, कम से कम आंशिक रूप से, बुद्धिमत्ता प्रतिमान का दोष नहीं हैं, बल्कि बड़े मॉडल निर्माताओं के सीमित संसाधनों का दोष हैं।
6. सुपर प्लेटफ़ॉर्म और सुपर इंटेलिजेंस का संयोजन मज़बूत इंटेलिजेंस के निर्माण के लिए फ़ायदेमंद है, लेकिन यह पारिस्थितिकी तंत्र के ध्रुवीकरण और निर्भरता को रोकने में मददगार नहीं है। अग्रणी एआई कंपनियों की विकास विशेषताएँ—जैसे कि मज़बूत का और मज़बूत होना, विजेता का सब कुछ ले लेना, साइफन प्रभाव और पारिस्थितिकी तंत्र में असंतुलन—तेज़ी से स्पष्ट होते जा रहे हैं। ट्रांसफ़ॉर्मर के साथ गूगल की विजयी वापसी का मतलब है कि ओपनएआई-माइक्रोफ़ॉस्ट गठबंधन (सुपर इंटेलिजेंस + सुपर प्लेटफ़ॉर्म) को एक और प्रतियोगी मिल गया है। हालाँकि, गूगल एआई ध्रुवीकरण की प्रवृत्ति का हिस्सा बना हुआ है, और सुपर इंटेलिजेंस और सुपर प्लेटफ़ॉर्म स्वाभाविक रूप से गूगल में एकीकृत हैं।
7. यदि जेमिनी संस्करण 2 और 2.5 ने केवल GPT को प्रभावित किया, तो जेमिनी 3 दर्शाता है कि गूगल की पारिस्थितिकी तंत्र की मज़बूती ओपनएआई की स्थिति को हिला रही है। ओपनएआई का असली प्रतिद्वंद्वी एथ्रोपिक नहीं है; ओपनएआई के वित्तपोषण, मूल्यांकन और आईपीओ से जुड़ी आगे की प्रक्रिया अनिवार्य रूप से अशांत और अप्रत्याशित होगी। यह गति कई तकनीकी और उत्पाद नोड्स, जैसे नेटिव मल्टीमॉडल और वीईओ, में पहले ही उभरने लगी है। हालाँकि, डीप रिसर्च में जेमिनी 3 प्रो और GPT-5.1 की तुलना करने पर, GPT-5.1 स्पष्ट रूप से अपना बेहतर प्रदर्शन दिखाता है। मॉडलों के बीच असली प्रतिस्पर्धा नियमित प्रश्नोत्तर सत्रों में नहीं, बल्कि डीप थिंक और डीप रिसर्च जैसे “गहन” क्षेत्रों में है, जहाँ वास्तविक प्रदर्शन की तुलना केवल $200 के आसपास के खातों का उपयोग करके की जा सकती है, $20 के नहीं। फिर भी, जेमिनी 3 अभी भी ओपनएआई पर भारी दबाव डालेगा, और GPT-5.5 और GPT-6 संभवतः उनके विकास को और तेज़ कर देंगे।
8. ऑल्टमैन का दावा है कि GPT-6, GPT-5 से काफ़ी बेहतर प्रदर्शन करेगा, खासकर मेमोरी के मामले में; हालाँकि, जेमिनी 3 एक बुनियादी उद्योग सहमति की पुष्टि करता है: इंटेलिजेंस में सुधार के लिए एक यथार्थवादी और उच्च-ROI दृष्टिकोण एजेंटों, उपकरणों और कोड के बीच पारिस्थितिकी तंत्र सहयोग के माध्यम से है। मॉडल को या तो एजेंटों और उपकरणों की क्षमताओं को आंतरिक बनाना होगा या उनके लिए बेहतर समर्थन प्रदान करना होगा; केवल बेहतर आंतरिककरण ही बेहतर समर्थन की ओर ले जाता है।
9. जेमिनी 3 मुख्य रूप से एक क्रमिक प्रतिमान परिवर्तन का प्रतिनिधित्व करता है, लेकिन इसमें महत्वपूर्ण क्षमता वृद्धि भी शामिल है; अन्यथा, यह कई बेंचमार्क में इतने महत्वपूर्ण प्रदर्शन सुधार हासिल नहीं कर पाता। अधिक जटिल गहन अनुमान एक मुख्य आकर्षण है। क्या यह सुदृढीकरण सीखने और विचार श्रृंखलाओं में नई प्रगति, या नवीन तरीकों के कारण है? आगे अवलोकन की आवश्यकता है।
10. प्रशिक्षण और अनुमान के लिए GPU के बजाय अपने स्वयं के TPU का उपयोग करके, Gemini को गैर-Nvidia पारिस्थितिकी तंत्र का एक सफल उदाहरण माना जा सकता है, जो अन्य गैर-Nvidia पारिस्थितिकी तंत्रों की कल्पना को बढ़ाता है।
11. एक तरफ ध्यान दें, DeepSeek चमत्कार के खुद को दोहराने की संभावना कम है, क्योंकि AI पारिस्थितिकी तंत्र में प्रतिस्पर्धा अब एकल-बिंदु सफलताओं के बारे में नहीं है, बल्कि समग्र पारिस्थितिकी तंत्र की आगे बढ़ने की क्षमता के बारे में है।
12. एक और साइड नोट: पिछले साल के वुझेन शिखर सम्मेलन में AI OS चर्चा के दौरान, मैंने एक प्रश्न पूछा था: एंड्रॉइड ऐप्स का HarmonyOS पारिस्थितिकी तंत्र में स्थानांतरण मुख्य रूप से बड़ी संख्या में इंजीनियरों पर निर्भर करता है और इसमें कई बग हैं। क्या मजबूत कोडिंग क्षमताओं वाले विशेष रूप से प्रशिक्षित AI मॉडल का उपयोग संकलन और रूपांतरण के लिए किया जा सकता है? जब मैंने इस साल के वुझेन शिखर सम्मेलन में फिर से चर्चा की अध्यक्षता की, तो मैंने इस प्रश्न को फिर से उठाने की हिम्मत नहीं की। जेमिनी 3 के साथ जारी एंटीग्रेविटी डेवलपमेंट प्लेटफ़ॉर्म के साथ, कम से कम बड़ी संख्या में अपेक्षाकृत सरल लॉन्ग-टेल एंड्रॉइड ऐप्स को “मानक + मॉडल + टूल + मैन्युअल हस्तक्षेप” के माध्यम से एक क्लिक से हार्मोनीओएस इकोसिस्टम में माइग्रेट करना तेज़ी से संभव होता जा रहा है। संक्षेप में, हार्मोनीओएस इकोसिस्टम में ठहराव वास्तव में एआई क्षमताओं की अपर्याप्तता को दर्शाता है।
मीडिया के सवालों के मेरे पिछले जवाब को दोहराते हुए, लेकुन जैसे जिन्हें गतिरोध माना जाता है, वे वास्तव में गतिरोध नहीं हैं, बल्कि ऐसे रास्ते हैं जिन पर चलना है, कम से कम उनमें से एक, और एक आवश्यक रास्ता जिस पर पहले ही चला जा चुका है। संशयवादियों का तर्क है कि भविष्य का रास्ता अभी भी अनिश्चित है, और वर्तमान तथाकथित विश्व मॉडल मुख्य रूप से दृश्य स्थानिक बुद्धिमत्ता या स्थानिक-कालिक बुद्धिमत्ता पर आधारित हैं; एक सच्चा विश्व मॉडल अभी भी एक दूर की संभावना है। हालाँकि, मॉडलों के अंतर्निहित सिद्धांतों (जैसे ट्रांसफॉर्मर-डिफ्यूज़न-माम्बा), बुद्धिमत्ता के गणितीय विश्वदृष्टिकोण, और एकीकृत बोध, निरंतर सीखने और आंतरिक स्वायत्तता पर आधारित संज्ञानात्मक और व्यवहारिक बुद्धिमत्ता की ओर प्रतिमान परिवर्तन की आवश्यकता है।




