अगर आप गूगल के नोटबुकLM टूल का इस्तेमाल करते हैं, तो ये खबर आपके काम की है। गूगल ने इसके ‘Audio Overviews’ फीचर को अब 50 से ज़्यादा भाषाओं में उपलब्ध करा दिया है। मतलब अब दुनिया के अलग-अलग हिस्सों में लोग अपने हिसाब से किसी भी भाषा में जानकारी को सुन सकते हैं, और वो भी बिल्कुल बातचीत के अंदाज़ में।
ओडियो ओवर्व्यू क्या है?
सीधे कहूं तो ये एक ऐसा टूल है जो किसी भी टेक्स्ट डॉक्युमेंट को उठाकर आपको उसका ऑडियो समरी बना देता है। सुनने में ये एक पॉडकास्ट जैसा लगता है, जहां दो AI आवाज़ें आपस में उस कंटेंट पर बात करती हैं। अब तक ये सिर्फ इंग्लिश में होता था, लेकिन अब गूगल ने इसे मल्टीलिंगुअल बना दिया है। यानी आप हिंदी में भी सुन सकते हैं, या फिर जापानी, स्पैनिश, फ्रेंच जैसी किसी भी भाषा में।
कौन है इसके पीछे?
इस फीचर के पीछे काम कर रहा है गूगल का Gemini AI। यही टेक्नोलॉजी अब टेक्स्ट को न सिर्फ समझती है बल्कि उसे आपकी भाषा में नेचुरल और सहज आवाज़ में सुनाती भी है। ऐसा लगता है जैसे आप किसी इंसान की बात सुन रहे हैं, मशीन की नहीं।
भरोसेमंद क्यों है ये?
नोटबुकLM बाकी AI चैटबॉट्स से अलग है। ये सिर्फ वही जानकारी यूज़ करता है जो आप अपलोड करते हैं, इंटरनेट पर से कुछ नहीं खींचता। इसी वजह से इसमें गलत जानकारी देने की संभावना कम हो जाती है। और सबसे अच्छी बात, इसमें फुटनोट्स भी आते हैं, जिससे आप साफ देख सकते हैं कि कौन सी जानकारी कहां से ली गई है।
टीचर्स और ग्लोबल टीम्स के लिए फायदेमंद
मान लीजिए कोई टीचर अमेज़न रेनफॉरेस्ट पर क्लास ले रहा है। वो पोर्तुगीज़ डॉक्युमेंट, स्पैनिश रिसर्च पेपर और इंग्लिश स्टडी मैटेरियल अपलोड करके किसी भी भाषा में ऑडियो ओवरव्यू बना सकता है। छात्रों को अब वही जानकारी उनकी अपनी भाषा में सुनने को मिल सकती है।
वैसे ही, जो बिज़नेस अलग-अलग देशों में काम करते हैं, उनके लिए भी ये टूल काफी काम का है। अब रिपोर्ट्स, एनालिसिस या मार्केट डेटा को एक भाषा से दूसरी में ट्रांसलेट करवाने की जरूरत नहीं, सीधे अपलोड करो और सुनो।
आसान और पर्सनल
गूगल ने इसे काफी सिंपल तरीके से पेश किया है। जो भाषा आपके गूगल अकाउंट में सेट है, उसी में ऑडियो ओवरव्यू मिलेगा। लेकिन अगर आप चाहें, तो ‘आउट्पुट लैंग्वेज’ सेटिंग से भाषा बदल सकते हैं।
मेहनत कम, इस्तेमाल ज़्यादा
पहले, मल्टीलिंगुअल कंटेंट को संभालना थोड़ा झंझट वाला काम था। ट्रांसलेशन टूल्स, एक्स्ट्रा ऐप्स, टाइम वगैरह सब लगता था। अब ये सब कुछ एक ही प्लेटफॉर्म पर हो रहा है। यही बात इसे ज्यादा यूज़फुल बनाती है।
अभी क्या बाकी है?
हां, कुछ बातें अभी भी मिसिंग हैं। आप ऑडियो में कितने स्पीकर्स होंगे, उनकी आवाज़ कैसी होगी, कितनी देर की बातचीत होगी, ये सब कंट्रोल नहीं कर सकते। और फिलहाल, जो आउटपुट आता है, वो एक ही ऑडियो फाइल में होता है। अगर गूगल इसमें और फीचर्स जोड़ दे, तो ये वीडियो एडिटिंग या दूसरे मीडिया यूज़ के लिए भी सही टूल बन सकता है।
कुछ और छोटे लेकिन अच्छे बदलाव
गूगल ने हर नोटबुक के लिए अब स्मार्ट आइकन भी जोड़ दिए हैं। जैसे अगर आप वॉलीबॉल कोचिंग पर नोटबुक बना रहे हो, तो आइकन वॉलीबॉल का होगा। ये छोटी बातें हैं, लेकिन यूज़र एक्सपीरियंस को बेहतर बनाती हैं।
ये अपडेट एक और कदम है उस दिशा में जहां AI कंटेंट इंसान जैसा लगने लगता है। पॉडकास्ट टाइप ऑडियो ओवरव्यू अब इतना नेचुरल फील कराता है कि एक बार को लगेगा, असली लोग बात कर रहे हैं।
भविष्य में शायद AI खुद पॉडकास्ट बना ले, या रेडियो जैसे शो क्रिएट करने लगे। अभी के लिए इतना जरूर है कि गूगल का यह कदम भाषा की दीवारों को गिरा रहा है, और जानकारी को सबके लिए थोड़ा और आसान बना रहा है।


