बीते कुछ सालों में गूगल सर्च इंजन के काम करने के तरीकों में अगर कोई सबसे बड़ा बदलाव हुआ है तो वो है BERT Algorithm को लॉन्च किया जाना। BERT Algorithm को अक्टूबर 2019 में लॉन्च किया गया था।
तब BERT Algorithm अमेरिका में सिर्फ अंग्रेज़ी Language में सिर्फ 10% सर्च Queries के साथ ही शुरू किया गया था। लेकिन आज BERT हर देश में हर सर्च में इस्तेमाल किया जाता है।
Google BERT Algorithm कितनी Languages को सपोर्ट करता है?
Google BERT Algorithm पूरी दुनिया में लगभग 70 languages को सपोर्ट करता है। जो कि आगे है,
“अफ्रीकी, अल्बानियाई, अम्हारिक्, अरबी, अर्मेनियाई, अज़ेरी, बास्क, बेलारूसी, बल्गेरियाई, कैटलन, चीनी (सरलीकृत और ताइवान), क्रोएशियाई, चेक, डेनिश, डच, अंग्रेज़ी, एस्टोनियाई, फ़ारसी, फिनिश, फ्रेंच, गैलिशियन्, जॉर्जियाई, जर्मन , ग्रीक, गुजराती, हिब्रू, हिंदी, हंगेरियन, आइसलैंडिक, इंडोनेशियाई, इतालवी, जापानी, जावानीस, कन्नड़, कजाख, खमेर, कोरियाई, कुर्दिश, किर्गिज़, लाओ, लात्विया, लिथुआनियाई, मैसेडोनियन मलय (ब्रुनेई दरियालम और मलेशिया), मलयालम, माल्टीज़, मराठी, मंगोलियाई, नेपाली, नॉर्वेजियन, पोलिश, पुर्तगाली, पंजाबी, रोमानियाई, रूसी, सर्बियाई, सिंहली, स्लोवाक, स्लोवेनियाई, स्पेनिश स्वाहिली, स्वीडिश, तागालोग, ताजिक, तमिल, तेलुगु, थाई, तुर्की, यूक्रेनी, उर्दू, उज़्बेक और वियतनामी”
जिन Languages में BERT सबसे ज्यादा इस्तेमाल किया जा रहा है उनमे से एक हिंदी भी है। इसका मतलब हुआ कि चाहे आपकी वेबसाइट या आपका ब्लॉग इंग्लिश में हो या हिंदी में BERT का असर आपकी वेबसाइट आपके ब्लॉग के ट्रैफिक के ऊपर पड़ रहा है। Read Also: Google SMITH Algorithm क्या है?
Google BERT Algorithm का Full Form क्या है?
Google BERT Algorithm का Full Form “Bidirectional Encoder Representations From Transformers” है।
किसी भी Language को समझना सर्च इंजन या नॉर्मल Computer System के लिए एक मुश्किल काम होता है। क्योंकि इसमें न सिर्फ Language की नॉलेज लगती है बल्कि Culture, Reference, Condition और Emotions को भी समझना होता है।
Example के तौर पर एक लाइन है “कुत्ते मैं तेरा खून पी जाऊंगा” अगर यह बात कोई इंडियन बोलता है तो आप समझ जाएंगे कि जरूर धर्मेंद्र जी होंगे। लेकिन अगर कोई चीनी यह बोलता है तो हो सकता है कि वह सच में कुत्ते का कुछ पकाने का ट्राई कर रहा हो।
अगर इस लाइन को कोई गुस्से में बोलता है तो उसका मतलब अलग होगा। लेकिन वहीं अगर Same लाइन को कपिल शर्मा बोले तो? हो सकता है हमारी हसी निकल जाए।
Sentence एक और उसके मतलब कई सारे। इन सारे लंबे चौड़े शब्दों का मतलब भी हम समझते है।
BERT Algorithm क्या है?
Google BERT Algorithm एक Natural Language Processing(NLP) Model है जो कि Google के Neural Network पर Based एक Technique है। BERT कंप्यूटर सिस्टम को किसी Word का मतलब Natural तरीके से समझने में Help करता है। Google के अनुसार BERT Algorithm Search किए जा रहे Queries को सही ढंग से समझने में Google की मदद करता है और उन Search Queries के लिए Exact Match कंटेंट को Search Results में दिखाने में भी गूगल की मदद करता है। BERT Algorithm, Google के Search Results में दिखाए जाने वाले Feature Snippet पर भी काफी असर डालता है। BERT के जरिए Query Search करने वाले यूजर को सही और उस Query से Exact Match करने वाला कंटेंट मिलता है।
BERT Algorithm काम कैसे करता है?
BERT के फुल फॉर्म में पहला वर्ड है Bidirectional यानी कि दो Direction वाला। एक Sentence में किसी भी वर्ड को अगर आप देखते है तो, या तो उसके आगे कोई दूसरा Word होता है या उसके पीछे कोई दूसरा Word होता है। मतलब कि दो Direction होती है. BERT के अलावा बाकी सारे Language Processing Model एक Sentence में या तो लेफ्ट से राइट की तरफ पढ़ना शुरू करते हैं या फिर राइट से लेफ्ट की तरफ पढ़ना शुरू करते हैं। मतलब एक ही Direction में पढ़ते है और इसे Unidirectional कहा जाता है।
वही BERT एक साथ दोनों Direction में पढ़ना शुरू करता है। जिससे पूरे Sentence का मतलब एक ही बार में निकल सकता है, इसलिए इसे Bidirectional कहते हैं।
Example के लिए मान लेते हैं की एक शब्द है ‘दिन‘ इससे पहले अगर ‘आज’ लिख दिया जाए तो आज के दिन के बारे में बात हो जाएगी। अगर ‘कल’ लिख दिया जाए तो 1 दिन पहले के बारे में बात हो जाएगी। अगर ‘परसो’ लिख दिया जाए तो एक और दिन पहले के बारे में बात हो जाएगी। वहीं इस दिन शब्द के आगे हम ‘भर’ लगा दे तो आज दिन भर या कल दिन भर या परसों दिन भर हो जाएगा।
लेकिन अगर हम भर की जगह ‘में’ लगा दे तो Phrase हो जाएगा आज दिन में या कल दिन में या परसों दिन में। दिन शब्द नहीं बदल रहा है, लेकिन उसके आगे और बाद में / आगे और पीछे जो लिखा जा रहा है उससे पूरा मतलब ही बदल रहा है।
तो Bidirectional क्या हुआ समझ में आ गया। अब आते है “Encoder Representations From Transformers” पर। Natural language Processing में Transformers एक ऐसा Mechanism होता है जो किसी Text में मौजूद वर्ड के आपस के रिलेशन को पहचान सकता है। इन Transformers के 2 पार्ट होते हैं,
- 1. Encoder
- 2. Decoder
Encoder टेक्स्ट को पढ़कर मतलब समझता है और Decoder मतलब के बेस पर टेक्स्ट को बनाता है। Encoder Representations का मतलब हुआ कि Encoder ने जो मतलब समझा है उसको बताना।
अब हम इन्हें Combine कर देते हैं। इन सारे वर्ड्स को “Bidirectional Encoder Representations From Transformers” एक करने पर इस पूरे लाइन का मतलब है की Transformers ने किसी सेंटेंस का एक साथ दोनों Direction में जो मतलब समझा है उसको Define करना। तो BERT Algorithm किसी भी टेक्स्ट का मतलब समझ सकता है लेकिन खुद से नया टेक्स्ट बना नहीं सकता है।
BERT Algorithm एक ऐसा Natural Language Processing Framework है जो गूगल को सर्च किए जा रहे पूरे Phrase को किसी नॉर्मल ह्यूमन की तरह समझने में हेल्प करता है। यह हेल्प BERT इंग्लिश Language में भी करता है और हिंदी में भी करता है। गूगल यह समझ सकता है कि सर्च किए जा रहे Phrase का मतलब क्या है। जब कोई सर्च करता है सरकारी जॉब फॉर्म तो सरकारी जॉब की Performance की बात नहीं कर रहा है। बल्कि सरकारी जॉब के फॉर्म भरने की वेबसाइट ढूंढ रहा है। इस तरह से आपकी वेबसाइट को बेहतर ट्रैफिक मिलता है।
अब सवाल आता है कि BERT Algorithm से आपकी वेबसाइट पर क्या फर्क पड़ता है? इसका शॉर्ट जवाब है काफी ज्यादा फर्क पड़ता है। अभी जैसा हमने बताया कि BERT का काम सर्च किए जा रहे वर्ड्स को अच्छी तरीके से समझना होता है।
गूगल अच्छे तरीके से वर्ड को समझेगा Keywords को समझेगा तभी तो वह ऐसे ट्रैफिक को आपकी तरफ भेज सकेगा जो पहले नहीं आ रहा था। BERT की वजह से आपकी वेबसाइट या ब्लॉग के ट्रैफिक में दो बदलाव होंगे असल में हो चुके है और आगे भी होते रहेंगे।
पहला ट्रैफिक की Quantity, गूगल सर्च अच्छे तरीके से समझेगा तो आपको ज्यादा ट्रैफिक मिलेगा। दूसरा Quality ट्रैफिक, जब गूगल को सर्च किए जाने वाले Keywords ज्यादा सही तरीके से समझ में आएंगे तभी वह सही वेबसाइट को सर्च रिजल्ट्स में “आपकी वेबसाइट को” दिखा पाएगा। आपको जो ट्रैफिक मिलेगा वो बेहतर Quality का होगा।
BERT के लिए आपको अपनी वेबसाइट में क्या बदलाव करने चाहिए?
इसका शॉर्ट जवाब है कुछ नहीं। जैसे आप यूजफुल कंटेंट लिख रहे थे वैसे ही लिखते रहिए। BERT का काम सिर्फ सर्च किए जा रहे वर्ड्स को अच्छी तरीके से समझना है। BERT को सिर्फ गूगल सर्च बार के अंदर टाइप किए जा रहे वर्ड्स पर अप्लाई किया जाता है। इसलिए आपको अपनी वेबसाइट में BERT के लिए कंटेंट में कोई बदलाव करने की जरूरत नहीं है।
एक और बात का ध्यान रखें अगर आपसे कोई कहे की उसके पास BERT के लिए वेबसाइट Optimize करने का कोई Plugin है। तो समझ जाना कि फेक है। जैसा की हमने बताया की BERT “Bidirectional Encoder Representations From Transformers” में Encoder का मतलब है Meaning को समझना।
Encoder का मतलब हुआ Input और Decoder का मतलब Output हैं। इसमें Output देने का कोई Mechanism नहीं है। ये जनाब सिर्फ समझ सकते है बता नहीं सकते(Encoder). BERT के बेस पर कोई ऐसा Tool या Plugin नहीं बनाया जा सकता जो किसी वेबसाइट को Optimize कर सके।
BERT Algorithm के फायदे क्या है?
अधिक Languages के लिए Search को Improve करना
पूरी दुनिया में users के लिए search को बेहतर बनाने के लिए Google ने BERT algorithm को release किया है। BERT की खासियत यह है की यह अगर किसी एक languages में अपने आप को train करता है या कुछ सीखता है तो उसे हर languages के लिए इस्तेमाल में लाता है।
जैसे BERT ने अगर Hindi language में कुछ सीखा है तो वो उसे बाकि languages पर भी apply करता है। ऐसे में इस system को दूसरी languages के लिए अलग से train करने की जरुरत नहीं होती है।
Improvement In Featured Snippets
जैसा की हमने देखा की BERT algorithm Featured Snippets पर भी असर करता है। Google के अनुसार BERT को Featured Snippets को बेहतर बनाने के लिए भी इस्तेमाल किया जा रहा है। आप चाहे जो भी language बोलते है, Hindi, English या कोई और आपको आपकी language में जवाब देने के लिए यह system Google Search को काफी मदद करती है।
Search करने वाले यूजर को उसके Queries का जवाब Featured Snippets में ही मिल जाए इसके लिए BERT काफी असरदार साबित भी हुआ है। लेकिन फिर भी google का कहना है की हर बार सही results को दिखाना अभी भी मुश्किल है। Languages को समझना इतना आसान नहीं होता है जैसे की हमने देखा भी है और गूगल भी इस बात को मानता है। इसलिए गूगल अपने search को बेहतर बनाने के लिए हमेशा कोशिश करता रहता है।
बहुत ही सरल शब्दों में आपने जानकारी दी है सर!
धन्यवाद
बहुत अच्छी जानकारी है