दोस्तों, क्या आपको मालूम हैं कि Robots.txt File क्या होती हैं? और Website के लिए इस File को कैसे बनाते हैं? और SEO के नजरिये से इस File की क्या Importance हैं।

अगर आप Blogging करते हैं तो इस important file के बारें में आपको जानकारी होना बहुत ही जरुरी हैं नहीं तो जाने-अनजाने में इसकी वजह से आपकी साईट को काफी नुकसान पहुँच सकता हैं। आपकी साईट का कौन सा URL Search Engine में index होगा या नहीं यह काफी हद तक Robots.txt file पर निर्भर करता हैं। 

अगर आप इस महत्वपूर्ण फाइल को बनाते समय या अपडेट करते समय कुछ गलती कर देते हैं तो आपकी पूरी साईट सर्च इंजन से Remove हो सकती हैं या जो कंटेंट आप सर्च इंजन को दिखाना नहीं चाहते हैं वो भी index हो सकता हैं।

इसलिए आज की इस पोस्ट में हम आपको इसी टॉपिक के बारें में जानकारी देने जा रहें हैं कि Blogging में Robots.txt file Kya Hoti Hai? और इसकी क्या importance हैं तथा एक Perfect Robots.txt file Create कैसे होती हैं? अगर आप इस Post को ध्यानपूर्वक पढ़ते हैं तो अंत तक आप Blogging की इस Term के बारें में अच्छे से समझ चुकें होंगे।

Robots.txt File Kya Hai in Hindi ?

What is Robots.txt File in Hindi? Robots.txt file आपकी साईट की Web Hosting के Root Folder में स्थित एक .txt file होती हैं जो Search Engine Bots को यह दिशा-निर्देश देने में Help करती हैं कि जब भी Bots मेरी Site पर आए तो उन्हें साईट के किस Url को Search Engine में दिखाने के लिए index करना हैं और किस Url को index नहीं करना हैं। किसी भी साईट की इस TXT File को आप https://example.com/robots.txt के माध्यम से Check कर सकते हैं।

Robots.txt File एक तरह से साईट के Indexing Rules Manage करती हैं जिसके अंदर अलग-अलग File Path के लिए अलग-अलग Rules बनाए जा सकते हैं। हर एक Rule Crawlers को किसी Special File Path को Crawl करने से रोकता हैं या अनुमति प्रदान करता हैं।

इस file को एकदम सही जगह पर रखना भी बहुत ही जरुरी हैं क्योंकी अगर आप इसे वेबसाइट की Root Directory से अलग रखते हैं तो शायद Search Engines Crawlers को इसे Find करने में मुश्किल हो सकती हैं जोकि बिल्कुल भी सही नहीं हैं।

जब भी किसी Search Engine के Crawlers आपकी वेबसाइट को Crawl करने के लिए आते हैं तो वे सबसे पहले Website की Root Directory में Robots.txt file को Target करते हैं कि इस साईट में वो कौन-कौन से Urls हैं जिन्हें index नहीं करना हैं और कौन से Urls indexing के लिए स्वतंत्र हैं? 

इसलिए हर वेबसाइट के अंदर इस important file का रहना बहुत ही जरुरी हो जाता हैं ताकि सभी Search Engines जैसे कि Google, Bing आदि को Crawling के लिए सही दिशा निर्देश मिल सकें और केवल वो Content ही Search Engine में Publicly Visible हो जिसे आपने अनुमति दी हैं।

Robots.txt File के क्या-क्या Advantages हैं?

  • 1. Robots.txt file Search Engine Crawlers को instruct करती हैं कि साईट के किस पार्ट को Crawl करें और किसे नहीं?
  • 2. इस file की Help से आप अपने ब्लॉग को Category के हिसाब से Search Engine में index और Noindex करा सकते हैं।
  • 3. यह Search Engines को आपके ब्लॉग के indexing structure को जल्दी समझने में Help करता हैं।
  • 4. इस file के द्वारा आप किसी भी पूरे Search Engine को ब्लॉग को इंडेक्स करने से रोक सके हो।
  • 5. कई बार कुछ कंटेंट ऐसे होते हैं जिन्हें आप Search Engines को Visible नहीं कराना चाहते लेकिन अगर Robots.txt file नहीं हैं तो सब कुछ फटाफट index हो जाता हैं। ऐसे में अगर आप चाहें तो इस फाइल की हेल्प से ब्लॉग की indexing को Delay भी कर सकते हैं।
  • 6. इस file में आप Sitemap का URL भी Add कर सकते हो जिसकी Help से ब्लॉग के indexable कंटेंट को fast index होने में help मिलती हैं क्योंकि Crawlers सबसे पहले Robots.txt file को ही Target करते हैं।

Robots.txt File SEO में क्यों महत्वपूर्ण हैं?

ऊपर दी गई जानकारी के अनुसार अब आप यह तो समझ ही गए होंगे कि Website में Robots.txt File Kya Hai in Hindi? और इसके क्या Advantage हैं? चलिए अब आपको बताते हैं कि इस प्रकार की txt फाइल Site के SEO के लिए क्यों जरुरी हैं? किसी भी साईट के लिए यह फाइल Technical SEO का एक बहुत ही महत्वपूर्ण part हैं इसलिए इसे SEO के Point of View से समझना बहुत ही जरुरी हैं। 

अगर आप अपनी साईट को Search Engine के हिसाब से SEO Friendly बनाना चाहते हैं तो इसके लिए एक Robots.txt file जरुर बनाए ताकि Crawlers को आपकी साईट के सही Content को Crawl करने के लिए उचित दिशा निर्देश मिल सके।

A2 Hosting OfferA2 Hosting Offer

वैसे Manually देखा जाए तो Search Engine Crawlers किसी भी साईट के कंटेंट को क्रॉल करने में कुछ समय लेते हैं। लेकिन जब आप Google Search Console में Sitemap Submit करते हैं तो उस स्तिथि में काफी जल्दी Crawling होती हैं।

लेकिन अगर ऐसे में आपने Robots.txt File को अपनी साईट के लिए Configure नहीं किया हैं तो पूरा का पूरा Content ही Search Engine में index हो जाएगा जिसमे ऐसा कंटेंट भी होगा जिसे आप Search Results में Visible नहीं होने देना चाहते थे। जोकि Site SEO के लिए बिल्कुल भी सही नहीं रहता हैं इसलिए हर Website के लिए एक Robots.txt File को रखना बहुत ही महत्वपूर्ण हो जाता हैं।

Robots.txt File की Location कहाँ होनी चाहिए?

अगर आप एक WordPress Website User हैं तो Ideally Robots.txt File की जगह आपकी Site की Root Directory में होनी चाहिए ताकि जब भी Crawlers साईट पर आए तो वो इस फाइल को आसानी से Access कर सके और उसकी Guidelines के अनुसार कंटेंट को Crawl करें।

लेकिन अगर आप इस महत्वपूर्ण फाइल को साईट की Root Directory से कही अलग रखते हैं तो Crawlers उसे Access नहीं कर पाएंगे और आपकी पूरी की पूरी साईट एकदम से Search Engine में Index हो जाएगी। अगर किसी साईट की Robots.txt File बनी हैं तो आप उसे इस URL के माध्यम से Access कर सकते हैं: https://example.com/robots.txt 

अब आपके सामने एक Text File Open हो जाएगी जैसा कि आप नीचे image में देख सकते हैं। यह IndiGyan.com की Robots.txt File हैं। अगर इस URL को डालने के बाद 404 Error Display होता हैं तो इसका मतलब हैं आपकी साईट के अंदर कोई Robots.txt File उपलब्ध नहीं हैं।

Robots.txt File of IndiGyan

और अगर नीचे दिए गए Code के जैसे कोई Code नजर आता हैं तो इसका मतलब हैं Website के लिए यह File बनी हुई हैं लेकिन उस Robots.txt File को SEO के हिसाब से Optimize नहीं किया गया हैं।

User-agent: * 
Crawl-Delay: 10

Robots.txt File से सम्बंधित Important दिशा निर्देश

1. User-agent

इस Command का उपयोग Search Engine Bots/Crawlers को Crawling के दिशा निर्देश देने के लिए किया जाता हैं जिसमे एक या उससे अधिक User-agents हो सकते हैं जैसे कि *, Googlebot, AdsBot-Google, Bingbot आदि। (यहाँ अगर आप * का इस्तेमाल करते हैं तो इसका मतलब हैं कि आप सभी Crawlers को अनुमति दे रहें हैं)। चलिए इसे एक उदहारण के द्वारा समझते हैं:

Example 1: Googlebot को Block करने के लिए।

User-agent: Googlebot
Disallow: /

Example 2: Googlebot और Adsbot को Block करने के लिए।

User-agent: Googlebot
User-agent: AdsBot-Google
Disallow: /

Example 3: सभी Search Crawlers को Crawling के लिए Allow करने के लिए।

User-agent: *
Allow: /
2. Disallow

यह Command Search Engine Bots को Crawling की अनुमति न देने के लिए इस्तेमाल की जाती हैं। इस Command का Use भी आप ऊपर दिए गए उदहारणों में देख सकते हैं।

3. Allow

इस Command का इस्तेमाल Search Engine Bots को Crawling की अनुमति देने के लिए इस्तेमाल किया जाता हैं।

4. Sitemap

यहाँ पर आप अपनी साईट के Sitemap का URL Mention कर सकते हैं ताकि जो भी कंटेंट आप क्रॉल कराना चाहते हैं वो उस तक Crawlers Easily Find कर सके।

WordPress के लिए Robotos.txt File कैसे बनाए? 

(Manually Process)

How to Create Robots.txt File in Hindi? जैसा कि आप जान ही चुके होंगे कि Robots.txt एक simple Text file हैं। इसलिए अपनी साईट के लिए इस फाइल को Ready करना बहुत ही आसान हैं। इसके लिए आप कोई भी Text Editor का इस्तेमाल कर सकते हो जैसे कि Notepad, Notepad++ आदि।

किसी भी एक Text Editor को Open करें और इसके बाद robots.txt के नाम से एक Blank file Create कर ले।

Save Robots.txt

अब अपने Favorite Ftp tool या फिर अपनी Web Hosting के cPanel के माध्यम से होस्टिंग के वेब सर्वर पर Sign-in करें।

Sign-in करने के बाद public_html Folder या जो भी आपकी साईट का Root Folder हो उसे Open करें और जो Text file अभी आपने बनाई थी इस folder में उसे Upload कर दीजिए।

Upload Robots.txt File in public_html folder

वैसे अगर आप चाहें तो Robots.txt file को Direct अपने Ftp Server या cPanel (Root Folder) में भी Create कर सकते हैं जिसमे आपको किसी Text Editor को इस्तेमाल करने की भी जरुरत नहीं पड़ेगी।

इसके लिए अपनी साईट के Root Folder में जाने के बाद Top Left Corner में File पर Click कीजिए। अब जो भी Dialog Box Open होगा उसमे robots.txt टाइप कर Create New File पर Click करें।

Create Robots.txt File in public_html folder

OK पर Click करते ही आप देखेंगे कि robots.txt के नाम से एक Text file create हो जाती हैं।

How to Create Robots.txt File in Hindi

आगे बढ़ने से पहले आप इस फाइल के लिए Right Permissions जरुर Set कर ले। जैसे कि Owner Permissions, Group Permissions और Public Permissions. इसके लिए आप इस file पर Right Click करने के बाद Change Permissions को चुनें और फिर आप नीचे दी गई image को फॉलो कर सकते हैं। (ध्यान से यह भी Check कर ले कि Numeric Value 644 होनी चाहिए)।

Set Permissions in Robots.txt

Robots.txt File को कैसे Use करें?

अब आपकी साइट के लिए एक Robots.txt file Create हो चुकी हैं लेकिन ये अभी Empty File हैं। आप इस फाइल के अंदर साईट के कंटेंट के लिए Crawlers को आप क्या-क्या दिशा निर्देश दे सकते हो इस बारे में आगे आप इस Post में जानेंगे।

जैसे कि अगर आप Search Engines की Crawling को अपनी साईट के लिए Block करना चाहते हैं तो बस Robots.txt के अंदर कुछ Permissions को Add कर दीजिए।

अगर आप अपनी साईट के किसी Special Page को Crawlers से Hide करना चाहते हैं तो वह भी आप आसानी से कर सकते हैं।

हालांकि Robots.txt खुद आपकी साईट के SEO को improve नहीं करता हैं लेकिन Search Engine Crawling के Behaviour को Control करने के लिए इस File का इस्तेमाल बहुत जरुरी हैं।

इस File को Modify करने या किसी भी तरह की Editing के लिए Simply अपने Ftp Editor या cPanel में जाने के बाद Open करें और यहाँ file के अंदर आप जो Changes करते हैं वो instantly आपकी Site के में Effective हो जाते है।

1

Site के लिए सभी Bots को Block करें।

अगर आप सभी Crawlers को Crawling के लिए Block करना चाहते हैं तो Robots.txt File के अंदर यह Code Add करें।

User-agent: *
Disallow: /

यह Code आपकी Actual Robots.txt File के अंदर कुछ इस प्रकार दिखना चाहिए जैसा कि आप नीचे image में देख सकते हैं।

How to Block all Bots for Site in Hindi?
2

किसी विशेष फोल्डर के लिए Crawler की Crawling को Block करना।

अगर आप चाहते हैं कि आपकी साईट के किसी विशेष फोल्डर तक Crawlers न पहुँच पाए तो फाइल के अंदर निम्न Code Add कीजिए।

User-agent: *
Disallow: /write_folder_name/

यदि आप चाहते हैं कि कोई भी Crawlers आपकी Site के images वाले Folder को Search Engine के लिए Crawl न कर पाए यह Code आपकी Actual File में कुछ इस प्रकार Add किया जाना चाहिए जैसा कि आप नीचे image में देख सकते हैं।

किसी विशेष फोल्डर के लिए Crawler की Crawling को Block करना।

Note: यहाँ पर /images वाले Folder को केवल एक Example के तौर पर लिया हैं यह जरुरी नहीं हैं कि आपको भी अपना /images का Folder Search Engines Bots के लिए Block करना हैं यह आपके Case में अलग भी हो सकता हैं। आप जिस भी Folder के लिए यह कार्य करना चाहते हैं उसी फोल्डर का नाम इस Code के साथ Add करें।

3

किसी Specific Search Engine Bots को Block करना।

यदि आप अपनी साईट से किस Special Search Engine Bot जैसे कि Googlebot या Bingbot को Block करना चाहते हैं तो आपको इस Code का इस्तेमाल करना चाहिए:

User-agent: robot name
Disallow: /

उदाहरण के लिए अगर आप Bingbot को Block करना चाहते हैं तो ऊपर दिए गए Code को आप Robots.txt File के अंदर कुछ इस प्रकार Add करें जैसा कि नीचे image में दिया गया हैं।

किसी Specific Search Engine Bots को Block करना।
4

किसी भी Specific File को Crawling होने से रोकना।

Robots.txt file आपको किसी Specific Folder की File को Search Engine में Crawling होने से रोकने की भी अनुमति देती हैं। इसके लिए आपको नीचे दिया गया Code उस file में Add करना चाहिए।

User-agent: *
Disallow: /folder_name/file_name.extension

आपकी Robots.txt file में यह Code कुछ इस प्रकार Add होना चाहिए जैसा कि आप नीचे image में देख सकते हैं।

किसी भी Specific File को Crawling होने से रोकना।
5

पूरे फोल्डर को Block करना लेकिन किसी एक File को Allow करना।

कई बार ऐसी भी Condition भी आ सकती हैं कि आप किसी फोल्डर को Crawling नहीं होने देना चाहते लेकिन उसी फोल्डर के अंदर किसी एक File को Search Engine की Crawling के लिए Allow करना चाहते हैं तो यह भी आप Robots.txt File के माध्यम से आसानी से कर सकते हो। इसके लिए निम्न Code का इस्तेमाल कीजिए।

User-agent: *
Disallow: /folder_name/
Allow: /folder_name/file_name.extension

उदाहरण के लिए अगर आप आपकी साईट के “images” नाम के Folder को Block करना चाहते हैं लेकिन उस फोल्डर में मौजूद “img_0001.png” नाम की FIle का Access देना चाहते हैं तो आपकी Actual File के अंदर यह Code कुछ इस प्रकार दिखना चाहिए जैसा नीचे image में दिख रहा हैं।

पूरे फोल्डर को Block करना लेकिन किसी एक File को Allow करना।

RankMath SEO के द्वारा Robots.txt File Create कैसे करें?

RankMath SEO WordPress Plugin की Help से आप Robots.txt File को अपने WordPress Dashboard के Admin Area में ही बना सकते हो। यह इस फाइल को बनाने का सबसे Fast और Easy तरीका हैं।

Rank Math SEO के माध्यम से एक SEO Friendly Robots.txt Create करने के लिए सबसे पहले आपके WordPress के अंदर Rank Math Plugin installed होना चाहिए। इसके बाद Rank Math->General Settings->Edit robots.txt पर Click कीजिए। अब आपके सामने कुछ इस तरह का Interface आ जाता हैं जैसा कि आप नीचे image में देख सकते हो।

How to Create Robots.txt File using Rank Math Plugin in Hindi

यहाँ नीचे मैंने जो Robots.txt File अपने लिए बनाई हैं उसकी Coding दी हुई हैं आप चाहें तो इसे Copy कर Rank Math में Past कर सकते हैं और अगर आप खुद अपने हिसाब से बनाना चाहते हैं तो वह टाइप कर नीचे Save Changes पर Click कीजिये।

User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /comments/feed/
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /feed/
Disallow: */feed/
Disallow: /trackback/
Disallow: /index.php
Disallow: /xmlrpc.php
Allow: /wp-includes/js/
Allow: /wp-includes/css/
Allow: /wp-content/cache/minify/
Allow: /wp-admin/admin-ajax.php
User-agent: Googlebot-Image
Allow: /wp-content/uploads/

User-agent: Adsbot-Google
Allow: /

User-agent: Googlebot-Mobile
Allow: /

User-agent: Bingbot
Allow: /

Sitemap: https://example.com/sitemap.xml
sitemap: https:// example.com/post-sitemap.xml
sitemap: https:// example.com/page-sitemap.xml

Save Changes पर Click करते ही आपकी Site के लिए एक SEO Friendly Robots.txt File बन चुकी होगी। yoursitename.com/robots.txt की Help सेज एक बार उसे Check जरुर कर ले कि जो कुछ Coding आपने लिखी थी क्या वो Visible हो रही हैं या नहीं?

Conclusion (आज आपने क्या सीखा)?

इस महत्वपूर्ण Post में हमने आपको बताया कि Robots.txt File क्या होती हैं? आपको उसे अपनी साईट के लिए क्यों Use करना चाहिए? Website के लिए Robots.txt File कैसे बनाए? अगर आपने इस Post को ध्यानपूर्वक पढ़ा हैं तो आपको यह सब अच्छे से समझ में आ गया होगा।

यह भी पढ़ें:

और अब आप भी अपनी Site के लिए एक Perfect Robots.txt File Create कर सकेंगे। अगर आपको अभी भी इससे सम्बंधित कुछ परेसानी हैं तो आप नीचे Comment Box के माध्यम से आपनी बात हम तक पंहुचा सकते हैं। आप सभी के हर सवाल पर हमारी नजर रहती हैं और मेरी हमेशा ये ही कोशिश रहती हैं कि आपके हर सवाल का जल्द से जल्द जवाब दिया जाए।

अगर आपको यह जानकारी अच्छी लगी हो तो इसे शेयर भी कर दीजिए ताकि बाकी दूसरे New Bloggers को भी यह सही जानकारी प्राप्त हो सकें।

INDI GYAN को समय देने के लिए आपका धन्यवाद।
HAPPY BLOGGING!

LEAVE A REPLY

Please enter your comment!
Please enter your name here

This site uses Akismet to reduce spam. Learn how your comment data is processed.