Cara Terbaru Membuat dan Setting Robot.txt di Blogger
Setting Robot TXT ini dibuat karena ada beberapa pengguna yang baru baru ini mengalami Masalah Warning Diindeks Meski Diblokir Oleh Robots.txt - Pada Google Search Console (Console Versi Baru) muncul masalah warning diindeks, meski diblokir oleh robots.txt khususnya untuk blog-blog yang menggunakan platform Blogger.
Kalau kita cek semua URL yang diindeks, meski diblokir oleh robots.txt ini adalah semua halaman Search yaitu untuk halaman Search Label dan untuk halaman navigasi postingan lama.
Seperti yang ditunjukan bahwa halaman-halaman tersebut diindeks, meski diblokir oleh robots.txt. Itu karena blogger menggunakan robots.txt seperti berikut:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Allow: /
Sitemap: https://kamiberinfo.blogspot.com/sitemap.xml
Pada
robots.txt di atas menunjukan bahwa semua halaman Search tidak diizinkan untuk
dicrawl bot.
Namun karena halaman-halaman search tersebut ditautkan di blog seperti pada breadcrumb, menu, atau widget label atau pada navigasi next prev, maka halaman-halaman tersebut tetap dirayapi bot.
Untuk mengatasi masalah ini, sebaiknya halaman-halaman tersebut diperbolehkan untuk dirayapi bot dan ditampilkan di hasil pencarian.
Silahkan ganti robots.txt dengan kode berikut ini jika Anda menggunakan robots.txt seperti di atas.
User-agent: *
Disallow:
Sitemap: https://kamiberinfo.blogspot.com/sitemap.xml
Sitemap:https://kamiberinfo.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
Sitemap: https://kamiberinfo.blogspot.com/feeds/posts/default
Sitemap: https://kamiberinfo.blogspot.com/sitemap-pages.xml
Silahkan
ganti kode yang saya tandai dengan domain blog Anda.
Untuk
kode berikut,Silahkan buat baris baru jika postingan blog Anda sudah di atas 500.
Sitemap:https://kamiberinfo.blogspot.com/atom.xml?redirect=false&start-index=501&max-results=500Begitu seterusnya, jika postingan sudah di atas 1000, maka buat baris baru lagi seperti berikut:
Sitemap:https://kamiberinfo.blogspot.com/atom.xml?redirect=false&start-index=1001&max-results=500Kemudian silahkan simpan kode meta tag noindex berikut di bagian <head> blog untuk memblokir bot pada halaman arsip dan tidak menampilkannya di halaman hasil percarian Google untuk menjaga duplikat konten dengan halaman search.
<b:if cond='data:view.isArchive'> <meta content='noindex,noarchive' name='robots'/> </b:if>Dan pastikan Anda tidak menggunakan widget arsip blogger.
Alangkah baiknya Anda membaca dua postingan saya dibawah ini sebelumnya agar tidak menimbulkan error struktur data.
LD-JSON Script Schema.org Untuk Homepage
Blogger
Kemudian masuk ke Console dan lakukan validasi pada warning Diindeks, meski diblokir oleh robots.txt dan silahkan pantau terus Search Console.
Kemudian masuk ke Console dan lakukan validasi pada warning Diindeks, meski diblokir oleh robots.txt dan silahkan pantau terus Search Console.
Semoga bermanfaat….