Cara mengatasi duplikat konten di blogger
Bagi anda yang masih baru dalam blogging, anda mungkin sering kali membaca artikel yang menyinggung tentang duplikat konten, terlebih jika itu merupakan artikel yang membahas seputar teknik SEO.
Apa itu duplikat konten ?
Duplikat konten adalah keadaan dimana suatu situs memiliki dua atau lebih halaman yang sama atau sangat mirip. Duplikat konten hanya sebatas pada blog yang sama. Untuk kasus copas artikel orang, ini disebut plagiat konten.
Plagiat konten sendiri kasusnya jauh lebih "berat" dibandingkan duplikat konten. Ya, hal ini jelas karena plagiat konten adalah pelanggaran hak cipta.
Mesin pencari google sangat-sangat care dengan ini. Blog yang terdeteksi sebagai plagiat konten akan dihapus dari mesin pencari (deindex).
Penyebab duplikat konten
Duplikat konten tergolong kasus yang wajar. Hal ini karena sistem dari blog itu sendiri yang umumnya akan menampilkan suatu konten pada beberapa halaman (URL) yang berbeda.
Kita misalkan untuk blog dengan platform blogging blogger.com, ketika anda menerbitkan postingan, postingan ini akan ditampilkan pada beberapa halaman, yaitu halaman item (halaman postingan itu sendiri), label, arsip dan search.
Sistem inilah yang menyebabkan terdeteksinya duplikat konten oleh mesin pencari, terlebih lagi jika anda menampilkan post secara penuh pada halaman index (homepage, label, search). Hal ini akan memproduksi banyak halaman yang memiliki konten serupa.
Dampak duplikat konten terhadap SEO blog
Mengenai dampak duplikat konten terhadap ranking blog di mesin pencari, pada kasus umum, mesin pencari akan memilih mana halaman yang lebih diprioritaskan dan hanya menampilkan satu dari halaman-halaman yang serupa pada hasil pencarian.
Untuk kasus seperti ini, google tidak akan menjatuhkan penalty (hukuman) untuk blog yang bersangkutan. Namun, ada kasus dimana mesin pencari google menganggap bahkan duplikat konten yang terdeteksi merupakan hasil dari tindakan manipulasi yang bertujuan menjaring trafik dengan banyak keyword dan konten yang tidak relevan.
Untuk kasus seperti ini, google mungkin akan menghapus index blog yang bersangkutan (deindex). Informasi google tentang duplikat konten bisa anda baca di: https://support.google.com/webmasters/answer/66359?hl=id
Mengatasi / mencegah duplikat konten
Meskipun belum tentu duplikat konten akan berdampak pada ranking blog di mesin pencari, melakukan tindakan pencegahan merupakah salah satu praktek SEO yang umumnya diterapkan oleh para webmaster.
Dengan mencegah dan meminimalisir produksi duplikat konten, mesin pencari setidaknya tidak perlu serangkaian proses untuk menentukan prioritas konten.
Berikut adalah beberapa halaman yang dapat menyebabkan duplikat konten, halaman-halaman ini (umumnya) memang tidak perlu diindex oleh mesin pencari.
Halaman | Format URL |
---|---|
Label | www.example.com/search/label/nama%20label |
Search by query | www.example.com/search?q=guery |
Search by published | www.example.com/search?update-max=date |
Arsip | www.example.com/tahun/bulan |
Info
Beberapa waktu yang lalu, konfigurasi robots.txt untuk mencegah duplikat konten juga memblock index untuk halaman mobile. Untuk update algoritma google saat ini, konfigurasi yang memblock halaman mobile sudah tidak relevan.
Hal ini karena google telah mulai menerapkan Mobile-first index. Jadi, jangan block index untuk halaman mobile.
Setting robots.txt
Login ke dashboard blog dan menuju menu Setelan > Preferensi penelusuran. Pada bagian Perayapan dan pengindeksan, klik edit pada robots.txt.
Masukkan konfigurasi robots.txt berikut pada textarea dan simpan perubahan.
User-agent: Mediapartners-google
Disallow :
User-agent : Googlebot
Disallow : /search/
Disallow : /search?q=
Disallow : /search?update-max=
Sitemap : https://www.example.com/atom.xml
Petunjuk:
Ganti URL pada sitemap sesuai dengan domain blog anda.
Konfigurasi robots.txt diatas akan memblock index mesin pencari untuk semua halaman bertipe search (by label, by query dan by published).
Pada konfigurasi robots.txt diatas, intruksi untuk memblok index halaman arsip belum disertakan. Untuk memblok index halaman arsip, akan jauh lebih efektif jika dilakukan melalui meta robots.
Ganti URL pada sitemap sesuai dengan domain blog anda.
Konfigurasi robots.txt diatas akan memblock index mesin pencari untuk semua halaman bertipe search (by label, by query dan by published).
Pada konfigurasi robots.txt diatas, intruksi untuk memblok index halaman arsip belum disertakan. Untuk memblok index halaman arsip, akan jauh lebih efektif jika dilakukan melalui meta robots.
Tambahkan meta robots pada tema blog
- Login ke dashboard blog dan menuju menu Tema > Klik Edit HTML
- Pada antarmuka HTML editor yang terbuka, cari kode </head>
- Tambahkan meta robots berikut tepat sebelum kode </head>
<b:if cond='data:view.isSearch or data:view.isArchive'>
<meta content='noindex, follow' name='robots'/>
</b:if>