Mengatasi Internal Site Search Spam WordPress
Sepanjang tahun, saya melihat ada-nya widespread SEO spam “attack” yang menargetkan hampir semua web wordpress di dunia. Serangan ini melakukan spam menggunakan fungsi internal site search spam dan bot crawler IP berbeda. Meskipun secara SEO serangan ini tidak mempengaruhi ranking artikel. Tapi untuk website dengan skala yang besar, serangan ini membuat web owner menjadi cukup khawatir.
Negatif-SEO memang istilah yang populer sejak dulu. Meskipun Google mengumumkan bahwa mereka bisa mengatasi Negatif SEO dengan baik, namun banyak orang yang berpikir bahwa resiko pasti tetaplah ada. Begitu pula dengan spam internal site search ini. Metode ini pertama kali terdeteksi beberapa waktu lalu, ketika kita melihat index page halaman di laporan Google Search Console.
Meskipun reporting diatas tidak membahayakan SEO website, namun jika Google crawl URL dalam skala besar, hal itu tentu bisa menghabiskan ‘crawl budget’. Lebih penting lagi, hal ini membuang-buang listrik dan sumber daya server untuk penyerang, korban, dan mesin pencari. Pada skala besar terutama, pemborosan dan dampaknya pasti akan terus bertambah.
Contoh Penyerangan Spam Internal Site Search
Jika kita telaah, metode penyerangan ini memiliki beberapa variasi. Beberapa di antaranya adalah:
- Spam BOT menargetkan URL format ?s=example dan /search/example. Penyerang akan mencoba keduanya, dengan harapan website yang diserang menggunakan salah satu fungsi, atau keduanya. Jika kalian menggunakan sistem Static Caching HTML, maka pastikanlah bahwa query atau search tidak tersimpan dalam static cache html.
- Mereka menargetkan paginasi, seperti /halaman/5/?s=contoh atau /search/page/2/?s=contoh. Variasi ini adalah yang paling jahat, karena tautan paginasi di WordPress itu memang meneruskan parameter kueri ke URL paginasi. Sekarang situs Anda bisa menautkan URL spam ini, dan ‘memvalidasinya’. Hal itu menciptakan kekacauan besar di Google Search Console dari URL spam yang ‘merujuk diri sendiri’, dan menyulitkan untuk melacak sumber aslinya.
- Selain itu, Spam Attack juga menargetkan versi RSS feed dari hasil pencarian (misalnya, /search/[spam]/feed/rss2/). Ini sangat pintar, dan saya menduga ini adalah metode yang paling pertama digunakan. Itu karena sistem lain secara aktif mencari dan mengkonsumsi RSS feed, dan sering kali mengubah URL menjadi tautan. Itu menciptakan tautan kembali ke situs yang menyerang di lebih banyak situs. Situs WordPress Anda hanyalah bagian dari serangan ‘man in the middle’.
Pengaruh Search Spam Terhadap SEO
Saya bisa pastikan serangan ini tidak memberikan pengaruh buruk terhadap SEO secara langsung. Namun untuk berjaga-jaga, silahkan kalian install plugin SEO seperti Yoast SEO, Rank Math atau lainnya untuk mengatasi masalah Internal Site Search Spam ini.
Basicnya, plugin tersebut memberikan attibute noindex ke semua URL yang tidak memiliki kaitan langsung dengan artikel. Plugin juga bisa membersihkan Crawl sehingga, Google BOT dan Search Engine lainnya tidak memaksimalkan resource mereka untuk halaman spam.
Untuk lebih pastinya lagi, silahkan gunakan fitur ROBOTS.txt. Untuk disallow fungsi search, agar tidak di crawl oleh mesin pencariannya. Kodenya adalah sebagai berikut:
# We're experimenting with blocking search results to prevent search result spam Disallow: /?s=* Disallow: /search/*