Warung Online

Cara Setting & Membuat Robots.txt

Posted by cyber On Saturday, September 17, 2011 1 comments

Cara Setting & Membuat Robots.txt

Robots.txt merupakan sebuah file yang terdapat dalam directory root dari suatu situs yang berguna untuk mengontrol halaman-halaman tertentu agar diindex oleh spider mesin pencari, atau untuk mengatur bagian-bagian tertentu supaya tidak diindex oleh search engine.

Secara default (jika dalam direktori blog atau web tidak ada file robots.txt maka akan memberikan informasi pada Search Engine bahwa seluruh bagian dari blog atau situs dapat dijelajahi dan dimasukkan dalam index-nya. Dan tidak semua bagian sebuah blog atau web itu perlu didatangi search engine, sebagai contoh untuk pengguna wordpress dengan hosting sendiri bagian folder atau direktori wp-admin, wp-content/cache, wp-content/plugins, wp-includes dll tidak perlu diindex, karena tidak ada gunanya, sebaliknya kalau direktori tersebut ikut diindex malah akan merugikan karena akan boros bandwidth dan juga mungkin mengandung data-data penting yang tidak boleh jadi konsumsi publik.

Dengan memblokir direktori atau file tertentu yang memang tidak perlu diindex, ini juga salah satu cara agar blog atau website menjadi lebih SEO, kenapa bisa begitu, karena waktu yang dibutuhkan search engine saat mendatangi blog kita tidaklah lama. Jadi dengan dicegahnya search engine merayapi direktori tertentu maka kesempatan mesin pencari untuk merayapi dan mengindex seluruh konten atau halaman web yang memang perlu ditampilkan (diindex) menjadi lebih besar (lebih diprioritaskan).

Sebagai Contoh anda bisa menggunakan setting seperti ini :

User-agent: Googlebot
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*?*
Disallow: /*?

Setting ini akan mencegah search engine untuk merayapi dan mengindex file php, javascript, css dll.

Contoh lainnya :

User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/cache/
Disallow: /wp-content/themes/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /trackback/
Disallow: /feed/
Disallow: /tag/
Disallow: /author/
Disallow: /comments/
Disallow: /category/

Sitemap: at Domainanda.com
Sitemap: at Domainanda.com

Setting ini akan mencegah search engine untuk merayapi dan mengindex direktori cgi-bin, wp-admin, wp-includes dll beserta seluruh file yang ada di dalam direktori tersebut. Jika anda menggunakan plugin Google XML Sitemap Generator bagian paling akhir dari file robots.txt bisa ditambahkan kode ini : Sitemap: at Domainanda.com dan Sitemap: at Domainanda.com

Bagi yang menggunakan plugin Google XML Sitemap Generator, Platinum SEO atau All in One SEO Pack dan kebetulan menyertakan category dan atau tag dalam indexnya, maka setting di bagian berikut harus dihapus supaya sinkron :

Disallow: /tag/
Disallow: /category/

Selain contoh di atas anda juga bisa membuat parameter-parameter tertentu misalnya, jika anda sering mengikuti program paid review dan tidak ingin Page Ranknya turun bisa menggunakan parameter seperti ini :

User-agent: Googlebot
Disallow: /review/

Ini setting khusus yang menggunakan struktur permalink dengan settingan seperti ini : /%category%/%postname%/ dan sebelumnya seluruh postingan paid review harus dijadikan satu dalam kelompok atau kategori review.

Cara membuat file robots.txt :

Buka Program Notepad anda.
Masukkan setting atau parameter-parameter file robots.txt yang diinginkan, contoh yang saya gunakan untuk blog ini bisa dilihat di sini. robots.txt - 4shared.com - document sharing - download
Simpan dengan nama robots.txt.
Upload file tersebut ke root direkori wordpress bisa lewat Cpanel atau FTP.
Cara lainnya login ke Cpanel ~ klik File Manager, klik public_html, klik Icon New File (atas kiri), pada kotak New File Name : beri nama file “robots.txt” (tanpa tanda petik) terus klik create New File.
Kemudian buka file robots.txt tersebut, masukkan parameter-parameter settingan yang diinginkan. Kemudian simpan.

Jangan lupa validasi hasil pembuatan file robots.txt ada dengan mengunjungi link ini New Robots.txt Syntax Checker: a validator for robots.txt files Robots.txt Checker, dan masukkan url file robots.txt anda (contoh http://namadomain.com/robots.txt) pada kotak yang tersedia kemudian lihat hasilnya apakah file robots.txt anda sudah benar-benar valid, jika masih banyak eror di situ dikasih informasi letak erornya.

Valid Robots.txtSelain file robots.txt yang saya tempatkan di root direktori, saya juga menempatkan settingan pengaturan robots pada meta tag yang saya letakkan di file header.php yang ada di folder theme yang saya gunakan, dan settingan ini sudah saya uji joba selama 3 bulan, hasilnya sangat signifikan dalam pengindekan blog ini oleh search engine.

Semoga artikel Cara Setting & Membuat Robots.txt bermanfaat bagi Anda.

Jika artikel ini bermanfaat,bagikan kepada rekan melalui:

+ comments + 1 comments

September 23, 2011 at 1:54 AM

@Prasetyo: klo di blogger susah gan psang robot bgituan,,, ^_^ kbanyakan berupa widget...

Post a Comment

Langganan artikel lewat email

Enter your email address:

Delivered by FeedBurner

AutoSurf Traffic Exchange: Powerful Results with SEO tips | 10KHits - 10KHits provides quality traffic hits to your personal or business websites.
Loading

Sobat BlogCare Mau Tukar Link? Copy/paste code HTML berikut ke sidebar blog sobat

semua jadi satu

Entri Populer

Recent Comment

Followers