Cara
Kerja Google Search Engine – Search Engine
seperti Google, Yahoo!, Bing, Cuil, dll, merupakan tempat dimana kita melakukan
pencarian data atau informasi berupa kata kunci tertentu. Tahukah kamu
bagaimana cara kerja google
(search engine), sampai dapat menemukan hasil pencarian dalam waktu singkat dan
dengan hasil pencarian yang sangat banyak? Disini saya mengutip cara kerja
Google dari buku Google Hacking – Cara Baru Melakukan Hacking Tanpa Tools karya Efvy Zam Kerinci.
Sebuah search engine
memiliki komponen yang disebut sebagai spider (laba-laba) atau sering
disebut juga dengan crawler. Elemen spider tersebut melakukan
kunjungan atau mengakses ke situs-situs internet untuk membaca isinya dan
mengikuti berbagai link yang ada dalam situs tersebut. Biasanya search engine
melakukan kunjungan tersebut secara berkala untuk melihat jika ada
perubahan-perubahan yang terjadi.
Program yang dikenal
sebagai crawler, spider atau robot yang digunakan Google
sebagai petugas penjelajah dunia internet tersebut dinamakan Cusco, Scooter
dan Deephot. Ketiga program Google tersebut menilai sebuah situs dengan
berbagai cara.
Pertama-tama mencari
info utama dari sebuah tittle-tag, HTML tag, serta meta tag.
Selain itu, juga menelusuri teks yang ada pada situs beserta link-nya. Tidak
ketinggalan pula untuk memeriksa file robot.txt yang memuat informasi
mana saja yang boleh diteruskan dan yang tidak. Dari hal ini maka aka ada
direktori tertentu yang diabaikan pendataannya. Terutama pada file-file yang
berisi informasi sensitif.
Tiap-tiap elemen yang
ditemui oleh sang laba-laba (spider) akan direkam (record) dalam sebuah
index. Mirip sebuah buku raksasa yang berisikan copy dari situs yang telah
ditemukan. Apabila ditemukan perubahan pada situs, secara otomatis pula spider
melakukan update.
Google melakukan
proses pengindeksan tersebut secara otomatis dan teratur. Pada saat itu pula
Google mendata halaman baru, membuang link yang mati, dan memperbarui link
tersebut.
Terkadang diperlukan
proses penulisan halaman baru dari yang ditemukan spider. Jadi, akan ada
kemungkinan bahwa informasi terbaru dalam situs internet tersebut tidak masuk
dalam katalog index.
Selanjutnya, aplikasi
search engine yang bertugas memilah ribuan data yang terdapat dalam katalog.
Serta mencocokkannya sesuai dengan permintaan si pencari. Barulah kemudian
menampilkannya berupa daftar sesuai dengan urutan (ranking). aplikasi yang
digunakan Google untuk membuat ranking tersebut dikenal dengan sebutan PageRank.
Sebelum sebuah search
engine menampilkan hasil pencariannya, search engine tersebut haruslah terlebih
dahulu menemukan dokumen yang dicari. Andaikata search engine tidak memberikan
informasi yang kita cari, itu bukan berarti informasi tersebut tidak tersedia
di internet. Bisa jadi informasi yang kita cari tersebut belum ditemukan oleh
search engine.
Sewaktu mencari
informasi menggunakan Google, Google akan mengabaikan beberapa kata berikut: a,
about, an, and, are, as, at, be, by, from, how, i, in, is, it, of, on, or,
that, the, this, to, we, what, when, where, which, dan with.
Untuk mengetahui
bagaimana sebuah search engine bekerja, kamu dapat membuka situs www.spider-simulator.com. Dalam situs tersebut ditunjukkan bagaimana sebuah search engine memperoleh informasi
dalam situs. Program ini disebut spider
simulator. untuk mencobanya, kamu hanya perlu memasukkan alamat situs.
Sumber :
http://galuhristyanto.web.id/