Selamat Datang Kawan-kawan di Blognya Aris Wahyu Nugroho
Saat ini aku Kuliah Jurusan Informatika di Batam..!! bagi kalian yang mau berkenalan bisa Add Facebook saya..Jangan Lupa yaa klik Like nya,, biar tambah semangat

Cara Kerja Google Search Engine

Senin, 28 Mei 2012 | komentar

Cara Kerja Google Search Engine – Search Engine seperti Google, Yahoo!, Bing, Cuil, dll, merupakan tempat dimana kita melakukan pencarian data atau informasi berupa kata kunci tertentu. Tahukah kamu bagaimana cara kerja google (search engine), sampai dapat menemukan hasil pencarian dalam waktu singkat dan dengan hasil pencarian yang sangat banyak? Disini saya mengutip cara kerja Google dari buku Google Hacking – Cara Baru Melakukan Hacking Tanpa Tools karya Efvy Zam Kerinci

Sebuah search engine memiliki komponen yang disebut sebagai spider (laba-laba) atau sering disebut juga dengan crawler. Elemen spider tersebut melakukan kunjungan atau mengakses ke situs-situs internet untuk membaca isinya dan mengikuti berbagai link yang ada dalam situs tersebut. Biasanya search engine melakukan kunjungan tersebut secara berkala untuk melihat jika ada perubahan-perubahan yang terjadi.

Program yang dikenal sebagai crawler, spider atau robot yang digunakan Google sebagai petugas penjelajah dunia internet tersebut dinamakan Cusco, Scooter dan Deephot. Ketiga program Google tersebut menilai sebuah situs dengan berbagai cara.

Pertama-tama mencari info utama dari sebuah tittle-tag, HTML tag, serta meta tag. Selain itu, juga menelusuri teks yang ada pada situs beserta link-nya. Tidak ketinggalan pula untuk memeriksa file robot.txt yang memuat informasi mana saja yang boleh diteruskan dan yang tidak. Dari hal ini maka aka ada direktori tertentu yang diabaikan pendataannya. Terutama pada file-file yang berisi informasi sensitif.

Tiap-tiap elemen yang ditemui oleh sang laba-laba (spider) akan direkam (record) dalam sebuah index. Mirip sebuah buku raksasa yang berisikan copy dari situs yang telah ditemukan. Apabila ditemukan perubahan pada situs, secara otomatis pula spider melakukan update.
Google melakukan proses pengindeksan tersebut secara otomatis dan teratur. Pada saat itu pula Google mendata halaman baru, membuang link yang mati, dan memperbarui link tersebut.
Terkadang diperlukan proses penulisan halaman baru dari yang ditemukan spider. Jadi, akan ada kemungkinan bahwa informasi terbaru dalam situs internet tersebut tidak masuk dalam katalog index.
Selanjutnya, aplikasi search engine yang bertugas memilah ribuan data yang terdapat dalam katalog. Serta mencocokkannya sesuai dengan permintaan si pencari. Barulah kemudian menampilkannya berupa daftar sesuai dengan urutan (ranking). aplikasi yang digunakan Google untuk membuat ranking tersebut dikenal dengan sebutan PageRank.
Sebelum sebuah search engine menampilkan hasil pencariannya, search engine tersebut haruslah terlebih dahulu menemukan dokumen yang dicari. Andaikata search engine tidak memberikan informasi yang kita cari, itu bukan berarti informasi tersebut tidak tersedia di internet. Bisa jadi informasi yang kita cari tersebut belum ditemukan oleh search engine.

Sewaktu mencari informasi menggunakan Google, Google akan mengabaikan beberapa kata berikut: a, about, an, and, are, as, at, be, by, from, how, i, in, is, it, of, on, or, that, the, this, to, we, what, when, where, which, dan with.

Untuk mengetahui bagaimana sebuah search engine bekerja, kamu dapat membuka situs www.spider-simulator.com. Dalam situs tersebut ditunjukkan bagaimana sebuah search engine memperoleh informasi dalam situs. Program ini disebut spider simulator. untuk mencobanya, kamu hanya perlu memasukkan alamat situs.

Sumber : http://galuhristyanto.web.id/
Share this article :
0 Comments
Tweets
Komentar

Posting Komentar

mohon koment nya sobb..!!
Bagi yg tidak login blog bisa beri komentar sebagai Name/URL
Bagi yg tidak punya blog bisa beri komentar sebagai Anonymoustidak di sarankan

Random Post (silahkan pilih)

 
Support : Home | Daftar Isi | My University
Copyright © 2010-2012. plagiarist - Blog Informasi -
Template Created by Imagine Published by Mas Template
Power On Blogger