Sebuah mesin
mesin pencari web bekerja dengan menyimpan informasi tentang banyak halaman web, yang mereka mengambil dari html itu sendiri. Halaman ini diambil oleh crawler Web (kadang-kadang juga dikenal sebagai laba-laba) - Web browser otomatis yang mengikuti setiap link di situs. Pengecualian dapat dilakukan dengan menggunakanrobots.txt . Isi setiap halaman lalu dianalisis untuk menentukan bagaimana harusdiindeks (misalnya, kata-kata diambil dari judul, judul, atau field khusus yang disebutmeta tag ). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam query nanti. query bisa menjadi kata tunggal. Tujuan dari indeks adalah untuk memungkinkan informasi dapat ditemukan secepat mungkin. Beberapa mesin pencari, seperti Google , menyimpan semua atau sebagian dari halaman sumber (disebut sebagai cache ) maupun informasi tentang halaman web, sedangkan yang lain, seperti AltaVista , menyimpan setiap kata dari setiap halaman yang mereka temukan. Cache halaman ini selalu memegang pencarian teks yang sebenarnya karena merupakan salah satu yang sebenarnya diindeks, sehingga dapat menjadi sangat berguna ketika isi dari halaman saat ini telah diperbarui dan istilah pencarian tidak lagi di dalamnya. Masalah ini mungkin dianggap sebagai bentuk ringan linkrot , dan yang menangani Google itu meningkatkan kegunaan dengan memenuhi harapan pengguna bahwa istilah pencarian akan berada pada halaman web dikembalikan. Ini memenuhi prinsip keheranan setidaknya sejak pengguna biasanya mengharapkan istilah pencarian berada di halaman kembali. relevansi pencarian Peningkatan membuat halaman-halaman cache yang sangat berguna, bahkan di luar fakta bahwa mereka mungkin berisi data yang mungkin tidak lagi tersedia di tempat lain.
Ketika pengguna memasukkan query ke mesin pencari (biasanya dengan menggunakan kata-kata kunci ), mesin memeriksa nya indeksdan memberikan daftar pencocokan laman web-terbaik menurut kriteria, biasanya dengan ringkasan pendek berisi dokumen judul dan kadang-kadang bagian teks. Indeks dibangun dari informasi yang tersimpan dengan data dan metode yang informasi diindeks. Sayangnya, saat ini tidak ada mesin pencari yang dikenal publik yang memungkinkan dokumen yang akan dicari menurut tanggal. Kebanyakan mesin pencari mendukung penggunaan operator boolean AND, OR dan NOT untuk lebih menentukan permintaan pencarian . operator Boolean adalah untuk pencarian literal yang memungkinkan pengguna untuk memperbaiki dan memperluas syarat-syarat pencarian. Mesin mencari kata atau frasa persis seperti masuk. Beberapa mesin pencari menyediakan fitur yang disebut maju pencarian kedekatan yang memungkinkan pengguna untuk menentukan jarak antara kata kunci. Ada juga konsep berbasis mencari dimana penelitian melibatkan menggunakan analisis statistik pada halaman yang berisi kata atau frasa yang Anda cari. Selain itu, pertanyaan bahasa alam memungkinkan pengguna untuk mengetik pertanyaan dalam satu bentuk yang sama akan meminta kepada manusia. Sebuah situs seperti ini akan ask.com.
Kegunaan dari mesin pencari bergantung pada relevansi hasil set itu memberi kembali. Meskipun mungkin ada jutaan halaman web yang mencakup kata tertentu atau frase, sebagian halaman mungkin lebih relevan, populer, atau otoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan metode untuk peringkat hasil untuk memberikan yang "terbaik" hasil pertama. Bagaimana mesin pencari yang memutuskan halaman yang paling cocok, dan apa pesanan hasilnya harus ditunjukkan dalam, sangat bervariasi dari satu mesin yang lain.Metode juga berubah dari waktu ke waktu sebagai perubahan penggunaan internet dan teknik baru berkembang. Ada dua jenis utama mesin pencari yang telah berevolusi: satu adalah sistem kata kunci standar dan hirarki memerintahkan bahwa manusia telah diprogram secara ekstensif. Yang lainnya adalah sistem yang menghasilkan sebuah " indeks terbalik "dengan menganalisis teks ini menempatkan.Bentuk kedua jauh lebih banyak bergantung pada komputer itu sendiri untuk melakukan sebagian besar pekerjaan.
Sebagian besar mesin pencari web adalah usaha komersial yang didukung oleh periklanan pendapatan dan, sebagai hasilnya, beberapa mempekerjakan praktek memungkinkan pengiklan untuk membayar uang untuk memiliki daftar mereka peringkat lebih tinggi dalam hasil pencarian. mesin pencari Mereka yang tidak menerima uang untuk mesin hasil pencarian mereka menghasilkan uang dengan menjalankan terkait iklan pencarian di samping hasil mesin pencarian biasa. Mesin pencari menghasilkan uang setiap kali seseorang mengklik salah satu iklan tersebut.
Tidak ada komentar:
Posting Komentar