Apa itu Search Engine??
Search engine disebut juga dengan mesin pencari, dimana sistem yang ada pada sistem tersebut diolah melalui satu atau sekelompok komputer yang berfungsi untuk melakukan pencarian data. Data yang ada pada mesin ini dikumpulkan oleh mereka melalui suatu metoda tertentu, dan diambil dari seluruh server yang dapat mereka akses. Jika dilakukan pencarian melalui search engine ini, maka pencarian yang dilakukan sebenarnya adalah pada database yang telah terkumpul di dalam mesin tersebut. Jadi dapat di simpulkan Searh Engine adalah Mesin Pelacak atau penelusur.
Search engine disebut juga dengan mesin pencari, dimana sistem yang ada pada sistem tersebut diolah melalui satu atau sekelompok komputer yang berfungsi untuk melakukan pencarian data. Data yang ada pada mesin ini dikumpulkan oleh mereka melalui suatu metoda tertentu, dan diambil dari seluruh server yang dapat mereka akses. Jika dilakukan pencarian melalui search engine ini, maka pencarian yang dilakukan sebenarnya adalah pada database yang telah terkumpul di dalam mesin tersebut. Jadi dapat di simpulkan Searh Engine adalah Mesin Pelacak atau penelusur.
Untuk mengenal lebih jauh search engine ini, maka kita perlu mengetahui terdiri dari unsur apa saja search engine itu dan bagaimana setiap komponennya itu bekerja, Komponen dari search engine adalah sebagai berikut.
- Spider
Spider
merupakan sebuah program yang cara kerjanya hampir mirip dengan browser yang
berguna untuk mendownload halaman web. Walaupun mirip spider beda dengan
browser, spider tidak terlihat karena ditujukan kepada mesin yang langsung
disimpan pada database mereka, sedangkan browser ditujukan untuk useryang
langsung menampilkan informasi baik berupa teks, gambar dan sebagainya.
- Crawler
Sebuah program
yang dimiliki search engine yang bertugas menelusuri setiap link yang ada dalam
suatu website. Tugas dari crawler yaitu membantu spider untuk menentukan arah
yang akan ditujunya sekaligus mengevakuasi link tersebut.
Dalam melakukan prosesnya, web crawler juga
mempunyai beberapa persoalan yang harus mampu di atasinya. Permasalahan
tersebut mencakup :
- Halaman mana yang harus dikunjungi terlebih dahulu.
- Aturan dalam proses mengunjungi kembali sebuah halaman.
- Performansi, mencakup banyaknya halaman yang harus dikunjungi.
- Aturan dalam setiap kunjungan agar server yang dikunjungi tidak kelebihan beban.
- Kegagalan, mencakup tidak tersedianya halaman yang dikunjungi, server down, timeout, maupun jebakan yang sengaja dibuat oleh webmaster.
- Seberapa jauh kedalaman sebuah website yang akan dikunjungi.
Hal yang tak kalah pentingnya adalah
kemampuan web crawler untuk mengikuti
perkembangan teknologi web, dimana setiap kali teknologi baru muncul, web crawler harus dapat menyesuaikan diri agar dapat mengunjungi halaman web yang menggunakan teknologi baru tersebut.
perkembangan teknologi web, dimana setiap kali teknologi baru muncul, web crawler harus dapat menyesuaikan diri agar dapat mengunjungi halaman web yang menggunakan teknologi baru tersebut.
- Indexer
Sebuah
program yang menganalisa suatu halaman web dan berbagai unsure di dalamnya,
seperti pada penulisan title, penulisan huruf, keywoard-keyword dan sebagainya
yg telah di download dan diolah oleh spider dan crawler
- Database
Tempat
meletakkan data-data sebelumnya yang telah di download oleh spider serta tempat
yang tadinya digunakan oleh indexer dalam menganalisa suatu halaman website.
- Result Engine
Merupakan
program yang bertugas menggolongkan suatu website dan menentukan perangkingan
dalam hasil pencarian yang diminta oleh user. Progam ini menganalisa sapakah
yang layak masuk keriteria utama dalam perangkingan suatu keyword yang diminta
oleh pengguna. Yang ditampilkan terlebih dahulu dari pencarian adalah website
yang telah memenuhi peraturan dan kaedah-kaedah yang ditentukan oleh search
engine tersebut.
- Web Server
Bagian ini
merupakan pusat komputer yang ada pada search engine yang melayani permintaan
kepada user yang merupakan umpan balik dari permintaan user tersebut.
Cara
Kerja Search Engine
Komponen-komponen
tersebut saling berkaitan dengan unsur-unsurnya yang lain. Setelah komponennya
kita bahas selanjutnya kita bahas cara kerjanya. Pada dasarnya hampir semua
search engine bekerja dengan tiga point.
- Web Crawling
Pertama
kali search engine harus mencari file dari databasenya sebelum menampilkan
alamatnya, dibantu dengan sebuah software khusus yaitu spider yang dapat
memilih informasi yang ada baik dalam memilih informasi yang ada baik dalam
ratusan juta halaman web sekalipun serta membuat daftar kata-kata didalam
database, proses inilah yang disebut dengan Web Crawling.
- Indexing
Dimana
point ini bekerja menyimpan index dari tiap-tiap file yang ditemukan beserta
alamatnya. Selain itu dengan proses index dapat juga mempercepat kerja sistem
spidering untuk mencari file dalam website yang paling banyak digunakan.
- Searching
Yang lebih
kearah penyediaan fasilitas bagi pengguna untuk mencari kata-kata atau
kombinasi kata paling relevan yang ditemukan dalam index tersebut.
Cara penggunaan search engine adalah dengan
mengetikkan kata kunci (keyword) yang hendak dicari dan setelah itu akan
ditampilkan sejumlah link yang akan mengarahkan kita kepada situs atau
informasi yang ada relevansinya dengan keyword yang kita masukkan.
Misal dalam Mesin pencari web, bekerja dengan cara menyimpan hampir semua informasi halaman web, yang diambil langsung dari www. Halaman-halaman ini diambil secara otomatis. Isi setiap halaman lalu dianalisis untuk menentukan cara mengindeksnya (misalnya, kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.
Ketika seorang pengguna mengunjungi mesin pencari dan memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen dan terkadang sebagian teksnya.
Mesin pencari lain yang menggunakan proses real-time, seperti Orase, tidak menggunakan indeks dalam cara kerjanya. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time ini unggul dalam beberapa hal seperti informasi selalu mutakhir, (hampir) tak ada broken link, dan lebih sedikit sumberdaya sistem yang diperlukan (Google menggunakan hampir 100.000 komputer, Orase hanya satu.). Tetapi, ada juga kelemahannya yaitu pencarian lebih lama rampungnya.
Tidak ada komentar:
Posting Komentar