Enam Arsutektur
Search Engine
1.Spider
Spider merupakan sebuah program untuk menemukan halaman
baru yang masih ada maka dibutuhkan software khusus atau informasi pada ratusan
jutaan halaman web. Spider digunakan untuk membawa halaman situs web ke mesin
pencari atau search engine.
Bagaimana cara bekerja spider pada search
engine ?
Inilah jawabannya : 1. Spider mengumpulkan informasi dari website yang paling popular
saat
itu dan server yang paling banyak di akses.
2. setelah
mengambil informasi dari website tersebut kemudian spider menelusuri semua link
pada website.
3. Untuk
mengetahui popular atau tidak maka pada search engine googke diterapkan Algoritma
pagerank,yaitu misalnya semakin banyak website lain yang mempunyai Link ke
website A maka semakin popular website A tersbut.
Kelemahan jika menggunakan spider, yaitu:
1.
Membutuhkan bandwidth yang sangat besar
2.
Bisa membuat server overload jika lalu lintas
informasi dari atau server sangat tinggi.
Untuk mengatasi kelmahan ditas maka pada
server digunakan rumus jika membutuhkan t
detik untuk mendownload sebuah dokumen dari server maka Spider akan menunggu
10*t detik untuk mendownload dokumen berikutnya.
2.Crawling
Crawling adalah suatu program yang ada di search
engine yang menjadi proses pengambilan sejumlah besar halaman Web , dengan
cepat ke dalam suatu tempat penyimpanan lokal dan mengindeksnya berdasarkan
kata kunci , tugas crawling adalah membantu spider untuk menentukan arah yang
ditujunya sekaligus mengevaluasi link tersebut.
3.
Indexer
Indexer adalah suatu komponen search engine
yang bertugas untuk mendeskripsikan suatu halaman web site dan menganalisa
berbagai unsur di dalamnya, seperti pada penulisan title, penulisan huruf,
keyword** yang ada di konten sehingga dapat mengenal web tersebut lebih jauh
lagi terutama dalam menganalisa suatu ketword.
4.DataBase
Database merupakan komponen search engine
yang bertugas sebagai tmpat meletakkan data-data sebelumnya yang telah
didownload oleh spider serta sebagai tempat yang tadinya digunakan oleh indexer
dalam menganalisa web.
5.Result Engine
Result Engine
menrupakan program yang bertugas untuk menggolongkan suatu web site dan
menentukan suatu perangkingan dalam hasil pencarian yang diminta oleh user.
6.Web Server
Web Server merupakan komponen terakhir pada
search engine yang berfungsi melayani permintaan kepada user yang merupakan
balik dari permintaan user tersebut. Web server merupakan bagian central
terhadap apa-apa yang diminta oleh user.
Tidak ada komentar:
Posting Komentar