Rabu, 11 Juli 2012

6 arsitektur search engine

Enam Arsutektur Search Engine
1.Spider
Spider merupakan sebuah program untuk menemukan halaman baru yang masih ada maka dibutuhkan software khusus atau informasi pada ratusan jutaan halaman web. Spider digunakan untuk membawa halaman situs web ke mesin pencari atau search engine.
Bagaimana cara bekerja spider pada search engine ?
Inilah jawabannya :     1. Spider mengumpulkan informasi dari website yang paling popular
            saat itu dan server yang paling banyak di akses.
2. setelah mengambil informasi dari website tersebut kemudian spider menelusuri semua link pada website.
3. Untuk mengetahui popular atau tidak maka pada search engine googke diterapkan Algoritma pagerank,yaitu misalnya semakin banyak website lain yang mempunyai Link ke website A maka semakin popular website A tersbut.
Kelemahan jika menggunakan spider, yaitu:
1.     Membutuhkan bandwidth yang sangat besar
2.    Bisa membuat server overload jika lalu lintas informasi dari atau server sangat tinggi.
Untuk mengatasi kelmahan ditas maka pada server digunakan rumus jika membutuhkan t detik untuk mendownload sebuah dokumen dari server maka Spider akan menunggu 10*t detik untuk mendownload dokumen berikutnya.

2.Crawling      
Crawling adalah suatu program yang ada di search engine yang menjadi proses pengambilan sejumlah besar halaman Web , dengan cepat ke dalam suatu tempat penyimpanan lokal dan mengindeksnya berdasarkan kata kunci , tugas crawling adalah membantu spider untuk menentukan arah yang ditujunya sekaligus mengevaluasi link tersebut.
3.    Indexer
Indexer adalah suatu komponen search engine yang bertugas untuk mendeskripsikan suatu halaman web site dan menganalisa berbagai unsur di dalamnya, seperti pada penulisan title, penulisan huruf, keyword** yang ada di konten sehingga dapat mengenal web tersebut lebih jauh lagi terutama dalam menganalisa suatu ketword.
4.DataBase
Database merupakan komponen search engine yang bertugas sebagai tmpat meletakkan data-data sebelumnya yang telah didownload oleh spider serta sebagai tempat yang tadinya digunakan oleh indexer dalam menganalisa web.
5.Result Engine
Result Engine menrupakan program yang bertugas untuk menggolongkan suatu web site dan menentukan suatu perangkingan dalam hasil pencarian yang diminta oleh user.
6.Web Server
Web Server merupakan komponen terakhir pada search engine yang berfungsi melayani permintaan kepada user yang merupakan balik dari permintaan user tersebut. Web server merupakan bagian central terhadap apa-apa yang diminta oleh user.





Tidak ada komentar:

Posting Komentar