موتور جستجوگر گوگل امروزه متداول ترین ابزار جستجو می باشد .خدمات جستجویی که در وب ارائه می شود به دو گروه اصلی زیر تقسیم می شود:
Search Engine (موتور جستجو گر)
Directory (فهرست)
DIRECTORY : دایرکتوریها اطلاعات را در گروه های مختلف دسته بندی می کنند.
تفاوت اصلی دایرکتوری با یک موتور جستجو در این است که اطلاعات پایگاه داده در موتورهای جستجو را نرم افزارها جمع آوری می کنند ولی این کار برای directory ها توسط انسانها انجام می شود.
موتور جستجو چگونه کار می کند؟
- وقتی جستجویی در یک موتور جستجوگر انجام و نتایج جستجو ارایه می شود، كاربران در واقع نتیجه كار بخش های متفاوت موتور جستجوگر را می بینند.
- موتور جستجوگر قبلا” پایگاه داده اش را آماده كرده است و این گونه نیست كه درست در همان لحظه جستجو، تمام وب را بگردد.
معماری موتورهای جستجوگر
بخشهای مجزای یک موتور جستجوگر عبارتند از:
- Spider – Crawler- Indexer- Database- Ranker
Spider :
کار یک اسپایدر بسیار شبیه کار کاربران وب است.همانطور که کاربران وب صفحات را بازدبد می کننداسپایدر هم دقیقاٌ همین کار را انجام می دهد با این تفاوت که کدهای html صفحات را می بیند اما کاربران خیر.
اسپایدر به هنگام مشاهده صفحات از خود بر روی سرور ها ردپا بر جای می گذارد.
Crawler: نرم افزاری است که به عنوان یک فرمانده برای اسپایدر عمل می کند و مشاهده می کند که اسپایدر کدام صفحات را مورد بازدید قرار دهد.
به عنوان مثال کراولر تصمیم می گیرد که کدام یک از لینک های صفحه ای که اسپایدر در حال حاضر در آن قرار دارد دنبال شود.
Indexer: تمام اطلاعات جمع آوری شده توسط اسپایدر در اختبار ایندکسر قرار می گیرد.در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می گیرند و به بخش های متفاوتی تقسیم می شوند.
در واقع ایندکسر صفحه را به پارامترهای آن خرد می کند و تمام این پارامترها را به یک مقیاس عددی تبدیل می کند با سیستم رتبه بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند.
Data Base: تمام داده های تجذیه و تحلیل شده در ایندکسر به پایگاه داده ارسال می گردد.در این بخش داده های گروه بندی,کدگذاری و ذخیره می شوند همچنین داده ها قبل از آنکه ذخیره شوند طبق تکنیک های خاصی فشرده می شوند تا حجم کمی از پایگاه داده را اشغال کنند.
يک سايت خوب با پايگاه دادهاي با محتواي خوب شانس بيشتري به نسبت يک سايت با پايگاه داده ضعيف دارد.
Ranker: بعد از آنکه تمام مراحل قبل انجام شد موتور جستجو آماده پاسخگویی به سوالات کاربران است.برای پاسخگویی به درخواست کاربر ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جستجو مرتبط هستند مشخص می شوند.
پس از آن سیستم رتبه بندی وارد عمل شده و آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب می کند و به عنوان نتایج جستجو به کاربر نمایش می دهد.