loading...
پرشین تیک/مرجع کد وابزار وبسایت
امید بازدید : 40 شنبه 15 تیر 1392 نظرات (0)

وقتی جستجویی در یک موتور جستجو انجام و نتایج جستجو ارایه می شود ، کاربران در واقع نتیجه ی همکاری بخش های متفاوتی از آن را می بینند. موتور جستجو قبلا پایگاه داده خود را آماده کرده است و این گونه نیست که درست در همان لحظه ی جستجو ، تمام وب را بگردد تا پاسخی برای پرسش کاربر بیابد .

بسیاری از خود می پرسند که چگونه امکان دارد گوگل در کمتر از یک ثانیه تمام سایت های وب را بگردد و میلیون ها صفحه در خروجی خود لیست کند؟ در حقیقت گوگل و هر موتور جستجوی دیگری توانایی انجام چنین کاری را ندارد . همه ی آن ها در زمان پاسخ گویی به کاربران ، تنها در پایگاه داده ای که در اختیار دارند به جستجو می پردازند و نه در همه وب!
موتور جستجو به کمک بخش های مختلف خود ، اطلاعات مورد نیاز را قبلا جمع آوری ، تجزیه و تحلیل می کند ، آن ها را در پایگاه داده اش ذخیره می کند و به هنگام جستجوی کاربر ، تنها در همین پایگاه داده می گردد.
موتور جستجو را می توان شامل سه بخش اصلی دانست که عبارتند از :
• جمع آوری کننده اطلاعات ، اسپایدر (Spider)
• بایگانی کننده داده ها ، ایندکسر (Indexer)
• تحلیل گر درخواست کاربر (Query Processor)
الف ) جمع آوری کننده اطلاعات ( اسپایدر ، روبوت یا کراولر Spider , Robot , Crawler )

وقتی جستجویی در یک موتور جستجو انجام و نتایج جستجو ارایه می شود ، کاربران در واقع نتیجه ی همکاری بخش های متفاوتی از آن را می بینند. موتور جستجو قبلا پایگاه داده خود را آماده کرده است و این گونه نیست که درست در همان لحظه ی جستجو ، تمام وب را بگردد تا پاسخی برای پرسش کاربر بیابد .

بسیاری از خود می پرسند که چگونه امکان دارد گوگل در کمتر از یک ثانیه تمام سایت های وب را بگردد و میلیون ها صفحه در خروجی خود لیست کند؟ در حقیقت گوگل و هر موتور جستجوی دیگری توانایی انجام چنین کاری را ندارد . همه ی آن ها در زمان پاسخ گویی به کاربران ، تنها در پایگاه داده ای که در اختیار دارند به جستجو می پردازند و نه در همه وب!
موتور جستجو به کمک بخش های مختلف خود ، اطلاعات مورد نیاز را قبلا جمع آوری ، تجزیه و تحلیل می کند ، آن ها را در پایگاه داده اش ذخیره می کند و به هنگام جستجوی کاربر ، تنها در همین پایگاه داده می گردد.
موتور جستجو را می توان شامل سه بخش اصلی دانست که عبارتند از :
• جمع آوری کننده اطلاعات ، اسپایدر (Spider)
• بایگانی کننده داده ها ، ایندکسر (Indexer)
• تحلیل گر درخواست کاربر (Query Processor)
الف ) جمع آوری کننده اطلاعات ( اسپایدر ، روبوت یا کراولر Spider , Robot , Crawler ) ، آن بخش از موتور جستجو است که کار جمع آوری اطلاعات مورد نیاز آن را به عهده دارد. اسپایدر به صفحات مختلف سر می زند (فضولی کردن در وب) ، محتوای آنها را می خواند ، اطلاعات را جمع آوری می کند و در اختیار سایر بخش های موتور جستجو قرار می دهد.
اسپایدر مشخص می کند که کدام صفحات را مورد بازدید قرار دهد . در واقع تصمیم می گیرد که کدام یا از لینک های موجود در هر صفحه را دنبال کند . ممکن است همه لینک ها را دنبال کند ، برخی از آنها را و یا هیچ کدام را دنبال نکند . اسپایدر ممکن است قبلا به گونه ای برنامه ریزی شده باشد که تنها صفحات خاصی از هر سایت را ببیند.
ب ) بایگانی کننده داده ها ، تمام اطلاعات جمع آوری شده توسط اسپایدر در اختیار ایندکسر قرار می گیرد. در این بخش اطلاعات ارسالی مورد تجزیه قرار می گیرند و به تکه های متفاوتی تقسیم می شوند. تجزیه و تحلیل به این معناست که مشخص می شود اطلاعات از کدام صفحه ارسال شده ، چه حجمی دارد ، کلمات موجود در آن کدامند ، کلمات چند بار تکرار شده اند و در کجای صفحه قرار دارند ، صفحه چه زمانی به روز رسانی خواهد شد و …
در حقیقت ایندکسر ، صفحه را به پارامترهای آن خرد می کند و تمام این پارامتر ها را به یک مقیاس عددی تبدیل می کند تا سیستم رنبه بندی بتواند پارامتر صفحات مختلف را با هم مقایسه کند. تمام داده ها تجزیه و تحلیل شده ، گروه بندی ، کدگذاری و ذخیره می شوند. هم چنین داده ها قبل از اینکه ذخیره شوند ، طبق تکنیک های خاصی فشرده می شوند تا حجم کمی را اشغال کنند.
ج ) تحلیل گر درخواست کاربر ، پس از انجام تمامی مراحل گفته شده ، موتور جستجو آماده پاسخ گویی به کاربران است. آنها چند کلمه را در فیلد جستجو وارد می کنند و سپس با فشار دادن دکمه جستجو ، منتظر پاسخ موتور جستجو می مانند . برای پاسخ گویی به درخواست کاربر ابتدا تمامی صفحات مرتبط موجود در پایگاه داده ، مشخص می شوند . پس از آن عمل رتبه بندی صورت می گیرد. به عبارت دیگر صفحات جمع آوری شده ، از بیشترین ارتباط تا کمترین ارتباط با موضوع مطرح شده ، به عنوان نتایج جستجو به کاربر نشان داده می شوند.
حتی اگر موتور جستجو بهترین و کامل ترین پایگاه داده را داشته باشد اما نتواند پاسخ های مرتبطی ارائه دهد ، یک موتور جستجوی ضعیف به شمار می آید . آلتاویستا زمانی مهمترین موتور جستجو در وب بود اما تنها به همین دلیل بازی را به گوگل تازه وارد باخت. در حقیقت سیستم رتبه بندی قلب تپنده یک موتور جستجو است . تفاوت اصلی موتور های جستجو نیز در سیستم رتبه بندی می باشد.
در حال حاضر قدرتمندترین سیستم رتبه بندی را گوگل در اختیار دارد . سیستم رتبه بندی گوگل پیچ رنک (Page Rank) نام دارد که در آموزش های بعدی سئو در مورد آن کاملا شرح می دهیم.

مطالب مرتبط
ارسال نظر برای این مطلب

کد امنیتی رفرش
اطلاعات کاربری
  • فراموشی رمز عبور؟
  • نویسندگان
    نظرسنجی
    از کدام قسمت سایت بهتره؟
    آمار سایت
  • کل مطالب : 183
  • کل نظرات : 3
  • افراد آنلاین : 1
  • تعداد اعضا : 27
  • آی پی امروز : 14
  • آی پی دیروز : 10
  • بازدید امروز : 68
  • باردید دیروز : 13
  • گوگل امروز : 0
  • گوگل دیروز : 0
  • بازدید هفته : 160
  • بازدید ماه : 597
  • بازدید سال : 2,051
  • بازدید کلی : 55,301