چکیده
این مقاله تکامل وب را در رابطه با وب و فناوری های بازیابی اطلاعات بررسی میکند. در این بررسی بین عناصر مختلف وب در زمینهء نمایهسازی و صفحات جستجوی وب وجه تمایز وجود دارد. ده ابزار اصلی و مهم وب براساس معیارهای انتخاب و تعداد اتصالها با یکدیگر مقایسه و ارزیابی شدهاند. ابزارهای جستجو مانند راهنماها و موتورهای جستجوگر نیز مورد بررسی و مقایسه قرار گرفتهاند.
کلیدواژه : وب، راهنما های جستجوگر، موتور های جستجوگر
مقدمه
کلمه اینترنت مخفف "Interconnected Networks" و به معنی شبکههای بههممرتبط است. اینترنت سیستمی برای توزیع و تبادل اطلاعات در سطح جهان است که براساس آخرین آمار موجود در حال حاضر 226 کشور به آن متصل هستند. این مجموعه به همراه فناوریهای ساده کاربردی، سبب کاهش هزینهء نشر الکترونیکی شده است (1).در هر صورت، وب یک عنصر منسجم و واضح مستقل نیست، بلکه دو عنصر مجزای وب وجود دارند: وب قابلرویت و دیدنی، و وب نامرئی و غیرقابل رویت(2).
برای فهم کاربرد این دو عنصر و برای ارزیابی اطلاعات ضرورت دارد که از موضوع خارج شویم و ببینیم چگونه صفحات وب تولید میشوند.
دو نوع صفحهء وب وجود دارند: استاتیک و دینامیک.
صفحات وب استاتیک توسط طراح وب، در خدماتدهندهء وب نصب میشوند و برای هر کس و هر چیزی که وب سایت را مشاهده کند قابل دسترساندو هر تغییری هم باید به صورت دستی انجام شود.
صفحات وب دینامیک توسط رایانه با بهکارگیری دستورهای یک زبان دستنوشته(1) و اغلب «سیجیآیجاوا»(2)که به عنوان پلی بین سرویسگرهای پروتکل انتقال ابرمتن (3) و کاربران وب عمل میکند، ایجاد می شود.
دستورهای یک زبان دستنوشته، نتایج را در یک صفحهء خالی وب جا میدهند و به کاربر، صفحهء وب دینامیک را ارائه میدهند. صفحات وب استاتیک اطلاعات عام و کلی را برای کاربر تهیه میکند، در حالی که صفحات وب دینامیک، اطلاعات منحصربهفرد را برای کاربر تهیه مینمایند. صفحات وب استاتیک برای همهء کاربران قابل رویتاند و در دسترس می باشند.
صفحات وب دینامیک
صفحات وب استاتیک
توسط رایانه تولید میشوند
دستی تولید میشوند.
اطلاعات منحصربهفرد است
اطلاعات عام و کلی است
قابل نمایهسازی نمیباشند
اکثر آنها قابل نمایهسازی هستند
اولین مطالعه در موسسه تحقیقاتی «انئیسی» در پرینستون آمریکا در دسامبر سال 1997 نشان داد که صفحات وب قابل رویت، حداقل 320 میلیون صفحهء وب را شامل میشوند، در حالی که دومین مطالعه تخمین زد که تعداد صفحات وب رشد کرده و به 800 میلیون صفحه در فوریه سال 1999 رسیدهاند. در هر صورت، اکثر ناشرین اطلاعاتشان را بر روی وب به وسیلهء پایگاههای اطلاعاتی بزرگ توزیع میکنند. این اطلاعات اساسا جنبه تجاری دارد (2).
موتورهای جستجوگر(4) و راهنماهای وب
2. 1. راهنماهای وب
چه تفاوتی بین راهنمای وب و موتور جستجو وجود دارد؟
راهنمای وب:
الف. فهرستی از سایتهای وب که از قبل تعیین شدهاند، میباشد؛
ب. توسط ویراستاران جمعآوری شده؛
ج. براساس موضوع و عنوان طبقه بندی شده؛
د. انتخابی است.
با توجه به این که راهنماهای وب توسط افراد جمعآوری میشوند, تصمیمگیری دربارهء کیفیت محتوای هر یک از سایتهای وب قبلا انجام شده است. در نتیجه راهنماهای وب در اینترنت بسیار مورد مراجعه قرار میگیرند، زیرا کاربران به دنبال موضوعات خاصی در اینترنت هستند که این راهنماها، نقطهء شروع خوبی در تشخیص بهترینها در وب میباشند.
در کاربرد راهنماهای وب، کاربر میتواند در بین فهرستهای راهنما حرکت نماید. راهنماهای اصلی وب همچنین اجازهء عبور از دیگر موتورهای جستجو را هم میدهند. مثلا بزرگترین راهنمای وب، یعنی «یاهو»، اجازهء عبور از موتور های جستجوی دیگر را میدهد.
سایتهای وبی که به وسیلهء راهنمای وب نمایهسازی شدهاند، به علت روند تکمیل به صورت دستی، در آن راهنماها باقی میمانند؛ مگر این که به احتمال بسیار ضعیف به صورت دستی حذف شوند. در حالی که وجود دائمی یک لیست یا یک فهرست در موتور جستجو همیشه ضمانت نمیشود، اما ساختن و حضور دائمی یک فهرست در یک راهنمای وب مثل «یاهو» امکانپذیر میباشد.
2. 2. موتورهای جستجوگر
وقتی که یک موتور جستجوگر را به کار میبرید، کاربر، پایگاه اطلاعاتی سایتهای وب را جستجو مینماید. همه موتورهای جستجوگر دارای سه جزء ترکیبی هستند:
الف. «اسپایدرها»(5)که سایتهای وب را بررسی میکنند،
ب. فهرستها و نمایه پایگاه اطلاعاتی؛
ج. نرمافزار بازیابی اطلاعات.
2 . 2 .1. اسپایدرهای موتورهای جستجوگر
پایگاه اطلاعاتی موتورهای جستجوگر ابتدا توسط «اسپایدرها» ساخته میشود و توسط موتورهای جستجوگر به مأخذ اصلی اعزام میشود.«اسپایدرها» برنامههایی هستند که وب را به دنبال صفحات جدید وب جستجو مینمایند، کلمات را نمایهسازی میکنند و اتصال را به صفحات برقرار مینمایند، سپس کلمات نمایهشده را با آدرسی که به یک صفحهء وب یا هر منبعی که بر روی وب جهانی و به طور کلی اینترنت قرار دارد اشاره مینماید,(6) مقابله میکنند.
2. 2 .2. نمایهء پایگاه اطلاعاتی موتور جستجو
این بخش عنصر اصلی از هر موتور جستجو است. این همان چیزی است که کاربر به دنبال آن است. در طی سال 1998 تعدادی از تولیدکنندگان موتورهای جستجو آغاز به کار کردند. این شرکتها نمایهها را مطابق با معیارهای گوناگون ساختند. بطور مثال می توان از نمایهء «دایرکت هیل» و «گوگل» (7) نام برد و نیز «نمایهء نامهای حقیقی» (8) که شرکتها را قادر میسازد واژههای کلیدی خود را برای حمایت از محصولات خود ثبت نمایند.
2 . 2 . 3 . نرمافزار بازیابی اطلاعات
تمامی موتورهای جستجوگر، نرمافزار مختص به خود برای پاسخگویی به سوالات دارند.
موتورهای جستجوگر مطابق با قوانین مشابه به شرح زیر عمل مینمایند: هر سایت وب شامل کلمات یا واژههایی است که سوءال کاربر را با آنها مقابله میکند. و در صفحهء نمایش، به صورت فهرستوار نمایش میدهد و با توجه به سوال کاربر و ارتباط موضوعی، فهرستی از مطالب را طبقهبندی مینماید. تفاوت مختصری در چگونگی کار الگوریتمها بین موتورهای جستجو وجود دارد، که دلیلی بر این مدعااست که کاربران، با یک پرسش واحد, از موتورهای مختلف نتایج متفاوتی را کسب مینمایند. در هر صورت، دلیل مهم دیگر اختلاف نتایج جستجو، نسبت پایین همپوشانی، در بین موتورهای جستجوگر میباشد.
3 . پورتالها
«پورتال»(9) ها سایتهای وبی هستند که خود عرضهکنندهء خدمت خاصی نیستند، ولی مراجعین را به صورت ساده و دوستانه به اطلاعات و سایتهای موردعلاقهشان هدایت میکنند. «پورتال» ها نقاط اصلی برای راهبردهای تجارت الکترونیکی هستند و به تدریج از سال 1994 به وسیلهء سه نوع شرکت اینترنتی به وجود آمدند. این شرکتها که نقش اساسی در توزیع زنجیرهء اطلاعاتی برای کاربر ایفا میکنند به شرح زیر میباشند:
الف. تولیدکنندگان خدمات اینترنتی(10)
ب. سایتهای جستجو(11)
ج. تولیدکنندگان مرورگر(12)
سایت «اکسایت»(13) نمونهای که از یک سایت پورتال موفق است(1).
4. توسعه و تکامل فناوری جستجو
همهء ما تکامل زندگی بشر بر روی کره خاکی را به خاطر داریم. همانطور که همگی ما میدانیم، شکلهای مختلف زندگی سلولی برای مدتهای بسیار طولانی قبل از تکامل زیستی وجود داشته است. در هر صورت هنگامی که به این نقطه از تکامل دست یافتیم، تغییرات به فرم سازمانیافتهء آن در مدت زمان کمتری به انجام رسید.
همین مطلب برای فناوری جستجوی وب نیز صادق است. با تاکید بر روی پورتالیزیشن و تجارت الکترونیکی، اولین نسل سایتهای جستجو، عملاً و به تدریج فراموش شدند و این در حالی است که آنها تا سالهای متمادی، حکومت اصلی را به عهده داشتند؛ اما بدلیل این که نتوانستند خودشان را با تغییرات محیطی وفق بدهند، فراموش گردیدند و انواع جدیدی از تولیدکنندگان جستجو به بهرهبرداری رسیدند.
4 .1. موتورهای جستجوی ماورا
موتورهای جستجوی ماورا(14) به کاربر این امکان را میدهند که از میان موتورهای جستجوی متعدد و راهنماهای وب به طور مقارن و همزمان، جستجو نماید (2و3).
محبوبترین موتورهای جستجوی ماورا به شرح زیر میباشند:
- Dogpile ( www.dogpile.com )
- Mamma ( www.mamma.com )
- 2Q ( www.2q.com )
- Infind ( www.infind.com )
- Insleuth ( www.isleuth.com )
- Surfy ( www.surfy.com )
- Webtaxi ( www.webtaxi.com )
4 .2. نسل اول موتورهای جستجو که توسط سایتهای وب بصورت«اسپایدر», نمایهسازی را ایجاد کردند، انبوهی از واژهها و کلمات را تجزیه و تحلیل نمودند. راهنماهای وب به طور دستی گردآوری شدند و از آوریل 1998 مورد بهرهبرداری قرار گرفتند: یکی از این راهنماها به نام «دایرکت هیل»(15)یک حرکت ریشه ای را آغاز کرد و اصلاحاتی انجام داد و روش خود را «راه سوم»(16) نامید.
این راهنمای وب ادعا میکرد که در زمان جستجو، کنترل با کاربر است و نتایج به صورت طبقهبندی شده بر روی سایت وب نمایان میشوند. این موتور جستجو، آنچنان که ادعا میکرد نتوانست خدمات منحصربهفردی را ارائه نماید. بنابراین موتور جستجوی دیگری به نام «هاتبات»(17)به جای آن تولید شد (2).
4 .3. جستجوی زبان طبیعی
همانطور که قبلا بحث شد، اولین نسل موتورهای جستجو با مقابلهء واژههایی که توسط کاربران ارائه میشدند عمل مینمودند. آنها به محتوای واژههای جستجو توجه نمی کردند. برای مثال به ارتباط منطقی بین واژههای جستجو و دیگر معناهای لغوی توجه نمیشد، به علاوه، لغات را به صورت تحتاللفظی جستجو میکردند و به واژهها و توصیفگرهایبولی نظیر and, or, not توجه نداشتند. دو موتور جستجوی جدید یکی پس از دیگری در طول یک هفته آغاز به کار کردند. این موتورهای جستجو، به شرح زیر زبان طبیعی را برای جستجو پیشنهاد کردند: