چکیده
رشد سریع اطلاعات الکترونیکی در عصر حاضر، زمینهساز ایجاد انواع متعدد شبکههای کتابشناختی گردیده است. دستیابی به اطلاعات الکترونیکی مستلزم استفاده از روش موثر در نمایهسازی و تشخیص کلیدواژههای مهم بیانگر محتوای یک مدرک است. در همین راستا، (او.سی.ال.سی)1 که بزرگترین شبکه کتابشناختی جهان محسوب میشود به منظور فراهم آوردن تسهیلات لازم برای دستیابی سریع وموثر به اطلاعات، اقدام به ساخت سیستمنمایهسازی خودتحت عنوان "وورد اسمیت" نموده است. مبنای کار این سیستم، تشخیص خودکار مفاهیم، کلمات و عبارات کلیدی در متن ماشینخوان، براساس »پردازش زبان طبیعی« است. به این ترتیب شبکه (او.سی.ال.سی) با استفاده از تئوریهای زبانشناسی محاسباتی و معنائی-که مورد تأکید پردازش زبان طبیعی است-و نیز با بکارگیری تئوریهای اطلاعرسانی و مدلهای آماری، سعی در ساخت نمایهای داشته است که علاوه بر همخوانی با حجم عظیم دادههای این شبکه، از کارآئی و توانائی کافی و لازم در بازیابی سریع و موثر اطلاعات از محیط شبکه نیز برخوردار باشد.
کلیدواژهها: شبکه کتاب شناختی (او.سی.ال.سی)، نمایه سازی (دبلیو.اس)، نمایهسازی خودکار، پردازش زبان طبیعی
مقدمه
نمایه مهمترین ابزار در نظامهای بازیابی اطلاعات و کلید اساسی برای دستیابی به اطلاعات مندرج در منابع اطلاعاتی است. ارزش هر نمایه در گرو تهیه بهترین نقاط دستیابی و تأمین رضایت استفادهکنندگان در بازیابی اطلاعات است.
سالهاست که کتابداران مسائل مربوط به ذخیره و بازیابی اطلاعات را مدنظر قرار داده و برای کنترل موثر مواد سنتی، ابزاری را توسعه دادهاند. توجه به روند تکاملی فرآیند نمایهسازی مبیّن این نکته است که افزایش حجم انتشارات و تغییر در شکل ارائه خدمات اطلاعرسانی، نظامهای نمایهسازی را نیز دستخوش تحولات قابل توجهی نموده است. ابداع انواع نمایههای پیشهمارا، پس همارا، نمایههای خودکار و استفاده از انواع زبانهای طبیعی، آزاد و ساخت یافته یا کنترل شده همه تلاشهایی بودهاند در جهت بهبود و تکمیل فرآیند نمایهسازی در انجام رسالت خاص خود.
ایجاد شبکههای متعدد کتابشناختی و نیز رشد سریع آنها، فرصتهای متعدد و چالشهای بیسابقهای را فراروی حرفه کتابداری و اطلاعرسانی برای دستیابی به حجم عظیمی از اطلاعات گذارده است. چنین شرایطی نیاز به مجتمع و یکپارچهسازی منابع موجود در محیط وب و اینترنت همراه با انواع مواد سنتی کتابخانهای، ضرورت بررسی مجدد ابزارهای موجود در بازیابی اطلاعات و کنترل کتابشناختی را ایجاب مینماید.
بزرگترین شبکهء کتابشناختی پیوستهء موجود، شبکه (او.سی.ال.سی) میباشد (هسی-یی، 1996) که در سال 1967 ایجاد شده است و حاوی بیش از 31 میلیون رکورد در فرمتهای مختلف است. این شبکه یک سازمان تحقیقاتی غیرانتفاعی واقع در اوهایو میباشد که با ارائه خدمات کتابخانهای امکان دستیابی 41 هزار کتابخانهء مختلف را به اطلاعات فراهم میآورد. هدف کلی (او.سی.ال.سی) افزایش دسترسپذیری منابع کتابخانهای از طریق اشتراک در منابع و کاهش نرخ رشد هزینههای کتابخانهای است. شبکه (او.سی.ال.سی) در راستای تحقق بخشیدن به این هدف اقدام به تهیه پروژههائی نموده است که یکی از مهمترین این پروژهها، پروژه نمایهسازی دبلیو.اس میباشد.
هدف نمایهسازی دبلیو.اس اصلاح و بهبود دستیابی به اطلاعات الکترونیکی با استفاده از روشهای موءثر برای تشخیص کلیدواژههای مربوط به محتوای یک مدرک میباشد. تشخیص کلمات و عبارات باید به گونهای باشد که به بهترین نحوی مبیّن موضوع مدرک باشند و در نتیجه نمایههای مفید و کارآمدی برای مدارک موجود در وب ایجاد گردد. به همین منظور مبنای این نمایهسازی، تشخیص خودکار مفاهیم در متن ماشینخوان براساس پردازش زبان طبیعی، مدلهای آماری، زبانشناسی محاسباتی و تئوری ردهبندی میباشد.
مقالهء حاضر ضمن معرفی شبکهء کتابشناختی (او.سی.ال.سی) و اشاره به خدمات، پایگاههای اطلاعاتی و پروژههای این شبکه، بطور اجمالی به مرور نظامهای نمایهسازی و زبانهای بازیابی اطلاعات میپردازد و سپس طراحی و ساختار نظام نمایهسازی دبلیو.اس را تشریح مینماید.
پایگاه کتابشناختی (او.سی.ال.سی)
انواع پایگاههای کتابشناختی با هدف تسهیل و تسریع در ارائه خدمات کتابشناختی و کمک به پیشرفت دانش ایجاد شدهاند و از بدو پیدایش خود تاکنون با ارائه سرویسها و خدمات متعدد، افراد و کتابخانههای مختلف را در تحقق اهداف خود یاری بخشیدهاند. این پایگاهها دامنه وسیعی از خدمات را ارائه میدهند از جمله خدمات تهیه مواد، فهرستنویسی و خدمات مرجع. بسیاری از کتابخانهها به دلیل فشارهای اقتصادی، رشد روزافزون حجم انتشارات و در نتیجه لزوم وجود شبکهای برای اشتراک منابع و تعاون بین کتابخانهها و همچنین لزوم تغییر فاز از مالکیت به سمت دستیابی به اطلاعات، بر استفاده از این شبکهها تأکید دارند. بطور کلی از طریق این پایگاهها میتوان به سه پرسش اساسی پاسخ داد: 1) سئوالات کتابشناختی یعنی امکان بدست آوردن اطلاعات کامل دربارهء یک کتاب، مجله یا انواع خاص دیگر مواد کتابخانهای. سیستمهای شبکهای معمولاً دادههای فهرستنویسی کاملی بر روی صفحه (سی.آر.تی) پایانه میآورند. 2) سئوالات تحقیقی (تعیین صحت و سقم چیزی) مربوط به تشخیص هجی صحیح نام یک نویسنده، نام ناشر، تاریخ و غیره. 3) سئوال در مورد تعیین محل مدرک. از طریق این قبیل سیستمها میتوان فهمید که کدام کتابخانهها مواد اطلاعاتی مورد نیاز را دارند.
سیستمهای کتابشناختی مثل (آر.ال.آی.ان)، (او.سی.ال.سی) و غیره شبکههائی غیرانتفاعی و بینالمللی هستند که با روشهای متنوعی اداره میشوند و به شکلهای بسیار متفاوت اقدام به ارائه خدمات مینمایند. عملکردهای خاص این شبکهها عبارتند از: تعیین محل سریع کتاب، مقاله و غیره؛ فراهمآوری و تهیه مواد از طریق مستقیم یا غیرمستقیم؛ کنترل گردش و دستیابی فهرست راه دور و فهرستنویسی مشترک. هر سیستم شامل مدخلهای فهرستگان ملی مثلاً رکوردهای مارک است. این رکوردها شامل همه فرمتها از جمله کتاب، نشریهء ادواری و نسخ دستی میباشند.
بزرگترین شبکهء کتابشناختی موجود، شبکهء (او.سی.ال.سی) میباشد (هسییی، 1996) که به منظور دستیابی بیشتر به اطلاعات جهانی بوجود آمده است. موءسسات و کتابخانههای دانشگاهی و تحقیقاتی (هر کدام با توجه به نوع نیاز خود) در سطح وسیعی از این شبکه استفاده میکنند. این شبکه، یک سازمان تحقیقاتی غیرانتفاعی است که به ارائه خدمات کتابخانهای میپردازد و در اوهایو واقع شده است.
تاریخچه، اهداف و عضویت در (او.سی.ال.سی)
در سال 1967، مسئولین دانشکدهها و دانشگاهها در اوهایو، یک سیستم کامپیوتری به نام »مرکز کتابخانهای کالج اوهایو«2 را ایجاد نمودند که در آن کتابخانههای موءسسات آکادمیک اوهایو میتوانستند در منابع مشترک شوند و هزینهها را کاهش دهند. اولین دفاتر (او.سی.ال.سی) در کتابخانهء اصلی دانشگاه ایالتی اوهایو مستقر گردیدند و اولین دفتر کامپیوتری آن در مرکز تحقیقاتی "او.سی.یو"3 جای گرفت. فردریک کلیگور، اولین مسئول (او.سی.ال.سی) بود. در سال 1991 ساختمان مدیریت OCLC توسعه یافت. این شبکه دارای پنج مرکز مدیریت در کلمبو، اوهایو و کتابخانه اصلی دانشگاه ایالتی اوهایو میباشد و محل کنونی آن در فرانتس رود 6565 در دوبلین است. اداره (او.سی.ال.سی) با اعضای آن است. ساختار مدیریتی آن متشکل از اعضای عمومی، شورای اعضا و هیأت امناء است. (او.سی.ال.سی) از یک سیستم کامپیوتری منطقهای برای 45 کالج اوهایو شروع شد و در نهایت به یک شبکهء بینالمللی تبدیل گردید. در سال 1977 اعضای (او.سی.ال.سی) از اوهایو، با عضویت کتابخانههای خارج از اوهایو موافقت کردند و به این ترتیب، (او.سی.ال.سی) به او.سی.ال.سی.اینک تغییر نام داد و امروزه انواع مختلف کتابخانهها از سراسر دنیا از خدمات (او.سی.ال.سی) استفاده مینمایند. به دنبال آن شورای استفادهکنندگان (او.سی.ال.سی) تشکیل گردید (جردان، 1998). این شورا متشکل از کتابداران و سایر شرکائی است که شایستگی و صلاحیت آنها برای عضویت منوط به میزان سهمی است که در فهرستگان آنلاین (او.سی.ال.سی) دارند. با ایجاد اصلاحات در سختافزار، امکانات بیشتری برای استفادهکنندگان بیشتری فراهم نمود. از سال 1973 کتابخانههای غیرآکادمیک توانستند عضو (او.سی.ال.سی) شوند و نیز بر تعداد شبکههای خارج از ایالتی که به (او.سی.ال.سی) پیوستند افزوده گشت.
کتابخانهها با عضویت در (او.سی.ال.سی) میتوانند به همهء اطلاعات جهانی و به تمامی خدمات و پایگاههای اطلاعاتی دسترسی یابند. این عضویت، بزرگترین کنسرسیوم کتابخانههای جهانی را در بر میگیرد و در بین سایر شبکههای کتابشناختی بیشترین تعداد اعضاء را دارد. تعداد اعضای آن تا سال 1991 بیش از 7000 کتابخانه در سراسر دنیا بود که اکثر آنها از امریکا و کانادا بودند.
در سراسر تاریخ (او.سی.ال.سی) ارتباطات راه دور، یک وسیلهء مهم برای تداوم اهداف کلی خود در زمینهء افزایش دستیابی به اطلاعات جهانی و کاهش هزینهء اطلاعات بوده است (جردان، 1998). این شبکه همچنان براساس پروتکل استاندارد صنعتی (تی.سی.پی/آی.پی) طی سه سال آینده در جهت تبدیل به یک شبکه کاملاً باز به پیش میرود. از طرف دیگر امکان دستیابی با کیفیت بالا را برای کتابخانهها فراهم میسازد.
هدف کلی و اساسی (او.سی.ال.سی) که بر مبنای افزایش سهولت دستیابی و استفاده از پیکره رو به رشد دانش و اطلاعات علمی، ادبی و آموزشی (گزارش سالیانه، 1995) قرار دارد، عبارت است از افزایش دسترسپذیری منابع کتابخانهای و کاهش نرخ رشد هزینههای کتابخانه. در راستای تحقق این هدف، اهداف ذیل را دنبال میکند:
استقرار، نگهداری و پیاده کردن یک شبکه کتابخانهای کامپیوتری و افزایش استفاده از کتابخانه، بررسی و توجه به مسائل مربوط به کتابخانهها و کتابداری، فراهم نمودن امکانات و محصولاتی که به نفع استفادهکنندگان کتابخانه وکتابخانهها باشد؛ از جمله افزایش قابلیت دسترسی به منابع کتابخانه برای مراجعین به کتابخانهها و کاهش هزینههای هر واحد کتابخانه.
کارهائی که (او.سی.ال.سی) انجام میدهد شامل خدمات فهرستنویسی، جستجو، امانت بین کتابخانهای و فهرستگان ادواریها میباشد. بطور کلی میتوان گفت که در سه زمینه خدمات مرجع و نشر الکترونیکی، توسعه فهرستنویسی، خدمات اشتراک منابع و توسعه بینالمللی پیشرفت داشته است.
شبکه و خدمات کتابشناختی (او.سی.ال.سی)
شبکه و خدمات کامپیوتری آن با بیش از 41000 کتابخانه در 82 کشور و قلمرو ارتباط برقرار مینماید. (او.سی.ال.سی) از یک پایگاه کتابشناختی به نام "اپیک" نگهدای میکند. در سال 1991 این سیستم شامل 16 میلیون کتاب، یک میلیون سریال و 450000 رسانه سمعی بصری و همچنین 500000 گزارش بوده است. و تقریباً دو میلیون رکورد سالانه به آن اضافه میشود (کاتز، 1974) بطوریکه هم اکنون این پایگاه حاوی بیش از 31 میلیون رکورد در فرمتهای مختلف کتاب، فیلم، گزارش یا تکنگاشت از کتابخانههای عضو میباشد.
(اپیک) مداخل متعددی از جمله دستیابی موضوعی و کلیدواژهای و جستجوی بولین را فراهم میکند. دستیابی موضوعی فقط از سال 1990 میسر بود. نرمافزار اپیک علاوه بر رکوردهای او.سی.ال.سی امکان جستجوی پایگاههای دیگر را از (اریک) و (ان.تی.آی.اس) فراهم میسازد. سیستم اپیک هر ساله پایگاههای اطلاعاتی جدیدی به پایگاههای خود میافزاید. به این ترتیب (او.سی.ال.سی) بزرگترین منبع اطلاعاتی جهانی است. نوارهای مارک در قلب سیستم (او.سی.ال.سی) قرار دارد و نیز شامل فهرستنویسی اصلی مهم اعضا و موجودی همه کتابخانههای دولتی است.
فهرستگان پیوسته (او.سی.ال.سی)، از نظر تعداد کتابخانههای عضو و از نظر عمق و وسعت پوشش، پایگاه کتابشناختی پیشگام در دنیاست. تا قبل از سال 1970 اکثر فعالیتهای (او.سی.ال.سی) مربوط به تحقق در مورد طرح و عملکرد سیستم کامپیوتری فهرست آنلاین بود اما پس از آن تعداد 440711 فهرستبرگه آف لاین را نیز تولید کرد (پرومنشنکل، 2000). در سال 1971 سیستم فهرست آنلاین شروع به کار کرد و در سال مالی 1972، کتابخانهها بیش از 330000 عنوان را فهرست کردند. در سال 1974 (او.ال.یو.سی) به یک میلیون رکورد، در 1975/76 به دو میلیون، سال بعد به سه میلیون و در دسامبر 1980 به هفت میلیون رکورد کتابشناختی رسید (جردان، 1998). در 1994 این پایگاه شامل بیش از 29 میلیون رکورد بود و نرخ افزایش رکورد آن در هفته 22000 رکورد میباشد (کروک، 1995).
در ژانویه 1999، (او.سی.ال.سی) یک پروژه فوری اولیه تحت عنوان (کرک) یا فهرست منابع پیوسته تعاونی را ارائه نمود. هدف این پروژه که مبتنی بر (دی.سی) یا استاندارد هسته فرادادهای در دوبلین بود، توسعه یک فهرست منابع در محیط وب بود. در ژانویه سال 1999 مرکز کامپیوتری کتابخانه اوهایو، پروژه "کورک" را آغاز نمود تا یک پایگاه اطلاعاتی جامع برای منابع پیوسته از طریق تعاونی بینالمللی با کتابخانهها ایجاد کند.
پایگاههای اطلاعاتیو سرویسهای (او.سی.ال.سی)
(او.سی.ال.سی) به منظور تامین نیازهای انواع کتابخانهها، طیف وسیعی از خدمات را ارائه میدهد که شامل ابزار فهرستنویسی، پایگاههای اطلاعاتی مرجع و خدمات جستجوی پیوسته، ابزار اشتراک منابع، خدمات حفاظت و ردهبندی دهدهی دیوئی میباشد. همچنین امکان ارتباط با فروشندگان متعدد پایگاههای اطلاعاتی را میسر میسازد.
بطور کلی پایگاههای اطلاعاتی (او.سی.ال.سی) شامل WorldCat, ArticleFirst, Electronic Collection Online, NetFirst, PAIS International, PaperFirst, Proceedings First, OCLC Union Lists of Periodicals میباشد. در اینجا به دو پایگاهها یعنی "وورلدکات" و فهرستگان پایگاه اطلاعاتی مجلات در (او.سی.ال.سی) یا بطور مختصر اشاره میشود.
در مرکز خدمات (او.سی.ال.سی)، پایگاه اطلاعاتی "وورلدکات" قرار دارد که بیشترین استفاده را در آموزش عالی دارد و سابقه دانش بشری را از 4000 سال گذشته تاکنون به 400 زبان دربرمیگیرد. "وورلدکات" بزرگترین پایگاه اطلاعاتی کتابشناختی در جهان است که حاوی بیش از 46 میلیون رکورد فهرستنویسی از کتابخانههای سراسر جهان بوده و هر پانزده ثانیه یک رکورد جدید به آن اضافه میگردد (پرومنشنکل، 2000). این رکوردها شامل کتاب، نسخ دستی، نوارهای ویدئویی و صوتی، نشریات ادواری، روزنامهها، نقشهها، و برنامههای کامپیوتری میباشد. به علاوه محصولات میکروفیلم و میکروفیش را به شکل نوار یا فرمت کارتی فهرست میکند. ورلدکات طرحهایی را برای توسعه مجموعه، فهرستنویسی، کنترل مستند، و خدمات گذشتهنگر ارائه مینماید. میتوان از طریق سیستمهای محلی به طرو مستقیم به ورلدکات دسترسی یافت.
فهرستگان پایگاه اطلاعاتی مجلات در او.سی.ال.سی، یکی دیگر از پایگاههای اطلاعاتی این شبکه است که شامل میلیونها (ال.دی.آر) میباشد و به بیش از 750000 رکورد کتابشناختی مرتبط شده است. هر (ال.دی.آر) مجموعه اطلاعاتی خاصی از نشریات ادواری را فراهم میکند.
سیستم فرعی کنترل نشریات ادواری در (او.سی.ال.سی) از سال 1975 مورد استفاده قرار گرفته است و هدف از طراحی آن، فراهمآوری امکان مشارکت موءسسات در کنترل آنلاین نشریات ادواری است. این سیستم دارای چهار جزء است: کنترل، پیگیری، کنترل صحافی و فهرستگان، تا سال 1980 فقط جزء کنترل آن کار میکرد اما کتابخانهها میتوانستند از سیستم کنترل محدود ادواریها نیز استفاده کنند. پردازش یک نشریهء ادواری جدید و یا تغییر یک عنوان، یکی از مشکلترین کارهایی است که سیستم فرعی کنترل ادواریها در (او.سی.ال.سی) باید انجام دهد. مبنای فرآیند کنترل خودکار سیستم فرعی کنترل ادواریها در (او.سی.ال.سی)، کد بسامد یک رکورد دادهای محلی است. اما این کدها همیشه روزآمد نمیشوند. حل مسائل مربوط به تغییر بسامد، منوط به استفاه از جزء پیگری کنترل ادواریهاست (رافتون، 1982).
یکی از مهمترین سرویسهای (او.سی.ال.سی)، سرویس امانت بین کتابخانهای است که در سال 1979 معرفی گردید و از آن زمان با استفاده از این سرویس بیش از 14 میلیون امانت بین 6700 کتابخانهء سراسر جهان انجام گرفت. یکی دیگر از این سرویسها، خدمات جستجوی اولیه میباشد که به عنوان یک ابزار مرجع در سال 1991 معرفی شد و اکنون در 19246 کتابخانه استفاده میشود. وظیفه آن ارائه خدمات در زمینهء مجلات الکترونیکی به کتابخانهها و تأمین نیازهای استفادهکنندگان راه دور است. این سرویس با ایجاد یک ذخیرهء اطلاعات و فراهم نمودن امکان اشتراک کتابخانهها (بطور مستقیم از طریق ناشر) در مجموعه چاپی مجلات علمی، نقش خود را در توسعهء مجموعه ایفا مینماید. مقالات مجلات در (او.سی.ال.سی) بطور الکترونیک ذخیره میشود و کتابخانهها میتوانند از طریق وب، با استفاده از یک مرورگر وب اشتراکی و از طریق رابط پشتیبانیکننده از جستجو در مجلات، به آنها دست یابند. از طریق خدمات جستجوی اولیه استفادهکنندگان میتوانند به 70 پایگاه اطلاعاتی مشهور و شناخته شده دسترسی پیدا کنند.در حال حاضر این سرویس دارای صفحات جستجو و گرافیکهای جدیدی است که انجام جستجوهای اساسی و پیشرفته را برای استفادهکنندگان به مراتب راحتتر کرده است (هیزل، 1996).