نوع مقاله : مقاله مروری
نویسنده
چکیده
کلیدواژهها
مقدمه
هر حوزهای یک یا چند مفهوم اصلی[1] دارد. بازیابی اطلاعات مرتبط و نه هر نوع اطلاعاتی، مفهوم اصلی علم اطلاعات است. بازیابی اطلاعات یک بخش اصلی از علم اطلاعات است که به موضوع اطلاعات مرتبط میپردازد. پس مفهوم ربط[2]، بنیان[3] علم اطلاعات است.
همانند بیشتر مفاهیم بنیانی، ربط نیز به صورت شهودی قابل درک است و هر فردی میتواند آن را برای فرد دیگری در این جهان توضیح دهد. این نقطه قوت آن است. این امر به صورت جهانی پذیرفته شده است که هدف سیستمهایی همچون موتورهای کاوش و بسیاری از برنامههای جستجو در رسانههای اجتماعی، بازیابی اطلاعات مرتبط به کاربران است و تفاوتهای فرهنگی و جامعهشناختی و دیگر مسائل در آن اهمیتی ندارد. به هرحال ربط مفهومی انسانی-نه فنی- است و این نقطه ضعف آن است. همه مفاهیم انسانی نظیر ربط «گیچ کننده هستند و به سختی تعریف میشوند[4]». ربط بسیاری از متغیرها را شامل میشود که نه تنها کنترل کردن بلکه فهمیدن آنها نیز دشوار است. ربط همیشه بوده و همواره تکرار میشود و شامل یک بافت است. همه الگوریتمهای جستجو در همه سیستمها در کل دنیا تلاش دارند تا به میزان بیشتری به مفهوم انسانی ربط نزدیک شوند. و «ربط» همه اینهاست. همچنین این دلیلی بر وجود مبحث ربط است.
هدف این مقاله آن است تا چشم اندازی تاریخی و امروزی درباره دو پرسش مهم فراهم آورد که این دو پرسش عبارتند از:
1- چرا ربط به مفهوم اصلی در علم اطلاعات تبدیل شده است؟
2- چرا امروزه، با وجود پیشرفتهای عظیم در فناوری اطلاعات، باز هم ربط به عنوان مفهوم اصلی در علم اطلاعات مطرح است؟
اولین پرسش به هیچ وجه در علم اطلاعات مورد توجه قرار نگرفته است. به نظر می رسد به این دلیل مورد توجه نبوده زیرا ربط به عنوان یک مسئله اساسی به سادگی در هر عبارت به کاربرده شده است. همچنان که اشاره شد، ربط به صورت کلی قابل درک است اما مدرکی وجود ندارد که به صورت مستقیم به آن بپردازد و همین امر در مورد پرسش دوم نیز صادق است و در مدرکی به آن پرداخته نشده است. پیشرفت در فناوری اطلاعات و به طور ویژه پیشرفت در جستجوی اطلاعات به هیچ وجه در ربط منعکس نشده است. در مفهوم کلی ربط همان چیزی است که هدف آنهاست، اگرچه آن بیان نشود.
مراجع اصلی
ربط موضوع شمار عمدهای از بررسی هایی بوده است که در طول زمان منتشر شده اند. در بین آنها میتوان به بررسیهایی که به وسیله شامبر، آیزنبرگ و نیلان[5] (1990)، شامبر (1994)، میزارو[6] (1997) ، بورلاند[7] (2003)، اینگورسن و یارولین[8] (2005) ، یورلند[9] (2010) و هوانگ و سورگل[10] (2013) اشاره کرد. این بررسیها از بین سایر بررسیها، شامل اطلاعاتی از ماهیت تاریخی ربط هستند، با این حال هیچ یک از این پژوهشها به دو پرسش مطرح شده در بالا پاسخ نداده اند. من (ساراسویک) در موضوع ربط، مقالات جامعی را در سالهای 1975، 2007، 2008 و 2012 ارائه نموده ام. بخش عمدهای از این مقالات، در مقاله سال 2012 ترکیب شده است، جایی که به برخی از جزئیات پرسش اول پردخته شده است ولی در این مقاله نیز به پرسش دوم پرداخته نشده است.
چرا ربط؟ تاریخچه مختصر
چرا ربط مفهوم مرکزی علم اطلاعات شده است؟
علم اطلاعات بعد از جنگ جهانی دوم همراه با سایر رشتهها به دنبال پیروزیهای فنی و علمی جنگ به وجود آمد. به دنبال اتمام جنگ، مقاله بسیار تأثیرگذاری توسط ونوار بوش[11] (1890-1974) دانشمند، مخترع و رئیس پژوهشکده علمی ایلات متحده در جنگ[12] نوشته شد. در این مقاله یک مسئله انتقادی ذکر و راه حل آن ارائه شده بود (بوش، 1945). ونوار بوش «وظیفه عظیم دسترسپذیری به ذخیره دانش حجیم[13]» را مطرح کرد و سپس راه حلی فنی برای آن پیشنهاد نمود. به بیان دیگر، بوش مسئله انفجار اطلاعات را مطرح نمود. ما هنوز نیز با این مسئله مواجه هستیم، اما امروزه این امر محدود در علم و فناوری نیست؛ بلکه همه فعالیتهای انسانی را شامل میشود.
بوش نظامی را با نام ممکس[14] پیشنهاد نمود که دارای تجمعی از اندیشهها و فرآیندهای ذهنی به صورت مصنوعی بود. ممکس هرگز ایجاد نشد، نظام ممکس هنوز به عنوان یک هدف باقی مانده است. ایده بوش از راهحل فنی هنوز در جریان است. با گسترش رایانهها و ارتباطات، نظام ممکس یک واقعیت جهانی و بسیار موفق شد. مردم و سازمانهای حمایتی مهم شنیدند که بوش درحال راه اندازی چنین ابزاری در بنیاد ملی علوم امریکا است و قانون 1950، اختیاراتی را برای بنیاد ملی علوم ایجاد کرده و حمایتهای مالی به منظور پیشرفت اطلاعات فنی و علمی در نظر گرفته شده است. همه تلاشهایی که تا امروز دنبال شده است یک مسئله مشترک دارند و آن تأکید بر حمایت از پژوهش، توسعه و کاربردهایی که به حل مشکلات بازیابی از طریق تلکنولوژی[15] میپردازد است تا مسائل مختلف و متنوعی از مشکلات اطلاعاتی را که شامل بازیابی اطلاعات است حل نمایند.
بازیابی اطلاعات
واژه «بازیابی اطلاعات» توسط ریاضیدان و فیزیکدان کالوین موئرز[16] (1919-1994) و پیشگام محاسبات و بازیابی اطلاعات ابداع شد.
بازیابی اطلاعات نام فرآیند یا روشی است که به موجب آن کاربر احتمالی اطلاعات بتواند نیاز اطلاعاتی خود را تبدیل به اطلاعاتی در یک لیست واقعی از استنادات نموده تا مدارکی که در آن ذخیره شده اند و برای وی مفید هستند را بازیابی نماید. بازیابی اطلاعات شامل جنبههای ذهنی از توصیف اطلاعات و به طور ویژه در جستجو است. همچنین برای هر سیستم، تکنیک یا ماشین که برای انجام عملیات به کار گرفته میشود.
موئرز[17] از واژه ربط استفاده نکرد، اما مفهوم «مفید[18]» و بافت «نیاز اطلاعاتی» را به کار برده بود. در طول دهههای بعد، بازیابی اطلاعات به طور چشمگیری از زمان موئرز تغییر یافت، اما ایده اساسی که فرمولبندی شده بود، هنوز معتبر است. جستجو اضافه شد و با آن، ربط به طور نامحسوسی وارد شد.
بر اساس روشهای جستجو، هانس پیتر لوهان[19] (1896-1964)، دانشمند علوم رایانه در آی بی ام، مخترع و پیشگام اصلی در این حوزه و رئیس موسسه دکومانتیسون امریکا[20] تا زمان مرگش، اولین کسی بود که به صورت رسمی توصیفی از جستجو با استفاده از نمودار ون ارائه نمود (لوهان، 1953). علاوه بر این مورتیمر تاب[21] (1910-1965)، کارآفرین قدیمی در این حوزه، دکترای فلسفه، مبدع نمایهسازی هماهنگ[22]، اولین کسی بود که جستجو را با واژگان جبر بولی توصیف نمود (تاب و واچل[23]، 1953). درحالی که اینها اولین بار تلاش کردند تا جستجو را فرمولبندی نمایند اما نه لوهان و نه تاب نامی از ربط نبرده اند ولی منظورشان از جستجو همان ربط بوده است. آنها از جستجو استفاده نموده اند؛ زیرا فناوری آن را اجازه میداد و همچنین آن را میطلبید، یعنی فناوری کلاً درباره جستجو بود. به صورت مختصر مفهوم دربارگی[24] و مفهوم ربط پیوند داده شد. ردهبندی کتابشناختی، سرعنوان موضوعی، زبان نمایهسازی در طول زمان برای سازماندهی اطلاعات یا منابع اطلاعاتی به کاربرده شده است. برخی از طرحها و عملیات به چند قرن پیش باز میگردد. همه اینها مبتنی بر مفهوم دربارگی است. انتخاب کد رده بندی، سرعنوان موضوعی و اصطلاح نمایهای به آنچه یک مدرک، بخشی از آن یا درباره آن است، اشاره دارد. آنها فرض میکنند اما به جستجو هیچ اشارهای ندارد. جستجو مفروض در نظر گرفته شده است. به عبارت دیگر همه به ورودی میپردازند و خروجی را معین در نظر میگیرند. هیچ تلاشی انجام نشده است تا جستجو در رابطه با طرحهای سرعنوان موضوعی و ردهبندی تعریف شود و آن رسمی و عمل گرایانه باشد.
پیشنهاد مارون[25](1977) در مورد تعریف رسمی از دربارگی این بود که تمایز دقیقی بین ربط و دربارگی قائل شد. دربارگی مفهومی بنیانی مربوط به سازماندهی اطلاعات است. درحالی که ربط مفهومی بنیانی درباره جستجو و بازیابی اطلاعات است. درحالی که هر دو وابسته بوده ولی فرآیند کاملاً متفاوتی دارند. دربارگی، مرتبط به موضوع و در احساس گسترده مربوط به معرفت شناسی است؛ درحالی که ربط مربوط به مسئله در دست و در احساس گسترده مربوط به بافت و عمل است.
پرسشی که در شروع این بخش میتوان پاسخ داد بدین صورت است که:
ربط به دلیل توجهات عملی و نظری و همچنین الزامات جستجو و نه فقط سازماندهی اطلاعات به مفهوم بنیانی در علم اطلاعات تبدیل شد. در این چرخش، جستجو با استفاده از فناوری اطلاعات مدرن تکمیل شد. افراد با استفاده از فناوری اطلاعات به جستجوی اطلاعات مرتبط به مسئله در دست و در بافت مربوط پرداختند. سیستمها مبتنی بر الگوریتمهای مختلفی هستند که روشها و ابزارهای سازماندهی و جستجو اطلاعات را ارائه میکنند و تلاش دارند تا با احتمال بیشتری مدارک مرتبط به افراد را فراهم آورند. جالب این است که سازماندهی اطلاعات میتواند بدون داشتن منابعی نظیر ابزارهای خاصی چون اصطلاحنامه و طرحهای ردهبندی انجام شود. این کار به وسیله الگوریتمهای رایانهای انجام میشود که الگوهایی را از دادههای خام استخراج میکنند. برای مثال به عنوان نشانی از مجموعه واژهها، شمارشها، پیوندها، رتبههای صفحات و نظیر آن که همه آنها به جستجو مرتبط هستند. از دیرباز، کتابداری به سازماندهی اطلاعات و درنتیجه به دربارگی تمرکز دارد. در حالی که علم اطلاعات به جستجو و در نتیجه به ربط تمرکز دارد. این توصیف هم روابط و هم تفاوت این دو را نشان میدهد.
ربط و آزمایش
همانگونه که اشاره شد، تأکید به جستجو در ربط از علم اطلاعات ریشه میگیرد که در شروع سالهای 1950 شناخته نشده بود. برونداد مطلوب، بازیابی نتایج مرتبط بود. در طول مدت کوتاه اوایل 1950 چندین طرح و محاسبات سیستمهای بازیابی اطلاعات پیشنهاد شد. همانطور که برای آزمایش آن، ادعاها و ادعاهای متقابل افزایش یافته بود، برای حل و فصل آنها نیز افزایش یافت. این تعجب آمیز نبود؛ چون بیشتر توسعه دهنگان بازیابی اطلاعات، دانشمندان و مهندسانی بودند که الزام داشتند پیشرفتهای خود (الگوریتمهای پیشنهادی خود) را آزمایش نمایند. در این سالها آموختیم که ربط، رابطهای با آزمایش کردن سیستمها و فنون بازیابی اطلاعات دارد. ربط به دلیل اولین آزمایش بازیابی اطلاعات به شدت به خط مقدم توجهات در این حوزه تبدیل شده است. شرایط ارزش تکرار شدن دارند- آنها درسهای ماندگاری هستند.
از اواسط دهه 1950 تلاش شده است تا عملکرد دو سیستم محاسبه بازیابی اطلاعات که توسط دو گروه مختلف توسعه داده شدهاند، آزمایش شود. یکی از آنها توسط آژانس پژوهشی فناوری اطلاعات ارتش[26] با استفاده از سرعنوان موضوعی گسترش یافت و دیگری توسط مورتیمر تاب و شرکت وی با استفاده از مجموعه واژگان[27] (کلیدواژهها جستجو شده به روش بولی) توسعه یافت. این مطالعه یک مثال کلاسیک از قانون عواقب ناخواسته است که نه تنها نشان میدهد نتایج ربط در گروههای قضاوت کننده به طور چشمگیری متفاوت است. همچنین به طور ناخواسته تمامی مسائل مطرح مربوط به ارزیابی بازیابی اطلاعات را آشکار میسازد. به یاد آوردن این نتایج با ارزش هستند. در آزمایشی، دو گروه، 98 تقاضا را با استفاده از 15000 مدرک که به صورت جداگانه نمایه شده بود، به منظور ارزیابی عملکرد ربط آنها، مدارک را بازیابی نمودند. به هرحال هر گروه ربط آنها را به صورت جداگانه ارزیابی نمودند. آن ربط سیستمی نبود اما باز هم قضاوت آنها با هم متضاد بود. گروه اول 2200 مدرک را به 98 تقاضا، مدرک مرتبط تشخیص دادند. درحالی که گروه دیگر 1998 مدرک را مرتبط دانستند که بین آنها همپوشانی زیادی وجود نداشت. از نظر گروه اول 1640 مدرک مرتبط بود؛ درحالی که از نظر گروه دوم این مدارک مرتبط نبودند. همچنین از نظر گروه دوم 980 مدرک مرتبط بودند، درحالی که از نظر گروه اول این مدارک مرتبط نبودند. سپس آنها مصالحه نموده و مدارک مرتبط همدیگر را دوباره بررسی نمودند و هر گروه، مدارک مرتبط سایر گروه را دوباره انتخاب نمود تا این که در نهایت، باز هم تفاوت وجود داشت و میزان توافق آنها حتی پس از مذاکرات صلح، 30.9% بود. اولین ارزیابی بازیابی اطلاعات به انتها نرسید و به خاطر ارزیابی ربط دچار اضمحلال شد. به هرحال به نظر میرسد که میزان توافق انسانی در مورد ارزیابی ربط در حول و حوش این رقم قرار دارد (ساراسویک ،2007ب).
سنجههای عملکرد
در اواسط دهه 1950 آلن کنت[28] (1922-2014) و جیمز دابلیو پری[29] (1907-1971) هر دو شیمیدان و پیشگام در علم اطلاعات، مجموعه مقالاتی را درباره فنون بازیابی اطلاعات نوشتند. در یکی از این مقالهها سنجههایی را برای ارزیابی سیستم بازیابی اطلاعات پیشنهاد دادند که آن دو سنجه دقت و ربط بودند (که بعدا به دلیل ابهام، به «بازخوانی»[30] تغییر نام پیدا کرد) (کنت، بری، لوهرس و پری[31]، 1955). این اولین بار درک کامل ربط تحت مفهوم بازیابی بود. به بیان دیگر ربط معیاری برای این دو سنجه بود. سنجههای دقت و بازیافت از یک طرف احتمال توافق بین مدارک بازیابی شده مرتبط به مدارک بازبی نشده توسط سیستم را در نظر میگیرند (ربط سیستمی) و از طرف دیگر آنچه که کاربران به عنوان ربط (ربط کاربری) ارزیابی میکردند، در نظر گرفته میشود که ربط کاربری به عنوان استاندارد طلایی برای مقایسه بود. بدین ترتیب ربط به عنوان معیاری برای سنجش کارآمدی بازیابی اطلاعات تبدیل شد و تا هنوز نیز باقی مانده است.
آزمایشهای بازیابی اطلاعات تا امروز ادامه داشته است. تا امروز بازخوانی و دقت به عنوان سنجههای استاندارد باقی مانده است، هرچند که شمار متنوعی از تغییرات در زمینه آنها مشاهده میشود. این درسی است که از اولین آزمایشها آموخته شد، اگرچه امروزه کسی به سختی منبع آن را میشناسد. آزمایش شامل یک قضاوت ساده (برخی اوقات گروهی از قضاوتها با یک اجماع) است که به عنوان یک میله طلایی[32] از مدارک مرتبط، عملکرد سیستم یا الگوریتم را ارزیابی میکند.
ربط و فناوری اطلاعات
تا امروزه با وجود پیشرفت در فناوری اطلاعاتی چرا ربط هنوز مفهوم بنیانی در علم اطلاعات باقی مانده است؟
به هر حال مدت بسیار طولانی قبل از ظهور فناوری اطلاعات مردم به خاطر رفع انواع مختلفی از نیازهای اطلاعاتی به جستجو پرداخته و به دنبال اطلاعات مرتبط بودند. به هرحال فناوری اطلاعات ربط را قابل توجه کرده است.
این به صورت کلی پذیرفته شده است که فناوری اطلاعات، توسعه، حفاظت، استفاده از سیستمهای رایانهای، نرمافزار و شبکه برای پردازش و توزیع دادهها را شامل است (فرهنگ آنلاین مریام وبستر: واژه فناوری اطلاعات اولین بار درسال 1978 استفاده شد). به هرحال، در دیدگاه انسانی، فناوری اطلاعات به استفاده از فناوری به عنوان ابزاری برای وظایف مختلفی از قبیل ذخیره و دستکاری متون و دادهها، تشکیل محاسبات و ارتباطات اشاره دارد. جنبههای ارتباطی فناوری اطلاعات برای ربط خیلی مهم است. در واقع، برعکس این رابطه نیز برقرار است. ربط عمدهترین علتی است که چرا فناوری اطلاعات برای ارتباطات استفاده میشود. همچنین هدف ممکن است برقراری ارتباط غیر مرتبط، اطلاعات اشتباه، تبلیغات و نظیر آن باشد که باز همه در همه این موارد، ربط مفهوم اصلی است.
فناوری اطلاعات درهمه جا حضور دارد- فناوری اطلاعات در همه جهان حضور دارد حتی اگر بخش عظیمی از بشریت با آن ارتباطی نداشته باشند.
پیشرفتهای امروزی در فناوری اطلاعات، تغییرات زیادی را با خود همراه داشته است. موتورهای کاوش، رسانههای اجتماعی و تنوع عظیمی از منابع اطلاعاتی جدید، جهان را دگرگون کرده و تغییر داده اند. متون بسیاری که هم معروف و هم علمی هستند به این تغییرات پرداخته اند. هر حوزهای تغییر کرده است- سلامت، دولت، تجارت، علم، حرفه، نشر و نظیر آن و هر آنچه که شما میتوانید نام ببرید. ارتباطات تغییر کرده است. سیاستها و پلیسها تأثیر پذیرفتهاند. انقلابها حمایت شدهاند همچان که ظلمها نیز هستند.
تغییر معنیدار دیگری نیز وجود دارد. مردم از فناوریهای معاصر به صورت گستردهای استفاده میکنند. مردم از سیستمهای بازیابی اطلاعات اصلی در محدوده علم، حرفه، مدیریت، ادارات و نظیر آن استفاده میکنند. مردم از سیستمهای معاصر مبتنی بر فناوری اطلاعات (موتورهای جستجو، رسانههای اجتماعی، منابع اطلاعاتی دیجیتال) که به آن دسترسی دارند، استفاده میکنند. این فقط شامل کسانی نمیشود که وابسته یا مرتبط به اقتصاد دانشی هستند، بلکه شامل تمام افرادی است که به هر نحوی به فناوری دسترسی دارند. دسترسی به فناوری به عامل کلیدی تبدیل شده است.
تنوعی از موتورهای جستجو، رسانههای اجتماعی و منابع اطلاعاتی دیجیتال ظرفیت جستجو دارند. در این چرخش، جستجو برای رسیدن به همه نوع اطلاعاتی در سرتاسر جهان توسط همه افراد به دلایل مختلف صورت میگیرد. توده مردم جستجو میکنند. به هرحال جستجو اساس ربط است. مردم جستجو میکنند تا چیزهای که در آن لحظه برای آنها مرتبط است، پیدا کنند. در بافت ارائه شده ربط مفهوم اساسی در رابطه با جستجو و بازیابی اطلاعات بوده و هنوز نیز است.
نتیجهگیری
در زمان کوتاهی – نه در درازمدت- فناوری اطلاعات، سیستمهای اطلاعاتی و بازیابی اطلاعات به گونهای تغییر خواهند کرد که حتی ما نمیتوانیم تصورکنیم. آنها با سرعت شتابندهای تغییر میکنند. به هرحال تحت هر شرایطی ربط تا امروز باقی مانده است. ربط محدود به زمان نیست و همواره در طول زمان مورد توجه خواهد بود.
[1] central idea
[2] relevance
[3] fundamental
[4] messy
[5] Schamber, Eisenberg & Nilan
[6]Mizzaro
[7] Borlund
[8] Ingwersen, & Järvelin
[9] Hjørland
[10] Huang & Soergel
[11] Vannevar Bush
[12] head of the U.S. scientific effort during the War
[13] the massive task of making more accessible a bewildering store of knowledge
[14] Memex
[15]technological fix
[16] Calvin N. Mooers
[17] Mooers
[18] useful
[19] Hans Peter Luhn
[20] American Documentation Institute
[21] Mortimer Taube
[22] coordinate indexing
[23] Wachtel
[24]Aboutness
[25] Maron
[26] Armed Services Technical Information Agency
[27] uniterm
[28] Allen Kent
[29] James W. Perry
[30] recall
[31] Kent, Berry, Leuhrs, & Perry
[32] Golden Rod