|
معيارهاي ارزيابي ابزارهاي كاوش اينترنت: مطالعه مقايسهايبر روي ابزارهاي كاوش وب با واسط جستجوي فارسي |
|
|
|
نويسنده (گان) : كيوان كوشا (عضو هيات علمي مركز اطلاعات و مدارك علمي كشاورزي و دانشجوي دکتري) |
چکيده : هدف اصلي از مقاله حاضر، استفاده از معيارهاي مستند براي ارزيابي منفرد و نيز تجزيه و تحليل مقايسهاي ابزارهاي كاوش با واسط جستجوي فارسي است. بيش از 40 ابزار كاوش درباره ايران در شبكه جهاني وب مورد شناسايي قرار گرفت. بررسي نشان داد كه تنها 6 ابزار كاوش امكان جستجوي اطلاعات را از طريق واسط فارسي در اختيار قرار ميدهند. به منظور ارزيابي امكانات و قابليتهاي جستجو و بازيابي اطلاعات در ابزارهاي كاوش فارسي، از 27 معيار استفاده شد. نتيجه تحقيق نشان ميدهد كه از نقطه نظر امكانات جستجو و بازيابي اطلاعات، موتور كاوش Google رتبه اول و راهنماي موضوعي Iranhoo رتبه دوم را دارند. علاوه براين، ابزارهاي كاوش با واسط جستجوي فارسي از نظر تعداد صفحات پيوند داده شده ، محل جغرافيايي ، نمايه سازي ماشيني و انساني و دارا بودن پايگاه اطلاعاتي مستقل مورد ارزيابي قرار گرفتند. اين مطالعه نشان ميدهد كه لزوم طراحي و توسعه يك ابزار كاوش ملي با امكانات و قابليتهاي جستجوي پيشرفته به زبان فارسي در داخل كشور ضروري است.
|
|
| کليد واژه ها :ابزارهاي كاوش اينترنت، موتورهاي كاوش، راهنماهاي موضوعي، ارزيابي، ايران |
متن مقاله :1. مقدمه
شبكه جهاني وب، به هسته اصلي منابع اطلاعاتي كه امروزه ميتوانند در دسترس قرار گيرند، مبدل شده است. در اين وادي، ابزارهاي كاوش مختلفي براي مكانيابي و دسترسي به اطلاعات در فضاي الكترونيكي يا به عبارت ديگر سايبراسپس وجود دارند. تعداد ابزارهاي كاوشي كه در اينترنت به ما امكان جستجو و بازيابي اطلاعات را ميدهند، پيوسته درحال افزايش است؛ به طوري كه راهنماهاي متعددي در محيط وب نظيرSearch Engine Watch (www.searchenginewatch.com) و Search Engine Guide
(.comwww.searchengineguide) به شناسايي، سازماندهي موضوعي و معرفي صدها ابزار كاوش اينترنت ميپردازند.
نتايج يكي از مطالعات نشان ميدهد استفادهكنندگاني كه مهارت و دانش لازم براي استفاده از امكانات و قابليتهاي اينترنت را دارند، معمولاً كمتر با مشكل بازيابي بيش از حد اطلاعات مواجه ميشوند (1) . بنا بر پژوهشي كه توسط Nielsen Netratings صورت گرفته است، از هر 10 كاربر اينترنت در آمريكا، ماهانه 9 نفر از ابزارهاي كاوش اينترنت براي دسترسي به اطلاعات استفاده ميكنند (2).
مطالعات آماري انجام شده توسط موسسه فنآوري جورجيا در دسامبر 1998 نشان ميدهد كه 85 درصد از كاربران اينترنت براي دسترسي به اطلاعات از موتورهاي كاوش استفاده ميكنند. اين بررسي نشان مي دهد كه رايجترين شيوه دسترسي به اطلاعات (88 درصد) توسط كاربران اينترنت استفاده از فراپيوندها در صفحات وب است. معرفي سايتها توسط دوستان (65 درصد)، مطالعه رسانههاي چاپي (63 درصد)، استفاده از راهنماهاي موضوعي وب (58 درصد) به ترتيب از ديگر روشهاي دسترسي به اطلاعات در محيط وب ذكر شدهاند (3) . مطالعات مشابهي در انگلستان در سال 2000 توسط Forrester Research صورت گرفته است كه نشان ميدهد رايجترين شيوه دسترسي به اطلاعات در وب توسط كاربران، با استفاده از موتورهاي كاوش است. اين مطالعه نشان مي دهد كه موتورهاي كاوش با 81 درصد و پيوندهاي فرامتني با 59 درصد به ترتيب مهمترين شيوههاي دسترسي به اطلاعات در محيط وب به شمار ميآيند (4) .
نتايج مطالعه انجام شده در جولاي 2000 روي كاربران اينترنت در آمريكا نشان ميدهد كه 36 درصد از جامعه مورد مطالعه پژوهش، بيش از دو ساعت در هفته را صرف جستجوي اطلاعات در وب ميكنند. كاربران اينترنت به طور متوسط 5/1 ساعت را صرف جستجوي اطلاعات مورد نظر در شبكة جهاني وب ميكنند. اين پژوهش همچنين نمايانگر آن است كه 31 درصد از جامعه مورد مطالعه پژوهش، 2 يا 3 بار در هفته به جستجوي اطلاعات در محيط وب ميپردازند (5).
از مطالعات آماري فوق مي توان اين طور نتيجه گرفت:
1. فرايند اطلاع يابي در محيط وب به مقوله اي مهم و حياتي در جوامع اطلاعاتي مبدل شده است.
2. ابزارهاي كاوش اينترنت، تنها فناوري حاضر براي رويارويي و دسترسي به اطلاعات در محيط وب به شمار مي آيد.
3. آشنايي با امكانات، قابليتها و تواناييهاي ابزارهاي كاوش اينترنت از اهميت زيادي برخوردار است .
يكي از روشهاي آگاهي صحيح و دقيق از امكانات و قابليتهاي ابزارهاي كاوش اينترنت، ارزيابي و مقايسه علمي و منطقي آنها بر اساس معيارهاي مستند و از پيش تعيين شده است. ابزارهاي كاوش اينترنت را ميتوان از جنبههاي مختلف نظير حجم پايگاه اطلاعاتي ، رتبه بندي نتايج كاوش ، نمايش اطلاعات ، واسط كاربر ، روز آمد بودن اطلاعات، سرعت بازيابي اطلاعات ، نمايه سازي اطلاعات و از همه مهمتر «امكانات و عملكرد جستجو و بازيابي اطلاعات » مورد مقايسه قرار داد كه در اين مقاله مورد آخر مورد تاكيد قرار گرفته است.
2. بيان مسئله
در حال حاضر ابزارهاي كاوش مختلفي درباره ايران ظهور پيدا كرده اند. برخي از اين ابزارهاي كاوش مدعي هستند كه اولين، كاملترين و قدرتمندترين بستر را براي دسترسي به اطلاعات درباره ايران بوجود آورده اند. اين مسئله قابل طرح است كه كداميك از ابزارهاي كاوش كنوني امكان جستجوي اطلاعات به زبان فارسي را در اختيار قرار مي دهند و داراي چه امكانات و قابليتهاي براي بازيابي موثر و مناسب اطلاعات هستند. بهترين ابزار كاوش ايران با واسط جستجوي فارسي از لحاظ امكانات و عملكرد جستجو و بازيابي اطلاعات كدام است؟ رتبه بندي ابزارهاي كاوش مبتني بر موارد فوق چگونه خواهد بود.
3. پرسشهاي اساسي تحقيق
1. كداميك از ابزارهاي كاوش ايران داراي واسط جستجوي فارسي هستند؟
2. رتبه بندي ابزارهاي كاوش با واسط جستجوي فارسي از لحاظ تعداد صفحات پيوند داده شده به آنها چگونه است؟
3. محل جغرافياي ابزارهاي كاوش با واسط جستجوي فارسي در كجاست؟
4. كداميك از ابزارهاي كاوش با واسط جستجوي فارسي داراي روبات (موتور كاوش) هستند و كداميك توسط انسان (راهنماهاي موضوعي) اداره مي شوند؟
5. آيا ابزارهاي كاوش با واسط جستجوي فارسي خود داراي پايگاه اطلاعاتي مستقل مي باشند و يا از پايگاه ديگر ابزارهاي كاوش براي جستجو و بازيابي اطلاعات استفاده مي كنند؟
6. رتبه بندي ابزارهاي كاوش با واسط جستجوي فارسي از لحاظ قابليتهاي جستجو و بازيابي اطلاعات منطبق با معياري هاي از پيش تعريف شده چگونه است؟
4. پيشينه تحقيق
به طور كلي مطالعات مقايسهاي بر روي ابزارهاي كاوش اينترنت با توسعه و گسترش ابزارهاي كاوش اينترنت شتاب گرفت. از آنجايي كه امكانات و قابليتهاي ابزارهاي كاوش اينترنت به سرعت در حال تغيير و تحول بوده است، مطالعات صورت گرفته در اين زمينه مربوط به دورههاي زماني متفاوتي است (6-14). اغلب تحقيقات صورت گرفته در اين زمينه بر روي ابزارهاي كاوش اصلي بوده است و تقريبا از روشهاي تحقيق يكساني استفاده شده است، اما با اين وجود انجام اينگونه تحقيقات در دورهاي زماني مختلف منجر به ارائه نتايج ً متفاوتي شده است. بسياري از تحقيقات مقايسهاي بر روي ابزارهاي كاوش اينترنت بر روي امكانات و قابليتهاي جستجو و بازيابي اطلاعات آنها بوده است (6 و12). در اغلب اين مطالعات منطبق با معيارهاي اصلي جستجو و بازيابي اطلاعات، به ابزارهاي كاوش مورد مطالعه نمرهاي تعلق گرفته است و آنها رتبه بندي شده اند (6).
پيشينهپژوهي در داخل كشور نشان ميدهد كه تحقيقي در ارتباط با بررسي مقايسهاي ابزارهاي ايران با واسط فارسي صورت نگرفته است*.
5. روش تحقيق
الف. انتخاب موتورهاي كاوش و راهنماها
نقطة شروع براي انتخاب ابزارهاي كاوش ايران با واسط جستجوي فارسي، وجود آنها در راهنماي موضوعي Open Directory بود. اين راهنما در تاريخ 15 مرداد 1381 در بخش راهنماهاي موضوعي ايران 39 ابزار كاوش را نمايه كرده بود. بررسي اوليه نشان داد 9 مورد از سايتهاي نمايه شده در اين راهنما از لحاظ ساختاري يا محتوايي نميتوانند به عنوان ابزار كاوش براي بررسي تحليلي بيشتر انتخاب شوند و بنابراين ناديده گرفته شدند. از آنجا كه هدف از تحقيق شناسايي و بررسي ابزارهاي كاوش ايران با «واسط جستجوي فارسي» بود، 30 ابزار كاوش منتخب از لحاظ زبان، ساختار سلسله مراتبي موضوعي، امكانات جستجوي ساده و جستجوي پيشرفته مورد بررسي قرار گرفتند. (جدول 1). همان طوري كه در جدول شماره 1 مشاهده ميشود، تنها دو ابزار كاوش Iran Click و Iran File داراي واسط فارسي بودند. از آنجايي كه سايت Iran File تنها امكاني را براي جستجو به زبان فارسي در اختيار نگذاشته بود و تنها فهرستي موضوعي و قابل انتخاب را به زبان فارسي طراحي كرده بود، ناديده گرفته شد. در واقع اين سايت فاقد واسط جستجوي فارسي بود.
رديف نام ابزار كاوش زبان واسط جستجو ساختار سلسله مراتبي جستجوي ساده جستجوي پيشرفته ارائه توصيف درباره هر مدخل
1 Abadan.net انگليسي خير خير خير خير
2 Alborz.net انگليسي خير خير خير خير
3 Ankaboot انگليسي خير بله خير خير
4 Bozorgrah انگليسي بله بله بله بله
5 Gooya انگليسي خير خير خير خير
6 Iran Click فارسي بله بله خير بله
7 Iran File فارسي خير خير خير خير
8 Iran Index انگليسي بله بله بله بله
9 Iran Web List انگليسي خير خير خير خير
10 Iranbestsites انگليسي خير خير خير بله
11 Iranet UK انگليسي خير خير خير خير
12 Iranfo انگليسي بله بله بله بله
13 Iranian Connection انگليسي خير خير خير خير
14 Iranian Directory انگليسي خير خير خير بله
15 Iranian Links انگليسي خير خير خير خير
16 Iranian Online انگليسي خير بله خير خير
17 The Iranian Pages انگليسي بله بله خير خير
18 Iranian Web انگليسي خير خير خير خير
19 IranMania انگليسي بله بله خير بله
20 Irantelaat انگليسي بله بله خير خير
21 Iranvatan انگليسي خير بله بله بله
22 Kashan.com انگليسي خير خير خير خير
23 Pars Times انگليسي خير خير خير خير
24 Payvand انگليسي خير خير خير خير
25 Persian Link انگليسي خير خير خير خير
26 Poya انگليسي خير خير خير خير
27 SearchIR انگليسي بله بله بله خير
28 We Love Iran انگليسي خير خير خير خير
29 WorldSkip: Iran انگليسي خير خير خير بله
30 Yadaboo انگليسي خير خير خير خير
جدول 1. بررسي 30 ابزار كاوش نمايه شده در بخش راهنماهاي موضوعي Open Directory
از لحاظ واسط جستجوي فارسي و موارد ديگر (15 مرداد ماه 1381)
به منظور بررسي عميق تر جهت شناسايي ابزارهاي كاوش ايران با واسط جستجوي فارسي به منابع ديگري نيز مراجعه شد. مطالعه مجلات كامپيوتر به زبان فارسي، بخش كامپيوتر و انفورماتيك روزنامههاي ايران و ارتباطات شفاهي منجر به شناسايي ابزارهاي كاوش ديگري نيز گرديد كه برخي از آنها مدعي بودند «اولين، قدرتمندترين و تنها ابزار يا موتور كاوش ايران» هستند. اين ابزارهاي كاوش عبارت بودند از NPiran ، Iranhoo ، IranMehre و Parseek . بررسي اوليه نشان داد كه به جز سايت NPIran ديگر سايتها داراي واسط جستجوي فارسي هستند، بنابراين به عنوان جامعه مورد مطالعه تحقيق برگزيده شدند. در خلال اين بررسي، موتور كاوش Google واسط جستجوي فارسيخود را طراحي و در دسترس همگان قرار داد. همچنين، مشخص شد كه بخش فارسي راهنماي موضوعي Open Directory نيز مي تواند در اين بررسي به عنوان جامعه مورد پژوهش انتخاب شود. بدين ترتيب در نهايت 6 ابزار كاوش كه داراي واسط جستجوي فارسي بودند به شرح ذيل به عنوان جامعه نهايي تحقيق برگزيده شدند.
رديف نام ابزار كاوش با واسط جستجوي فارسي نشاني دسترسي
1 Google www.google.com/webhp?hl=fa&ie=UTF-8
2 Iran Click www.iranclick.com
3 Iranhoo www.iranhoo.com
4 IranMehr www.iranmehr.com
5 Open Directory http://dmoz.org/World/Farsi
6 Parseek www.parseek.com
جدول 2. شش ابزار كاوش برگزيده با واسط جستجوي فارسي همراه با نشاني دسترسي آنها
ب. بررسي ابزارهاي كاوش از لحاظ تعداد صفحات پيوند داده شده، محل جغرافيايي،
نوع نمايه سازي، پايگاه اطلاعاتي
به منظور كشف محبوبيت و رايج بودن ابزارهاي كاوش تصميم بر آن شد تا آنها از نظر تعداد صفحات يا سايتهايي پيوند داده شده مورد مقايسه قرار گيرند. بدين ترتيب از طريق موتور كاوش AltaVista تعداد صفحات پيوند داده به هريك از 6 ابزار كاوش منتخب از طريق رابطه ذيل بدست آمد (جدول 3).
link:www.iranclick.com AND NOT host:www.iranclick.com
link:www.iranhoo.com AND NOT host:www.iranhoo.com
نام ابزار كاوش با واسط فارسي تعداد صفحات پيوند داده شده رتبه
Iran Click 289 1
IranMehre 110 2
Open Directory 17 3
Parseek 1 4
Google 0 5
Iranhoo 0 5
جدول 3. رتبه بندي ابزارهاي كاوش با واسط جستجوي فارسي بر اساس تعداد صفحات پيوند داده شده به آنها(20 مرداد 1381 در موتور كاوش AltaVista )
بررسي محل ابزارهاي كاوش مورد مطالعه نيز در جدول 4 نشان داده شده است.
نام ابزار كاوش با واسط فارسي محل جغرافيايي فعلي
Google آمريكا
Iran Click آمريكا
Iranhoo ايران
IranMehr خارج از ايران كشور؟
Open Directory آمريكا
Parseek ايران
جدول 4. محل جغرافيايي طراحي و توسعه ابزارهاي كاوش ايران با واسط جستجوي فارسي
بررسي ابزارهاي كاوش مورد مطالعه نشان داد تنها موتور كاوش Google داراي برنامه روبات به منظور شناسايي و نمايه سازي صفحات يا سايتهاي وب به زبان فارسي (يوني كد) و نمايه سازي خودكار مي باشد و سايت Parseek نيز از پايگاه Google براي جستجو و بازيابي اطلاعات استفاده مي كند. به تعبير ديگر، 4 ابزار كاوش ديگر توسط نمايه سازي انساني اداره مي شوند و از اين لحاظ راهنماي موضوعي تلقي مي شوند.
نام ابزار كاوش با واسط فارسي نوع نمايه سازي ماشيني/انساني
Google نمايه سازي ماشيني – موتور كاوش
Iran Click نمايه سازي انساني – راهنماي موضوعي
Iranhoo نمايه سازي انساني – راهنماي موضوعي
IranMehr نمايه سازي انساني – راهنماي موضوعي
Open Directory نمايه سازي انساني – راهنماي موضوعي
Parseek نمايه سازي ماشيني – موتور كاوش
جدول 5. فرايند نمايه سازي در ابزارهاي كاوش با واسط فارسي به صورت ماشيني (موتور كاوش) يا انساني (راهنماي موضوعي)
همچنين بررسي ابرازهاي كاوش مورد مطالعه نشان ميدهد كه ابزارهاي كاوش Parseek و IranMehr خود داراي پايگاه اطلاعاتي نيستند و به ترتيب در پايگاه Google و Open Directory جستجو مي كنند. اين در حالي است آنها به اين موضوع يعني استفاده از ديگر پايگاههاي اطلاعاتي اشاره نكردهاند.
نام ابزار كاوش با واسط فارسي داراي پايگاه مستقل /استفاده از پايگاه هاي ديگر
Google داراي پايگاه اطلاعاتي مستقل
Iran Click داراي پايگاه اطلاعاتي مستقل
Iranhoo داراي پايگاه اطلاعاتي مستقل
Open Directory داراي پايگاه اطلاعاتي مستقل
Parseek جستجو در پايگاه موتور كاوش Google
IranMehr جستجو در پايگاه راهنماي Open Directory
جدول 6. بررسي ابزارهاي كاوش از نظر دارا بودن يا نبودن پايگاه اطلاعاتي مستقل
ج. ارزيابي ابزارهاي كاوش اينترنت بر اساس عملكرد و قابليتهاي جستجو و بازيابي اطلاعات
1. معيار ارزيابي و ارزشيابي
شش ابزار كاوش برگزيده از طريق 27 معيار مرتبط با قابليتهاي جستجو و بازيابي اطلاعات با يكديگر مورد مقايسه قرار گرفتند. معيارهاي فوق مبتني بر مطالعه ديگر مقالات مرتبط و تجربه شخصي در زمينه ارزيابي و مقايسه امكانات جستجو و بازيابي اطلاعات در ابزارهاي كاوش اينترنت و نيز بررسي بخش جستجوي پيشرفته ابزارهاي كاوش اصلي بين المللي تعيين گرديدند.
معيارهايي كه براي مقايسه امكانات بازيابي اطلاعات در ابزارهاي كاوش ايران با واسط فارسي مورد استفاده قرار گرفتند به شرح ذيل ميباشند:
1. استفاده از عملگر منطقي AND براي تركيب مفاهيم مختلف- AND Operator
2. استفاده از عملگر منطقي OR به منظور تركيب مفاهيم و كليدواژه هاي مترداف و مرتبط –OR Operator
3. استفاده از عملگر منطقي NOT به منظور حذف و ناديده گرفتن كليدواژه هاي ديگر- Not Operator
4. امكان استفاده از پرانتز براي تركيب عملگرها و انجام جستجوهاي پيچيده تر -Nesting
5. امكان استفاده از جستجوي عبارتي براي بازيابي يك جمله يا عبارت مشخص – Phrase Search
6. كوتاهسازي اصطلاحات براي پوشش لغاتي كه در انتها با يكديگر تفاوت دارند – /WildcardTruncation
7. امكان استفاده از عملگر نزديك يابي براي بازيابي كلمات در مجاور يا نزديك به يكديگر- Proximity
8. جستجو در فيلد عنوان صفحات يا سايتهاي وب- Title Search
9. جستجو در فيلد توصيف صفحات يا سايتهاي وب - Description Search
10. محدود كردن زبان صفحات يا سايتهاي وب - Language Limit
11. محدود كردن تاريخ انتشار صفحات يا سايتهاي وب - Date Limit
12. محدود كردن حوزه سايتها – Domain Search
13. جستجوي كليدواژهها در سايت ميزبان- Host Search
14. جستجو كليدواژهها در نشاني صفحات وب - URL Search
15. جستجوي اطلاعات چندرسانهاي (صوت، تصوير و ويدئو)- Media Search
16. نمايش تعداد كل نتايج بازيابي شده - Hits Counter
17. دسترسي به اطلاعات از طريق مرور ساختار سلسله مراتب موضوعي – Hieratical Structure Browsing
18. دسترسي به صفحات مشابه برگرفته از سايتي واحد - /Related pagesSimilar pages
19. حذف صفحات مشابه از سايتي واحد - Site Collapse/Site Compression
20. انتخاب تعداد نمايش مدخلهاي بازيابي شده - /Display OptionOutput Option
21. جستجوي يك كلمه مشخص در زبان فارسي- Exact Word Search
22. امكان تركيب فيلدهاي مختلف از طريق عملگرهاي بول - Fields Boolean Search
23. امكان دسترسي به كليه نتايج بازيابي شده - Accessing all retrieved results
24. جستجوي كليدواژهها در قالب پيوند فرامتني - Anchor Search
25. جستجوي قالبهاي مختلف فايل - File Formats Search
26. جستجوي صفحات پيوند داده شده به سايتي مشخص - Link Search
27. دسترسي به بخش موضوعي مرتبط در ساختار سلسله مراتب موضوعي - Links to related Subject Categories
2. نحوه امتياز دهي
براي بررسي درستي و صحت عملكرد قابليتهاي جستجو و بازيابي اطلاعات مبتني بر 27 معيار تعيين شده، هر يك از امكانات جستجو در ابزارهاي كاوش مورد مطالعه مورد آزمايش قرار گرفت. به تعبير ديگر، دادن امتياز در هر بخش مبتني بر عملكرد صحيح قابليتهاي كاوش بوده است نه صرفا به نمايش گذاشتن يا گنجانده شدن آنها در ابزار كاوش. در واقع، برخي از ابزارهاي كاوش با وجود اينكه مدعي بودند داراي امكانات كاوش مختلفي هستند، اما در برخي از موارد چنين قابليتهايي به درستي عمل نمي كردند. بدين ترتيب، به اينگونه موارد امتيازي تعلق نگرفت. شايان ذكر است. كليه بررسيها و كاوشها در ابزارهاي كاوش در تاريخ 22 مرداد 1381 صورت گرفته است، بنابراين، هر گونه تغيير احتمالي حذف يا اضافه شده امكانات جستجو و بازيابي اطلاعات مربوط به بعد از اين تاريخ خواهد بود.
براي مقايسه ابزارهاي كاوش اينترنت، نظامي براي امتيازدهي تعيين گرديد. بدين ترتيب، براساس اينكه آيا ابزارهاي كاوش مورد مطالعه از معيارهاي اصلي تعيين شده برخوردار هستند يا نه، به هر يك از آنها امتيازي از صفر تا 1 داده شد.
در جدول شماره 7 مقايسه ابزارهاي كاوش ايران با واسط جستجوي فارسي مبتني بر 27 معيار از پيش تعريف شده مرتبط با امكانات و قابليتهاي جستجو و بازيابي اطلاعات نشان داده شده است. علامت + نشان دهنده كسب يك امتياز و علامت – نشان دهند عدم كسب امتياز مي باشد.
Google Iranhoo Iran Click Open Dir. Iran Mehr Parseek
AND + + + + + +
OR - ؟ + + - - -
NOT + + + - - -
Parentheses ( ) - - - - - -
Phrase" " + - - - - -
Truncation * - + خودكار + خودكار - ؟ - -
Proximity NEAR - - - - - -
Title Search + + - - - -
Description Search + + - - - -
Language Limit - ؟ - - - - -
Date Limit + - - - ؟ - -
Domain Search + - - - ؟ - -
Host Search + - - + + -
URL Search + + - + + -
Media Search + تصوير - - - - -
Hits counter + + + + + -
Directory Browsing - + + + + -
Similar Pages + - - - - -
Site Collapse + + + + + -
Output Option + + + - - -
Exact Word Search + + - + + +
Fields Boolean Search - + - - - -
Access all Results - + + + + +
Anchor Search + - - - - -
File Formats Search + - - - - -
Link Search + - - - - -
Links to Related Subjects - + + + + -
جمع امتيازات 18 15 10 9 9 3
رتبه اول دوم سوم چهارم چهارم پنجم
جدول7 . مقايسه 6 ابزار كاوش ايران با واسط جستجوي فارسي از نظر امكانات و قابليتهاي جستجو و بازيابي اطلاعات (تاريخ بررسي 22 مرداد 1381)
*علامت -؟ به معناي اين است كه قابليت كاوش مورد نظر موجود بوده است اما در زمان اين بررسي به درستي عمل نمي كرد
6. بحث درباره نتايج بدست آمده
بررسي منابع مختلف نشان داد كه تنها شش ابزار كاوش داراي واسط جستجوي فارسي هستند. البته اين احتمال وجود دارد ابزارهاي كاوش ديگري با واسط جسجوي فارسي وجود داشته باشند و در اين تحقيق مورد شناسايي قرار نگرفته باشند. رتبه بندي ابزارهاي كاوش از نظر رايج بودن مبتني بر تعداد صفحات پيوند داده شده به آنها نمايانگر آن است كه ابزارهاي كاوش Iran Click و Iran Mehr به ترتيب از محبوبيت بيشتري برخوردار مي باشند. جالب توجه اينكه با وجود اينكه ابزار كاوش Iran Mehr به طور مشخص از پايگاه Open Directory استفاده مي كند و در واقع هسته اصلي آن كاملا وابسته به Open Directory مي باشد، اما به طور نسبي از رتبه بالاتري از لحاظ صفحات پيوند داده برخوردار است. بدين ترتيب به سئوالات اول و دوم تحقيق پاسخ داده شد.
بررسي محل جغرافيايي ابزارهاي كاوش نشان داد كه دو ابزار كاوش Iranhoo و Parseek در داخل كشور فعاليت مي كنند. اين در حالي است كه ابزار كاوش Parseek كاملا وابسته به پايگاه موتور كاوش Google در خارج از كشور است. همچنين، بررسي اينكه كدام ابزار كاوش، موتور كاوش يا راهنماي موضوعي است نشان داد كه تنها موتور كاوش Google داراي برنامه روبات
مي باشد و قادر است صفحات فارسي را در قالب يوني كد شناسايي و در پايگاه خود نمايه كند. Parseek نيز از انجايي كه از پايگاه Google استفاده مي كند، يك موتور كاوش وابسته به پايگاه ديگر ابزارهاي كاوش به حساب مي آيد. 4 ابزار كاوش ديگر راهنماي موضوعي به شمار مي آيند و انسان فرايند شناسايي، بررسي و نمايه سازي سايتها يا صفحات وب را بر عهده دارد. بدين ترتيب براي سئوالات سوم و چهارم تحقيق نيز جواب روشني پيدا شد.
سئوال پنجم تحقيق در پي يافتن اين موضوع بود كه آيا ابزارهاي كاوش خود داراي پايگاه اطلاعاتي مستقل هستند. به تعبير ديگر، آيا ابزارهاي كاوش چه از طريق روبات و چه از طريق نيروي انساني خود به گردآوري اطلاعات و وارد كردن آنها در يك پايگاه مستقل مبادرت مي ورزند. بررسي نشان داد كه به جز دو ابزار كاوش Parseek و Iran Mehr كه به ترتيب از پايگاه Google و Open Directory استفاده مي كنند، ساير ابزارهاي كاوش داراي پايگاه اطلاعاتي متعلق به خود هستند.
مهمترين سئوال تحقيق، رتبه بندي ابزارهاي كاوش مبتني بر 27 معيار مرتبط با قابليتها و امكانات جستجو و بازيابي اطلاعات آنها بود. همان طوري كه در جدول شماره 6 مشاهده مي شود، موتور كاوش Google رتبه اول، راهنماي موضوعي Iranhoo رتبه دوم، راهنماي موضوعي Iran Click رتبه سوم ، راهنماهاي موضوعي Open Directory و Iran Mehr هر كدام رتبه چهارم و در نهايت Parseek رتبه پنجم را بدست آوردند. اين سئوال ممكن است مطرح گردد كه چرا ابزارهاي كاوش و Iran Mehr و Parseek كه از پايگاه ديگر ابزارهاي كاوش استفاده مي كنند در اين مطالعه به عنوان جامعه مورد پژوهش مورد بررسي قرار گرفته اند. اين دليل منطقي را مي توان مطرح كرد كه ابزارهاي كاوشي كه از ديگر پايگاه هاي اطلاعاتي استفاده مي كنند ممكن است امكانات جستجويي را فراتر از پايگاه ابزار كاوش مورد استفاده ارائه دهند. اين موضوع هم اينك در مورد ابزارهاي كاوش بين المللي نيز صادق است. به اين دليل تصميم گرفته شد ابزارهاي كاوش با واسط فارسي صرفنظر از اينكه خود داراي پايگاه اطلاعاتي هستند يا نه در اين مطالعه مورد بررسي قرار گيرند.
بدون شك در زمان انجام اين مطالعه موتور كاوشGoogle بهترين ابزار كاوش با واسط جستجوي فارسي از لحاظ امكانات و قابليتهاي كاوش بوده است. يكي از دلايل اين امر ساختار قوي، منطقي و از پيش تعريف شده آن مي باشد كه در ابتدا با هدف ايجاد بستري بين المللي براي جستجوي اطلاعات به زبان انگليسي طراحي شده است. طراحي منطقي اين موتور كاوش چه از لحاظ فرايند شناسايي و نمايه سازي اطلاعات توسط روبات خود و چه از نظر امكانات و قابليتهاي جستجو و بازيابي اطلاعات تا حدود بسيار زيادي از طريق واسط هاي جستجوي مختلف به 82 زبان مختلف در دسترس قرار گرفته است. در واقع، اين موتور كاوش تا حدود بسياري زيادي از همان ساختار اصلي خود در ارتباط با زبانهاي ديگر استفاده كرده است. چه بسا، با اين تحول اخير در Google كه احتمالا به منظور بر داشتن موانع زباني در جستجوي اطلاعات در اينترنت در دسترس قرار گرفته است، نقش اين موتور كاوش از يك ابزار كاوش بين المللي با واسط جستجوي انگليسي، به ابزار كاوش ملي براي بسياري از كشورها تغيير پيدا كند. البته بررسي مزايا و محدوديتهايي اين فرايند تحقيق ديگري را مي طلبد.
در اين وادي، طراحي و توسعه راهنماي موضوعي سايتهاي ايران Iranhoo نيز با ساختار سلسله مراتبي قوي و نيز امكانات جستجوي نسبتا مناسب نقطه عطفي در طراحي و توسعه ابزارهاي كاوش در ايران محسوب مي شود. نكته حائز اهميت اينكه برخي از معيارهاي مورد استفاده در اين تحقيق تقريبا مختص موتورهاي كاوش است و راهنماهاي موضوعي اغلب آنها را در طراحي نظام بازيابي خود مورد توجه قرار نمي دهند. براي مثال، جستجوي قالب هاي مختلف فايل، جستجوي تعداد صفحات پيوند داده شده، جستجوي حوزه سايتها، جستجو در سايت ميزبان، جستجوي كليدواژه ها در قالب فرامتن و جستجوي اطلاعات چندرسانه اي از امكانات كاوشي هستند كه در كليه راهنماهاي موضوعي مهم بين المللي نظير Yahoo و Open Directory مشاهده نمي شوند. به تعبير ديگر، چنين امكاناتي تقريبا مختص موتورهاي كاوش داراي روبات است. امتياز كمتر راهنماي موضوعي Iranhoo نسبت به موتور كاوش Google نيز تا حدود بسيار زيادي به اين دليل است. در واقع مي توان اين طور استنباط كرد كهIranhoo به عنوان يك راهنماي موضوعي نه موتور كاوش داراي امكانات جستجوي مناسبي مي باشد.
سايت Iran Mehr بدون هيچ كم و كاست تصويري مشابه از راهنماي موضوعي Open Directory ارائه داده است و در واقع به صورت سايت آينه اي عمل مي كند. اين درحالي است كه اين موضوع در خود سايت عنوان نشده است. با اين وجود اين موضوع تا قبل از انجام اين مطالعه غير قابل اثبات و بررسي بود. سايت Parseek كه در پايگاه Google جستجو مي كند و مدعي است "ابر موتور كاوش فارسي" است، نه تنها به صورت يك سايت آينه اي تصويري از قابليتهاي كاوش Google ارائه نمي كند، بلكه بسياري از قابليتهاي جستجو و بازيابي اطلاعات در Google را در بر ندارد.
اگرچه بخش انگليسي راهنماي موضوعي Open Directory به عنوان بزرگترين، برجسته ترين و مهمترين راهنماهاي موضوعي در جهان داراي امكانات جستجو و بازيابي اطلاعات مناسب و متنوعي است؛ اما بسياري از اين امكانات در زمان انجام اين مطالعه در بخش فارسي اين راهنماي موضوعي قابل اجرا نبودند. اگر اين راهنماي موضوعي مشكلات مذكور را در بخش جستجوي فارسي خود رفع نمايد، احتمالا خواهد توانست رتبه بهتري از لحاظ بازيابي اطلاعات كسب نمايد.
در نهايت بخش فارسي سايت Iran Click كه يك راهنماي موضوعي عامه پسند به شمار مي آيد و داراي بيشترين استنادها در محيط وب است، از نظام بازيابي اطلاعات نسبتا متوسطي برخوردار است.
7. نتيجه گيري
مهمترين نتيجهگيري از تحقيق حاضر اين است كهرابطه غير مستقيمي ميان رايج و عامهپسندبودن ابزارهاي كاوش موردمطالعه (از لحاظ صفحات پيوند داده شده) با تواناييهاي جستجوي اطلاعات آنها وجود ندارد. دو نمونة بارز براي طرح اين ادعا را ميتوان در موتور كاوش Google و راهنماي موضوعي Iranhoo بهخوبي مشاهده كرد. اگرچه اين دو آخرين درجه از مقبوليت رتبهبندي بر اساس تعداد پيوندها را كسب نموده اند (جدول3)، اما در فهرست رتبهبندي امكانات ابزارهاي كاوش در بازيابي اطلاعات، به ترتيب اولين و دومين رتبه را دارند (جدول 7).
از نقطه نظر بازيابي اطلاعات كليه ابزارهاي كاوش مورد مطالعه قابليت اجراي عملگر نزديكيابي، تركيب فرايند جستجو از طريق پرانتز و بازيابي صفحات يا سايتهاي وب را به زبانهاي ديگر(دربخش جستجوي پيشرفته موتور كاوش Google اين امكان مشاهده مي شود اما در زمان اين مطالعه به درستي عمل نمي كرد) را نداشتند.
موتورهاي كاوش دائما در حال تغيير و تحول مي باشند و اين احتمال وجود دارد در آينده نزديك امكانات جستجو و بازيابي اطلاعات در ابزارهاي كاوش اينترنت با واسط جستجوي فارسي پيشرفت كند و يا ديگر ابزارهاي كاوش اصلي نظير AltaVista، Fast Search و ... نيز با طراحي واسط جستجوي فارسي به رقابت با موتور كاوش Google كه ظاهرا قصد دارد نقش يك ابزار كاوش بين المللي و ملي را با زبانهاي مختلف ايفا نمايد، وارد صحنه شوند.
از آنجايي كه سياست شناسايي و نمايه سازي سايتهاي وب توسط روبات هاي موتورهاي كاوش مي تواند توسط صاحبان ابزارهاي كاوش تعيين گردد (به سادگي سايت يا كليدواژه هاي مشخصي انتخاب و يا در فرايند نمايه سازي ناديده گرفته شوند)، بيم آن مي رود بازيابي اطلاعات در اينگونه از ابزارها منطبق با نيازهاي اطلاعاتي كاربران اينترنت در ايران نباشد و يا تحت تاثير قرار گيرد. بنابراين، طراحي و توسعه يك ابزار كاوش ملي كه با در نظر گرفتن نيازهاي اطلاعاتي كاربران اينترنت در ايران و تحت نظارت يك سازمان (نظير سازمان پژوهشهاي علمي و صنعتي) باشد، اهميت بسيار زيادي دارد. طراحي يك راهنماي موضوعي كه به شناسايي و نمايه سازي سايتهاي ايراني مفيد و مناسب مبادرت ورزد از اهميت زيادي برخوردار است، بستري كه تا حدودي به نظر مي رسد در راهنماي موضوعي سايتهاي ايران Iranhoo اعمال شده است.
8. پيشنهاداتي براي تحقيقات بيشتر
مطالعه حاضر با هدف بررسي امكانات جستجو و بازيابي اطلاعات در ابزارهاي كاوش با واسط فارسي صورت گرفته است. اين درحالي است ابزارهاي كاوش متعددي در مورد ايران با واسط جستجوي انگليسي وجود دارند (جدول 1) كه بررسي امكانات جستجو و بازيابي اطلاعات آنها مي تواند به دانش در اين حوزه بيافزايد. علاوه براين، مي توان مطالعات مقايسه اي بيشتري بر روي ابزارهاي كاوش منتخب با واسط جستجوي فارسي از نظر پوشش سايتهاي ايراني (فارسي و انگليسي)، كيفيت سايتهاي نمايه شده ، ميزان ارتباط سايتهاي بازيابي شده با كليدواژه هاي جستجو (Relevancy)، پيوندهاي كور(Dead Links) و روز آمد بودن پايگاه اطلاعاتي، نمايش اطلاعات، ارزيابي واسط گرافيكي، عامه پسند بودن در ميان مردم (نه از لحاظ صفحات پيوند داده شده بلكه از نظر ميزان مراجعه به آنها) صورت گيرد.
فهرست مآخذ
۱. Bartlett, Michael. "Digital Information Overload Can Be Overcome-Study" . 7June 2001. [Online].
. [Accessed 7 July 2001].
2. Singer, Michael. "Three Sites Types Dominate Surfing Habits" . 11 June 2001. [Online]
. [Accessed 30 July 2001].
3. "GVU Survey Results: How Do You Find New Web Pages/Sites?" . [Online]. . [Accessed 20 July 2001].
4. Sullivan, Danny. "In UK, Search Engines Are Top Method to Find Sites" . 27 July 2001. [Online]
. [Accessed 12 Sep 2001].
5. Sullivan, Danny. "WebTop Search Rage Study" . 5 Feb 2001. [Online]
. [Accessed 9 Sep 2001].
6. آنجلس مالدونا. مقايسه ابزارهاي كاوش اينترنت. ترجمه كيوان كوشا. گزيده مقالات بيست و سومين كنفرانس بين المللي اطلاع رساني پيوسته دسامبر 1999. – تهران: مركز اطلاع رصاني و خدمات علمي وزارت جهاد سازندگي، 1379: ص. 53-64.
7. W. Ding and G. Marchionini. A comparative study of Web search service performance. Proceedings of the 5Ninth Annual Meeting of the American Society for Information Science, Baltimore, Maryland,
21-4 Oct 1996, p.136-42.
8. H. Chu and M. Rosenthal. Search engines for the World Wide Web: a comparative study and evaluation methodology. Proceedings of the 5Ninth Annual Meeting of the American Society for Information Science, Baltimore, Maryland, 21-4 Oct 1996. p.127-35.
9. H-M. C. Liu. Selection . Comparison of WWW search tools. Journal of Information, Communication, and Library Science. 2 (4) Summer 96, p.41-63.
10. C. Sasikala and K. R. Patnaik. A comparative study of two Web search engines: AltaVista and Excite. CALIBER 99. Academic libraries in the Internet era. Proceedings of the Sixth National Convention for Automation of Libraries in Education and Research, Nagpur, India, 18-20 February 1999. p.346-54.
11. W. Zhong and Z. Shibo. Evaluation and analysis of English search engines on Internet. Journal of the China Society for Scientific and Technical Information 18 (5) Oct 1999, p.392-8.
12. M. D. Gordon and P. Pathak. Finding information on the World Wide Web: the retrieval effectiveness of search engines. Information Processing and Management
35 (2) Mar 1999, p.141-80.
13. D. Hawking, N. Craswell and Results and challenges in Web search evaluation. Computer Networks31 (11-16) 17 May 1999, p. 1321-30.
14 . Z. Lin. Comparative study of WWW search tools. Journal of the China Society for Scientific and Technical Information. 17 (4) Aug 1998, p.273-80.
|
|
|
|