درک ابرداده و استانداردهاي آن

چكيده

ظهور محيط‌هاي الکترونيکي جديد و منابع الکترونيکي مختلف، ضرورت الگوها، روشها و استانداردها و ابزارهاي جديد براي ذخيره، سازماندهي و بازيابي دقيق آنها را اثبات کرده است. ابرداه به عنوان روشي نظامند براي شناسايي، توصيف و مکان يابي منابع الکترونيکي بر روي شبکه، درواقع براي پاسخ به چنين نيازي ابداع شده است. آشنايي کتابداران و اطلاع رسانان  با ابزارهاي جديد سازماندهي منابع اطلاعاتي الکترونيکي يك ضرورت است. قالبهاي ابرداده اي دابلين کور، متس و مودس که در اين مقاله معرفي شدند، پرکاربردترين قالبهاي ابرداده اي در ايجاد کتابخانه هاي ديجيتالي است.

 

مقدمه
"ابرداده فهرست تهيه شده توسط افراد است"[2].
دنياي فناوري اطلاعات غرق گفتگو درباره ابرداده است. امروزه به نظر مي رسد هرکسي در حال ايجاد يک قالب ابرداده اي است. يک ابرنشانه[3] در زبان نشانه گذاري فرامتن[4] براي حمل ابرداده در منابع اينترنتي وجود دارد؛ به طوريکه متخصصان ابرداده را براي توصيف ژنوم ها توسعه داده اند؛ و ناشران داراي يک قالب ابرداده اي براي تسهيل انتقال داده هاي تبليغاتي و قيمت به خرده فروشان هستند. چه چيزي در دنياي فناوري در حال رخ دادن است که موجب شده هر فردي تصور کند براي مديريت و کنترل اطلاعات در اينترنت ابرداده پاسخ است؟ اگر ابرداده پاسخ است، در اين صورت پرسش چيست و در کتابخانه ها و فهرستهاي کتابخانه چه معنايي دارد (1)؟
 
تعريف ابرداده[5]
واقعيت اين است که گسترش شتابناک پديده اينترنت در دهه اخير و بخصوص ابداع وب باعث نگراني بسياري از دست اندرکاران و متخصصان در اطلاع رساني گرديده است. اين نگراني از اين بابت است که اطلاعات توليد و منتشر شده از طريق اينترنت و وب با سرعت شگفت انگيزي درحال افزايش است و مديريت و کنترل اين منابع کاري بسيار دشوار است. اين نگراني ها سبب شده با ابداع راهکارها و روشهاي علمي تاحدودي بر اداره و ساماندهي منابع روي وب تسلط يابند. ارائه راهکاري تحت عنوان "ابرداده" باعث شد انتهاي روشني براي مديريت و کنترل اطلاعات در اينترنت گشوده شود(6).
درابتدا بايستي حدود و دامنه اين واژه را مشخص نماييم، به چه چيزي ابرداده اطلاق مي شود. بررسي تاريخي مفهوم ابرداده نشان مي دهد که اين اصطلاح از مدتها قبل مورد استفاده قرار گرفته است. اما قبل از فراگير شدن آن به طورگسترده در دهه 1990 داراي چنين هدف گسترده اي نبود. اين اصطلاح اولين بار در سال 1969 به عنوان يک شرکت آمريکايي به کار رفته است . بنابراين ابرداده مفهومي نو با مضمون کهن است (6) چرا که کتابداران قبل از ظهور رايانه يا اينترنت با سازماندهي اطلاعات در کتابخانه به ايجاد ابرداده (براي مثال ايجاد پيشينه هاي کتابشناختي، نمايه سازي مقالات و پايان نامه ها و ايجاد پايگاه اطلاعاتي از آنها،…) پرداخته اند.
تعريف رايج از ابرداده، " داده درباره داده" است. اگرچه اين تعريف گمراه کننده است و به شناخت ما درباره اينکه ابرداده چيست کمکي نمي کند، اما براي ما روشي براي شناخت ابرداده فراهم نمايد.
در وهله اول، ابرداده اطلاعات ساخت يافته است، به اين معني که آن ابداع بشري است و در طبيعت يافت نمي شود. يک نمونه خوب از اطلاعات ساخت يافته استفاده از طول و عرض جغرافيايي براي توصيف زمين و نقاط روي آن است. پرواضح است که سياره واقعي داراي خطوط در اطراف آن نيست، اگرچه ما به ديدن نقشه ها و کره ها با آن نقاط عادت کرده ايم، اما اختراع طول و عرض جغرافيايي به ما اين امکان را مي دهد تا درباره مکانهاي روي سياره و رديابي دقيق آن در فضاهاي وسيع بدون علامت و راهنما گفتگو نماييم.
اين مسئله ما را به دومين ويژگي مهم ابرداده هدايت مي کند: ابرداده بوسيله افراد بنا به هدف يا نقشي خاص تهيه مي شود. بنابراين نقشه اي از سيستم مترو ميان رانندگان توزيع مي شود؛ از طريق رمزگذاري رنگي، مسيرها و نشانه ها براي راهنمايي رانندگان در ميان شبکه پرپيچ و خم مسيرها و نقاط نقل و انتقال،  مشخص مي شود. اغلب اين نقشه ها تنها و به زحمت نشانگر مقياس واقعي و جغرافيايي شهر است که بوسيله  مترو بکار گرفته مي شود. اما کاملا مفيد است، به اين دليل که آن منظره مترو مرکزي را بر گستره و دقت جغرافيايي مورد توجه و تأکيد قرار مي دهند. نقشه راه همان منطقه به وضعيت واقعي نزديکتر خواهد بود، اما اگر آن نقشه بوسيله کميته توريستي طراحي شود، در آن هتلها، موزه ها، نقاط گردشگري و فضاهاي پارک مشخص خواهد شد. درست همانطوريکه هيچ نقشه جداگانه اي براي برآوردن تمام نيازها وجود ندارد، يک نوع ابرداده براي مدارک يا ساير اشياء اطلاعاتي هم وجود ندارد. اين به اين دليل است که خود شيء تعيين کننده نوع ابرداده نيست، بلکه نيازها و اهداف افرادي که آن را ايجاد مي کنند و افراديکه از آن استفاده مي نمايند، نوع ابرداده را تعيين مي کند. همچنين از ابرداده به عنوان جايگزيني[6] براي شيء واقعي استفاده مي شود. در فهرست کتابخانه مدخلها جايگزيني هايي براي کتابها در قفسه ها هستند، ولي آن بررسي هر کتاب را جهت انتخاب يکي از آنها براي استفاده کنندگان کتابخانه دشوار خواهد ساخت. حداقل کتاب فيزيکي وجود دارد. در محيط ديجيتالي، بدليل آنکه بيشتر منابع به آساني قابل تورق و بررسي نيستند و ساير منابع داده هاي روشني درباره خودشان ارائه نمي دهند، نقش جايگزين ابرداده اي حائزاهميت است.
افزايش علاقه به ابرداده بخشي از تلاش براي سامان دادن دنياي نسبتا نامنظم منابع ديجيتالي و فراهم کردن دسترسي و خدماتي که قبل از آن در هيچ کجا وجود نداشته است، مي باشد. همچنين آن روشي براي مبادله داده ها ميان مخازن پراکنده منابع و امکان جستجو در انبار ديجيتالي است (1).
درمجموع، مي توان  ابرداه را روشي نظامند دانست که منابع الکترونيکي روي شبکه را شناسايي، توصيف و مکان يابي مي کند. اطلاعات ابرداده اي در مورد منبع الکترونيکي شامل اطلاعات مربوط به عنوان سايت يا منبع، موضوع، پديدآورنده سايت، ناشر، تاريخ نشر يا ايجاد سايت، جزئيات مالکيت معنوي اثر، زبان، پوشش، توصيف و کليدواژه هاي قابل جستجو براي هر منبع و کد و نشانه هايي براي رده بندي محتواي مدارک مي باشد.
 
قالب توصيف منبع[7] و زبان نشانه گذاري گسترش پذير[8]
دوآغازه اي که شما همزمان با هم با بيان ابرداده خواهيد شنيد زبان نشانه گذاري گسترش پذير يا XML و قالب توصيف منبع يا RDF است. زمانيکه برخي افراد درباره XML و RDF صحبت مي کنند گويي که اين دوآغازه خودشان قالب ابرداده اي هستند، اما اين آشوبي ميان قالب و محتوا است. درعمل XML و RDF قالبهاي داده اي عمومي هستند که مي توانند در موارد گوناگون استفاده شوند. خصوصا، ازXML  اغلب به عنوان قالب مدرک استفاده مي شود و قالب کلي تري است که از آن HTML حاصل مي شود.
اگر شما با ساختار رکورد XML آشنا نيستيد، در اين صورت ممکن است آن براي شما نسبتا پيچيده و اسرارآميز به نظر آيد. در واقع، اگرچه ممکن است ايجاد رکوردهاي داده اي با آن پيچيده باشد، اما قالب پايه اي آن بسيار ساده است.
هرگاه شما فيلدهاي رکورد مارک را با تگ هايي مانند استفاده از "245" به معني "عنوان" در نظر بگيريد:

245 $a Hamlet, Prince of Denmark

در اين صورت XML تنها روش ديگري براي تگ زدن يک قطعه داده است، اگرچه آن شامل گذاشتن يک تگ شروع و يک تگ پاياني (با يک "/" قبل از نام تگ) در اطراف هر عنصر داده اي است:

<title>Hamlet, Prince of Denmark</title>

تگ ها مي تواند هر چيزي که شما تمايل داريد باشد،  به شرط اينکه شما آنها را در يک قالب داده اي تعريف ساختار، از قبل تعيين کرده باشيد. بنابراين اگر شما ترجيح مي دهيد، تعريفتان مي تواند داراي هر کدام از تگ هاي زير براي "عنوان" باشد.

<245>Hamlet, Prince of Denmark</245>
<ti>Hamlet, Prince of Denmark</ti>

در اصلXML ، مشابه تگ ها و فيلدهاي فرعي مارک، سلسله مراتبي است. مزاياي آن بيش از مارک21 است که مي تواند به اندازه اي که سطوح سلسله مراتبي لازم است را دارا باشد. برخلاف مارک21 که مي تواند داراي دو سطح تگ و فيلد فرعي باشد.
 RDF يک مرحله يا دو مرحله بعد از XML است. آن بر روابط ميان عناصر داده اي تأکيد دارد. همانطور که از نام RDF  برمي آيد ايجاد يک مکانيزمي براي توصيف منابع و اسناد برروي اينترنت است و رابطه کليدي آن توصيف[9] مي باشد. RDF  عنصر ضروري و مهمي از وب معنايي است که توسط ائتلاف شبکه جهانگستر وب[10] براي افزودن عنصر معنايي و در چارچوب توصيف منابع براي اشتراک داده ها روي اينترنت ايجاد شده است.
RDF پيچيده تر و نسبت به XML کمتر استفاده شده است و هنوز مشخص نيست، آيا آن به عنوان يک زبان عمومي در توصيف جهاني وب موفق است. به طور قطع به نظر مي رسد RDF به شناخت عميق تري در مفاهيم خاص فلسفي نسبت به XML  نياز دارد و تعداد افرادي که آن را معمايي تلقي مي کنند، بسيار بيشتر از آناني که آن را به عنوان يک راه حل مي بينند،  مي باشد. (نمونه پايين مربوط به يک رکورد Creative Commons است که از يک قالب ساده RDF استفاده مي کند) (1).
 
 ابرداده براي اشياء شبه مدرک[11]
مي توان با اين پرسش اساسي آغاز نمود که ابرداده با فهرست کتابخانه چه تفاوتي دارد؟ خاطر نشان کردن اينکه قالبهاي ابرداده اي معرفي شده در اين مقاله (دابلين کور، مودس و متس) مهمترين قالبهايي هستند که امروزه استفاده مي شوند، اما بيش از همه اين سه قالب عموما در کتابخانه هاي ديجيتالي بکار ميروند.
بدون ترديد فهرست نويسي در کتابخانه شرط لازم ايجاد مدرک ابرداده اي است. منشاء آن را مي توان در اواسط دهه 1800 در قوانين جوت و پانيزي[12] يافت. تقريبا هر شخص آموزش ديده اي با انگلوآمريکن جهاني آشنا است. در شمار زيادي، مصداقهاي فهرستنويسي کتابخانه شديدا  هر طرح ابرداده اي که درحال استفاده شدن براي کتابها است را تحت کنترل درآورده است (اگرچه احتمالا نه در مقالات مجلات).  با اين وجود، به مجرداينکه توسعه دهندگان کاربردهاي اينترنت نياز به ابرداده براي مدارک پيوسته داشتند، از استانداردهاي کتابداري استفاده نکردند. درواقع، استاندارد ابرداده اي مدرک که بر کاربردهاي غيرکتابداري پايه گذاري شده، قالب ابرداده اي دابلين کور است (1).
دابلين کور[13]
دابلين در کلمه دابلين کور اشاره به مرکز OCLC در دابلين اوهايو دارد و بدليل آنکه OCLC سازمان حمايتي دابلين کور بوده است، شما ممکن است تصور کنيد که دابلين کور از سنت کتابداري تشکيل شده است. درواقع، تلاش زيادي براي جدا کردن دابلين کور از سنت کتابداري صورت گرفت و اينکه در بيشتر موارد اين تلاشها موفق بوده است. هدف دابلين کور فراهم کردن مجموعه اي ساده از عناصر داده اي براي توصيف مدارک و ساير اشياء روي اينترنت بود. آن بسيار ساده است بطوريکه هر کسي مي تواند يک پيشينه براي مدارک خود ايجاد نمايد. دابلين کور 15 عنصر هسته دارد، که مي تواند با استفاده از تعدادي توصيفگر ارائه شود. عناصر هسته بسيار کلي هستند بنابراين بجاي "نويسنده"[14] هسته "پديدآور"[15] دارد. اما پديدآور مي تواند براي نويسنده يا مصنف و غيره تعيين شود. به آساني شما مي توانيد يک رکورد دابلين کور را براي هر چيزي ايجاد نماييد،  مانند:

creator = Karen Coyle
title = Understanding Metadata and its Purpose
date = December, 2004
description = The first draft of an article for Journal of Academic Librarianship
subject = metadata
type = text

اميد دابلين کور اين بود که مدارک روي اينترنت توصيفهاي کتابشناختي خود را حمل خواهند نمود و از اين رو عناصرداده اي به اطلاعاتي مانند نويسنده، عنوان و تاريخ رمزگذاري شده اند. به تعبيري اين "[16]ديدگاه شبه کتابدار" را معرفي مي کند، که احتمالا بايد يک مدرک را بوسيله نويسنده يا عنوانش يافت. امروزه بر روي اينترنت دابلين کور، به شدت استفاده مي شود، اگرچه آن در ايجاد فهرستي از منابع اينترنتي نتيجه نداده است. در عوض، دابلين کور ابرداده توصيف مدرک براي انواعي از کاربردهاي مبتني بر وب شده است. يک نمونه از قالب دابلين کور مجوز کرييتيو کامانز[17] است (1).
کرييتيو کامانز بنيادي غيرانتفاعي است که در راستاي گسترش دسترسي‌پذيري آثار بديع براي ديگران به منظور استفاده اشتراکي و سازنده فعاليت مي‌کند. آن توسط لاري لزيگ[18] استاد شناخته شده حقوق دانشگاه استانفورد در انتقادش نسبت به فايده قانون کپي رايت در استفاده و استفاده مجدد از عقايد پشينيان توسعه يافت. اين مجوز به پديدآورندگان امکان مي دهد تا براي استفاده از آثارشان، مجموعه اي کوچک از مجوزها را توسعه دهند تا بتواند به آساني به فايلهاي روي اينترنت متصل شود (2). اين مجوزها بيان مي کند که استفاده و استفاده هاي مجدد توسط پديدآورنده اثر تضمين مي شود. علاوه بر مجوز، نرم افزار کرييتيو کامانز به پديدآور امکان افزودن ابرداده توصيفي مانند پديدآور، عنوان، تاريخ، توصيف کوتاهي از فقره اطلاعاتي را مي دهد. اين مجوزها از عناصر دابلين کور پديدآور، عنوان، تاريخ، توصيف استفاده مي کنند (رمزگذاري شده در رکورد به شکل dc:creator، dc:title، و غيره) (شکل1).

 


 


شکل1: مجوز کرييتيو کامانز با ابرداده دابلين کور موردتأکيد قرار گرفته شده است
استفاده از مجوز کريپتو کامانز نيازي به شناخت قانون کپي رايت يا قراردادها ندارد و عناصر توصيفي عناصري هستند که تقريبا هر کسي به آساني مي تواند آنها را درک کند. در مواردي دابلين کور به هدف اش با فراهم کردن هسته عناصر توصيفي نائل شده است که مي تواند در انواع گسترده اي از کاربردهاي وب گنجانده شود. يکي از مواردي که دابلين کور را براي هر کسي آسان و قابل استفاده ساخته است، درگيرنشدن در قوانين فهرستنويسي است. اين چيزي است که خلاف طبيعت فهرستنويسي در کتابداري است و به طور قطع قابليت استفاده دوباره از محتواي رکوردهاي دابلين کور را کاهش مي دهد. توصيفهايي از هر عنصر داده اي در استاندارد دابلين کور وجود دارد، بنابراين مفهوم عنصر داده اي به طور کلي تعيين مي شود (1).

مودس: استاندارد توصيف ابرداده اي شيء گرا[19]
قالب مارک يک رکورد بي اندازه پيچيده براي رمزگذاري اطلاعات کتابشناختي است. اين قالب در عالم کتابداري مشهور است و بوسيله نظامهاي کتابداري در ايالات متحده، کانادا، و ساير کشورها خصوصا در کشورهاي انگليسي زبان حمايت مي شود. در محيط شبکه اي در شرايطي که ابرداده توصيفي مي تواند بر روي نظامها ارسال شود و مي تواند درون يا همراه با انواع ديگر ابرداده باشد، استفاده از رکوردهاي مارک با اين هدف، ايده آل به نظر خواهد رسيد. با اين وجود، گنجاندن رکوردهاي مارک درون ابرداده، استفاده از ساختار داده اي XML  را ضروري ساخته است، درحاليکه مارک يک رکورد XML نيست. کتابخانه کنگره روشي را براي تبديل رکورد مارک به XML ايجاد کرده است، اما آن با اقبال زيادي روبرو نشد و احتمالا به اين دليل که رکورد مارک بزرگتر و جزئي تر از اکثر نظامهاي مورد نياز است،  و استفاده اش از تگ هاي عددي و کدهاي فيلد فرعي موجب شده درک آن را بدون آموزش قابل توجهي مشکل سازد. چيزي که مورد نياز بود نسخه اي خوشايندتر و باکيفيت تر از مارک بود تا بتواند عناصرکليدي داده اي  از رکورد مارک را قبول نمايد و آنها را به يک قالب آسان و قابل درک XML ارسال نمايد. بنابراين استاندارد توصيف ابرداده اي شي گرا (مودس) متولد شد.
مودس از تگ هاي قابل درک بشري بجاي تگ هاي سه رقمي و کدهاي فيلدفرعي مارک (يعني "عنوان" بجاي "245") استفاده مي کند. آن بيشتر عناصر داده اي فيلد ثابت، به استثناي کدهاي قالب فيزيکي (از007) و بيشتر کدهاي نوع (از 008) را ناديده مي گيرد. همچنين آن برخي قابليت ها و نوآوري ها را معرفي مي کند. مودس يک ساختار نام گذاري شده "نام" را تعيين مي کند که فيلدها و فيلدهاي فرعي براي اسامي شخصي، سازماني و براي کنفرانسها را ارائه مي نمايد. اين ساختار مي تواند در هر جايي که نامها ظاهر خواهند شد، يا به شکل سرشناسه، شناسه هاي افزوده يا موضوعات استفاده شوند. بنابراين با يک فيلد نام شبيه:

<name type="personal">
<namePart>Shakespeare, William</namePart>
<namePart type="date">1564-1616</namePart>
</name>

مي تواند به عنوان يک فيلد نويسنده استفاده شود يا آن مي تواند قسمتي از يک سرعنوان موضوعي باشد.

<subject authority=‘‘lcsh’’>
<name type=‘‘personal’’>
<namePart>Shakespeare, William</namePart>
<namePart type=‘‘date’’>1564–1616</namePart>
</name>
<topic>Bibliography</topic>
<topic>Periodicals</topic>
</subject>

اگرچه آن از مارک 21 بدست مي آيد و بسيار جزئي تر از دابلين کور است، مودس قوانين بسيار کمتري از مارک 21 دارد. مانند دابلين کور، در آن فيلدهاي غيرضروري وجود ندارد و تمام فيلدها قابل تکرارهستند. مودس نه تنها ارزشهاي بسيار زيادي نسبت به مارک دارد؛ بلکه آن روشي نوين از مارک 21 است: مفاهيم سرشناسه يا شناسه افزوده وجود ندارد، تمام نويسندگان فقط نويسندگان هستند؛ و يک رکورد مي تواند عناوين چندگانه بدون يک "عنوان اصلي" تکي داشته باشد. زمانيکه رکوردهاي مارک 21 به مودس تبديل مي شوند، شما رکوردي در XML مي گيريد که نوعي از "MARC- lite"[20] است (4). رکوردهاي مودس همچنين مي تواند از ابرداده هاي کتابشناختي ايجاد شوند، و اغلب در پايگاههاي اطلاعاتي استفاده مي شود که ترکيبي از فهرست کتابخانه و ساير داده هاي کتابشناختي خواهد بود (1).

 

متس[21]: ابرداده به عنوان ساختار
مديريت کتابخانه هاي متشکل از شيء هاي ديجيتالي نيازمند مديريت ابرداه هاي آن شيء هاست. ابرداده هاي ضروري براي مديريت موفق و استفاده از شيء هاي ديجيتالي، گسترده تر و متفاوت تر از ابرداده هاي مورد استفاده در مديريت مجموعه آثار چاپي و ساير منابع فيزيکي مي باشد. در فهرستهاي کتابخانه ها ابرداده توصيفي هر کتاب ثبت مي شود. اگر کتابخانه در ثبت دقيق ابرداده ساختاري سازمان منتشردهنده کتاب ناموفق باشد، به هم پيوستگي صفحه هاي کتاب مذکور از بين نخواهد رفت. همچنين اگر کتابخانه در بيان نحوه چاپ کتاب و استفاده از ابزارهاي ويژه دقت نکرده باشد، در بازيابي کتاب توسط محققان آثار منفي در پي نخواهد داشت، اما اين مسائل درخصوص نسخه ديجيتالي همان کتاب صحيح نيست. بدون ابرداده ساختاري، تصوير صفحه يا فايل متني به وجود آورنده اثر ديجيتالي کمتر مورد استفاده قرار خواهد گرفت. براي اهداف مديريت داخلي، کتابخانه بايد ابرداده فني مناسب جهت روزآمدسازي و انتقال متناوب داده و اطمينان از ماندگاري منابع باارزش دسترسي داشته باشد. اين قالب استاندارد با فراهم کردن يک قالب کدگذاري براي ابرداده توصيفي، مديريتي و ساختاري جهت آثار متني و تصويري به حل اين مسئله کمک کند. نتيجه و حاصل از اينکار، مدارک با قالب XML مي باشد که از اين طريق کدگذاري ابرداده هاي ضروري جهت مديريت شيء هاي ديجيتالي در مخزن و نيز تبادل چنين شيء هايي بين مخزنها (يا بين مخزنها و کاربران آنها) فراهم مي شود(6).
با اين اوصاف، مدرک ابرداده اي وجود دارد که هدف "توصيف" به مفهوم فهرستنويسي نيست. يک مثال از قالب ابرداده اي که در حال استفاده توسط کتابخانه ها و آرشيوهاي ديجيتالي است، استاندارد رمزگذاري و انتقال ابرداده (متس) مي باشد. از متس به عنوان "يک روکش" براي حفظ فايلها با يکديگر استفاده مي شود تا يک شيء ديجيتالي ايجاد شود. برخلاف جلدکتاب،  مدارک ديجيتالي اغلب از تعدادي فايلهاي جداگانه ارائه شده در صفحات يا واحدهاي ديگر ساخته مي شود. و بر خلاف کتاب فيزيکي، جلد يا عنوان صفحه قابل رويت نيست، نه مي توان از انگشت شست براي يافتن صفحه اي خاص در کتاب استفاده نمود. متس را به عنوان صحافي، جلد و رديابي يک گروه از فايلهاي ديجيتالي تصور کنيد (3).
همچنين آن شامل اطلاعات فني است که نياز به کنترل و شناخت اين فايلها خواهد داشت، مانند قالبهاي فايل، فناوري استفاده شده در پويش اگر فقره اطلاعاتي زندگي اش را برروي کاغذ آغاز کند، و تغييرشکل ديجيتالي و فشردگي که برروي فايلها استفاده شده است. چيزي که متس تعيين نمي کند ابرداده توصيفي است. درعوض امکان ايجاد رکوردهاي متس براي درج در هر ابرداده توصيفي وجود دارد. اين ويژگي مهم، دنياي ابرداده را توصيف مي کند، که ما همچنين آن را در نمونه کريپتوکامانز مشاهده نموديم:  ابرداده مي تواند دوباره استفاده شود بجاي اينکه دوباره اختراع شود. معمولا رکوردهاي متس ابرداده توصيفي در دابلين کور يا در مودس را حمل مي کنند (1).


ابرداده و فهرست کتابخانه
آيا ابرداده جايگزين فهرستنويسي خواهد شد؟ در بالا بيان شد که يکي از مسائل مهم در رکورد دابلين کور اين است که آن از قوانين فهرستنويسي بي بهره است و بنابراين پيش بيني پذيري کمي ميان جوامع يا پروژه ها باتوجه به محتواي فيلدها وجود دارد. چيزي که فهرستها و فهرستنويسي کتابخانه فراهم مي کند ميزان بالايي از يکنواختي و يکدستي در داده هاي ذخيره شده در پيشينه ها است. اين يکنواختي خدمت به استفاده کنندگان است، که مي توانند از يک کتابخانه به يک کتابخانه ديگر به راحتي حرکت نمايند. اما ارزش اصلي يکنواختي در پيشينه ها امکان فهرستنويسي اشتراکي و مبادله پيشينه هاي فهرستنويسي ميان کتابخانه ها و نظامهاي کتابداري است. همچنين آن به کارگزاران و فروشندگان نظامهاي کتابخانه براي توليد يک محصول امکان مي دهد تا بتواند در هر کتابخانه استفاده شود، درست همانطوري که فهرستبرگه استاندارد شده مي تواند درون هر کشوي فهرست برگه اي جاگيرد.
قابليت هايي که نتيجه اين يکنواختي است فوق العاده است و جامعه کتابداري نيازمند اين يکنواختي براي فهرستنويسي منابع دست اولش است. اما کتابخانه در سازماندهي منابع سنتي کمتر حرکت مي کند، و نه قوانين فهرستنويسي و نه نظامهاي کتابخانه اي راه حل هاي قابل اجرايي را فراهم نمي کنند. پيش خود تصور کنيد که شما آرشيوي داريد که تصويرهايي از شهر خودتان در اوايل قرن 20 دارد، و شما تمايل داريد آنها را بر روي وب قابل دسترس سازيد. اجازه دهيد بگويم که شما حدودا يک هزار عکس از آنها  داريد. در بيشتر آنها، شما تصور و ايده اي از عکاس نداريد، و اغلب عکسها تاريخي ندارند. کسي در گذشته در پشت آنها چيزي نوشته است، يعني، Main street, circa1910 فهرست کردن و توليد رکوردهاي مارک 21 از اين عکسها زمان زيادي نخواهد گرفت و رکوردهاي نتيجه اطلاعات کمي خواهد داشت. ولي، شما مي توانيد رکورد دابلين کور را به سادگي به شکل زير، توليد کنيد:

Date=circa1910
Description=main street

اين رکورد نمي تواند در فهرست پيوسته يتان وارد شود، اگرچه رکوردهاي شبيه اين مي تواند اهداف فناوري هاي ابرموتورهاي جستجو باشد که امکان جستجوي تکي را بجاي رفتن در چندين پايگاههاي اطلاعاتي  با قالبهاي ابرداده اي مختلف فراهم مي سازد. فايده مهمي که اين رکوردها دارند مي تواند سريعا و به سادگي بوسيله کارمند کتابخانه با کمي آموزش ايجاد شود.  ابرداده مانند دابلين کور از سطح پيش بيني پذيري بي بهره است که آن هم استفاده مجدد نظامند و گسترده از رکوردها را امکان پذير خواهد ساخت. در حقيقت اين قالبهاي ابرداده اي و ساير قالبهاي ابرداده اي، اغلب در نظامهاي ويژه و مستقل غيريکپارچه[22] براي مبادله داده ها استفاده مي شوند. همانطورکه کتابخانه ها در اواخر قرن 19 براي مبادله داده ها آغاز کردند، نظامهاي ويژه نيز با اين هدف شروع نمودند، در واقع توسعه دهندگان ممکن است به اين  نتيجه برسند که محتواي رکوردهاي ابرداده اي، نه ساختار رکوردشان، موجب تفاوت بين يک راه حل نظام تکي و دنياي کتابشناختي منسجم است. به عبارت ديگر، ممکن است تصور نماييم زمانيکه ابرداده رشد نمايد،  به فهرستنويسي تبديل شود (1 ).
 
نتيجه گيري
ظهور محيط هاي الکترونيکي جديد و منابع الکترونيکي مختلف، ضرورت الگوها، روشها و استانداردها و ابزارهاي جديد براي ذخيره، سازماندهي و بازيابي دقيق آنها را اثبات کرده است. ابرداده درواقع براي پاسخ به چنين نيازي پا به منصه ظهور گذارده است. کتابداران و اطلاع رسانان که سالهاست به عنوان سازماندهندگان منابع اطلاعاتي چاپي ايفاي نقش کرده اند لازم است با ابزارهاي جديد سازماندهي منابع اطلاعاتي الکترونيکي آشنا شوند (5). قالبهاي ابرداده اي دابلين کور، متس و مودس که در اين مقاله معرفي شدند، پرکاربردترين قالبهاي ابرداده اي در ايجاد کتابخانه هاي ديجيتالي است. شناخت و استفاده موثر از اين قالبها از گامهاي اساسي در سازماندهي مطلوب اطلاعات الکترونيکي به ويژه منابع اينترنتي است.
 ترجمه و تأليف: مريم اسدي[1]

يادداشتها:

[1] 1- کارشناس ارشد کتابداری و اطلاع رسانی، تلفن: 66165118 و 09126350928
[2] – این نقل قول در ابتدا به تام دلزی از کتابخانه ملی کانادا (ابرداده: فهرستنویسی برای افراد) و سپس به میشل گورمن (…ابرداده فهرست تهیه شده توسط افراد است) نسبت داده شده است.


 [3] Meta Tag
[4] HTML: HyperText Markup Language
[5] Metadata
[6] Surrogate
[7]  Resource Description Framework (RDF)
[8] eXtensible Markup Language (XML)
[9] about
[10] World Wide Web Consortium (W3C)
[11] Document –like objects
[12] Jewett and Panizzi
[13] Dublin Core
[14] Author
[15] Creator
[16] librarian- like point of view
[17] Creative Commons license
[18] Larry Lessig
[19] MODS: Metadata Object Description Standard
[20] MARC21- lite Bibliographic Format زیرمجموعه ای از MARC 21 Bibliographic Format است که راهنمای مرجع فوری برای برچسب زدن و شامل تمام عناصر ضروری برای ایجاد توصیفهای کتابشناختی اقلام اطلاعاتی است.
[21] METS: Metadata Encoding and Transmission Standard
[22] ad hoc and stand alone systems

منابع

1. Karen Colyle.(2005)."Managing Technology: Understanding metadata and its purpose". The Journal of Academic Librarianship, v.31, n.2, p.160-163.
2. http://www.creativecommons.org. access in: 2006-11-24
3. http://www.loc.gov/standards/mets/.  access in: 2006-11-24
4. http://www.loc.gov/marc/bibliographic/lite/genintro.html. access in: 2006-11-24


5. علي اصغر شيري. "ابرداده و تاثير آن بر فهرستهاي ماشين خوان…". فهرستهاي رايانه اي کاربرد و توسعه: مجموعه مقالات همايش کاربرد و توسعه فهرستهاي رايانه اي در کتابخانه هاي ايران. به کوشش رحمت الله فتاحي.- مشهد: دانشگاه فردوسي مشهد، 1379.
6. فاطمه نبوي. کتابخانه ديجيتالي: مباني نظري…. مشهد: سازمان کتابخانه ها موزه ها و مرکز اسناد آستان قدس رضوي، 1384.

 

متن كامل در قالب pdf

      

 

 

منبع : مجله الکترونيکي پژوهشگاه اطلاعات و مدارک ايران

1,759 total views, 2 views today

Share

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *