خلاصه
سرویس دادههای باستانشناسی (ADS) یک آرشیو دیجیتالی است که به مدت بیست سال در حال ترویج شیوههای خوب در استفاده از دادههای باستانشناسی دیجیتال و پشتیبانی از تحقیق، یادگیری و آموزش با کیفیت بالا و منابع دیجیتالی قابل اعتماد است. ADS این کار را با حفظ داده های دیجیتال در بلندمدت و با ترویج و انتشار مجموعه داده های باز و رایگان جمع آوری شده از تمام بخش های باستان شناسی انجام می دهد. یک جزء جدایی ناپذیر از مسئولیت ADS، اصل چرخه عمر حفظ، نگهداری و انتشار داده ها به منظور امکان استفاده مجدد بوده است. ADS ترکیبی از نرمالسازی، انتقال نسخه، انتقال فرمت و تازهسازی را برای مدیریت فعال و حفظ مداوم انواع دادههای بایگانی شده انجام میدهد. این مقاله اهمیت مدیریت مداوم داده های تحقیقاتی را برای حفظ طولانی مدت برجسته می کند. این مقاله به طور خاص بر چالشهای انتقال دادههای مکانی، بهویژه فایلهای طراحی به کمک رایانه (CAD) تمرکز دارد. انتقال موفقیت آمیز داده های این فایل ها تضمین می کند که داده ها قابل دسترسی و قابل استفاده هستند و فرصت های زیادی را از طریق استفاده مجدد از داده ها برای ترکیب و بازجویی مجدد مجموعه داده ها فراهم می کند و امکان توسعه تفاسیر باستان شناسی جدید را فراهم می کند.
کلید واژه ها:
حفظ دیجیتال ؛ مهاجرت داده ها ; CAD ؛ استفاده مجدد
چکیده گرافیکی
1. معرفی
یکی از اجزای اساسی مدیریت موثر داده های پژوهشی، حفظ و نگهداری داده های دیجیتال است. این مقاله اهمیت حفظ دیجیتال و مدیریت فعال دادههای تحقیقاتی را از طریق مطالعه موردی حفاظت با مهاجرت دادههای طراحی به کمک رایانه (CAD) در رشته باستانشناسی مورد بحث قرار میدهد. مسائل مرتبط با حفظ طولانی مدت داده های دیجیتال – همراه با مزایای انجام این کار – اکنون در طیف گسترده ای از زمینه های خارج از جامعه آرشیوی به طور فزاینده ای شناخته شده است. در رشته باستان شناسی آگاهی فزاینده ای از اهمیت مدیریت داده های تحقیقاتی وجود دارد و منابع دسترسی آزاد آنلاین به جنبه ای فزاینده مهم از تحقیقات باستان شناسی مدرن تبدیل شده اند. باستان شناسی در ذات خود می تواند فرآیندی مخرب باشد. ایجاد یک رکورد جامع از تحقیقات باستان شناسی برای این رشته ضروری است زیرا بسیاری از روش های میدانی اولیه باستان شناسی توسط محققان آینده قابل تکرار نیستند. بنابراین حفظ و تسهیل دسترسی به این پرونده باستان شناسی به منظور آزمایش، ارزیابی و متعاقباً تجزیه و تحلیل مجدد داده ها و فرضیه های ناشی از آنها حیاتی است. چارچوبهای عملکرد خوب اکنون سازمانهای باستانشناسی و متخصصان را ملزم میکنند تا روشهایی را برای اطمینان از حفظ طولانیمدت و دسترسی به دادههای دیجیتالی ایجاد کنند. در انگلستان چارچوب سیاست برنامه ریزی ملی [ بنابراین حفظ و تسهیل دسترسی به این پرونده باستان شناسی به منظور آزمایش، ارزیابی و متعاقباً تجزیه و تحلیل مجدد داده ها و فرضیه های ناشی از آنها حیاتی است. چارچوبهای عملکرد خوب اکنون سازمانهای باستانشناسی و متخصصان را ملزم میکنند تا روشهایی را برای اطمینان از حفظ طولانیمدت و دسترسی به دادههای دیجیتالی ایجاد کنند. در انگلستان چارچوب سیاست برنامه ریزی ملی [ بنابراین حفظ و تسهیل دسترسی به این پرونده باستان شناسی به منظور آزمایش، ارزیابی و متعاقباً تجزیه و تحلیل مجدد داده ها و فرضیه های ناشی از آنها حیاتی است. چارچوبهای عملکرد خوب اکنون سازمانهای باستانشناسی و متخصصان را ملزم میکنند تا روشهایی را برای اطمینان از حفظ طولانیمدت و دسترسی به دادههای دیجیتالی ایجاد کنند. در انگلستان چارچوب سیاست برنامه ریزی ملی [1 ] بیان می کند که هر گونه دارایی میراثی که از بین می رود (به طور کامل یا جزئی) باید به روشی متناسب با اهمیت آنها ثبت شود و هر آرشیو ایجاد شده باید در دسترس عموم قرار گیرد. مؤسسه منشور باستان شناسان همچنین در استانداردها و دستورالعمل های خود تأکید می کند “این مسئولیت همه متصدیان بایگانی های باستان شناسی است که اطمینان حاصل کنند که آرشیوها مطابق با استانداردهای شناخته شده برای نگهداری طولانی مدت ذخیره می شوند و برای مشاوره در دسترس قرار می گیرند” [2 ] .
سرویس داده های باستان شناسی (ADS) یک مخزن دیجیتال مخصوص رشته است که در سال 1996 در پاسخ به افزایش ایجاد داده های باستان شناسی دیجیتال متولد شده [ 3 ] و در شناخت خطرات مرتبط با از دست دادن داده ها [ 4 ] تاسیس شد. ADS توسط دپارتمان باستانشناسی دانشگاه یورک میزبانی میشود و در ابتدا توسط هیئت تحقیقات هنر و علوم انسانی بریتانیا (اکنون شورای تحقیقات هنر و علوم انسانی، AHRC) و کمیته سیستمهای اطلاعاتی مشترک (JISC) تامین مالی میشود. اخیراً ADS یک مدل کسب و کار نوآورانه را توسعه داده است که بر سیاست شارژ سپرده گذار متکی است [ 5]. وظیفه ADS حمایت از تحقیق، یادگیری و آموزش در باستان شناسی با منابع دیجیتالی با کیفیت بالا و قابل اعتماد است. ADS این کار را با حفظ داده های دیجیتال در درازمدت، حمایت از استقرار فناوری های دیجیتال، ترویج و انتشار طیف وسیعی از داده ها در باستان شناسی، و ارائه مشاوره فنی به بخش از طریق وب سایت ADS انجام می دهد. در طول 20 سال گذشته، ADS به طور گسترده ای برای برتری در حفظ دیجیتال و در توسعه و انتشار راهنمایی در مورد استانداردهای بایگانی، نه فقط در جامعه باستان شناسی، بلکه در مقیاس بسیار گسترده تر شناخته شده است. در سال 2012، ADS جایزه ده ساله ائتلاف حفظ دیجیتال (DPC) را برای برجسته ترین سهم در حفظ دیجیتال در دهه گذشته دریافت کرد [ 6]] و ADS از سال 2011 مهر تایید داده را دارد [ 7 ].
یک جزء جدایی ناپذیر از مسئولیت ADS، اصل چرخه عمر حفظ، نگهداری و انتشار داده ها به منظور امکان استفاده مجدد بوده است. این مقاله راهبردهای حفظ دیجیتال و مهاجرت در ADS را قبل از پرداختن به چالشهای مهاجرت اخیر در مقیاس بزرگ فایلهای CAD که توسط ADS انجام شده است، معرفی میکند. این اولین بار است که در 20 سال از عمر ADS، مهاجرتی در این مقیاس انجام شده است. استراتژی انتقال داده های CAD، همانطور که توسط ADS استفاده می شود، ارائه شده و مراحل لازم برای یک مهاجرت موفق CAD ارائه شده است. نتایج مثبت و منفی مرتبط با مهاجرت ارائه شده است. این مطالعه موردی درسهای ارزشمندی را برای جامعه حفظ دیجیتال و کسانی که سعی در مهاجرت به عنوان بخشی از استراتژیهای مدیریت دادههای تحقیقاتی خود دارند، ارائه میدهد.
2. حفظ دیجیتال در ADS
ADS مجموعه داده های باستان شناسی را در منطقه ای که به طور کلی به عنوان باستان شناسی و محیط تاریخی تعریف شده است، از جمله جنبه های فرهنگ مادی تاریخ باستان و کلاسیک حفظ می کند. دادههایی که برای سپرده به ADS ارائه میشوند، برای ارزیابی محتوای فکری آنها و ارزیابی اینکه آیا میتوانند بهطور زنده به آنها دسترسی پیدا کنند، مدیریت شوند، حفظ شوند و منتشر شوند، ارزیابی میشوند [8 ] .
به منظور برآورده ساختن این الزامات، ADS مجموعهای از دستورالعملهای آنلاین برای سپردهگذاران [ 9 ] را به سپردهگذاران ارائه میدهد که توصیههای مفصلی در مورد خطمشی جمعآوری ADS، فرمتهای فایل پذیرفتهشده برای سپردهگذاری، و نحوه کامپایل ابرداده بهطور خاص برای سپردهگذاری با ADS ارائه میدهد. دستورالعملهای سپردهگذاران توسط ADS و راهنماهای باستانی دیجیتال برای عملکرد خوب [ 10 ] تحسین شده است. راهنمای عملکرد خوب مجموعه ای از راهنماهای آنلاین است که هدف آن ارائه مشاوره و گردش کار برای برنامه ریزی، ایجاد و حفظ انواع داده های باستان شناسی رایج است.
در رشته باستان شناسی، پیشرفت رسانه های دیجیتال به طرز چشمگیری نحوه برقراری ارتباط و ثبت میراث خود را تغییر داده است. امروزه باستان شناسان در هر مرحله از پروژه، از کار میدانی و ارزیابی، از طریق تجزیه و تحلیل و گزارش، تا انتشار، داده های دیجیتالی را در حجم بی سابقه ای تولید می کنند. این مجموعه دادهها به طور فزایندهای پیچیده هستند، از فرمتهای مختلفی استفاده میکنند، و میتوانند تحقیقات انباشتهشده افراد، تیمها و مؤسسات باشند و مجموعهای وسیع و پراکنده را تشکیل دهند. فرآیندهای حفاظت ممکن است با صدها نوع فایل، از انواع دستگاههای فراوان، با استفاده از مجموعهای از بستههای نرمافزاری و طیف وسیعی از تکنیکهای باستانشناسی سروکار داشته باشند که به چالش حفظ میافزاید. انواع داده هایی که معمولاً توسط ADS بایگانی می شوند عبارتند از: گزارش های متنی، پایگاه های داده، تصاویر شطرنجی (شامل عکسهای هوایی، تصاویر سنجش از دور، نقشهها و نقشههای دیجیتالی)، مجموعه دادههای مربوط به بررسیهای توپوگرافی و زیرسطحی و سایر دادههای مکانی، تصاویر برداری، مانند نقشههای CAD، مدلهای بازسازی سهبعدی، ویدئو و صدا. برای کاهش چالش مواجهه با چنین تنوعی از انواع دادههای مختلف، ADS رویههای دادهای بهروز را برای همه انواع دادههای باستانشناسی رایج حفظ میکند، که شامل جزئیات مربوط به فرمتهای فایل مناسب برای رسوب، نگهداری طولانیمدت و انتشار است.
دادههای سپردهشده با ADS در چارچوبی مدیریت میشوند که با مدل مرجع سیستم اطلاعات بایگانی باز (OAIS) مطابقت دارد [ 11 ]. مدل مرجع OAIS چارچوبی است که مسئولیتها و تعاملات تولیدکنندگان، مدیران و مصرفکنندگان داده را تعریف میکند و فعالیتهای اصلی (و روابط بین آنها) را که برای کارکرد سیستم باید انجام شوند، ترسیم میکند. شکل 1توابع اصلی مدل مرجع OAIS را نشان می دهد. مدل مرجع به طور خاص فرآیندهای مورد نیاز برای جذب، نگهداری و انتشار درازمدت دادهها را از طریق یک سری تغییرات دادهای که باید با انتقال دادهها از تولیدکنندگان داده از طریق OAIS و به مصرفکنندگان داده صورت گیرد، مشخص میکند. این تحولات بسته های اطلاعاتی زیر را تشکیل می دهند:
-
بسته اطلاعاتی ارسال (SIP): داده های ارائه شده توسط تولید کننده داده، از جمله اسنادی برای تسهیل بایگانی و استفاده مجدد.
-
بسته اطلاعات بایگانی (AIP): داده های تولید شده از SIP و تبدیل به یک بسته نگهداری طولانی مدت که در OAIS مدیریت می شود، شامل اسناد اداری، فنی و استفاده مجدد.
-
بسته اطلاعاتی انتشار (DIP): دادههایی که از SIP یا AIP تولید میشوند و در دسترس مصرفکنندگان داده قرار میگیرند، از جمله اسنادی برای تسهیل استفاده مجدد.
سیاست حفظ ADS [ 12 ] و عملیات مخزن [ 13] به طور فعال استراتژی های حفاظت و مدیریت مبتنی بر مدل مرجع OAIS را با هدف اطمینان از صحت، قابلیت اطمینان و یکپارچگی منطقی همه منابعی که به آن سپرده شده است، دنبال می کند. عملیات ADS را میتوان به طور خلاصه به شرح زیر بیان کرد: تولیدکنندگان داده، دادهها را در قالبهای پذیرفتهشده با فرادادههای خاص نوع داده، در سطح فایل، ذخیره میکنند. داده ها و ابرداده های ارائه شده توسط تولید کننده داده، در کنار اسناد اداری به SIP تبدیل می شوند. سپس SIP به سیستم مدیریت مجموعه های ADS (یک برنامه جاوا Struts سفارشی مبتنی بر پایگاه داده Oracle که تمامی فرآیندهای الحاق، حفظ و انتشار ADS را تسهیل و ضبط می کند) وارد می شود. فرآیند الحاق شامل تأیید اعتبار، یکپارچگی، سازگاری و کامل بودن همه داده ها و فراداده های دریافتی است. سپس SIP ذخیره می شود و یک AIP و DIP ایجاد می شود. این اغلب مستلزم تبدیل داده ها به فرمت های فایل مناسب برای نگهداری طولانی مدت و انتشار آنلاین است. سپس AIP و SIP برای ذخیره و نگهداری طولانی مدت وارد بایگانی ADS شوید. برای همه مجموعههای داده، DIP بهعنوان مجموعهای از فایلهای قابل دانلود از وبسایت ADS در دسترس مصرفکنندگان داده قرار میگیرد. این گردش کار در به تصویر کشیده شده استشکل 2 . جدول 1 همچنین نمونه هایی از تبدیل داده های انجام شده برای ایجاد قالب های AIP و DIP برای انواع داده های ارسال شده در قالب های انتخابی را ارائه می دهد. در حالی که مجموعه دادههای خاصی دارای رابطهای آنلاین اضافی هستند (به عنوان مثال، پایگاههای داده قابل جستجو یا مجموعه دادههای GIS)، همه دادهها – از جمله فایلهای CAD – در ADS به عنوان فایلهای فردی در مجموعههای مجزا مبتنی بر پروژه ذخیره و منتشر میشوند. در حالی که چنین استراتژی در حال حاضر به این معنی نیست که داده ها (به عنوان مثال، مجموعه داده های مکانی) بین مجموعه ها یکپارچه شده است، ابرداده استاندارد شده در سطح مجموعه و فایل در کل آرشیو ADS یکپارچه شده است تا امکان کشف داده ها را فراهم کند.
3. مروری بر مهاجرت
OAIS استراتژی های حفاظت یا راهنمایی خاصی را برای حفظ انواع داده های خاص در AIP ممنوع نمی کند، اما رویکردهای مدیریت فعال و چرخه حیاتی که از آن حمایت می کند، به جای شبیه سازی یا حفظ فناوری، به سمت مهاجرت گرایش دارد [11 ] . ADS این رویکرد را اتخاذ میکند و از ترکیبی از عادیسازی، انتقال نسخه، مهاجرت قالب و تازهسازی برای حفظ مداوم همه انواع دادههای آرشیو شده استفاده میکند [ 12 ] (ص 4-5).
برنامه ریزی برای انتقال داده های ذخیره شده در ADS یک جزء کلیدی از فعالیت های چرخه عمر داده های بزرگتر “برنامه ریزی حفظ” ما است. انواع مختلف مهاجرت دیجیتال به تفصیل در سند مرجع OAIS مورد بحث قرار گرفته است، اما به عبارت ساده، انتقال داده شامل انتقال یا به روز رسانی مجموعه ای گسسته از داده ها است که در آن نسخه قدیمی به طور جامع با یک پیاده سازی جدیدتر یا جایگزین جایگزین می شود. . تمام دادههای موجود در بایگانی ADS به فرمتهای استاندارد نگهداری و انتشار در هنگام مصرف عادی میشوند ( جدول 1 را ببینیدبه عنوان مثال)، با این حال، این قالب ها ممکن است قدیمی شوند یا توسط نسخه های جدیدتر یا فرمت های جایگزین جایگزین شوند. فعالیتهای در حال انجام ADS، از جمله «نگرش فناوری» و تعامل با جوامع کاربر، با هدف نظارت و برجسته کردن چنین پیشرفتهایی انجام میشود. هنگامی که قالب جدیدی ظاهر می شود که هم برای ADS و هم برای جامعه تعیین شده (هم تولیدکنندگان داده و هم مصرف کنندگان داده) مناسب است، ممکن است نیاز به مهاجرت دیجیتال را ایجاد کند. مهاجرت در ADS معمولاً بر حسب بهروزرسانی یا جایگزینی یک فرمت فایل نگهداری طولانیمدت در کل آرشیو تعریف میشود. روشی که در آن دادهها در دایرکتوریهای AIP در ADS ذخیره میشوند، به سمت چنین انتقال دادههای مبتنی بر فرمت تنظیم میشوند [ 13 ].
شایان ذکر است که انتقال داده در مقیاس بزرگ بدون خطر نیست [ 11 ] (ص 3-5) و به طور ایده آل باید با فرآیند اولیه عادی سازی داده ها به فرمت های استاندارد انجام شده در مرحله دریافت کاهش یابد. یک جزء کلیدی برای شناسایی قالب های مناسب برای حفظ و انتشار داده ها، پایداری و مقاومت آنها در برابر تغییرات مکرر است. هنگامی که یک انتقال داده اتفاق می افتد، اغلب نشان دهنده یک تغییر با دقت برنامه ریزی شده و اساسی در نحوه جذب، ذخیره و نگهداری یک نوع داده خاص توسط یک مخزن است، به عنوان مثال، یک قالب ترجیحی جدید جایگزین قالب داده استاندارد شده قبلی می شود که در کل بایگانی استفاده می شد.
-
به عنوان یک فرآیند گام به گام ساده شده، انتقال داده شامل موارد زیر است: شناسایی داده های آرشیو شده (به عنوان مثال، انواع فایل های خاص) که نیاز به مهاجرت دارند.
-
تکرار و ذخیره سازی این داده ها به عنوان یک AIP “اصلی”.
-
انتقال داده های شناسایی شده به فرمت آرشیوی جدید و ایجاد AIP جدید
علاوه بر ایجاد «دادههای جدید»، انتقال داده همچنین شامل بهروزرسانی مربوطه به اطلاعات توصیفی مربوطه و اطلاعات توصیف حفاظت (PDI) مربوط به مجموعه دادههای مهاجرت شده است. این بهروزرسانیها جزء کلیدی چرخه عمر دادهها هستند و شامل مستندسازی فرآیندهایی هستند که بر روی کدام دادهها (ورودی و خروجی)، مکانهای جدید برای این دادهها و سایر عناصر مانند مقادیر ثابت انجام شدهاند.
4. استراتژی مهاجرت CAD در ADS
در سال 2013، از طریق ترکیبی از نظارت فناوری و نظارت بر مجموعه دادههای وارد شده به بایگانی ADS، تصمیم گرفته شد که تغییری در سیاست در مورد نحوه ذخیره و انتشار فایلهای CAD توسط ADS ضروری است. فایلهای CAD دو و سه بعدی، همراه با طیف گستردهای از مجموعه دادههای جغرافیایی و سه بعدی، جزء مشترک بسیاری از پروژههای باستانشناسی هستند و به طور مرتب در ADS از طیف گستردهای از تولیدکنندگان دادههای تجاری و مبتنی بر تحقیق سپرده میشوند. شکل 3 نمایشی از یک فایل CAD دو بعدی معمولی است که ارتفاع یک ساختمان شامل اطلاعات مراحل ساختمان را ثبت می کند. شکل 4یک مدل معمولی سه بعدی CAD از یک بلوک از یک ساختمان تاریخی را به تصویر می کشد. این فایلها تقریباً همیشه در نرمافزار Autodesk Autodesk ایجاد میشوند و برنامهها و انواع فایلهای مربوطه حداقل در 15 سال گذشته یک استاندارد واقعی برای دادههای CAD باستانشناسی باقی ماندهاند [14] در حالی که پذیرش رایج این نرمافزار منجر به الزامات ظاهراً ساده شده است. برای سپرده گذاری داده ها – دستورالعمل های ADS مشخص می کند که فایل های CAD باید به صورت اتوکد DWG یا فرمت تبادل نقشه (DXF) [ 15 ] سپرده شوند – به روز رسانی منظم و انتشار نسخه های جدید این فرمت ها توسط Autodesk تعدادی از مشکلات را برای ذخیره و نگهداری طولانی مدت این داده های CAD.
قبل از انتقال دادهها که در اینجا توضیح داده شد، خطمشی بایگانی ADS این بود که دادههای CAD را بهعنوان فایلهای DWG AutoCAD بومی یا در قالب DXF Autodesk دریافت کند. سپس این فایلها به DXF نسخه R14 هم برای حفظ و هم برای اهداف انتشار منتقل شدند ( جدول 2 را ببینید ). تصمیم برای استفاده از DXF R14 بهعنوان یک فرمت حفاظتی، اساساً مبتنی بر پشتیبانی آن از رمزگذاری متنی (ASCII) و هدف اصلی آن بهعنوان قالب تبادلی است که میتواند فراتر از نرمافزار Autodesk مورد استفاده قرار گیرد [18] .]. با این حال، در واقعیت، به دلیل توسعه سریع نرم افزار اتوکد، فرمت DXF تقریباً به اندازه فرمت اختصاصی DWG (که از سال 1982 هجده نسخه جدید را دیده است) به روز رسانی نسخه را مشاهده کرده است. در نتیجه، در اوایل سال 2014 تصمیم به تغییر سیاست بایگانی ADS گرفته شد و DWG نسخه 2010 (AC1024) به عنوان فرمت آرشیوی ترجیحی برای دادههای CAD اتخاذ شد. این قالب مورد ارزیابی قرار گرفت و مشخص شد که فرمتی نسبتاً پایدار و به خوبی پذیرفته شده است و از آنجایی که استفاده از اتوکد در جامعه رایج است، حرکت به یک قالب بومی مزایای خاصی را هم از نظر سازگاری و هم از نظر اندازه فایل معرفی میکند. از آنجایی که فرآیند انتقال داده ها بر روی فرمت های اتوکد بومی متمرکز بود، حرکت به فرمت DWG همچنین تضمین بهتری را ارائه کرد که ویژگیها و ویژگیهای مهم مختلف فایلهای CAD هم در نسخههای نگهداری و هم در انتشار دادهها باقی میماند. چنین ویژگی هایی شامل دقت و صحت داده ها، مختصات مرتبط و هندسه در کنار قراردادهای بصری مانند وزن خطوط، سبک ها و رنگ ها می شود.19 ] (اینها همچنین در فایل های فراداده مورد نیاز که با تمام مجموعه داده ها سپرده شده اند، مستند شده اند).
علاوه بر انتقال مجموعه داده های CAD بایگانی شده، انتقال دیجیتال پیشنهادی فایل های CAD در ADS نیز شامل به روز رسانی نسخه های انتشار این فایل ها است. قبلاً تمام دادههای CAD بهعنوان فایلهای DXF قابل دانلود جداگانه (همان قالبی که در AIP ذخیره میشد) منتشر میشد. به عنوان بخشی از این فرآیند، تصمیم بر این شد که ADS همچنین باید با هدف افزایش قابلیت دسترسی و استفاده مجدد از مجموعه دادههای CAD از طریق انتشار فایلهای DWG و DXF اتوکد 2010 در کنار فایلهای فرمت سند قابل حمل (PDF)، تصاویر پیشنمایش، و ریز عکسهای طرح بندی طرح. در حالی که انتقال داده های CAD در AIP های موجود یک وظیفه “پشت صحنه” بود، که در درجه اول به نیازهای حفظ بلندمدت ADS کمک می کرد.
5. فرآیند مهاجرت CAD
فرآیند انتقال داده ها طی چند ماه در طول سال 2015 انجام شد و می توان آن را به یک سری مراحل به وضوح تعریف کرد. این مراحل در زیر خلاصه شده و در شکل 5 نشان داده شده است :
مرحله 1: شناسایی فایل های CAD. مرحله اولیه انتقال داده ها شامل شناسایی مجموعه هایی در مخزن ADS است که شامل مجموعه داده های CAD است. علاوه بر شناسایی ساده مجموعه، فایل های فردی، مکان آنها، انواع فایل (DXF یا DWG) و نسخه ها نیز ثبت شد. فایلهای CAD هم با پسوند فایل و هم با امضای دیجیتال ایجاد شده توسط ابزار شناسایی شیهای ثبت دیجیتالی DROID در آرشیو ملی شناسایی شدند. این امضا در ADS CMS در نقاطی در طول فرآیند دسترسی و بایگانی داده ها ذخیره می شود و اجازه می دهد تا تمام نسخه های فایل ذخیره شده شناسایی شوند.
مرحله 2: حذف و ذخیره سازی نسخه های اصلی نگهداری و انتشار فایل ها. یکی از عناصر کلیدی استراتژی مهاجرت این بود که در حالی که مجموعه داده های CAD بایگانی شده تا حد زیادی به روز می شدند، هیچ داده ای نباید از بایگانی حذف یا حذف شود. در عمل، این بدان معناست که هر گونه نگهداری یا انتشار نسخههای دادهای که قرار بود جایگزین شوند، قبل از فرآیند مهاجرت، در یک مکان جدید «مهاجرتشده» در مجموعه کپی میشد ( شکل 6 را ببینید).برای مثالی از ساختار فایل AIP مجموعه). از آنجایی که اکثر انتقال دادهها بر روی مجموعه دادههای حفاظتی موجود انجام میشود، هدف این فرآیند حفظ این دادهها به عنوان مجموعه دادههای میانی بین دادههای SIP اصلی و دادههای AIP جدید منتقل شده است. اگرچه، همانطور که در زیر توضیح داده شد، این همیشه در فرآیند مهاجرت ADS CAD صدق نمی کرد، این مجموعه داده ها برای ارائه یک “تاریخچه” برای چگونگی حفظ و انتشار عناصر CAD هر مجموعه نگهداری می شدند.
مرحله 3: انتقال نسخههای آرشیوی دادهها به فرمت جدید نگهداری (DXF یا DWG به DWG 2010). این مرحله عنصر اصلی فرآیند مهاجرت برای مجموعه دادههای حفاظتی را تشکیل میدهد و شامل ایجاد و تأیید فایلهای CAD در قالب جدید حفاظت DWG میشود. شناسایی قبلی فایلها، همراه با ساختار بایگانی نوع فایلی که مجموعههای ADS بر اساس آن هستند، به این کار اجازه میدهد هر مجموعه خودکار یا تا حدی خودکار شود.
مرحله 4: انتقال داده ها به فرمت های انتشار جدید (DWG یا DXF به DWG و DXF 2010). همانند مرحله 3، مرحله 4 عنصر اصلی کار مهاجرت انجام شده را تشکیل می دهد، اما فراتر از به روز رسانی فایل های موجود بوده و شامل ایجاد نسخه های انتشار چندگانه می شود.
مرحله 5: ایجاد فایل های PDF/A از طرح بندی های CAD برای انتشار. علاوه بر ایجاد فایلهای انتشار جدید در فرمتهای CAD DWG و DXF، فایلهای با فرمت PDF/A در دسترستر و اضافی نیز برای آن دسته از کاربران بدون دسترسی به نرمافزار CAD ایجاد شد.
مرحله 6: ایجاد تصاویر پیش نمایش شطرنجی و ریز عکسها برای انتشار. همانند مرحله 5، پیشنمایش شطرنجی و تصاویر بندانگشتی اضافی از فایلهای CAD ایجاد شد تا دسترسی به دادهها را افزایش دهد.
مرحله 7: به روز رسانی ابرداده مربوطه. جدای از مرحله 8 (ارائه دسترسی)، مرحله نهایی کلیدی انتقال داده، مستندسازی خود فرآیند بود. این شامل به روز رسانی بخش های مختلف ADS CMS برای شامل جزئیات فرآیندهای انجام شده روی داده ها، مکان فایل های قدیمی و جدید، به روز رسانی مقادیر ثابت و مستندسازی روابط جدید بین فایل ها بود.
مرحله 8: به روز رسانی رابط های وب برای گنجاندن فایل ها و پیش نمایش های جدید. در نتیجه ارائه فرمت های انتشار به روز و اضافی، مرحله نهایی فرآیند انتقال داده شامل به روز رسانی صفحه وب مجموعه ADS مربوطه برای اجازه دسترسی به این فایل های جدید بود (شکل 7 و شکل 8 را ببینید ).
6. مسائل و مشکلات مهاجرت CAD
در حالی که هشت مرحله بالا یک نمای کلی از مهاجرت CAD انجام شده در ADS ارائه می دهد، این فرآیند به طور کلی بدون مشکل نبود. یک مشکل عمده از تصمیم به جایگزینی فرمت حفاظتی DXF R14 موجود با DWG 2010 ناشی شد، که اساساً فرآیند حفاظت اولیه را که بر روی بخش قابل توجهی از دادههای سپرده شده ما انجام شده بود، معکوس کرد. از آنجایی که بخش بزرگی از آرشیو ADS در ابتدا به عنوان DWG سپرده شده بود (1254 فایل، حدودا.78٪ قبل از حفظ به عنوان DXF R14، ترجیح داده می شد که به فایل های SIP اصلی به عنوان منبع مهاجرت به جای استفاده از DXF های عادی ذخیره شده در AIP همگن، بازگردید. نتیجه این کار این بود که مراحل 3 و 4 فرآیند مهاجرت، به جای اینکه صرفاً از یک قالب ورودی معمولی کار کنند ( به عنوان مثال، DXF 14)، مجبور بود با تبدیل مخلوطی از فرمت های CAD از SIP های اصلی، در مکان هایی که فرآیند دریافت و عادی سازی اصلی را تکرار می کند، کنار بیاید. در تعدادی از موارد، با این واقعیت که SIP اصلی و غیر عادی گاهی اوقات چندین نسخه از یک فایل را در قالبهای DXF و DWG شامل میشد، پیچیدهتر میشد و بنابراین نیاز به عنصر اولویتبندی و انتخاب (DWG بیش از DXF) داشت. به مهاجرت این باعث کاهش سطح اتوماسیونی شد که میتوان در این فرآیند تعبیه کرد و زمان صرف شده برای تکمیل مهاجرت را افزایش داد. با این حال، این موضوع درس ارزشمندی را ارائه می دهد، زیرا فعالیت مهاجرت ایده آل که در مدل OAIS نشان داده شده است، همیشه قابل دستیابی یا مناسب نیست. و تصمیمات استراتژیک باید بر اساس مورد به مورد گرفته شود تا بهترین نتیجه ممکن برای حفظ طولانی مدت داده ها حاصل شود. توجه به اهمیت ثبت این تصمیمات در کنار مستندات فرآیندهای انجام شده (مرحله 7) برای پشتیبانی از درک آینده بایگانی حائز اهمیت است.
ایجاد فایلهای PDF/A برای انتشار نیز باعث ایجاد مشکل دیگری شد، زیرا همه فایلهای CAD با طرحبندی چاپ مناسب تولید نشدند. این بدان معناست که بسیاری از فرمتهای DWG به تبدیل دستی نیاز دارند – فرآیندی بسیار زمانبر، و همچنین منجر به انتشار برخی فایلهای PDF شد که کاملاً نماینده فایلهای CAD اصلی نبودند. قبل از انتقال، این مشکلی نداشت، زیرا فایلهای دریافت شده به فرمت CAD دیگری تبدیل میشدند و بنابراین نیازی به فرمت مناسب برای تبدیل PDF/A نداشتند. نقاط مثبت افزایش قابلیت انتشار از طریق استفاده از PDF/A تا حدودی با نیاز به بررسی دادههای CAD تازه دریافت شده برای طرحبندیهای سازگار با PDF/A کاهش یافته است.
7. نتیجه گیری
درس های آموخته شده در طول فرآیند مهاجرت CAD در مقیاس بزرگ که در این مقاله ارائه شده است، بینش مهمی را در مورد جزء حفظ دیجیتالی عملکرد مدیریت داده های تحقیقاتی ارائه می دهد.
در حالی که فرآیند کلی مهاجرت ارائه شده در این مقاله، یک مهاجرت دقیق طبق مدل OAIS نبود و در بسیاری از موارد اساساً شامل «آرشیو مجدد» دادهها بود، خود تمرین برای حفظ طولانیمدت دادهها ضروری بود و در به گونه ای که به بهترین نتیجه ممکن برای ADS و مصرف کنندگان داده دست یابد. در حالی که عناصر فرآیند هم پرزحمت و هم وقتگیر (و در نتیجه پرهزینه) بودند، در نتیجه نیاز به ارزیابی مجدد فایلهای اصلی در SIP، این امر مزایای عادیسازی دادهها در نقطه مصرف و تولید AIPهای همگن را به حالت پایدار نشان میدهد. استانداردها و قالبهای قابل اعتماد، که بر اهمیت مدیریت حرفهای دادههای پژوهشی و شیوههای نگهداری تاکید میکند. اهمیت مستندسازی فایلها در زمان جذب، و مدیریت داده ها و فرآیندهای انجام شده بر روی پرونده ها در حین بایگانی نیز به عنوان دارایی های ارزشمند برای فرآیند انتقال داده های بعدی مورد تاکید قرار گرفت. به ویژه ضبط مکان فایل، نوع فایل، و روابط بین فایلها در مجموعههای جداگانه، امکان ارزیابی و برنامهریزی کلی مهاجرت را از نظر دامنه و زمان مورد نیاز فراهم میکند. این اجازه می دهد تا مراحل کلیدی در فرآیند مهاجرت در کنار شناسایی عناصری که می توانند مشکل ساز یا ساده باشند، برنامه ریزی شوند. این امکان ارزیابی میزان خودکارسازی هر مرحله را فراهم کرد. و روابط بین فایلها در مجموعههای فردی امکان ارزیابی و برنامهریزی کلی کار مهاجرت را از نظر دامنه و زمان مورد نیاز میدهد. این اجازه می دهد تا مراحل کلیدی در فرآیند مهاجرت در کنار شناسایی عناصری که می توانند مشکل ساز یا ساده باشند، برنامه ریزی شوند. این امکان ارزیابی میزان خودکارسازی هر مرحله را فراهم کرد. و روابط بین فایلها در مجموعههای فردی امکان ارزیابی و برنامهریزی کلی کار مهاجرت را از نظر دامنه و زمان مورد نیاز میدهد. این اجازه می دهد تا مراحل کلیدی در فرآیند مهاجرت در کنار شناسایی عناصری که می توانند مشکل ساز یا ساده باشند، برنامه ریزی شوند. این امکان ارزیابی میزان خودکارسازی هر مرحله را فراهم کرد.
این انتقال دادههای CAD محصول یک تغییر ضروری و ارزشمند در خطمشی بوده است و یک مطالعه موردی در مورد چگونگی ادامه تبدیلها و انتقال دادههای بیشتر در صورت لزوم ارائه کرده است. افزایش اضافی در قالبهای انتشار که با مهاجرت امکانپذیر شده است، همچنین مزیت واضحی را در دسترسی بیشتر به مجموعه دادههای CAD برای عموم فراهم کرده است. فرمت های انتشار جدید در شکل 8 نشان داده شده استبه یک جمعیت جدید از کاربران داده، که معمولاً از فایلهای CAD استفاده نمیکنند یا کسانی که به نرمافزار مناسب دسترسی ندارند، اجازه دادهاند تا دادههای CAD را مشاهده و مجدداً استفاده کنند. فرمتهای جدید پیشنمایش JPG همچنین نیاز به ارزیابی مناسب بودن فایل موجود برای اهدافشان را کاهش دادهاند، زیرا دیگر نیازی به دانلود و باز کردن فایل CAD DFX در نرمافزار مناسب ندارند. آمار دسترسی کاربران وب سایت ADS تغییرات قابل توجهی را در رفتار کاربرانی که با این آرشیوها در تعامل هستند، به دنبال این تغییر مشاهده کرده است. کاربران اکنون زمان بیشتری را در مجموعه بایگانی CAD صرف مشاهده تصاویر پیش نمایش و سپس دانلود تعداد کمتری از فایل ها می کنند. با وجود افزودن عوارض اضافی، زمان و هزینه برای فرآیند مهاجرت CAD مزایای اضافه شده برای کاربران منجر به بهبود قابل توجهی در سرویس ADS شده است. این امر توجه را به پیامدهای قالب های داده های انتشار بر قابلیت استفاده مجدد از داده ها در طول برنامه ریزی مدیریت داده های پژوهشی جلب می کند. توجه به این نکته مهم است که این تمرین تاکید کرده است که در حالی که یک نوع داده و قالب خاص ممکن است برای الزامات نگهداری طولانی مدت بهترین باشد، انتشار داده ها در قالب هایی خارج از نوع داده اصلی می تواند به پتانسیل استفاده مجدد از داده ها اضافه کند. مسائل تجربه شده و نتایج حاصله ارائه شده در این مقاله به طور قابل توجهی بر مهاجرت و استراتژی های انتشار داده در آینده در ADS تأثیر می گذارد، و نویسندگان امیدوارند که این مطالعه موردی برای دیگرانی که مهاجرت داده را به عنوان بخشی از مدیریت داده های تحقیقاتی خودشان انجام می دهند، ارزشمند باشد.
مراجع و یادداشت ها
- اداره جوامع و حکومت محلی. چارچوب سیاست برنامه ریزی ملی. لندن، 2012. در دسترس آنلاین: https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/6077/2116950.pdf (دسترسی در 25 نوامبر 2015). [ Google Scholar ]
- موسسه مجاز باستان شناسان. استاندارد و راهنمای ایجاد، تدوین، انتقال و رسوب آرشیوهای باستان شناسی ؛ موسسه مجاز برای باستان شناسان: بیرمنگام، بریتانیا، 2014. [ Google Scholar ]
- ریچاردز، JD حفظ و استفاده مجدد از داده های دیجیتال: نقش سرویس داده های باستان شناسی. Antiquity 1997 , 71 , 1057-1059. [ Google Scholar ] [ CrossRef ]
- واترز، دی. Garrett, J. Reserving Digital Information, Report of Task Force on Archive of Digital Information ; کمیسیون حفظ و دسترسی: واشنگتن، دی سی ایالات متحده آمریکا، 1996. [ Google Scholar ]
- هاردمن، سی. ریچاردز، جی دی کیوریشن دیجیتال در سرویس داده باستان شناسی. Archäol. Informationssyst. 2013 ، 42 ، 76-78. [ Google Scholar ]
- ائتلاف حفظ دیجیتال صرفه جویی در دهه دیجیتال: DPC به سازمان هایی که به محافظت از حافظه دیجیتال ما کمک می کنند پاداش می دهد. در دسترس آنلاین: http://www.dpconline.org/newsroom/latest-news/945-saving-the-digital-decade-dpc-recognizes-major-accomplishments-to-safeguard-our-digital-memory (در 25 مورد دسترسی قرار گرفته است. نوامبر 2015).
- مهر تایید داده ها اجرای مهر تایید داده ها. 2013. در دسترس آنلاین: https://assessment.datasealofapproval.org/assessment_96/seal/html/ (دسترسی در 25 نوامبر 2015).
- سرویس داده های باستان شناسی خط مشی مجموعه ها در دسترس آنلاین: http://archaeologydataservice.ac.uk/advice/collectionsPolicy (در 25 نوامبر 2015 قابل دسترسی است).
- سرویس داده های باستان شناسی دستورالعمل برای سپرده گذاران ؛ سرویس داده های باستان شناسی: یورک، بریتانیا، 2014. [ Google Scholar ]
- سرویس داده های باستان شناسی راهنمای عمل خوب در دسترس آنلاین: http://guides.archaeologydataservice.ac.uk/ (در 25 نوامبر 2015 قابل دسترسی است).
- باز کردن مدل مرجع سیستم اطلاعات بایگانی. در دسترس آنلاین: http://public.ccsds.org/publications/archive/650x0m2.pdf (دسترسی در 25 نوامبر 2015).
- سیاست حفظ. در دسترس آنلاین: http://archaeologydataservice.ac.uk/attach/preservation/PreservationPolicyV1.3.1.pdf (دسترسی در 25 نوامبر 2015).
- عملیات مخزن در دسترس آنلاین: http://archaeologydataservice.ac.uk/attach/preservation/ADS_Repository_Operations_V2.pdf (در 25 نوامبر 2015 قابل دسترسی است).
- کاندرون، اف. ریچاردز، جی. رابینسون، دی. Wise, A. Strategies for Digital Data. در دسترس آنلاین: http://archaeologydataservice.ac.uk/legacy/strategies/ (در 25 نوامبر 2015 قابل دسترسی است).
- سرویس داده های باستان شناسی CAD و تصاویر برداری. در دسترس آنلاین: http://archaeologydataservice.ac.uk/advice/FilelevelMetadata#section-FilelevelMetadata-CADAndVectorImages (در 25 نوامبر 2015 قابل دسترسی است).
- باستان شناسی در ابی گلستونبری به صورت آنلاین. در دسترس به صورت آنلاین: http://dx.doi.org/10.5284/1000292 (در 29 فوریه 2016 قابل دسترسی است).
- هریسون، Eiteljorg، II. پروژه CSA Propylaea. در دسترس به صورت آنلاین: http://dx.doi.org/10.5284/1022574 (در 29 فوریه 2016 قابل دسترسی است).
- اندرسون، اس. پرینگل، ام. ادی، م. آستین، تی. ویلسون، ا. Polfreman, M. Arts and Humanities Data Service Service Archiving Images Digital. در دسترس آنلاین: http://www.ahds.ac.uk/about/projects/archiving-studies/digital-images-archiving-study.pdf (دسترسی در 25 نوامبر 2015).
- کوین، ام. دوسه، دی. هاپگود، بی. مالن، جی. استاپلتون، ام. ویژگیهای مهم تصاویر برداری. JISC. 2007. موجود به صورت آنلاین: http://www.jisc.ac.uk/media/documents/programmes/preservation/vector_images.pdf (دسترسی در 25 نوامبر 2015).

شکل 1. موجودیت های اصلی مدل مرجع سیستم اطلاعات بایگانی باز (OAIS). © کمیته مشورتی برای سیستم های داده فضایی.

شکل 2. گردش کار عملیاتی سرویس داده های باستان شناسی (ADS).

شکل 3. نمایش یک فایل طراحی به کمک کامپیوتر (CAD) دو بعدی که در آرشیو ADS نگهداری میشود و ارتفاع جنوبی دیوار جنوبی راهرو گروه کر در کلیسای گلستونبری [16] © Trustees of Glastonbury Abbey را نشان میدهد.

شکل 4. نمایش یک فایل CAD سه بعدی از Propylaea [ 17 ] که در آرشیو ADS نگهداری می شود. © Harrison Eiteljorg II.

شکل 5. نمودار گردش کار فرآیند مهاجرت CAD ADS. آبی گام های برداشته شده برای اطمینان از حفظ طولانی مدت را برجسته می کند، سبز گام های برداشته شده برای افزایش انتشار داده ها را برجسته می کند.

شکل 6. نمونه ای از موارد اضافه شده به ساختار فایل بسته اطلاعات بایگانی (AIP) پس از مهاجرت. سبز نشان دهنده فایل های جدید، بنفش نشان دهنده فایل های مهاجرت شده، آبی نشان دهنده فایل های منتقل شده است.

شکل 7. نمونه ای از یک صفحه وب دانلود بایگانی ADS قبل از ایجاد فرمت های جدید. کادرهای قرمز رنگ فایل های انتشار قدیمی با فرمت تبادل نقشه (DXF) را برجسته می کند.

شکل 8. نمونه ای از یک صفحه وب دانلود بایگانی ADS پس از مهاجرت. کادر قرمز، تصاویر پیشنمایش محبوب جدید و قالبهای انتشار جدید در دسترس کاربر را برجسته میکند.

جدول 1. این جدول فرمت های نگهداری و انتشار برای انواع داده های ارسال شده در قالب های انتخابی را نشان می دهد. NB _ این فهرست کاملی از همه فرمتهای فایل پذیرفته شده ADS نیست و ممکن است تفاوتهایی در قالبهای بایگانی و انتشار رخ دهد.

جدول 2. تعداد فایل های CAD در آرشیو ADS بر اساس فرمت فایل قبل از مهاجرت. (اعداد در این جدول به دلیل فایل های تکراری ( به عنوان مثال ، در هر دو فرمت) در فهرست اصلی و انتشار جمع نمی شوند . سایر فایل های برداری غیر CAD نیز به صورت DXF حفظ می شوند و ممکن است در قالب های دیگر منتشر شوند.)
© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons by Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر