به سوی کاهش شکاف سرپرستی - ملاحظات نظری و درس های آموخته شده از دهه ها تمرین

خلاصه

تحقیقات به‌عنوان یک شرکت دیجیتال چالش‌های جدیدی را ایجاد کرده است که اغلب به آنها پرداخته نشده است تا از تداوم، شفافیت و مسئولیت‌پذیری اطمینان حاصل شود. یک سوء تفاهم رایج وجود دارد که می‌توان در مرحله بعد از چرخه تحقیقاتی را در نظر گرفت یا به او تفویض کرد یا اینکه به دلیل کمبود ابزار کارآمد، بسیار سنگین یا بسیار گران است. این باعث ایجاد شکافی بین عمل تحقیق و نیازهای مراقبتی می شود. ما استدلال می‌کنیم که اگر متصدیان حمایت جذابی را که مناسب نیازهای پژوهشی است ارائه دهند و اگر محققان به طور مداوم کار خود را بر اساس مفاهیم عمومی به طور مداوم از ابتدا مدیریت کنند، می‌توان این شکاف را کاهش داد. یک مطالعه موردی نسبتاً منحصر به فرد درازمدت نشان می‌دهد که چگونه چنین مفاهیمی به اجرای عملی یک عمل تحقیقاتی به طور عمدی با استفاده از ابزارهای حداقلی برای بایگانی پایدار و مستقل از سال 1989 کمک کرده‌اند. این مقاله مفاهیم زیربنایی سه فعالیت تحقیقاتی اصلی را ترسیم می‌کند. (i) مدیریت داده های تحقیق، (2) مدیریت مرجع به عنوان بخشی از انتشارات علمی، و (iii) پیشبرد نظریه ها از طریق مدل سازی و شبیه سازی. این مفاهیم نشان دهنده بهترین روش تحقیق قابل انتقال جهانی است، در حالی که جزئیات فنی آشکارا مستعد تغییر مداوم هستند. ما امیدواریم که محققان را تحریک کند تا تحقیقات را به طور مشابه مدیریت کنند و متصدیان به درک بهتری از چالش‌های سرپرستی که عمل تحقیقاتی با آن مواجه است، دست یابند. این مقاله مفاهیم زیربنای سه فعالیت اصلی تحقیقاتی را ترسیم می کند. (i) مدیریت داده های تحقیق، (2) مدیریت مرجع به عنوان بخشی از انتشارات علمی، و (iii) پیشبرد نظریه ها از طریق مدل سازی و شبیه سازی. این مفاهیم نشان دهنده بهترین روش تحقیق قابل انتقال جهانی است، در حالی که جزئیات فنی آشکارا مستعد تغییر مداوم هستند. ما امیدواریم که محققان را تحریک کند تا تحقیقات را به طور مشابه مدیریت کنند و متصدیان به درک بهتری از چالش‌های سرپرستی که عمل تحقیقاتی با آن مواجه است، دست یابند. این مقاله مفاهیم زیربنای سه فعالیت اصلی تحقیقاتی را ترسیم می کند. (i) مدیریت داده های تحقیق، (2) مدیریت مرجع به عنوان بخشی از انتشارات علمی، و (iii) پیشبرد نظریه ها از طریق مدل سازی و شبیه سازی. این مفاهیم نشان دهنده بهترین روش تحقیق قابل انتقال جهانی است، در حالی که جزئیات فنی آشکارا مستعد تغییر مداوم هستند. ما امیدواریم که محققان را تحریک کند تا تحقیقات را به طور مشابه مدیریت کنند و متصدیان به درک بهتری از چالش‌های سرپرستی که عمل تحقیقاتی با آن مواجه است، دست یابند. در حالی که جزئیات فنی آشکارا مستعد تغییر مداوم هستند. ما امیدواریم که محققان را تحریک کند تا تحقیقات را به طور مشابه مدیریت کنند و متصدیان به درک بهتری از چالش‌های سرپرستی که عمل تحقیقاتی با آن مواجه است، دست یابند. در حالی که جزئیات فنی آشکارا مستعد تغییر مداوم هستند. ما امیدواریم که محققان را تحریک کند تا تحقیقات را به طور مشابه مدیریت کنند و متصدیان به درک بهتری از چالش‌های سرپرستی که عمل تحقیقاتی با آن مواجه است، دست یابند.

کلید واژه ها:

شکاف سرپرستی ; مدیریت داده های تحقیق ; مدیریت داده های دیجیتال ; حفظ داده ها ؛ مدیریت چرخه عمر داده ; تئوری مدیریت چرخه حیات ; آرشیو کردن بهترین تمرین

1. معرفی

جوامع امروزی انتظار دارند که علم به صورت تجمعی کار کند، به عنوان مثال، [ 1 ، 2 ، 3 ، 4 ]. در حالی که تحقیقات بیشتر و بیشتری با استفاده از ابزارهای دیجیتال انجام می شود و برخی از فعالیت های اصلی آن در حال حاضر به طور کامل دیجیتالی شده است، خطر افزایش اختلاف بین انتظارات جامعه و آنچه محققان و مؤسسات سرپرستی واقعاً انجام می دهند وجود دارد.

ما مدیریت را به عنوان مدیریت هر نوع داده در طول چرخه عمر آن درک می کنیم تا از حفظ ارزش آن در طول زمان و در دسترس بودن آن برای استفاده مجدد اطمینان حاصل کنیم. این دیدگاه چرخه عمر داده به مدیریت چرخه حیات داده ها و سایر رکوردهای اطلاعاتی که توسط آرشیوها استفاده می شود، برمی گردد [ 5 ، 6 ]. این مقاله استدلال می کند که نظارت بر خروجی علمی به طور سنتی سنگ بنای پیشرفت در علم بوده است.

برای هدف این مقاله، مدیریت داده‌های پژوهشی شامل تمام فعالیت‌هایی است که توسط یک فرد یا گروهی از محققان برای سازمان‌دهی، توصیف، ساختار و ذخیره داده‌هایی که تولید، جمع‌آوری یا استفاده می‌کنند انجام می‌شود. این شامل برخورد با داده هایی است که به طور منظم مورد استفاده قرار می گیرند، به عنوان مثال، در طول عمر یک پروژه تحقیقاتی و تا انتشار نتایج و حفظ آنها برای استفاده مجدد در آینده فراتر از محدوده پروژه اصلی گسترش می یابد. در نتیجه، ما مدیریت ادبیات تحقیق شامل تمام متا داده های مرتبط را به عنوان بخشی جدایی ناپذیر از مدیریت داده های تحقیق در نظر می گیریم، اگرچه این دسته اطلاعات اغلب به عنوان خود داده های تحقیق درک نمی شود. به طور مشابه، در مدیریت داده های پژوهشی، ما تحقیقات تئوری گرا را شامل می شود که اغلب از مدل های پیچیده و شبیه سازی استفاده می کند.

یک محرک مهم برای این مقاله، بازنشستگی قریب الوقوع رئیس گروه بوم شناسی سیستم های زمینی در ETH زوریخ بود. تحقیقات آن گروه، تا حدی، بر روی داده‌های صحرایی طولانی مدت و منحصربه‌فرد حاصل از یک پروژه تحقیقاتی بزرگ در مورد پویایی جمعیت پروانه جوانه کاج اروپایی حلقوی در کوه‌های آلپ اروپایی بوده است، به عنوان مثال، [7 ] . نمونه‌های صحرایی غیرزیستی و زیستی با ماهیت ناهمگن قابل‌توجهی از سال 1949 با استفاده از فناوری‌های پیشرفته مدرن جمع‌آوری شده‌اند [ 8]]. این فناوری‌ها شامل استفاده از امکانات محاسباتی متمرکز و کارت‌های پانچ برای ذخیره و وارد کردن داده‌ها برای هر تحلیلی است که بسیار متفاوت از فناوری‌های امروزی است. تجربه به وضوح نشان می دهد که چگونه تغییرات چالش برانگیز در فناوری برای تحقیقات طولانی مدت کلیدی برای درک واقعی بسیاری از پدیده های محیطی، به ویژه در مقیاس بزرگ است، به عنوان مثال، [ 9 ]. هنگامی که مرکز محاسبات رها شد ، یک پایگاه داده پیچیده [ 10 ] شامل داده های واقعی به طور کامل از بین رفت. فقط داده های خام را می توان نجات داد. در نتیجه رویکردهای جدید و قوی تری جستجو شد و این تجربه به شکل قابل توجهی در شکل گیری تکنیک بایگانی شرح داده شده در بخش 2 کمک کرد .

به عنوان مؤسسات متولی، تیم مدیریت دیجیتال کتابخانه ETH و آرشیو دانشگاه ETH زوریخ اخیراً در مورد انتقال پیشنهادی آرشیو فوق به دامنه عمومی همانطور که در شکل 1 نشان داده شده است، بحث کردند . هنگام بازنشستگی اساتید، آرشیو دانشگاه اغلب با الزامات جمع آوری داده ها مواجه می شود. روشی که گروه بوم‌شناسی سیستم‌های زمینی آرشیو خود را سازماندهی کرده و در طول سال‌ها از آن مراقبت می‌کرد، بسیار خوب فکر شده بود. همانطور که در زیر توضیح داده شد، اصولی را که می توان در مدل مرجع OAIS (جوانتر) نیز یافت، به عنوان مثال، [ 11 ] گنجاند و بنابراین منبع امیدوارکننده ای برای انتقال داده ها به آرشیو داده های ETH در آینده و انتشار آنها ارائه کرد.

تفاوت اصلی رویکرد گروه بوم‌شناسی سیستم‌های زمینی در مقایسه با رویکردهای گروه‌های دیگر، استفاده از هیچ سیستم فنی پیچیده‌ای نیست – هیچ‌کدام وجود ندارد – بلکه این واقعیت است که این گروه در مسئولیت خود به عنوان محقق، آنچه را که برای دستیابی به آن نیاز داشتند، در نظر گرفته است. اصول و قواعدی که باید به این شیوه ها پایبند بوده و آنها را اجرا کنند. اینکه چگونه دقیقاً بایگانی انجام شد و چه تصمیماتی گرفته شد، همه الزامات نظری را برآورده نمی کند و ممکن است به راحتی برای گروه های دیگر مناسب نباشد. با این حال، ما این مورد را به دلایل زیر به عنوان مطالعه موردی انتخاب کردیم: (1) بایگانی به طور قابل توجهی عمر طولانی دارد، در سال 1989 شروع به کار کرد. (ii) ما می خواستیم بدانیم که چگونه آرشیو از بسیاری از تغییرات تکنولوژیک جان سالم به در برد. (iii) ما می‌خواستیم ارزش انجام ساده کاری را که زمانی که راه‌حل‌های بهتری در دسترس نیست یا نمی‌توان از عهده آنها برآمد، ممکن است را بررسی کنیم. (IV) ما همچنین به یک رویکرد مینیمالیستی علاقه مند بودیم، که شایستگی ابتکارات بزرگ گردآوری داده ها یا سودمندی راه حل های جامع سرپرستی یا دیگر آرشیوهای داده پیچیده تر را به چالش می کشد. (v) در نهایت می‌خواهیم نقشی را که محققان بازی می‌کنند و اینکه چگونه می‌توانند یا باید در غلبه بر چالش‌های ناشی از تغییرات تکنولوژیکی که درمان را به طور کلی در معرض خطر قرار می‌دهند، کمک کنند را بررسی کنیم.

هر چه فعالیت‌های علمی دیجیتالی‌تر شوند، به‌طور کلی، مدیریت بیشتر از شکنندگی داده‌های دیجیتالی و به‌طور خاص از فرسایش نرم‌افزار رنج می‌برد، به عنوان مثال، [ 12 ، 13 ، 14 ، 15 ]. به نظر می‌رسد که اختلاف ممکن است آنقدر زیاد شود که اصلاً امکان رسیدگی وجود ندارد [ 11 ، 13 ، 16 ، 17 ، 18 ، 19 ]، برای مثال به این دلیل که بسیار پرهزینه است. ما این اختلاف بین عملکرد واقعی تحقیق و نیازهای حفظ محتوای تحقیق را “شکاف مراقبت” می نامیم، همچنین ببینید [ 20]]. ما استدلال می‌کنیم که این شکاف مراقبتی کاملاً حیاتی است، زیرا نتایج تحقیقات را در معرض خطر زودگذر شدن قرار می‌دهد، که مطالعه موردی ما آن را برجسته می‌کند. در دسترس بودن (تداوم) نتایج تحقیقات، با این حال، یک پیش نیاز شناخته شده برای پیشرفت علمی، به اشتراک گذاری داده ها در داخل و بین پروژه ها و به طور کلی علم باز است، به عنوان مثال، [15 ، 21 ] .

شکاف کیوریشن چندین دیدگاه دارد: دیدگاه اول، خود کیوریشن است. نیاز به مدیریت دیجیتال به خوبی پذیرفته شده است [ 22 ] و بسیاری از موسسات مانند دانشگاه ها، آژانس های تامین مالی، و موسسات اختصاصی از بخش خصوصی یا در سطح دولتی تلاش های قابل توجهی را برای آن انجام می دهند، به عنوان مثال، [ 16 ، 23 ، 24 ، 25 ] , 26 , 27 , 28 , 29 , 30 , 31 ]. ابتکارات و مراکز شایستگی مانند مرکز مدیریت دیجیتال ( www.dcc.ac.uk )، DataONE ( www.dataone.org، PANGEA ( 36.www.pangaea.de )، ANDS (سرویس داده ملی استرالیا، ands.org.au ) و تعدادی دیگر با موفقیت برای ایجاد خدمات و بهترین شیوه ها کار کرده اند. با این حال، در بسیاری از مناطق و حوزه‌های موضوعی، این تلاش‌ها اغلب تنها به اقلیتی از محققان می‌رسند. علاوه بر این، خود درمان در حال حاضر با ابهامات زیادی مواجه است، نه کمترین به دلیل هزینه های ناشناخته [ 16 ، 17 ، 23 ، 32 ، 33 ، 34 ]، به علاوه چندین مانع و مشکلات دیگر [ 6 ، 18 ، 20 ، 22 ، 35 ،]. همچنین یک تعامل مشکل ساز با Open Data وجود دارد. در رشته‌هایی با سنت کمی مبادله داده، به سختی انگیزه‌ای برای مدیریت داده‌های خود به گونه‌ای وجود دارد که اشتراک‌گذاری را تسهیل کند، مثلاً [21، 34 ، 37 ] ، چه رسد به اشتراک گذاری فوری. هنگامی که به درستی مدیریت می شود، ممکن است تلاش بیشتری برای اشتراک گذاری داده ها انجام شود یا حتی ممکن است غیرممکن شود.

این منجر به دیدگاه دوم، عمل تحقیق واقعی می شود. چگونه داده‌ها و گردش‌های کاری مدیریت می‌شوند، به‌ویژه در رابطه با دیجیتالی‌سازی، از جمله هر جریان کاری که شامل داده‌های دیجیتالی است؟

برخی از محققان و سایر ذینفعان استدلال کرده اند که فقدان ابزارها و زیرساخت های موجود مانع از گزینش داده های دیجیتال می شود [ 26 ]. بسیاری استدلال می کنند که وضعیت بهتر است با آموزش بیشتر و بهتر متخصصان و محققان، تسهیل درک متقابل [ 38 ، 39 ، 40 ، 41 ] بهبود یابد و تعداد کمی نیز خواستار آموزش هدفمند پژوهشگران فردی با توجه به گزینش داده های دیجیتال هستند، به عنوان مثال. ، [ 37 ، 42 ]. برخی از محققان درخواست حمایت بهتری از جمله حمایت از موسسات داخلی خود و همچنین از زیرساخت های ملی یا بین المللی دارند. 19]]. دیگران برای ارائه چنین حمایتی تلاش کرده‌اند و در حال حاضر جامعه فعالی از کتابداران، بایگانی‌ها و کارشناسان اطلاعاتی مشابه، مشغول تهیه وسایل لازم هستند، به عنوان مثال، [ 16 , 23 , 24 , 25 , 26 , 27 , 28 , 29 , 30 , 31]. اما آیا این برای کاهش شکاف به ظاهر در حال گسترش کافی است؟ با تعداد فزاینده ای از ابتکارات و موسسات درگیر در مدیریت داده های تحقیقاتی، می توان انتظار داشت که این شکاف بسته شود. تجربه ما، از جمله از مطالعه موردی ما، این انتظار را به سوال تبدیل می کند. سرعت توسعه در خود تحقیق در حال حاضر به قدری سریع است که به نظر می رسد اطمینان حاصل نشده باشد.

محققان خود با چالش‌هایی مواجه هستند، انگیزه‌های خاصی دارند و در یک محیط خاص کار می‌کنند. همه این عوامل باید به خوبی درک شوند تا به مسائل مربوط به پردازش داده های دیجیتال به طور مناسب پرداخته شود، به عنوان مثال، [ 21 ، 43]]. علاوه بر این، توجه به این نکته مهم است که چالش‌ها به طور قابل ملاحظه‌ای در بین انواع خروجی‌های پژوهشی متفاوت است، به عنوان مثال خروجی ممکن است به شکل داده‌های خام یا پردازش شده، یا مدل‌ها در مقابل خروجی‌های تعریف‌شده و به‌طور گسترده‌ای با حمایت نهادی مانند انتشارات علمی باشد. مقالات مجلات علمی به روش استاندارد شده با هدف تبدیل شدن به بخشی از رکورد رسمی منتشر شده علم ایجاد می شوند. انتظار می رود آثار منتشر شده در دراز مدت در دسترس باقی بمانند و این در مورد نشریات الکترونیکی نیز صادق است. با این حال، نشریات الکترونیکی با چالش‌های اضافی خاصی از نظر کسب، استفاده، به عنوان مثال، [ 35 ، 44 ، 45 ]، و حفظ، به عنوان مثال، [ 46] مواجه هستند.]. با این وجود، ما معتقدیم که مؤسسات حافظه مانند کتابخانه‌ها در موقعیت معقولی هستند که می‌توانند نظارت بر محتوای خوب تعریف شده مانند نشریات علمی را بدون در نظر گرفتن شکل آنها تضمین کنند، حتی اگر آن را تنها پس از پایان تولید آن به دست آورند.

با این حال، این مورد برای داده های تحقیق و دانش تحقیق، از جمله مدل های بزرگ و پیچیده، که معمولاً به طور رسمی منتشر نمی شوند، صادق نیست. امروزه آنها در بهترین حالت به شکل مواد تکمیلی در دسترس هستند، اما حتی در آن زمان نیز معمولاً از نظر نگهداری آنها مراقبت کمی صورت می گیرد. بسیاری از ناشران هر گونه مسئولیتی را در قبال خوانایی و قابل استفاده بودن مطالب تکمیلی فاش می کنند در حالی که نویسندگان معتقدند آن را ایمن می کنند، تنها به این دلیل که در وب سایت ناشر ذخیره شده است.

برای اشیاء دیجیتالی کمتر رسمی مانند، که اکثریت داده‌های تحقیقاتی امروزی را تشکیل می‌دهند، ما استدلال می‌کنیم که بین پیشنهادات ارائه‌شده توسط کارشناسان سرپرستی و آنچه که اکثر محققان در حال حاضر انجام می‌دهند، اختلاف نظر مهمی وجود دارد . ، که حتی ممکن است در حال گسترش باشد. دلایل زیر احتمالاً به این روند تاسف بار کمک می کنند:

مسئله این نیست که آموزش‌ها و ابزارهای موجود از مدیریت داده‌های پژوهش پشتیبانی نمی‌کنند، به عنوان مثال، [ 47 ]، بلکه مسئله این نیست که تا زمانی که آنها راه خود را به محققان پیدا کنند، ممکن است قبلاً به سمت روش‌های پیچیده‌تر رفته باشند که به ابزارهای دیگری نیاز دارند. بنابراین ممکن است به جای تلاش برای همگام شدن با سرعت تغییرات تکنولوژیک، تمرکز بر مفاهیم بسیار اساسی مستقل از ابزارهای خاص ضروری باشد.
متصدیان اغلب درک دقیقی از عملکرد واقعی پژوهش ندارند و در نتیجه خطر نادیده گرفتن جامعه پژوهشی در فعالیت روزانه خود را دارند و بالعکس، برای جلوگیری از موانعی که پس از پایان پروژه‌های تحقیقاتی دیگر نمی‌توان بر آن‌ها فائق آمد، به درک متقابل خوبی نیاز است. ، [ 21 ، 42 ، 43 ].
شیوه‌های پژوهشی به شدت به روش‌ها، سنت‌ها و استانداردهای یک جامعه پژوهشی خاص بستگی دارد، و تأثیر «خارجی‌ها» مانند متصدیان را محدود می‌کند.
محققان با یک محیط رقابتی روبرو هستند و اغلب انگیزه های کمی برای مدیریت داده های تحقیقاتی و سایر فعالیت های تحقیقاتی خود، از جمله همکاری بین محققان، به گونه ای که از درمان حمایت می کند، دارند.
مجموع هزینه‌ها (زمان، منابع) مدیریت ممکن است مانع از گزینش داده‌های دیجیتال شود و حتی به‌شدت زیاد شود.

پاسخ‌های احتمالی سازمانی به این روندها شامل شروع تلاش‌ها برای به حداقل رساندن هزینه کل گردآوری داده‌های دیجیتال از نظر زمان و منابع صرف شده توسط همه درگیر و اصلاح محیط‌های تحقیقاتی به سمت افزایش کیفیت داده‌ها و نتایج پژوهش از نظر «قابلیت درمان‌پذیری» آنها است. “. با این حال، چنین اصلاحاتی به آهستگی پیشرفت می‌کنند، به‌ویژه در مقایسه با نرخ‌های فعلی که دیجیتالی‌سازی در حال پیشرفت است.

ما استدلال می کنیم که درک بهتر از مسائل توسط جوامع درگیر می تواند فورا کمک کند. در این مقاله راه حل های عملی آماده ارائه می کنیم. با این حال، آنها مستلزم این هستند که به جای نادیده گرفتن نیازهای مراقبتی به خوبی رسیدگی شود. در اینجا ما از مطالعه موردی خود تجربه‌ای را به دست می‌آوریم که بیش از سه دهه تلاش مدیریت داده‌های تحقیقاتی را شامل می‌شود، از جمله یک مفهوم ساده بایگانی، همانطور که توسط گروه تحقیقاتی بوم‌شناسی سیستم‌های زمینی در ETH زوریخ توسعه و دنبال شد.

در این مقاله، ابتدا آرشیو و سپس مفاهیم اساسی را که توسط آن واحد پژوهشی توسعه و به کار گرفته شده است، با تمرکز بر آن بخش‌هایی از پژوهش که در هر نوع تحقیق رایج است، از علوم طبیعی گرفته تا علوم اجتماعی و علوم انسانی، تشریح می‌کنیم. ما فعالیت‌های تحقیقاتی زیر را مورد بحث قرار می‌دهیم که هر کدام در بخش خاص خود مورد بررسی قرار می‌گیرند: (1) مدیریت داده‌های تحقیق، (2) انتشار، از جمله مدیریت مرجع، (iii) مدیریت تئوری‌ها، به ویژه همانطور که در مدل‌ها محصور شده‌اند. پس از یک تعریف محدود از داده های تحقیق، ممکن است تعجب آور باشد که همزمان در مورد ادبیات و مدیریت مرجع بحث شود. با این حال، ادبیات و مدیریت مرجع باید به عنوان بخشی جدایی ناپذیر از فرآیند تحقیق در نظر گرفته شود که کیفیت تحقیق را بهبود می بخشد. چالش اینجا کمتر بلند مدت است، بلکه مدیریت کارآمد اعضای یک گروه و پروژه های موازی یا متوالی آنهاست. مفاهیم به شیوه ای گویا و در عین حال با جزئیات کافی ارائه شده اند، به عنوان مثال، با توضیح چگونگی استفاده از ابزارهای معمول در دسترس برای آسان کردن مفاهیم – تا حدی کاملاً پیچیده – برای درک آسان تر. برخی از جزئیات فنی که ممکن است برای برخی از خوانندگان جالب باشد در ضمیمه ها (یکی برای هر فعالیت تحقیقی مورد بحث) آمده است. سپس در مورد برخی از درس‌های آموخته‌شده از تجربیات توصیف‌شده و معنای آن در وضعیت فعلی شکاف در حال گسترش بحث می‌کنیم. ما امیدواریم که این امر باعث پیشرفت در همه جوامع درگیر، از جمله محققان، متصدیان و سازندگان ابزار شود. مفاهیم به شیوه ای گویا و در عین حال با جزئیات کافی ارائه شده اند، به عنوان مثال، با توضیح چگونگی استفاده از ابزارهای رایج در دسترس برای آسان کردن مفاهیم – تا حدی کاملاً پیچیده – برای درک آسان تر. برخی از جزئیات فنی که ممکن است برای برخی از خوانندگان جالب باشد در ضمیمه ها (یکی برای هر فعالیت تحقیقی مورد بحث) آمده است. سپس در مورد برخی از درس‌های آموخته‌شده از تجربیات توصیف‌شده و معنای آن در وضعیت فعلی شکاف در حال گسترش بحث می‌کنیم. ما امیدواریم که این امر باعث پیشرفت در همه جوامع درگیر، از جمله محققان، متصدیان و سازندگان ابزار شود. مفاهیم به شیوه ای گویا و در عین حال با جزئیات کافی ارائه شده اند، به عنوان مثال، با توضیح چگونگی استفاده از ابزارهای رایج در دسترس برای آسان کردن مفاهیم – تا حدی کاملاً پیچیده – برای درک آسان تر. برخی از جزئیات فنی که ممکن است برای برخی از خوانندگان جالب باشد در ضمیمه ها (یکی برای هر فعالیت تحقیقی مورد بحث) آمده است. سپس درباره برخی از درس‌های آموخته‌شده از تجربیات توصیف‌شده و معنای آن در وضعیت فعلی شکاف در حال گسترش بحث می‌کنیم. ما امیدواریم که این امر باعث پیشرفت در همه جوامع درگیر، از جمله محققان، متصدیان و سازندگان ابزار شود. برخی از جزئیات فنی که ممکن است برای برخی از خوانندگان جالب باشد در ضمیمه ها (یکی برای هر فعالیت تحقیقی مورد بحث) آمده است. سپس درباره برخی از درس‌های آموخته‌شده از تجربیات توصیف‌شده و معنای آن در وضعیت فعلی شکاف در حال گسترش بحث می‌کنیم. ما امیدواریم که این امر باعث پیشرفت در همه جوامع درگیر، از جمله محققان، متصدیان و سازندگان ابزار شود. برخی از جزئیات فنی که ممکن است برای برخی از خوانندگان جالب باشد در ضمیمه ها (یکی برای هر فعالیت تحقیقی مورد بحث) آمده است. سپس در مورد برخی از درس‌های آموخته‌شده از تجربیات توصیف‌شده و معنای آن در وضعیت فعلی شکاف در حال گسترش بحث می‌کنیم. ما امیدواریم که این امر باعث پیشرفت در همه جوامع درگیر، از جمله محققان، متصدیان و سازندگان ابزار شود.

2. مفهوم آرشیو عمدی مینیمالیست

برای چندین سال، مقررات ETH زوریخ تصریح کرده است که تمام داده‌ها و مدل‌های ایجاد شده در حین استخدام در ETH زوریخ متعلق به مؤسسه است و نه به نویسندگان فردی، به استثنای حق غیرقابل مذاکره آنها به عنوان خالق. سیاست های تحقیقاتی ETH زوریخ همچنین بیان می کند که تمام تحقیقات باید قابل ردیابی باشند تا از شفافیت کامل و انجام صحیح اطمینان حاصل شود. بنابراین مدتی است که بایگانی برای هر محقق شاغل در ETH زوریخ یک وظیفه بوده است. با این حال، سیاست‌ها این را به محققین اصلی واگذار می‌کنند که الزامات را بر اساس رویه رایج در حوزه خود تعریف کنند و با وسایلی که مناسب می‌دانند به آنها رسیدگی کنند. این منجر به استفاده از طیف گسترده ای از رویکردها، معمولاً در سطح گروه های تحقیقاتی می شود. اگرچه هیچ نمای کلی قابل اعتماد یا به روزی از این راه حل ها وجود ندارد، تجربه نویسندگانی که در کتابخانه ETH کار می‌کنند، نشان می‌دهد که صرفاً ذخیره‌سازی ساختارهای پوشه بدون نظر یا تصاویر دیسک غیرمعمول نیست، به‌ویژه زمانی که داده‌ها به عنوان بخشی از تحقیقات بلندمدت در نظر گرفته نمی‌شوند. راه‌حل‌های پیچیده‌تری نیز وجود دارد، اما آنها قاعده نیستند و مدیریت آن‌ها در طول نسل‌های دانشجوی دکترا می‌تواند یک چالش باشد. گرچه قبلاً در سال 1988 تشکیل شده بود و بنابراین احتمالاً قبل از اجرایی شدن بیشتر الزامات ذکر شده در بالا، گروه بوم‌شناسی سیستم‌های زمینی با چالش‌های خاصی در مدیریت تحقیقات خود مواجه بود (همچنین رجوع کنید به راه‌حل‌های پیچیده‌تری نیز وجود دارد، اما آنها قانون نیستند و مدیریت آن‌ها بر نسل‌های دانشجویان دکترا می‌تواند چالش‌برانگیز باشد. گرچه قبلاً در سال 1988 تشکیل شده بود و بنابراین احتمالاً قبل از اجرایی شدن بیشتر الزامات ذکر شده در بالا، گروه بوم‌شناسی سیستم‌های زمینی با چالش‌های خاصی در مدیریت تحقیقات خود مواجه بود (همچنین رجوع کنید به راه‌حل‌های پیچیده‌تری نیز وجود دارد، اما آنها قانون نیستند و مدیریت آن‌ها بر نسل‌های دانشجویان دکترا می‌تواند چالش‌برانگیز باشد. گرچه قبلاً در سال 1988 تشکیل شده بود و بنابراین احتمالاً قبل از اجرایی شدن بیشتر الزامات ذکر شده در بالا، گروه بوم‌شناسی سیستم‌های زمینی با چالش‌های خاصی در مدیریت تحقیقات خود مواجه بود (همچنین رجوع کنید بهبخش 1 ).

تحقیقات بین رشته ای آن به شدت به مدل های شبیه سازی پیچیده و منابع داده متنوع بستگی داشت. تجارب قبلی رهبر از پیشگامی در این زمینه در دهه 1970 با استفاده از امکانات محاسباتی متمرکز، نیاز به مدیریت قوی داده های تحقیقاتی را نشان داد که بتواند به آرامی از انتقال سریع فناوری های اطلاعاتی تجربه شده در دهه 1980 جان سالم به در ببرد. به عنوان مثال، [ 48 ].

فوری‌ترین نیاز به مدیریت داده‌ها از این واقعیت ناشی می‌شد که این گروه تحقیقات میدانی را دنبال کرد، به عنوان مثال ، پروژه پروانه جوانه کاج اروپایی را ادامه داد، که با اندازه‌گیری‌های میدانی گسترده در امتداد کل کوه‌های آلپ اروپایی در سال 1949 آغاز شد [ 7 ، 8 ]. از همان ابتدا، این پروژه به طور مداوم به دنبال استفاده از مدرن ترین فن آوری های آن زمان، از جمله محاسبات بود. در طول تحقیق، داده های جمع آوری شده در بسیاری از رسانه ها از جمله کارت های پانچ، نوار کاغذی، نوارهای قرقره مغناطیسی و غیره ذخیره شدند.امکانات محاسباتی و ذخیره سازی هنوز در دهه 1970 و اوایل دهه 1980 بسیار محدود بود. با این وجود، یکی از نویسندگان، همراه با همکاران و متخصصان پایگاه داده، یک پایگاه داده پیشرفته در اواخر دهه 1970 برای نگهداری انواع داده های تحقیقاتی پروانه غنچه کاج اروپایی از مزرعه و آزمایشگاه ایجاد کردند (LAWIDAT as یک پایگاه داده DDLDML-INFOSYS، [ 8 ، 10 ]). هدف اطمینان از ذخیره طولانی مدت تمام داده ها و ورود مداوم داده ها به محض جمع آوری نمونه ها بود. همچنین با هدف بهبود کیفیت داده ها از نظر سازگاری، بررسی خطای فوری، و ورود متا داده ها، به منظور دسترسی آسان به داده ها برای تجزیه و تحلیل و مدل سازی برای همه محققان درگیر، و امکان تجزیه و تحلیل داده ها جامع تر بود.

با این حال، این راه حل پایگاه داده از نظر نیاز به نیروی انسانی آن چندان پایدار نبود. زمانی که مرکز محاسبات ETH زوریخ در اواخر دهه 1980 متروک شد، انتقال آن سیستم پایگاه داده به یک میزبان مدرن بسیار پرهزینه شده بود. فرسایش نرم افزار همچنین بازیابی همه داده ها را به صورت منظم غیرممکن کرده بود و داده های گرانبها عمدتاً فقط در شکل خام خود قابل نجات هستند.

این تجربه در تصمیم گیری برای جستجوی یک سیستم جدید که عمدا حداقلی بود، در عین حال که اقتصاد و پایداری را تضمین می کرد، تأثیر گذاشت. رویکرد به حداقل رساندن وابستگی‌ها به فناوری‌های پیچیده‌ای بود که نیاز به تعمیر و نگهداری پرهزینه دارند و در عین حال داده‌ها را بر اساس برخی از اصول بنیادی مدیریت می‌کردند که یک سیستم قابل مقایسه با عملکردهای یک سیستم پایگاه داده را تشکیل می‌دهند.

آرشیو اکولوژی سیستم های حاصل در سال 1990 بر اساس مفهوم زیر ساخته شد.

خودکنترلی هدف اصلی اطمینان از استفاده طولانی مدت از داده ها برای تحقیقاتی بود که طی دهه ها انجام شده است. بایگانی همچنین نیاز به مستقل بودن داشت، یعنی نه تنها داده‌های مشاهده‌ای و اندازه‌گیری (داده‌های تحقیق به معنای محدود)، بلکه همه نرم‌افزارهای درگیر مانند مدل‌ها، برنامه‌ها و سیستم‌های عامل بایگانی شدند. حتی سخت افزار در مواقع لزوم حفظ می شد. با محدود کردن دسترسی به آرشیو برای گروه تحقیقاتی، از مسائل مربوط به کپی رایت در تضاد با خودکنترلی اجتناب شد.
ورودی‌های بایگانی در پایان هر پروژه یا یک مرحله پروژه کاملاً تعریف شده، باید یک ورودی بایگانی ایجاد می‌شد ( شکل 1 ، AEDescr). یک پروژه تحقیقاتی تنها پس از تکمیل آخرین ورودی آرشیو آن، واقعاً پایان یافته در نظر گرفته شد. هر ورودی با یک توضیح همراه است و با عنوان منحصر به فرد جهانی شناسایی می شود و بخشی از آرشیو را تشکیل می دهد. بنابراین، همه متا داده‌های بایگانی می‌توانند در هر زمان از بایگانی بازسازی شوند، و همچنین به خودکنترلی بایگانی کمک می‌کند.
داده های متا متا داده ها به بخش توصیف کننده و بخش رسانه تقسیم شدند ( شکل 1 ، AEDescr در مقابل AEMedium؛ نمونه های گویا در ضمیمه A.1 ، شکل A1 در مقابل شکل A2) ، جایی که دومی ها خارج از بایگانی نگهداری می شدند تا در طول تعمیر و نگهداری منظم به روز شوند، به عنوان مثال، زیرا رسانه های ذخیره سازی قدیمی می شوند و نیاز به کپی دارند. ورودی‌های بایگانی فقط اضافه شدند و به هیچ وجه اجازه تغییر نداشتند، صرف نظر از اینکه آیا رسانه ذخیره‌سازی اصولاً اجازه بازنویسی یا حذف را می‌دهد. به روز رسانی یک ورودی بایگانی باید با بایگانی مجدد نسخه به روز شده انجام شود. در نهایت از نرم افزار پایگاه داده به صورت هدفمند استفاده نشد. تمام این انتخاب‌های طراحی برای به حداقل رساندن نگهداری بایگانی انجام شد.
فرمت ها همه متا داده ها فقط در فایل های متنی ساده کدگذاری شده ASCII ذخیره می شدند، در حالی که داده های واقعی معمولاً در قالب های اصلی بایگانی می شدند. با این حال، بیشتر بخش‌های حیاتی، به عنوان مثال، متن پایان‌نامه، به‌طور اضافی به‌عنوان rtf، به‌علاوه فایل‌های متنی، یا صفحه‌گسترده‌های حاوی داده‌های گرانبها، دوباره به‌صورت اضافی، مانند SYLK، به‌علاوه فایل‌های متنی، بایگانی شدند (برای جزئیات به پیوست A.1 مراجعه کنید ) .
رسانه ذخیره‌سازی دسترسی به ورودی‌های آرشیو منفرد به سیستم فایل در حال استفاده بستگی دارد که بسته به رسانه ذخیره‌سازی ممکن است از استانداردها پیروی کند یا نه. به عنوان مثال، دیسک های مغناطیسی-اپتیکال، که به دلیل عمر طولانی مورد انتظارشان 50 سال مورد علاقه بودند، به طور عملی با پلت فرم کامپیوتری مورد استفاده در آن زمان قالب بندی شدند، که احتمالاً نیاز به نگهداری بایگانی در مقطعی از زمان با انتقال ورودی های تحت تأثیر به رسانه های جدید دارند. سی دی ها یا دی وی دی ها بر اساس استانداردهای ISO رایت شدند.
دسترسی و استفاده برای تسهیل بازیابی، یک فهرست جهانی ( شکل 1 ، استوانه قرمز)، به عنوان مثال ، مجموعه ای جهانی از توضیحات ورودی بایگانی، به طور اضافی در خارج از بایگانی بر روی یک سرور فایل مرکزی ذخیره شد که هر محققی می توانست به آن دسترسی داشته باشد. در این فایل متنی ASCII، تمام توضیحات ورودی بایگانی، که با توضیحات رسانه‌های آن‌ها گسترش یافته‌اند، به ترتیب زمانی جمع‌آوری شده‌اند. جستجوی یک ورودی آرشیو خاص به قابلیت های جستجوی یک ویرایشگر متن یا یک ابزار خط فرمان مانند grep بستگی دارد . از آنجایی که نقش اصلی بایگانی بوم‌شناسی سیستم‌ها فعال کردن استفاده داخلی از داده‌ها برای اهداف تحقیقاتی بود، دسترسی فقط به اعضای تیم تحقیقاتی محدود شد.

جزئیات بیشتر در مورد ویژگی‌های خاص این بایگانی، از جمله نمونه‌هایی از متا داده‌ها، گردش‌های کاری برای آماده‌سازی مدخل‌های بایگانی به‌علاوه قوانین استفاده شده برای دسترسی و نگهداری، در پیوست A.1 موجود است .

3. مدیریت داده های تحقیق

تمام مدیریت داده های تحقیقاتی توسط خود محققین در طول یک پروژه تحقیقاتی را می توان به عنوان مراحل یک پیوستار با توجه به حفظ و نگهداری، همانطور که توسط Treloar و Harboe-Ree [ 49 ] بحث شده و در شکل 2 نشان داده شده است، درک کرد .

اینکه چگونه می توان داده ها را در طول زمان حفظ کرد و آیا می توان از آنها دوباره استفاده کرد تا حد زیادی به اقدامات انجام شده در زمان تولید داده بستگی دارد. این وابستگی در مواردی که سرپرستی به مؤسسات تخصصی واگذار می‌شود، که اغلب فقط در «انتهای خط لوله» تولید داده‌ها وارد عمل می‌شوند، آشکارتر می‌شود. جای تعجب نیست که تأثیر چنین نهادهایی نسبتاً محدود است. در بهترین حالت می‌توان از طریق سیاست‌ها، دستورالعمل‌ها و آموزش، تأثیر مستقیم کمتری توسط متصدیان به دست آورد. مسائلی که مرتباً با آن مواجه می‌شوید مربوط به مفقود شدن داده‌های متا و اسناد زمینه، اطلاعات از دست رفته در قالب‌های فایل (ویژگی‌ها، وابستگی‌ها، نرم‌افزارهای مرتبط)، فایل‌های داده از دست رفته یا خراب، و اطلاعات گمشده یا نامشخص در مورد جنبه‌های قانونی (حق دسترسی و استفاده از داده‌ها، و همچنین). به عنوان حقوق شخص ثالث)، به عنوان مثال،13 ، 26 ].

از آنجایی که معمولاً بین شروع تولید یا جمع‌آوری داده‌ها و تصمیم‌گیری برای انتشار و حفظ داده‌ها یک فاصله زمانی چند ساله (یا حتی دهه‌ها) وجود دارد، این خطر وجود دارد که این مسائل در زمان ارائه اطلاعات توجه لازم را دریافت نکنند. شکاف ها هنوز هم می توانند به راحتی بسته شوند.

با این حال، اطلاعات مورد نیاز برای شناسایی، بازیابی، تفسیر و استفاده از داده‌ها، البته برای هر بررسی معنادار بسیار مهم است. اطلاعاتی که باید جمع آوری شود در حالی که شناسایی و بازیابی هنوز امکان پذیر است، شامل اطلاعات مربوط به وابستگی ها و ویژگی های فنی، توصیف رویه ها و ابزارها، اطلاعات قانونی در مواردی که استفاده محدود است، و مستندات کامل زمینه علمی، به ویژه نظریه ها، مدل ها و مدل های اساسی است. ، الگوریتم ها و انتشارات. هر چند این ممکن است پیش پا افتاده باشد، تجربه ما نشان می دهد که موارد زیر اغلب فراموش می شوند: بیشتر این اطلاعات را فقط خود محققان می توانند ارائه دهند، به ویژه هر اطلاعاتی که برای تسهیل استفاده مجدد علمی از داده ها در آینده مورد نیاز است. روابط ممکن است کاملا نامتقارن باشند، به عنوان مثال، قانون 5 از [42 ]، برای مثال، در حالی که یک محقق ممکن است رابطه بین یک نشریه علمی و داده‌های زیربنایی را واضح و ایمن بداند، از زمان انتشار، تجربه ما نشان می‌دهد که در طول یک بررسی دیرهنگام، اغلب غیرممکن است که آن داده‌ها را به انتشاراتی که آن منتشر شده است، متصل کنیم. مورد استفاده قرار گرفت، مگر اینکه محقق ارجاع صریح به داده‌ها و همه انتشارات مرتبط اضافه کرده باشد (این رابطه n:n به ندرت به درستی مدیریت می‌شود، مگر اینکه جنبه‌های مراقبت از همان ابتدا در نظر گرفته شود و نظارت شود).

چند اصل برای مدیریت مجموعه داده ها نه تنها توسط متصدیان، بلکه توسط محققان نیز باید رعایت شود.

در مرحله اول، باید داده ها را با کیفیت آنها، یعنی خام در مقابل پردازش شده، متمایز کرد. ممکن است وسوسه انگیز باشد که داده های خام را به عنوان یک کاندید آسان برای وظایف سرپرستی در نظر بگیریم زیرا تغییرات وابسته به ابزار بیشتری را که نیاز به مستندسازی دارند، متحمل نشده است. متأسفانه، این به ندرت معنی‌دار است، زیرا کیفیت داده‌های خام معمولاً از استفاده از آن‌ها جلوگیری می‌کند، زیرا داده‌ها باید ابتدا بررسی شوند و احتمالاً تغییر شکل دهند، که بهتر است توسط تولیدکننده انجام شود.

ثانیاً، داده‌های پردازش‌شده محصول به‌کارگیری رویه‌ها یا الگوریتم‌ها برای داده‌های خام یا کمتر پردازش‌شده را نشان می‌دهند. اگرچه این ممکن است بی‌اهمیت به نظر برسد، اما اغلب نادیده گرفته می‌شود، اما پیامدهایی با توجه به مستندات چنین پردازشی به وجود می‌آیند. مبادله یا استفاده مجدد از داده ها، به عنوان مثال، در حین ضمیمه کردن برخی از داده های خام جدید، غیرممکن، بی معنی و یا از نظر علمی غیرممکن می شود، مگر اینکه به خوبی مستند شده باشد (به بهترین وجه با آرشیو کردن توضیحات دقیق رویه های مورد استفاده و حتی بهتر با گنجاندن خود برنامه های مورد استفاده). بسیار مشکوک

ثالثاً نوع اطلاعات مورد نیاز برای چنین اهدافی به طور جامع در مدل مرجع برای یک سیستم اطلاعات بایگانی باز (OAIS) [ 11 ] توضیح داده شده است (متن کامل عمدتاً با استاندارد ISO 14721:2012 [ 51 ] یکسان است). در آن مدل هر مجموعه داده ای را می توان ابتدا به عنوان یک Data Object مشاهده کرد. این مدل تاکید می کند که یک شی داده صرف تنها زمانی می تواند ارائه شود یا به طور معناداری مورد استفاده قرار گیرد که با اطلاعات نمایش مناسب همراه باشد (صص 2-4، [ 11 ]). اگر فقط شی داده در دسترس باشد، رندر کار نمی کند و شی اطلاعات مورد نظر غیرقابل دسترسی باقی می ماند ( شکل 3)، بالا) و بایگانی ارزش تلاش را ندارد. شیء داده و اطلاعات نمایش، شیء محتوا را با هم تشکیل می‌دهند، که سپس می‌تواند برای به دست آوردن شی اطلاعات مورد نظر پردازش شود ( شکل 3 ، پایین).

اطلاعات بازنمایی باید کل زنجیره وابستگی‌هایی را که یک Data Object به آنها تکیه می‌کند، به ویژه نرم‌افزار خاص مورد نیاز برای رندر کردن و استفاده از آن، سیستم‌عاملی که چنین نرم‌افزاری به آن متکی است، و حتی سخت‌افزار مورد نیاز برای اجرای سیستم‌عامل را پوشش دهد. در اصل، Representation Information باید نرم‌افزار و سیستم‌عامل‌ها را در نسخه دقیق موجود در آن زمان برای بایگانی به عنوان بخشی از Content Object بسته بندی کند.

از آنجایی که این یک رویکرد بسیار زائد خواهد بود، جمع‌آوری قابل اعتماد این ابزارها در یک مخزن مشترک مفیدتر و کارآمدتر خواهد بود و بنابراین فقط باید آنها را مستند کرده و به طور مداوم در اطلاعات نمایندگی ارجاع دهیم. در حالی که این رویکرد منابع مشترک از قبل می تواند در سطح گروه های تحقیقاتی اجرا شود، به دلایل کارآمدی ترجیح داده می شود که این امر در سطح کل موسسات یا حتی جوامع بین المللی با حمایت متولیان نهادی سازماندهی شود. با این حال، حمایت نهادی فعلی برای چنین رویکردهایی حداقل است.

خوشبختانه، هر چه جامعه علمی معینی بهتر تعریف شود – و بنابراین معمولاً از نظر تخصصی یکنواخت تر باشد، دانش رایج، از جمله ابزارهای مورد استفاده، بیشتر می تواند گسترش یابد. پس انداز قابل توجهی با حذف گسترده اطلاعات بازنمایی جامع از بایگانی ممکن می شود. با دانستن اینکه همه اجزای مورد نیاز برای رندرینگ به طور قابل اعتماد توسط انجمن در جاهای دیگر مدیریت می شوند، تنها ارجاع به آن استانداردها کافی است.

بعد دیگری که در این زمینه باید در نظر گرفته شود، دوره زمانی است که یک شی محتوا باید به طور کامل قابل استفاده باقی بماند. هرچه این مدت کوتاه تر باشد، می توان فرضیات بیشتری در مورد در دسترس بودن نرم افزار در خارج از خود آرشیو ایجاد کرد.

مهم نیست که در نهایت چگونه به این موضوع پرداخته شود، بدیهی است که با توجه به این واقعیت که هر عنصر از زنجیره باید یک شی داده در نظر گرفته شود، همیشه نمی‌توان زنجیره کامل وابستگی‌ها را به معنایی کاملاً بدون ابهام مستند کرد. حق خود. محدودیت های فنی و منابع این را غیرممکن می کند.

یک رویکرد عمل گرایانه برای پرداختن به این مسائل، اتخاذ حداقل اقدامات سازمانی در سطح یک گروه تحقیقاتی است. در آن سطح، وابستگی‌های حیاتی داده‌ها و پردازش آن‌ها، به عنوان مثال، نیازمندی‌های ابزار خاص، بهترین شناخته شده‌اند. مفهوم ساده بایگانی از آرشیو بوم‌شناسی سیستم‌ها ( بخش 2 ) از چنین رویکردی با پشتیبانی از ارجاع متقابل و فهرست وابستگی ورودی‌های بایگانی پیروی می‌کند ( شکل A1)). برخی از مؤلفه‌های اغلب مشترک، مانند سیستم‌های عامل، برنامه‌های کاربردی، و ابزارهای خاص رشته، به‌طور جداگانه با ورودی‌های مختلف بایگانی شدند، که نه تنها افزونگی را کاهش می‌دهد و تلاش‌های بایگانی را به حداقل می‌رساند، بلکه به طور قابل توجهی خودکنترلی بایگانی را از نظر قابلیت استفاده مجدد افزایش می‌دهد. از داده های بایگانی شده مطالعه موردی ما نشان می‌دهد که شبیه‌سازهای سخت‌افزاری امروزی همراه با ابزارهای قدیمی بازیابی‌شده از آرشیو، از داده‌ها، ابزارها و مدل‌ها به‌طور شگفت‌آوری طولانی‌مدت پشتیبانی می‌کنند و در نتیجه اثرات مخرب فرسایش نرم‌افزار را به‌طور قابل‌توجهی کاهش می‌دهند.

یکی دیگر از عناصر مهم رویکرد اتخاذ شده در گروه بوم‌شناسی سیستم‌های زمینی، پردازش سریع داده‌های خام و آوردن آنها به شکلی بود که حاوی حداقل داده‌های متا باشد که استفاده مجدد را تسهیل می‌کند. این امر آرشیو چنین مجموعه‌های داده‌ای را در هر زمان ممکن می‌سازد، زیرا در شکل پردازش شده، مخزن ممکن است حداقل ارجاعاتی به موجودیت‌ها، به عنوان مثال، ابزارها، گزارش‌ها، یا انتشارات موجود در سایر ورودی‌های آرشیو، که حاوی اطلاعات بازنمایی مورد نیاز است را داشته باشد (همچنین رجوع کنید به بخش 2 ، شکل 1 ).

برای این منظور از چارچوب های داده استفاده شد، یک فرمت ذخیره سازی داده، که در میان بسیاری از مزایای دیگر، توانایی ذخیره داده های پردازش شده همراه با متا داده ها را ارائه می دهد (شکل 4، جزئیات در ضمیمه A.1 ؛ چارچوب های داده در درجه اول توسعه داده شدند. برای اهداف مدلسازی و شبیه سازی همانطور که در بخش 5 بحث شد ). سایر قالب‌ها می‌توانند با رزرو بخش‌های جداگانه، به عنوان مثال، در ابتدا یا انتهای یک فایل داده بزرگ، برای نگهداری متا داده، اهداف مشابهی را انجام دهند. با این حال، سایر قالب‌ها ممکن است محدودیت‌های قابل‌توجهی در مقایسه با چارچوب‌های داده نوشته شده به زبان LL(1) داشته باشند، به عنوان مثال، [ 52 ] که از عملکرد کل سیستم پایگاه داده پشتیبانی می‌کند.

ذخیره سازی متا داده ها با هم در همان فایلی که خود داده ها هستند، پردازش را تسهیل می کند. سپس اطلاعات رندر ممکن است به طور کامل در متا داده ها ( شکل 4 ، پایین) یا حداقل ارجاع داده شوند ( شکل 4 ، بالا). در مورد دوم، شی اطلاعات تنها در صورتی قابل ارائه است که هم مرجع و هم ورودی های آرشیو ارجاع شده در دسترس باشند ( به بخش 2 و ضمیمه A.1 مراجعه کنید ).

منشاء مطالعه موردی مورد بحث در این مقاله به طور قابل توجهی پیش از ایجاد مدل OAIS است. در حالی که مدل OAIS و ابزارهای پیچیده مرتبط با آن کمبود داشتند، مفاهیم واضح این کمبود را جبران کرد و رویکرد آرشیو با قدرت قابل مقایسه با مدل OAIS را تقویت کرد. ما استدلال می‌کنیم که این تجربه باید امروز به‌عنوان تشویقی برای انجام کارهایی که هم‌اکنون انجام می‌شود درک شود، به‌جای اینکه مدیریت داده‌ها را تسهیل کند تا به آینده‌ای نامشخص در حالی که منتظر یک راه‌حل فنی جامع یا خدمات ایده‌آل هستیم، به تعویق بیفتد. خدماتی که به طور مطلوب برای کاربر مناسب هستند، ممکن است هرگز تکامل نیابند یا بسیار دیر باشد و زمانی که نیازهای تحقیقاتی کنونی در مقطعی در آینده در نهایت مطابقت داشته باشند، ممکن است قبلا رشد کرده یا تغییر کرده باشند.

4. مدیریت انتشارات و ادبیات

4.1. انتشارات علمی

فرآیند انتشار یک محصول تعریف شده را در قالب یک نشریه رسمی تولید می کند، اما از نظر علمی و کیوریتوری، این فقط نوک کوه یخ را تشکیل می دهد. انتشار رسمی نتایج بسیاری از تحقیقات اساسی را به شکل عمدی فشرده ارائه می کند در حالی که بیشتر داده ها و مواد مورد استفاده واقعاً منتشر نشده باقی می مانند.

در بهترین حالت، داده ها و مطالب جمع آوری شده تا حدی در مطالب تکمیلی مقاله در دسترس قرار می گیرند. با این حال، کیفیت این مطالب اغلب کاملاً مشکوک است، برای مثال، بسیاری از ناشران مطالب تکمیلی را فقط بر اساس آن ارائه می‌دهند و مسئولیتی در قبال محتوا و خوانایی به نویسندگان محول می‌کنند، در حالی که هیچ استانداردی برای چنین مطالبی اعمال نمی‌کنند. علاوه بر این، مشاهده می‌کنیم که نویسندگان با ارائه مطالب تکمیلی که فقط با نرم‌افزار اختصاصی قابل دسترسی است، فرسایش نرم‌افزار را دست‌کم می‌گیرند، به طوری که در هر زمانی که مقاله اصلی هنوز قابل خواندن است، مطالب تکمیلی غیرقابل خواندن شود.

خوشبختانه، سرمایه‌گذاران و سردبیران مجلات بیشتر و بیشتری برای انتشار آزاد تحقیقات با بودجه عمومی تلاش می‌کنند. با این حال، حتی اگر این کار به طور گسترده انجام شود، هنوز داده های منتشر نشده زیادی وجود خواهد داشت که باید طبق آنچه ما آن را عمل علمی خوب می نامیم حفظ شوند.

برای هر دو هدف – در دسترس قرار دادن داده‌های مرتبط در اختیار دیگران و نگهداری آن‌ها به دلایل مسئولیت‌پذیری – تجربه مطالعه موردی ما نشان می‌دهد که ممکن است مفید باشد که هر نشریه را به تنهایی یک پروژه در نظر بگیریم. بر اساس این مفهوم، در پایان هر پروژه بایگانی می آید ( به بخش 2 و پیوست A.1 مراجعه کنید ). بایگانی یک نشریه بر اساس اصل بسته بندی تمام داده ها، مدل ها و ابزارهایی است که برای ایجاد نشریه استفاده شده است، از جمله، به عنوان مثال، اسکریپت هایی که برای پردازش داده ها و/یا ایجاد گرافیک مورد نیاز بودند. بنابراین، اصول راهنما مانند نحوه رسیدگی به داده های تحقیق است که در بخش قبل ارائه شد (به بخش 3 مراجعه کنید ).

4.2. مدیریت ادبیات

بخش زیر صرفاً به داده های ادبی می پردازد (متا داده های کتابشناختی و متون کامل) و عمداً داده های تحقیق را که در جاهای دیگر درمان شده اند حذف می کند ( بخش 3 ). با این حال، به‌طور قابل‌توجهی، مقالات داده‌ها روز به روز رایج‌تر می‌شوند و بدین وسیله تمایز ما را محو می‌کنند.

مدیریت ادبیات که به این روش درک می‌شود، کل فرآیند تحقیق را در بر می‌گیرد، از خواندن اطلاعات پیش‌زمینه تا تولید خودکار فهرست مرجع در حین تألیف نشریات، در حالی که همیشه شامل بخش قابل‌توجهی شخصی برای هر محقق است، به عنوان مثال، [53 ]]. بنابراین باید به عنوان بخشی همه جا حاضر و جدایی ناپذیر از مدیریت داده های پژوهشی در نظر گرفته شود، همانطور که ما آن را برای هدف این مقاله تعریف می کنیم. از آنجایی که محققان به طور معمول چندین هزار مرجع و مقاله را در طول حرفه خود جمع آوری می کنند، یک مدیریت کارآمد تنها در صورتی سودآور است که این اطلاعات را از نظر اقتصادی در پروژه های تحقیقاتی، نشریات، رزومه های پژوهشگران و وب سایت به علاوه به اشتراک گذاری آن با همکاران، همتایان و همکارها مدیریت کند. نویسندگان در داخل و خارج از پروژه های تحقیقاتی در حال انجام.

مدیریت خوب ادبیات هنوز یک چالش است، زیرا برخلاف آنچه بسیاری تصور می‌کنند، روندهای فعلی کمک چندانی به کاهش شکاف سرپرستی نمی‌کنند. این موضوع نیز نمونه‌ای است که نشان می‌دهد شکاف سرپرستی نه تنها بر عهده بخش پژوهشی است، بلکه نیازمند پیشرفت‌هایی از سوی علم کتابداری و اطلاع‌رسانی و کلیه خدمات و ابزارهای مرتبط با آن است. کل چرخه زندگی داده‌های ادبیات چالش‌های قابل‌توجهی را برای دانشمندان در تحقیقات روزانه‌شان ایجاد می‌کند، و برای پیشرفت واقعی در کاهش شکاف مراقبت، باید به خوبی درک شود.

دلایل متعددی وجود دارد که چرا ما نیز در این زمینه شکاف داریم. در اینجا به چند مورد اشاره می کنیم: (i) محققان معمولاً از چندین ابزار مختلف برای نوشتن مقالات استفاده می کنند (مثلاً مایکروسافت ورد، ) و استفاده از چندین ابزار مدیر مرجع (EndNote، Mendeley، و غیره) ضروری است . Ijgi 05 00091 i001

(ابزارهای مدیریت مرجع فهرست شده در اینجا به طور خودسرانه فهرست شده و مورد بحث قرار گرفته اند و هیچ حمایت یا انتقادی از هیچ یک از این محصولات در نظر گرفته نشده است. ما در اینجا فقط چند مورد از محبوب ترین آنها را به عنوان نماینده بسیاری دیگر فهرست کرده ایم.)). (ii) استفاده از چنین ابزارهایی ممکن است توسط ناشران تجویز شود یا توسط یک تیم نویسنده تصمیم گرفته شود و بنابراین خارج از کنترل کامل محقق فردی است. (iii) بسیاری از محبوب ترین ابزارهای مدیریت مرجع امروزی با نقض اصول نظریه پایگاه داده (فقدان کلید پایگاه داده اولیه، به عنوان مثال، EndNote، Mendeley) یا در نظر گرفتن اساساً محقق به عنوان یک پایگاه داده مستحکم، مبتنی نیستند. فقط نویسنده یک مقاله (مثلاً EndNote) یا با داشتن مقررات ناکافی برای واردات، صادرات، و به روز رسانی مطمئن سوابق (مثلاً مندلی)، چه رسد به بررسی داده های مربوطه. (IV) مخازن متا داده های کم و بیش رقیب برای انتشارات علمی توسط بسیاری از خدمات عمدتا مبتنی بر اینترنت ارائه می شوند. آنها معمولاً از هر محقق جلوتر هستند و دلایل اقتصادی استفاده مناسب از چنین خدماتی را ضروری می کند. با این حال، این سرویس‌ها اغلب از تکنیک‌های اختصاصی استفاده می‌کنند که از استفاده انعطاف‌پذیر و استفاده مجدد از متا داده‌های درگیر در شرایطی که چندین تکنیک نوشتن به محقق تحمیل می‌شود، جلوگیری می‌کند. به طور خلاصه، هیچ راه حلی برای همه موجود نیست و بعید به نظر می رسد در آینده قابل پیش بینی باشد. در نتیجه، محققان باید به طور مداوم تکنیک‌های نوشتن خود را تطبیق دهند و به انعطاف‌پذیری نیاز دارند که عموماً بسیار فراتر از آن چیزی است که توسط هر یک از خدمات امروزی ارائه می‌شود، چه رسد به ابزارهای نرم‌افزاری مربوطه. آنها معمولاً از هر محقق جلوتر هستند و دلایل اقتصادی استفاده مناسب از چنین خدماتی را ضروری می کند. با این حال، این سرویس‌ها اغلب از تکنیک‌های اختصاصی استفاده می‌کنند که از استفاده انعطاف‌پذیر و استفاده مجدد از متا داده‌های درگیر در شرایطی که چندین تکنیک نوشتن به محقق تحمیل می‌شود، جلوگیری می‌کند. به طور خلاصه، هیچ راه حلی برای همه موجود نیست و بعید به نظر می رسد در آینده قابل پیش بینی باشد. در نتیجه، محققان باید به طور مداوم تکنیک‌های نوشتن خود را تطبیق دهند و به انعطاف‌پذیری نیاز دارند که عموماً بسیار فراتر از آن چیزی است که توسط هر یک از خدمات امروزی ارائه می‌شود، چه رسد به ابزارهای نرم‌افزاری مربوطه. آنها معمولاً از هر محقق جلوتر هستند و دلایل اقتصادی استفاده مناسب از چنین خدماتی را ضروری می کند. با این حال، این سرویس‌ها اغلب از تکنیک‌های اختصاصی استفاده می‌کنند که از استفاده انعطاف‌پذیر و استفاده مجدد از متا داده‌های درگیر در شرایطی که چندین تکنیک نوشتن به محقق تحمیل می‌شود، جلوگیری می‌کند. به طور خلاصه، هیچ راه حلی برای همه موجود نیست و بعید به نظر می رسد در آینده قابل پیش بینی باشد. در نتیجه، محققان باید به طور مداوم تکنیک‌های نوشتن خود را تطبیق دهند و به انعطاف‌پذیری نیاز دارند که عموماً بسیار فراتر از آن چیزی است که توسط هر یک از خدمات امروزی ارائه می‌شود، چه رسد به ابزارهای نرم‌افزاری مربوطه. این سرویس‌ها اغلب از تکنیک‌های اختصاصی استفاده می‌کنند که از استفاده انعطاف‌پذیر و استفاده مجدد از متا داده‌های درگیر در شرایطی که چندین تکنیک نوشتن به محقق تحمیل می‌شود، جلوگیری می‌کند. به طور خلاصه، هیچ راه حلی برای همه موجود نیست و بعید به نظر می رسد در آینده قابل پیش بینی باشد. در نتیجه، محققان باید به طور مداوم تکنیک‌های نوشتن خود را تطبیق دهند و به انعطاف‌پذیری نیاز دارند که عموماً بسیار فراتر از آن چیزی است که توسط هر یک از خدمات امروزی ارائه می‌شود، چه رسد به ابزارهای نرم‌افزاری مربوطه. این سرویس‌ها اغلب از تکنیک‌های اختصاصی استفاده می‌کنند که از استفاده انعطاف‌پذیر و استفاده مجدد از متا داده‌های درگیر در شرایطی که چندین تکنیک نوشتن به محقق تحمیل می‌شود، جلوگیری می‌کند. به طور خلاصه، هیچ راه حلی برای همه موجود نیست و بعید به نظر می رسد در آینده قابل پیش بینی باشد. در نتیجه، محققان باید به طور مداوم تکنیک‌های نوشتن خود را تطبیق دهند و به انعطاف‌پذیری نیاز دارند که عموماً بسیار فراتر از آن چیزی است که توسط هر یک از خدمات امروزی ارائه می‌شود، چه رسد به ابزارهای نرم‌افزاری مربوطه.

در اینجا ما سیستمی را توصیف می کنیم که با موفقیت در گروه بوم شناسی سیستم های زمینی در ETH زوریخ در تلاش برای رسیدگی به چنین مسائلی پیاده سازی و استفاده شده است. این سیستم تکامل یافته و از تغییرات تکنولوژیکی متعددی جان سالم به در برده است و نزدیک به سه دهه است که مورد استفاده روزانه قرار گرفته است. این می تواند به عنوان یک مدل موفق از نحوه اجرای مدیریت ادبیات قوی در یک گروه تحقیقاتی و چگونگی غلبه بر برخی از چالش های فوق الذکر عملی عمل کند.

اهداف سیستم پیشنهادی در اینجا بر اساس اصول طراحی زیر بنا شده است. در حالی که سعی می شود مجموعه ادبیات را بین اعضای تیم تحقیقاتی به اشتراک بگذارد، به هر یک از اعضای تیم باید حداکثر آزادی برای حفظ یک مجموعه بسیار شخصی داده شود. در حالی که برخی این اهداف را گسترش دهنده اهداف متضاد می دانند، قوانین و توضیحات طراحی زیر باید انتخاب های انجام شده را قابل درک کند.

سیستم ادبیات پیشنهادی برای مجموعه های شخصی نشریات در شکل 5 نشان داده شده است . این سیستم از به اشتراک گذاری متا داده های کتابشناختی و متون کامل انتشارات، احتمالاً مشروح، در یک تیم از محققان پشتیبانی می کند، در حالی که مالکیت شخصی اولیه مجموعه توسط هر یک از محققین شرکت کننده را حفظ می کند .

این سیستم چه محقق x به اینترنت متصل باشد چه نباشد کار می کند و یکپارچگی داده ها را حفظ می کند، علیرغم پیچیدگی توپولوژی آن که از توزیع متا داده های کتابشناختی و متون کامل انتشارات بر روی چندین کاربر و چندین دستگاه پشتیبانی می کند (همچنین رجوع کنید به ضمیمه A.2 ). این به پژوهشگر منفرد احساس کار با یک مجموعه ادبیات شخصی را در همه زمان ها می دهد، در حالی که از همکاری حمایت می کند، از جمله با به اشتراک گذاری حداقل متا داده ها در مورد ادبیات مورد استفاده در تیم.

علاوه بر این و بسیار مهمتر، این سیستم نه تنها از مدیریت متا داده ها، بلکه از نگهداری مجموعه انتشارات شخصی، به عنوان مثال، در قالب مجموعه ای از فایل های PDF، خواندن آن انتشارات، به علاوه حاشیه نویسی آن انتشارات، پشتیبانی می کند (به پیوست مراجعه کنید . A.2 برای جزئیات فنی در مورد تکنیک ها و ابزار واقعی مورد استفاده). این مفهوم تلاش می کند تا سیستم را تا حد امکان از دیدگاه هر محقق جذاب کند، بنابراین احتمال استفاده از آن را به طور قابل توجهی افزایش می دهد، همانطور که تجربه نزدیک به سه دهه به طور مشخص تأیید می کند.

سوابق متا داده حاوی منابع کتابشناختی هر اثر علمی تنها از طریق پایگاه داده مرکزی بین کاربران تیم تحقیق مبادله می شود.

L i t C e n t r a l

(توپولوژی ستاره مانند). این اتفاق با همگام سازی رکوردهای مالک از طریق

L i t C e n t r a l

به پایگاه داده های شخصی کاربر دیگر، به عنوان مثال، از

L i t M Y_{a}

همانطور که توسط محقق a to استفاده می شود

L i t M Y_{b}

همانطور که توسط محقق ب استفاده شده است . فرض بر این است که این امر به صورت ناهمزمان اتفاق می افتد، یعنی هر زمان که یکی از محققین درگیر x به پایگاه داده مرکزی متصل شود.

L i t C e n t r a l

سازگاری بین محققان با مرتبط کردن مجوزهای خاص به سوابق تضمین می شود. محقق منفرد، به عنوان مثال، a ، دارای مجوز نوشتن (سبز) در تمام سوابق خود است، اما فقط تا زمانی که این سوابق در دستگاهی متعلق به آن کاربر باشد. توجه داشته باشید، دامنه‌های A ، B ، … مختص کاربر هستند (رابطه 1:1)، اما محدود به دستگاه نیستند، به طوری که یک محقق می‌تواند هر تعداد دستگاه را که دوست دارد استفاده کند (شکل 5 این را برای دامنه A با رایانه لوحی و یک رایانه نشان می‌دهد. تلفن هوشمند، برای دامنه Bبا لپ تاپ و تلفن هوشمند). هر رکورد همیشه تنها در اختیار یک محقق است (رابطه 1:1) و باید دارای یک کلید منحصر به فرد جهانی باشد که به یک کار علمی خاص (رابطه 1:1) ارجاع دهد تا ثبات را در سراسر سیستم همیشه تضمین کند. متأسفانه، این ویژگی جایی است که اکثر راه حل های امروزی، به عنوان مثال، مبتنی بر ابر (مانند، مندلی)، اساساً شکست می خورند.

برای اهداف توضیحی در شکل 5 از کلیدهایی استفاده می شود که شامل یک عدد و حرفی است که نشان دهنده صاحب رکورد، یعنی محقق x است . هر گونه تکراری از رکوردهای متا داده (رابطه 1:n) ممکن است در سراسر تیم تحقیقاتی توزیع شود، با این حال، فقط با مجوزهای فقط خواندنی (در شکل 5 ، اگر کپی رکورد در دامنه ای غیر از رکورد قرار داشته باشد، بخش ها قرمز رنگ می شوند. مالک).

اگر کلید شامل صاحب رکورد نیز باشد، هر کلیدی که در هر دامنه X اختصاص داده شده و در آن دامنه X منحصر به فرد است ، به طور خودکار در سطح جهانی نیز منحصر به فرد است. این امر تخصیص مستقل کلیدها را تا حد زیادی تسهیل می‌کند، اما با این مضرات وجود افزونگی در کل سیستم همراه است، زیرا به چندین محقق اجازه می‌دهد تا کلیدهای متفاوتی را به یک کار علمی مشابه اختصاص دهند.

با این حال، همانطور که تجربه ما نشان می دهد، تکنیک هایی برای به حداقل رساندن خطر چنین افزونگی وجود دارد، به عنوان مثال، با داشتن ابزار مناسب برای بررسی وجود سابقه ای که قبلاً به یک کار علمی خاص ارجاع می دهد. با گسترش شناسه های دیجیتالی اشیاء، می توان این عیب را بیشتر برطرف کرد. شکل 6 قوانین مربوطه را نشان می دهد که باید هنگام وارد کردن رکوردهای جدید به سیستم رعایت شود. با این حال، توجه داشته باشید، اصل طراحی پیشنهاد شده در اینجا استفاده از چنین امکاناتی را برای هر شرکت کننده جذاب می کند، زیرا حجم کاری کاربران را کاهش می دهد و آنها را قادر می سازد تا صرفاً یک رکورد را به اشتراک بگذارند به جای اینکه وارد مشکل ورود مجدد به آن شوند.

هر گونه به روز رسانی احتمالی داده های اصلی هر رکورد متعلق به کاربر x ، کپی مربوطه را در آن بازنویسی می کند

L i t C e n t r a l

به محض اینکه محقق x او را همگام کرد

L i t M Y x

با پایگاه داده مرکزی و در عین حال ادغام هرگونه داده غیر اصلی مانند حاشیه نویسی های شخصی از همه کاربران رکورد.

هر کاربر دیگری، مثلاً کاربر y ، که احتمالاً از برخی از آن رکوردها نیز استفاده می کند، به محض اینکه خود را همگام سازی کرد، کپی های خود را در دامنه Y بازنویسی می کند.

L i t M Y y

با پایگاه داده مرکزی

L i t C e n t r a l

. این بدان معنی است که همگام سازی ناهمزمان داده ها در بین نسخه های مختلف همیشه از رکورد اصلی در سیستم مالک یک طرفه است و باید در سراسر سیستم به دستگاه های دیگر در آن دامنه ها منتشر شود، تنها زمانی که کاربران به پایگاه داده مرکزی دسترسی دارند.

L i t C e n t r a l

. باز هم، این کنترل کامل را به همه شرکت‌کنندگان در هنگام به اشتراک‌گذاری داده‌های کتابشناختی و متون کامل می‌دهد، در حالی که تکنیک‌های لازم را ساده نگه می‌دارد و از سازگاری داده‌ها در همه زمان‌ها اطمینان می‌دهد.

تجربه تقریباً سه دهه ای، پیاده سازی این مفهوم با استفاده از اجزای مختلف ابزارهای پرکاربرد مانند EndNote و از جمله در نگارش آثار علمی با استفاده از مایکروسافت آفیس ورد یا . – به ویژه تحقیقات مشترک – از بسیاری جهات. قابل ذکر است که انتظار می رود این سیستم آزمایش شده با زمان از استفاده از ابزارهای موجود به شیوه ای عملی و انعطاف پذیر پشتیبانی کند. این به محقق فردی امکان می‌دهد تا ابزارها را به سرعت تغییر دهد، و در صورت نیاز، زمانی که همکاری تغییر می‌کند یا صرفاً زمانی که مجله علمی دیگری استفاده از ابزارهای خاص دیگر را به محقق تحمیل می‌کند (مثلاً Word vs. Ijgi 05 00091 i003

). اگر ابزارها به طور دائمی تغییر کنند یا ابزارهای دیگری نیاز به گنجاندن داشته باشند، سیستم می تواند به طور مشترک تکامل یابد و حتی تا حدی کاستی ها و کاستی های بسیاری را که برنامه های کاربردی محبوب امروزی در حفظ ثبات نشان می دهند، جبران کند.

با این حال، این سیستم بدون معایب نیست. به عنوان مثال، هر محقق x اصولاً فقط باید همیشه یک نسخه اصلی متناظر با یک نشریه خاص در دامنه X خود داشته باشد . استثنائات الزامات فوق را فقط باید به طور موقت تحمل کرد، به عنوان مثال ، در هنگام ورود به یک نشریه جدید و در یک وضعیت گذرا از سیستم (به عنوان مثال، شکل 6 ). با این حال، این الزام تنها می تواند توسط رشته محقق x “اجرا شود” ، که خطر واقعی ناسازگاری را ایجاد می کند، علیرغم اینکه کاملاً در حوزه واحد X باقی می ماند که فقط توسط محقق واحد x کنترل می شود.. این محدودیت تا حد زیادی به دلیل ماهیت عملگرایانه مفهوم ما است، به عنوان مثال ، اجازه می دهیم ابزارهای محبوب، علیرغم ایراداتشان، ترکیب شوند، یعنی برای همکاری با ابزارهای رقابتی طراحی نشده اند.

مجبور شدن با تغییر تحقیقات مشترک برای استفاده، به عنوان مثال، چندین “مدیران مرجع” نیز پیچیدگی را اضافه می کند، مانع دیگری که ممکن است توسط محققان به عنوان یک عامل بازدارنده قابل توجه برای پایبندی به مفهوم ما درک شود. با این حال، شرط فوق حیاتی است، نباید آرام شود، و مستلزم نظم و انضباط دقیق از محقق x است تا از هرگونه میانبر صرفاً با به‌روزرسانی رکوردهای سبز اجتناب کند، و هرگز به موارد نارنجی ( نگاه کنید به شکل 5 )، صرف نظر از اینکه در کجا کمبود برخی از متا داده‌ها وجود دارد. به عنوان مثال، یک اشتباه تایپی، شناسایی شد. رکوردهای سبز به روز شده باید با انتقال رکوردهای سبز به روز شده از مرکز در دامنه X منتشر شوند

L i t M Y x

به هر پایگاه داده دیگری که گزیده ای خاص از رکوردهای نارنجی را ذخیره می کند. خطر ناهماهنگی را می توان مجدداً با ارائه ابزارهای انتقال مناسب که می توانند به طور مؤثر چنین انتشاراتی را به راحتی انجام دهند به حداقل رساند ( پیوست A.2 ، شکل A4 و شکل A5 ).

علیرغم معایب خاصی که با رویکرد ما و کمبودهای متعدد «مدیران مرجع» امروزی به وجود می‌آید، رجوع کنید به. پیوست A.2 برای جزئیات)، که مفید نیستند، ما توانسته‌ایم راه‌حل‌های عمل‌گرایانه و در عین حال بسیار موفقی را توسعه دهیم. ما فقط نیاز به پیروی از مفاهیم روشنی داشتیم که پایه و اساس حیاتی را برای تضمین ثبات در سیستم و در نتیجه قابلیت اطمینان ( شکل 5 و شکل 6 )، یکی از مرتبط‌ترین عناصر برای کاربرپسندی، فراهم می‌کردند.

علاوه بر این، به نظر می‌رسد که مفهوم ما نیز تا حد زیادی با انگیزه‌ها و انگیزه‌های پژوهشگر منطبق باشد – به‌ویژه با حمایت از استفاده شخصی – در حالی که با این وجود از همکاری و اشتراک داده‌های ادبیات حمایت می‌کند. طراحی مفهومی ما ( شکل 5 و شکل 6 ) برای اجتناب از مسائل و به حداقل رساندن خطرات ناسازگاری ضروری به نظر می رسد. همچنین می‌توان آن را مستقل از ابزارهای خاص تعمیم داد تا زمانی که شرایط زیر برآورده شود:

هر شرکت‌کننده را می‌توان به‌صورت جهانی به‌صورت منحصربه‌فرد نشان‌داد (مثلاً با استفاده از شناسایی منحصربه‌فرد محقق ORCID).
هر نشریه همچنین به طور جهانی به طور منحصر به فرد با یک کلید اصلی (به عنوان مثال، DOI) در سیستم پایگاه داده توزیع شده مشخص می شود که مالک را نیز شناسایی می کند.
همه فایل‌ها، به‌عنوان مثال، فایل‌های PDF مرتبط با یک نشریه معین، به گونه‌ای نام‌گذاری می‌شوند که نام فایل حاوی کلید اصلی باشد یا اجازه می‌دهد تا کلید اصلی مشتق شود.

یک سرور ثبت مرکزی نیاز اول را حتی برای تعداد بسیار زیادی از محققین برآورده می کند. برای شرط دوم، یک کاندید خوب برای کلید اصلی ساختن کلیدهای اصلی از DOI (شناسه شی دیجیتال) پرکاربرد کار علمی مرجع مرتبط با شناسه کاربر به عنوان نتیجه الزام یک خواهد بود (فرض می کنیم که همه آثار درگیر دارای DOI هستند) . شرط سه در ساده ترین شکل خود با استفاده از کلید اصلی برای نام فایل، ناشی از برآورده کردن نیاز دو است.

با این حال، نسل فعلی DOI از کاراکترهایی استفاده می کند که از نظر فنی در تضاد قابل توجهی با سیستم های فایل امروزی و طرح های کدگذاری «مدیران مرجع» هستند. همراه با این واقعیت که همه نشریات به دور از اختصاص یک DOI منحصر به فرد در سطح جهانی، همه اینها مخالف راه حل کلی ساده و ساده است. بازنگری قابل‌توجهی در طرح‌ها و ابزارهای نرم‌افزاری که به‌طور گسترده مورد استفاده قرار می‌گیرند مورد نیاز است تا هر سه نیاز را به خوبی برآورده کنند، تا پس از آن، به عنوان مثال، یک سیستم مبتنی بر ابر با راحتی بیشتر از آنچه سیستم ما در حال حاضر می‌تواند انجام دهد، ارائه شود.

در نهایت، در حالی که هر سیستم پایگاه داده حرفه ای برای انجام وظایف مورد نیاز مناسب است و در اصل می تواند از سیستم ما پشتیبانی کند، استناد به منابع در حالی که تالیف نشریات به هیچ وجه توسط آنها پشتیبانی نمی شود. آنچه که مورد نیاز است عملکرد دومی است که به نقاط قوت معمول “مدیران مرجع” تعلق دارد. با این حال، دومی دارای ضعف های قابل توجهی از نظر عملکرد پایگاه داده است، استدلال دیگری که به وضوح برای راه حلی مشابه آنچه ارائه کردیم صحبت می کند.

به نظر می رسد که اکثر «مدیران مرجع» امروزی در انجام کارکردهای بنیادی پایگاه داده آنگونه که واقعاً مورد نیاز است کوتاهی می کنند و/یا با تأمین نیازهای تحقیقی واقعی همانطور که در ابتدا توضیح داده شد، کمک بسیار کمی به بهبود وضعیت می کنند. رویکرد ما، با این حال، به تمام مسائل مربوطه پرداخت. این کارکرد یک سیستم پایگاه داده کاملاً پیشرفته را ارائه می‌کند، از جمله وارد کردن و صادر کردن از و به دیگر سیستم‌های پایگاه داده و/یا «مدیران مرجع»، به علاوه استفاده از «مدیران مرجع» محبوب که می‌تواند به نویسندگان در استناد به آثار و تولید کتاب‌شناسی کمک کند. . بنابراین، سیستم ما به طور قابل‌توجهی به حفظ سرمایه‌گذاری قابل توجهی که هر محقق فردی ممکن است در حین خواندن، حاشیه‌نویسی، ارجاع، و مشارکت در ادبیات علمی به شیوه‌ای سیستماتیک انجام دهد، کمک می‌کند. این کلید برای هر گونه اصلاح آن سرمایه گذاری است، که خطر از بین رفتن کامل آن را دارد، که ما گمان می کنیم معمولاً چنین است. همچنین بسیار قابل توجه است که چگونه بسیاری از نرم‌افزارها و ابزارهای مبتنی بر کتابداری و علم اطلاعات، به ویژه محبوب‌ترین آن‌ها، در رسیدگی به همه این مسائل کوتاهی می‌کنند. تنها در صورتی می‌توان این شکاف را کاهش داد که ابزارسازان وضعیت واقعی را که محققان امروزی باید در آن کار کنند و با ادبیات علمی کار می‌کنند، درک کنند.

5. نظریه و مدل ها

نظریه های علمی و توسعه آنها خارج از حوصله این مقاله است. با این حال، ملاحظات کمی وجود دارد. اولین انتشارات علمی تا حد زیادی تئوری ها، از جمله زمینه آنها را در بر می گیرند، در حالی که تمام ظرافت ها را حفظ می کنند و با کمترین خطر از نظر مراقبت روبرو هستند همانطور که در بخش 4.2 بحث شد.. با این حال، این مورد در مورد شاخه‌های رو به رشد علم که در آن از مدل‌ها، به‌ویژه مدل‌های شبیه‌سازی پیچیده، برای گرفتن و محصور کردن درک نظری استفاده می‌شود، صادق نیست. آنها نیاز به توجه ویژه ای دارند تا توسعه نظریه را تضعیف نکنند اگر وابستگی دومی احتمالاً افزایش یابد در حالی که مدل اولی، مدل های شبیه سازی، که معمولاً به فناوری های محاسباتی کاملاً پیچیده وابسته هستند، به ویژه توسط فرسایش نرم افزار تهدید می شوند. چالش‌های پیش‌رو نیز باید در این زمینه برطرف شود.

تمایز بین مدل‌های نظری که توسط برخی مدل‌های پایه نامیده می‌شوند، مهم است، به عنوان مثال، [ 54 ]، که بیانگر یک نظریه علمی است که در تلاش برای توضیح و/یا توصیف پدیده‌ای از جهان قابل مشاهده است که به عنوان «واقعیت» تعبیر می‌شود ( شکل 7 ، بیضی قهوه‌ای ) و مدل های ساده شده، پارامتری شده یا یکپارچه، به عنوان مثال، [ 55 ، 56 ، 57 ، 58 ]، مدل های شبیه سازی ( شکل 7 )، که به طور معمول بسیاری از جنبه های سیستم واقعی را جمع می کنند. در حالی که مدل های قبلی معمولاً در دست نوشته های علمی منتشر می شوند، مدل های شبیه سازی به ندرت به طور کامل در دسترس عموم قرار می گیرند.

مدل‌ها و داده‌های مورد نیاز برای اجرا، تجزیه و تحلیل و اعتبارسنجی مدل‌های اولی آشکارا به طور پیچیده‌ای به هم مرتبط هستند (همچنین به شکل 7 مراجعه کنید ). با این حال، تجربه ما نشان داد که اگر داده‌های مدل از ساختارهای ریاضی موجود در یک مدل جدا شوند، چندین مزیت به وجود می‌آیند. یکی این است که داده‌های یکسان می‌توانند به زیبایی برای چندین مدل مدل استفاده شوند، به عنوان مثال، هنگام آزمایش فرضیه‌های نظری جایگزین که هر کدام در یک مدل مدل متفاوت با معادلات ریاضی جایگزین محصور شده‌اند، مفید باشد. مزیت دیگر این است که مجموعه‌های مختلفی از پارامترها را می‌توان برای یک مدل ریاضی به کار برد، به عنوان مثال، در طول شبیه‌سازی‌های مجموعه برای تقلید تصادفی، تحلیل حساسیت یا زمانی که یک مدل، مثلاً یک مدل پوشش گیاهی، در میان قاره‌ها جابجا می‌شود، مفید باشد.

برای این منظور، چارچوب‌های داده توسط گروه بوم‌شناسی سیستم‌های زمینی در یک پروژه فرعی از پروژه RAMSES (کمک‌های پژوهشی برای مدل‌سازی و شبیه‌سازی سیستم‌های محیطی، [58]، www.sysecol.ethz.ch/ramses/ ) ، بر اساس توسعه داده شد. نظریه سیستم های ویمور و زیگلر [ 56 ، 57 ]. اینها همان چارچوب های داده ای هستند که قبلاً ذکر شد ( بخش 3 ) در زمینه ذخیره داده های متا همراه با داده های اصلی. قاب های داده صرفاً فایل های متنی هستند که می توانند آزادانه با استفاده از یک نحو خاص LL(1) قالب بندی شوند، به عنوان مثال، [ 52 ]، نحو DTF (به پیوست A.3 ، شکل A7 مراجعه کنید.) و با هر ابزاری که محقق ترجیح می دهد ایجاد و ویرایش می شوند. فریم های داده می توانند مجموعه داده های بزرگ و پیچیده ای را شامل شوند، نه تنها برای داده های مدل، بلکه برای نگهداری مشاهدات بزرگ (به بخش 3 مراجعه کنید ). این امکان پذیر است زیرا آنها می توانند هر تعداد فایل را از طریق مراجع فایل در بر گیرند ( پیوست A.3 ، شکل A7 را ببینید ) بدین ترتیب یک پایگاه داده کامل را تشکیل می دهند، اما به لطف فیلتر کردن و سایر تکنیک های شتاب، بازیابی کارآمدی را ارائه می دهند.

جداسازی خصوصیات مدل ریاضی (مثلاً شکل 8 ) از داده ها (مثلاً شکل 9 ) از بسیاری جهات قدرتمند است. همانطور که در بالا گفته شد برای شبیه سازان انعطاف پذیری ارائه می دهد، زیرا ترکیب رایگان n فریم داده با مدل های مشابه یا m با استفاده از چارچوب داده مشابه، امکان تعریف بسیاری از آنها را فراهم می کند، به عنوان مثال ،

n \times m

آزمایش های شبیه سازی، به عنوان مثال، [ 59 ]. از آنجایی که نیاز کمی به بایگانی وجود دارد، در عین حال، کاریابی را تسهیل می کند

n \times m

بار مدل به علاوه داده، احتمالاً حاوی تعداد زیادی افزونگی است، اما فقط n قاب داده به اضافه کد برنامه های تعریف مدل m را بایگانی می کند .

چنین رویکردی برای مدل ریاضی عمداً ساده برای رشد لجستیک، DESS (مشخصات سیستم معادلات دیفرانسیل) نشان داده شده است.

\dot{x} (t) = a x (t) - b x {(t)}^{2}

( شکل 8 ).

برای هر شبیه سازی، آن مدل به مقادیر پارامتر (val) از جمله محدودیت های دامنه آنها (min، max) به اضافه واحدها و سایر داده ها مانند شرایط اولیه نیاز دارد. چارچوب داده نشان داده شده در شکل 9 این را برای پارامترهای مدل معادله لجستیک نشان می دهد.

جدا نگه‌داشتن داده‌ها از مدل‌های ریاضی نه تنها مزایای فوق‌الذکر را ارائه می‌کند، به عنوان مثال، از نظر انعطاف‌پذیری برای آزمایش‌های شبیه‌سازی، بلکه مزایای قابل‌توجهی را از نظر حفظ چنین تلاش‌هایی ارائه می‌دهد. به‌ویژه، اعتبارسنجی مدل‌سازی و شبیه‌سازی یک بار بایگانی و بازیابی شده را برای استفاده مجدد امکان‌پذیر می‌کند.

اگر یک ورودی مرجع خاص، مجدداً به شکل قاب‌های داده اختصاصی ذخیره شود (ورودی مرجع در شکل 7 )، و نتایج شبیه‌سازی مربوطه که رفتار مدل را تحت این شرایط نشان می‌دهند، مجدداً به عنوان خروجی مرجع کنار گذاشته شوند ( شکل 7 )، یک مجموعه آزمایشی برای استفاده مجدد از مدل ایجاد شده است. با توجه به این رویکرد، هر مدل باید همراه باشد (i) با ورودی مرجع خود متشکل از قاب های داده که آزمایش شبیه سازی خاصی را برای آزمایش تعریف می کند («ورودی مرجع» آبی تیره در شکل 7) و (2) خروجی مرجع ، یعنی شبیه سازی به عنوان مثال، در یک فایل به اصطلاح ذخیره («خروجی مرجع» آبی تیره در شکل 7). اگر همراه با کد مدل شبیه‌سازی آرشیو شود («مدل شبیه‌سازی» آبی تیره در شکل 7 )، هر گونه فعال‌سازی مجدد مدل را می‌توان ابتدا با تولید مجدد خروجی مرجع و مقایسه آن با خروجی مرجع مورد انتظار همانطور که در آرشیو موجود است، آزمایش کرد. این تضمین می‌کند که محققی که کار روی آن مدل را در زمان بعدی بر روی یک ماشین و راه‌اندازی دیگر انتخاب می‌کند، می‌تواند ابتدا چنین آزمایشی را قبل از استفاده از مدل برای تحقیقات جدید انجام دهد.

این محقق را قادر می سازد تا از کیفیت بالای شی اطلاعات اطمینان حاصل کند، در حالی که تنها چند نتیجه شبیه سازی را بایگانی می کند (به بخش 3 ، شکل 3 مراجعه کنید ). در مواردی که نتایج شبیه‌سازی بسیار بزرگ است، به عنوان مثال، معمولاً برای نتایج پرهزینه از مدل‌های آب و هوایی، این ممکن است به طور قابل‌توجهی اندازه آرشیو را بدون به خطر انداختن تکرارپذیری کاهش دهد.

در اینجا چهار مورد قابل تفکیک است. آنها از ترکیب اجراهای شبیه‌سازی ارزان در مقابل پرهزینه به دلیل زمان‌های طولانی شبیه‌سازی و/یا نیاز به کامپیوترهای فوق‌العاده و ارزان‌قیمت ناشی می‌شوند.بایگانی پر هزینه به دلیل حجم داده ها اگر هم اندازه آرشیو کوچک باشد و هم آزمایش های شبیه سازی ارزان باشند، هیچ چالشی وجود ندارد. با این حال، رویکرد ما در دو موردی که اندازه آرشیو بزرگ یک چالش است، مزایای بزرگی ارائه می‌کند، اما ارائه تنظیمات شبیه‌سازی از جمله نتایج شبیه‌سازی آن را می‌توان به راحتی انجام داد، یا زمانی که آزمایش‌های شبیه‌سازی پرهزینه نتایج شبیه‌سازی با اندازه نسبتاً کوچک تولید می‌کنند. . این رویکرد تنها زمانی به محدودیت‌های خود می‌رسد که هم نتایج شبیه‌سازی بزرگ به دست می‌آید و هم اجرای مجدد شبیه‌سازی‌ها بسیار پرهزینه است، به عنوان مثال، موردی برای مدل‌های گردش عمومی که در تحقیقات آب و هوایی استفاده می‌شود. روشی که برای ایجاد تعادل بین تعداد نتایج شبیه سازی وارد بایگانی می شود، باید بر اساس یک مورد به مورد تصمیم گیری شود. هنوز،

6. بحث و نتیجه گیری کلی

تنظیم داده‌های دیجیتالی نیازمند اقدامات مناسب در مدیریت داده‌ها و تحقیقات است، به طور ایده‌آل درست از ابتدای ایجاد داده، یعنی قبل از انجام تمام تحقیقات با استفاده از آن داده‌ها. چنین اقداماتی را تنها می‌توان توسط خود محققانی که داده‌هایشان، وابستگی‌های بین آنها و ابزارهای مورد نیاز را می‌دانند، و روابط بین داده‌ها، مدل‌ها و نظریه‌ها را کاملاً درک می‌کنند، به‌عنوان مثال رجوع کنید به [13، 18، 37 ، 42 ] ، اجرا شود .

محققین برای انجام وظیفه خود نیاز به حمایت دارند که می تواند در قالب جریان های کاری ساختارمندتر ارائه شود. این به آنها اجازه می دهد تا تحقیقات بهتری را به طور کارآمدتر انجام دهند و در عین حال بررسی را تسهیل کنند. ما این را مدیریت داده های تحقیق ساختاریافته می نامیم، به عنوان مثال، [ 29 ] را نیز ببینید. این موضوع در محیط‌های ترکیبی پیچیده‌ای که امروزه هنوز داریم، که بخشی از کار به‌طور کامل دیجیتالی‌شده انجام می‌شود، اهمیت ویژه‌ای دارد، در حالی که بخش‌های دیگر، هر چند در حال کاهش هستند، سنتی‌تر باقی می‌مانند، یعنی « مبتنی بر کاغذ». بنابراین، اگر تحقیق و همچنین سرپرستی بتوانند از رویکردهایی که در اینجا پیشنهاد می‌کنیم سود ببرند، به نظر می‌رسد که در واقع یک موقعیت برد-برد خواهیم داشت.

با این حال، به دلیل این بینش‌ها، شکاف فعلی در حال گسترش نه از بین می‌رود و نه محدود می‌شود و متصدیان نهادی مانند آرشیو داده‌ها و کتابخانه‌ها با چالش‌های قابل‌توجهی هنگام تلاش برای به عهده گرفتن مسئولیت بر اساس مدل OAIS، به عنوان مثال، [33] مواجه می‌شوند . در بخش بعدی به برخی از دلایلی که ما را وادار می کند انتظار داشته باشیم که شکاف curation همچنان با ما باقی بماند و اینکه چرا رویکردهای پیشنهادی شرح داده شده در این مقاله نمی توانند بر شکاف curation به طور کامل غلبه کنند، بحث می کنیم.

ابزارهای ضعیف گاهی اوقات به عنوان بهانه ای برای فقدان مدیریت داده های تحقیق و سایر اقدامات برای ایجاد یک عمل تحقیقاتی ساختاریافته تر استفاده می شوند که باعث تسهیل در مدیریت می شود. برخی از تلاش ها برای رفع این نیاز انجام شده است، به عنوان مثال، [ 60 ]. ابزارهای پیچیده، اگر واقعاً در دسترس باشند، مطمئناً می توانند مدیریت و مدیریت داده ها را پشتیبانی و تسهیل کنند. اگر توسعه‌دهندگان نرم‌افزار تلاش کنند تا محققان را بهتر درک کنند و ابزارهای مناسب‌تری را در دسترس قرار دهند، ما نیز مانند دیگران انتظار داریم که وضعیت بهبود یابد، به عنوان مثال، [ 42]]. با این حال، باید ترسید که این کافی نباشد، زیرا انگیزه های اقتصادی ممکن است برای مشتریان محدود و بسیار متنوع محقق بسیار کم باشد، و/یا اینکه تحقیقات به سرعت پیشرفت کند که رسیدن کامل به آن برای همیشه بعید است.

از سوی دیگر توجه به این نکته نیز حائز اهمیت است که ابزارها، صرف نظر از اینکه چقدر به کمال نزدیک هستند، هرگز نمی توانند مفاهیم ضعیف را در مورد آنچه باید به دست آورد و کدام عوامل باید در تحقیق در نظر گرفته شوند، جبران کنند. همانطور که در این مقاله به طور گسترده نشان داده شده است، مفاهیم خوب طراحی شده را می توان حتی با منابع محدود و با ابزارهایی با قدرت محدود با ترکیب ابزارها بر اساس مفاهیم جامع، فراگیر و مهمتر از همه استوار و فکری پیاده سازی کرد. نتیجه‌ای که از طریق ترکیب‌های هوشمندانه به دست می‌آید بسیار بیشتر از آن چیزی است که از اجزای سازنده به تنهایی انتظار می‌رود. با این حال، چنین مفاهیمی گسترده نیستند، یا به دلایل مشابهی که به طور کلی به چالش کشیده می شود، اعتبار آنها به چالش کشیده می شود.

خوشبختانه، همانطور که مطالعه موردی نشان داد، شکاف درمان حداقل می تواند کاهش یابد. موفقیت قابل توجهی از نظر مدیریت به ویژه در زمینه‌های عمده‌ای به دست آمد که در آن چالش‌ها در حال حاضر بزرگ هستند، اما برای تحقیقات در بسیاری از رشته‌ها بسیار مرتبط هستند، به عنوان مثال، برای (i) مدیریت داده، (ii) مدیریت ادبیات، و (iii) پیشرفت تئوری در زمینه ها با استفاده از مدل های پیچیده

رویکرد عملگرایانه استفاده بهینه از ابزارها و تکنیک‌هایی که در حال حاضر در دسترس است، همانطور که در اینجا پیشنهاد می‌کنیم، احتمالاً به دلایل زیادی که برخی از آنها در بالا ذکر شد، با ما باقی خواهد ماند. مورد دیگر که احتمالاً کاملاً مرتبط است، این است که محققان امروزی خود را با بسیاری از محیط‌های تحقیقاتی متنوع و تا حدی ناسازگار می‌بینند که باید پیوسته با آنها سازگار شوند. مفاهیم انتزاعی، یعنی کلی و در عین حال جامع و قوی را می توان با این وجود به کار برد، زیرا آنها کمی به ابزارهای خاص و ویژگی های خاص آنها بستگی دارند. به همین دلیل است که ما استدلال می‌کنیم که برای کاهش شکاف سرپرستی، تمرکز قوی بر کاربرد عمومی و سازماندهی کار قبل از هر چیز بر اساس اصول کلی به جای راه‌حل‌های خاص، کلیدی است، به عنوان مثال، [29 ] .

مطالعه موردی ما این را به طرز چشمگیری برای مدیریت ادبیات نشان می دهد ( بخش 4.2) که در آن ابزارهای کافی به ویژه در سال های قبل تا حد زیادی از دست رفته بودند. به دلیل ماهیت قوی و عمومی، این رویکرد با در دسترس قرار گرفتن ابزارهای جدید و/یا بهتر قابل گسترش بود و می‌توانست گسترش یابد. همانطور که مدیریت ادبیات به طور خاص نیز نشان داد، ما هنوز با نیازهای واقعی محققین فاصله داریم و ابزارهای قوی تری برای تسهیل شیوه های تحقیقاتی مورد نیاز است، زیرا آنها به خوبی طراحی شده اند، از تبادل داده ها به طور انعطاف پذیر پشتیبانی می کنند، و در غیر این صورت به خوبی مناسب هستند. وضعیت امروز محقق البته اگر برخی از اصول ارائه شده، به عنوان مثال، جداسازی داده ها از مدل ها، از یک رشته به رشته دیگر منتقل شود، به محققان کمک بیشتری می شود. این رویکرد ما را زیر سوال نمی برد،

درس‌های زیر را نیز می‌توان از مطالعه موردی ما آموخت: بایگانی به خوبی زنده ماند و از سال 1989 تا به امروز به طور بی‌نقصی به هدف خود عمل کرده است، بدین ترتیب از چندین تغییر تکنولوژیکی مانند تغییرات پلت فرم رایانه، بسیاری از تغییرات سیستم عامل و برنامه بدون نقص و بدون نیاز به حفظ است. هر گونه تعمیر و نگهداری اضافی به دلیل آن تغییرات. بنابراین به نظر می‌رسد که رویکرد مینیمالیستی نقش مهمی در این موفقیت داشته است و بر ارزش انجام کارهای ممکن تأکید می‌کند در حالی که راه‌حل‌های بهتری در دسترس نیستند یا نمی‌توان از پس آن برآمد. در این زمینه، شایان ذکر است که هر رویکرد کمتر مینیمالیستی در مراحل اولیه پروژه بلندمدت قبل از آرشیو ارائه شده در اینجا شکست خورده و باعث از دست دادن داده های حیاتی شده است، اما هنوز حل نشده است، در حالی که تلاش هایی برای نجات تا حد امکان انجام می شود، به عنوان مثال،

این تجربه همچنین تا حدودی به چالش می کشد یا حداقل باعث ایجاد برخی ملاحظات نسبت به شایستگی ابتکارات به اشتراک گذاری داده های بزرگ و همکاری می شود، به عنوان مثال، TERENO (رصدخانه های محیطی زمینی، teodoor.icg.kfa-juelich.de ، به عنوان مثال، [ 61 ]) یا TERN (زمینی) شبکه تحقیقات اکوسیستم، www.tern.org.au) ، جایی که هنوز باید نشان داده شود که (1) تلاش های چتر هماهنگ کننده بدون توجه به تغییرات تکنولوژیکی یا سازمانی بر مبنای طولانی مدت خواهد بود و می تواند حفظ شود و/یا (2) اینکه مشارکت های فردی می توانند دسترسی به داده های خود را به طور کامل حفظ کنند. یک پایه دائمی برای ذکر یک مثال کاملاً چشمگیر، تجربه ما، با مشارکت در شبکه مشابه LEMA (فعالیت مدل‌سازی بلندمدت اکوسیستم) پروژه GCTE (تغییر جهانی و اکوسیستم‌های زمینی) IGBP (برنامه بین‌المللی ژئوسفر-بیوسفر: مطالعه تغییر جهانی، به عنوان مثال، [ 62 ]، برای URL مراجعه کنید به [ 63 ])، نشان می دهد که خطرات فوق واقعی هستند، زیرا شبکه LEMA اکنون ناپدید شده است، به عنوان مثال، [ 64]]، علیرغم اینکه سنگ بنای مهم GCTE در نظر گرفته شده است، به عنوان مثال، [ 62 ]. در نهایت درسی که باید از این و تلاش‌های مشابه آموخته شود، به عنوان مثال، [ 34 ] این است که مشارکت محققان برای موفقیت بسیار مهم است، مشابه فرض اولیه ما و یافته‌های دیگران [ 18 ، 29 ، 37 ، 42 ، 47 ] .

در نهایت، یکی دیگر از پیش نیازهای اساسی برای موفقیت در کاهش شکاف سرپرستی، به ویژه در درازمدت، تعهد روشن از سوی رهبر گروه تحقیقاتی است، از جمله مهارت‌هایی برای اطمینان از اینکه همه اعضای کارکنان با ساختاردهی کار خود مطابق با مفاهیم مورد توافق مطابقت دارند.

با این حال، یک عمل تحقیقاتی بهبود یافته تنها مراحل اولیه چرخه حیات داده های تحقیق را پوشش می دهد. تلاش‌ها در عمل تحقیقاتی باید با پاسخ‌های سازمانی بیشتر تکمیل شود [ 26 ، 29 ، 30 ]. دانشگاه‌ها، سرمایه‌گذاران و مجلات نیز می‌توانند نقش مهمی را ایفا کنند، به عنوان مثال، با تعیین انگیزه‌های مناسب برای یک عمل تحقیقاتی بهبود یافته از نظر سرپرستی، به عنوان مثال، [ 17 ، 19 ، 25 ، 28 ]. به طور قابل‌توجه، اجرای دقیق‌تر یا گسترش دامنه دستورالعمل‌های موجود، ممکن است باعث پیشرفت شود، به‌عنوان مثال، با اعمال دستورالعمل‌های انتشار موجود برای مطالب پشتیبانی به جای سپردن تمام مسئولیت‌ها به نویسندگان.

علاوه بر این، دانشگاه ها، کتابخانه ها، بایگانی ها و مراکز داده باید تلاش های خود را برای رفع شکاف سرپرستی ادامه داده و تقویت کنند. ابتدا با ادامه حمایت و آموزش محققان. این همچنین مستلزم درک کاملی از نحوه کار محققان و چالش هایی است که باید با آنها روبرو شوند. ثانیاً، خدمات نگهداری داده ها، که مطمئناً پس از خروج داده های تحقیق از حوزه فردی محقق وارد عمل می شوند، باید بهبود و تقویت شوند. اگر متصدیان نیز نقش خود را در اینجا انجام دهند، یک رویکرد یکپارچه ممکن است به طور قابل توجهی سریعتر نتیجه دهد.

به طور کلی، با توجه به ملاحظاتی که در اینجا توضیح داده شد، نه تنها کیفیت ها در همه بخش های درگیر از طریق برد-برد متقابل افزایش می یابد، بلکه حرکت به سمت دسترسی آزاد به نتایج علمی نیز ممکن است پرورش یابد. حداقل در نتیجه به حداقل رساندن تلاش های اضافی مورد نیاز برای در دسترس قرار دادن اطلاعات به خوبی سازماندهی شده است. مطمئناً، تلاش‌های انجام شده توسط جامعه پژوهشی و سرپرستی، در جهت‌هایی که در اینجا پیشنهاد می‌شود، به کاهش شکاف سرپرستی کمک می‌کند، و شاید حتی آن را در نهایت ناپدید می‌کند. گرایش به دیجیتالی شدن بیشتر ممکن است حتی به غلبه بر شکاف سرپرستی به جای کمک به آن کمک کند، همانطور که امروزه اغلب اتفاق می افتد.

از نظر چشم انداز آینده چنین تلاش هایی، موضوع پایداری دیجیتال در اینجا قابل ذکر است. حرکت به سمت خارجی سازی هزینه ها در درازمدت عدم تعادل ایجاد می کند. جامعه باید از نیاز به پایداری دیجیتال آگاه باشد، جایی که داده های تحقیقاتی مربوطه به طور ایمن برای نسل های آینده ذخیره می شود، به راحتی در دسترس است و توسط متخصصان نظارت می شود، به عنوان مثال، [ 15 ، 22 ]. همه اینها فقط از درخواست ما برای رویکردی عملگرایانه پشتیبانی می کند، مشابه آنچه که «تحقیق محض» سعی در انجام آن دارد.

پایداری دیجیتال نه تنها به معنای حفظ پایدار داده ها، تضمین بعد اجتماعی پایداری است، بلکه پایداری اقتصادی و زیست محیطی را نیز در بر می گیرد. مدیریت و حفظ داده های پژوهشی بیشتر و با ساختار بهتر می تواند به پیشرفت علمی کمک کند. به عنوان مثال می تواند به محققان کمک کند تا از تکرار ناخواسته تحقیقاتی که قبلاً نمی دانستند انجام شده است اجتناب کنند، شاید به این دلیل که آنها صرفاً به جزئیات آن تحقیق دسترسی نداشتند. این امر به نوبه خود باعث صرفه جویی در بودجه، صرفه جویی در زمان و منابع طبیعی مورد استفاده برای انجام تحقیقات می شود و شاید از این طریق حتی به طور کلی به پایداری کمک کند.

پیوست اول

پیوست A.1. جزئیات در مورد مفهوم آرشیو گروه اکولوژی سیستم های زمینی

مفهوم بایگانی مینیمالیستی همانطور که در بخش 2 معرفی شد نیاز به شرح ورودی بایگانی برای هر ورودی بایگانی دارد (AEDescr، قرمز، شکل 1 ). این متا داده ها باید در قالب یک فایل متنی ASCII جداگانه ارائه شوند و باید دقیقاً قبل از بایگانی به ورودی بایگانی اضافه شوند تا اطمینان حاصل شود که در صورت لزوم بازسازی متا داده از خود آرشیو امکان پذیر است. شکل A1 نشان می‌دهد که بایگانی‌کننده، معمولاً نویسنده، باید چه متا داده‌هایی را برای یک ورودی بایگانی با عنوان “Easy ModelWorks <= 1.3r2” ارائه دهد.

برای اینکه بتواند یک ورودی بایگانی را پیدا کند به اطلاعاتی در مورد رسانه (AEMedium، آبی، شکل 1 ) نیز نیاز دارد که در حال حاضر روی آن ذخیره شده است ( شکل A2 ). این یک فایل متنی ASCII جداگانه است که نباید به خود ورودی بایگانی اضافه شود، زیرا احتمالاً به دلیل نگهداری بایگانی تغییر می کند، به عنوان مثال، اگر یک ورودی بایگانی از یک رسانه قدیمی و قدیمی به یک رسانه جدید منتقل شود. این جداسازی به محتوای بایگانی اجازه می دهد تا بدون توجه به تغییرات در رسانه ذخیره سازی، همیشه ثابت نگه داشته شود ( شکل 1 ).

به منظور استانداردسازی ایجاد و نگهداری مدخل‌های آرشیو، دستورالعمل‌های دستورالعمل، پژوهشگران را از طریق ایجاد یک ورودی بایگانی و متا داده‌های آن راهنمایی می‌کند. راهنماهای دیگر به کاربران نحوه جستجو و بازیابی ورودی‌های آرشیو و نحوه نگهداری آرشیو را آموزش می‌دهند.

شکل A1. نمونه ای از توضیحات ورودی بایگانی (به رنگ قرمز در شکل 1 نشان داده شده است ).

شکل A2. نمونه ای از توضیحات رسانه برای همان ورودی بایگانی که در شکل A1 توضیح داده شده است . چنین توضیحات رسانه ای در شکل 1 به رنگ آبی نشان داده شده است .

گردش کار برای یک ورودی جدید بایگانی:

(1): در مورد ورودی برنامه ریزی شده با عضو گروه مسئول بایگانی و همچنین رهبر گروه در صورت لزوم بحث کنید. آیا لحظه مناسب است، چه چیزی باید گنجانده شود، چه چیزی در جای دیگری بایگانی شد یا خواهد شد؟
(2): با انتقال و آماده سازی تمام عناصر برای بایگانی در یک پوشه واحد و همچنین با مرتب سازی و حذف فایل های منسوخ یا اضافی، ورودی بایگانی را آماده کنید.این مرحله بسیار مهم است زیرا جایی است که فایل‌های حیاتی احتمالاً به فرمت‌های فایل با طول عمر بیشتر تبدیل می‌شوند (مثلاً اسناد Word -> rtf، متن یا صفحات گسترده -> فایل‌های SYLK). علیرغم اصل اجتناب از افزونگی، افزونگی دومی عمدی است زیرا باید به حداکثر استفاده طولانی مدت از آرشیو کمک کند. برای این منظور باید کپی های اضافی از اسناد مهمی که حاوی اطلاعات کمتری نسبت به اصل خود هستند، ذخیره شوند، به عنوان مثال، با ذخیره اجباری یک سند Word در قالب یک فایل متنی ساده که بدین وسیله تمام اطلاعات قالب بندی از بین می رود. بنابراین یک مقاله علمی، اگر، به عنوان مثال، با Word نوشته شده باشد، سه بار در ورودی آرشیو ذخیره می شود: (i) فایل Word باینری (doc/docx)، (ii) rtf (فایل متنی با اطلاعات قالب بندی)، (iii) فایل متنی ساده (فایل متنی بدون هیچ گونه اطلاعات قالب بندی). در نهایت برای اطمینان از استفاده مجدد، به عنوان مثال به منظور نوشتن اشتباه یا ادامه تحقیق، تمام فایل های اصلی اصلی که در تهیه شکل ها یا جداول استفاده می شوند، به عنوان مثال، رویه های آماری مانند اسکریپت های R، در آرشیو یک مقاله علمی، علی رغم اینکه انتشار دومی مثلا در صورت استفاده ، تمام فایل های مورد نیاز به عنوان ورودی برای حروفچینی کامل، علاوه بر PDF منتشر شده، به شکل اصلی خود وارد آرشیو می شوند. ورودی بایگانی تنها زمانی آماده در نظر گرفته می شود که رویه هایی مانند حروفچینی را بتوان با استفاده از فایل های موجود در بایگانی انجام داد. بخش‌های مشترک، به‌عنوان مثال، نرم‌افزار مدل‌سازی و شبیه‌سازی، که توسط بسیاری از محققین به اشتراک گذاشته شده است را می‌توان کنار گذاشت، اما چنین وابستگی‌هایی باید در تیم تحقیقاتی مورد بحث قرار گیرند تا اطمینان حاصل شود که آرشیو موازی آنها تضمین می‌شود.
(3): داده های متا، به عنوان مثال ، توضیحات ورودی بایگانی را برای ورودی بایگانی ایجاد کنید ( شکل A1 ). هر ورودی باید حاوی اطلاعاتی در مورد عنوان پروژه، نسخه، فهرست قطعات، نویسندگان، توضیحات محتوا، مدیریت (که همچنین شامل نرم افزار و/یا سخت افزار لازم برای خواندن داده ها) باشد، نکات کلی، اینکه آیا پروژه بخشی است یا خیر. از یک پروژه فرعی است و دارای هرگونه ارجاع متقابل، آرشیو و تاریخ ایجاد است.
(4): توضیحات ورودی بایگانی ( شکل A1 ) را به خود ورودی آرشیو اضافه کنید. به صورت اختیاری – مخصوصاً در مورد ورودی‌های بایگانی بزرگ و پیچیده مفید است – به عنوان آخرین مرحله که بر محتوای آرشیو تأثیر می‌گذارد، می‌توان از برخی ابزارهای فهرست‌بندی فایل برای اسکن کل ورودی بایگانی و افزودن یک قسمت فهرست فایل مفصل و جامع به ورودی بایگانی استفاده کرد. دوباره در قالب یک فایل متنی
(5): در مورد نوع و تعداد رسانه ذخیره سازی مورد نیاز تصمیم بگیرید ، به عنوان مثال، دیسک های مغناطیسی نوری (MO)، سی دی یا دی وی دی، که معمولاً با اندازه ورودی بایگانی تعیین می شود. از دیسک‌هایی استفاده کنید، به‌عنوان مثال، دیسک‌های MO، که قبلاً استفاده شده‌اند، اگر هنوز پر نشده‌اند و ورودی روی آن قرار می‌گیرد. اگر ورودی بایگانی بیش از حد بزرگ است که روی یک دیسک قرار نگیرد (رابطه n:n) از چندین دیسک، به عنوان مثال، DVD استفاده کنید.
(6): شرح رسانه را در ورودی بایگانی در فایل متنی کوچک جداگانه بنویسید. این متا داده ها رسانه ذخیره سازی، مکان و نام رسانه را توصیف می کنند ( شکل A2 ).
(7): ورودی بایگانی را دو بار در بایگانی ذخیره کنید . هنگامی که مراحل فوق برای رضایت همتا مسئول بایگانی تکمیل شد، ورودی بایگانی آماده را با کپی کردن دوبار کل شاخه سیستم فایل در رسانه ذخیره سازی هدف ذخیره کنید. هر دو کپی باید یکسان باشند و روی یک رسانه مانند دیسک MO، CD یا DVD ساخته شده باشند.
(8): توضیحات ورودی بایگانی را به فهرست جهانی ذخیره شده در سرور فایل مرکزی اضافه کنید ( شکل 1 ).
(9): شرح رسانه ورودی بایگانی را به فهرست جهانی ذخیره شده در سرور فایل مرکزی اضافه کنید. نمایه جهانی اکنون حاوی تمام داده های متا است که امکان دسترسی به هر ورودی بایگانی را فراهم می کند ( شکل 1 ).
(10): به صورت اختیاری شرح رسانه مدخل را در یک نمایه رسانه ای جداگانه و همچنین در مرکز ذخیره شده ذخیره کنید که همه رسانه های بایگانی موجود را جدول بندی می کند. آن شاخص حیاتی نیست (در شکل 1 نشان داده نشده است ) و فقط به بایگانی‌گر اطلاع می‌دهد که تعمیرات دوره‌ای انجام شود، به‌عنوان مثال ، با افزایش سن رسانه‌ها، کدام بخش‌های آرشیو باید در رسانه‌های جدید کپی شود و کدام توضیحات رسانه‌ها نیاز به به‌روزرسانی دارند.
(11): در نهایت، رسانه های آرشیو ، به عنوان مثال، دو دیسک MO، دو سی دی، یا دو دی وی دی، را در دو مکان جداگانه، به عنوان مثال، در یک گاوصندوق و یک کابینت بایگانی در یک ساختمان دیگر ذخیره کنید.

امنیت و حفظ طولانی مدت بایگانی با چندین اقدام تضمین شد: اول با استفاده از یک ایمن ضد بلایا (آتش، آب، رادیواکتیویته، پالس الکترومغناطیسی). ثانیا با ذخیره یک نسخه دوم از کل بایگانی در مکان دیگری. ثالثاً نگهداری پیشگیرانه بایگانی دوره‌ای، با استفاده از نمایه رسانه ذخیره‌سازی جداگانه، خوانایی را با انتقال ورودی‌های آرشیو به رسانه‌های جدید به دلیل پیری رسانه و/یا تغییرات پلت فرم آنها تضمین می‌کند (به دنبال فواصل بازرسی/کپی رعایت می‌شود: پنج سال برای DVD و دیسک‌های فلاپی، ده سال سال برای سی دی ها و دیسک های MO). چهارم، هر گونه از دست رفتن داده های متا که در خارج از بایگانی نگهداری می شود، به عنوان مثال در اثر آتش سوزی شاخص جهانی، بایگانی را به خطر نمی اندازد، زیرا مستقل است.، تمام متا داده ها، از جمله اطلاعات رسانه ذخیره سازی، می توانند از خود آرشیو بازسازی شوند، البته دومی نسبتاً پر زحمت است.

دسترسی به کارمندان عادی و قبلی محدود شده بود، در حالی که داده‌های شخصی نیاز به مجوز اضافی خاص دارد، به عنوان مثال، از رهبر یا معاون آن، برای محافظت از حریم خصوصی داده‌های شخصی احتمالاً درگیر. این رویکرد شامل Private و Shared است، اما نه دامنه عمومی همانطور که در شکل 2 نشان داده شده است .

گردش کار بازیابی از سه مرحله تشکیل شده است: (1) جستجو برای یک ورودی در فهرست جهانی، (2) اطمینان از داشتن حقوق دسترسی، و (iii) کپی کردن ورودی بایگانی مورد نیاز از رسانه بایگانی در رایانه ای که در حال حاضر استفاده می شود. سیستم. از کاربران آرشیو خواسته شد که هدف بازیابی را روشن کنند، اینکه آیا داده ها برای اهداف فقط خواندنی بازیابی شده اند یا برای ادامه تحقیق. در مورد قبلی، کاربران مجبور بودند کپی بازیابی شده را پس از استفاده حذف کنند تا از بایگانی مجدد تصادفی جلوگیری کنند. در مورد استفاده مجدد برای تحقیقات جدید، کاربران باید مطمئن می شدند که داده ها فقط در صورت اصلاح واقعی دوباره بایگانی می شوند.

ضمیمه A.2. مدیریت مرجع

این یک پیاده سازی مشخص از مفهوم مدیریت ادبیات ارائه شده در بخش 4.2 را توصیف می کند . برای اجرای سیستم مدیریت ادبیات پیشنهادی، باید برخی از اصول طراحی اساسی رعایت شود. در میان آنها به اصطلاح انواع مرجع هستند ( شکل A3 ).

شکل A3. انواع مراجع مورد استفاده در سیستم مدیریت ادبیات پیشنهادی شامل

L i t C e n t r a l

و شاخه های شخصی آن

L i t M Y x

( ر.ک. شکل 5 ) با استفاده از FileMaker ( : انواع ورودی؛ EndNote : انواع مرجع؛ مندلی : نوع و غیره ) اجرا شده است. در ستون دوم توضیحاتی در مورد نوع مرجع و کاربرد آن ارائه شده است. رنگ‌ها همراه با دنباله اولویت‌ها را مشخص می‌کنند (بالا سبز بالاتر، پایین‌ترین قرمز) که در مواردی که چندین احتمال وجود دارد، باید از انواع مرجع استفاده شود. Ijgi 05 00091 i002

ارجاعات باید به طور جامع تعریف شوند و در میان همه ابزارهای پشتیبانی شده، به ویژه «مدیرهای مرجع» خاص مانند BibDesk یا EndNote یا Mendeley مبتنی بر نقشه‌برداری شوند . کاری به دور از بی اهمیت بودن. مجموعه ای که در شکل A3 نشان داده شده است چندین سال است که با موفقیت مورد استفاده قرار گرفته است و تمام نیازها را برآورده می کند. با این حال، بیشتر برای دانشمندان علوم طبیعی هدف قرار گرفته است و ممکن است به اندازه کافی از دانشمندان علوم اجتماعی و دانشمندان علوم انسانی حمایت نکند. به‌ویژه، این مجموعه احتمالاً نیاز به تمدید دارد تا به خوبی به دانشمندان حقوقی خدمت کند. با این حال، و مهمتر از آن، شکل A3 Ijgi 05 00091 i003

انواع مرجعی را پیشنهاد می‌کند که معمولاً استفاده می‌شوند، اما به طور شگفت‌انگیزی در برخی از مدیران مرجع محبوب‌تر (مانند مندلی) فاقد آن هستند. از جمله آنها انواع مرجع هستند

E d i t e d B o o k

I n E d i t e d B o o k

، یا

I n P r o c e e d i n g s

، که در صورت عدم وجود و در نتیجه مخلوط کردن، به عنوان مثال،

B o o k

با

E d i t e d B o o k

، از تولید یک فهرست مناسب و بدون ابهام از مراجع جلوگیری کنید که، به عنوان مثال، به وضوح بین ویراستاران و نویسندگان تمایز قائل شود.

شکل A3 همچنین نحوه استفاده از این انواع مرجع را توصیه می کند، به ویژه زمانی که محقق ممکن است در مورد استفاده از آن شک داشته باشد یا به راهنمایی روشن نیاز دارد. به عنوان مثال: یک شماره ویژه از یک مجله علمی حاوی مجموعه مقالات یک کنفرانس را می توان با استفاده از نوع مرجع مقالات ویرایش شده ، کتاب ویرایش شده ، یا مجموعه مقالات استناد کرد . سپس می‌توان به مقاله‌ای که در چنین جلساتی منتشر شده است، با استفاده از نوع مرجع مقاله مجله ، در کتاب ویرایش شده یا در مجموعه مقالات استناد کرد . این جدول توصیه می کند که مقالات ویرایش شده را به کتاب یا مجموعه مقالات ویرایش شده ترجیح دهید و به مقاله مجله ترجیح دهیددردر کتاب ویرایش شده یا بیش از آن در مجموعه مقالات . انتظار می رود این اولویت ها به خوانندگان و کتابداران کمک کند تا آثار ذکر شده را پیدا کنند و از اشتباه رایج استفاده از ظاهر فیزیکی یک اثر، به عنوان مثال، کتاب بودن، به عنوان مبنایی برای تصمیم گیری برای استفاده از نوع مرجع جلوگیری کنند.

مفهوم پیشنهادی مستلزم انتقال آزادانه سوابق در میان ابزارهای درگیر مانند پایگاه داده FileMaker با اهمیت محوری در حوزه هر محقق، کتابشناسی های EndNote خاص پروژه ، به عنوان مثال، هنگام نوشتن مقاله با مایکروسافت ورد ، و فایل های خاص پروژه، به عنوان مثال، هنگام نوشتن مقالات با . پایگاه داده مرکزی که تمام رکوردهای متعلق به یک کاربر را ذخیره می کند، فقط پایگاه داده FileMaker است (سوابق سبز، شکل 5 ). هر گونه ذخیره‌سازی خاص پروژه از نسخه‌های فقط خواندنی در کتاب‌شناسی‌های EndNote یا فایل‌های BibDesk (سوابق نارنجی، شکل 5) Ijgi 05 00091 i002

) شامل یک زیر مجموعه گزیده از رکوردها است. هر گونه به روز رسانی رکوردهای سبز نیاز به انتقال مجدد از FileMaker به فایل های خاص پروژه EndNote یا فایل های BibDesk دارد ، و هر رکورد نارنجی رنگی که احتمالاً در آنجا ذخیره شده است را بازنویسی کنید ( به شکل A4 و شکل A5 مراجعه کنید ). Ijgi 05 00091 i002

شکل A4. سوابق را بین پایگاه داده Filemaker LiteratureMY و کتابشناسی EndNote پروژه خاص EndNoteMY منتقل کنید ( شکل 5 را نیز ببینید ). انتقال در هر دو جهت امکان پذیر است، در حالی که انتقال از EndNote به FileMaker فقط در هنگام ورود رکوردهای جدید استفاده می شود. استفاده از هر ابزار میانی مانند ویرایشگر متن متن باز مبتنی بر tcl AlphaX کاملاً خودکار است و نیازی به دخالت کاربر ندارد.

مفاهیم انتقال همچنین امکان استفاده از چندین دستگاه را فراهم می کند ( شکل 5 ). اینکه محقق x از بیش از یک دستگاه استفاده کند، مثلاً یک لپ‌تاپ و یک تبلت، کاملاً تصمیم x است. مشخصاً همگام سازی رکوردها در بین چندین دستگاه متعلق به یک شخص x نیز تنها مسئولیت شخصی محقق x است . در اینجا ( شکل 5 ) از نظر مفهومی فرض می‌کنیم که وقتی یک شخص از چندین دستگاه استفاده می‌کند، این اساساً به معنای تکراری شدن دامنه A در چندین دستگاه است، که در آن مسئولیت محقق فردی است که مطمئن شود او فقط با نسخه اصلی کار می‌کند. هر نقطه از زمان

خوشبختانه ابزارهای موجود در حال حاضر گزینه هایی را ارائه می دهند، به عنوان مثال، از طریق به اصطلاح ابری، برای همگام سازی متا داده های کتابشناختی و متون کامل در بین دستگاه های شخصی. با این حال، در موارد نقص فنی یا غیرقابل اعتماد بودن تکنیک‌های همگام‌سازی خودکار، از لحاظ فنی، همگام‌سازی دستی ساده از یک دستگاه اصلی اختصاصی به دستگاه دیگر، به عنوان مثال، با استفاده از یک ابزار همگام‌سازی کلاسیک در سطح فایل (چنین ابزارهایی که برای این منظور مفید هستند نیز ارائه می‌شوند. به عنوان “نرم افزار رایگان” www.sysecol.ethz.ch/people/afischli/software توسط یکی از نویسندگان)، همچنین می تواند به غلبه بر کاستی های متعدد امروزی خدمات ابری در حال حاضر در بازار کمک کند. باز هم، سیستم پیشنهادی ما در اینجا انعطاف پذیری کامل را ارائه می دهد.

شکل A5. سوابق را بین پایگاه داده Filemaker LiteratureMY و یک فایل خاص پروژه BibDesk منتقل کنید (همچنین به شکل 5 مراجعه کنید ؛ BibDesk یک مدیر منبع باز همه کاره و قدرتمند برای فایل ها است). انتقال در هر دو جهت امکان پذیر است، در حالی که انتقال از BibDesk به FileMaker فقط در هنگام ورود رکوردهای جدید استفاده می شود. استفاده از هر ابزار میانی مانند EndNote یا ویرایشگر متن منبع باز مبتنی بر tcl AlphaX کاملاً خودکار است و نیازی به دخالت کاربر ندارد ( شکل A4 را ببینید ). Ijgi 05 00091 i002

شکل A6. نگاشت انواع مرجع بین سیستم های درگیر، به عنوان مثال ، پایگاه داده Filemaker LiteratureMY ، EndNote ، و . Ijgi 05 00091 i002

انتقال رکوردها ( شکل A4 و شکل A5 ) البته نیاز به نگاشت انواع مرجع ( شکل A3 ) از یک مکان ذخیره سازی به مکان دیگر دارد. شکل A6 نگاشت بین FileMaker ، EndNote و . Ijgi 05 00091 i002

ضمیمه A.3. مدل سازی و شبیه سازی

چارچوب های داده، به عنوان مثال، [ 59 ] توسط گروه بوم شناسی سیستم های زمینی در چارچوب داعش (نرم افزار پیاده سازی سیستم های یکپارچه، www.sysecol.ethz.ch/ramses/layer/ISIS ) در قیاس با مفهوم نظری سیستم توسعه داده شد. فریم های تجربی، به عنوان مثال، [ 54 ]. قاب‌های داده به داده‌ها اجازه می‌دهند که در فرمت آزاد روی فایل‌های متنی ساده ذخیره شوند و در یک نحو خاص DTF نوشته شوند ( شکل A7 ). نحو DTF LL(1) است، به عنوان مثال، با توضیحات مختصر [ 52 ] برای تجزیه آسان تر و کارآمد و اجازه می دهد تا داده های متا را در هر جایی تزریق کنند، و ذخیره داده ها را بسیار بصری برای درک می کند (به عنوان مثال، شکل 4 و شکل 9 ).

شکل A7. تعریف توسعه یافته Backus-Naur از نحو DTF مورد استفاده در ISIS (نرم افزار پیاده سازی سیستم های یکپارچه) برای ذخیره داده ها در قالب به اصطلاح Data Frames. دومی توسط گروه اکولوژی سیستم های زمینی توسعه داده شد. نحو DTF LL(1) [ 52 ] است و به عنوان مثال، ذخیره سازی داده های چند فایلی انعطاف پذیر و دسترسی تصادفی کارآمد را در زمان اجرا امکان پذیر می کند، به عنوان مثال، زمانی که داده ها توسط برنامه های تعریف مدل قابل دسترسی هستند، به عنوان مثال، [58] (به عنوان مثال ، شکل 4 ، شکل 8 و شکل 9 ).

برای بازیابی کارآمد و ذخیره سازی مدولار، می توان داده ها را به شیوه ای توزیع شده با استفاده از منابع فایل شرطی ذخیره کرد (به ساختار FileReference مراجعه کنید، به عنوان مثال، FILE = “~/DataBases/TemperatureObs/CH1887-1921.DTF؛ USE IF FILTER = 1880”). یک قاب داده باید به طور کامل در یک فایل ذخیره شود، در حالی که یک فایل ممکن است حاوی n قاب داده باشد (به عنوان مثال، شکل 4 ). اگر در طول بازیابی با تعاریف چندگانه قاب داده با همان شناسه مواجه شد، فقط داده های آخرین خوانده شده در واقع قابل دسترسی هستند، در حالی که مراجع فایل دایره ای اسکن شاخه درگیر را با بسته شدن دایره لغو می کنند.

بازیابی اطلاعات ذخیره شده توسط Data Frames از طریق تعاریف به اصطلاح ارزش انجام می شود. چارچوب داده ها امکان دسترسی تصادفی به داده ها را از طریق یک شناسه فراهم می کند و توالی ذخیره سازی را از توالی استفاده جدا می کند. این جداسازی همچنین امکان دسترسی به داده‌ها را در زمان اجرا از درون برنامه‌های تعریف مدل [ 58 ] فراهم می‌کند و یک محیط شبیه‌سازی بسیار انعطاف‌پذیر و از لحاظ نظری سالم را فراهم می‌کند. با استفاده از چارچوب داده از شکل 4 ، شناسه ای که نشان دهنده نام علمی گونه درختی صنوبر نقره ای اروپایی است، “ForClim.Aalb.Scientific_name” (تعریف مقدار اسکالر) خواهد بود در حالی که بردار اندازه های سطل از تمام سایت های موجود با شناسه نشان داده می شود. “ForClim.Bucketsize” یا شناسه های همه سایت ها توسط “ForClim.SiteID” (تعریف مقدار برداری).

فریم های داده تنها چهار نوع داده ابتدایی را می شناسند: اعداد حقیقی و صحیح، رشته ها و شناسه ها. اعداد را می توان با هر دقتی ارائه کرد و نحوه کنترل واقعی آنها به پلت فرم بستگی دارد. اگر یک بایگانی قدیمی در پلتفرمی متفاوت از جایی که در ابتدا بایگانی شده است دوباره استفاده شود، ممکن است مشکلات عددی در هنگام تبدیل به فرمت‌های باینری ایجاد شود. اگر کارایی مورد توجه خاصی باشد، البته می توان Data Frame ها را قبل از استفاده پردازش کرد و داده ها را به طور موقت به شکل باینری ذخیره کرد. آن ابزارهای مورد نیاز برای تولید مخازن باینری البته باید بایگانی شوند.

منابع

Bunge, M. Scientific Research I: The Search for System ; مطالعات در روش مبانی و فلسفه علم; Springer: برلین، آلمان، 1967. [ Google Scholar ]
Bunge, M. Scientific Research II: The Search for Truth ; مطالعات در روش مبانی و فلسفه علم; Springer: برلین، آلمان، 1967. [ Google Scholar ]
پوپر، KR حدس و گمان ها و ابطال ها: رشد دانش علمی . Routledge & Kegan Paul: نیویورک، نیویورک، ایالات متحده آمریکا، 1963. [ Google Scholar ]
پوپر، ک. دانش عینی: یک رویکرد تکاملی . Clarendon Press: آکسفورد، بریتانیا، 1972. [ Google Scholar ]
Pearce-Moses, R. A Glossary of Archival and Records Terminology ; انجمن آرشیوداران آمریکا (SAA): شیکاگو، IL، ایالات متحده آمریکا، 2005. [ Google Scholar ]
وایت، ا. ایوب، دی. گیلز، اس. لاوری، اس. چالش های سرپرستی در یک گروه تصویربرداری عصبی. بین المللی جی دیجیت. Curation 2008 , 3 , 171-181. [ Google Scholar ] [ CrossRef ]
بالتنسوایلر، دبلیو. Fischlin، A. پروانه جوانه کاج اروپایی در کوه های آلپ. در دینامیک جمعیت حشرات جنگلی: الگوها، علل، پیامدها . بریمن، AA، اد. Plenum Publishing Corporation: نیویورک، نیویورک، ایالات متحده آمریکا، 1988; جلد 1، ص 331-351. [ Google Scholar ]
بالتنسوایلر، دبلیو. Fischlin، A. در مورد روش های تجزیه و تحلیل اکوسیستم ها: درس هایی از تجزیه و تحلیل سیستم های جنگلی-حشره ای. Ecol. گل میخ. 1987 ، 61 ، 401-415. [ Google Scholar ]
فیشلین، ا. Baltensweiler, W. تجزیه و تحلیل سیستم سیستم پروانه جوانه کاج اروپایی. بخش اول: رابطه پروانه جوانه کاج اروپایی و کاج اروپایی. میت شویز. Ent. Ges. 1979 ، 52 ، 273-289. [ Google Scholar ]
روچتی، ج. فیشلین، ا. Strässler، E. DDLDML. Hilfsprogramm für PASCAL Programmierer zur Definition und Verwaltung von INFOSYS-Datenfiles (MANUAL) ; Institut für Phytomedizin ETHZ (vormals Entomologisches Institut ETHZ): زوریخ، سوئیس، 1978. [ Google Scholar ]
کمیته مشورتی سیستم های داده های فضایی و دبیرخانه (CCSDS). مدل مرجع برای یک سیستم اطلاعات بایگانی باز (OAIS)—عمل توصیه شده ؛ CCSDS: واشنگتن، دی سی، ایالات متحده آمریکا، 2012. [ Google Scholar ]
آندره، PQC؛ بسر، اچ. الکینگتون، ن. گرت، جی. گلدنی، اچ. هدستروم، ام. هیرتل، پی بی. هانتر، ک. کلی، آر. کرش، دی. و همکاران حفظ اطلاعات دیجیتال: گزارش کارگروه آرشیو اطلاعات دیجیتال . کمیسیون حفظ و دسترسی و گروه کتابخانه های تحقیقاتی (RLG): نیویورک، نیویورک، ایالات متحده آمریکا، 1996. [ Google Scholar ]
نایت، جی. پنوک، ام. داده های بدون معنی: ایجاد ویژگی های مهم تحقیقات دیجیتال. بین المللی جی دیجیت. Curation 2009 , 4 , 159-174. [ Google Scholar ] [ CrossRef ]
هسو، ال. مارتین، RL; مک الروی، بی. لیتوین میلر، ک. کیم، دبلیو. مدیریت داده‌ها، اشتراک‌گذاری و استفاده مجدد در ژئومورفولوژی تجربی: چالش‌ها، استراتژی‌ها و فرصت‌های علمی ژئومورفولوژی 2015 ، 244 ، 180-189. [ Google Scholar ] [ CrossRef ]
استافورد، N. علم در عصر دیجیتال. Nature 2010 ، 467 ، S19–S21. [ Google Scholar ] [ CrossRef ] [ PubMed ]
بیگری، ن. لاووی، بی. Woolard, M. ایمن نگه داشتن داده های تحقیق 2 ; JISC: سالزبری، بریتانیا، 2010. [ Google Scholar ]
بیگری، ن. Chruszcz, J.; لاووی، بی. ایمن نگه داشتن داده های تحقیقاتی: مدل هزینه و راهنمایی برای دانشگاه های بریتانیا . JISC: سالزبری، انگلستان، آوریل 2008. [ Google Scholar ]
غفلت خوش خیم Deridder، JL: توسعه قایق های نجات برای محتوای دیجیتال. Inf. تکنولوژی Libr 2011 ، 30 ، 71-74. [ Google Scholar ] [ CrossRef ]
کویپرس، تی. ون در هوون، جی. بینش در مورد حفظ دیجیتالی خروجی تحقیقات در اروپا: گزارش نظرسنجی PARSE-Insight D3.6 ; پروژه PARSE.Insight—دسترسی دائمی به سوابق علم در اروپا: Didcot، انگلستان، 2010. [ Google Scholar ]
والر، ام. Sharpe, R. Mind the Gap-Assessing Digital Preservation Needs in the UK ; ائتلاف حفظ دیجیتال (DPC): یورک، بریتانیا، 2006. [ Google Scholar ]
نلسون، بی. اشتراک گذاری داده ها: بایگانی خالی. طبیعت 2009 ، 461 ، 160-163. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Pryor, G. (Ed.) Managing Research Data ; Facet Publishing: لندن، انگلستان، 2012.
آیریس، پ. دیویس، آر. مک لئود، آر. میائو، آر. شنتون، اچ. Wheatley، P. گزارش نهایی پروژه LIFE2 . گزارش نهایی (22/08/08); JISC، کتابخانه بریتانیا، کالج دانشگاه لندن، LIBER: لندن، انگلستان، 2008. [ Google Scholar ]
برتون، ا. Groenewegen، D.; عشق، سی. ترلوار، ا. Wilkinson, R. در دسترس قرار دادن داده های تحقیقاتی در استرالیا. IEEE Intell. سیستم 2012 ، 27 ، 40-43. [ Google Scholar ] [ CrossRef ]
دیویدسون، جی. جونز، اس. مولوی، ال. Kejser، UB روش خوب در حال ظهور در مدیریت داده های تحقیقاتی و اطلاعات تحقیقاتی در دانشگاه های بریتانیا. Proecedia Comput. علمی 2014 ، 33 ، 215-222. [ Google Scholar ] [ CrossRef ]
کویپرس، تی. ون در هوون، جی. بینش در مورد حفظ دیجیتالی خروجی تحقیقات در اروپا: گزارش نظرسنجی PARSE-Insight . گزارش بینش D3.4; پروژه PARSE.Insight—دسترسی دائمی به سوابق علم در اروپا: Didcot، انگلستان، 2009. [ Google Scholar ]
نوروت، اچ. استراتمن، اس. اوسبالد، ا. شفل، آر. کلمپ، جی. Ludwig, J. (Eds.) مدیریت دیجیتال داده های تحقیقاتی – تجربیات یک مطالعه پایه در آلمان ; Verlag Werner Hülsbusch: Glückstadt، آلمان، 2013.
OpenAIRE. برگه‌های اطلاعات OpenAIRE Horizon2020: آزمایشی داده‌های تحقیقاتی باز در Horizon 2020. 2015. در دسترس آنلاین: www.openaire.eu/or-data-pilot-factsheet (در 3 ژوئن 2016 قابل دسترسی است).
پریور، جی. جونز، اس. کالینز، ای. Whyte, A. (Eds.) ارائه خدمات مدیریت داده های پژوهشی: مبانی عملکرد خوب . Facet Publishing: لندن، انگلستان، 2014.
تنوپیر، سی. توس، بی. Allard، S. کتابخانه های آکادمیک و خدمات داده های تحقیقاتی: رویه ها و برنامه های فعلی برای آینده . انجمن کتابخانه‌های کالج و تحقیقات (ACRL): شیکاگو، IL، ایالات متحده آمریکا، 2012. [ Google Scholar ]
تنوپیر، سی. Sandusky، RJ; آلارد، اس. توس، ب. خدمات مدیریت داده های پژوهشی در کتابخانه های پژوهشی دانشگاهی و ادراکات کتابداران. Libr Inf. علمی Res. 2014 ، 36 ، 84-90. [ Google Scholar ] [ CrossRef ]
Palaiologk، AS; Economides، AA; Tjalsma، HD; Sesink، LB یک مدل هزینه‌یابی مبتنی بر فعالیت برای حفظ و انتشار طولانی‌مدت داده‌های تحقیقات دیجیتال: مورد DANS. بین المللی جی دیجیت. Libr 2012 ، 12 ، 195-214. [ Google Scholar ] [ CrossRef ]
کجسر، UB; نیلسن، AB; Thirifays، A. مدل هزینه برای حفظ دیجیتال: هزینه مهاجرت دیجیتال. بین المللی جی دیجیت. Curation 2011 , 6 , 255-267. [ Google Scholar ] [ CrossRef ]
کارلسون، دی. درس به اشتراک گذاری. طبیعت 2011 ، 469 ، 293-293. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Björk، BC; هدلاند، تی. یک مدل رسمی از فرآیند انتشار علمی. اطلاعات آنلاین Rev. 2004 , 28 , 8-21. [ Google Scholar ] [ CrossRef ]
توماس، ا. کمپبل، LM؛ بارکر، پی. هاکسی، ام. (ویرایشگاه) Into the Wild: Technology for Open Educational Resources ; دانشگاه بولتون: بولتون، انگلستان، 2012.
ون دن آیندن، وی. Bishop, L. Sowing the Seed: مشوق ها و انگیزه ها برای به اشتراک گذاری داده های تحقیقاتی، دیدگاه محقق . آرشیو داده‌های بریتانیا، دانشگاه اسکس: اسکس، بریتانیا، 2014. [ Google Scholar ]
چو، اچ. روش های تحقیق در علم کتابداری و اطلاع رسانی: تحلیل محتوا. Libr Inf. علمی Res. 2015 ، 37 ، 36-41. [ Google Scholar ] [ CrossRef ]
تامارو، AM; کازاروسا، وی. مدیریت داده های تحقیق در برنامه درسی: یک رویکرد بین رشته ای. Proecedia Comput. علمی 2014 ، 38 ، 138-142. [ Google Scholar ] [ CrossRef ]
جونز، اس. چگونه یک برنامه مدیریت داده و اشتراک گذاری ایجاد کنیم . DCC چگونه به راهنمای. مرکز مدیریت دیجیتال (DCC): ادینبورگ، اسکاتلند، 2011. [ Google Scholar ]
وربان، ای. کاکس، AM خرده فرهنگ‌های شغلی، مبارزه قضایی و فضای سوم: نظریه‌پردازی پاسخ‌های خدمات حرفه‌ای به مدیریت داده‌های پژوهشی. J. Acad. Libr 2014 ، 40 ، 211-219. [ Google Scholar ] [ CrossRef ]
گودمن، ا. پپه، آ. مسدود کننده، AW؛ بورگمن، CL; کرانمر، ک. کراساس، ام. دی استفانو، آر. گیل، ی. گروت، پ. هدستروم، ام. و همکاران ده قانون ساده برای مراقبت و تغذیه از داده های علمی. محاسبات PLoS. Biol. 2014 ، 10 ، e1003542. [ Google Scholar ] [ CrossRef ] [ PubMed ]
فاستر، NF; Gibbons، S. درک اعضای هیئت علمی برای بهبود جذب محتوا برای مخازن سازمانی. D-Lib Mag. 2005 ، 11 ، 1-12. [ Google Scholar ] [ CrossRef ]
تنوپیر، سی. King, DW کاربرد و ارزش مجلات علمی: گذشته، حال و آینده. سریال های 2001 ، 14 ، 113-120. [ Google Scholar ] [ CrossRef ]
تنوپیر، سی. کینگ، DW; اسپنسر، جی. وو، ال. تغییرات در الگوهای جستجوی مقاله و خواندن دانشگاهیان: چه چیزی تفاوت را ایجاد می کند؟ Libr Inf. علمی Res. 2009 ، 31 ، 139-148. [ Google Scholar ] [ CrossRef ]
مورو، تی. بیگری، ن. جونز، ام. Chruszcz, J. A Comparative Study of E-Journal Archiving Solutions ; کمیته مشترک سیستم های اطلاعاتی (JISC): بریستول، انگلستان، 2008. [ Google Scholar ]
Sutter، RD; Wainscott، SB; Boetsch, JR; پالمر، سی جی; Rugg, DJ راهنمای عملی برای ادغام مدیریت داده ها در پروژه های بلندمدت نظارت بر محیط زیست. Wildl. Soc. گاو نر 2015 ، 39 ، 451-463. [ Google Scholar ] [ CrossRef ]
والدراپ، ام ام منشا محاسبات شخصی. علمی صبح. 2001 ، 285 ، 84-91. [ Google Scholar ] [ CrossRef ] [ PubMed ]
ترلوار، ا. Harboe-Ree, C. مدیریت داده و پیوستار سرپرستی: چگونه تجربه موناش روابط مخزن را اطلاع رسانی می کند. در مجموعه مقالات چهاردهمین انجمن ویکتوریا برای اتوماسیون کتابخانه، کنفرانس و نمایشگاه، ملبورن، VIC، استرالیا، 5-7 فوریه 2008.
Treloar, A. Private Research, Shared Research, Publication, and the Boundary Transitions, Version 1.4.3, 19 Mar 2012. موجود آنلاین: andrew.treloar.net (در 8 ژوئن 2016 قابل دسترسی است).
CCSDS. سیستم‌های انتقال اطلاعات و داده‌های فضایی—سیستم اطلاعات بایگانی باز (OAIS)—مدل مرجع ; ISO 14721:2012; کمیته مشورتی برای سیستم های داده های فضایی و سازمان بین المللی استاندارد (ISO): ژنو، سوئیس، 2012. [ Google Scholar ]
Bongulielmi، AP; Cellier، FE در مورد سودمندی گرامرهای قطعی برای زبان های شبیه سازی. ACM SIGSIM Simul. دایجست 1984 ، 15 ، 14-36. [ Google Scholar ] [ CrossRef ]
زومشتاین، پی. Stöhr, M. Zur Nachnutzung von bibliographischen Katalog- und Normdaten für die persönliche Literaturverwaltung und Wissensorganisation. ABI Tech. 2015 ، 35 ، 210-221. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
زایگلر، BP پنج عنصر. در نظریه مدلسازی و شبیه سازی ، ویرایش اول. رابرت، ای.، اد. Krieger Publishing Company Inc.: Malabar, FL, USA, 1976; ص 27-49. [ Google Scholar ]
زیگلر، بی پی مدلسازی چند فرمالیسم چندسطحی: یک نمونه اکوسیستم. در اکولوژی سیستم های نظری ; Halfon, E., Ed. مطبوعات آکادمیک: نیویورک، نیویورک، ایالات متحده آمریکا، 1979; صص 17-54. [ Google Scholar ]
زایگلر، نظریه مدل سازی و شبیه سازی BP ، ویرایش اول. رابرت، ای.، اد. Krieger Publishing Company Inc.: Malabar, FL, USA, 1976. [ Google Scholar ]
وای مور، نظریه سیستم های AW. در کتابچه راهنمای مهندسی نرم افزار ; Vick, CR, Ramamoorthy, CV, Eds. شرکت Van Nostrand Reinhold: نیویورک، نیویورک، ایالات متحده آمریکا، 1984; صص 119-133. [ Google Scholar ]
Fischlin، A. مدل سازی تعاملی و شبیه سازی سیستم های محیطی در ایستگاه های کاری. در تجزیه و تحلیل سیستم های پویا در پزشکی، زیست شناسی و اکولوژی ؛ Möller, DPF, Richter, O., Eds. Springer: برلین، آلمان، 1991; جلد 275، صص 131–145. [ Google Scholar ]
Nemecek، T. نقش رفتار شته در اپیدمیولوژی ویروس Y سیب زمینی: یک مطالعه شبیه سازی . دیس. ETH شماره 10086; موسسه فناوری فدرال سوئیس: زوریخ، سوئیس، 1993. [ Google Scholar ]
آندرولاکیس، س. سگک، AM; اتکینسون، آی. Groenewegen، D.; نیکلاس، ن. ترلوار، ا. Beitz، A. ARCHER – ابزارهای تحقیق الکترونیکی برای مدیریت داده های تحقیق. بین المللی جی دیجیت. Curation 2009 , 4 , 22-33. [ Google Scholar ] [ CrossRef ]
کانکل، آر. سورگ، ج. کلدیتز، او. رینک، ک. کلمپ، جی. گاشه، آر. Neidl, F. TEODOOR – یک زیرساخت داده مکانی برای داده های رصد زمینی. در مجموعه مقالات دهمین کنفرانس بین المللی IEEE 2013 در مورد شبکه، سنجش و کنترل (ICNSC)، Evry، فرانسه، 10-12 آوریل 2013. ص 242-245.
استفن، WL; واکر، BH; اینگرام، تغییر جهانی JSI و اکوسیستم های زمینی: برنامه عملیاتی . گزارش تغییرات جهانی شماره 21; برنامه بین المللی ژئوسفر-زیست کره (IGBP): استکهلم، سوئد، 1992. [ Google Scholar ]
GCTE – تغییرات جهانی و اکوسیستم های زمینی. موجود به صورت آنلاین: www.igbp.net/researchprojects/igbpcoreprojectsphaseone/globalchangeandterrestrialecosystems.4.1b8ae20512db692f2a680009018.html (در 3 ژوئن 2016 قابل دسترسی است).
Seitzinger، SP; گافنی، او. براسور، جی. برودگیت، دبلیو. سیایس، پی. کلاوسن، ام. اریسمن، جی دبلیو. کیفر، تی. لانسلوت، سی. راهبان، PS; و همکاران برنامه بین المللی ژئوسفر-زیست کره و علم سیستم زمین: سه دهه تکامل مشترک Anthropocene 2015 ، 12 ، 3-16. [ Google Scholar ] [ CrossRef ]

شکل 1. سازمان آرشیو گروه بوم‌شناسی سیستم‌های زمینی با دو مخزن یکسان (مستطیل سمت چپ) در دو ساختمان مختلف که هر کدام شامل مجموعه‌ای یکسان از مدخل‌های بایگانی (خاکستری) است. در هر ورودی بایگانی (AE، خاکستری) متا داده ها حاوی توضیحات ورودی مربوطه بایگانی (AEDescr، قرمز) مشخص شده است. برای هر ورودی بایگانی، دومی (قرمز) نیز به صورت اضافی در یک فهرست جهانی که در یک سرور مرکزی (سیلندر) قرار دارد برای اهداف دسترسی همراه با توضیحات رسانه مربوطه (AEMedium، آبی) ذخیره می‌شود. همه فایل‌های متا داده (قرمز، آبی)، از جمله فهرست جهانی، عمداً فقط فایل‌های متنی ساده ASCII هستند (نمونه‌هایی در ضمیمه شکل A1 و شکل A2 ، برای توضیحات بیشتر به متن مراجعه کنید).

شکل 2. انتقال بین حوزه های curation در طول چرخه عمر داده های تحقیق، بر اساس شکل Data Curation Continuum توسط Andrew Treloar [ 50 ].

شکل 3. اطلاعات موجود در یک Content Object تنها زمانی قابل دسترسی است که هم خود شیء داده و هم هر گونه اطلاعات نمایشی که بر آن تکیه دارد در دسترس باشد.

شکل 4. نمونه ای از داده های ذخیره شده به عنوان قاب های داده ای به دنبال دستور DTF ( به شکل A7 در پیوست A.3 مراجعه کنید ). نحو DTF اجازه می دهد تا داده های متا را وارد کنید و در هر جایی از فایل به عنوان نظر مداخله کنید. اینها می‌توانند برای افزودن حداقل متا داده به داده‌های واقعی ( بالا )، یعنی صرفا ارجاع دادن به سایر مؤلفه‌های حیاتی با ارزش بایگانی، مانند انتشار جداگانه به آرشیو ( ر.ک. بخش 4.1 )، یا به جای اسناد طولانی و مستقل استفاده شوند. پایین ).

شکل 5. اشتراک گذاری از طریق پایگاه داده مرکزی

L i t C e n t r a l

داده های متا در مجموعه های انتشارات شخصی (

L i t M Y_{a}

L i t M Y_{b}

…) در میان محققین a , b , … متعلق به همان تیم تحقیقاتی. سابقه ارجاع به یک کار علمی، به عنوان مثال، یک مقاله مجله، می تواند در چندین نسخه توزیع شده در سراسر سیستم وجود داشته باشد. با این حال، فقط رکوردهای سبز رنگ اصلی هستند و دارای مجوز نوشتن هستند، در حالی که هر کپی اضافی که خارج از سیستم پایگاه داده شخصی استفاده می شود.

L i t M Y a

همانطور که توسط محقق a استفاده می شود، یک کپی فقط خواندنی است (رنگ قرمز اگر در حوزه محقق دیگری باشد، نارنجی اگر در دامنه خود محقق به عنوان گزیده ای برای یک پروژه خاص مانند پروژه کاغذی استفاده شود). برای خواندن راحت، هر محققی معمولاً رکوردها را همیشه به یک مخزن اسناد شخصی، معمولاً یک مخزن PDF، پیوند می‌دهد، در حالی که احتمالاً از چندین دستگاه در دامنه شخصی استفاده می‌کند، مثلاً دامنه A (در اینجا فرض می‌کنیم که دستگاه‌ها می‌توانند به خوبی در دامنه مربوطه همگام شوند) برای توضیحات بیشتر به متن مراجعه کنید).

شکل 6. نمودار جریانی که قوانین ساده ای را نشان می دهد که محقق x باید هنگام افزودن آثار علمی جدید به سیستم پیشنهادی در اینجا رعایت کند ( شکل 5 را ببینید ). در اینجا فرض بر این است که این کار در دامنه A از محقق a (به اختصار “AF”) با استفاده از برنامه منبع باز BibDesk و برای

L i t A F

پایگاه داده FileMaker (برای توضیحات بیشتر به متن مراجعه کنید).

شکل 7. چرخه تحقیق ساخت تئوری شامل توسعه مدل، آزمایش های شبیه سازی، و تجزیه و تحلیل داده ها با پالایش گام به گام. جعبه‌های آبی نشان‌دهنده موجودیت‌هایی هستند – شامل داده‌ها و مدل‌هایی – که باید به منظور مدیریت معنی‌دار آرشیو شوند، به عنوان مثال، استفاده مجدد از مدل‌ها. اگر به‌درستی بایگانی شوند، مدل‌ها می‌توانند نتایج شبیه‌سازی را که بایگانی نشده‌اند، مجدداً محاسبه کنند، مثلاً به دلیل اندازه. برای آزمایش فعال‌سازی مجدد یک مدل، بایگانی باید داده‌های مورد نیاز برای آزمایش‌های شبیه‌سازی ویژه را نیز نگهداری کند که تلاش می‌کنند خروجی مرجع نیز بایگانی‌شده را بازتولید کنند و بدین وسیله از قابلیت استفاده مجدد مدل مطمئن اطمینان حاصل شود (متن را ببینید).

شکل 8. نمونه ای از یک مدل شبیه سازی برای یک مدل ریاضی ساده، به عنوان مثال ، معادله رشد لجستیک

\dot{x} (t) = a x (t) - b x {(t)}^{2}

، با استفاده از Data Frames ( شکل 9 ) برای نیازهای داده خود. چنین رویکردی مزایای قرار گرفتن در مدل شبیه‌سازی بسیار نزدیک به شکل ریاضی مدل نظری ( شکل 7 ) را ارائه می‌کند، در حالی که به طور همزمان انعطاف‌پذیری را ارائه می‌دهد و کارکرد را تسهیل می‌کند.

شکل 9. نمونه ای از یک چارچوب داده استفاده شده در مدل سازی معادله لجستیک ( شکل 8 ) که پارامترهای مدل r و K را ارائه می دهد . این جداسازی داده ها از مدل، انعطاف پذیری را برای شبیه ساز ارائه می دهد (به متن مراجعه کنید).

© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب