خلاصه
وب حسگر جهانی شامل داده های مشاهداتی از منابع مختلف است. هر ارائهدهنده دادهها ممکن است قبل از در دسترس قرار دادن مجموعهدادهها بهصورت متفاوتی پردازش و ارزیابی کند. این اطلاعات اغلب برای کاربران نهایی نامرئی است. بنابراین، انتشار دادههای مشاهداتی با توضیحات با کیفیت حیاتی است، زیرا به کاربران کمک میکند تا مناسب بودن دادهها را برای برنامههای خود ارزیابی کنند. همچنین مهم است که اطلاعات متنی مربوط به کیفیت دادهها مانند منشأ را برای ردیابی دادههای نادرست به منشأ آن دریافت کنید. در چارچوب فعال سازی وب حسگر (SWE) کنسرسیوم فضایی باز (OGC)، هیچ رویکردی به اندازه کافی و عملاً قابل اجرا وجود ندارد که چگونه این جنبه ها به طور سیستماتیک نمایش داده شوند و در دسترس قرار گیرند. این مقاله Q-SOS را ارائه می کند – یک توسعه OGC’ سرویس مشاهده حسگر (SOS) که از بازیابی داده های مشاهده همراه با توضیحات کیفیت پشتیبانی می کند. این توصیفات در یک مدل داده های مشاهده ای نشان داده شده اند که جنبه های مختلف ارزیابی کیفیت داده ها را پوشش می دهد. این سرویس و مدل داده بر اساس استانداردهای باز و ابزارهای منبع باز توسعه یافته اند و به طور مؤثری برای به اشتراک گذاشتن داده های مشاهده از زیرساخت رصدخانه TERENO استفاده می شوند. ما در مورد مزایای استقرار راه حل های ارائه شده از دیدگاه ارائه دهنده داده و مصرف کننده بحث می کنیم. پیشرفتهای اعمال شده در توسعههای منبع باز مرتبط نیز معرفی شدهاند. این سرویس و مدل داده بر اساس استانداردهای باز و ابزارهای منبع باز توسعه یافته اند و به طور مؤثری برای به اشتراک گذاشتن داده های مشاهده از زیرساخت رصدخانه TERENO استفاده می شوند. ما در مورد مزایای استقرار راه حل های ارائه شده از دیدگاه ارائه دهنده داده و مصرف کننده بحث می کنیم. پیشرفتهای اعمال شده در توسعههای منبع باز مرتبط نیز معرفی شدهاند. این سرویس و مدل داده بر اساس استانداردهای باز و ابزارهای منبع باز توسعه یافته اند و به طور مؤثری برای به اشتراک گذاشتن داده های مشاهده از زیرساخت رصدخانه TERENO استفاده می شوند. ما در مورد مزایای استقرار راه حل های ارائه شده از دیدگاه ارائه دهنده داده و مصرف کننده بحث می کنیم. پیشرفتهای اعمال شده در توسعههای منبع باز مرتبط نیز معرفی شدهاند.
کلید واژه ها:
کنترل کیفیت ؛ ارزیابی کیفیت داده ها ; منشأ ؛ وب سنسور ; خدمات مشاهده سنسور ; رصدخانه های محیطی ; TERENO
1. معرفی
وب حسگر زیرساختی است که شامل حسگرهای قابل دسترسی وب از ارائه دهندگان مختلف است. ماهیت باز وب به این معنی است که جمع آوری، پردازش و تحویل داده ها معمولاً به شیوه ای توزیع شده و مستقل انجام می شود [ 1 ]. هر یک از ارائه دهندگان داده ممکن است قبل از انتشار آنلاین، کیفیت مجموعه داده ها را به طور متفاوتی پردازش و ارزیابی کنند. هدف کنترل کیفیت (qc) اندازهگیری و کنترل کیفیت دادهها بهگونهای است که نیازهای کاربران را برآورده کند [ 2 ]، مانند کمی کردن عدم قطعیتها در دادهها و تشخیص دادههای نادرست بهگونهای که ممکن است اصلاح یا پرچمگذاری شوند. . فرآیند qc را می توان قبل، در طول یا بعد از ایجاد مجموعه داده ها پیاده سازی کرد [ 3]. این مقاله بر ارزیابی کیفیت داده های مشاهده تمرکز دارد، کنترلی که پس از تولید داده ها انجام می شود. به عنوان مثال، در یک سری داده های سطح آب تولید شده توسط یک گیج جریان، ممکن است مقادیری از دست رفته به دلیل عملکرد نادرست لاگر، سنبله های اشتباه، یا مقادیر فراتر از آستانه قابل قبول وجود داشته باشد. این اندازهگیریهای تحتتاثیر باید تأیید شده و بر این اساس علامتگذاری شوند. در حالی که ارزیابی کیفیت داده ها بر شناسایی و رفع نقص های داده تأکید دارد، اغلب به اطلاعات زمینه ای برای پشتیبانی از فرآیند نیاز دارد. این توصیفات به اصطلاح منشأ یا اصل و نسب، فرآیندها و نهادهای دخیل در جمع آوری و پردازش داده ها را پوشش می دهد. به عنوان مثال، یک پرچم با کیفیت ساده (“مشکوک”) اطلاعات کافی در مورد مشکلات در تخلیه محاسبه شده را منتقل نمی کند. ممکن است بخواهیم بدانیم چه کسی داده ها را پرچم گذاری کرده و از کدام منحنی های رتبه بندی برای محاسبه داده ها استفاده شده است. همه این جنبهها نشان میدهند که دادههای مشاهده باید با اطلاعات مربوطه همراه باشد که توضیح دهد چگونه مقادیر آنها تولید، ارزیابی و مشتق شدهاند. این به مصرفکنندگان دادهها امکان میدهد تا محصولات داده را بهتر تفسیر کنند و مجموعه دادههایی را انتخاب کنند که مناسبتر با کاربردهایشان باشد. ارائهدهندگان دادهها میتوانند از این اطلاعات برای تأیید اینکه چگونه مجموعه دادههایشان معیارهای تعیینشده در یک برنامه مدیریت داده را برآورده میکنند، و برای رسیدگی به سؤالات فعلی و آتی در مورد تغییرات داده استفاده کنند. این به مصرفکنندگان دادهها امکان میدهد تا محصولات داده را بهتر تفسیر کنند و مجموعه دادههایی را انتخاب کنند که مناسبتر با کاربردهایشان باشد. ارائهدهندگان دادهها میتوانند از این اطلاعات برای تأیید اینکه چگونه مجموعه دادههایشان معیارهای تعیینشده در یک برنامه مدیریت داده را برآورده میکنند، و برای رسیدگی به سؤالات فعلی و آتی در مورد تغییرات داده استفاده کنند. این به مصرفکنندگان دادهها امکان میدهد تا محصولات داده را بهتر تفسیر کنند و مجموعه دادههایی را انتخاب کنند که مناسبتر با کاربردهایشان باشد. ارائهدهندگان دادهها میتوانند از این اطلاعات برای تأیید اینکه چگونه مجموعه دادههایشان معیارهای تعیینشده در یک برنامه مدیریت داده را برآورده میکنند، و برای رسیدگی به سؤالات فعلی و آتی در مورد تغییرات داده استفاده کنند.4 ].
چارچوب SWE OGC [ 5 ] دسترسی یکپارچه به حسگرهای تحت وب، توضیحات آنها و دادههای مشاهده را از طریق رابطهای سرویس استاندارد شده امکانپذیر میسازد. مدل مشاهدات و اندازهگیریها (O&M) به استاندارد پیچیده ISO19139 ( http://www.iso.org/iso/catalogue_detail.htm?csnumber=32557 ) برای ارائه اطلاعات با کیفیت اشاره دارد، هرچند نمونههای مرتبط یا پیادهسازی وجود ندارد. در واقع، سرال و ماسو این مکانیسم را بسیار ابتدایی می دانند و نیاز به بررسی بیشتر دارد [ 6 ]]. به طور خاص، مشخص نیست که چگونه جنبههای مختلف کیفیت داده (به عنوان مثال، پرچمها و سطوح کیفیت) مرتبط با برنامههای حسگر مختلف را میتوان در رابطه با مفاهیم مشاهده موجود نشان داد، و سپس از طریق سرویس استاندارد برای کاربران در دسترس قرار گرفت. چندین پروژه Sensor Web وجود دارد که بر کیفیت داده ها تمرکز دارد. با این وجود، به بهترین دانش نویسندگان، ادغام اطلاعات ارزیابی کیفیت دادههای محیطی ناهمگن در وب حسگر هنوز به طور کامل محقق نشده است. به عنوان مثال، برخی از رویکردها [ 7 ، 8 ، 9 ] در درجه اول به معیارهای کیفیت و عدم قطعیت داده های مشاهده می پردازند. دیگران [ 10 ، 11 ، 12] توصیفات ارزیابی دادهها را تا حدی در یک سطح بسیار کلی ثبت میکند یا به کاربردهای سنجش خاص محدود میشود. برای مثالهای بیشتر، بخش 2.3 را ببینید .
در این مقاله، ما راهحلهایی (یک سرویس دسترسی به دادههای مشاهدهای و یک مدل داده) برای ادغام اطلاعات در مورد ارزیابی کیفیت دادهها در وب حسگر ارائه میکنیم. Q-SOS توسعهای از سرویس مشاهده حسگر OGC (SOS) است که امکان بازیابی دادههای مشاهده همراه با ارزیابی کیفیت و توصیفهای متنی مرتبط را فراهم میکند. این توصیفات در یک مدل داده ای ارائه شده است که از مدل داده مشاهدات CUAHSI (کنسرسیوم دانشگاه ها برای پیشرفت علم هیدرولوژیک) (CUAHSI-ODM) [ 13 ] گسترش یافته است. یکی از جنبه های مهم در مدل سازی کیفیت داده ها، دانه بندی است، به عنوان مثالسطح جزئیاتی که در آن اطلاعات کیفی داده های مشاهده مشخص می شود، به عنوان مثال، در یک لحظه زمانی یا یک بازه زمانی برای یک سری زمانی معین، یا مجموعه ای از چندین سری داده. جزئیات داده ها ممکن است منوط به زمینه استفاده باشد. به عنوان مثال، در عمل مشاهده سطحی، دانه بندی داده های کنترل شده با کیفیت مورد نیاز بسته به کاربردها متفاوت است، به عنوان مثال دقیقه برای هوانوردی، ساعت برای کشاورزی، و روز برای توصیف آب و هوا [ 14 ].]. برای مثال دیگر، حداقل ثبت ساعتی از یک ایستگاه هواشناسی برای شناسایی وقوع کولاک در یک ایستگاه مورد نیاز است. در زمینه سرورهای SOS، اطلاعات کیفیت را می توان در یک فایل SensorML در صورتی که کل فرآیند سنجش را ارجاع می دهد یا در یک سند O&M اگر برای مقادیر اندازه گیری اعمال می شود، مشخص کرد. مدل داده ما هر دو سطح دانه بندی را در نظر می گیرد. ما توصیفگرهای کیفیت را در سطح اندازهگیریهای فردی نشان میدهیم، در حالی که اطلاعات متنی مرتبط (به عنوان مثال، عملیات و نگهداری سنسورها و کنترل دسترسی) در سطح سنسورها ارائه میشوند.
نسخه های اولیه سرویس و مدل داده به عنوان اجزای چارچوب مشترک کنترل کیفیت داده که در [ 15 و 16 توضیح داده شده است، معرفی شده اند.]. این مقاله حاوی مطالب جدید و اصلاح شده ای است که قبلاً منتشر نشده بود. اول، شامل مقایسه رویکردهای موجود برای برقراری ارتباط اطلاعات با کیفیت در وب حسگر است. دوم، بهبودهای اعمال شده در سرویس و مدل داده را پوشش می دهد. به عنوان مثال، مدل داده برای جمع آوری اطلاعات متنی، به عنوان مثال، عملیات و نگهداری، توضیحات پردازش، کنترل دسترسی، و واژگان کنترل شده گسترش یافته است (زیر بخش 4.1). این مقاله همچنین توضیح میدهد که چگونه این سرویس نه تنها برای جمعآوری نتایج ارزیابی دادهها و فرادادههای آنها، بلکه برای پشتیبانی از درخواستهای داده بر اساس فیلترهای کیفیت، بهبود یافته است. علاوه بر این، شرحی از خدمات پشتیبانی ایجاد شده است (به عنوان مثال، یک سرویس پردازش وب) نیز گنجانده شده است. در نهایت، این مقاله همچنین شامل نتایج با استفاده از مؤلفههای توسعهیافته برای ارزیابی و انتشار دادههای مشاهدات باز از رصدخانههای محیطی زمینی (TERENO) است [ 17 ].
مقاله به روش زیر سازماندهی شده است: بخش 2 کار مرتبط را مورد بحث قرار می دهد و بخش 3 زیرساخت داده های مکانی TERENO را معرفی می کند. در ادامه توضیحاتی در مورد طراحی و اجرای راه حل ها در بخش 4 ارائه می شود . بخش 5 با مشارکت راه حل های توسعه یافته و کارهای آینده به پایان می رسد.
2. مفاهیم اساسی و کارهای مرتبط
این بخش مفاهیم اساسی مورد استفاده در این مقاله را ارائه می دهد و مقایسه ای از کار مرتبط در توسعه خدمات آگاه از کیفیت برای وب حسگر ارائه می دهد.
2.1. چارچوب فعال سازی وب سنسور OGC (SWE).
چارچوب SWE شامل مدلهای خدمات و اطلاعات برای پشتیبانی از کشف و دسترسی به حسگرها و دادههای آنها در وب است [ 5 ]. مدل سرویس به مجموعهای از مشخصات سرویس وب اشاره دارد، در حالی که مدل اطلاعات شامل مدلهای مفهومی و رمزگذاریهای XML است. این مقاله بر روی سرویس مشاهده حسگر (SOS) [ 18 ]، یک ویژگی استاندارد رابط سرویس وب برای دسترسی مبتنی بر کشش به دادههای مشاهده متمرکز است. این بدان معنی است که سرویس گیرندگان SOS می توانند درخواست های اطلاعاتی را به سرورهای SOS (معمولاً از طریق وب) ارسال کنند تا داده های مشاهداتی خاص را بازیابی کنند. رابط اصلی مشخصات شامل سه عملیات اساسی است. ابتدا، توضیحات یک سرویس با GetCapabilities درخواست می شودعملیات، سپس فراداده حسگر را می توان با عملیات DescribeSensor بازیابی کرد و در نهایت مجموعه داده های مشاهده توسط پارامترهای فیلتر با عملیات GetObservation قابل دسترسی هستند . خروجی های این عملیات به ترتیب اسناد با فرمت XML مانند پاسخ GetCapabilities و همچنین زبان مدل حسگر (SensorML) [ 19 ] و اسناد O&M [ 20 ] هستند. مدل داده O&M مفاهیم اساسی مشاهده را نشان میدهد و برای تفسیر دادههای مشاهدهای که توسط یک سرور SOS بازگردانده میشود، استفاده میشود. مدل مشاهده را به عنوان یک رویداد تعریف می کند که نتیجه آن (مثلاً 12.8 درجه سانتیگراد) تخمینی از مقدار یک پدیده (مثلاً دمای آب سطحی) از یک ویژگی مورد علاقه است.(به عنوان مثال، دریاچه ایری)، به دست آمده با استفاده از یک روش مشخص (به عنوان مثال، شناور حسگر). همچنین نشان می دهد که یک مقدار نتیجه را می توان با یک resultQuality مرتبط کردکه به عناصر کیفیت تعریف شده در استاندارد ISO19139 اشاره دارد. با این حال، برای الزامات ناشی از موارد استفاده ما (به عنوان مثال، ارائه پرچمهای با کیفیت که دامنههای مختلف را پوشش میدهد) مدل ISO مناسب نیست زیرا در نظر گرفته شده است که اطلاعات کیفی بسیار پیچیدهتری را پوشش دهد. انتخاب ها همچنین تا حدی تحت تأثیر تجربه پروژه های دیگر قرار گرفتند که نیاز به ورود فراداده های دقیق برای توصیف اطلاعات کیفیت با مدل ISO داشتند. ما تصمیم گرفتیم بر خلاف مدل ISO با پیچیدگی ذاتی از یک رویکرد ساده و عملی پیروی کنیم. از آنجایی که هدف ما نمایش جنبه های مختلف ارزیابی کیفیت داده است، مدل داده خود را بر اساس CUAHSI-ODM توسعه می دهیم. برای پیاده سازی خود، ما به نماهای پایگاه داده تکیه می کنیم تا مدل داده خود را با مدل استاندارد O&M مرتبط کنیم (به بخش 4.2 مراجعه کنید.).
2.2. توصیفگرهای کیفیت
دو توصیفگر کیفیت اصلی وجود دارد که توسط سرویس توسعهیافته پشتیبانی میشوند: سطوح پردازش داده و پرچمهای کیفیت داده. سطوح پردازش داده ها وضعیت متفاوتی از مدیریت داده ها را نشان می دهد. به عنوان مثال، سطح 1 شامل داده های خام است، سطح 2 به داده های پرچم گذاری شده اشاره دارد، در حالی که سطح بعدی داده های مشتق شده را پیشنهاد می کند. چندین طبقهبندی از سطوح دادههای دادههای محیطی وجود دارد که توسط سیستم مشاهده زمین (EOS) محصول داده استاندارد (SDP) ( http://nsidc.org/data/icebridge/eos_level_definitions.html )، کنسرسیوم دانشگاهها برای پیشرفت علوم هیدرولوژیکی (CUAHSI) ( http://his.cuahsi.org/ )، مرکز موضوعی جوی ( https://icos-atc-demo.lsce.ipsl.fr/node/34 ) و Earthscope (http://www.earthscope.org/science/data/access/ ). در حالی که هر یک از ارائه دهندگان داده ممکن است سطوح داده خود را داشته باشند، سطوح پردازش داده ما ساده نگه داشته می شود، اما با عملکرد سایر سیستم های داده سازگار است (به بخش 4.1 مراجعه کنید ).
پرچم گذاری روشی برای افزودن یک برچسب کیفیت به یک مقدار مشاهده است. پرچمهای کیفیت داده حاکی از نتیجه یک آزمون کیفیت است که ممکن است توسط رایانه (به عنوان مثال، روشهای ارزیابی خودکار) یا توسط انسان (مثلاً بازرسیهای بصری) تولید شده باشد. پرچمهای کیفیت در واژگان رایجی که به کیفیت دادهها میپردازند، به عنوان مثال، QualityML [ 21 ]، یا در طرحهای پرچم داده، به عنوان مثال، کدهای کیفیت آزمایش گردش اقیانوس جهانی (WOCE) برای نمونهبرداری آب تعریف شدهاند [ 22 ]. برخی از طرحهای پرچم کیفیت فهرستهای تک سطحی هستند و کیفیت کلی داده را نشان میدهند، به عنوان مثال، OceanSITES ( www.oceansites.org/docs/oceansites_user_manual_version1.2.doc )، پرچمهای کیفیت داده COS ( http://www.stsci.edu/) hst/cos/pipeline/cos_dq_flags) و SeaDataNet ( http://www.seadatanet.org/Standards-Software/Data-Quality-Control ). سایر طرح های پرچم گذاری از دو سطح تشکیل شده است. در اینجا، سطح اولیه شامل پرچمهای عمومی، به عنوان مثال، خوب، ارزیابی نشده، مشکوک و بد است. سطح ثانویه برای کاربرد خاص است و پرچمهای سطح اولیه را با نشان دادن (i) نتایج آزمایشهای کیفیت فردی اعمال شده، به عنوان مثال، بررسی گرادیان ناموفق، گسترش میدهد. یا (ii) تاریخچه پردازش داده، به عنوان مثال، مقادیر درونیابی. یا (iii) رویدادهای پسزمینه که بر مقادیر دادهها تأثیر میگذارند، بهعنوان مثال، رویداد یخی. در زمینه TERENO، ما به یک پرچم کیفیت مشترک و مستقل از دامنه نیاز داریم که بتواند توسط برنامههای حسگر مختلف استفاده شود. بنابراین، به دنبال [ 23 ]، ما یک طرح پرچم دو سطحی را اتخاذ کردیم (به بخش 4.1 مراجعه کنید ).
2.3. خدمات مشاهده سنسور فعال با کیفیت موجود
جدول 1 رویکردهای موجود برای انتقال اطلاعات با کیفیت در وب حسگر را خلاصه می کند. توجه داشته باشید که بحث زیر حول محور SOS است. سایر خدمات استاندارد OGC، اگرچه توسط این رویکردها پشتیبانی می شوند، در اینجا پوشش داده نمی شوند.
چندین پروژه به جنبه های مختلف کیفیت داده می پردازند. با این وجود، ادغام اطلاعات ارزیابی داده ها در وب حسگر به طور کامل انجام نشده است. برای مثال، UncertWeb [ 9 ] و INTAMAP [ 7 ] را در نظر بگیرید، که عمدتاً بر عدم قطعیت دادههای مشاهده تمرکز میکنند. یک استثنا برای تعمیم فوق، پروژه Sensors Anywhere (SANY) است [ 24]، که یک معماری خدمات حسگر باز (SensorSA) را برای پشتیبانی از توسعه کاربردهای محیطی مبتنی بر حسگر ایجاد می کند. معماری بر سه جنبه کیفیت (عدم قطعیت، اندازهگیری و فرآیند آمادهسازی داده، و تضمین کیفیت) تمرکز دارد و پیشنهاد میکند که بسته به جزئیات اطلاعات، این جنبهها را میتوان در یک SensorML یا در یک سند O&M مشخص کرد. در حالی که اجرای جنبه اول با رمزگذاری اطلاعات عدم قطعیت با UncertML نشان داده می شود، جنبه دوم زمینه اندازه گیری وجود ندارد. شباهت بین SANY و رویکرد ما این است که هر دو توصیفگرهای کیفیت را در سطح اندازهگیریهای فردی نشان میدهند تا بتوانند مستقیماً توسط برنامههای مشتری مورد استفاده قرار گیرند. با این حال، رویکرد قبلی فقط ابرداده های یک نوع توصیفگر کیفیت (پرچم های کیفیت) را مشخص می کند. قرارداد پرچم کیفیت قابل توسعه نیست و در نتیجه نمی تواند با داده های برنامه های سنجش مختلف مرتبط شود. در مقابل، رویکرد ما از بیش از یک توصیفگر کیفیت و یک طرح پرچم دو سطحی پشتیبانی میکند. سرویس مشاهده SANY ازروشی برای نمایش سطوح پردازش داده ها، به عنوان مثال، داده های خام و داده های ارزیابی شده به طور خودکار . در حالی که یک فعالیت پردازش داده به خودی خود می تواند از نظر مفهومی به عنوان یک رویه در نظر گرفته شود ، نشان داده نشده است که چگونه این کار با حسگرها و پیشنهادات واقعی در پیاده سازی مرتبط است. توجه داشته باشید که در مشخصات O&M، یک رویه می تواند یک ابزار، یک الگوریتم یا فرآیندی باشد که در تخمین مقدار یک ویژگی مشاهده شده دخیل است. پروژه EO2HEAVEN [ 8] بر هر سه جنبه کیفی که توسط SANY مشخص شده است، تأکید می کند. با این حال، مشخصات آن تنها بازنمایی عدم قطعیت دادهها را که از SANY اقتباس شدهاند را پوشش میدهد. به طور کامل مشخص نشده است که چگونه جزئیات کیفیت با زمینه های اندازه گیری مرتبط می شوند تا از اعتبارسنجی داده ها پشتیبانی کنند. همچنین لازم به ذکر است که پروژه FP7 اروپا EO2HEAVEN به توسعه Sensor Web Client ( http://52north.org/communities/sensorweb/clients/SensorWebClient/ ) و SOS 52°North ( http://) کمک کرده است. پروژه 52north.org/communities/sensorweb/sos/ ). ما سرویس گیرنده را توسعه داده ایم و آن را با سرویس توسعه یافته اعمال کرده ایم (به ابزار بازرسی داده ها در بخش 4.3 مراجعه کنید).
برخی از رویکردها تا حدی اطلاعات ارزیابی کیفیت را مدیریت می کنند. به عنوان مثال، NOAA یکپارچه سیستم رصد اقیانوس (IOOS) [ 25 ، 26 ] دسترسی متقابل به داده های اقیانوس شناسی از منابع مختلف را فراهم می کند. مشابه رویکرد ما، سرویس مشاهده حسگر آنها ( http://sdf.ndbc.noaa.gov/sos/) پیاده سازی بر اساس پیاده سازی مرجع SOS 52 درجه شمالی است. در میان ویژگیهای مشاهدهشده پشتیبانیشده توسط این سرویس، تنها اندازهگیریهای جریان اقیانوسی با مجموعهای از نه پرچم کیفیت همراه است (به عنوان مثال، 0 نشاندهنده کیفیت ارزیابی نشده و 1 نشاندهنده یک تست کیفیت ناموفق است) که نتایج آزمایشهای کیفیت را نشان میدهد. با این وجود، فراداده این پرچم ها در پاسخ گنجانده نشده است. بنابراین، نمی توان جزئیات کیفیت را تفسیر کرد. ما فراداده توصیفگرهای کیفیت را در همان سند O&M قرار می دهیم که مقادیر مشاهده شده را برمی گرداند. علاوه بر این، دریافت نسخه توسعه یافته ابرداده از طریق سرویس پردازش وب پیاده سازی شده (WPS) نیز امکان پذیر است. NOAA-IOOS همچنین نیاز به ترکیب پرچمهای کیفیت متفاوت برای یک ویژگی را که توسط مدلهای مختلف سنسور اندازهگیری میشود، برطرف میکند [ 26 ]]، که توسط رویکرد ما پوشش داده شده است. نویسندگان همچنین در ابتکار تضمین کیفیت دادههای اقیانوس در زمان واقعی (QARTOD) به OGC (Q2O) ( http://q2o.whoi.edu/ ) مشارکت دارند. شباهت بین Q2O و رویکرد ما در این واقعیت نهفته است که هر دو رویکرد از مشخصات SWE OGC برای گرفتن اطلاعات در مورد ارزیابی کیفیت داده ها استفاده کرده اند. Q2O بر نمایش اجزای حسگر، زنجیرههای پردازش و آزمایشهای کیفیت اعمال شده بر روی دادههای اقیانوسشناسی درجا از طریق اسناد SensorML تمرکز دارد [ 11 ، 27 ]. مدل داده ما این جنبه ها و همچنین سایر اطلاعات زمینه ای مورد نیاز برای ارزیابی داده ها را در بر می گیرد (به بخش 4.1 مراجعه کنید.). بسته به جزئیات اطلاعات، این جنبهها را در اسناد SensorML (مثلاً توصیفات سنجش) یا در اسناد O&M (مثلاً پرچمهای کیفیت) مشخص میکنیم. مدلسازی تستهای کیفیت بهعنوان فرآیندها در اسناد SensorML مانند Q2O قابل توجه است، اما تمرکز اصلی تحقیق ما نیست. Q2O دو پرچم اصلی (به عنوان مثال، قبولی و شکست) را پیشنهاد می کند که نتایج یک آزمون کیفیت را نشان می دهد (مثلاً، آزمایش واریانس). ما یک طرح پرچمگذاری کیفیت دو سطحی را در رویکرد خود اتخاذ کردهایم تا پرچمهای داده طیف گستردهای از کاربردهای سنجش در رصدخانه ما را بتوان مشخص کرد. Q2O واژگان رسمی (هستی شناسی) را توسعه داده است که پارامترها، تست های کیفیت و پرچم ها را تعریف می کند. در همین راستا، ما قصد داریم واژگان کنترل شده را که در پایگاه داده ما توضیح داده شده است را به مشخصات رسمی تبدیل کنیم.
در مورد درخواست های داده، باستین و همکاران. [ 9 ] نحوه بازیابی داده ها با مفاهیم عدم قطعیت و نحوه مشخص کردن نتایج در قالب مشترک (UncertML) در O&M را شرح می دهد. سرویس ما نیز به روشی مشابه است، اما درخواستهای داده را با فیلترهای کیفیت (مانند سطح داده و پرچمهای کیفیت) رسیدگی میکند و نتایج ارزیابی حاصل به مقادیر مشاهدهشده کدگذاریشده در پاسخ O&M SOS اضافه میشود. GeoViqua [ 6 ، 28] پروژه بر روششناسی برای تقویت زیرساخت مشترک GEOSS با کشف و تجسم دادههای کیفیت محور متمرکز شده است. این سه جنبه اصلی کیفیت دادهها، از جمله عدم قطعیتهای اندازهگیری، بررسیهای کاربر نهایی درباره استفاده از دادهها، و اطلاعات منشأ مرتبط با ایجاد داده را مورد توجه قرار میدهد. رویکرد ما آخرین جنبه را با توسعه یک مدل دادههای مشاهدهای آگاه از کیفیت و یک سرویس مشاهده تکمیل میکند. کار در حال انجام ما بر ارائه بازخورد کاربر در مورد کیفیت داده های منتشر شده همانطور که توسط پروژه پیشنهاد شده است متمرکز است.

جدول 1. کارهای مربوط به ادغام اطلاعات با کیفیت در وب حسگر.
3. رصدخانه های محیطی زمینی (TERENO)
TERENO، یک ابتکار زیرساخت تحقیقاتی انجمن هلمهولتز، با هدف ایجاد یک شبکه رصدخانه برای مطالعه اثرات بلندمدت تغییرات آب و هوا و کاربری زمین [ 17 ] است. این ابتکارات شامل چهار رصدخانه است: دشت شمال شرقی آلمان، هارتز / دشت مرکزی، ایفل / دره راین پایین، و Apls/Pre-Alps باواریا. هر رصدخانه در حال حاضر توسط یک موسسه هلمهولتز متفاوت اداره و نگهداری می شود. دادههای رصدی از چهار رصدخانه از طریق سرویسهای وب سازگار با OGC در دسترس هستند.
ما زیرساخت دادههای مکانی TEReno Online Data RepOsitORry (TEODOOR) را برای مدیریت و انتشار دادههای مشاهده از رصدخانه ایفل/راین پایین ( شکل 1 ) توسعه دادیم. جدول 2 حسگرهای مستقر در رصدخانه را خلاصه می کند. به غیر از حسگرهای متعلق به TERENO، زیرساخت داده نیز میزبان دادههای آژانسهای خارجی است. به عنوان مثال، رصدخانه ایفل رور همچنین شامل 65 ایستگاه (رواناب و آب و هوا) متعلق به Wasserverband Eifel-Rur است. در شکل 1 ، تجزیه کننده داده و پردازشگر داده سری های داده را از سیستم های سنجش مختلف وارد کرده و آنها را به مقادیر معنی دار تبدیل می کنند .، اعمال ضرایب مقیاس بندی و انجام محاسبات. داده ها و ابرداده ها در پایگاه داده PostGIS ذخیره می شوند و از طریق سرویس های وب سازگار با OGC قابل دسترسی هستند. پورتال وب TEODOOR ( http://teodoor.icg.kfa-juelich.de ) خدمات را مصرف می کند، و به عنوان یک فرانت اند عمل می کند که از کشف، تجسم و دانلود داده ها پشتیبانی می کند [ 29 ]. دادههای رصدی از بقیه رصدخانههای TERENO نیز از طریق همان پورتال قابل کشف است.

شکل 1. زیرساخت داده TEODOOR.
سه روش وجود دارد که در آن مجموعه دادههای مشاهده در زیرساخت داده ما پردازش و ارزیابی میشوند. ابتدا، دادههای وارد شده بهطور خودکار از طریق بررسیهای کیفیت خودکار (مثلاً مقادیر آستانه) انجام میشوند و پس از انجام بازرسی بصری در اختیار عموم قرار میگیرند. نمونههایی از دادههای وارد شده بهطور خودکار، دادههایی از ایستگاههای هواشناسی و گیجهای رودخانه هستند. نوع دوم وارد کردن داده شامل داده های بارگذاری شده دستی است که به صورت خارجی پردازش و ارزیابی می شوند و سپس به زیرساخت داده وارد می شوند. این مجموعه دادهها پیچیده هستند و به ابزارهای اختصاصی برای تبدیل دادههای خام به سوابق دادههای قابل استفاده، به عنوان مثال، دادههای شار گردابی نیاز دارند. زمانی که بازرسان اصلی انتشار آنها را تأیید کردند، به صورت آنلاین منتشر میشوند. مکانیسم سوم واردکننده به روشی مشابه دادههای وارد شده خودکار عمل میکند، اما در این مورد اندازهگیریها به صورت بصری بازرسی نمیشوند، بلکه دوباره از زیرساخت داده دانلود میشوند تا با استفاده از روش ارزیابی توسعهیافته توسط دانشمند مسئول، کیفیت ارزیابی شوند. در این مورد، زیرساخت داده از مکانیزمی برای به روز رسانی اطلاعات پرچمدار پس از تکمیل ارزیابی کیفیت پشتیبانی می کند.

جدول 2. حسگرهای مستقر در رصدخانه ایفل/راین پایین.
4. ارائه و انتشار اطلاعات ارزیابی کیفیت داده های مشاهده TERENO
این بخش دو مؤلفه اصلی (مدل داده و Q-SOS) را که بر اساس استانداردهای رایج و ابزارهای منبع باز توسعه یافته اند، شرح می دهد.
4.1. مدل داده های مشاهده
شکل 2 ، شکل 3 و شکل 4 نماهای جزئی از مدل را نشان می دهند. مشارکت ما شامل گسترش مدل CUAHSI-ODM موجود است تا جنبههای مختلف مربوط به کیفیت دادهها را که در مراحل مختلف جمعآوری، واردات و پردازش، و ارزیابی دادهها اتفاق میافتد، به تصویر بکشد.
- (آ)
-
[ارزیابی کیفیت داده ها] شکل 2 جداول مرتبط با مقادیر مشاهده را نشان می دهد. برای هر مقدار مشاهده (همانطور که در مقادیر داده جدول ثبت شده است ) ، می توان مشخص کرد که توسط چه کسی ( مدیر منبع )، چه زمانی ( تغییر یافته ) و چگونه کیفیت آن بررسی شده است ( متدگروه ). به طور خاص، با طرح پرچم دو لایه (نمایش داده شده از طریق جداول qualifiergroups و qualifier )، می توان نتیجه آزمایش کیفیت و آنچه منجر به مشکلات شناسایی شده در داده ها می شود، به عنوان مثال، baddata_sensorfrozen را مشخص کرد. وضعیت پردازش جدولوضعیت کلی مدیریت داده را مشخص می کند و برای کنترل انتشار داده ها استفاده می شود. به عنوان مثال، در مدل داده ما، سطح 1 داده های ارزیابی نشده را نشان می دهد، سطح 2 شامل داده های ارزیابی شده با کیفیت و سطح 3 شامل داده هایی است که از یک یا چند مجموعه داده سطح 2 به دست می آید . ما سطح 2 را به چندین سطح فرعی (2a، 2b و 2c) طبقه بندی کرده ایم. برای اطلاعات بیشتر به [ 15 ] مراجعه کنید. بسته به سطح داده، دسترسی به داده ها می تواند برای عموم آزاد باشد یا برای کاربران خاصی مانند شرکای کنسرسیوم محدود شود. به عنوان مثال، همانطور که در خط مشی داده TERENO ( http://teodoor.icg.kfa-juelich.de/downloads-de/ ) نشان داده شده است، فقط مجموعه داده های ارزیابی شده با کیفیت کامل ( سطح 2c )) از طریق سرویس مشاهده به صورت عمومی در دسترس هستند.
- (ب)
-
[واردات و پردازش دادهها] اطلاعات جمعآوری دادهها شامل توصیفی از ایستگاهها و ابزارهای جداگانه آنها، از جمله سازنده، تعمیر و نگهداری، کالیبراسیون، وضوح، دقت، ویژگیهای مشاهدهشده و فواصل نمونهبرداری و غیره است (به C و D در شکل 2 مراجعه کنید). بیشتر این اطلاعات در یک سند SensorML کدگذاری شده است. توضیحات پردازش داده به پیکربندیهای لاگر، روشها و توابع محاسبه، فیلترها، مسائل کشفشده در حین وارد کردن دادهها و غیره اشاره دارد (الف و ج را در شکل 3 ببینید). این توصیفها تاریخچه مستند اندازهگیریها را مشخص میکنند و بنابراین برای پشتیبانی از ارزیابی دادهها بسیار مهم هستند.
- (ج)
-
[کاربران و نقش ها] مجوز و کنترل دسترسی به نمایه ها و گروه های کاربر اشاره دارد و به تعیین نقش ها از نظر مسئولیت های کاربر کمک می کند. در زمینه TERENO، کاربران اصلی این سرویس، کاربران داخلی درگیر در عملیات فنی و نگهداری، بازرسی داده ها و انتشار داده ها و محققان مرتبط با ابتکار TERENO هستند. ما فقط اطلاعات مربوط به این کاربران را در پایگاه داده ذخیره می کنیم (به منبع جدول مراجعه کنید ). جزئیات مربوط به کاربران عمومی که از طریق پورتال وب به داده ها دسترسی دارند، ثبت نمی شود. چندین جدول برای شناسایی اینکه کدام کاربر داخلی ممکن است به داده های خاص دسترسی داشته باشد و چگونه از داده ها ممکن است استفاده شود، توسعه یافته است ( شکل 4 ). به عنوان مثال، هر سایت دارای چندین نمونه سنسور و هر سنسور استفقط متعلق به یک گروه منبع خاص است . گروه مسئولیت جدول نقش هایی را که کاربر می تواند برای یک گروه منبع معین ایفا کند را مشخص می کند . نمونه هایی از نقش ها عبارتند از تعمیر و نگهداری فنی، ارزیابی کیفیت و انتشار داده ها. توجه داشته باشید که یک کاربر (همانطور که در جدول منبع ذکر شده است ) را می توان به یک یا چند نقش مسئولیت اختصاص داد.
- (د)
-
[واژگان کنترل شده] مدل اصلی داده CUAHSI شامل جداولی برای تعریف واژگان کنترل شده مانند متغیر، رسانه نمونه، کد حسگر و نوع داده است. ما این جداول را بهروزرسانی کردهایم و چندین جدول واژگان جدید ایجاد کردهایم تا هنگام وارد کردن و پردازش دادهها از حسگرهای مختلف، مانند نمونهها، انواع حسگرها، ویژگیهای فیزیکی، برنامههای مورد نظر، کلمات کلیدی، دستههای موضوع و پیشنهادات، ثبات نامگذاری را تضمین کنیم. برخی از نمونههای واژگان کنترلشده در شکل 4 آمده است (به کلمات کلیدی سایت و دستهبندیهای موضوع سایت مراجعه کنیدو جداول مرتبط با آنها). علاوه بر این، واژگان نیز به عنوان ابرداده برای پشتیبانی از کشف اطلاعات مرتبط استفاده می شود. به عنوان مثال، ما اسناد SensorML تولید شده در فرآیندهای ذکر شده در بالا را به مدل اطلاعات ثبت کسب و کار الکترونیکی (ebRIM) تبدیل کرده ایم. متعاقباً ابرداده بر اساس مدل ebRIM ( http://www.buddata-open.org/ ) به یک سرویس کاتالوگ وارد شد. با این مکانیسم، پورتال وب TEODOOR از کشف داده ها بر اساس متون (به عنوان مثال، نوع حسگر، برنامه مورد نظر و کلمه کلیدی)، و اطلاعات مکانی و زمانی پشتیبانی می کند. دلیل پذیرش نمایه ebRIM سرویس کاتالوگ برای وب (CSW) این است که سرورهای CSW که مشخصات خدمات کاتالوگ OpenGIS 2.0.2—نمایه برنامه فراداده ISO [ 30 ] را پیادهسازی میکنند.] به طور کامل قادر به پشتیبانی از الزامات کشف استاندارد داده های سری زمانی نیستند زیرا می تواند یک SOS (سرویس) را نمایه کند، اما توصیفات SensorML را ندارد.

شکل 2. دو اطلاعات کیفیت به مقادیر مشاهده ای ارائه شده توسط سرویس پیاده سازی شده، یعنی پرچم های کیفیت ( گروه های واجد شرایط و واجد شرایط ) و سطح پردازش داده ها ( processingstati ) متصل می شوند. منبع جدول حاوی اطلاعاتی در مورد تمام کاربرانی است که در نگهداری و بهره برداری حسگرها، پردازش داده ها، ارزیابی کیفیت و انتشار آنها نقش دارند. جزئیات مربوط به سنجش داده ها و وارد کردن مقادیر مشاهده در سایت ها ، متغیرها ، و وارد کردن فایل و جداول مرتبط با آنها مشخص شده است.

شکل 3. یک حسگر ممکن است یک یا چند جزء حسگر داشته باشد . برای یک سنسور معین ، چندین نمونه از سنسور را می توان ایجاد کرد. نمونه های سنسور با یک سایت (ایستگاه) خاص مرتبط است. لاگر ابزاری است متصل به حسگر واقعی که داده های مشاهده را در طول زمان جمع آوری می کند. اطلاعات مشخص شده در جدولگرها و متغیرهای لاگر توسط تجزیه کننده های داده ورودی ( شکل 1 ) برای وارد کردن داده ها به زیرساخت داده استفاده می شود.

شکل 4. یک سنسور فقط به یک گروه منبع خاص تعلق دارد. گروه مسئولیت جدول مسئولیت ها (به عنوان مثال، تعمیر و نگهداری فنی و انتشار داده ها) یک کاربر را برای نمونه ای از یک حسگر مشخص می کند . اطلاعات دقیق در مورد کاربران TERENO در منابع جدول گنجانده شده است . سایتها همچنین به پروژهها و چندین واژگان کنترلشده مانند، دستههای موضوعی و کلمات کلیدی پیوند میدهند .
4.2. خدمات مشاهده سنسور با کیفیت (Q-SOS)
از آنجایی که مدل داده ما با مدل داده پیشفرض SOS (نسخه 1.0) متفاوت است، چندین نمای پایگاه داده برای ترسیم این دو مدل ایجاد کردهایم (به عنوان مثال، فهرست 1 را ببینید). SOS موجود اصلاح شده است، به طوری که SOS توسعهیافته (Q-SOS) علاوه بر مقادیر مشاهده، توصیفگرهای کیفیت و ابردادههای مرتبط با آنها را نیز ارائه میکند. ما چندین نمونه از Q-SOS را بر اساس گروه های حسگر همانطور که در جدول 2 مشخص شده است، پیاده سازی کرده ایم . نمونه ای از این خدمات در ( http://ibg3wradar.ibg.kfa-juelich.de:8080/eifelrur_quality/ ) قابل دسترسی است. شکل 5 گزیده ای از درخواست GetObservation را نشان می دهد که شامل یک فیلتر کیفیت بر روی مقادیر مشاهده تولید شده توسط WU_GW_001 است.ایستگاه اندازه گیری ویژگی GroundWaterLevel . مقدار فیلتر (مثلاً 4_2) ترکیبی از شاخصها است که دو توصیفگر کیفیت را نشان میدهد که عبارتند از سطح پردازش داده و پرچمهای داده که توسط یک جداکننده (زیر خط) از هم جدا شدهاند. شکل 6 نتایج درخواست (یک سند O&M) را نشان می دهد. برخی از بخش های XML سند برای شفافیت پنهان هستند. اطلاعات ارزیابی کیفیت با بخش <om:resultQuality> سند O&M به مقادیر مشاهده اختصاص داده می شود (بخش 3 از شکل 6 را ببینید). ابرداده های مرتبط در بخش <gml:metaDataProperty> گنجانده شده است (قسمت های 1،2 شکل 6 را مقایسه کنید). فرض بر این است که مقادیری که اطلاعات کیفی را تشکیل می دهند (مثلاً 4_2)) به ترتیب عناصر فراداده هستند. مزیت ارائه چنین اطلاعات با کیفیتی در سطح مقادیر مشاهده این است که می توان آنها را مستقیماً توسط برنامه های کاربردی مشتری مورد استفاده قرار داد. این در بخش 4.3 نشان داده شده است .
به غیر از Q-SOS، یک سرویس پردازش وب ( http://icg4aida.icg.kfa-juelich.de:9090/wps ) بر اساس WPS 52°North ( http://52north.org/communities/geoprocessing/ ) پیاده سازی wps/ ) توسعه یافته است. این سرویس برای جمع آوری اطلاعات دقیق تر در مورد توصیفگرهای کیفیت و تاریخچه یک ایستگاه، به روز رسانی اطلاعات پرچم گذاری و تأیید انتشار داده ها استفاده می شود. چند نمونه از این موارد در شکل 7 نشان داده شده است. سند SensorML یک حسگر معین شامل پیوند WPS در بخش <history> است که تاریخچه نگهداری سنسور را برای یک دوره زمانی معین برمی گرداند.
فهرست 1: نمونه ای از view که رویه ها را تولید می کند .
ایجاد یا جایگزینی مشاهده sos.soilnetwuestebach_procedure_quality AS SELECT sites DISTINCT.objectid AS procedureid , 'T':: شخصیت (1) AS hibernateddiscriminator, 1::bigint AS proceduredescriptionformat_id، earthnetwuestebach_datadirectory_quality.sitecode:: کاراکتر متغیر (255) شناسه AS ، 'F':: کاراکتر (1) AS حذف شده است، ('standard/'::text || earthnetwuestebach_datadirectory_quality.sitecode ::متن) || '.xml'::text AS descriptionfile, 'F':: کاراکتر (1) پرچم مرجع AS از sos.soilnetwuestebach_datadirectory_quality، observationreferences.sites WHERE earthnetwuestebach_datadirectory_quality.siteid = sites.objectid;

شکل 5. گزیده ای از درخواست GetObservation حاوی فیلتر نتیجه بر اساس اطلاعات کیفیت.
4.3. برنامه های کاربردی
در زمینه TERENO، این سرویس در دو مورد اعمال شده است. از دیدگاه ارائه دهنده داده، برای ارزیابی کیفیت داده های مشاهده استفاده می شود. از دیدگاه مصرفکننده داده، دسترسی به دادههای مشاهده از حسگرهای مختلف را از طریق برنامههایی مانند کلیزوهای سرویس گیرنده SOS خط فرمان و پورتال وب TEODOOR فراهم میکند.
در حالت اول، این سرویس توسط یک ابزار پرچمگذاری کیفیت آنلاین (INSPECT) ( شکل 7 ) که بر اساس منبع باز 52°North Sensor Web Client ( http://52north.org/communities/sensorweb/clients/ ) قابل دسترسی است. SensorWebClient/). ما کلاینت موجود را با یک ماژول بازرسی داده گسترش داده ایم که به کاربران امکان می دهد سری داده ها را بر اساس قرارداد پرچم گذاری دو لایه (زیر بخش 4.1) به صورت بصری ارزیابی و پرچم گذاری کنند. همانطور که در بخش فرعی 4.1 توضیح داده شد، این ابزار از اطلاعات کنترل دسترسی به داده ها استفاده می کند تا عملیات خاصی (مثلاً مشاهده سری، پرچم گذاری و تأیید داده ها) را بر اساس نقش های کاربر و گروه های کاربر امکان پذیر کند. همچنین تاریخچه نگهداری حسگرها را از طریق WPS پیاده سازی شده بازیابی می کند. این ویژگیها سودمندی مرتبط کردن اطلاعات کیفی با سایر زمینههای اندازهگیری را برای پشتیبانی از ارزیابی دادهها نشان میدهند.
در مورد دوم، این سرویس برای انتشار دادههای مشاهده همراه با اطلاعات با کیفیت، به عنوان مثال با استفاده از پورتال وب TEODOOR، استفاده میشود. شکل 8 نمونه ای از یک سری زمانی از ویژگی SurfaceWaterLevel_Venturi را از ایستگاه نمونه برداری رواناب Wuestebach 14 در 8 آوریل 2010 نشان می دهد. این سری برای نشان دادن پرچمهای با کیفیت مختلف کد رنگی دارد (به کادر افسانه پایین سمت راست شکل 8 مراجعه کنید). مثال دیگر این است که ما همچنین نمونهای از این سرویس را راهاندازی کردهایم تا دادههای ایستگاههای منتخب رطوبت خاک را به شبکه بینالمللی رطوبت خاک ( https://ismn.geo.tuwien.ac.at/newsitem/new-network-tereno ) منتشر کنیم. -26/04/2013/).

شکل 6. نمونه ای از سند O&M تولید شده توسط Q-SOS که فقط شامل داده های ارزیابی شده با کیفیت کامل (سطح 2c) است که کیفیت خوبی دارند (پرچم “ok_ok”).

شکل 7. داده ها را به صورت بصری با ابزار پرچم گذاری آنلاین INSPECT ارزیابی کنید.

شکل 8. جستجو و کشف داده های مشاهده با پورتال وب TEODOOR. نقاط داده قرمز نشان دهنده داده های بد هستند، در حالی که نقاط داده سرخابی نشان دهنده داده های خوب هستند.
به طور خلاصه، توصیفگرهای کیفیت برای مکان یابی مجموعه داده های مورد علاقه مفید هستند، مانند درخواست برای داده هایی که کیفیت ارزیابی شده و مقادیر بد و مشکوک را حذف می کنند. از پرچمها همچنین میتوان برای ایجاد تصاویر بهتر استفاده کرد، برای مثال ایجاد نمودارهای سری زمانی با کدگذاری رنگی مقادیر ( شکل 7 و شکل 8 را ببینید).
5. بحث و نتیجه گیری
شبکه رصدخانه TERENO شامل داده های مشاهداتی از کاربردهای مختلف سنجش، از جمله حسگرهای فنی و نمونه برداری میدانی است. چالش این است که راهی سیستماتیک برای کنترل کیفیت این مجموعه دادهها و سپس در دسترس قرار دادن آنها به کاربران به شیوهای رایج پیدا کنیم. برای تحقق این امر، ما یک مدل دادههای مشاهده و یک توسعه استاندارد OGC SOS 1.0 را توسعه دادهایم که از بازیابی دادههای مشاهده با توضیحات کیفیت پشتیبانی میکند. تفاوت با مدل داده ما در مقایسه با مدلهای دادههای مشاهدهای موجود در این واقعیت است که مدل ما جنبههای مختلف ارزیابی کیفیت دادهها را از انتخاب و نگهداری حسگرها تا ارزیابی نهایی دادهها را نشان میدهد. این مدل سنجش و پردازش دادهها را مشخص میکند که برای استنباط اطلاعات در مورد علل تغییرپذیری دادهها مفید است. این برنامه از یک طرح پرچم دو سطحی برای تهیه سیستم های پرچم با کاربردهای مختلف حسگر و سطوح پردازش برای سهولت ارزیابی و دسترسی به داده ها پشتیبانی می کند. مزیت دیگر این است که پرچمهای کیفیت متفاوت قابل اعمال برای یک ویژگی که توسط مدلهای سنسور مختلف اندازهگیری میشوند نیز قابل نمایش هستند. اگرچه مدل داده بر روی دادههای مشاهده TERENO تمرکز دارد، مفاهیم قابل توسعه هستند و میتوانند برای دادههای سری زمانی از دیگر برنامههای سنجش اعمال شوند. مزیت دیگر این است که پرچمهای کیفیت متفاوت قابل اعمال برای یک ویژگی که توسط مدلهای سنسور مختلف اندازهگیری میشوند نیز قابل نمایش هستند. اگرچه مدل داده بر روی دادههای مشاهده TERENO تمرکز دارد، مفاهیم قابل توسعه هستند و میتوانند برای دادههای سری زمانی از دیگر برنامههای سنجش اعمال شوند. مزیت دیگر این است که پرچمهای کیفیت متفاوت قابل اعمال برای یک ویژگی که توسط مدلهای سنسور مختلف اندازهگیری میشوند نیز قابل نمایش هستند. اگرچه مدل داده بر روی دادههای مشاهده TERENO تمرکز دارد، مفاهیم قابل توسعه هستند و میتوانند برای دادههای سری زمانی از دیگر برنامههای سنجش اعمال شوند.
برخلاف پیادهسازی SOS 52 درجه شمالی، Q-SOS برای ارائه دادههای مشاهده با توصیفگرهای کیفیت طراحی شده است. ما گزینههای موجود در رابط SOS را بررسی کردهایم و به این نتیجه رسیدهایم که افزودن توصیفگرهای کیفیت و ابردادههای آنها در همان سند O&M روش ترجیحی است زیرا اطلاعات کیفیت میتواند مستقیماً توسط برنامههای مشتری از نظر فیلتر کردن دادهها و تجسم استفاده شود. Q-SOS فراداده توصیفگرها را در سطح کلی نشان می دهد. برای به دست آوردن اطلاعات دقیق تر می توان از WPS آگاه از کیفیت استفاده کرد.
به طور کلی، هر دو مدل و سرویس نقش مهمی در حمایت از بازرسی و انتشار داده ها در زمینه TERENO ایفا کرده اند. این از طریق مثال های کاری شرح داده شده در بخش 4.3 نشان داده شده است. آنها با کارهای قبلی مطابقت دارند زیرا با تطبیق مشخصات موجود (مانند SWE و CUAHSI)، و با گسترش ابزارهای منبع باز (مثلاً پیاده سازی SOS 52°North و Sensor Web Client) طراحی و اجرا شده اند. ما قصد داریم Q-SOS، WPS آگاه از کیفیت و ابزار پرچمگذاری کیفیت را در مخزن 52°North GitHub منتشر کنیم. ما معتقدیم که این می تواند قابلیت استفاده مجدد از راه حل های توسعه یافته را ارتقا دهد.
اگرچه استاندارد SOS 2.0 از سال 2012 در دسترس است، کار ما همچنان بر اساس استاندارد SOS 1.0 است. دلیل این امر در الزامات پروژه TERENO نهفته است. از آنجایی که باید تصمیمات مهم طراحی قبل از استاندارد SOS 2.0 گرفته می شد و اجرای سرویس آن در دسترس قرار می گرفت، نمی توانست استاندارد جدیدتر SOS 2.0 را اتخاذ کند. اخیراً، ما با موفقیت نماهای پایگاه داده را ایجاد کرده ایم تا مدل داده خود را به مدل SOS 2.0 نگاشت کنیم. گام بعدی گسترش اجرای سرویس برای نمایش اطلاعات کیفی مقادیر مشاهده است.
کار آینده بر اجرای مدل بازخورد کاربر پیشنهاد شده توسط [ 6 ، 28 ] به عنوان بخشی از چارچوب مدیریت کیفیت داده ما تمرکز دارد. اطلاعات بازخورد از مصرف کنندگان داده، بینش بهتری در مورد کاربرد و ارزیابی مجموعه داده های منتشر شده می دهد. به عنوان مثال، توضیحاتی در مورد یک تحلیل علمی که در آن مجموعه داده ها استفاده شده است، و هر موضوع کشف شده مربوط به کیفیت مجموعه داده های منتشر شده را در نظر بگیرید. ارائه دهندگان داده می توانند از این اطلاعات برای مدیریت داده های اشتباه و بهبود روش های جمع آوری و پردازش داده ها استفاده کنند.
خط کار جالب دیگری که باید دنبال شود، توسعه هستیشناسی است که توصیفگرهای کیفیت (مثلاً پرچمها و آزمایشهای کیفیت) را برای رسیدگی به ابهامات نامگذاری نشان میدهد، که در نتیجه کشف دادههای مشاهده منتشر شده از منابع مختلف است. یک مطالعه مرتبط در این راستا مربوط به [ 31 ] است که نگاشت پرچم با کیفیت غیررسمی را بین 15 استاندارد پرچم پرکاربرد در حوزه اقیانوس شناسی توسعه داد. کار دیگر توسط [ 11 ] است که استفاده از هستی شناسی را برای پیوند دادن تست های کیفیت داده های دریایی بین مقامات مختلف پیشنهاد کرد.
منابع
- بالازینسکا، م. دشپنده، ع. فرانکلین، ام. گیبونز، پی. گری، جی. ناث، اس. هانسن، ام. لیبهلد، ام. اسزلای، ا. تائو، وی. مدیریت داده در وب حسگر جهانی. محاسبات فراگیر IEEE 2007 ، 6 ، 30-40. [ Google Scholar ] [ CrossRef ]
- آژانس حفاظت از محیط زیست ایالات متحده واژه نامه اصطلاحات تضمین کیفیت و کلمات اختصاری مرتبط ; مرکز ملی تحقیقات محیطی و تضمین کیفیت: واشنگتن، دی سی، ایالات متحده آمریکا، 1997.
- Hoyle, D. ISO 9000 Quality Systems Handbook (ویرایش چهارم) ; Butterworth-Heinemann: آکسفورد، بریتانیا، 2011. [ Google Scholar ]
- WMO. راهنمای عمل هیدرولوژیکی – تجزیه و تحلیل، پیشبینی و سایر کاربردها، جمعآوری و پردازش دادهها (WMO-No. 168) . سازمان جهانی هواشناسی (WMO): ژنو، سوئیس، 1994. [ Google Scholar ]
- باتس، من؛ پرسیوال، جی. رید، سی. فعال سازی وب حسگر دیویدسون، J. OGC: نمای کلی و معماری سطح بالا. در مجموعه مقالات دومین کنفرانس بین المللی شبکه های حسگر جغرافیایی (GSN 2006)، بوستون، MA، ایالات متحده آمریکا، 1 تا 3 اکتبر 2006.
- سرال، آی. Masó, J. Deliverable 6.3-ارزیابی استانداردها، پروتکل ها و رهنمودهای بکار رفته در GeoViQua. در دسترس آنلاین: http://www.geoviqua.org/Docs/SubmittedDeliverables/D6_3_GeoViQua.pdf (دسترسی در 5 ژوئیه 2014).
- ویلیامز، ام. کورنفورد، دی. باستین، ال. جونز، آر. پارکر، اس. پردازش خودکار، تضمین کیفیت و ارائه داده های آب و هوا در زمان واقعی. محاسبه کنید. Geosci. 2011 ، 37 ، 353-362. [ Google Scholar ] [ CrossRef ]
- براونر، جی. برورینگ، آ. بوگل، یو. فاور، اس. هولس، دی. هالمن، سی. هوتکا، ال. جیرکا، س. Jürrens، EH; کادنر، دی. و همکاران D4.14 مشخصات مفاهیم پیشرفته SWE (مسئله 4)—EO2HEAVEN SII Architecture Specification Part V ; جیرکا، س.، اد. کنسرسیوم EO2HEAVEN: مادرید، اسپانیا، 2013. [ Google Scholar ]
- باستین، ال. کورنفورد، دی. جونز، آر. Heuvelink، GB; پبسما، ای. استاش، سی. ناتیوی، س. مازتی، پی. ویلیامز، ام. مدیریت عدم قطعیت در مدلسازی محیطی یکپارچه: چارچوب UncertWeb. محیط زیست مدل. نرم افزار 2013 ، 39 ، 116-134. [ Google Scholar ] [ CrossRef ]
- استوارت، EM; ورس، جی. زلاتف، ز. واتسون، ک. بومرسباخ، آر. کونز، اس. هیلبرینگ، دی. لیدستون، ام. شو، تی. Jacques, P. SANY Fusion and Modeling Architecture ; مقاله بحث OGC OGC 10-001; کنسرسیوم SANY: ساوتهمپتون، انگلستان، 2009. [ Google Scholar ]
- فردریک، جی. بوتس، ام. برمودز، ال. بوش، جی. بوگدن، پی. بریجر، ای. کوک، تی. دلوری، ای. گریبیل، جی. هاینز، اس. و همکاران ادغام تضمین کیفیت و کنترل کیفیت در فعال سازی وب حسگر کنسرسیوم فضایی باز. In Proceedings of OceanObs 2009: Sustained Ocean Observations and Information for Society، ونیز، ایتالیا، 21-25 سپتامبر 2009.
- Garcia, M. NOAA IOOS Data Integration Framework (DIF)—دستورالعمل های نصب سرویس مشاهده سنسور IOOS ; دفتر برنامه سیستم یکپارچه مشاهده اقیانوس (IOOS): Silver Spring، MD، ایالات متحده آمریکا، 2010. [ Google Scholar ]
- تاربتون، دی جی; Horsburgh, JS; Maidment، DR CUAHSI جامعه مشاهدات مدل داده (ODM) نسخه 1.1 مشخصات طراحی ; کنسرسیوم دانشگاه ها برای پیشرفت علم هیدرولوژی: بوستون، MA، ایالات متحده آمریکا، 2008. [ Google Scholar ]
- WMO. راهنمای WMO برای ابزارهای هواشناسی و روشهای رصد – WMO-No. 8 ، 7th ed.; گزارش فنی 978-92-63-10008-5; سازمان جهانی هواشناسی: ژنو، سوئیس، 2008. [ Google Scholar ]
- دوراجو، ع. کانکل، آر. بوگنا، اچ. Vereecken، H. چارچوب ارزیابی کیفیت مشترک برای دادههای مشاهدات محیطی. در مجموعه مقالات چهاردهمین کنفرانس جغرافیایی SGEM در زمینه انفورماتیک، ژئوانفورماتیک و سنجش از دور (SGEM2014)، آلبنا، بلغارستان، 17 تا 26 ژوئن 2014.
- دوراجو، ع. کانکل، آر. سورگ، ج. بوگنا، اچ. Vereecken، H. فعال کردن کنترل کیفیت مشاهدات وب حسگر. در مجموعه مقالات سومین کنفرانس بین المللی شبکه های حسگر (SENSORNETS 2014)، لیسبون، پرتغال، 17-27 ژانویه 2014.
- زکریا، س. بوگنا، اچ. سامانیگو، ال. مائودر، ام. فوس، آر. پوتز، تی. فرنزل، م. شوانک، ام. بیسلر، سی. باترباخ باهل، ک. و همکاران شبکه ای از رصدخانه های محیطی زمینی در آلمان. Vadose Zone 2011 ، 10 ، 955-973. [ Google Scholar ] [ CrossRef ]
- برورینگ، آ. استاش، سی. Echterhoff، JE OGC مشخصات پیاده سازی: سرویس مشاهده سنسور (SOS) 2.0 (12-006) ; Open Geospatial Consortium Inc.: Wayland, MA, USA, 2012. [ Google Scholar ]
- بوتس، ام. Robin, A. OGC Implementation Specification: Sensor Model Language (SensorML) 2.0.0 ; Open Geospatial Consortium Inc: Wayland، MA، ایالات متحده آمریکا، 2014. [ Google Scholar ]
- Cox, S. OGC Implementation Specification: مشاهدات و اندازه گیری ها (O&M)—XML Implementation 2.0 ; گزارش فنی (10-025r1); Open Geospatial Consortium Inc.: Wayland، MA، ایالات متحده آمریکا، 2011. [ Google Scholar ]
- نینیرولا، ام. سویانو، ای. سرال، آی. پونز، ایکس. زبالا، ع. باستین، ال. Masó, J. QualityML: فرهنگ لغت برای رمزگذاری فراداده با کیفیت. ژنرال EGU Assem. Conf. Abstr. 2014 ، 16 ، 10452. [ Google Scholar ]
- WOCE. WHP 91-1: راهنمای عملیات WOCE، گزارش WOCE شماره 68/91 ویرایش. آزمایش گردش جهانی اقیانوس (WOCE): سن دیگو، ایالات متحده آمریکا، 1994. [ Google Scholar ]
- IOC یونسکو استانداردهای دادههای اقیانوس، جلد 3: توصیه برای طرح پرچم کیفیت برای تبادل دادههای هواشناسی اقیانوسشناسی و دریایی ؛ IOC Manuals and Guides 54 IOC/2013/MG/54-3; کمیسیون بین دولتی اقیانوس شناسی (IOC)، یونسکو: پاریس، فرانسه، 2013. [ Google Scholar ]
- بارتا، م. بلیر، تی. دیهه، پ. هاولیک، دی. هیلبرینگ، دی. هوجنتوبلر، ام. Iosifescu Enescu، I.; کونز، اس. پولل، اس. شول، ام. و همکاران مشخصات معماری سرویس سنسور نسخه 3 (نسخه سند 3.1) ; مقاله بحث OGC OGC 09-132r1; کنسرسیوم SANY: ساوتهمپتون، انگلستان، 2009. [ Google Scholar ]
- De La Beaujardiere, J. چارچوب یکپارچه سازی داده های NOAA IOOS: گزارش پیاده سازی اولیه. In Proceedings of the OCEANS 2008، شهر کبک، QC، کانادا، 15-18 سپتامبر 2008.
- کنوانسیون های گارسیا، M. IOOS برای رمزگذاری CSV – نسخه 1.0.0 ؛ NOAA/NWS/NDBC: سیاتل، WA، ایالات متحده آمریکا، 2010. [ Google Scholar ]
- بوش، جی. فردریک، جی. بوتس، ام. کوک، تی. هاینز، اس. بوگدن، پی. بریجر، E. استفاده از فعال سازی وب حسگر کنسرسیوم زمین فضایی باز برای رسیدگی به کیفیت داده های اقیانوس شناسی در زمان واقعی، استفاده از داده های ثانویه، و حفظ طولانی مدت. در مجموعه مقالات OCENS MTS/IEEE Biloxi-فناوری دریایی برای آینده ما: چالش های جهانی و محلی 2009، بیلوکسی، ام اس، ایالات متحده آمریکا، 26-29 اکتبر 2009.
- دیاز، پی. ماسو، جی. سویانو، ای. نینیرولا، ام. زبالا، ع. سرال، آی. Pons, X. تجزیه و تحلیل فراداده با کیفیت در اتاق تسویه حساب GEOSS. بین المللی جی. اسپات. زیرساخت داده Res. 2012 ، 7 ، 352-377. [ Google Scholar ]
- کانکل، آر. سورگ، ج. Eckardt، R. کلدیتز، او. رینک، ک. Vereecken، H. TEODOOR: زیرساخت داده های جغرافیایی توزیع شده برای داده های رصد زمینی. محیط زیست علوم زمین 2013 ، 69 ، 507-521. [ Google Scholar ] [ CrossRef ]
- Voges، U. Senkler, K. مشخصات خدمات کاتالوگ OpenGIS 2.0.2—نمایه برنامه فراداده ISO (OGC 07-045) ; Open Geospatial Consortium Inc: Wayland، MA، ایالات متحده آمریکا، 2007. [ Google Scholar ]
- Schlitzer, R. طرحهای پرچم کیفیت اقیانوسشناسی و نگاشت بین آنها (نسخه 1.4) . موسسه آلفرد وگنر برای تحقیقات قطبی و دریایی: برمرهاون، آلمان، 2013. [ Google Scholar ]
© 2015 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر