جمع سپاری داده های هواشناسی حسگر موبایل تولید شده توسط کاربر برای متراکم کردن شبکه های ژئوسنسور ایستا

خلاصه

شبکه‌های ژئوسنسور ساکن از ایستگاه‌هایی با دستگاه‌های حسگر تشکیل شده‌اند که داده‌های مربوط به نظارت بر پدیده‌های محیطی در محیط جغرافیایی خود را ارائه می‌دهند. اگرچه سیستم‌های هشدار اولیه برای مدیریت بلایا بر داده‌های بازیابی شده از این شبکه‌ها متکی هستند، برخی محدودیت‌ها عمدتاً از نظر پوشش ناکافی و چگالی کم وجود دارد. جمع‌سپاری داده‌های تولید شده توسط کاربر به عنوان یک روش کار برای بازیابی داده‌های بلادرنگ در شرایط فاجعه، کاهش محدودیت‌های فوق‌الذکر و افزایش داده‌های بلادرنگ تولید شده توسط شهروندان مجاور در حال ظهور است. این مقاله استفاده از داده‌های آب و هوای حسگر تولید شده توسط کاربر را از دستگاه‌های تلفن همراه برای ایجاد یک شبکه حسگر زمین یکپارچه و متراکم شده بررسی می‌کند. آزمایش‌های سناریویی مختلف اقتباس شده‌اند، که در آن داده های آب و هوا با استفاده از حسگرهای گوشی هوشمند، ادغام شده با توسعه یک الگوریتم تثبیت، برای تعیین قابلیت اطمینان و قابلیت استفاده داده های آب و هوای تولید شده توسط کاربر، جمع آوری می شود. با نمایش این روش بر روی حجم داده‌های بزرگ، یک الگوریتم فضایی-زمانی برای فیلتر کردن داده‌های آب و هوایی تولید شده توسط کاربر برخط بازیابی شده از WeatherSignal توسعه داده شد و برای شبیه‌سازی و ارزیابی متراکم‌سازی شبکه آب‌وهوای ژئوسنسور ساکن اسرائیل استفاده شد. نتایج زمین‌آماری به‌دست‌آمده ثابت کرد، اگرچه داده‌های آب‌وهوای تولید شده توسط کاربر در مقایسه با داده‌های معتبر، تفاوت‌های کوچکی را نشان می‌دهند، اما با ملاحظات می‌توان از آن‌ها در کنار داده‌های معتبر استفاده کرد و یک نقشه آب‌وهوای متراکم‌شده و تقویت‌شده را تولید کرد که دقیق و پیوسته است. یکپارچه شده با توسعه یک الگوریتم تثبیت، برای تعیین قابلیت اطمینان و قابلیت استفاده داده های آب و هوایی تولید شده توسط کاربر. با نمایش این روش بر روی حجم داده‌های بزرگ، یک الگوریتم فضایی-زمانی برای فیلتر کردن داده‌های آب و هوایی تولید شده توسط کاربر برخط بازیابی شده از WeatherSignal توسعه داده شد و برای شبیه‌سازی و ارزیابی متراکم‌سازی شبکه آب‌وهوای ژئوسنسور ساکن اسرائیل استفاده شد. نتایج زمین‌آماری به‌دست‌آمده ثابت کرد، اگرچه داده‌های آب‌وهوای تولید شده توسط کاربر در مقایسه با داده‌های معتبر، تفاوت‌های کوچکی را نشان می‌دهند، اما با ملاحظات می‌توان از آن‌ها در کنار داده‌های معتبر استفاده کرد و یک نقشه آب‌وهوای متراکم‌شده و تقویت‌شده را تولید کرد که دقیق و پیوسته است. یکپارچه شده با توسعه یک الگوریتم تثبیت، برای تعیین قابلیت اطمینان و قابلیت استفاده داده های آب و هوایی تولید شده توسط کاربر. با نمایش این روش بر روی حجم داده‌های بزرگ، یک الگوریتم فضایی-زمانی برای فیلتر کردن داده‌های آب و هوایی تولید شده توسط کاربر برخط بازیابی شده از WeatherSignal توسعه داده شد و برای شبیه‌سازی و ارزیابی متراکم‌سازی شبکه آب‌وهوای ژئوسنسور ساکن اسرائیل استفاده شد. نتایج زمین‌آماری به‌دست‌آمده ثابت کرد، اگرچه داده‌های آب‌وهوای تولید شده توسط کاربر در مقایسه با داده‌های معتبر، تفاوت‌های کوچکی را نشان می‌دهند، اما با ملاحظات می‌توان از آن‌ها در کنار داده‌های معتبر استفاده کرد و یک نقشه آب‌وهوای متراکم‌شده و تقویت‌شده را تولید کرد که دقیق و پیوسته است. یک الگوریتم فضایی-زمانی برای فیلتر کردن داده های آب و هوای تولید شده توسط کاربر برخط بازیابی شده از WeatherSignal توسعه داده شد و برای شبیه سازی و ارزیابی متراکم کردن شبکه آب و هوای ژئوسنسور ساکن اسرائیل استفاده شد. نتایج زمین‌آماری به‌دست‌آمده ثابت کرد، اگرچه داده‌های آب‌وهوای تولید شده توسط کاربر در مقایسه با داده‌های معتبر، تفاوت‌های کوچکی را نشان می‌دهند، اما با ملاحظات می‌توان از آن‌ها در کنار داده‌های معتبر استفاده کرد و یک نقشه آب‌وهوای متراکم‌شده و تقویت‌شده را تولید کرد که دقیق و پیوسته است. یک الگوریتم فضایی-زمانی برای فیلتر کردن داده های آب و هوای تولید شده توسط کاربر برخط بازیابی شده از WeatherSignal توسعه داده شد و برای شبیه سازی و ارزیابی متراکم کردن شبکه آب و هوای ژئوسنسور ساکن اسرائیل استفاده شد. نتایج زمین‌آماری به‌دست‌آمده ثابت کرد، اگرچه داده‌های آب‌وهوای تولید شده توسط کاربر در مقایسه با داده‌های معتبر، تفاوت‌های کوچکی را نشان می‌دهند، اما با ملاحظات می‌توان از آن‌ها در کنار داده‌های معتبر استفاده کرد و یک نقشه آب‌وهوای متراکم‌شده و تقویت‌شده را تولید کرد که دقیق و پیوسته است.

کلید واژه ها:

جمع سپاری ; اطلاعات جغرافیایی داوطلبانه شبکه های ژئوسنسور ؛ زمین آمار

چکیده گرافیکی

1. معرفی

در بلایای انسانی یا طبیعی زیست محیطی، تشخیص سریع فاجعه و زمان کوتاه رسیدن نیروهای اورژانس، عناصر کلیدی هستند که می توانند بین فاجعه کوچک مقیاس و حادثه تلفات جمعی تفاوت ایجاد کنند. دانستن در زمان واقعی اجزای فیزیکی حیاتی که بر گسترش و گستردگی فاجعه تأثیر می گذارد، سازمان های اورژانس را قادر می سازد تا سریعتر عمل کرده و آمادگی بهتری داشته باشند و از تعداد تلفات بدنی و آسیب های مالی کاسته شود. برای ارائه هشدار خطر، در کنار اطلاعاتی در مورد شرایط محیطی که همچنان بر فاجعه تأثیر می گذارد، حسگرهای فیزیکی به عنوان بخشی از شبکه حسگر محیطی (ESN) مستقر می شوند. ESN ها، مستقر در مناطق بزرگ، شامل دستگاه‌های حاوی حسگرهایی برای جمع‌آوری داده‌های فیزیکی از محیط اطراف با ظرفیت انتقال آن‌ها است. اگرچه ESN ها در ارائه هشدار خطر کارآمد هستند، تجربه گذشته از بلایای بزرگ نشان می دهد که استقرار سنسورهای فیزیکی ثابت معمولی اغلب کافی نیست، و بنابراین ممکن است داده های کافی مورد نیاز را برای ارزیابی موقعیت و تصمیم گیری فراهم نکند – عمدتا به دلیل پوشش محدود و کم سطح استقرار [1 ]. یک راه حل برای مشکل پوشش شبکه ژئوسنسور ناکافی می تواند تکیه بر داده های تولید شده توسط کاربر جمع سپاری، به عنوان مثال، استفاده از اطلاعات جغرافیایی داوطلبانه (VGI)، به عنوان یک منبع داده مکمل برای وظیفه تراکم داده های آب و هوا، یا به عبارت کلی تر، افزایش را پیشنهاد کند. استقرار ESN موجود

جمع‌سپاری داده‌های جغرافیایی تولید شده توسط کاربر، فرآیند جمع‌آوری و اشتراک‌گذاری داده‌ها و اطلاعات مکانی و جغرافیایی است که از افراد، شهروندان و جوامعی که داوطلبانه در یک کار خاص شرکت می‌کنند، سرچشمه می‌گیرد ([2 ، 3 ]]). استفاده از داده‌های حسی از طریق پارادایم‌های کاری VGI روشی مؤثر برای جمع‌آوری داده‌ها است که می‌تواند برای گسترش تنوع منابع داده، و افزایش وضوح فضایی قرائت‌ها و گزارش‌های حسگر مورد استفاده قرار گیرد. بنابراین، دستگاه‌های قابل حمل مدرن، مانند گوشی‌های هوشمند و تبلت‌ها، که امروزه به آشکارسازهای حسگر مدرن و برنامه‌های کاربردی (برنامه‌ها) مجهز هستند، پتانسیل ارائه شکاف دانش مرتبط با ESN را دارند. بنابراین، ایجاد ظرفیت افزایش و غنی سازی اطلاعات، به ویژه زمانی که ماهیت اطلاعات جغرافیایی پویا باشد. از آنجایی که انگیزه شهروندان برای مشارکت و مشارکت، همراه با فناوری پیشرفته و قابلیت‌های ارتباطی به رشد خود ادامه می‌دهد، استفاده از داده‌های آب و هوای تولید شده توسط کاربر برای فرآیندهای محیطی عملی و سودمند است.

این مقاله به بررسی استفاده از داده‌های آب و هوایی تولید شده توسط کاربر، یعنی دمای محیط و رطوبت نسبی، برای افزایش و متراکم‌سازی ESN می‌پردازد. انگیزه تسهیل یک منبع جدید از داده های حسی واقعی و دقیق است که با راه حل های عملی برای غلبه بر محدودیت های فیزیکی مرتبط با ESN ها کمک می کند. دو فرآیند اصلی زمین‌آماری در اینجا به کار گرفته می‌شوند که از مسائل مربوط به جمع‌آوری، ترکیب و انتشار داده‌های جمع‌سپاری تولید شده توسط کاربر ناشی می‌شوند: (1) تعیین دقت، قابلیت اطمینان و ویژگی‌های آماری تکمیلی داده‌های آب‌وهوای ارائه‌شده. این با انجام تجزیه و تحلیل آماری روی مشاهدات در رابطه با داده های مرجع معتبر خارجی به دست می آید. این امر با توسعه الگوریتم‌های بلادرنگ برای شناسایی داده‌های تثبیت‌شده بدون سوگیری همراه است، بنابراین نیاز به استفاده از منابع داده خارجی برای اعتبارسنجی داده‌ها در سناریوهای بلادرنگ را از بین می‌برد. و (2) توسعه یک روش تراکم مشاهدات ESN با داده های آب و هوایی تولید شده توسط کاربر، و به دنبال آن یک ارزیابی کمی زمین آماری از سهم کلی محیطی.

ایده این است که کشورهای قابل توجهی مانند ایالات متحده، با داشتن میانگین مساحت تقریباً 3500 کیلومتر مربع ^در هر ایستگاه هواشناسی ([ 4 ])، یا کانادا، با تقریباً 10000 کیلومتر ^مربع در هر ایستگاه هواشناسی، می توانند سود زیادی ببرند. برای نشان دادن روش شناسی خود، نتایج تجربی را در رابطه با پارامترهای آب و هوای آتش سوزی که برای شبیه سازی و ارزیابی شبکه آب و هوای ژئوسنسور اسرائیل استفاده می شود، ارزیابی و اعتبار سنجی خواهیم کرد. ارائه روش‌شناسی و نتایج تجربی ما انجام می‌شود که اثربخشی الگوریتم‌های توسعه‌یافته و پیاده‌سازی شده و پتانسیل فرآیند افزایش و تراکم پیشنهادی را اثبات می‌کند.

2. تحقیقات مرتبط

به طور گسترده ای پذیرفته شده است که داده های مکانی در زمان واقعی بهترین منبع هشدار اولیه اطلاعات در مورد مدیریت خسارت و بلایا را ارائه می دهند ([ 5 ]). مطالعات اخیر قبلاً ثابت کرده است که مردم در به اشتراک گذاری و جمع آوری اطلاعات با یکدیگر همکاری می کنند (به عنوان مثال، [ 6 ، 7 ])، در حالی که در موارد اضطراری و بلایا، انگیزه عمومی برای جمع آوری داده ها حتی بیشتر است (به عنوان مثال، [ 8 ، 9]]). اجرای طرح‌های کاری جمع‌سپاری، با پشتیبانی از حسگرهای فیزیکی مدرن و قابل اعتماد که توسط شهروندان حمل می‌شوند، داده‌های تولید شده توسط کاربر را قادر می‌سازد تا وابستگی به متخصصان را کاهش دهد و در عین حال از این واقعیت استفاده کند که داده‌ها را می‌توان از طریق منابع مختلف جمع‌آوری یا تولید کرد. سهم VGI برای موقعیت‌های فاجعه به طور خاص تا حدی در برنامه‌های مختلف اجرا می‌شود (به عنوان مثال، [ 10 ، 11 ])، جایی که دومی نشان داد که 26٪ از این برنامه‌ها به مدیریت بلایای آتش‌سوزی مربوط می‌شوند.

امروزه داده ها و اطلاعات آب و هوا و اندازه شناسی را می توان از منابع مختلف غیرمعتبر که از شهروندان و جوامع سرچشمه می گیرد به دست آورد (به عنوان مثال، [ 12 ، 13 ]). جمع‌آوری این داده‌ها از طریق استفاده از تکنیک‌های جمع‌سپاری نقش حیاتی در جمع‌آوری و ارزیابی داده‌های قابل اعتماد در زمان واقعی، به ویژه در مناطق پرجمعیت یا مناطقی که شبکه‌های هواشناسی پراکنده دارند، ایفا می‌کند ([14] ) . از آنجایی که پیش‌بینی‌ها بیان می‌کنند که انتظار می‌رود رویدادهای شدید آب و هوایی در فرکانس، مدت و بزرگی افزایش یابد (به عنوان مثال، [ 15 ، 16]])، مشاهدات متراکم، با وضوح بالا و زمان واقعی به طور فزاینده ای برای مشاهده شرایط اندازه شناسی و پدیده های آب و هوایی مورد نیاز برای تشخیص و ارزیابی فوری مورد نیاز خواهند بود.

نمونه‌های مختلفی که از جمع‌سپاری عمومی برای جمع‌آوری داده‌های آب و هوا (علم شهروندی) استفاده می‌کنند، وجود دارد. برای مثال، شبکه اشتراکی باران، تگرگ و برف (CoCoRaHS) به شبکه‌ای از داوطلبان متکی است که بارش را اندازه‌گیری و نقشه‌برداری می‌کنند تا داده‌هایی را برای تحقیقات، منابع طبیعی و برنامه‌های آموزشی فراهم کنند (به عنوان مثال، [17، 18 ] ) . پروژه “شناسایی بارش در نزدیکی زمین” (PING) که توسط اداره ملی اقیانوسی و جوی (NOAA) نگهداری می شود، نمونه دیگری است که در آن داوطلبان گزارش هایی را در مورد نوع بارشی که در زمان واقعی رخ می دهد، صادر می کنند ([19 ]]). با این حال، در اکثر این پروژه‌ها، جمع‌سپاری عمومی شامل استفاده از حسگرهای کم‌هزینه و آماتوری است که توسط شهروندان مستقر و مدیریت می‌شوند، و نه استفاده غیرفعال و فعال از دستگاه‌های تلفن همراه مجهز به حسگر. از آنجایی که امروزه تعداد حسگرهای تعبیه شده در دستگاه‌های تلفن همراه در حال افزایش است، داده‌های جمع‌آوری‌شده می‌توانند به عنوان ورودی برای برنامه‌ها و سرویس‌های مختلف، به عنوان مثال OpenSignal و PressureNet (به عنوان مثال، [20، 21، 22 ] ) جمع‌سپاری شوند . با این حال، متغیرهای فیزیکی آب و هوا می توانند در فواصل کوچک و با تغییر توپوگرافی متفاوت باشند، به طوری که قابلیت اطمینان این حسگرها در گرفتن دقیق شرایط محیطی هنوز در حال بررسی است.

با توجه به [ 23 ]، تراکم شبکه ژئوسنسور ایستا را می توان با دو روش به دست آورد: (1) با استفاده از دستگاه های سخت افزاری، در نتیجه استقرار سنسورهای بیشتر (تراکم “سخت”). یا (2) استفاده از راه حل های نرم افزاری بدون سخت افزار اضافی (تراکم “نرم”). می توان تراکم یک ESN را به عنوان تراکم یک شبکه کنترل ژئودتیکی با استفاده از روش های مختلف آماری در نظر گرفت ([ 24 ]). همانطور که در مورد روش های ترکیب داده های چند سنسوری، این روش ها از آمار مشتق شده اند و روش های احتمالی هستند ([ 25]])، مانند همجوشی بیزی، فیلتر کالمن گسترده و بدون عطر، مبتنی بر شبکه، و مبتنی بر مونت کارلو. نقطه ضعف اصلی همجوشی مبتنی بر روش‌های احتمالی، ناتوانی در ارزیابی شرایط ناشناخته است، از این رو برای مدیریت بلایا و موقعیت‌های ارزیابی مناسب‌تر است، که می‌تواند با ناهنجاری‌های شرایط محیطی مشخص شود.

ادغام و متراکم کردن داده‌ها از ژئوسنسورهای فیزیکی با داده‌های جمع‌آوری‌شده با استفاده از جمع‌سپاری یک برداشت نوآورانه است (به عنوان مثال، [ 25 ، 26 ]). تحقیقات مرتبط در این زمینه عمدتاً بر بهبود پوشش ژئوسنسورهای فیزیکی – بدون استفاده از داده‌های جمع‌سپاری متمرکز است. مشکل ادغام داده‌های حسگرهای فیزیکی ثابت با حسگرهای انسانی (تولید شده توسط کاربر) برای کار بهبود کیفیت داده (به منظور بهبود تصمیم‌گیری) به عنوان مشکل همجوشی داده‌ها و پردازش (SDFP) نامیده می‌شود [1] .]. نویسندگان یک سیستم پشتیبانی جمع سپاری را برای نظارت بر بلایا ایجاد کردند، و روش ترکیب تصمیم متمرکز (CDF) را برای پلت فرم، بر اساس تشخیص تصادفی و تئوری تخمین بیان شده در قالب آزمون‌های فرضیه دودویی، با استفاده از ترکیب ارزش و ترکیب تصمیم، پیشنهاد کردند. مثال دیگر Social Fusion ([ 27 ])، پلت فرمی برای ترکیب داده ها از منابع و انواع مختلف (به عنوان مثال، حسگرهای داده تلفن همراه، شبکه های اجتماعی و حسگرهای شبکه های ثابت)، با هدف ایجاد برنامه های کاربردی آگاه از زمینه است. ترکیب با استفاده از مجموعه‌ای از طبقه‌بندی‌کننده‌ها برای استخراج استنتاج‌های متنی معنادار از داده‌ها، در حالی که مکانیسم جمع‌آوری داده‌ها را از مرحله طبقه‌بندی تقسیم می‌کند، انجام می‌شود.

3. روش شناسی

3.1. معرفی

از آنجایی که داده‌های آب و هوا عامل مهمی برای سیستم‌های مختلف مدیریت بلایای طبیعی و طبیعی است، پارامترهای آب و هوای آتش‌سوزی به عنوان مطالعه موردی انتخاب می‌شوند. آب و هوای آتش سوزی داده های هواشناسی است که بر آتش سوزی های زمین وحشی تأثیر می گذارد ([ 28 ]). دو مورد از پارامترهای اصلی آب و هوای آتش سوزی عبارتند از: دمای محیط (AT) و رطوبت نسبی (RH) ([ 29 ]). سیستم‌های رتبه‌بندی خطر آتش‌سوزی رایج‌ترین سیستم‌های رتبه‌بندی خطر آتش‌سوزی جنگل‌های کانادا (CFFDRS) و سیستم رتبه‌بندی خطر آتش‌سوزی ملی (NFDRS) هستند که در ایالات متحده استفاده می‌شوند. الزامات ورودی هر دو سیستم برای AT و RH در جدول 1 نشان داده شده است .

3.2. داده های جمع آوری شده

داده‌های آب‌وهوای جمع‌آوری‌شده در آزمایش‌های صحرایی، AT و RH هستند، همراه با داده‌های کمکی، شرایط محیطی موجود در طول اندازه‌گیری‌ها را توصیف می‌کنند، در حالی که برخی ممکن است بر دستگاه جمع‌آوری و در نتیجه قابلیت اطمینان و دقت داده‌های آب و هوای حسی جمع‌آوری‌شده تأثیر بگذارند. داده های کمکی عبارتند از: (1) روشنایی، که ممکن است داده های آب و هوا را به دلیل تابش خورشید که سکوی جمع آوری (دستگاه) را گرم می کند، سوگیری کند. (2) نزدیکی، تشخیص اختلالات بیرونی احتمالی در فاصله نزدیک. (3) ویژگی‌های باتری، که ممکن است بر خوانش‌های حسگر تأثیر بگذارد و به درک استفاده فعلی از دستگاه جمع‌آوری کمک کند. و (4) GPS، به دست آوردن موقعیت جغرافیایی اندازه گیری.

3.3. پلتفرم جمع آوری داده ها

با توجه به استفاده از روش جمع‌آوری داده‌های تولید شده توسط کاربر جمع‌سپاری، که متکی بر افراد ناهمگن تصادفی واقع در نزدیکی منطقه مورد علاقه است، لازم است از یک دستگاه قابل حمل که توانایی جمع‌آوری آب و هوا و داده‌های کمکی فوق‌الذکر را داشته باشد و با آن ارتباط برقرار کند (از طریق اینترنت) به یک سیستم مرکزی. پلتفرم‌های رایج‌تر و گسترده‌تر جمع‌آوری داده‌ها، احتمال مشارکت شهروندان در جمع‌آوری داده‌ها، افزایش حجم داده‌ها و احتمالاً دقت، تراکم و قابلیت اطمینان کلی شبکه را افزایش می‌دهند. بررسی بازار نشان داد که Samsung Galaxy S4 (SG4) مدل GT-I9500، حاوی تمام سنسورهای لازم برای ارائه داده های فوق، به طور گسترده توسط شهروندان استفاده می شود و سهم بازار سامسونگ 25٪ است ([ 32]). SG4 شامل GPS، موقعیت یابی ژئومغناطیسی، و همچنین ژیرومتر، شتاب سنج، فشارسنج، دماسنج، رطوبت سنج، حسگر نور RGB، حسگر ژست، حسگر مجاورت و میکروفون است ([33] ) .

سنسور AT و RH تعبیه شده در دستگاه SG4 SHTC1 است که توسط “Sensirion” ساخته شده و در یک محیط کنترل شده کالیبره شده است. دقت رسمی سنسور در جدول 2 نشان داده شده است ، که در مقایسه با الزامات NFDRS و CFFDRS ( جدول 1 )، از نظر تئوری قابل قبول و در محدوده مناسب است. از نظر تئوری، در شرایط عادی، حسگر SHTC1 پتانسیل ارائه با قرائت های قابل اعتماد را دارد که هدف مطالعه ما را برآورده می کند ([ 34 ]).

3.4. برنامه جمع آوری داده ها

با بررسی برنامه‌های موجود مناسب برای پلت‌فرم جمع‌آوری داده‌های آب‌وهوا (سیستم عامل اندروید)، برنامه‌ای که نیازهای ما (تنوع پارامترهای ثبت‌شده، اتوماسیون، سادگی رابط کاربری) را برآورده می‌کند، WeatherSignal بود که در شکل 1 نشان داده شده است . این برنامه یک نقشه آب و هوا مبتنی بر جمع سپاری ایجاد می کند، که در آن کاربران می توانند انواع داده های آب و هوا را از حسگرهای تعبیه شده در دستگاه های تلفن همراه خود جمع آوری کنند.

3.5. داده های مرجع

داده های ایستگاه های هواشناسی ایستگاه هواشناسی اسرائیل (IMS) به عنوان مرجع استفاده می شود که با استانداردهای سازمان جهانی هواشناسی (WMO) مطابقت دارد ([ 36 ]). جدول 3 دقت حسگرهای AT و RH مورد استفاده در ایستگاه های هواشناسی IMS را نشان می دهد. از مارس 2016، 84 ایستگاه بدون سرنشین برای منطقه اسرائیل وجود دارد، در حالی که داده‌ها و ابرداده‌های جمع‌آوری‌شده در دسترس عموم هستند ( www.data.gov.il ).

3.6. مجموعه داده های میدانی

هدف سناریوهای جمع‌آوری داده‌ها، ارائه درک تحلیلی و آماری از داده‌های آب‌وهوای جمع‌آوری‌شده از نظر دقت و قابلیت اطمینان است که برای توسعه روش‌ها و الگوریتم‌های بهینه و قوی جمع‌آوری و پردازش لازم است. این کار با جمع آوری داده های آب و هوا و کمکی تولید شده توسط کاربر در سه سناریو مختلف انجام می شود.

3.6.1. سناریو 1: اندازه گیری طولانی مدت

هدف این سناریو بررسی دقت اندازه‌گیری‌ها در شرایط غیرآزمایشگاهی نسبت به دقت سازنده رسمی است ( جدول 2 ). داده ها به طور مداوم برای مدت زمان طولانی (12 ساعت) جمع آوری شد، در حالی که SG4 به صورت ایستا در یک مکان سایه دار (که به عنوان یک کلبه هواشناسی عمل می کند) قرار گرفت تا گرمایش را از قرار گرفتن در معرض نور مستقیم خورشید حذف کند. SG4 در نزدیکی یک ایستگاه IMS (پالایشگاه هایفا، شمال اسرائیل) برای مقایسه اندازه‌گیری‌ها قرار داشت که در شکل 2 نشان داده شده است.. نرخ نمونه برداری از اندازه گیری ها هر 10 ثانیه بود. از آنجایی که دقت داده ها در رابطه با IMS تعیین می شود، که در آن اندازه گیری ها برای هر 10 دقیقه میانگین می شود، داده های جمع آوری شده به طور مشابه میانگین گیری شدند. اگرچه فاصله بین مکان ها چندین کیلومتر است، اما فرض بر این است که مقادیر اندازه گیری باید مشابه باشند، عمدتا برای چنین مدت زمان طولانی و میانگین اندازه گیری ها.

3.6.2. سناریو 2: اندازه گیری های کوتاه مدت

هدف این سناریو تقلید از فرآیند جمع‌سپاری واقعی است. فرآیند جمع‌آوری به دلیل حجم نمونه کوچک امکان شناسایی و حذف موارد پرت را ندارد، بنابراین پس پردازش عملی نیست. این سناریو از چهار جلسه اندازه گیری مختلف تشکیل شده است که هر جلسه با زمان های اندازه گیری متفاوت مشخص می شود و شرایط محیطی مختلف را در طول روز پوشش می دهد: 01:00-02:00، 08:00-09:00، 13:00-14:00 و 19. :00-20:00. اندازه گیری ها در نزدیکی دو ایستگاه مرجع IMS (پالایشگاه های حیفا و دانشگاه حیفا، نشان داده شده در شکل 2 ) انجام شد .

3.6.3. سناریو 3: شرایط محیطی تأثیر می گذارد

قرائت‌های SG4 ممکن است تحت تأثیر شرایط محیطی قرار بگیرند، عمدتاً قرار گرفتن در معرض نور مستقیم خورشید، که بر خوانش‌های سنسور تأثیر می‌گذارد و سوگیری می‌کند. هدف در اینجا توسعه یک الگوریتم است که بتواند به طور خودکار تشخیص دهد و نشان دهد که چه زمانی اندازه‌گیری‌ها قابل اعتماد هستند (بدون سوگیری توسط تأثیرات خارجی). این با استفاده از سناریوهای اندازه‌گیری مختلف به دست می‌آید، که در آن SG4 در معرض نور مستقیم خورشید، قرائت‌های بایاس قرار گرفته و به مکانی سایه‌دار منتقل می‌شود. داده‌های خام جمع‌آوری‌شده در طول این سناریو برای یافتن شاخص‌ها مورد تجزیه و تحلیل قرار می‌گیرند، که در الگوریتمی استفاده می‌شود که هدف آن شناسایی زمانی است که قرائت‌های حسگر موبایل تثبیت شده‌اند، و بنابراین می‌توانند در زمان واقعی مورد استفاده قرار گیرند.

3.7. تحلیل داده ها

تجزیه و تحلیل داده ها با هدف تعیین ویژگی های آماری داده های جمع آوری شده است. دقت داده ها با استفاده از RMSE (ریشه میانگین مربعات خطا)، که در معادله (1) نشان داده شده است، محاسبه می شود. این شبیه به ارزیابی دقت بین مجموعه‌های داده در کاربردهای زمین‌آماری است: با استفاده از مقادیر داده‌های آب‌وهوای تولید شده توسط کاربر اندازه‌گیری شده ( L )، و مقادیر مرجع اندازه‌گیری شده توسط ایستگاه‌های رسمی IMS (µ). اگر پارامتر تخمین زده شده با استفاده از RMSE بدون سوگیری باشد، آنگاه مقدار RMSE برابر با مقدار انحراف استاندارد (SD) است.

R M اس E = \sum n i = 1 ( L من - μ من ) 2 n ————-\sqrt

(1)

برای تعیین کمیت عدم قطعیت یک تخمین نقطه ای خاص، در این مورد عدم قطعیت میانگین باقیمانده، یک فاصله اطمینان حول تخمین نقطه ای محاسبه می شود. اگر توزیع داده ها نرمال نباشد، فاصله اطمینانی که بر اساس مقدار میانگین است، ممکن است دقیق نباشد. اگر باقیمانده ها به طور معمول توزیع شوند، مقدار RMSE در مقداری ضرب می شود که نشان دهنده خطای ضریب احتمال توزیع نرمال استاندارد از میانگین در سطح اطمینان 95٪، Z = 1.96 است. بنابراین، فاصله اطمینان از میانگین برآوردگر/نمونه به دست می آید

\bar{X}

مانند (

\bar{X} - Z * R M S E, \bar{X} + Z * R M S E)

(به عنوان مثال، [ 38 ]). حذف پرت با استفاده از روش IQR (محدوده بین ربعی) انجام می شود ([ 39 ])، در حالی که داده های پذیرفته شده در بازه زمانی (چرک اول – 1.5 IQR، چارک سوم + 1.5 IQR) در نظر گرفته می شوند. به این ترتیب، نقاط پرت را می توان برای بهبود دقت نتایج شناسایی و فیلتر کرد.

برای ارزیابی توزیع نرمال (مواد باقیمانده)، آزمون فرضیه صفر نرمال بودن Shapiro-Wilk W مطابق با معادله (2) اجرا می‌شود ([ 40 ، 41 ]). x _( i ) آمار مرتبه i است ، $\bar{x}$ میانگین نمونه است، و a _i ثابت‌هایی هستند که از مقادیر مورد انتظار آمار نظم نمونه‌برداری شده از توزیع نرمال استاندارد و ماتریس کوواریانس به دست می‌آیند. در صورتی که پارامتر معناداری کمتر از سطح آلفای انتخابی باشد (به عنوان مثال 0.05 برای 5%)، فرضیه صفر رد می شود، به این معنی که داده ها به طور معمول توزیع نمی شوند. مزیت این آزمون این است که نتیجه آن عینی است، یعنی توسط ناظر تفسیر نمی شود (شاید ذهنی).

دبلیو = ( \sum n i = 1 آ من ایکس ( من ) ) 2 \sum n i = 1 ( ایکس من - ایکس ¯ ) 2

(2)

از آنجایی که هر دو اندازه گیری AT و RH ممکن است همبستگی قوی داشته باشند، آزمون همبستگی پیرسون ([ 42 ]) طبق رابطه (3) انجام شد. این کار برای شناسایی سوگیری بودن قرائت سنسور انجام می شود. $r$ ضریب همبستگی پیرسون است، $\bar{X}$ و $\bar{Y}$ میانگین نمونه مجموعه داده های اول و دوم هستند و $X_{i}$ و $Y_{i}$ مقدار i مجموعه داده اول و دوم هستند.

r = \sum ( ایکس من - ایکس ¯¯¯ ) ( Y من - Y ¯¯¯ ) [ \sum ( ایکس من - ایکس ¯¯¯ ) 2 \sum ( Y من - Y ¯¯¯ ) 2 ] 1 2 /

(3)

3.8. اعتبار سنجی داده ها

اعتبار سنجی داده ها با هدف توسعه یک الگوریتم برای نشان دادن اینکه آیا داده های جمع آوری شده توسط کاربر برای استفاده قابل اعتماد هستند یا خیر. داده های اندازه گیری شده در سناریوی 3 استفاده می شود. الگوریتم فقط بر اساس داده های جمع آوری شده است و بر هیچ داده خارجی (مرجع) تکیه نمی کند. نتایج بعداً با داده های مرجع IMS برای تجزیه و تحلیل آماری و تأیید مقایسه می شوند. این الگوریتم از شاخص های داده (آستانه) استفاده می کند که نقطه تثبیت را طبقه بندی می کند: شناسایی، در زمان واقعی، زمانی که داده های آب و هوای جمع آوری شده قابل استفاده هستند. از آنجایی که زمان های کالیبراسیون حسگرها (که برای به دست آوردن نتایج قابل اطمینان لازم است) ثابت نیستند و نمی توان آنها را از پیش تعیین کرد، مجموعه ای از چهار پارامتر را طبقه بندی کرده ایم که به صورت پویا (در زمان واقعی) در طول اندازه گیری ها محاسبه می شوند: (1) مقدار گرادیان. (2) مقدار SD; (3) تعداد مشاهدات. و (4) خواندن اشراق. این پارامترها از آنجایی انتخاب می شوند که در صورت ترکیب به عنوان شاخص های قابل اعتماد برای تثبیت و تداوم اندازه گیری داده ها عمل می کنند. گردش کار الگوریتم تثبیت در به تصویر کشیده شده استشکل 3 .

شکل 4 تغییر قرائت AT را به دلیل قرار گرفتن در معرض نور مستقیم خورشید (55000 لوکس) نشان می دهد. هنگامی که دستگاه جمع آوری به سایه منتقل شد، حسگر نور فقط چند صد لوکس را اندازه گیری کرد. تنها چند دقیقه بعد AT به 21 درجه سانتیگراد تثبیت می شود، مشابه داده های مرجع IMS (خوانش های RH اثر مشابهی دارند). این نشان می دهد که اگرچه مقدار روشنایی نشانه خوبی است، تنها ترکیبی از چهار پارامتر ذکر شده در بالا می تواند ثبات داده را تعیین کند. چهار پارامتر، که در جدول 4 نشان داده شده اند ، به صورت تجربی بر اساس یک فرآیند بهینه سازی با استفاده از پنج جلسه مشاهده در سناریوی 3 محاسبه شدند.

3.9. تراکم شبکه

با بررسی پتانسیل استفاده از داده‌های آب و هوای تولید شده توسط کاربر در مقیاس بزرگ‌تر، از داده‌های آب و هوا از نقشه آب‌وهوای جمع‌سپاری WeatherSignal ( www.weathersignal.com ) استفاده می‌کنیم. WeatherSignal از حسگرهای تعبیه‌شده تلفن همراه برای اندازه‌گیری شرایط جوی محلی استفاده می‌کند که سپس بر روی نقشه آب و هوای آنلاین آنها نمایش داده می‌شود. WeatherSignal توسط صدها هزار کاربر در سراسر جهان استفاده می شود و میلیون ها داده اندازه گیری آب و هوا تولید شده توسط کاربر را ذخیره می کند. به طوری که با استفاده از داده های ذخیره شده در پایگاه داده WeatherSignal، عملاً از داده های افرادی استفاده می کنیم که به طور فعال مشارکت می کنند و به طور مداوم داده های آب و هوا را جمع آوری می کنند.

داده‌های خام دانلود شده دارای میلیون‌ها ورودی داده هستند، بنابراین فیلتر کردن داده‌ها برای حذف قرائت‌های نامربوط یا اشتباه ضروری است. برای این، یک الگوریتم توسعه داده شده است که در ArcMap با استفاده از سازنده مدل، که در شکل 5 نشان داده شده است، پیاده سازی شده است . این الگوریتم از جستارهای مختلف اجرا شده در پایتون، که در جدول 5 نشان داده شده است، تشکیل شده است: مرزهای مکانی محیط مطلوب، دقت مکان کافی، و آستانه های داده های حسی کمکی. هدف الگوریتم فیلتر تشخیص اینکه آیا خوانش‌ها در داخل یا خارج از خانه توسط مجموعه‌ای از جستارهای تکمیلی گرفته شده‌اند، و همچنین خوانش‌های نامربوط یا اشتباه را فیلتر می‌کند. AT داخلی ممکن است متفاوت از AT در فضای باز باشد، به طوری که فیلتر کردن مشاهدات داخلی مهم است. این توسط سه پرس و جو انجام شد (نگاه کنید بهجدول 5 : (الف) دستگاه جمع آوری به یک دستگاه خارجی (از جمله پاور بانک های قابل حمل) وصل شده است. (ب) دستگاه در حال شارژ شدن است. و (ج) دستگاه به سرعت حرکت می کند، به عنوان مثال، در یک ماشین. به عنوان مثال، در مجموعه داده ما، تقریباً 30٪ از همه خواندن ها بر اساس استفاده از این پرس و جوها و آستانه ها فیلتر شدند. روش دیگر، استفاده از تطبیق نقشه موقعیت دستگاه‌های مجموعه با لایه‌های GIS (به عنوان مثال، ساختمان‌ها، مرزهای شهر و جاده‌ها) یا مدل‌های سطح دیجیتال منطقه ممکن است مفید باشد. با این حال، دقت دستگاه ها ممکن است ضعیف باشد (سیگنال GPS بد، چند مسیر در مناطق ساخته شده یا موقعیت مبتنی بر شبکه تلفن همراه)، به طوری که تطبیق ممکن است نتایج اشتباهی ایجاد کند، یا مناطق شهری ممکن است به طور کامل فیلتر شوند. برای حل این مشکل، مجموعه‌ای از آزمون‌های فرضیه‌های آماری تکمیلی را اعمال کرده‌ایم (به بخش 3.10 مراجعه کنید.) برای شناسایی و حذف خطاهای داده و موارد پرت که ممکن است از خوانش های داخل ساختمان ایجاد شود.

3.10. تجزیه و تحلیل جغرافیایی آماری

دو آزمون فرضیه زمین‌آماری بر روی داده‌های WeatherSignal پس از فیلتر انجام می‌شود، با هدف اثبات اینکه آیا می‌توان آن را به عنوان بخشی جدایی ناپذیر از شبکه آب و هوای ژئوسنسور IMS در نظر گرفت. اول، یک آزمون فرضیه صفر همبستگی خودکار مکانی محلی، Anselin Local Moran’s I ([ 43 ])، که همبستگی فضایی همه قرائت‌ها را در مجاورت آنها بررسی می‌کند. در صورتی که هیچ نقطه پرت شناسایی نشود، داده های WeatherSignal از نظر آماری به عنوان انتگرال شبکه IMS از نظر همبستگی در نظر گرفته می شوند. رد فرضیه صفر به این معنی است که تفاوت‌های بین مقادیر تصادفی نیستند، بلکه از داده‌های ناسازگار مشتق شده‌اند. آمار I Anselin Local Moran ( $I_{i}$ ) در معادله (4) نشان داده شده است، جایی که $x_{i}$ ویژگی ویژگی i است (AT یا RH)، $\bar{x}$ میانگین صفت مربوطه است و $w_{i, j}$ وزن فضایی (فاصله) بین ویژگی i و j است .

من من = ایکس من - ایکس ¯¯¯ اس 2 من \cdot \sum n j = 1; j \neq i w من ، ج (ایکس j - ایکس ¯¯¯) اس 2 من = \sum n j = 1 ; j \neq i ( ایکس j - ایکس ¯¯¯ ) 2 n - 1 ز من من = من من - E [ من من ] V [ من من ] —-\sqrt E [من من] = - \sum n j = 1 ; j \neq i w من ، ج n - 1 V [من من] = E [من 2 من] - E [من من] 2

(4)

دوم، یک آزمون فرضیه صفر همبستگی خودکار فضایی جهانی، Anselin Global Moran’s I ([ 44 ])، که همبستگی فضایی مکان ویژگی ها را با توجه به ارزش ویژگی خاص بررسی می کند. این آزمون سراسری است، به این معنی که الگوی فضایی کامل همه داده ها (خوشه ای، پراکنده یا تصادفی) را بررسی می کند. اگر فرضیه صفر رد شود، داده ها به طور تصادفی پخش نمی شوند، در حالی که اگر نتیجه به اندازه کافی قابل توجه باشد، می توان بیان کرد که داده ها خوشه ای هستند، به این معنی که داده های WeatherSignal بخشی جدایی ناپذیر از شبکه آب و هوای ژئوسنسور IMS هستند. آماره I Anselin Global Moran ( I ) در معادله (5) نشان داده شده است، جایی که $z_{i}$ انحراف ویژگی i (AT و RH) از میانگین آن است، $S_{0}$ تجمیع وزن های فضایی است و $w_{i, j}$ وزن فضایی (فاصله) بین ویژگی i و j است .

من = n اس 0 \cdot \sum n i = 1 \sum n j = 1 w من ، ج z من z j \sum n i = 1 z 2 من اس 0 = \sum i = 1 n \sum j = 1 n w من ، ج ز من = من - E [ من ] V [ من ] —-\sqrt E [من] = - 1 / (n - 1) V [I] = E [من 2] - E [من] 2

(5)

4. نتایج تجربی

4.1. سناریو 1

تعداد کل اندازه‌گیری‌ها به 1600 انباشته می‌شود، که میانگین نرخ نمونه‌گیری تقریباً 30 ثانیه را بیان می‌کند، و تعداد کل 73 جلسه تجزیه‌وتحلیل شده را ایجاد می‌کند (اعداد با فاصله 10 ثانیه‌ای برنامه‌ریزی‌شده این آزمایش متفاوت است، زیرا برخی از دوره‌ها وجود نداشتند یا اندازه‌گیری‌های نامربوطی را نشان دادند).

4.1.1. نتایج دمای محیط

تفاوت میانگین AT بین اندازه‌گیری‌های SG4 و IMS 1.2 درجه سانتی‌گراد، با SD 2 درجه سانتی‌گراد و RMSE 2.3 درجه سانتی‌گراد است. فاصله تخمینی میانگین با احتمال 95% 4.5 ± 1.2 درجه سانتیگراد است، با حداقل و حداکثر تفاوت به ترتیب 1.9- درجه سانتیگراد و 9.2 درجه سانتیگراد. نتایج ممکن است شامل خطاهای فاحشی باشد که بعدا بررسی خواهد شد. هفتاد و دو درصد از باقیمانده های محاسبه شده از مقدار اندازه گیری شده بالاتر از مقدار مرجع هستند، که نشان می دهد که SG4 تمایل دارد AT را بیش از حد تخمین بزند. این نیز مقادیر بالای باقیمانده مثبت را بر خلاف مقادیر باقیمانده منفی کوچک توضیح می دهد.

با توجه به حجم نسبتاً بزرگ نمونه (73 اندازه گیری)، فرض می شود که باقیمانده ها از یک توزیع نرمال به دست آمده اند. برای تأیید این امر، ترکیبی از تجزیه و تحلیل بصری با آزمون آماری انجام می شود. نتیجه آزمون Shapiro-Wilk در جدول 6 نشان داده شده است(بالا). سطح معنی داری 0.01 (<0.05) نشان می دهد که فرضیه صفر رد می شود. بنابراین، جمعیت به طور معمول توزیع نشده است. بررسی هیستوگرام و نمودار احتمال نرمال نشان داد که به جز چند اندازه گیری مشکوک، داده ها را می توان به طور معمول توزیع کرد، بنابراین نتیجه گیری در مورد توزیع داده ها مبهم است. بر این اساس، تشخیص نقاط پرت برای شناسایی مشاهدات با مقادیر اشتباه با استفاده از تصویرسازی باکس پلات که برای مقایسه توزیع‌ها و شناسایی نقاط پرت مفید است، انجام می‌شود. Boxplot نسبت به مقادیر شدید داده ها حساسیت کمتری دارد زیرا از میانگین یا SD استفاده نمی کند بلکه از چارک ها استفاده نمی کند و به توزیع عادی محدود نمی شود ([ 40]]). در نتیجه، چندین قرائت به عنوان نقاط پرت در خارج از سبیل باکس پلات شناسایی می شوند. با حذف این قرائت‌های پرت، AT دوباره تجزیه و تحلیل می‌شود، با نتایج نشان‌دهنده کاهش مقادیر آماری: فاصله تخمینی 95% 0.9 ± 3.2 درجه سانتی‌گراد، RMSE 1.6 درجه سانتی‌گراد و حداقل و حداکثر مقادیر اختلاف 1.9- و 3.9 است. درجه سانتیگراد به ترتیب اجرای مجدد آزمون نرمال بودن Shapiro-Wilk، که در جدول 6 (پایین) نشان داده شده است، این فرض را تأیید می کند که داده ها از یک جمعیت توزیع شده نرمال مشتق شده اند (Sig. 0.4 > 0.05 Alpha)، همچنین با تصویرسازی باکس پلات از داده ها تأیید شده است.

4.1.2. نتایج رطوبت نسبی

نتایج سناریوی 1 اندازه گیری RH یک تفاوت میانگین بین اندازه گیری SG4 و IMS مرجع 2-٪ با مقادیر SD و RMSE 8٪ ایجاد کرد. با فرض اینکه داده ها به طور معمول توزیع شده اند، فاصله تخمینی 95% 16±2% و به ترتیب مقادیر اختلاف حداقل و حداکثر 21% و 15% است. برخلاف AT، داده‌ها در اینجا به طور معمول توزیع می‌شوند، که توسط آزمون نرمال بودن Shapiro-Wilk (Sig. 0.1 > 0.05 آلفا)، نشان‌داده‌شده در جدول 7 ، و همچنین تجسم نمودار جعبه، بدون داده‌های پرت، اثبات شده است.

4.1.3. همبستگی بین رطوبت نسبی و دمای محیط

هنگامی که هر دو اندازه گیری SG4 AT و RH با داده های مرجع IMS مقایسه شدند، یک همبستگی قوی بین اندازه گیری ها وجود داشت: هر زمان که اندازه گیری AT بالاتر از مقدار مرجع (“درست”) باشد، اندازه گیری RH کمتر از مقدار مرجع است. شکل 6 هر دو مقدار باقیمانده را مقایسه می کند. نتایج آزمون همبستگی پیرسون در جدول 8 نشان داده شده است، نشان می دهد که وقتی باقیمانده های AT مثبت قوی هستند، باقیمانده های RH منفی قوی خواهند بود و بالعکس، ثابت می کند که یک همبستگی منفی قوی وجود دارد. به گونه ای که هرگاه پارامتری بایاس شود، بر پارامتر دیگر تأثیر می گذارد، به این معنی که سنسور بایاس است. این را می توان با چندین فرض توضیح داد، اصلی ترین آن این است که با توجه به این واقعیت که حسگر یکسان برای اندازه گیری AT و RH به طور همزمان استفاده می شود، بر تمام پارامترهای اندازه گیری شده تأثیر می گذارد (بایاس). فرض دیگر این است که شرایط محیطی موجود بر خوانش حسگرها تأثیر می گذارد، بنابراین آنها را برای هر دو پارامتر سوگیری می کند.

4.1.4. خلاصه و نتیجه گیری

تجزیه و تحلیل ها نشان می دهد که هر دو اندازه گیری AT و RH به طور معمول توزیع می شوند، اگرچه اختلاف بین مقادیر SHTC1 اعلام شده و مقادیر جلسات میدان واقعی نسبتاً بزرگ است. مقایسه الزامات دقت و نتایج دقت جلسات مختلف در جدول 9 ارائه شده است ، که نشان می‌دهد داده‌های آب و هوای تولید شده توسط کاربر در محل هر دو الزامات CFFDRS و NFDRS هستند.

4.2. سناریو 2

مقایسه آمار سناریو 2 و سناریو 1 نشان داده شده در جدول 10، تا حدودی بهبود را نشان می دهد. به عنوان مثال، میانگین باقیمانده، RMSE، SD و حداکثر بازه باقیمانده اندازه‌گیری‌های AT نزدیک به 50٪ کاهش یافت. توضیح احتمالی برای این موارد ممکن است به دلیل شرایط محیطی موجود در محیط اندازه‌گیری باشد، که باعث شد حسگر متحرک در سناریوی طولانی مدت 1 گرم شود و اندازه‌گیری‌ها را سوگیری کند. در اندازه‌گیری‌های کوتاه مدت (سناریوی 2)، به دلیل زمان جمع‌آوری کوتاه ، موقعیت خورشید مشابه باقی ماند ، بنابراین دستگاه جمع آوری در کل مرحله اندازه گیری سایه داشت. توضیح دیگر می تواند به دلیل دریفت شدن سنسور SHTC1 باشد، که اگرچه طبق داده های SHTC1 ناچیز در نظر گرفته می شود، اما بر اندازه گیری ها تأثیر می گذارد (به طور مشابه با دقت ارزیابی شده واقعی که بدتر از رسمی بود).جدول 9 ) به نظر می رسد که دقت AT تولید شده توسط کاربر شبیه به نیاز NFDRS است و نتیجه می گیرد که اندازه گیری ها می توانند به عنوان ورودی برای چنین کاربردهایی در نظر گرفته شوند. دقت RH تولید شده توسط کاربر به نیاز CFFDRS نزدیک‌تر است، همچنان در 2٪ از میزان مورد نیاز بایاس است. به طور کلی، نتایج آزمایش‌های سناریو 1 و سناریو 2 ثابت می‌کند که روش پیشنهادی استفاده از داده‌های آب‌وهوای تولید شده توسط کاربر برای تقویت شبکه ژئوسنسور آب‌وهوا، حتی زمانی که هیچ پس‌پردازش داده‌ای صورت نگرفته است، قابل بررسی است.

4.3. سناریو 3

مجموعه ای از پنج جلسه انجام شد که در جدول 11 نشان داده شده است و به عنوان ورودی برای فرآیند تثبیت استفاده می شود. شکل 7پارامتر گرادیان اندازه‌گیری‌های AT را نشان می‌دهد که برای تعداد قرائت‌های مختلف محاسبه می‌شود تا تعداد قرائت‌های لازم برای تشخیص واضح نقطه تثبیت را تعیین کند. می توان استنباط کرد که تنها پس از 30 خواندن تثبیت انجام می شود، گرادیان فیلتر بر روی مقادیر مشابه AT (مقدار گرادیان نزدیک به صفر) محاسبه می شود. بر این اساس، آستانه گرادیان کمتر از 0.05 انتخاب می شود. مقدار SD، که معیار کاهش است، می‌تواند پیش‌بینی کند که آیا اندازه‌گیری‌ها پراکنده یا پایدار هستند، بنابراین زمانی که مقادیر اندازه‌گیری مشابه و بدون نوسان هستند، تثبیت به دست می‌آید. به طور مشابه، به گرادیان، 30 قرائت یک مقدار SD با روند داده خوب ارائه کردند.

مشخص شد که اگر روشنایی کمتر از 50000 لوکس باشد، به این معنی نیست که داده ها تثبیت شده اند، فقط دستگاه جمع آوری مستقیماً در معرض نور خورشید قرار نمی گیرد. تنها ترکیبی از آستانه چهار پارامتر می تواند ثبات داده را تعیین کند. چهار پارامتر تثبیت به صورت تجربی محاسبه شدند، در رابطه با پنج جلسه تجزیه و تحلیل شدند، در حالی که مقدار آستانه برای هر یک در جدول 4 تعریف شده است ، با گردش کار الگوریتم تثبیت که در شکل 3 نشان داده شده است .

مقایسه داده های IMS AT (مرجع) با قرائت های تولید شده توسط کاربر همراه با شاخص های الگوریتم تثبیت در شکل 8 نشان داده شده است . نقطه تثبیت به طور خودکار و درست تعیین می شود. شکل 8 اثر مقادیر لوکس را نشان می‌دهد و ثابت می‌کند که مدتی طول می‌کشد تا اندازه‌گیری‌ها ثابت شوند و خوانش‌های دقیق ایجاد شود. قرائت AT (و همچنین RH) از هر دو منبع داده پس از تعیین خودکار نقطه تثبیت (کالیبراسیون) مشابه است.

5. نمایش کاربردی

5.1. مجموعه داده های آب و هوا

پتانسیل استفاده از داده های آب و هوای جمع سپاری شده با استفاده از نقشه آب و هوای جمع سپاری WeatherSignal نشان داده شده است. مشاهدات از پایگاه داده WeatherSignal برای دوره 1 ژوئن 2015 تا 22 اوت 2015 دانلود شد. بیش از دو میلیون رکورد بازیابی شد که تقریباً 24000 خواندن در روز و 1000 خواندن در ساعت را بیان می کند. در میان سایر موارد، هر خواندن (رکورد) شامل موارد زیر است: اندازه گیری مکان، AT، RH، روشنایی، سرعت، و اندازه گیری مجاورت. با استفاده از یک جستجوی فضایی ساده برای منطقه اسرائیل، در مجموع 7600 قرائت برای دوره 17 اوت 2015 تا 20 اوت 2015 بارگیری شد که تنها در 20 اوت 2015، 3755 قرائت انجام شد. شکل 9مناطقی را به تصویر می‌کشد که چگالی داده‌های آب‌وهوای WeatherSignal تولید شده توسط کاربر به طور قابل‌توجهی به تراکم ایستگاه‌های هواشناسی IMS موجود کمک می‌کند. واضح است که خوانش‌های مبتنی بر جمع‌سپاری شکاف‌ها را در مناطقی که پوشش ندارند یا ایستگاه‌های هواشناسی پراکنده‌اند پر می‌کنند.

5.2. پیش پردازش داده های آب و هوای تولید شده توسط کاربر

فرآیند فیلتر، که در جدول 5 نشان داده شده است، بر روی داده های آب و هوای تولید شده توسط کاربر در 20 آگوست 2015 پیاده سازی شده است، که در آن موقعیت GPS نادرست (نزدیک به 1200 قرائت)، داده هایی که ناقص هستند، به عنوان مثال، AT، RH موجود نیست (327 قرائت)، یا نامربوط، به عنوان مثال، در داخل ساختمان (بیش از 1000 قرائت)، فیلتر شده و استفاده نمی شود، که منجر به 730 قرائت (از 3755 اولیه) می شود. از آنجایی که آب و هوا دائماً در حال تغییر است، ما بر یک دوره زمانی خاص تمرکز کرده‌ایم که در آن فرآیند متراکم‌سازی اجرا می‌شود. دوره 10:00 تا 12:00 انتخاب شد که منجر به 57 خواندن شد.

5.3. تجزیه و تحلیل جغرافیایی آماری

5.3.1. خود همبستگی فضایی محلی

نتایج آزمون فرضیه برای داده‌های RH نشان داد که سه نقطه پرت وجود دارد، به این معنی که اندازه‌گیری‌ها با قرائت‌های RH اطراف ناسازگار هستند. همه موارد پرت اندازه گیری IMS هستند و هیچ کدام توسط کاربر تولید نشده است. این نشان می‌دهد که آزمون فرضیه از لحاظ نظری تأیید می‌کند که داده‌های RH تولید شده توسط کاربر دانلود شده از WeatherSignal را می‌توان به عنوان بخشی از شبکه آب و هوای جامع در نظر گرفت. برای AT، این آزمایش پنج نقطه پرت را شناسایی کرد که همگی مقادیر قابل توجهی بالاتر از محیط اطرافشان داشتند، که باز هم از اندازه‌گیری‌های IMS سرچشمه می‌گرفتند، بدون اینکه هیچ کدام توسط کاربر تولید شده باشد و نتیجه‌گیری یکسانی نداشته باشد. اگرچه نتایج نشان می‌دهد که تمام نقاط پرت اندازه‌گیری IMS هستند، باید بیان کرد که قرائت‌های IMS قابل اعتمادتر در نظر گرفته می‌شوند. نقاط پرت می تواند به دلیل توپوگرافی منطقه ایجاد شود، که در اینجا تنها رابطه فضایی تعریف شده فاصله بود. علاوه بر این، تمام خوانش‌ها (تولید شده توسط کاربر و IMS) به‌طور یکسان در نظر گرفته شدند، زیرا هدف این بود که ثابت شود هر دو منبع داده مکمل یکدیگر هستند. بنابراین، این امکان وجود دارد که خوشه‌هایی از خوانش‌های هواشناسی تولید شده توسط کاربر مغرضانه باعث شوند که قرائت‌های دقیق IMS به عنوان نقاط پرت شناسایی شوند. این موضوع در به تصویر کشیده شده استشکل 10 ، هر دو نتایج آزمون فرضیه را تجسم می کند، و نشان می دهد که در برخی موارد، نزدیک ترین قرائت ها به نقاط پرت IMS شناسایی شده، قرائت های تولید شده توسط کاربر خوشه ای هستند.

5.3.2. همبستگی خودکار فضایی جهانی

نتایج این آزمون فرضیه در جدول 12 به تفصیل آمده است ، که نشان می دهد فرضیه صفر (امتیاز z) برای هر دو اندازه گیری RH و AT رد شده است. مقدار مثبت شاخص موران برای هر دو نشان می دهد که خوشه های فضایی داده های همگن وجود دارد. مقدار z-score خروجی برای هر دو (به ترتیب 6.9 و 10.4) نشان می‌دهد که کمتر از 1٪ احتمال وجود دارد که الگوهای خوشه‌ای می‌توانند نتیجه شانس تصادفی باشند. از آنجایی که داده ها تصادفی نیستند، داده های آب و هوای تولید شده توسط کاربر، همراه با داده های آب و هوای IMS، می توانند به عنوان یک مجموعه داده یکپارچه با همبستگی فضایی در نظر گرفته شوند.

5.4. متراکم شدن

چگالش از طریق درون یابی کریجینگ معمولی، که برای داده های آب و هوا (به عنوان مثال، [ 45 ، 46 ]) مناسب ترین در نظر گرفته می شود ، در هر دو داده آب و هوای تولید شده توسط کاربر و IMS اجرا می شود. کریجینگ معمولی چندین مدل نیمه متغیری (همبستگی فضایی) دارد که می توان از آنها استفاده کرد و بر اساس داده های تجربی ایجاد شد. مدلی که بهترین تناسب با نیم‌واریوگرام را دارد در اینجا انتخاب می‌شود (مثلاً منحنی باید از مرکز ابر مقادیر binned و تا حد امکان نزدیک به مقادیر میانگین عبور کند). مدل هایی که به بهترین شکل برای نیم متغیره های AT و RH یافت می شوند، به ترتیب کروی و نمایی هستند که در شکل 11 نشان داده شده اند .

درون یابی قرائت‌های AT سه بار اجرا شد: روی داده‌های ایجاد شده توسط کاربر WeatherSignal، روی داده‌های IMS و روی هر دو. با کم کردن شطرنجی درون یابی IMS از نمونه تولید شده توسط کاربر، نتایج از -2.7 درجه سانتیگراد تا 1.2 درجه سانتیگراد، با مقدار متوسط -1.1 درجه سانتیگراد و SD 1.2 درجه سانتیگراد متفاوت بود. مقادیر حداکثر مطلق تفاوت ها در مناطقی هستند که خوانش های تولید شده توسط کاربر کمیاب است، که دلالت بر درون یابی دارد که مقادیر را با تکیه بر داده های ناقص محاسبه می کند، به عنوان مثال، داده های آب و هوای تولید شده توسط کاربر ناکافی است. مشابه با AT، نقشه درونیابی تولید شده توسط کاربر RH نسبت به IMS پیوسته کمتری دارد، با درونیابی که در مناطقی با داده های پراکنده دقت کمتری دارد و منجر به اختلافات بزرگتر می شود. با کم کردن هر دو نقشه، مقادیر اختلاف در محدوده -3.3٪ و 14.1٪، با مقدار متوسط 6.7٪ و SD 3.5٪ است. تفاوت‌های ارزشی قابل توجه عمدتاً در مناطقی با خوانش‌های تولید شده توسط کاربر کمتر است. با مقایسه مناطقی که خوانش های تولید شده توسط کاربر بیشتری دارند، تفاوت در مقادیر AT و RH به ترتیب کمتر از -1 درجه سانتیگراد و کمتر از 5٪ بود که نتیجه خوبی است. اگرچه تفاوت‌هایی وجود دارد، اما نتایج کلی با توجه به اینکه توسط کاربرانی که به‌طور داوطلبانه بدون تجهیزات خاص مشارکت می‌کنند، رضایت‌بخش است. این در مقایسه با داده های IMS، که یک شبکه آب و هوای رسمی است، نگهداری، نظارت و کنترل کیفیت است. این احتمال وجود دارد که دلیل تفاوت ها عمدتاً به دلیل درون یابی باشد که باعث کاهش دقت داده ها شده است، عمدتاً در مناطقی که چگالی پایین داده های تولید شده توسط کاربر دارند. با مقایسه مناطقی که خوانش های تولید شده توسط کاربر بیشتری دارند، تفاوت در مقادیر AT و RH به ترتیب کمتر از -1 درجه سانتیگراد و کمتر از 5٪ بود که نتیجه خوبی است. اگرچه تفاوت‌هایی وجود دارد، اما نتایج کلی با توجه به اینکه توسط کاربرانی که به‌طور داوطلبانه بدون تجهیزات خاص مشارکت می‌کنند، رضایت‌بخش است. این در مقایسه با داده های IMS، که یک شبکه آب و هوای رسمی است، نگهداری، نظارت و کنترل کیفیت است. این احتمال وجود دارد که دلیل تفاوت ها عمدتاً به دلیل درون یابی باشد که باعث کاهش دقت داده ها شده است، عمدتاً در مناطقی که چگالی پایین داده های تولید شده توسط کاربر دارند. با مقایسه مناطقی که خوانش های تولید شده توسط کاربر بیشتری دارند، تفاوت در مقادیر AT و RH به ترتیب کمتر از -1 درجه سانتیگراد و کمتر از 5٪ بود که نتیجه خوبی است. اگرچه تفاوت‌هایی وجود دارد، اما نتایج کلی با توجه به اینکه توسط کاربرانی که به‌طور داوطلبانه بدون تجهیزات خاص مشارکت می‌کنند، رضایت‌بخش است. این در مقایسه با داده های IMS، که یک شبکه آب و هوای رسمی است، نگهداری، نظارت و کنترل کیفیت است. این احتمال وجود دارد که دلیل تفاوت ها عمدتاً به دلیل درون یابی باشد که باعث کاهش دقت داده ها شده است، عمدتاً در مناطقی که چگالی پایین داده های تولید شده توسط کاربر دارند. نتایج کلی با توجه به اینکه توسط کاربرانی که داوطلبانه بدون تجهیزات خاص مشارکت می کنند، رضایت بخش است. این در مقایسه با داده های IMS، که یک شبکه آب و هوای رسمی است، نگهداری، نظارت و کنترل کیفیت است. این احتمال وجود دارد که دلیل تفاوت ها عمدتاً به دلیل درون یابی باشد که باعث کاهش دقت داده ها شده است، عمدتاً در مناطقی که چگالی پایین داده های تولید شده توسط کاربر دارند. نتایج کلی با توجه به اینکه توسط کاربرانی که داوطلبانه بدون تجهیزات خاص مشارکت می کنند، رضایت بخش است. این در مقایسه با داده های IMS، که یک شبکه آب و هوای رسمی است، نگهداری، نظارت و کنترل کیفیت است. این احتمال وجود دارد که دلیل تفاوت ها عمدتاً به دلیل درون یابی باشد که باعث کاهش دقت داده ها شده است، عمدتاً در مناطقی که چگالی پایین داده های تولید شده توسط کاربر دارند.

برای متراکم کردن هر دو مجموعه داده، دو نقشه آب و هوای جدید با استفاده از درون یابی کریجینگ معمولی، حاوی داده‌های هر دو منبع ایجاد شد. نتایج درونیابی برای AT و RH در شکل 12 نشان داده شده است. با بررسی هر دو نقشه، مشخص است که آنها پیوسته و از نظر ارزش مشابه هستند و هیچ ناهنجاری قابل مشاهده ای در سراسر منطقه مورد تجزیه و تحلیل شناسایی نشده است. این فرضیه را پشتیبانی می‌کند که اندازه‌گیری‌های تولید شده توسط کاربر صحیح هستند، اندازه‌گیری‌های معتبر را سوگیری نمی‌کنند، و می‌توانند برای تراکم در نظر گرفته شوند. مهمتر از آن، واضح است که برخی از شرایط فیزیکی در سطح محلی (عمدتا در منطقه مرکزی اسرائیل) آشکار و روشن شده است، که شناسایی آنها سخت بود مگر اینکه از داده های تولید شده توسط کاربر استفاده شود. نتیجه جالب دیگر این است که سطوح ارزش موجود برای هر دو درونیابی – تا حدی – با توپوگرافی موجود در اسرائیل و با شرایط هواشناسی توزیع شده از جنوب به شمال مطابقت دارد. اینها نتیجه مستقیم استفاده از مشاهدات جامع هستند،

6. نتیجه گیری و کار آینده

مفهوم استفاده از داده‌های حسگر آب و هوای تولید شده توسط کاربر جمع‌سپاری شده از دستگاه‌های تلفن همراه برای تقویت شبکه‌های آب و هوای ژئوسنسور استاتیک، همراه با روش‌شناسی توسعه‌یافته و عملکردهای متناسب ارائه شد. آزمایش‌های انجام‌شده با گوشی هوشمند SG4 نشان داد که با دقت‌های به‌دست‌آمده، داده‌های جمع‌آوری‌شده را می‌توان برای برنامه‌های مختلف در نظر گرفت. برخی مسائل و رویه‌های خودکار برای تضمین قابلیت اطمینان کلی، یعنی شناسایی تثبیت و تجزیه و تحلیل آماری زمین‌شناسی، امکان جمع‌آوری داده‌ها در زمان واقعی را بدون نیاز به داده‌های مرجع، مورد بررسی قرار دادند. تحقیقات ثابت کرد که با مدیریت صحیح داده ها، داده های تکمیلی جمع سپاری تولید شده توسط کاربر را می توان به منظور افزایش در نظر گرفت.

کار آینده استفاده از حجم بیشتری از داده‌های جمع‌آوری‌شده در آزمایش‌های میدانی و پروتکل‌های ارتباطی مشاهدات در زمان واقعی، همراه با ارزیابی سهم داده‌های تولید شده توسط کاربر در سیستم‌های واقعی را بررسی خواهد کرد. کار بر روی فرآیند تراکم با در نظر گرفتن عوامل اضافی مانند وزن مشاهده، ساختار شبکه و توپوگرافی موجود برنامه ریزی شده است. سایر داده‌های حسی فیزیکی، مانند فشار، مورد بررسی قرار خواهند گرفت، در حالی که در اسرائیل تنها 10 ایستگاه IMS مجهز به حسگرهای فشار هستند، به طوری که داده‌های تولید شده توسط کاربر تأثیر و سهم بیشتری خواهند داشت.

در نتیجه، نتایج این تحقیق ارزشمند و مثبت است و نشان می‌دهد که حسگرهای تعبیه‌شده در دستگاه‌های تلفن همراه مدرن می‌توانند برای جمع‌آوری داده‌های آب‌وهوا از طریق فرآیند جمع‌سپاری برای تقویت شبکه‌های آب‌وهوای ژئوسنسور ایستا مورد استفاده قرار گیرند و مشاهدات بیشتری از پارامترهای آب‌وهوای مورد استفاده برای تراکم شبکه ارائه کنند. اعتقاد بر این است که کشورها و مناطق با پراکندگی پراکنده شبکه‌های ژئوسنسور ساکن می‌توانند از این روش‌های کاری بهره ببرند، در حالی که در آینده، همراه با پیشرفت‌های تکنولوژیکی و ارتباطی، داده‌های آب و هوای تولید شده توسط کاربر در زمان واقعی به اندازه ESN معتبر قابل اعتماد در نظر گرفته می‌شوند.

منابع

لیو، JWS؛ چو، ETH؛ Tsai، PH چارچوبی برای ادغام سنسور انسان همزیست و داده های حسگر فیزیکی. گزارش فنی شماره TR-IIS-12-007. 2012. در دسترس آنلاین: http://www.iis.sinica.edu.tw/page/library/TechReport/tr2012/tr12007.pdf (در 6 مارس 2016 قابل دسترسی است).
Goodchild، MF; Glennon، JA اطلاعات جغرافیایی جمع سپاری برای پاسخ به بلایا: مرز تحقیقاتی. بین المللی جی دیجیت. زمین 2010 ، 3 ، 231-241. [ Google Scholar ] [ CrossRef ]
استلس-آرولاس، ای. González-Ladrón-de-Guevara، F. به سوی یک تعریف جمع سپاری یکپارچه. J. Inf. علمی 2012 ، 38 ، 189-200. [ Google Scholar ] [ CrossRef ]
NOAA. مجموعه داده های ماهانه سریال USHCN نسخه 2. 2012. در دسترس آنلاین: https://www.ncdc.noaa.gov/oa/climate/research/ushcn/ (دسترسی در 15 مه 2016). [ Google Scholar ]
شورای تحقیقات ملی. بهبود مدیریت بلایا: نقش فناوری اطلاعات در کاهش، آمادگی، واکنش و بازیابی. 2007. در دسترس آنلاین: https://www.nap.edu/read/11824/chapter/3 (در 20 مه 2016 قابل دسترسی است).
کلمن، دی جی; جورجیادو، ی. Labonte, J. اطلاعات جغرافیایی داوطلبانه: ماهیت و انگیزه تولیدکنندگان. بین المللی جی. اسپات. زیرساخت داده Res. 2009 ، 4 ، 332-358. [ Google Scholar ]
دست، E. علم شهروندی: قدرت مردم. طبیعت 2010 ، 466 ، 685-687. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Starbird، K. داوطلبانه دیجیتال در هنگام فاجعه: پردازش اطلاعات جمع سپاری. در مجموعه مقالات کنفرانس عوامل انسانی در سیستم های محاسباتی، ونکوور، BC، کانادا، 7-12 مه 2011.
هاورث، بی. بروس، ای. مروری بر اطلاعات جغرافیایی داوطلبانه برای مدیریت بلایا. Geogr. قطب نما 2015 ، 9 ، 237-250. [ Google Scholar ] [ CrossRef ]
Vivacqua، AS; بورخس، MRS بهره گیری از دانش جمعی در سیستم های واکنش اضطراری. J. Netw. محاسبه کنید. Appl. 2012 ، 35 ، 189-198. [ Google Scholar ] [ CrossRef ]
هوریتا، FEA؛ دگروسی، ال سی. Assis، LFFG; Zipf، A.; پورتو دو آلبوکرک، جی. استفاده از اطلاعات جغرافیایی داوطلبانه و جمع سپاری در مدیریت بلایا: مروری بر ادبیات سیستماتیک. در مجموعه مقالات نوزدهمین کنفرانس آمریکا در مورد سیستم های اطلاعاتی، شیکاگو، IL، ایالات متحده آمریکا، 15-17 اوت 2013.
ویگینز، ای. کروستون، ک. از حفاظت تا جمع‌سپاری: گونه‌شناسی علم شهروندی. در مجموعه مقالات چهل و چهارمین کنفرانس بین المللی هاوایی در سال 2011 در علم سیستم (HICSS)، Kauai، HI، ایالات متحده آمریکا، 4-7 ژانویه 2011.
اوانجلوس، ن. وورووپولوس، آ. لانگاینریچ، ام. کامپوس، پی. Doria, A. Atmos: یک رویکرد جمع سپاری ترکیبی برای تخمین آب و هوا. در مجموعه مقالات کنفرانس مشترک بین المللی ACM در سال 2014 در مورد محاسبات فراگیر و همه جا: انتشارات کمکی (UbiComp ’14 Adjunct)، سیاتل، WA، ایالات متحده آمریکا، 13-17 سپتامبر 2014.
GCOS. طرح اجرای سیستم مشاهده جهانی آب و هوا در حمایت از UNFCCC (به روز رسانی 2010). GOOS-184، GTOS-76، WMO-TD/No. 1523. 2010. در دسترس آنلاین: http://www.wmo.int/pages/prog/gcos/Publications/gcos-138.pdf (در 20 اکتبر 2016 قابل دسترسی است).
هیئت بین دولتی تغییرات آب و هوایی (IPCC). خلاصه ای برای سیاستگذاران در مدیریت خطرات رویدادهای شدید و بلایای طبیعی برای پیشبرد سازگاری با تغییرات اقلیمی ؛ گزارش ویژه گروه های کاری اول و دوم هیئت بین دولتی تغییرات آب و هوایی؛ Field، CB، Barros، V.، Stocker، TF، Qin، D.، Dokken، DJ، Ebi، KL، Mastrandrea، MD، Mach، KJ، Plattner، G.-K.، Allen، SK، و همکاران، ویرایش. انتشارات دانشگاه کمبریج: کمبریج، انگلستان; نیویورک، نیویورک، ایالات متحده آمریکا، 2012; صص 1-19. [ Google Scholar ]
مولر، CL; چپمن، ال. گریموند، CSB؛ جوان، DT; Cai، X. حسگرها و شهر: بررسی شبکه های هواشناسی شهری. بین المللی جی.کلیماتول. 2013 ، 33 ، 1585-1600. [ Google Scholar ] [ CrossRef ]
سیفلی، آر. دوسکن، ن. کندی، پی. کری، LD; راتلج، SA; گیمستاد، سی. دیپو، تی. شبکه اشتراکی باران، تگرگ و برف: آموزش غیررسمی برای دانشمندان و شهروندان. گاو نر صبح. هواشناسی Soc. 2005 ، 86 ، 1069-1077. [ Google Scholar ] [ CrossRef ]
Illingworth، SM; مولر، CL; گریوز، آر. چاپمن، L. شبکه بارندگی شهروندان بریتانیا: یک مطالعه آزمایشی. آب و هوا 2014 ، 69 ، 203–207. [ Google Scholar ] [ CrossRef ]
المور، کی ال. Flamig، ZL; لاکشمنان، وی. کانی، بی تی؛ کشاورز، وی. ریوز، HD; Rothfusz، LP mPING: گزارش‌های آب و هوای جمع‌سپاری برای تحقیق. گاو نر صبح. هواشناسی Soc. 2014 ، 95 ، 1335-1342. [ Google Scholar ] [ CrossRef ]
Boulos، MNK; رسچ، بی. کراولی، دی.ان. برسلین، جی جی. سون، جی. برتنر، آر. پایک، WA; جزیرسکی، ای. Chuang، K.-YS Crowdsourcing، فناوری‌های وب حسگر و حسگر شهروندان برای نظارت بر سلامت عمومی و محیط زیست و مدیریت بحران: روندها، استانداردهای OGC و نمونه‌های کاربردی. بین المللی J. Health Geogr. 2011 ، 10 ، 67. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Overeem، A.; رابینسون، JCR; لاینس، اچ. Steeneveld، GJ; شاخ، BKP; Uijlenhoet, R. جمع‌سپاری دمای هوای شهری از دمای باتری گوشی‌های هوشمند. ژئوفیز. Res. Lett. 2013 ، 40 ، 4081-4085. [ Google Scholar ] [ CrossRef ]
مولر، CL; چپمن، ال. جانستون، اس. کید، سی. ایلینگورث، اس. فودی، جی. Overeem، A.; Leigh، RR جمع سپاری برای علوم آب و هوا و جو: وضعیت فعلی و پتانسیل آینده. بین المللی جی.کلیماتول. 2015 ، 35 ، 3185-3203. [ Google Scholar ] [ CrossRef ]
Ge، L. ریزوس، سی. هان، اس. Zebker، H. نظارت بر فرونشست معدن با استفاده از رویکرد ترکیبی InSAR و GPS. در مجموعه مقالات دهمین سمپوزیوم بین المللی در مورد اندازه گیری تغییر شکل، آناهیم، کالیفرنیا، ایالات متحده آمریکا، 19 تا 22 مارس 2001.
فوک، اچ اس. باکی، آی اچ. شافرین، ب. مقایسه چهار راه حل تراکم شبکه ژئودزی. Surv. Rev. 2009 , 41 , 44-56. [ Google Scholar ] [ CrossRef ]
خالقی، ب. خمیس، ع. Karray، FO; رضوي، تلفيق داده‌هاي چندحسگر: مروري بر پيشرفت‌هاي روز. Inf. فیوژن 2013 ، 14 ، 28-44. [ Google Scholar ] [ CrossRef ]
لیناس، جی. مک نیس، ام. هال، مدل‌سازی DL و نقشه‌برداری از داده‌های منبع انسانی. دفتر برنامه های حمایت شده پارک دانشگاه ایالتی پنسیلوانیا، 2011. در دسترس آنلاین: https://ntrl.ntis.gov/NTRL/dashboard/searchResults/titleDetail/ADA546038.xhtml (در 20 فوریه 2017 قابل دسترسی است). [ Google Scholar ]
ساحل، آ. گارترل، ام. زینگ، ایکس. هان، آر. ترکیب داده‌های موبایل، حسگر و اجتماعی برای فعال کردن کامل محاسبات آگاه از زمینه. در مجموعه مقالات یازدهمین کارگاه در مورد سیستم‌ها و برنامه‌های محاسباتی سیار، آناپولیس، MD، ایالات متحده آمریکا، 22 تا 23 فوریه 2010.
شردر، ام جی; باک، CC آب و هوای آتش سوزی: راهنمای استفاده از اطلاعات هواشناسی در عملیات کنترل آتش سوزی جنگل. در دسترس آنلاین: http://digitalcommons.usu.edu/barkbeetles/14/ (در 20 فوریه 2017 قابل دسترسی است).
کلاد، سی ام. اندروز، ای. اسمی، ع. Baltensperger، U. بوکوویکی، ن. دی، دی. فیبیگ، ام. Fjaeraa, AM; فلنتجه، اچ. هیوارینن، ا. و همکاران روندهای دهه آئروسل – بخش 1: اندازه‌گیری‌های نوری درجا در ایستگاه‌های GAW و IMPROVE. اتمس. شیمی. فیزیک 2013 ، 13 ، 869-894. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
لاوسون، بی.دی. آرمیتاژ، راهنمای هواشناسی OB برای رتبه‌بندی خطر آتش‌سوزی جنگل‌های کانادا ؛ مرکز جنگلداری شمالی: ادمونتون، AB، کانادا، 2008.
گروه ملی هماهنگی آتش سوزی جنگلی استانداردها و دستورالعمل های ایستگاه هواشناسی آتش سوزی بین سازمانی. در دسترس آنلاین: https://www.nwcg.gov/sites/default/files/products/pms426-3.pdf (دسترسی در 10 اوت 2016).
شرکت بین المللی داده سهم بازار سیستم عامل گوشی هوشمند، سه ماهه دوم 2016. در دسترس آنلاین: http://www.idc.com/prodserv/smartphone-os-market-share.jsp (در 10 اوت 2016 قابل دسترسی است).
Nickinson, P. Samsung Galaxy S4 Specs. 2013. در دسترس آنلاین: http://www.androidcentral.com/samsung-galaxy-s4-specs (در 20 آگوست 2016 قابل دسترسی است).
حسی. برگه داده SHTC1 IC سنسور رطوبت و دما برای کاربردهای با حجم بالا. 2013. در دسترس آنلاین: http://www.sensirion.com/fileadmin/user_upload/customers/sensirion/Dokumente/Humidity/Sensirion_Humidity_SHTC1_Datasheet_V3.pdf (دسترسی در 5 مارس 2016).
OpenSignal. Sensing Samsung: تکامل سنسورها در سری Galaxy S. 2015. در دسترس آنلاین: http://opensignal.com/blog/category/weathersignal-2/ (در 10 ژانویه 2016 قابل دسترسی است).
سازمان جهانی هواشناسی راهنمای ابزارهای هواشناسی و روش های رصد. WMO-No. 8. 2008. در دسترس آنلاین: https://www.wmo.int/pages/prog/gcos/documents/gruanmanuals/CIMO/CIMO_Guide-7th_Edition-2008.pdf (در 20 مه 2016 قابل دسترسی است).
ایستگاه هواشناسی اسرائیل راهنمای کاربر سرویس هواشناسی اسرائیل برای استفاده از داده های هواشناسی. 2015. در دسترس آنلاین: http://www.ims.gov.il/IMSEng/CLIMATE (در 10 اوت 2016 قابل دسترسی است). [ Google Scholar ]
Drummond، JE Elements of Spatial Data Quality ; Guptill, SC, Morisson, JL, Eds. پرگامون: آکسفورد، بریتانیا، 1995. [ Google Scholar ]
سئو، اس. Marsh، GM مرور و مقایسه روش‌های تشخیص داده‌های پرت در مجموعه داده‌های تک متغیره . گروه آمار زیستی، دانشکده تحصیلات تکمیلی بهداشت عمومی: سیاتل، WA، ایالات متحده آمریکا، 2006. [ Google Scholar ]
ناترلا، م. کروارکین، سی. توبیاس، پی. Filliben, JJ NIST/SEMATECH E-Handbook of Statistical Methods ; موسسه ملی استاندارد و فناوری: Gaithersburg، MD، ایالات متحده آمریکا، 2012.
شاپیرو، اس.اس. Wilk، مگابایت؛ Chen, HJ مطالعه مقایسه ای تست های مختلف برای نرمال بودن. مربا. آمار دانشیار 1968 ، 63 ، 1343-1372. [ Google Scholar ] [ CrossRef ]
راجرز، جی ال. Nicewander، WA سیزده روش برای بررسی ضریب همبستگی. صبح. آمار 1988 ، 42 ، 59-66. [ Google Scholar ] [ CrossRef ]
Anselin، L. شاخص های محلی ارتباط فضایی-LISA. Geogr. مقعدی 1995 ، 27 ، 93-115. [ Google Scholar ] [ CrossRef ]
آنسلین، ال. ابنو، س. Youngihn، K. GeoDa: مقدمه ای بر تجزیه و تحلیل داده های مکانی. Geogr. مقعدی 2006 ، 38 ، 5-22. [ Google Scholar ] [ CrossRef ]
الدرندالی، کالیفرنیا؛ ابوزید، MS مقایسه شش روش درونیابی فضایی مبتنی بر GIS برای تخمین دمای هوا در غرب عربستان سعودی. جی. محیط زیست. آگاه کردن. 2011 ، 18 ، 38-45. [ Google Scholar ] [ CrossRef ]
هافسترا، ن. هایلاک، ام. جدید، م. جونز، پی. Frei, C. مقایسه شش روش برای درونیابی داده های آب و هوایی روزانه اروپا. جی. ژئوفیز. Res. اتمس. 2008 . [ Google Scholar ] [ CrossRef ]

شکل 1. داشبورد برنامه WeatherSignal (منبع: [ 35 ]).

شکل 2. سناریوهای 1 و 2: مکان های SG4 (مثلث سبز) با مکان های مرجع IMS (با دایره X مشخص شده اند).

شکل 3. گردش کار الگوریتم تثبیت.

شکل 4. زمان تثبیت دمای محیط: قرائت ها به دلیل قرار گرفتن در معرض مستقیم نور خورشید تغییر می کند، اگرچه قرائت های روشنایی برای نشان دادن ثبات اندازه گیری کافی نیست.

شکل 5. الگوریتم فیلتر داده WeatherSignal (سازنده مدل ArcGIS 10.2).

شکل 6. مقایسه دمای محیط و رطوبت نسبی باقیمانده.

شکل 7. گرادیان (C°/تعداد مشاهده) اندازه‌گیری‌های دمای محیط برای محاسبات مختلف میانگین متحرک.

شکل 8. مقایسه بین نتایج الگوریتم تثبیت خودکار در اندازه‌گیری‌های دمای محیط تولید شده توسط کاربر (که با VG، فیروزه‌ای مشخص می‌شود) و داده‌های مرجع IMS (بنفش).

شکل 9. مناطق با چگالی بالا داده های WeatherSignal تولید شده توسط کاربر (به عنوان WS) برای 20 اوت 2015 (دایره های سبز) در رابطه با ایستگاه های IMS (مثلث های سیاه).

شکل 10. نتایج تجزیه و تحلیل پرت از Anselin Local Moran’s I برای: ( الف ) رطوبت نسبی. و ( ب ) دمای محیط.

شکل 11. تجزیه و تحلیل نیم متغیری برای: ( الف ) دمای محیط. و ( ب ) اندازه گیری رطوبت نسبی. خطوط آبی مدل های کروی ( a ) و نمایی ( b ) را نشان می دهند. صلیب های آبی، مقادیر متوسط؛ نقاط قرمز، خوانش های تولید شده توسط کاربر. خطوط سبز، چند جمله ای های محلی

شکل 12. درون یابی کریجینگ معمولی اندازه گیری های تولید شده توسط کاربر و اندازه گیری های IMS: ( الف ) دمای محیط. و ( ب ) رطوبت نسبی.

جدول 1. مقایسه بین پارامترهای آب و هوای آتش سوزی CFFDRS و NFDRS (منبع: [ 30 ، 31 ]).

جدول 2. دقت رسمی سنسور SHTC1 (منبع: [ 34 ]).

جدول 3. صحت داده های دمای محیط و رطوبت نسبی ایستگاه هواشناسی اسرائیل ([ 37 ]).

جدول 4. پارامترهای تثبیت و آستانه.

جدول 5. فازهای الگوریتم فیلتر داده WeatherSignal با متغیرهای دقیق، آستانه ها و کد پایتون.

جدول 6. نتایج آزمایش نرمال بودن Shapiro-Wilk دمای محیط قبل از حذف (بالا) و بعد از (پایین) حذف نقطه بیرونی.

جدول 7. نتایج تست نرمالیت Shapiro-Wilk رطوبت نسبی.

جدول 8. آزمون همبستگی پیرسون دمای محیط و رطوبت نسبی.

جدول 9. مقایسه بین الزامات دقت و دقت منابع مختلف.

جدول 10. خلاصه آماری برای سناریوهای 1 و 2.

جدول 11. داده های تثبیت.

جدول 12. نتایج آماری آزمون همبستگی Anselin Global Moran’s I برای دمای محیط و رطوبت نسبی.

© 2017 توسط نویسندگان. دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC BY) ( http://creativecommons.org/licenses/by/4.0/ ) توزیع شده است

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب