چکیده
:
ارزیابی کیفیت داده ها از منابع مختلف را می توان به عنوان یک چالش کلیدی در حمایت از یکپارچه سازی داده های مکانی موثر و ارتقای همکاری در پروژه های نقشه برداری در نظر گرفت. این مقاله روشی را برای ارزیابی کیفیت موقعیت و شکل برای دادههای معتبر در مقیاس بزرگ ارائه میکند، مانند دادههای Ordnance Survey (OS) UK و دادههای اداره کل بررسی (GDS) عراق، و اطلاعات جغرافیایی داوطلبانه (VGI)، مانند OpenStreetMap. OSM) داده ها، با هدف ارزیابی ادغام احتمالی. این بر اساس اندازه گیری اختلاف بین مجموعه داده ها، پرداختن به دقت موقعیت و وفاداری شکل، با استفاده از روش های استاندارد و همچنین آمار جهت است. مقایسه ویژگی های خط با استفاده از تکنیک ها و آمار بافر انجام شده است، در حالی که معیارهای شکل، از جمله گشتاورهای ثابت، برای ارزیابی تطابق چند ضلعی استفاده شده است. تجزیه و تحلیل ها با یک رابط کاربر پسند ارائه می شوند که ورودی داده، محاسبه و خروجی نتایج را آسان می کند و به تفسیر مقایسه کمک می کند. نتایج نشان میدهد که مقایسه ویژگیهای موقعیت و شکل دادههای سیستمعامل یا دادههای GDS، با دادههای OSM، نشان میدهد که ادغام آنها برای برنامههای نقشهبرداری در مقیاس بزرگ قابل اجرا نیست.
کلید واژه ها:
تطبیق داده های جغرافیایی ; کیفیت داده ها ؛ ارزیابی دقت ; داده های رسمی و غیر رسمی ؛ نقشه برداری مشارکتی
1. مقدمه
توسعه سریع تکنیکهای جمعآوری دادههای جغرافیایی، و رشد شبکه جهانی وب (وب) برای طیف گستردهای از برنامههای «جغرافیایی»، منجر به افزایش اخیر در دسترسی به دادههای مکانی شده است. تعداد و تنوع منابع دادههای مکانی، که توسط سایتهایی مانند پروژه OpenStreetMap، سرویس (بریتانیا) Ordnance Survey (OS) OpenSpace، و اداره سرشماری ایالات متحده نشان داده شده است، نشان میدهد که امکان ایجاد، بازنگری، دانلود، توزیع وجود دارد. ، گنجاندن و افزودن ارزش به طیف عظیمی از داده ها. پیشرفت در خدمات وب منجر به ارائه هزاران سرور نقشه وب (WMS) صدها هزار لایه نقشه قابل استفاده آسان و سرورهای ویژگی وب (WFS) داده های خام با تنوع و منشأ بسیار شده است.
ماهیت «دموکراتیزهکننده» وب به این معنی است که چنین دادههایی میتوانند از تلاشهای دانشمندان یا مهندسان حرفهای زمینفضایی، ارائه دادههای معتبر، رسمی، «رسمی» و آماتورهای مشتاق بدون آموزش رسمی در جمعآوری، پردازش و تجزیه و تحلیل، حاصل شود. به اطلاعات “غیررسمی” کمک کنید. همکاری چنین گروههای متمایز در مشارکت، یکپارچهسازی، بایگانی و انتشار «دادههای جغرافیایی» در حال حاضر به صورت منظم و سیستماتیک انجام نمیشود. با این حال، واضح است که برای موفقیت استراتژیهای گسترده و جاهطلبانه مانند زیرساختهای دادههای مکانی چندملیتی، ورودی از طیف وسیعی از پروژههای نقشهبرداری و منابع داده مورد نیاز است و مکانیسمهایی برای مدیریت دادههای مکانی منابع مختلف نیاز است. توسعه یافته. مثلا،1 ]، به طور بالقوه می تواند از در نظر گرفتن کمک های ارزان تر و به موقع تر از منابع مبتنی بر شهروند بهره مند شود [ 2 ].
چنین ادغامی از مجموعه داده های غیررسمی و رسمی نیز باید در نظر گرفته شود، و در واقع به طور فزاینده ای در پروژه های معاصر دیگر مانند توسعه پایگاه های داده برای سیستم های ناوبری خودرو، و راه حل های نقشه برداری سریع در موقعیت های واکنش اضطراری اجرا می شود. نمونههای بیشتر از ادغام مجموعه دادههای رسمی و غیررسمی شامل استفاده از اطلاعات جغرافیایی داوطلبانه غیررسمی (VGI) در پروژههای مهندسی سایت، در توسعه پایگاههای اطلاعاتی عابر پیاده در مرکز شهر [ 3 ] و در پروژههای خدماتی، به ویژه در کشورهای در حال توسعه [ 4 ] است.]. از آنجایی که تصمیم گیری حیاتی ممکن است بر یکپارچگی موثر متکی باشد، مهم است که امکان پذیری آن را در نظر بگیریم، به ویژه با ارزیابی ویژگی ها و ویژگی های انواع مختلف داده ها، مانند کیفیت آن [ 5 ]. تنوع در دقت مکان، کدگذاری ویژگی ها، مهر زمانی، مقیاس جغرافیایی و سایر اجزای کیفیت داده ها قابل اندازه گیری و قضاوت است و ارزیابی کیفیت نسبی داده های مکانی یک پیش نیاز مهم و ضروری برای یکپارچگی موفقیت آمیز و موثر داده ها است. نقشه برداری مشارکتی
توسعه چنین مکانیزمهایی مستلزم یک رویکرد هماهنگ برای جمعآوری دادهها، و همچنین یک روش معتبر برای یکپارچهسازی دادهها است. این مقاله ابزار سفارشیسازی شدهای را ارائه میکند که در نظر گرفته شده است تا به کاربران کمک کند درباره قابلیت یکپارچهسازی دادهها قضاوت کنند، و در نتیجه فرکانس و کیفیت ترکیب منابع دادههای چندگانه را برای نقشهبرداری و ایجاد پایگاه داده SDI بهبود بخشد.
انجام چنین ارزیابی مؤثری از ارزش و ارتباط طیف وسیعی از دادههای منبعشده از جوامع مختلف میتواند دشوار باشد. تضاد مشخصی بین کسانی که دادههای مکانی را به عنوان اعضای عمومی جمعآوری و جمعآوری میکنند، محتوای تولید شده توسط کاربر (UGC) (که به دادههای مکانی محدود نمیشود، اگرچه به طور خاص UGC جغرافیایی معمولاً اطلاعات جغرافیایی داوطلبانه یا VGI نامیده میشود) وجود دارد. آن دسته از سازمان های دولتی یا تجاری که داده های رسمی یا رسمی (FD) را ارائه می دهند. تفاوت بین مجموعه داده های حاصل، از نظر منبع اندازه گیری، کیفیت، پوشش و هدف، مشهود است: به عنوان مثال، گیرندههای GNSS کمهزینه و در دسترس بودن سیگنالهای GNSS این امکان را برای عموم فراهم میکند که اطلاعات موقعیتی مکانهای مختلف را با استفاده از گوشیهای تلفن همراه استاندارد به دست آورند و آن را در پایگاههای داده محلی یا شخصی آپلود کنند. در حالی که دسترسی به ایستگاههای مرجع مجازی (VRS) و شبکههای امکانات تصحیح با دقت بالا که بهعنوان استاندارد توسط آژانسهای نقشهبرداری ملی استفاده میشوند، نتایج قابلتوجهی متفاوتی را حتی برای موقعیتیابی نقاط پایه ارائه میدهند. نقشه برداری بر اساس تلاش های داوطلبانه، رایانه های شخصی و اینترنت [6 ] از بسیاری جهات با پروژههای نقشهبرداری توپوگرافی در مقیاس بزرگ سنتی که مدتها مشخصه سازمانهای دولتی رسمی بوده، متفاوت است.
کیفیت متغیر (شامل تنوع در دقت ذاتی) اطلاعات جغرافیایی داوطلبانه میتواند ناشی از ترکیبی از یک جمعآورنده داده آموزشنندیده، رویکردهای غیرسیستماتیک برای جمعآوری دادهها در گسترههای فضایی وسیع، و فناوری ضبط با دقت پایین باشد. با این حال، در دسترس بودن آماده، اغلب بدون هزینه مالی، میتواند استفاده از آن را برای تکمیل، تقویت یا بهروزرسانی دادههای رسمی جذاب کند: نتیجه ممکن است نوع نقشهبرداری مشترک و توسعه پایگاه دادههای جغرافیایی باشد که میتواند برای انواع فعالیتهای ذکر شده در بالا اعمال شود. .
یکپارچهسازی دادههای مکانی شامل گردآوری موارد مجزا و مجموعههایی از دادهها است که اغلب ناسازگاری و ناقصی را آشکار میکنند. چنین یکپارچهسازی دادهها فقط مربوط به همپوشانی مجموعهای از لایهها در یک سیستم اطلاعات جغرافیایی نیست، بلکه ارزیابی اینکه تا چه حد میتوان ویژگیهای موقعیتی، هندسی و سایر ویژگیهای یک مجموعه داده را با دیگری همگرا کرد [ 7 ]]. به منظور چنین همگرایی و یکپارچه سازی نهایی داده ها برای کمک به توسعه SDI ها و سایر پروژه ها، هم مطابقت های موقعیتی و هم هندسی مجموعه داده ها، در میان ویژگی های دیگر، باید ایجاد شود. این ویژگیهای مجموعه دادههای جغرافیایی است که در این مقاله مورد توجه قرار میگیرد، و بهویژه، مقایسه دقتهای موقعیتی و هندسی نسبی آنها – منطقهای که مدتها مورد توجه قابل توجهی در زمینههای نقشه برداری و ژئوماتیک است [ 8 ]- انجام شده است. در ابزاری که می تواند برای خلاصه کردن امکانات یکپارچه سازی برای مجموعه داده های غیررسمی و رسمی استفاده شود.
نتایج تحقیقی که در اینجا توضیح داده شده است شامل سیستمی است که می تواند به کسانی که در تلاش برای ادغام مجموعه داده ها هستند، اجازه دهد تا تعیین کنند که آیا می توان آنها را به طور کامل یا جزئی با هم ترکیب کرد یا نه. قضاوت نهایی در مورد این بستگی به کاربر دارد، اما ابزارهای ارائه شده به این قضاوت کمک می کند تا با ارزیابی کمی و نمایش بصری مقایسه بین مجموعه داده های جغرافیایی نمونه مطلع شود. مجموعه داده ها شامل ویژگی های نقطه، خط و چند ضلعی است که با استفاده از استانداردهای تعیین شده برای دقت داده های مکانی برای در نظر گرفتن موقعیت های نقطه مورد بررسی قرار می گیرند. روش های بافر و پوشش برای مقایسه داده های خطی. و محاسبه “لحظه های ثابت” برای مقایسه اشیاء مساحتی. بحث بیشتر کاربرد چنین سیستمی و سهم آن در پروژه های نقشه برداری مشارکتی را در نظر می گیرد.
2. محتوای تولید شده توسط کاربر و داده های رسمی
یک نمونه اصلی از یک آرشیو دادههای جغرافیایی غیررسمی گسترده، پروژه OpenStreetMap (OSM) است [ 9 ]]. هرکسی میتواند بدون هیچ محدودیت یا محدودیتی به مجموعه دادههای مکانی در OSM دسترسی داشته باشد و به دادهها کمک کند. اطلاعات OSM و دادههای نقشه زیربنایی آن را میتوان آزادانه مشاهده کرد، با ایجاد یک حساب کاربری آپلود کرد و از طریق یک رابط کاربری مانند ویکی بهصورت آنلاین ویرایش کرد. دسترسی رایگان به دادههای OSM (مجوز، هزینه، اشتراکگذاری) و گشودن پارادایم جدیدی از «دادههای جغرافیایی مردم» را میتوان سود اصلی این پروژه دانست. «طرفهای نقشهبرداری» و تلاشهای سیستماتیک جمعآوری دادهها شامل هزاران جمعآورنده آماتور دادههای مکانی است. بسیاری از کاربران وب قادر به دسترسی به داده های OSM فعلی بدون هیچ هزینه ای هستند. منابع OSM به بازدیدکنندگان این امکان را می دهد که در هر نقطه از نقشه جهان جستجو کنند و بخش های مختلف را از راه دور دانلود کنند. با این حال، سطح جزئیات می تواند بسیار متفاوت باشد، و علاوه بر این،
چندین مطالعه دادههای OSM را تحت آزمایشهای کیفیت قرار دادهاند و به مسائلی مانند کامل بودن، موضوعیت و دقت پرداختهاند. برای مثال، Zielstra و Zipf [ 10 ] کیفیت شبکه مسیر را در دادههای OSM در آلمان مطالعه کردند و آن را با مجموعه داده تجاری Tele Atlas مقایسه کردند. مقایسهها نشان داد که دقت موقعیتی خطوط جاده برای استفاده از دادههای OSM برای بسیاری از برنامههای مسیریابی کافی است، اما کمبودی در کامل بودن مجموعه دادههای OSM منطقهای وجود دارد. هاکلی [ 11 ] از تکنیک های مشابهی برای آزمایش کامل بودن استفاده کرد تا نتیجه بگیرد که مقایسه داده های OSM با داده های سیستم عامل در مقیاس کوچکتر مطلوب است. گیرس و تویا [ 12] هم دقت موقعیتی دادههای OSM را در مقایسه با دادههای آژانس ملی نقشهبرداری فرانسه (متوسط جابجایی مکانهای نقطهای 6.65 متر بود) و هم طبقهبندی ویژگیها را در نظر گرفت (که برای جادههای اصلی سازگاری داشت، اما توافق کمتری در طبقهبندی مسیرهای فرعی داشت).
این مطالعات تمایل به پرداختن به کیفیت داده های VGI در مقیاس های کوچک دارند (معمولاً مقیاس های نقشه برداری 1:50000 و کوچکتر). در مقابل، البکری و فیربایرن [ 13 ] کیفیت دادههای مکانی را در مقیاسهای بسیار بزرگتر ارزیابی کردند و آزمایش دقت موقعیتی را در مقیاسهای معادل 1:2500 گزارش کردند و همچنین دقت طبقهبندی معنایی کدگذاری ویژگی و تعیین ویژگی اشیاء را در نظر گرفتند. در داده های OSM [ 14]. تست دقت هندسی جزء اساسی ابزاری است که در اینجا نشان داده شده است و به صورت کمی به کاربر روی صفحه گزارش می شود. تطابق نسبی دادههای OSM غیررسمی با دادههای رسمی تولید شده توسط آژانس نقشهبرداری توپوگرافی رسمی، Ordnance Survey of Britain (OS) مورد بررسی قرار میگیرد. مقایسه دیگری از داده های OSM با داده های آژانس نقشه برداری رسمی از اداره کل بررسی عراق (GDS) انجام شد. علاوه بر این، مجموعه داده های بیشتری توسط نقشه برداران آموزش دیده با استفاده از پیمایش میدانی مرتبه بالاتر (FS) جمع آوری شده است تا مشخص شود که آیا معرفی یک رژیم دقیق تر جمع آوری داده ها می تواند داده های موقعیتی را به دست آورد که با داده های رسمی، سیستماتیک و رسمی مطابقت داشته باشد و چه می تواند باشد. برای اهداف نقشه برداری مشترک با آن یکپارچه شده است.
در البکری و فیربرن [ 13] که تطبیق دادههای OS و OSM در حوزههای جزئیات فرهنگی (انسانزایی) دقیقتر است، در حالی که ماهیت «فازی» برخی از ویژگیهای توپوگرافی طبیعی به این معنی است که اختلاف هندسی بین دادههای OS و OSM در مناطق روستایی احتمالاً بزرگتر است. دو مجموعه داده سیستم عامل نمونه برداری شد، یکی از یک منطقه شهری که در آن جزئیات “سخت” (ساختمان ها، خطوط حاشیه و مبلمان خیابان) غالب است، دیگری از یک منطقه روستایی تر که در آن جزئیات “نرم” (مرزهای پوشش گیاهی، لبه های آب، ویژگی های زمین) وجود دارد. نوع رایجتر شی اولی در شهر کراملینگتون، انگلستان واقع شده بود، در حالی که جزئیات “نرم” با محیط اطراف روستای کلارا ویل، بریتانیا مشخص می شد. مجموعه داده عراقی انتخاب شده برای یک منطقه شهری، نزدیک به مرکز بغداد بود، اما همچنین دارای محوطه دانشگاهی وسیع تری را پوشش می داد. برای هر منطقه، رسمی،به عنوان مثال ، OpenStreetMap)، و همچنین در برابر بررسی میدانی انجام شده توسط نقشه برداران با تجربه ( شکل 1 ، شکل 2 ، شکل 3 ).

شکل 1. بازنمایی OpenStreetMap از منطقه مورد مطالعه در Cramlington.

شکل 2. بازنمایی OpenStreetMap از منطقه مورد مطالعه در Clara Vale.

شکل 3. بازنمایی نقشه خیابان باز از منطقه مورد مطالعه در بغداد.
دادههای MasterMap در مقیاس بزرگ طی سالها تجدیدنظر پی در پی Ordnance Survey (OS) با استفاده از ترکیبی از بررسی کنترلی، رسم فتوگرامتری و بهروزرسانیهای بررسی میدانی و GPS ایجاد شدهاند. مجموعه داده اداره کل بررسی (GDS) از رسم فتوگرامتری با استفاده از تصاویر بررسی هوا تصحیح شده و ارجاع داده شده به زمین تهیه شده است. در مقابل، بیشتر دادههای OpenStreetMap (OSM) در مناطق مورد مطالعه بریتانیا با جمعآوری دادههای «پایینتر»، عمدتاً با ردیابی GPS، جمعآوری شدهاند، در حالی که برای مطالعه موردی عراق، بهصورت دستی از تصاویر ماهوارهای یاهو ردیابی شده است، و توسط ثبت نشده است. کنترل زمینی دقیق و بنابراین از نظر بصری “مرجع جغرافیایی”. بررسی میدانی تنظیم (FS) با ایجاد یک چارچوب مرجع با استفاده از گیرندههای جیپیاس Leica و Topcon و سپس جمعآوری جزئیات با استفاده از کل ایستگاهها، ثبت شد. یا GPS در حالت RTK در برخی مناطق باز. پیشنهاد می شود که تنوع موقعیتی بین این مجموعه داده های محتوای تولید شده توسط کاربر و داده های رسمی به تأثیرات مرتبط مانند تجربه نقشه بردار و نوع ابزار مورد استفاده برای جمع آوری داده ها بستگی دارد.
بنابراین، این پروژه به طیف وسیعی از عوامل از جمله نوع جزئیات نقشهبرداری شده (“سخت”، “نرم”)، جمعآوری دادههای متعهد آژانس (تامینکنندگان رسمی دادههای رسمی در بریتانیا و عراق)، روش جمعآوری دادهها (بررسی میدانی). واحد GPS دستی؛ ردیابی از تصاویر هوایی) و تجربه نقشه بردار فردی (نقشه نگار حرفه ای؛ شهروند علاقه مند) که انتظار دارد هر یک از عوامل تأثیری بر نتایج به دست آمده داشته باشد. آزمایشهایی برای پرداختن به دقت موقعیتی مقایسهای نقاط (شامل نقاط گوشه چندضلعیها، تقاطع ویژگیهای خط، و ویژگیهای نقطه منفرد)، اندازهگیریهای جهت اختلاف بین مجموعههای داده، تنوع نسبی در مسیرهای ویژگیهای خطی (با استفاده از تکنیکهای بافر)، و مقایسه انجام شد. خواص هندسی (از جمله گشتاور) چند ضلعی ها.
3. ارزیابی اختلاف موقعیت
3.1. روش های آماری برای مشخص کردن خطا
ارزیابی تطبیق موقعیت با تطبیق روشهای تعیینشده برای اندازهگیری دقت دادههای مکانی که توسط آژانسهای نقشهبرداری برای ایجاد استانداردهای دقت مطلق برای محصولات نقشه استفاده میشود، انجام شد. چنین روشهای آماری مدتهاست که توسط آژانسهای نقشهبرداری رسمی برای توصیف نقشهها استفاده میشود و شامل استاندارد ملی دقت نقشه (NMAS) [ 15 ]، استاندارد دقت نقشه مهندسی (EMAS) [ 16 ]، و استانداردهای دقت برای نقشههای مقیاس بزرگ [ 17 ] میشود.]. اشکال عمده چنین استانداردهایی اتکای آنها به اندازه گیری خطاها در مقیاس نقشه به جای مقیاس زمین است: این می تواند هنگام تغییر سیستم های نقشه برداری سنتی به فرمت های دیجیتالی که می توانند در مقیاس های مختلف خروجی شوند، مشکل ساز در نظر گرفته شود. استانداردهای جدیدتر دقت دادههای مکانی مانند استاندارد ملی دقت دادههای مکانی (NSSDA) آزمایش مؤثر مجموعه دادههای دیجیتال را ممکن کرده است [ 8 ، 18 ]. همه روشهای آزمایش شباهتهایی را در رویکرد نشان میدهند: مقایسه یک مجموعه داده با منبع داده مرجع، که دقت بالاتری در نظر گرفته میشود، تجزیه و تحلیل فواصل واقعی بین نقاط مشترک در هر مجموعه داده، و آزمایشهای بیشتر ویژگیهای هندسی.
در اینجا، مقایسه بین دادههای OSM غیررسمی و مجموعه دادههای رسمی دولتی، و همچنین بین مجموعه دادههای دقیق FS و دادههای رسمی است. هیچ فرضی مبنی بر اینکه کدام دقیق تر است وجود ندارد – مقایسه ها برای ارزیابی اختلافات بین مجموعه داده ها انجام می شود.
NSSDA یک رویکرد رسمی برای چگونگی شناسایی، اندازه گیری و توزیع نقاط آزمایش شده در سراسر نقشه ارائه می دهد. به عنوان مثال، برای آزمایش دقت موقعیتی، نشان می دهد که بیست یا بیشتر از نقاط تست مورد نیاز است، به خوبی تعریف شده، اندازه گیری آسان و قابل شناسایی در هر مجموعه داده است. توزیع ایده آل نقاط آزمایش شده یکنواخت است، با حداقل 20٪ در هر ربع زمانی که مجموعه داده یک منطقه مستطیلی را پوشش می دهد. فواصل بین نقاط باید حداقل 10٪ از فاصله قطری وسعت مجموعه داده باشد [ 19 ]. شاخص NSSDA تطابق افقی نسبی در بازه اطمینان 95% بیان شده است و با استفاده از میانگین خطای استاندارد ریشه (RMSE) محاسبه می شود:

جایی که:
n : تعداد نقاط چک
E r , N r : مختصات در یک مجموعه داده
E c , N c : مختصات در یک مجموعه داده مقایسه شده
, : اختلاف فاصله خطی مستقیم برای من نقطه چک شده 
اندازه گیری دقت NSSDA برای دو مورد قابل محاسبه است:
اگر RMSE E = RMSE N باشد، اختلاف کل مجموعه داده با مجموعه داده = 1.7308 RMSE
اگر RMSE E ≠ RMSE N باشد، برابر است با 2.4477 × 0.5 × ( RMSE E + RMSE N ) [ 20 ].
آزمایشها با استفاده از روش NSSDA برای بررسی تفاوتهای موقعیتی نسبی مکانها در مناطق مورد مطالعه بریتانیا، برای مجموعه دادههای رسمی و غیررسمی، در مناطق جزئیات «سخت» و در مناطق جزئیات «نرم»، با مقایسه بیشتر انجام شد. برای مجموعه داده های عراقی در میان آنهایی که از تصاویر سنجش از دور (غیررسمی)، از بررسی میدانی، و از داده های توپوگرافی رسمی گرفته شده توسط GDS گرفته شده است. توزیع و تعداد نقاط آزمایش شده با رویکرد NSSDA مطابقت داشت و نتایج نشان دهنده بزرگی و جهت اختلاف موقعیت (همه بر حسب متر) بود. میز 1برخی از نتایج اولیه آزمایش انجام شده را نشان می دهد، که نشان می دهد که اختلاف بین OpenStreetMap، داده های غیررسمی (OSM) و مجموعه داده رسمی Ordnance Survey (OS) نسبتاً زیاد است. این عدم تطابق بالاتر از حد معیارهای دقت استاندارد دادههای مورد استفاده توسط Ordnance Survey است (RMSE از موقعیت 1.0 متر برای مناطق شهری، 2.5 متر برای مناطق روستایی)، که نشان میدهد دادههای OSM نمیتوانند آستانه دقت نسبی را برآورده کنند. با موفقیت با داده های سیستم عامل ادغام شود. بررسیهای میدانی بررسی (FS) بیشتر با دادههای سیستمعامل تراز بود تا با مجموعه دادههای OSM.

جدول 1. مقایسه میانگین خطای استاندارد ریشه (RMSE) و استاندارد ملی برای دقت داده های مکانی (NSSDA) اختلاف موقعیتی برای مجموعه داده های مقایسه شده.
تطابق مجموعه دادهها در مناطق شهری (از جمله در بغداد) نزدیکتر است، جایی که ویژگیها را میتوان با دقت بیشتری متمایز کرد، اما دامنه اختلافات بین مجموعه دادههای مقایسه شده هنوز بسیار زیاد است که نشان دهد ممکن است ادغام چنین مجموعه دادههای جغرافیایی متفاوتی ممکن باشد.
3.2. ارزیابی تنوع جهتی اختلافات
با جداسازی مقادیر شرقی و شمالی برای هر مختصات، آمار توصیفی بیشتری برای تعیین اینکه آیا سوگیری جهتی در اختلافات وجود دارد یا خیر، استفاده شد. نتایج اولیه نشان داد که برای هر مقایسه ( جدول 2 )، تغییرپذیری خاورها بیشتر از شمالها بود. با این حال، شکل 4 به صورت گرافیکی نشان می دهد که ناهماهنگی های رسم شده ماهیت ایزوتروپیک و غیر سیستماتیک را نشان می دهد.
آمار دایره ای، نوعی از آمار جهت دار است که در آن پاسخ واحد زاویه ای یا جهت دار است، اما عددی نیست، برای تایید و کمیت جهت مغایرت های موقعیتی استفاده می شود. چنین رویکردی در تعدادی از رشته ها از جمله علوم کامپیوتر [ 21 ]، علوم زمین [ 22 ]، زمین شناسی [ 23 ]، علوم کشاورزی [ 24 ]، جغرافیا [ 25 ] و علوم محیطی [ 26 ] مواجه می شود. فیشر [ 27 ] و Jammalamadaka و Sengupta [ 28] توضیحات مفیدی از توسعه آمار جهت و نحوه محاسبه آنها با استفاده از جمع برداری ارائه می دهد. برای یک بردار حاصل که بردارهای واحد هر اختلاف را جمع میکند، میتوان «زاویه جهتی متوسط» آن ، و طول بردارهای ترکیبی (نتیجه) را محاسبه کرد، که دومی یک مقیاس مقیاسبندی شده برای همسانگردی (صفر) یا ناهمسانگردی است. یک): “واریانس دایره ای”، V ، مکمل آن است. کاوش اولیه مجموعه دادهها شامل این آمار خلاصه بود و نشان داد ( جدول 3
) که اختلاف بین دادههای رسمی و غیررسمی در منطقه روستایی از نظر جهت نسبت به مناطق شهری کمی یکنواختتر بود، اما در هر مورد واریانس آنقدر بالا بود که نتیجهگیری شد که هیچ توضیحی سیستماتیک برای تفاوتها وجود ندارد.
) که اختلاف بین دادههای رسمی و غیررسمی در منطقه روستایی از نظر جهت نسبت به مناطق شهری کمی یکنواختتر بود، اما در هر مورد واریانس آنقدر بالا بود که نتیجهگیری شد که هیچ توضیحی سیستماتیک برای تفاوتها وجود ندارد.
جدول 2. خلاصه آمار مغایرت های موقعیتی مجموعه داده های مقایسه شده.

شکل 4. بزرگی و جهت عدم تطابق بین داده های Ordnance Survey (OS) و OpenStreetMap (OSM)، Cramlington، UK.

جدول 3. آمار دایره ای برای مقایسه مجموعه داده های جغرافیایی.
برای تجزیه و تحلیل بصری، توزیع دادههای دایرهای از اختلافات بهعنوان یک نمودار بردار نمودار فلش نشان داده شد که اطلاعاتی را در مورد ویژگیهای مهم دادهها، مانند اندازه و جهت تفاوتهای موقعیتی بین نقاط نمونهگیری شده در دو مجموعه داده مختلف و میانگین ارائه میدهد. جهت اختلافات ( شکل 5). همچنین می توان از هیستوگرام دایره ای برای خلاصه کردن تعداد اختلافات مشاهده شده در هر جهت استفاده کرد. بازرسی بصری توزیع همسانگرد را تایید کرد، هم اندازه و هم جهت ناهماهنگیها غیرقابل پیشبینی بود. تغییرپذیری واگراییهای جهتی کمتر از اختلافات موقعیتی بین دادههای رسمی و غیررسمی (OSM) آشکار است، که میتوان آنها را به عنوان بالاتر از آستانههای استاندارد خلاصه کرد که منجر به این نتیجه میشود که ادغام چنین مجموعههای داده در مقیاسهای جغرافیایی بزرگ توصیه نادرست است.

شکل 5. نمونه ای از نمودار برداری رسم هر اختلاف بر اساس اندازه (آبی) و جهت میانگین (قرمز) (دایره های متحدالمرکز در فاصله 5 متری قرار دارند).
4. اندازه گیری دقت هندسی خطی
هنگامی که ویژگیهای خطوط توپوگرافی مانند رودخانهها و مرزهای پیچیده، یا حتی جادهها یا راهآهنهای ساده در نظر گرفته میشوند، مقایسه با استفاده از دقت نقطه ممکن است برای دریافت پیچیدگی فضایی و تنوع اشیاء مجموعه داده کافی نباشد. اندازهگیریهای نقطهای ممکن است برای درک و محاسبه ساده باشند، اما نمیتوانند تمام جنبههای تطبیق خطی را نشان دهند. بنابراین، علاوه بر در نظر گرفتن اختلاف موقعیت نقاط در امتداد خطوط مقایسه شده، رویه های تطبیق خطی را می توان به طور مفید برای کمک به توسعه یک ابزار ارزیابی یکپارچگی، با استفاده از تکنیک های تعیین شباهت شکل یا انحنای بین دو خط مقایسه مورد بررسی قرار داد. روشهای بافر، و ارزیابی همپوشانی بافر، تکنیکهای رایجی بودهاند [ 29 ، 30]. بافرهایی با اندازه متغیر را می توان در اطراف خطوط در هر مجموعه داده (به عنوان مثال، خط X بافر XB، خط Q بافر QB) ساخت، که محاسبات آماری را می توان انجام داد. اندازه گیری های زیر انجام می شود:




از این معیارها می توان برای نشان دادن انحراف یک خط در یک مجموعه داده از خط مجموعه دیگر یا مقایسه دو خط با هم استفاده کرد. به عنوان مثال، میانگین جابجایی بین دو خط را می توان به صورت زیر محاسبه کرد:

جایی که: 2 bs i : کل عرض بافری که در اطراف مرکز خط ایجاد شده است.
افزایش مکرر اندازه بافر نتایج متفاوتی را هنگام اندازه گیری جابجایی خطوط یا همپوشانی مناطق بافر به همراه خواهد داشت، اما این موارد در اندازه بافر مناسب تثبیت می شوند. یک بار دیگر، مجموعه داده های OS، GDS، FS و OSM با مقایسه ای که عمدتاً برای برخی از خطوط مرکزی جاده در مناطق شهری کراملینگتون، بریتانیا و بغداد، عراق انجام شد، مورد بررسی قرار گرفت. اندازه بافر از 0.5 متر به 12.5 متر در فواصل 0.5 متر برای مقایسه های مربوط به داده های OSM غیررسمی افزایش یافته است.
نمودارها نشان میدهند که با افزایش اندازه بافر، میانگین جابجایی جفتهای مقایسهای خطوط به یک آستانه میرسد. تفاوت قابل توجه بین داده های OSM و مجموعه داده های رسمی در همان منطقه به طور قابل توجهی بزرگتر از هر مقایسه بررسی میدانی دقیق تر (FS) با داده های رسمی است: میانگین جابجایی برای مقایسه OS-OSM (خط جامد در شکل 6). ، کراملینگتون) زمانی که اندازه بافر 12.5 متر است به 3.5 متر نزدیک می شود. شکل 7 (بغداد) به طور مشابه نشان می دهد که داده های FS بسیار نزدیک به مجموعه داده های GDS است (میانگین جابجایی حدود 0.7 متر برای اندازه بافر 0.5 متر پس از آن نمودار ثابت می ماند) اما مقایسه داده های OSM با GDS جابجایی حدود 5 متر را نشان می دهد. برای اندازه بافر 5 متر.
همچنین میتوان شیب نمودارها را تفسیر کرد، با گرادیانهای تندتر که نشاندهنده تنوع بیشتر و تأیید سطوح پایینتر تطبیق است. بررسی بیشتر اطلاعات جابجایی را می توان با اشاره به اقدامات بافری که قبلاً انجام شده است انجام داد. به عنوان مثال، مناطق خارج از بافرهای ویژگی های خط در یک مجموعه داده را می توان با مناطق داخل بافرهای مجموعه داده دوم مقایسه کرد. منحنی مشخصه برای چنین نمودارهایی رو به پایین به سمت محور x است.
نتیجه گیری با ارجاع به داده های خطی مشابه نتیجه ای است که از مقایسه موقعیت نقطه ای به دست می آید. مسیر ویژگی های خط اصلی در مجموعه داده OSM می تواند به طور قابل توجهی از مجموعه داده رسمی متفاوت باشد. اگرچه آمار جابجایی و درصد همپوشانی ممکن است به نفع ادغام احتمالی دادههای رسمی با دادههای پیمایش میدانی غیررسمی، اما دقیق جمعآوریشده باشد، آنها نسبت به ادغام دادههای OSM با دادههای رسمی هشدار میدهند.

شکل 6. اطلاعات جابجایی متوسط جاده ها در یک منطقه شهری، انگلستان.

شکل 7. اطلاعات جابجایی متوسط جاده ها در بغداد، عراق.
5. تشابه شکل ناحیه
5.1. لحظه های ثابت
تحلیل شکل رویکرد نهایی است که در اینجا برای ارزیابی تشابه فرم هندسی معرفی شده است. روشهای تحلیل شکل نقش مهمی در سیستمهای پردازش تصویر برای مقایسه، تطبیق و تشخیص شکل دارند. استفاده از تجزیه و تحلیل شکل می تواند نشانه بیشتری از خطاها در مجموعه داده های جغرافیایی، دوباره با مقایسه مجموعه داده های منبع شده از VGI و آنهایی که از منابع رسمی و رسمی منشأ می گیرند، نشان دهد. معیارهایی که شکل مسطح ویژگیهای چند ضلعی را در یک مجموعه داده مشخص میکنند شامل فشردگی، تحدب و پراکندگی و مشتقاتی مانند فاصله Hausdorff است که هنگام مقایسه چند ضلعیها استفاده میشود.
در این مطالعه، از «لحظههای ثابت» استفاده شده است، معیارهای بدون واحد که طیفی از ویژگیهای شکل را مشخص میکند، تغییری در اندازه، چرخش یا مکان شکل، که بنابراین فرصتی برای مقایسه ویژگیهای ناحیه متناظر در فضای جغرافیایی میدهد. مجموعه داده ها در ابتدا توسط Hu [ 31 ] توسعه یافت و با تکیه بر محاسبات با استفاده از آرایه پیکسل های منظم که به طور کامل یک شکل را اشغال می کنند (به عنوان مثال ، محاسبه شطرنجی)، توسعه بیشتر توسط Chen [ 32 ] نشان داد که گشتاورهای ثابت را می توان با استفاده از مختصات خط مرزی محاسبه کرد. از یک منطقه یا ویژگی چند ضلعی، ساختار یافته در قالب برداری.
یک “لحظه” پایه یک بعدی با نظم (p + q) روی یک خط کلی، مانند یک خط مرزی بسته، با معادله تعریف می شود:

برای p ، q = 0،1،2،3،…
جایی که:
یک خط انتگرال در امتداد منحنی C است.
“لحظه مرکزی” را می توان به صورت زیر تعریف کرد:

جایی که:
، و ، x 0 ، y 0 مختصات مرکز چند ضلعی است. 
انتگرال باید در امتداد لبه بیرونی جسم ارزیابی شود. لحظه مرکزی، که مرکز ثقل شکل را مشخص می کند، نسبت به ترجمه تغییرناپذیر است، و زمانی که نرمال شود، نسبت به تغییر مقیاس نیز تغییر نمی کند. بنابراین گشتاورهای مرکزی نرمال شده در مقیاس چن توسط:

جایی که:
a = p + q + 1، برای p + q = 2، 3، 4، …
از این ممانهای مرکزی نرمال شده، مجموعهای از هفت ممان فضایی مرکب ایجاد میشود. این معیارهای بدون واحد به صورت زیر محاسبه می شوند:







تفسیری از این گشتاورها توسط Noh و Rhee [ 33 ] انجام شده است: به عنوان مثال، آنها پیشنهاد می کنند که گشتاور 2 (Ω 2 ) مقدار کوواریانس محورهای عمودی و افقی را زمانی که شدت واریانس محور عمودی و محور افقی مشابه است، منعکس می کند. در حالی که گشتاورهای 5، 6 و 7 (Ω 5 ، Ω 6 ، Ω 7 ) مقادیری هستند که خواص اشکال را منعکس می کنند که به ترتیب در برابر اندازه، چرخش و مکان تغییر نمی کنند. برای این مطالعه، گشتاورهای ثابت برای اشکال مقایسه ای در هر یک از مجموعه داده های مورد بررسی محاسبه شده است.
5.2. استفاده از محاسبات ثابت لحظه ها
هر یک از هفت ممان محاسبهشده در توصیف برخی از ویژگیهای اشکال در نظر گرفته شده دارای ارزش است، و بنابراین روشی برای ترکیب گشتاورهای ثابت در یک اندازهگیری خلاصه بهدنبال شد. این کار با ترسیم نمودار، برای هر ویژگی معادل در نظر گرفته شده، مقادیر هر یک از ممان های آن (در این مورد، ممان Ω i , i= 1، 2، 3،…،7) در یک فضای هفت بعدی. هر چند ضلعی که باید مقایسه شود، یک موقعیت را در آن فضا اشغال میکند، و مقادیر لحظههای آن را خلاصه میکند، و همترازی موقعیتهای ویژگیهای متناظر، نشانی از تطابق بین چنین ویژگیهای چندضلعی را نشان میدهد. نمادهای منطقه تقریباً قابل مقایسه، فاصله اقلیدسی بین لحظات کوچکی را در فضای هفت بعدی نشان می دهند، در حالی که آن چند ضلعی که به خوبی مطابقت ندارند، فاصله بسیار بیشتری را نشان می دهند. بنابراین فاصله واقعی اتخاذ شده به عنوان یک معیار برای تطبیق به صورت زیر تعریف می شود:

جایی که:
d s : یک مقدار توصیف کننده که تفاوت را نشان می دهد (صفر اگر ( ) و ( ) از همه جنبه های مساحتی یکسان باشند). قدر d s اندازه معقولی از تفاوت بین اشکال را نشان می دهد.


M و N : ویژگی یکسان در دو مجموعه داده جداگانه.
و : مجموعههای لحظههای ثابت برای ویژگیهای هر مجموعه داده [ 34 ]. 
مختصات E، N خطوط کلی هر چند ضلعی در مجموعه دادههای شهری و روستایی بریتانیا، و مجموعه داده عراقی برای محاسبه مقادیر ثابت لحظهها استفاده شد. هر مجموعه داده منطقه متفاوتی را پوشش میدهد، اما ویژگیهای چند ضلعی در هر منطقه یکنواختی را نشان میدهند: خانههای بلوکی در منطقه شهری بریتانیا، ویژگیهای منطقه طبیعی نامنظم در منطقه روستایی بریتانیا، ساختمانهای بلوک بزرگ نهادی در نمونه عراق. مقادیر گشتاورهای حاصل محاسبهشده برای ویژگیهای چند ضلعی منفرد در هر مجموعه داده شباهت را نشان میدهد، با اشکال چندضلعی سادهتر و منظمتر برای مجموعه دادههای شهری که به طور قابلتوجهی با ممانهای ثابت محاسبهشده برای اشکال نامنظم و پیچیده مشخصشده در مناطق روستایی متفاوت است ( جدول 4).). به نظر میرسد که میانگینگیری مقادیر ثابت گشتاورها در همه چند ضلعیها در هر مجموعه داده موجه است، بنابراین، یک مقدار گشتاور مشخص کننده واحد برای هر لحظه ثابت، یک تا هفت به دست آمد. اینها همانطور که در بالا نشان داده شد ترسیم شدند و یک مقدار توصیفگر واحد برای نشان دادن “فاصله” بین دو مجموعه داده کامل به دست آمد. شکل 8 نمونه ای از نتایج رسم شده چنین “فاصله ها” را نشان می دهد. بزرگی تفاوت بین مجموعه داده های OSM غیررسمی و مجموعه داده های رسمی GDS واضح است: یک بار دیگر به نظر می رسد عدم تطابق قابل توجهی بین داده های OpenStreetMap و مجموعه داده های رسمی دولتی وجود دارد.

جدول 4. نمونه هایی از محاسبات غیرمتغیر گشتاور از یک ویژگی چندضلعی در هر مجموعه داده.

شکل 8. نمونه ای از مقایسه فاصله اقلیدسی 7 لحظه ای ثابت برای سه مجموعه داده (بررسی میدانی (FS)، اداره کل بررسی (GDS) و OSM) در بغداد، عراق.
6. ابزاری برای ارزیابی تطبیق مجموعه داده های مکانی
معیارهای تطبیق مجموعه دادههای ذکر شده در بالا در یک ابزار بصری گنجانده شد که میتواند برای قضاوت در مورد پتانسیل یکپارچهسازی دادهها مورد استفاده قرار گیرد. هدف ایجاد یک رابط کاربر پسند با ترکیب تجزیه و تحلیل کمی و بصری مقایسه مجموعه داده بود که می تواند برای ارزیابی شباهت هندسی مجموعه داده های آزمایش شده مورد استفاده قرار گیرد. مراحل پردازش در تطابق نقطه، خط و ناحیه در بسته نرم افزاری MATLAB توسعه داده شد و یک رابط کاربری گرافیکی (GUI) نیز برای گزارش نتایج محاسبات و تجسم مقایسه ها ایجاد شد [ 35 ]]. با این رابط کنترل شده توسط کاربر، داده ها را می توان به عنوان فایل های متنی مختصات پلان سنجی از مجموعه داده ها وارد کرد، محاسبات با استفاده از فرمول ها و روش های ذکر شده در بالا اعمال می شوند، و نمایش گرافیکی داده های ورودی و تجزیه و تحلیل نیز می توانند در یک گزارش. هر مجموعه داده، رسمی (FM)، داده های رسمی (شامل داده های OS و GDS)، داده های بررسی میدانی به طور دقیق جمع آوری شده (FS)، و داده های OpenStreetMap (OSM) با استفاده از این رابط مورد بررسی قرار گرفته اند که نمونه هایی از آن در زیر نشان داده شده است. . مقایسههای نقطهای، خطی و منطقهای برای هر ترکیبی از مجموعه دادهها انجام میشود، اگرچه مهمترین آنها مقایسه مستقیم دادههای رسمی و غیررسمی است.
اگرچه نشان داده شده است که این رابط های کاربرپسند در گزارش ورودی، محاسبات، نقشه برداری و خروجی داده ها موثر هستند، اما هیچ عملکرد تصمیم گیری خاصی به سیستم متصل نیست. هیچ آستانه پذیرشی برای راهنمایی کاربر ارائه نشده است، زیرا احساس می شود که قضاوت در نظر گرفته شده باید تعیین کننده اصلی باشد که آیا یکپارچه سازی داده ها باید توصیه شود یا خیر. عامل اصلی، در هر تمرین یکپارچه سازی داده ها، البته، کاربرد نهایی هر مجموعه داده ترکیبی است. همانطور که در ابتدای این مقاله نشان داده شد، دامنه کاربردهای بالقوه برای ادغام دادههای رسمی و غیررسمی بسیار زیاد است و هر یک از مجموعههای داده مورد استفاده در اجرای خود مطالباتی را ایجاد میکنند. آنچه برای یک کار مناسب است ممکن است برای دیگری مناسب نباشد. این به ویژه در مورد ویژگی اصلی یک مجموعه داده جغرافیایی، مقیاس آن صادق است. تمرکز این کار بر روی دادههای مقیاس بزرگ بوده است و در اینجا پیشنهاد میشود که توجه قابل توجهی به این جنبه قبل از در نظر گرفتن هرگونه ادغام مجموعه داده شود.
شکل 9 یک نمونه رابط کاربری گرافیکی MATLAB را نشان می دهد که مقایسه بین موقعیت های نقطه را در داده های رسمی Ordnance Survey (در اینجا به عنوان “داده های مرجع” در نظر گرفته شده است) در مقایسه با داده های OpenStreetMap برای منطقه مورد مطالعه روستایی، در Clara Vale، UK گزارش می دهد. آمارهای موقعیتی، توصیفی و جهت دار به صورت عددی، همراه با ارائه گرافیکی میزان اختلافات، بر روی یک نقشه مقیاسبندی شده و نمودار برداری خلاصه گزارش شدهاند.
به طور مشابه، شکل 10 رابط کاربری گرافیکی را نشان می دهد که برای ارزیابی تطابق خطی، در این مورد با مقایسه داده های رسمی (FM)، با بررسی دقیق میدانی (FS)، و داده های OSM غیررسمی، در منطقه مورد مطالعه شهری (کراملینگتون، انگلستان) طراحی شده است. ). در اینجا، محاسبات درصد همپوشانی بافر به صورت عددی و گرافیکی، همراه با پوششی از ویژگی های خطی (در این مورد، خطوط مرکزی جاده) ارائه شده است. نمودار جابجایی میانگین محاسبه شده هر سه مجموعه داده را به طور همزمان نشان می دهد، در حالی که ویژگی های خطی به دقت در پنجره نهایی در این رابط نگاشت می شوند.

شکل 9. نتایج اندازه گیری شباهت موقعیتی برای مقایسه مجموعه داده های OS-OSM در Clara Vale-UK.

شکل 10. نتایج اندازه گیری شباهت خطی برای مقایسه FS، OS – به عنوان FM، داده های رسمی، و OSM در کراملینگتون، انگلستان ذکر شده است.
در نهایت، شکل 11 رابط مبتنی بر چند ضلعی را نشان میدهد، محاسبات لحظهها را خلاصه میکند، و دوباره یک پوشش نگاشت شده برای قضاوت بصری اختلافات ارائه میکند. در اینجا، هفت لحظه ثابت برای هر مجموعه داده محاسبه میشود: FM، دادههای رسمی، بخشی از مجموعه دادههای GDS برای کلانشهر بغداد، عراق است، در حالی که دادههای بررسی میدانی (FS) و OSM در کنار یکدیگر مقایسه میشوند. موقعیت کلی مقدار لحظه های خلاصه برای هر مجموعه داده در فضای هفت بعدی رسم می شود و نمودار میله ای در GUI فاصله یک مجموعه داده تا دیگری را نشان می دهد. مجموعه داده های ساده در نظر گرفته شده در اینجا به شکل نقشه نیز نشان داده شده است.

شکل 11. رابط نتایج خروجی اندازهگیری شباهت شکل مساحت برای سه مجموعه داده (FS، GDS – به عنوان FM، دادههای رسمی و OSM) در بغداد، عراق.
7. نتیجه گیری و بحث
یک روش و سیستم برای استخراج معیارهایی برای ارزیابی شکل و کیفیت موقعیت در میان مجموعه داده ها برای اهداف یکپارچه سازی توسعه داده شده است. روش های مختلفی برای به دست آوردن توصیفات ارزشمند از تطابق هندسی (بر اساس دقت موقعیت و وفاداری شکل) استفاده شده است. NSSDA برای انتخاب و تجزیه و تحلیل نقاط آزمایش شده انتخاب شده است، سپس مقادیر RMSE را محاسبه می کند و معیارهای مقایسه ای اختلاف موقعیت را به دست می دهد. برای تجزیه و تحلیل جهت خطا، آمار دایره ای اتخاذ شده است. شباهت هندسی خطی با ایجاد بافرهایی در اطراف خطوط در مجموعه داده های مربوطه، با تجزیه و تحلیل یکنواختی نسبی چنین مناطق بافر (اتحاد، تقاطع، و غیره ) آزمایش شده است.). معیارهای شکل، از جمله گشتاورهای ثابت، برای ارزیابی تطابق چند ضلعی استفاده شده است.
نتایج این تحلیل نشان میدهد که مقایسه مجموعه دادههای رسمی (دادههای سیستمعامل و GDS) با مجموعه دادههای دقیق FS تطبیق خوبی را بهویژه برای مناطقی با جزئیات «سخت» میدهد. با این حال، اندازهگیریهای موقعیت و شکل دادههای OSM غیررسمی با دادههای رسمی در هیچ یک از حوزههای مطالعه موردی بررسیشده مطابقت ندارد. نتیجه این است که، وقتی از منظر تطبیق هندسی مورد بررسی قرار گیرد، در تلاش برای ادغام دادههای OSM با دادههای رسمی، در مقیاسهای بزرگی که در اینجا در نظر گرفته میشود، مشکلات قابل توجهی وجود خواهد داشت. هدف اصلی این مقاله ارزیابی دقت OSM در برابر یک “حقیقت” درک شده، بلکه انجام برخی مقایسه ها نبوده است. تناقضات اندازه گیری شده که از کارهایی که در اینجا شرح داده شده است، به وضوح علیه یکپارچگی مبارزه می کند. دلیل اصلی اختلافات ذکر شده بدیهی است که روشهای مختلف جمعآوری دادهها متفاوت است: VGI ارائهشده در مجموعه داده OSM میتواند از دستگاههای GPS با دقت بسیار متفاوت، از تصاویر ماهوارهای یا عکسهای هوایی، یا صرفاً از دانش محلی تهیه شود. تگ “منبع” متصل به هر ویژگی در مجموعه داده OSM معمولاً برای مشخص کردن مبدا داده ها استفاده می شود.36]. این می تواند برای به دست آوردن یک دید اولیه از دقت هندسه استفاده شود: یک ویژگی OSM که با منبع “landsat” برچسب گذاری شده است، معمولاً نسبت به ویژگی “ردیابی GPS” با دقت کمتری ضبط می شود. حتی برای ویژگی هایی که در میدان با استفاده از GPS ثبت شده اند، اکثر آنها با استفاده از گیرنده های GPS با دقت پایین مانند Garmin، Holux GPSlim236 و iPhone GPS نمونه برداری شده اند. گاهی اوقات، ویژگیهای OSM با چشم از موقعیتهای GPS و مسیرهای ثبت شده توسط چندین نفر در طول زمان میانگینگیری میشوند، و اغلب به دلیل مشکلات دسترسی یا عدم تجربه در بررسی میدانی، جزئیات به جای اندازهگیری واقعی استنباط میشوند. برای ویژگیهای OSM دیجیتالی شده از تصاویر هوایی یا ماهوارهای یاهو (منبع داده استاندارد برای مشارکتکنندگانی که از منطقه نقشهبرداری شده دورتر هستند)، عدم آشنایی ممکن است کیفیت را بیشتر کاهش دهد. تشخیص ویژگی هایی مانند خیابان های یک طرفه یا جاده های دوتایی می تواند از تصاویر در مقیاس کوچک دشوار باشد. یک مشارکتکننده محلی احتمالاً دانش بهتری در مورد یک منطقه مورد علاقه و همچنین دسترسی به آن منطقه دارد، اما بسیاری از دادههای OSM از راه دور نقشهبرداری میشوند (به عنوان مثال، برخی از دادههای OSM در بغداد توسط یک مشارکتکننده OSM ساکن ایجاد شدهاند. در انگلستان). علاوه بر دانش محلی، ممکن است مجموعه دادههای مستقل بیشتر و نظرات متخصص بتواند به بهبود کیفیت مجموعه داده OSM کمک کند: افزودن مجموعه دادههای نظرسنجی میدانی در مطالعات گزارششده در این مقاله میتواند با ورودی تعدیلکننده اضافی در مقایسه برابر باشد. روند. کامبر و همچنین دسترسی به محل، اما بسیاری از دادههای OSM از راه دور نقشهبرداری میشوند (به عنوان مثال، برخی از دادههای OSM در بغداد توسط یکی از مشارکتکنندگان OSM ساکن بریتانیا ایجاد شدهاند). علاوه بر دانش محلی، ممکن است مجموعه دادههای مستقل بیشتر و نظرات متخصص بتواند به بهبود کیفیت مجموعه داده OSM کمک کند: افزودن مجموعه دادههای نظرسنجی میدانی در مطالعات گزارششده در این مقاله میتواند با ورودی تعدیلکننده اضافی در مقایسه برابر باشد. روند. کامبر و همچنین دسترسی به محل، اما بسیاری از دادههای OSM از راه دور نقشهبرداری میشوند (به عنوان مثال، برخی از دادههای OSM در بغداد توسط یکی از مشارکتکنندگان OSM ساکن بریتانیا ایجاد شدهاند). علاوه بر دانش محلی، ممکن است مجموعه دادههای مستقل بیشتر و نظرات متخصص بتواند به بهبود کیفیت مجموعه داده OSM کمک کند: افزودن مجموعه دادههای نظرسنجی میدانی در مطالعات گزارششده در این مقاله میتواند با ورودی تعدیلکننده اضافی در مقایسه برابر باشد. روند. کامبر افزودن یک مجموعه داده پیمایش میدانی در مطالعات گزارش شده در این مقاله می تواند با ورودی تعدیل کننده اضافی در فرآیند مقایسه برابر باشد. کامبر افزودن یک مجموعه داده پیمایش میدانی در مطالعات گزارش شده در این مقاله می تواند با ورودی تعدیل کننده اضافی در فرآیند مقایسه برابر باشد. کامبرو همکاران [ 37 ] نشان دادهاند که چگونه چنین دانش تخصصی میتواند دقت دادههای VGI گرفتهشده برای بررسی کاربری زمین را افزایش دهد. ویژگیهای شخصی دیگری مانند تجربه و تواناییهای جمعآورنده VGI وجود دارد که بر یکپارچگی و ارزش مجموعه داده OSM تأثیر میگذارد.
ماهیت نوع ویژگی نیز تعیین کننده اختلافات مشاهده شده است. البکری و فیربایرن [ 13 ] نشان دادهاند که دادههای VGI روستایی و طبیعی (جزئیات نرم) در مقایسه با دادههای جمعآوریشده در مکانهای شهری «محیط سخت» و کامل، دقت موقعیتی و کاملی کمتری دارند. بنابراین ادغام مجموعه داده های رسمی و غیررسمی در مناطق شهری می تواند با اطمینان بیشتری نسبت به مکان های روستایی انجام شود.
اندازه گیری دقت مجموعه داده های جغرافیایی و ارزیابی ادغام احتمالی فراتر از مسائل موقعیتی و هندسی است. معنای نمادها و طبقهبندی اشیا در دنیای واقعی با دادههای معنایی اضافه شده به مجموعه دادههای هماهنگ اندازهگیریشده یا مشتقشده از آن، مورد بررسی قرار میگیرد. مطالعه بیشتر درباره معنایی هر مجموعه داده انجام شده است [ 14]، و اندازهگیری «نزدیک» اطلاعات ویژگیها، اندازهگیری شباهت معنایی عناصر طرحواره XML به منظور ارزیابی احتمالات یکپارچهسازی دادهها از طیف وسیعی از منابع «جمعسپاری» و رسمی انجام شد. اندازهگیری شباهت معنایی بین OSM و مجموعه دادههای رسمی در این مطالعه عدم تطابق مشابه با آزمایشهای مربوط به ویژگیهای هندسی را به همراه داشت. بسط های بیشتر به این روش می تواند دقت زمانی، کامل بودن و اصل و نسب، همه ویژگی های قابل مقایسه را مورد توجه قرار دهد.
همچنین باید دانست که VGI نه تنها میتواند شامل دادههای اندازهگیری شده از میدان یا تصاویر سنجش از راه دور باشد، بلکه میتواند شامل عکسهای ایجاد شده توسط کاربر (به عنوان مثال، فلیکر)، توضیحات متنی و بهروزرسانی کاربر مجموعه دادههای مکانی باشد (مثلا TomTom MapShare، Google MapMaker): اینها همچنین می توانند به UGC “انبوه سپاری” کمک کنند و دقت آنها را می توان با استفاده از تکنیک های ذکر شده در اینجا بررسی کرد.
از آنجایی که استفاده بالقوه از VGI اهمیت روزافزونی پیدا میکند و دادههای «جمعسپاری» هم بهعنوان یک مجموعه داده اولیه ارائه میشوند، برای مثال در مناطقی که نقشهبرداری در مقیاس بزرگ وجود ندارد (مانند مناطق دورافتاده توسط بلایا)، و به عنوان یک در زیرساخت های داده های مکانی یکپارچه (از جمله به روز رسانی مجموعه داده های رسمی)، مهم است که احتیاط کنید. یک مفهوم معتبر این مطالعه این است که دادههای OSM را میتوان با دقت کمتری نسبت به مجموعه دادههای رسمی توصیف کرد. بنابراین، دقت موقعیتی و هندسی VGI میتواند باعث نگرانی شود: ارائه آن بهعنوان نوشدارویی برای بهبود مجموعه دادههای رسمی قدیمی، در مقیاس بزرگ، در بیشتر موارد باید با شک و تردید و در بسیاری از آنها با رد نگریست. در برخی از کاربردهای پیشنهادی در ابتدای این مقاله، از جمله سیستمهای ناوبری داخل خودرو، در پروژههای مهندسی سایت و خدمات شهری، و هر سیستمی که مبتنی بر ترسیم دقیق قطعه زمین است، احتمالاً بهتر است بهجای برخی از محتوای نادرست و احتمالاً ناقص تولید شده توسط کاربر، اصلاً نقشهبرداری نداشته باشیم. اگرچه مشارکت جوامع محلی و افراد و پروژههای مشتاق در گسترش دامنه مجموعه دادههای جغرافیایی قابل استقبال است، اما واضح است که چنین مشارکتی باید به عنوان بخشی از برنامه گستردهتر و سیستماتیک فعالیت نقشهبرداری در نظر گرفته شود، که ثبات، مراقبت و بررسی را نشان میدهد. .
کد رابط کاربری گرافیکی MATLAB که برای تولید رابط مورد استفاده در انجام ارزیابی ایجاد شده است در البکری [ 38 ] ارائه شده است.
منابع
- واندنبروک، دی. زامبون، M.-L. Crompvoets، J.; Dufourmont, H. فصل 16 دستورالعمل INSPIRE: الزامات خاص برای نظارت بر اجرای آن. در یک چارچوب چند نما برای ارزیابی SDI ها ؛ Crompvoets, J., Rajabifard, A., von Loenen, B., Delgado Fernández, T., Eds.; Space for Geo-Information (RGI)، دانشگاه Wageningen: Wageningen، هلند، 2008. [ Google Scholar ]
- کوپر، AK; راپنت، پی. هجلماگر، ج. لوران، دی. ایوانیاک، ع. کوتزی، اس. مولرینگ، اچ. Düren، U. گسترش مدل رسمی زیرساخت داده های مکانی برای شامل اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات بیست و پنجمین کنفرانس بین المللی کارتوگرافی، پاریس، فرانسه، 3 تا 8 ژوئیه 2011.
- Mackaness، WA; بوی، جی. کلارک، اس. فردریکسون، ام. گفنر، اچ. لیمو، او. مینوک، ام. وببر، بی. پروژه کتاب فضایی: اکتشاف عابر پیاده شهر با استفاده از تعامل مبتنی بر گفتگو از طریق تلفن های هوشمند. در مجموعه مقالات هشتمین سمپوزیوم بین المللی خدمات مبتنی بر مکان، وین، اتریش، 21-23 نوامبر 2011.
- Welle, K. بهبود ارائه خدمات اساسی برای فقرا در محیط های شکننده: تامین آب، بهداشت و بهداشت . موسسه توسعه خارج از کشور (ODI): لندن، انگلستان، 2008. [ Google Scholar ]
- موستییر، اس. Devogele, T. تطبیق شبکه ها با سطوح مختلف جزئیات. Geoinformatica 2008 ، 12 ، 435-453. [ Google Scholar ] [ CrossRef ]
- Goodchild، MF Citizens به عنوان حسگرهای داوطلبانه: زیرساخت داده های مکانی در دنیای وب 2.0. بین المللی جی. اسپات. Data Infrastr. Res. 2007 ، 2 ، 24-32. [ Google Scholar ]
- بوتنوت، م. فون گوسلن، جی. تایدج، م. هیپکه، سی. لیپک، یو. Sester, M. ادغام داده های جغرافیایی ناهمگن در یک پایگاه داده فدرال. ISPRS J. Photogramm. 2007 ، 62 ، 328-346. [ Google Scholar ] [ CrossRef ]
- Congalton، RG; گرین، ک. ارزیابی دقت دادههای سنجش از راه دور: اصول و روشها . CRC Press: Boca Raton، FL، USA، 2009. [ Google Scholar ]
- نیس، پ. Zipf، A. تجزیه و تحلیل فعالیت مشارکت کننده یک پروژه داوطلبانه اطلاعات جغرافیایی – مورد OpenStreetMap. ISPRS Int. J. Geo Inf. 2012 ، 1 ، 146-165. [ Google Scholar ] [ CrossRef ]
- زیلسترا، دی. Zipf، A. مطالعات کمی در مورد کیفیت داده OpenStreetMap در آلمان. در مجموعه مقالات GIScience 2010: ششمین کنفرانس بین المللی علوم اطلاعات جغرافیایی، زوریخ، سوئیس، 14-17 سپتامبر 2010.
- Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی مجموعه داده های نظرسنجی OpenStreetMap و مهمات. محیط زیست طرح. B طرح. دس 2010 ، 37 ، 682-703. [ Google Scholar ] [ CrossRef ]
- Girres, J.-F. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS 2010 ، 14 ، 435-459. [ Google Scholar ] [ CrossRef ]
- البکری، م. Fairbairn، D. ارزیابی دقت دادههای جمعسپاری و ادغام آن با مجموعههای رسمی دادههای مکانی. در مجموعه مقالات دقت 2010: نهمین سمپوزیوم بین المللی ارزیابی دقت فضایی در منابع طبیعی و علوم محیطی، لستر، بریتانیا، 20 تا 23 ژوئیه 2010. صص 317-320.
- البکری، م. Fairbairn، D. ارزیابی تطبیق شباهت برای ادغام احتمالی طبقهبندی ویژگیهای دادههای مکانی از منابع رسمی و غیررسمی. بین المللی جی. جئوگر. به اطلاع رساندن. علمی 2012 ، 26 ، 1437-1456. [ Google Scholar ] [ CrossRef ]
- دفتر بودجه ایالات متحده، استانداردهای دقت نقشه ملی ایالات متحده ؛ دفتر بودجه: واشنگتن، دی سی، ایالات متحده آمریکا، 1947.
- انجمن مهندسین عمران آمریکا (ASCE)، استفاده از نقشه، مقیاس ها و دقت برای اهداف مهندسی و مرتبط . ASCE، کمیته نقشه برداری نقشه برداری، نقشه برداری و بخش نقشه برداری: نیویورک، نیویورک، ایالات متحده آمریکا، 1983.
- ASPRS. استانداردهای دقت برای نقشه های مقیاس بزرگ فتوگرام مهندس سنجش از دور 1989 ، 56 ، 1038-1040.
- کمیته داده های جغرافیایی فدرال (FGDC)، استانداردهای دقت موقعیت یابی جغرافیایی، قسمت 3: استاندارد ملی برای دقت داده های مکانی ؛ STD-007.3-1998; FGDC: واشنگتن، دی سی، ایالات متحده آمریکا، 1998.
- Zandbergen، PA دقت موقعیتی داده های مکانی: توزیع های غیر عادی و نقد استاندارد ملی برای دقت داده های مکانی. ترانس. GIS 2008 ، 12 ، 103-130. [ Google Scholar ] [ CrossRef ]
- گرینوالت، سی. Shultz, M. اصول تئوری خطا و کاربردهای نقشه برداری ; نمودار هوانوردی و مرکز اطلاعات: سنت لوئیس، MO، ایالات متحده آمریکا، 1962. [ Google Scholar ]
- Hanbury، A. آمار دایره ای اعمال شده در تصاویر رنگی. در مجموعه مقالات هشتمین کارگاه زمستانی بینایی کامپیوتر، Valtice، جمهوری چک، 5 فوریه 2003; صص 55-60.
- Bowers، JA; مورتون، ID; قالب، GI آمار جهت باد و امواج. Appl. Ocean Res. 2000 ، 22 ، 13-30. [ Google Scholar ] [ CrossRef ]
- دی، س. Ghosh, P. GRDM – یک ابزار نقشه برداری میدانی دیجیتال برای مدیریت و تجزیه و تحلیل داده های زمین شناسی میدانی. محاسبه کنید. Geosci. 2008 ، 34 ، 464-478. [ Google Scholar ]
- آرادوتیر، Á.L. رابرتسون، ا. مور، E. تجزیه و تحلیل آماری دایره ای از استعمار توس و پاسخ رشد جهت دار توس و چوب پنبه سیاه در جنوب ایسلند. Agr. هواشناسی جنگلی 1997 ، 84 ، 179-186. [ Google Scholar ]
- کورکوران، جی. چتری، پ. استیمسون، آر. استفاده از آمار دایره ای برای کشف جغرافیای سفر به محل کار. پاپ Reg. علمی 2009 ، 88 ، 119-132. [ Google Scholar ] [ CrossRef ]
- آرنولد، بی. Sengupta، A. پیشرفت های اخیر در تجزیه و تحلیل داده های جهت دار در علوم زیست محیطی و زیست محیطی. محیط زیست Ecol. آمار 2006 ، 13 ، 253-256. [ Google Scholar ] [ CrossRef ]
- فیشر، NI تجزیه و تحلیل آماری داده های دایره ای ; انتشارات دانشگاه کمبریج: نیویورک، نیویورک، ایالات متحده آمریکا، 1993. [ Google Scholar ]
- Jammalamadaka، SR; Sengupta، A. موضوعات در آمار دایره ای ; انتشارات علمی جهانی: سنگاپور، 2001. [ Google Scholar ]
- Goodchild، MF; Hunter، GJ یک اندازه گیری دقت موقعیتی ساده برای ویژگی های خطی. بین المللی جی. جئوگر. Inf. علمی 1997 ، 11 ، 299-306. [ Google Scholar ] [ CrossRef ]
- تیویت، اچ. Langaas، S. یک روش ارزیابی دقت برای مجموعه داده های خط جغرافیایی بر اساس بافر. بین المللی جی. جئوگر. Inf. علمی 1999 ، 13 ، 27-47. [ Google Scholar ] [ CrossRef ]
- هو، ام.-ک. تشخیص الگوی بصری توسط متغیرهای لحظه ای. IRE Trans. Inf. نظریه 1962 ، 8 ، 179-187. [ Google Scholar ]
- چن، سی.-سی. تغییر ناپذیر لحظه ای بهبود یافته برای تشخیص شکل. پت تشخیص. 1993 ، 26 ، 683-686. [ Google Scholar ]
- نه، JS; الگوریتم شناسایی Rhee، KH Palmprint با استفاده از لحظههای ثابت هو و دوتایی کردن Otsu. در مجموعه مقالات چهارمین کنفرانس بین المللی سالانه ACIS در زمینه علوم کامپیوتر و اطلاعات، جزیره ججو، کره جنوبی، 14 تا 16 ژوئیه 2005. ص 94-99.
- بل حاج علی، ع. نمایش لحظه ای چند ضلعی ها برای ارزیابی کیفیت شکل آنها. جی. جئوگر. سیستم 2002 ، 4 ، 209-232. [ Google Scholar ]
- Lent, C. آموزش برنامه نویسی با متلب: ساخت ابزارهای رابط کاربری گرافیکی ; جان وایلی: نیویورک، نیویورک، ایالات متحده آمریکا، 2013. [ Google Scholar ]
- رام، اف. تاپف، جی. Chilton, S. OpenStreetMap—استفاده و تقویت نقشه رایگان جهان . UIT Cambridge Ltd.: Cambridge, UK, 2011. [ Google Scholar ]
- کامبر، ا. ببینید، L. فریتز، اس. ون در ولده، م. پرگر، سی. فودی، جی. استفاده از داده های کنترلی برای تعیین قابلیت اطمینان اطلاعات جغرافیایی داوطلبانه در مورد پوشش زمین. بین المللی J. Appl. زمین Obs. Geoinf. 2013 ، 23 ، 37-48. [ Google Scholar ]
- البکری، م. توسعه ابزارها و مدلها برای ارزیابی ادغام دادههای مکانی منابع داده رسمی و VGI. Ph.D. پایان نامه، دانشگاه نیوکاسل، نیوکاسل، انگلستان، 2012. [ Google Scholar ]
© 2013 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/3.0/) توزیع شده است.


بدون نظر