خلاصه
توسعه فزاینده اطلاعات جغرافیایی داوطلبانه (VGI) و نقش بالقوه آن در مطالعات GIScience سوالاتی را در مورد کیفیت داده های حاصل ایجاد می کند. چندین مطالعه به کیفیت VGI از دیدگاه های مختلف مانند کامل بودن، دقت موقعیتی، ثبات و غیره می پردازند. آنها عمدتاً در مورد ناهمگونی کیفیت داده اتفاق نظر دارند. مشکل ممکن است به دلیل فقدان رویه های استاندارد برای جمع آوری داده ها و عدم وجود بازخورد کنترل کیفیت برای شرکت کنندگان داوطلب باشد. در تحقیق خود، ما با کیفیت داده ها از منظر طبقه بندی سروکار داریم. مخصوصاً در پروژههای نقشه برداری VGI، تخصص محدود شرکتکنندگان و تعریف غیر دقیق ویژگیهای جغرافیایی منجر به کلاسهای همپوشانی مفهومی میشود، جایی که یک موجودیت به طور منطقی میتواند به چندین کلاس تعلق داشته باشد، مثلاً دریاچه یا برکه ، پارک یا باغ ، مرداب یا باتلاق . و غیره. معمولاً ویژگی های کمی و/یا کیفی وجود دارد که بین طبقات تمایز قائل می شود. با این وجود، این ویژگی ها ممکن است برای شرکت کنندگان غیرمتخصص قابل تشخیص نباشد. در کار قبلی، ما رویکرد طبقهبندی مبتنی بر قانون را توسعه دادیم که شرکتکنندگان را به مناسبترین کلاسها راهنمایی میکند. به عنوان مثال، ما به همپوشانی مفهومی برخی از طبقات مرتبط با علف می پردازیم. برای یک مجموعه داده معین، رویکرد ما توصیهشدهترین کلاسها را برای هر موجودیت ارائه میکند. در این مقاله، ما اعتبار رویکرد خود را ارائه می دهیم. ما یک برنامه مبتنی بر وب به نام Grass&Green پیاده سازی می کنیمکه توصیه هایی را برای اعتبارسنجی جمع سپاری ارائه می دهد. یافته ها کاربرد رویکرد پیشنهادی را نشان می دهد. در چهار ماه، این برنامه 212 شرکت کننده از بیش از 35 کشور را جذب کرد که 2865 نهاد را بررسی کردند. نتایج نشان میدهد که 89 درصد مشارکتها به طور کامل یا جزئی با توصیههای ما موافق هستند. سپس یک تجزیه و تحلیل دقیق انجام دادیم که پتانسیل این طبقه بندی داده های پیشرفته را نشان می دهد. این تحقیق توسعه برنامه های کاربردی سفارشی شده را تشویق می کند که یک ویژگی جغرافیایی خاص را هدف قرار می دهند.
کلید واژه ها:
اطلاعات جغرافیایی داوطلبانه (VGI) ; طبقه بندی ; کیفیت داده های مکانی ؛ OpenStreetMap (OSM)
1. معرفی
انقلابهای وب و اطلاعات، افزایش در دسترس بودن دستگاههای سنجش مکان، و فناوریهای ارتباطی پیشرفته، تکامل محتوای جغرافیایی رایگان را تسهیل میکنند که به اطلاعات جغرافیایی داوطلبانه (VGI) معروف است [1 ] . به طور خاص، ما نگران قالب VGI هستیم که در آن مردم بدون توجه به تجربه جغرافیایی قبلی خود در فرآیندهای نقشه برداری شرکت می کنند. در گذشته، این فرآیندها منحصراً توسط نقشهبرداران در آژانسهای نقشهبرداری و در سازمانهای تخصصی انجام میشد. از جمله، OpenStreetMap (OSM) ( http://openstreetmap.org/ )، Wikimapia ( http://www.wikimapia.org/ )، و Google Map Maker ( https://www.google.com/mapmaker )) نمونه هایی از پروژه های نقشه برداری مبتنی بر VGI هستند. با گسترش جمعسپاری، شرکتکنندگان حجم عظیمی از دادههای جغرافیایی رایگان را توسعه دادهاند که در برنامههای مختلف مورد استفاده قرار گرفتهاند. به عنوان مثال، VGI به عنوان یک منبع داده بالقوه برای کاربردهای نقشه برداری محیطی [ 2 ، 3 ]، مدیریت بحران [ 4 ، 5 ]، برنامه ریزی شهری [ 6 ، 7 ]، ارائه نقشه [ 8 ] و خدمات مبتنی بر مکان (LBS) عمل می کند. ) [ 7 ، 9 ]. با این حال، در هر برنامه، کیفیت داده ها یک موضوع نگران کننده است. چندین مطالعه به این نتیجه رسیده اند که کیفیت VGI ناهمگن است [ 10]. این یافته بر کاربرد VGI به عنوان یک منبع مکمل یا به عنوان جایگزینی برای منابع داده معتبر تأثیر می گذارد [ 11 ، 12 ، 13 ، 14 ].
به طور کلی، VGI – به عنوان داده های مکانی – دارای معیارهای متعددی از کیفیت داده ها مانند: کامل بودن، اصل و نسب، سازگاری منطقی، دقت موقعیتی، و دقت معنایی (ویژگی) است [15 ] . در تحقیق خود، ما به دقت ویژگی توجه داریم. به طور خاص، ما کیفیت داده ها را از نظر طبقه بندی بررسی می کنیم، به عنوان مثال ، آیا یک قطعه زمین پوشیده از چمن به عنوان پارک ، باغ یا جنگل طبقه بندی می شود ، اگر یک آب منطقه ای متعلق به کلاس دریاچه ، حوضچه یا مخزن و غیره باشد.. در پروژه های VGI، طبقه بندی داده ها عمدتا بر اساس شناخت شرکت کنندگان است. از یک طرف، طبقه بندی مناسب به ویژگی های کمی (مثلاً اندازه، مساحت) و/یا کیفی (مثلاً زمینه) بستگی دارد. با این حال، این ویژگی ها، که بین کلاس ها تمایز قائل می شود، ممکن است توسط شرکت کنندگان مشاهده نشود. علاوه بر این، روشهای غیر استاندارد جمعآوری دادهها و تخصص محدود شرکتکنندگان ممکن است منجر به طبقهبندی ناهمگن دادهها شود. از سوی دیگر، تعریف غیر دقیق ویژگیهای جغرافیایی – در برخی موارد – به طبقات همپوشانی مفهومی منجر میشود. بنابراین، یک موجودیت معین ممکن است به عنوان دریاچه یا برکه ، پارک یا باغ ، مرداب یا باتلاق طبقه بندی شود.و به طور قابل قبولی می تواند به چندین کلاس تعلق داشته باشد، اما فقط جزئیات کوچک ممکن است بین مناسب ترین کلاس تمایز قائل شود [ 16 ، 17 ].
برای مقابله با مشکلات فوق الذکر، ما رویکرد طبقه بندی مبتنی بر قانون را در کار قبلی خود پیشنهاد می کنیم [ 16 ، 17 ]. این رویکرد ویژگی های کیفی متمایز کلاس های خاص را می آموزد و آنها را در قوانین پیش بینی رمزگذاری می کند. پس از آن، قوانین استخراج شده در یک طبقه بندی سازماندهی می شوند که برای هدایت شرکت کنندگان به سمت مناسب ترین کلاس ها عمل می کند. در این مقاله، ما اعتبار یابی جمع سپاری را به عنوان یکی از سناریوهای اجرای ممکن رویکرد خود پیشنهاد می کنیم. در این سناریو، مجموعهای از موجودیتهای مرتبط با کلاسهای توصیهشده خود را به منظور اعتبارسنجی به جمعیت ارائه میکنیم.
در این مقاله، ما برنامه Grass&Green ( http://www.opensciencemap.org/quality ) را ارائه می کنیم: یک برنامه وب که به چالش همپوشانی مفهومی برخی از کلاس های مرتبط با چمن می پردازد. ما از داده های پروژه OSM، به ویژه مجموعه داده های آلمان استفاده کردیم. با این حال، نتایج به کل نقشهبرداران OSM و همچنین شرکتکنندگان عمومی ارائه شد. ما کلاس های باغ ، چمن ، جنگل ، پارک و علفزار را انتخاب کردیمبه عنوان نمونه ای از مسئله همپوشانی مفهومی. این انتخاب بر اساس دلایل زیر است: (1) در مجموعه داده های مورد استفاده، آنها رایج ترین طبقات مربوط به چمن در محدوده شهر هستند (حوزه جغرافیایی تحقیق ما). و (ii) برای افراد غیرمتخصص، همپوشانی مفهومی بین این طبقات وجود دارد، زیرا آنها با مفهوم جهانی چمن مرتبط هستند اما با تفاوتهای ظریفتری. ما برنامه را برای اعتبارسنجی کار قبلی خود در [ 16 ، 17 ] راه اندازی کردیم. به شرکت کنندگان اجازه داده شد تا موافقت/مخالفت خود را با کلاس های پیشنهادی اعلام کنند. علاوه بر این، شرکت کنندگان تشویق شدند تا بازخورد و نظرات خود را برای ما ارسال کنند. ما برنامه را در دفتر خاطرات OSM اعلام کردیم [ 18] و سایر وبلاگ های رسانه های اجتماعی. در چهار ماه، این برنامه 212 شرکت کننده از بیش از 35 کشور را جذب کرد. در این دوره، شرکت کنندگان 2865 نهاد را بررسی کردند. یافته ها نشان دهنده کاربردی بودن رویکرد پیشنهادی است. حدود 89٪ از مشارکت ها به طور کامل یا جزئی با کلاس های توصیه شده ما مطابقت دارد. علاوه بر این، بررسی دقیق نتایج، طبقهبندی پیشرفته موجودیتهای هدف را نشان میدهد. ما بازخورد مثبتی از شرکتکنندگان دریافت کردیم، که گسترش کاربرد رویکرد پیشنهادی را در مکانهای مختلف تشویق میکند. علاوه بر این، یافتههای این کار، انگیزه توسعه برنامههای کاربردی سفارشیسازیشدهتری را ایجاد میکند که یک ویژگی جغرافیایی خاص را مدیریت میکنند تا کیفیت دادههای مجموعه دادههای جغرافیایی داوطلبانه را افزایش دهند.
این مقاله به شرح زیر سازماندهی شده است. بخش 2 یک نمای کلی در مورد کارهای مرتبط ارائه می دهد. دلایل طبقهبندی مشکلدار دادهها در پروژههای VGI، از جمله طبقهبندی ذهنی، ناهمگونی شرکتکنندگان، و کلاسهای همپوشانی مفهومی در بخش 3 مورد بحث قرار گرفتهاند . خلاصه ای از رویکرد پیشنهادی ما در بخش 4 ارائه شده است . برنامه Grass&Green در بخش 5 ارائه شده است که شامل: توضیحات، معماری مفهومی، و متدولوژی های اعلام است. بخش 6 نتایج را از دیدگاه های مختلف نشان می دهد. چشم اندازی از رویکرد پیشنهادی با توجه به افزایش کیفیت داده ها در بخش 7 ارائه شده است. بخش 8 مقاله را به پایان می رساند و برخی از جهت گیری های تحقیقاتی آینده را برجسته می کند.
2. کارهای مرتبط
با افزایش در دسترس بودن منابع VGI، کیفیت داده های حاصل به عنوان یک موضوع نگران کننده در GIScience مطرح شده است [ 10 ، 12 ، 14 ]. بیشتر تحقیقات پروژه OSM را به عنوان برجسته ترین پروژه نقشه برداری VGI هدف قرار داده اند. هدف این پروژه ایجاد یک نقشه دیجیتالی رایگان جهان است که توسط همه قابل ویرایش و قابل دستیابی است [ 8 ]. در حال حاضر، دادههای OSM بیشتر جهان را پوشش میدهد و طبق وبسایت OSMstats [ 19 ]، این پروژه در 10 آوریل 2016 بیش از 2500000 کاربر ثبتشده دارد. چندین مطالعه تحقیقاتی به کیفیت از دیدگاه های مختلف مانند ارزیابی داده های حاصل پرداخته اند ( بخش 2.1).و توسعه رویکردها و روششناسی برای افزایش کیفیت دادهها ( بخش 2.2 ). تحقیقات دیگر بر طبقه بندی داده ها در محتوای جغرافیایی تولید شده توسط کاربر متمرکز شده است ( بخش 2.3 ).
2.1. ارزیابی کیفیت VGI
به طور کلی، داده های جغرافیایی-مکانی یا با مقایسه با یک منبع داده معتبر یا با تجزیه و تحلیل ویژگی های ذاتی داده ها ارزیابی می شوند. ارزیابی بر اساس معیارهای استاندارد کیفیت داده های مکانی توسعه یافته در ISO/TC 211 [ 20 ، 21 ] انجام می شود. دادههای OSM با دادههای معتبر در بریتانیا، آلمان، کانادا و فرانسه مقایسه میشوند [ 22 ، 23 ، 24 ، 25 ، 26 ، 27 ]. با تکامل VGI، نویسندگان در [ 13] استدلال می کنند که در ارزیابی داده های VGI سه بعد وجود دارد: ابعاد جمع سپاری، اجتماعی و ابعاد جغرافیایی. از این رو، ویژگی های ذاتی داده ها مانند شهرت مشارکت کنندگان، تاریخچه ویرایش و تکامل داده ها برای ارزیابی کیفیت داده ها تجزیه و تحلیل شده است [ 28 ، 29 ، 30 ، 31 ، 32 ، 33 ، 34 ، 35 ]. محققان معیارهای کیفی مختلفی مانند دقت موقعیتی، کامل بودن و دقت موضوعی را با توجه به ویژگیهای مختلف جغرافیایی مانند شبکههای جادهای، ساختمانها و ویژگیهای کاربری زمین بررسی کردهاند. دیدگاه دیگری از ارزیابی کیفیت در [ 36] ارائه شده است]، که در آن کیفیت داده با هدف استفاده مرتبط است. در [ 37 ]، نویسندگان چارچوبی را برای ارزیابی مفهومی کیفیت داده ها ارائه کردند.
اکثر تحقیقات به این نتیجه رسیدند که VGI یک منبع داده بالقوه ارزشمند است، به ویژه در مکان های شهری [ 38 ]. با این وجود، آنها عمدتاً در مورد کیفیت ناهمگن داده ها با توجه به معیارهای مختلف کیفیت توافق دارند [ 12 ، 13 ].
2.2. افزایش کیفیت VGI: رویکردها و روش ها
چندین عامل اقتصادی و فرهنگی بر کیفیت داده ها در پروژه های نقشه برداری VGI تأثیر می گذارد [ 35 ، 39 ]. طبق دانش ما، تنها تعداد محدودی از مطالعات تحقیقاتی مربوط به افزایش کیفیت داده ها در پروژه های نقشه برداری مبتنی بر VGI وجود دارد.
در [ 40 ، 41 ]، نویسندگان استدلال می کنند که رابط های انسانی بصری می توانند در تولید داده های با کیفیت بالا نقش داشته باشند. کار در [ 42 ] ترکیب OSM و داده های معتبر را تشویق می کند تا یک منبع داده باز یکپارچه ایجاد کند در حالی که [ 43 ] یک راه حل معنایی ارائه می دهد که به مشارکت کنندگان در طول فرآیند ویرایش به سمت بهبود کیفیت داده ها کمک می کند تا بر بین فرهنگی و چند-فرهنگی غلبه کنند. مشکلات زبان علاوه بر این، [ 11 ، 44 ] در مورد استفاده از یادگیری برای افزایش طبقه بندی داده های پروژه های VGI بحث کردند. در [ 16 ، 17]، ما رویکرد طبقهبندی مبتنی بر قانون را ارائه کردیم که برای ایجاد کلاسهای توصیهشده برای بهبود کیفیت طبقهبندی عمل کرد. به عنوان یک جایگزین، “Gamification” به عنوان روش دیگری برای افزایش کیفیت VGI ارائه شده است [ 45 ].
به طور خاص برای پروژه OSM، OSMRec یک ابزار توصیه ارائه شده در [ 46 ] است. این یک ابزار افزونه ویرایشگر برای حاشیه نویسی خودکار موجودات فضایی در پروژه OSM است [ 47 ]. علاوه بر این، OSM Inspector [ 48 ]، KeepRight [ 49 ]، MapRoulette [ 50 ] و MapDust [ 51 ] نمونههایی از برنامههای وب هستند که برای افزایش کیفیت دادههای پروژه توسعه یافتهاند. این برنامه ها یا برای یک ویژگی خاص در یک مکان خاص مانند NOVAM سفارشی شده اند [ 52]، که ویژگی های ایستگاه اتوبوس را در بریتانیا مدیریت می کند، یا به طور کلی برای چندین ویژگی در مکان های مختلف توسعه یافته اند. این برنامهها نقش مشارکتکنندگان را برای ارتقای کیفیت دادهها از طریق تجدیدنظر در جمعسپاری تشویق میکنند.
2.3. طبقه بندی داده های انسان محور
تحقیقات دیگر به ویژه بر طبقه بندی داده ها در محتوای جغرافیایی-مکانی تولید شده توسط کاربر متمرکز شده است. در VGI، طبقه بندی داده ها انسان محور است. داده ها بر اساس ادراکات فردی به جای یک مدل از پیش تعریف شده طبقه بندی می شوند، همانطور که در طبقه بندی داده های حرفه ای وجود دارد. نویسندگان در [ 53 ] اشکال مختلفی از عدم قطعیت داده های مکانی را ارائه کردند که بر دقت طبقه بندی و دانه بندی تأثیر می گذارد. در [ 44 ]، نویسندگان طبقه بندی قابل قبول و مبهم در VGI را تجزیه و تحلیل کردند. با این وجود، تحقیق در [ 54 ] توانایی عموم را برای طبقهبندی دقیق ویژگیهای پوشش زمین زمانی که عکسهای هوایی و زمینی به آنها ارائه میشود، نتیجهگیری میکند. کار [ 55] تأثیرات فرهنگی، زبانشناسی و منطقهای را بر طبقهبندی دادهها مورد مطالعه قرار داد در حالی که نویسندگان [ 56 ] کیفیت طبقهبندی کاربری زمین و ویژگیهای پوشش زمین در VGI را با توجه به مشارکتکنندگان و دادههای ارائهشده بررسی کردند.
نویسندگان [ 57 ] Geo-Wiki ( http://www.geo-wiki.org/ ) (یک برنامه کاربردی وب جمع سپاری) را برای اعتبارسنجی و ارتقای طبقه بندی داده های پوشش زمین جهانی توسعه داده اند. Geo-Wiki همچنین با هدف توسعه یک نقشه جهانی ترکیبی پوشش زمین از منابع داده های مختلف، که در آن منابع داده معتبر با منابع باز تقویت می شوند و قدرت جمع سپاری برای اعتبار سنجی استفاده می شود.
در [ 58 ]، نویسندگان فرآیند حاشیه نویسی در پروژه OSM را مطالعه کردند. آنها مشکل استفاده از طبقه بندی داده های OSM و تأثیرات آن بر طبقه بندی داده ها را شناسایی کردند. از یک نقطه نظر خاص، ماهیت بین فرهنگی پروژه OSM منجر به طبقه بندی داده های ناهمگن از ویژگی های جغرافیایی یکسان و در نتیجه استفاده محدود از داده ها می شود. با این حال، راه حل های معنایی برای غلبه بر این مشکل استفاده شده است [ 59 ، 60 ].
با این وجود، تحقیق در [ 24 ، 26 ] دقت طبقه بندی کاربری و ویژگی های پوشش زمین را در پروژه OSM ارزیابی کرده است. آنها کیفیت قابل توجه داده و استفاده بالقوه از VGI را به عنوان منبع داده مکمل این ویژگی ها برجسته کردند.
3. فراتر از طبقه بندی داده ها در پروژه های VGI: مورد OpenStreetMap
چندین مطالعه تحقیقاتی بر اهمیت منابع VGI تاکید کرده اند. با این حال، آنها همچنین طبقه بندی داده های مشکل ساز خود را برجسته می کنند: در اکثر برنامه ها، طبقه بندی داده های نادقیق منجر به نتایج نادرست یا ناقص می شود. داده ها چگونه طبقه بندی می شوند؟ آیا داده ها از یک مدل طبقه بندی دقیق پیروی می کنند؟ چگونه می توانیم طبقه بندی داده ها را تأیید کنیم؟ طبقه بندی داده ها در کدام سطح دانه بندی کامل است؟ همه اینها مسائل مهمی هستند که بر استفاده مؤثر از منابع VGI تأثیر میگذارند. بنابراین، این بخش بینشی از چالش های طبقه بندی در پروژه های VGI می دهد. در این مقاله، دادههای OSM را تحلیل کردیم. تأثیر مکانیسم مشارکت و مدلهای داده مورد استفاده بر کیفیت داده در بخش 3.1 ارائه شده است. در هر پروژه VGI، شرکت کنندگان نقش اصلی را در فرآیند جمع آوری داده ها ایفا می کنند. بنابراین، جوامع OSM و تأثیر آنها بر طبقه بندی داده ها در بخش 3.2 مورد بررسی قرار می گیرند ، در حالی که بخش 3.3 مشکلات کلی طبقه بندی داده های جغرافیایی را مورد بحث قرار می دهد.
3.1. طبقه بندی بر اساس برچسب ها ( کلید = مقدار )
در OSM، مشارکتها توسط شرکتکنندگان به شرح زیر انجام میشود: شرکتکنندگان ویژگیهای جغرافیایی را از تصاویر ماهوارهای ارائه شده (مثلاً تصاویر هوایی بینگ)، با استفاده از یکی از ویرایشگرهای OSM (مثلاً ویرایشگر iD) مشخص میکنند. ویژگی ها به عنوان موجودیت ها با استفاده از مدل های داده مناسب نشان داده می شوند: نقطه (ویژگی های 0-D)، راه (ویژگی های خطی)، و رابطه (ویژگی های پیچیده). پس از آن، شرکت کنندگان آزادند تا موجودیت ارائه شده را با استفاده از برچسب ها توصیف و طبقه بندی کنند. هنگامی که یک برچسب دارای قالب کلید = مقدار باشد ، کلید دیدگاه طبقه بندی را توصیف می کند و مقدار آن برچسب کلاس است. مثلاً برچسب طبیعی = آبپوشش طبیعی یک موجود را به عنوان یک بدنه آبی توصیف می کند، در حالی که یک برچسب اضافی، به عنوان مثال، آب = دریاچه ، برای بیان طبقه بندی دقیق مورد نیاز است.
پروژه OSM برچسب های توصیه شده و روش های مناسب برای نگاشت ویژگی های مختلف جغرافیایی را در صفحات ویکی خود ارائه می دهد ( http://wiki.openstreetmap.org/wiki/Map_Features ). با این حال، فقدان مکانیسمهای بررسی یکپارچگی و مکانیسمهای مشارکت رایگان کامل منجر به طبقهبندی مشکلساز میشود. به عنوان مثال، یک موجودیت را نمی توان بدون برچسب یا تگ بی نهایت نسبت داد و حتی تکرار برچسب ها ممکن است، به عنوان مثال، طبیعی = آب و natural_1 = شن . اگرچه این مکانیسمهای انعطافپذیر به شرکتکنندگان اجازه میدهد تا کلاسهای جدیدی را راهاندازی کنند، اما چالشهای مختلفی را در طول پردازش و تمیز کردن دادهها ایجاد میکنند. شکل 1یک مثال طبقه بندی مشکل ساز از زمانی که موجودیت مشخص شده به کلاس های متضاد نسبت داده می شود را نشان می دهد.
3.2. طبقه بندی ذهنی
پروژه های نقشه برداری VGI توسط قدرت جمعیت اجرا می شود. کمک ها از دانش محلی شرکت کنندگان می آید. آنها آزادند مشاهدات خود را به یک ویژگی جغرافیایی مشروح با توضیحات/ردهبندی/طبقهبندی ترجمه کنند. از آنجایی که انسان مشاهدات را متفاوت تفسیر میکند، ممکن است ویژگیهای جغرافیایی را متفاوت درک کنند. یک موجودیت خاص ممکن است توسط یک شرکتکننده به عنوان رستوران طبقهبندی شود ، اما ممکن است توسط دیگران به عنوان یک کافه طبقهبندی شود . آیا یک حجم آبی به اندازه کافی بزرگ است که به عنوان دریاچه طبقه بندی شود یا آنقدر کوچک است که به طور مناسب به عنوان یک برکه طبقه بندی شود . این طبقه بندی ها به جنبه های عقلانی و فردی بستگی دارد. این واقعیت منجر به طبقه بندی ذهنی می شود.
در پروژه OSM، شرکت کنندگان تجربه نقشه برداری و نقشه برداری نابرابر دارند. آنها از فرهنگ های مختلف آمده اند. و سوابق تحصیلی و علایق مختلفی دارند. بنابراین، شرکتکنندگان ناهمگن، طبقهبندی مشکلساز را تقویت میکنند. طبقه بندی ناقص و ناسازگار نمونه هایی از مشکلات مربوط به طبقه بندی ذهنی است.
-
طبقهبندی ناقص: دانش محلی محدود یک شرکتکننده یا مشاهدات درک شده نامشخص از تصاویر ماهوارهای ارائهشده بر جزئیات طبقهبندی تأثیر میگذارد. در یک مطالعه آزمایشی بر روی مجموعه داده های OSM آلمان (مه 2015)، ما 225933 نهاد مرتبط با کلاس های بدنه آب را پیدا کردیم. تنها 20 درصد از این نهادها دارای کلاس های ظریف تری مانند دریاچه ، فاضلاب و غیره هستند . ما حدود 10،520،418 ساختمان طبقهبندینشده را شناسایی کردیم که طبقهبندی درشتتری به عنوان ساختمان دارند در حالی که سایر نهادهای ساختمانی به کلاسهای ظریفتری مانند مسکونی ، صنعتی و غیره طبقهبندی میشوند .
-
طبقهبندی ناسازگار: وقتی شرکتکنندگان یک ویژگی خاص را متفاوت تفسیر میکنند، آن را به کلاسهای متضاد یا یک کلاس مبهم اختصاص میدهند. در طول بررسیهایمان، متوجه شدیم که برخی از نهادها به کلاسهای متضاد اختصاص داده شدهاند. برخی از نهادها به عنوان چمنزار ( به عنوان مثال ، زمین چمن) و تالاب ( به عنوان مثال ، بدنه آبی) طبقه بندی می شوند. شکل 1 مثال واضحی از ناسازگاری طبقه بندی را نشان می دهد، زمانی که موجودیت داده شده بر اساس کلاس های زمین ، مدرسه و ساحل طبقه بندی می شود .
3.3. کلاس های همپوشانی مفهومی
به طور کلی، داده های مکانی مستعد اشکال مختلف عدم قطعیت هستند: احتمال، ابهام و ابهام. مشکل ممکن است مربوط به این باشد که آیا یک ویژگی جغرافیایی خوب یا ضعیف تعریف شده است [ 53 ]. در [ 61 ، 62 ]، نویسندگان عدم قطعیت داده های مکانی را با کیفیت VGI مرتبط می کنند. به طور خاص، تعاریف ضعیف منجر به ایجاد مرزهای واضح بین کلاس های مشابه می شود. بنابراین، یک موجودیت خاص به طور قابل قبولی می تواند به چندین کلاس همپوشانی با درجات مختلف دقت تعلق داشته باشد. با این وجود، معمولاً ویژگی های کیفی و/یا کمی وجود دارد که می تواند بین این طبقات تمایز قائل شود.
از جمله ویژگیهای بدنههای آبی، مربوط به چمن و تالاب نمونههایی از ویژگیها با تعاریف غیر دقیق هستند و از این رو، آنها شامل طبقات همپوشانی هستند. شکل 2 کلاس های همپوشانی مفهومی را در ویژگی های مربوط به چمن و بدنه آب، با توجه به توصیه های داده شده در OSM Wiki نشان می دهد. جدول 1 نقشه برداری بین تگ های OSM و کلاس های مربوط به آنها را توضیح می دهد. در پروژه OSM، یک کلاس واحد را می توان با برچسب های مختلف توصیف کرد. با این حال، ما رایج ترین برچسب گذاری را بررسی می کنیم. همپوشانی بین طبقات در شکل بر اساس اشتراک یک مفهوم خاص یا ویژگی های مشترک است. علاوه بر این، اندازه همپوشانی نشان دهنده میزان شباهت مفهومی است.
به عنوان مثال، پارک ، تفریح و باغ طبقات همپوشانی در شکل 2 الف هستند: آنها ویژگی های مشترک استفاده برای سرگرمی و سرگرمی را دارند. کلاسهای پارک ، باغ با کلید اوقات فراغت طبقهبندی میشوند ، در حالی که کلاس تفریحی با کلید کاربری زمین توصیف میشود . با این حال، موجودیتهای تفریحی به احتمال زیاد به فعالیتهای خاصی (به عنوان مثال، فعالیتهای ورزشی یا اجتماعی) مرتبط هستند، موجودیتهای باغ بیشتر از سایرین با گل و گیاه کشت میشوند و پارک .موجودیت ها به طور کلی بزرگتر از باغ و تفریح هستند و ممکن است هر دوی آنها را نیز شامل شوند. شکل 2 ب نمونه دیگری از همپوشانی طبقات مربوط به ویژگی های بدنه آبی را نشان می دهد. هنگامی که یک آب راکد و طبیعی است، میتوان آن را به عنوان دریاچه (اگر بزرگ باشد) یا برکه (اگر کوچک باشد) طبقهبندی کرد، اما زمانی که ساخته دست بشر باشد بهطور مناسبتری به عنوان مخزن طبقهبندی میشود . طبقات دیگر مانند مرداب و باتلاق هر دو منطقه ای را توصیف می کنند که به طور دائم یا فصلی از آب اشباع شده است. در دادههای OSM، هر دو با کلید تالاب توصیف شدهاند . فقط نوع پوشش گیاهی بین طبقات متمایز می شود: مردابزمانی که پوشش گیاهی چوبی و مردابی است و زمانی که پوشش گیاهی غیرچوبی و زیستگاه های باز.
بحث های قبلی دلایل طبقه بندی مشکل ساز در پروژه های VGI را خلاصه می کند. بخش 3.1 و بخش 3.2 مشکل را از ماهیت پروژه های VGI استدلال می کنند، در حالی که بخش 3.3 مشکل را از منظر عدم قطعیت داده های مکانی مورد بحث قرار می دهد. این مشکلات طبقهبندی نه تنها بر کیفیت دادهها تأثیر میگذارد، بلکه توسعه برنامههای کاربردی عمومی را نیز محدود میکند، بهعنوان مثال، برنامههای کاربردی ارائه و تجسم جهانی. علاوه بر این، کیفیت داده های مشکل ساز، کاربرد منابع VGI را برای انواع خاصی از برنامه ها تعیین می کند.
4. رویکرد طبقه بندی مبتنی بر قانون
در [ 16 ، 17 ]، ما با توسعه رویکرد طبقه بندی مبتنی بر قانون، به طبقه بندی پرداختیم. در پروژه های VGI، مفهوم سازی مشارکت کنندگان از ویژگی های جغرافیایی بر طبقه بندی داده ها تأثیر می گذارد. از دیدگاه شناختی انسان، افراد احتمالاً ویژگی های کیفی یک ویژگی معین را بررسی می کنند تا آن را به طور مناسب طبقه بندی کنند. علاوه بر این، انسان ها به طور ضمنی بین طبقات مشابه تضاد دارند تا طبقه خاصی را به جای طبقه های دیگر استنتاج کنند. به عنوان مثال، ما بین پارک و جنگل تضاد داریمکلاس ها با بررسی پوشش درختان، در دسترس بودن امکانات تفریحی و سرگرمی، و دسترسی عابران پیاده. از این رو، رویکرد ما از ویژگیهای کیفی و مقایسه برای تمایز بین کلاسهای مشابه استفاده میکند. برای موجودیتهای خاص کلاسهای همپوشانی، ما یک مکانیسم یادگیری ماشین را برای استخراج ویژگیهای توپولوژیکی کیفی متمایز که هر کلاس را شناسایی میکنند، اعمال میکنیم. این ویژگی ها برای توسعه یک طبقه بندی کننده فرموله و سازماندهی شده اند. سپس، این رویکرد از طبقهبندیکننده توسعهیافته برای طبقهبندی مجدد موجودیتها استفاده میکند و دوباره آنها را برای اعتبارسنجی جمعسپاری ارائه میکند. در این رویکرد، ما فرض می کنیم که نهادهای یکسان باید به طور مشابه در یک کشور طبقه بندی شوند ( یعنی، طبقه بندی موضعی). بنابراین، یادگیری از دادههای هند و بهکارگیری دانش استخراجشده بر روی دادههای آلمان ممکن است منجر به طبقهبندی مشکلساز دیگری به دلیل فرهنگها و مفاهیم مختلف شود. برای جزئیات بیشتر، [ 17 ] را ببینید.
شکل 3 ساختار مفهومی رویکرد طبقه بندی مبتنی بر قانون را نشان می دهد. برای مثال، ما رویکرد را در یک مطالعه موردی نشان میدهیم. ما از مجموعه داده های OSM آلمان استفاده می کنیم و طبقه بندی برخی از طبقات مرتبط با چمن را هدف قرار می دهیم: چمن ، باغ ، جنگل ، پارک و چمنزار . انتخاب مجموعه داده آلمان به دلایل زیر است: (الف) در آلمان، یک جامعه نقشهبردار فعال در پروژه OSM وجود دارد. (ب) چندین مطالعه کیفیت بالای داده ها را به ویژه در مناطق شهری تأیید کردند. و (ج) واردات انبوه زیادی از داده ها وجود ندارد. شکل 3این رویکرد را به سه مرحله تقسیم می کند: مراحل پردازش داده، یادگیری و مراحل اعتبار سنجی.
- (1)
-
پردازش داده ها :از مجموعه داده های OSM آلمان، موجودیت های کلاس های هدف را استخراج کردیم. نهادها از پرجمعیت ترین شهرها استخراج می شوند تا از داده هایی با کیفیت بالا اطمینان حاصل شود. ما نگران نهادهای منطقه هستیم. بنابراین، برای درک ویژگیهای کیفی کلاسها، ما هر موجودیت جداگانه را به صورت توپولوژیکی بررسی کردیم. ما یک الگوریتم خودکار را با استفاده از مدل 9-تقاطع (9IM) برای انجام بررسی توسعه دادیم [ 63 ]. هدف این تحقیق یافتن روابط توپولوژیکی مشترک بین جفت موجودیت است. این روابط به طور بالقوه برای تمایز بین کلاس های مشابه مفید هستند. برای مثال، رابطه بین جفت موجودیت ( E1، E2)، چه زمانی E1نشان دهنده ویژگی هدف (به عنوان مثال، موجودیت پارک ) و E2نوع دیگری از ویژگی های نزدیک به است E1(به عنوان مثال، زمین بازی، بدنه های آبی، و غیره ).
- (2)
-
یادگیری :هدف مرحله یادگیری، ایجاد طبقهبندیکنندهای است که بتواند به طور بالقوه بین کلاسهای مشابه تمایز قائل شود. ما یک مکانیسم داده کاوی طبقه بندی انجمنی [ 64 ] را برای انجام وظیفه یادگیری اعمال می کنیم. این رویکرد استخراج از قانون تداعی برای ساختن سیستم طبقه بندی استفاده می کند [ 64 ]. ابتدا مجموعه ای از قوانین پیش بینی را استخراج می کنیم که هر کلاس را توصیف می کند و سپس این قوانین در طبقه بندی کننده رتبه بندی و سازماندهی شدند. در طی فرآیند طبقه بندی، یک موجودیت معین با کل مجموعه قوانین استخراج شده مطابقت داده می شود. قوانین منطبق بر اساس معیارهای اطمینان آنها به ترتیب نزولی رتبه بندی می شوند. به دلیل مشکل همپوشانی (به بخش 3 مراجعه کنید)، طبقهبندیکننده توسعهیافته طوری پیکربندی شده است که به جای انتخاب یک کلاس، دو کلاس مناسب را ارائه دهد.
- (3)
-
اعتبارسنجی :با توجه به ماهیت VGI، رویکرد پیشنهادی از جمعسپاری برای اعتبار بخشیدن به طبقهبندی استفاده میکند. موجودیت ها با استفاده از طبقه بندی کننده توسعه یافته مجدداً طبقه بندی می شوند. سپس مجدداً به منظور بازنگری در کلاس های توصیه شده به عموم ارائه می شود. مرحله اعتبار سنجی دارای عملکردهای متعددی است: (الف) طبقه بندی نهادهای هدف را با تجدید نظر در جمع سپاری افزایش/تضمین می کند. (ب) درک عمومی از طبقات هدف. و (ج) پاسخ شرکت کنندگان به توصیه های ارائه شده را بیابد.
فاز اول و دوم با جزئیات بیشتر در کار قبلی ارائه شده است [ 16 ، 17 ]، در حالی که این مقاله بر فاز سوم تمرکز دارد، جایی که اجرای مرحله اعتبار سنجی در بخش بعدی ارائه شده است.
5. Grass&Green: برنامه تضمین کیفیت سفارشی
به عنوان اعتبار سنجی رویکرد طبقه بندی مبتنی بر قانون، ما یک برنامه وب به نام Grass&Green را توسعه دادیم . ما یک معماری مبتنی بر وب را برای دستیابی به تعداد زیادی از شرکت کنندگان اتخاذ کردیم. این برنامه در آگوست 2015 راه اندازی شد و شرکت کنندگان عمومی و نقشه برداران OSM را نیز هدف قرار داد. برنامه بر روی یک سرور اوبونتو [ 65 ] به عنوان یک زیرشاخه از پروژه OpenScienceMap (OScieM) میزبانی می شود [ 66 ].
شرح برنامه در بخش 5.1 ارائه شده است . بخش 5.2 معماری برنامه و اجزای آن را نشان می دهد، در حالی که کانال های مورد استفاده برای جذب شرکت کنندگان در بخش 5.3 مورد بحث قرار گرفته است .
5.1. توضیحات برنامه
شکل 4 ، شکل 5 و شکل 6 رابط کاربری (UI) برنامه را نشان می دهد. قابلیت استفاده از رابط و سهولت استفاده برای ما برای دستیابی به اهداف برنامه و شبیه سازی ماهیت پروژه های VGI نگران کننده است. قبل از ورود به سیستم، Grass&Green دستورالعمل استفاده را به شرکت کننده ارائه می دهد. از آنجایی که ما مستقیماً در پروژه OSM مشارکت می کنیم، شرکت کنندگان باید یک حساب کاربری OSM داشته باشند. این برنامه به کاربران غیر OSM اجازه می دهد تا برای یک حساب ثبت نام کنند ( شکل 4 را ببینید ).
برای شرکت کنندگان غیرمتخصص، برنامه دارای منویی به نام “راهنما” است که توضیحات کلاس را معرفی می کند. توضیحات به صورت بصری و به صورت متن از منابع متعدد ارائه شده است: Wikipedia، OSM Wiki، و WordNet [ 67 ] ( شکل 5 را ببینید ).
پس از ورود، برنامه به طور تصادفی موجودیت ها را به شرکت کننده نشان می دهد. شکل 6 رابط ساده فرآیند تجدید نظر را نشان می دهد. در سمت راست، موجودیت داده شده مشخص شده و با تصاویر ماهوارهای Bing، که یک ارائهدهنده تصویر هوایی است، همپوشانی دارد. علاوه بر این، توضیحات کیفی توپولوژیکی موجودیت به صورت متن ارائه شده است. برای مثال، موجودیت داده شده در شکل 6 شامل درختانی است که در مجاورت یک ساختمان، یک باغ و یک راه خدماتی قرار دارند و توسطیک منطقه مسکونی در سمت چپ، موجودیت مشخص شده و با نقشه پایه OSM همپوشانی دارد. بر روی نهاد، یک پیام پاپ آپ کلاس های توصیه شده (که به عنوان توصیه شده علامت گذاری شده اند) و کلاس های دیگر را نیز نشان می دهد. اعتبار سنجی منعطف است، شبیه به مکانیسم مشارکت پروژه OSM. شرکتکننده میتواند بین گزینههای «بله»، «نه» و «شاید» از کلاسهای ارائه شده انتخاب کند. شرکتکننده میتواند توصیههای ما را لغو انتخاب کند و کلاسهای دیگر را انتخاب کند یا کلاس جدیدی اضافه کند (در صورت نیاز). گزینه های بیشتری مانند مشاهده و ویرایش موجودیت مستقیماً از طریق رابط های پروژه OSM برای شرکت کننده ارائه شده است. در هر دو نقشه، یک گزینه بزرگنمایی/کوچک کردن ارائه شده است تا شرکت کنندگان بتوانند زمینه جغرافیایی را کشف کنند.
علاوه بر این، منوی “Help” در صورت نیاز دستورالعملها را در هر زمان به شرکتکنندگان ارائه میدهد. در پایین، یک آدرس ایمیل تماس برای بازخورد بیشتر و نظرات شرکت کنندگان علاقه مند داده شده است. در هر نقطه، شرکت کنندگان مجاز به خروج یا بستن برنامه برای خروج از فرآیند اعتبار سنجی هستند.
5.2. معماری اپلیکیشن
به عنوان یک برنامه مبتنی بر وب، Grass&Green از اجزای جلویی و انتهایی تشکیل شده است. اجزای جلویی قابلیت استفاده و تجسم را در UI مانند مولفه برگه [ 68 ]، چارچوب Bootstrap [ 69 ] و کتابخانه JQuery [ 70 ] کنترل میکنند، در حالی که مؤلفههای backend مسئول انجام ارتباطات کارآمد و قابل اعتماد هستند. در میان لایه های کاربردی شکل 7 نشان می دهد که چگونه برنامه از سه لایه تشکیل شده است: لایه رابط، لایه داده و لایه خارجی.
با استفاده از هر مرورگر اینترنتی، شرکت کنندگان می توانند به لایه رابط دسترسی داشته باشند. ابتدا، شرکتکنندگان با استفاده از استاندارد باز مجوز OAuth [ 71 ] به برنامه وارد میشوند، که به آنها اجازه میدهد به یک وبسایت شخص ثالث – در این مورد، پروژه OSM – به روشی امن و بدون افشای رمز عبور خود متصل شوند. پس از ورود موفقیت آمیز، لایه رابط، با استفاده از AJAX و PHP، شروع به فراخوانی داده ها از لایه داده برای فرآیند اعتبار سنجی می کند. با استفاده از توابع php، برنامه نتایج اعتبارسنجی و مشارکت های شرکت کننده را کنترل می کند. لایه داده شامل مجموعه داده های توسعه یافته توسط رویکرد پیشنهادی در [ 17]. در مجموعه داده ها، هر موجودیت با ویژگی های کیفی توپولوژیکی، هندسه آن و دو کلاس توصیه شده مرتبط است. مجموعه داده در پایگاه داده Postgres با پسوند postGIS ذخیره می شود تا هندسه موجودیت ها را مدیریت کند. به عنوان یک لایه خارجی، سرور OSM از طریق رابط برنامه کاربردی OSM (API) قابل دسترسی است. ما از حساب کاربری OSM به عنوان مرجعی برای تجربه شرکت کنندگان و منشاء جغرافیایی آنها استفاده کردیم. در طول اعتبارسنجی، شرکت کنندگان گزینه هایی برای ویرایش/مشاهده موجودیت های ارائه شده توسط ویرایشگران/بینندگان OSM دارند. علاوه بر این، لایه رابط، OSM API را برای به روز رسانی موجودیت ها پس از فرآیند اعتبار سنجی فراخوانی می کند.
5.3. روشهای اعلام و شرکتکنندگان هدف
شرکت کنندگان قدرت هر پروژه VGI هستند. بنابراین، جذب و تشویق شرکت کنندگان به مشارکت یکی از چالش های استقرار است. هدف جذب تعداد زیادی از شرکت کنندگان است: نقشه برداران OSM و شرکت کنندگان عمومی نیز. ما از قدرت جمعیت برای جذب شرکت کنندگان با استفاده از کانال های زیر استفاده کرده ایم:
-
خاطرات OSM:ما راهاندازی و اهداف برنامه را به صورت محلی به نقشهبرداران OSM از طریق دفتر خاطرات پروژه ( https://www.openstreetmap.org/user/grass_and_green/diary ) اعلام کردیم. خاطرات OSM برای همه عمومی است.
-
رسانه های اجتماعی:ما دو صفحه برای این پروژه ایجاد کردیم: یکی در توییتر ( https://twitter.com/grass_and_green ) و دیگری در فیس بوک ( https://www.facebook.com/grassANDgreen/ ) تا از قدرت رسانه های اجتماعی برای جذب استفاده کنیم. شرکت کنندگان عمومی ما به ندرت اخبار برنامه را ارسال کردیم و از شرکت کنندگان در صفحات پروژه تشکر کردیم.
-
دیگران:لیست های پستی و بروشورهای مبتنی بر کاغذ نیز برای هدف قرار دادن سایر محققان و دانشجویان نیز استفاده می شود.
6. نتایج
در این بخش، ما نتایجی را که توسط برنامه از دیدگاههای مختلف بهدست آمده است، مورد بحث قرار میدهیم: الگوهای مشارکتکننده و مشارکت ( بخش 6.1 )، پاسخهای شرکتکننده به توصیهها ( بخش 6.2 )، و طبقهبندی دادههای افزایشیافته بالقوه ( بخش 6.3 ). علاوه بر این، ما بازخورد شرکتکنندگان را نیز تحلیل کردیم ( بخش 6.4 ). نتایج ارائه شده نشان دهنده مشارکت در یک دوره چهار ماهه از 28 اوت تا 28 دسامبر 2015 است.
6.1. الگوهای مشارکت و مشارکت
با در نظر گرفتن اینکه ما از رویکردهای اعلامی ساده استفاده کردیم، شکل 8 ، شکل 9 و شکل 10 بینشی را در مورد الگوهای شرکت کنندگان و مشارکت ها ارائه می دهد. این برنامه 212 شرکت کننده را جذب کرد: 163 شرکت کننده دارای منشأ مشخصی از مکان از 35 کشور مختلف هستند در حالی که بقیه از مکان های ناشناخته هستند. شکل 8 الف نشان می دهد که 46 نفر (حدود 28%) از 163 شرکت کننده از آلمان هستند. علاوه بر این، شرکت کنندگان طبقه بندی 2865 نهاد را بررسی کردند. 1060 مورد از این نهادها توسط شرکت کنندگان مرتبط با آلمان بررسی شده است، همانطور که در شکل 8 نشان داده شده است.b، که مربوط به مجموعه داده های مورد استفاده در اینجا است. بقیه نهادها توسط شرکت کنندگان از مکان های مختلف بررسی شده است.
از سوی دیگر، شرکت کنندگان سطوح مختلفی از آشنایی با پروژه OSM، و در نتیجه، سطوح متفاوتی از مشارکت را دارند، همانطور که در شکل 9 نشان داده شده است . ما شرکتکنندگان را بر اساس طرح طبقهبندی پیشنهادی در [ 30 ]، بر اساس Changsets گروهبندی میکنیم. هنگامی که Changesets تعداد تغییراتی را که نقشهبردار انجام داده از جمله عملیات افزودن، حذف و بهروزرسانی را نشان میدهد.
شکل 9 الف توزیع شرکت کنندگان و مشارکت در هر گروه را به شرح زیر نشان می دهد: 30.19٪ طلا >=2000)، 32.08٪ ارشد +(500 <=تغییرات < 2000)، 18.4% ارشد (100 <=تغییرات < 500)، 9.43% جونیور (10 <=تغییرات < 100)، 3.77٪ غیر تکراری (1 < تغییرات < 10)، و 6.13٪ ثبت شده جدید (تغییرها) <=1). در Grass&Green ، حدود 65% از مشارکتها از سالمندان است +و Gold mappers که قابلیت اطمینان را به نتایج به دست آمده می افزاید. شکل 9 ب، حداقل و حداکثر مشارکت شرکت کنندگان در هر گروه، علاوه بر میانگین مشارکت در هر شرکت کننده را نشان می دهد. این رقم بیانگر آن است که هرچه تجربه و آشنایی یک شرکت کننده با پروژه OSM بیشتر باشد، نگرانی و مشارکت آنها بیشتر است. شکل 9 ب نشان می دهد که شرکت کنندگان از طلا ، ارشد +گروههای ارشد و جوان بهطور متوسط بین 11 تا 16 نهاد/شرکتکننده را مورد بررسی قرار دادند، در حالی که شرکتکنندگان از گروههای غیر تکراری و ثبتشده جدید بهطور میانگین بین 6 تا 8 نهاد/شرکتکننده را بررسی کردند. این یافته برخی نگرانیهای شدید از مشارکتهای فردی 289، 222 و 174 نهاد از شرکتکنندگان متعلق به Gold ، Senior و Senior را نشان میدهد. +گروه ها به ترتیب
شکل 10 الگوهای مشارکت را نسبت به روش های اعلام استفاده شده نشان می دهد. پس از دو هفته، تعداد شرکت کنندگان اکثراً کمتر از ده نفر در روز است. شکل نشان می دهد که تعداد شرکت کنندگان با گذشت زمان کاهش می یابد و با استفاده از روش جذب، به ویژه دفترچه خاطرات OSM افزایش می یابد.
6.2. پاسخ های شرکت کنندگان
شرکت کنندگان 2865 نهاد را بررسی کردند. در طول اعتبارسنجی، زمانی که شرکتکننده از طبقهبندی خاصی مطمئن نیست، میتواند گزینه «نمیدانم» را انتخاب کند. برای 586 نهاد، زمانی که واریانس بین کلاسها توسط شرکتکنندگان شناسایی نشد، گزینه «نمیدانم» را دریافت کردیم. در این موارد، نهادها در پروژه OSM به روز نشده اند و از تجزیه و تحلیل ما نیز حذف شده اند. برای بقیه 2279 نهاد، نظر یک شرکت کننده را دریافت کردیم. همانطور که قبلا توضیح داده شد (به بخش 5.1 مراجعه کنید )، شرکت کننده انعطاف کاملی برای انطباق کلاس های توصیه شده ما دارد که منجر به سه سطح توافق شرکت کننده می شود:
-
توافق کامل : زمانی که یک شرکت کننده با هر دو کلاس توصیه شده موافق است و آنها را با گزینه “بله” علامت گذاری می کند.
-
توافق جزئی : زمانی که یک شرکتکننده فقط با یکی از کلاسهای پیشنهادی موافقت میکند و دیگری را با گزینه «نه» یا «شاید» علامتگذاری میکند.
-
اختلاف نظر : زمانی که یک شرکتکننده با هیچ یک از کلاسهای پیشنهادی موافق نیست و هر دو را با گزینه «نه» یا «شاید» علامتگذاری میکند.
شکل 11 موافقت شرکت کنندگان با کلاس های پیشنهادی را به شرح زیر نشان می دهد: 10.84% مخالف، 26.89% کاملا موافق و 62.53% تا حدی موافق هستند. می توان نتیجه گرفت که حدود 89 درصد از شرکت کنندگان با کلاس های توصیه شده توافق کامل/جزئی دارند. یافتهها نشاندهنده موفقیت طبقهبندیکننده توسعهیافته برای تمایز بین کلاسهای هدف است. علاوه بر این، پاسخ ها و مشارکت حاکی از امکان سنجی رویکرد پیشنهادی نیز می باشد.
6.3. کیفیت طبقه بندی داده های پیشرفته
برای درک تأثیر رویکرد ما بر کیفیت طبقهبندی دادهها، مشارکتها را با جزئیات بیشتری تحلیل کردیم. ما طبقه بندی موجودیت ها را قبل و بعد از اعتبارسنجی با توجه به کلاس های توصیه شده بررسی کردیم. جدول 2 و جدول 3 دو دیدگاه متفاوت از نتایج ارائه می دهند.
جدول 2 طبقه بندی موجودیت ها را قبل و بعد از اعتبارسنجی با توجه به کلاس های توصیه شده و نظرات شرکت کنندگان مقایسه می کند. در طول دوره مشخص شده، شرکت کنندگان 2279 نهاد را اعتبارسنجی کردند. این نهادها قبلاً به شرح زیر طبقه بندی می شدند: 412 باغ ، 1136 چمن و 731 پارک . در تجزیه و تحلیل، بررسی می کنیم که آیا طبقه بندی قبلی توسط رویکرد ما توصیه می شود یا خیر. از دیدگاه شناختی، در این تحلیل، پاسخ «شاید» را بیشتر به «بله» نزدیک میکنیم تا «نه». یافته ها حاکی از آن است که شرکت کنندگان 9/75 درصد، 2/89 درصد و 2/85 درصد از توصیه های باغ ، چمن و پارک را پذیرفتند.نهادها به ترتیب شرکتکنندگان طبقهبندی بخش بزرگی از موجودیتهای ارائهشده، و همچنین تصحیح سایر موجودیتهای بالقوه اشتباه طبقهبندی شده را تأیید کردند (اعداد پررنگ در ستونهای 3 و 4 جدول 2 ). به طور کلی حدود 85.5 درصد از توصیه های ارائه شده را پذیرفتند.
در تجزیه و تحلیل دیگری، جدول 3 بینشی در مورد کلاس ها با توجه به توصیه ها و نظرات شرکت کنندگان پس از فرآیند اعتبار سنجی ارائه می دهد. در طول فرآیند اعتبار سنجی، کلاس جنگل برای 748 نهاد به عنوان توصیه اول یا دوم توصیه شد. برای 184 از 748 نهاد، شرکتکنندگان در مورد کلاسهای پیشنهادی بالقوه زمانی که کلاس جنگل قبلاً به هیچ یک از نهادهای ارائهشده اختصاص داده نشده بود، توافق کردند. در مورد کلاس meadow نیز همین اتفاق افتاد (اعداد پررنگ در جدول 3 ). علاوه بر این، نهادهایی که به طور بالقوه کلاس های باغ ، چمن و پارک را پذیرفته اندهمانطور که در مقایسه با جدول 2 نشان داده شده است، بیشتر از موجودیت های ارائه شده در هر کلاس هستند . از یک طرف، این یافته ممکن است نشان دهنده اصلاح بالقوه موجودیت های طبقه بندی شده اشتباه باشد. از سوی دیگر، نتایج کلی در جدول 3 طبقه بندی همپوشانی مفهومی را اثبات کرد و معقول بودن طبقات چندگانه را همانطور که در شکل 12 نشان داده شده است نشان داد .
از طریق بررسی دستی، مواردی را شناسایی کردیم که موجودیتها میتوانند به شدت به کلاسهای مختلف تعلق داشته باشند. با توجه به اعتبار سنجی شرکت کنندگان، ما موجودیت های متعددی با دو کلاس معتبر پیدا کردیم. از جمله، 37 نهاد به عنوان پارک / جنگل ، 24 نهاد به عنوان پارک / باغ ، و دو نهاد به عنوان پارک / علفزار . شکل 12 برخی از این مثال ها را زمانی که موجودیت داده شده در شکل 12 a در یک منطقه جنگلی و در مجاورت یک حیاط مزرعه قرار دارد، نشان می دهد. با این حال، موجودیت دارای یک زمین بازی است ( به عنوان مثال، امکانات تفریحی) و توسط پیاده راه (خطوط قرمز شکسته) سنگفرش شده است. بنابراین، توصیه و تایید می شود که به عنوان پارک / علفزار طبقه بندی شود ، در حالی که موجودیت های ارائه شده در شکل 12 b,c به عنوان پارک / جنگل توصیه و تایید شده اند . آنها تا حدی توسط درختان سنگین و گیاهان چوبی (مناطق سبز تیره) پوشیده شده اند. علاوه بر این، آنها حاوی آب (که با یک خط آبی مشخص شده اند) و راه های چرخشی (خطوط آبی چین دار) هستند.
شکل 13 به صورت بصری پتانسیل طبقه بندی داده های پیشرفته را نشان می دهد. شکل سه سناریوی مشارکت را نشان می دهد: تأیید، تصحیح و ناآگاهی. شکل 13 a سناریوی تایید را در زمانی که موجودیت مشخص شده به عنوان پارک طبقه بندی می شود، نشان می دهد . این رویکرد پارک و چمن را به عنوان کلاس های توصیه شده پیشنهاد می کند. در طول اعتبارسنجی، یک شرکتکننده فقط کلاس پارک را انتخاب کرد . شکل 13 ب سناریوی اصلاحی را نشان می دهد که موجودیت داده شده به عنوان پارک طبقه بندی می شود و رویکرد کلاس های علفزار و چمن را توصیه می کند . در طول اعتبارسنجی، یک شرکتکننده آن را به عنوان یک طبقهبندی کردچمنزار . شکل 13 ج سناریوی ناآگاهی را در زمانی که موجودیت مشخص شده به عنوان چمن طبقه بندی شده است، نشان می دهد . این رویکرد کلاس های باغ و چمن را توصیه می کند . با این حال، یکی از شرکتکنندگان تصمیم گرفت آن را به عنوان علفزار طبقهبندی کند ، که انتخاب نامناسبی بود.
در سناریوی اول، موجودیت داده شده دارای ویژگی های اوقات فراغت است و شرکت کننده به توصیه های ما عمل کرده و طبقه بندی آن را به عنوان پارک تایید کرده است . موجودیت در سناریوی دوم شامل هیچ ویژگی دیگری نیست، در یک منطقه جنگلی واقع شده است، و نام “Gerlach-Wiese” دارد، که در آن wiese (آلمانی) = مراتع (انگلیسی) است. به عنوان پارک طبقه بندی شده بود ، اما یکی از شرکت کنندگان توصیه های ما را دنبال کرد و آن را به مراتع به روز کرد . در سناریوی سوم، موجودیت با ساختمانهایی احاطه شده است و طبق توصیههای ما، احتمال باغ بودن آن بیشتر است. با این حال، شرکت کننده آن را به عنوان چمنزار طبقه بندی کرد، که کلاس نامناسبی بود. آخرین سناریو طبقه بندی داده ها را افزایش نمی دهد، اما ادراکات فردی را منعکس می کند. این سناریو همچنین ممکن است زمانی اتفاق بیفتد که توصیههای ما اشتباه باشد یا واقعیت را منعکس نکند. در چنین مواردی، اعتبارسنجی های متعدد می تواند راه حل مناسبی باشد.
6.4. بازخورد شرکت کنندگان
به شرکت کنندگان اجازه داده شد با ما تماس بگیرند و نظرات و بازخوردهای خود را از طریق ایمیل یا نظر دادن در مورد پست های ما بیان کنند. بازخورد مثبت و منفی نیز دریافت کردیم. با توجه به بازخورد مثبت، شرکتکنندگان احترام گذاشتند و با عبارات مختلفی ما را تشویق کردند: «خدمات عالی، برنامههایی برای توسعه دارید؟»، «اگر قصد دارید بلژیک را هم شامل کنید، چیزهای بسیار عجیبی خواهید دید»، «فقط عالی. متشکرم، “این واقعاً موضوع خوبی است!”، و غیره. برعکس، برخی از افراد برای ما بازخورد منفی یا بهبودی ارسال کردند، مانند: “سوالات شما یک سوگیری پاسخ بسیار قوی ایجاد می کند”، “ارجاع به ویکی پدیا و تعاریف از فرهنگ لغت کاملا اشتباه است زیرا OSM از زبان طبیعی برای توصیف اشیا استفاده نمی کند”، برای اینکه بتوان از این ابزار به درستی استفاده کرد، باید اجماع واضحی در مورد معنای دقیق وجود داشته باشد.» و غیره . ما از همه شرکت کنندگان برای مشارکت و بازخوردشان تشکر می کنیم. کل بازخورد برای گسترش برنامه در نظر گرفته خواهد شد.
7. بحث
در گذشته، نقشه برداری وظیفه انحصاری نقشه برداران و افراد آموزش دیده بود. با این وجود، خطاها و دقت نقشه ها حتی در تولید حرفه ای نیز موضوعی نگران کننده بود. در واقع، به دلیل ابهام داده های جغرافیایی و تحولات زمانی داده ها، نقشه دقیقی وجود ندارد [ 72 ، 73 ، 74]]. با در دسترس بودن فناوری های جدید، VGI به منبع بالقوه داده های جغرافیایی تبدیل شده است. به ویژه، VGI فرآیند نقشه برداری را زمانی که عموم مردم در فرآیند جمع آوری داده ها شرکت می کنند، تسهیل می کند. با این حال، در VGI، عوامل دیگری بر دقت دادههای حاصل تأثیر میگذارند، مانند: ویژگیهای ناهمگن شرکتکنندگان، فقدان تخصص، و مکانیسمهای مشارکت انعطافپذیر. به طور خاص، اکثر منابع VGI دارای مسائل ذاتی مانند طبقه بندی داده های مشکل ساز هستند که یا ناسازگار یا ناقص است. برای ارائه خدمات قابل اعتماد نیاز به داده هایی با کیفیت تضمین شده است. مفهوم خدمات جغرافیایی داوطلبانه (VGS) در [ 75 ] معرفی شده است. با این حال، هنوز نیاز به منابع داده قابل اعتماد وجود دارد [ 76 ].
VGI بر اساس قدرت جمع سپاری است. از دیدگاه ما، به منظور بهره برداری از جمعیت برای ارائه اطلاعات ارزشمند، شرکت کنندگان باید در مورد کیفیت داده های مورد نیاز راهنمایی و/یا به خوبی آموزش داده شوند. بنابراین، ما رویکرد طبقهبندی مبتنی بر قانون را در [ 16 ، 17] پیشنهاد کردیم]. هدف این رویکرد پر کردن شکاف بین نیاز به مکانیسمهای مشارکت انعطافپذیر، عدم قطعیت دادههای مکانی، و ادراکات مختلف شرکتکنندگان است. با افزایش تکامل منابع VGI، یادگیری ماشین، به ویژه داده کاوی، می تواند نقشی حیاتی در تضمین کیفیت داده ایفا کند. در رویکرد خود، ما مکانیسمهای داده کاوی را برای ایجاد یک طبقهبندی که میتواند بین کلاسهای مشابه تمایز قائل شود، اعمال کردیم. پس از آن، طبقهبندیکننده توسعهیافته برای هدایت شرکتکنندگان به سمت طبقهبندی دقیقتر استفاده میشود.
برای افزایش کیفیت داده، استفاده از جمعسپاری یکی از امکانهایی است که قبلاً به عنوان یک بعد برای اطمینان از کیفیت داده تشویق شده بود [ 13 ]. در این مقاله، ما بهرهبرداری از جمعیت را تشویق میکنیم اما به شیوهای هدایتشده. در جمع سپاری، شرکت کنندگان مایل به مشارکت هستند. با این حال، آنها به طور کلی به هدف هدف اهمیت نمی دهند. برای مثال، ما تعاملات شرکتکنندگان را در طول مشارکت آنها در Grass&Green ردیابی کردیمتا دریابند که آیا توضیحات ارائه شده را به دقت بررسی کرده اند یا خیر. ما متوجه شدیم که تنها 80 نفر از 212 شرکت کننده، توضیحات داده شده را در منوی “راهنما” بررسی کردند. همین وضعیت در پروژه OSM رخ می دهد که در آن اکثر شرکت کنندگان بدون صرف زمان کافی برای خواندن پیشنهادات و توصیه های ارائه شده در صفحات OSM Wiki مشارکت می کنند.
کاربرد ارائه شده در این مقاله امکان سنجی رویکرد پیشنهادی را نشان می دهد. علاوه بر این، توسعه برنامه های کاربردی سفارشی شده برای یک ویژگی جغرافیایی خاص را تشویق می کند. به عنوان مثال، در مورد پروژه OSM، چندین برنامه کاربردی و خدمات برای بررسی و بهبود شبکه های جاده ای در مکان های مختلف توسعه یافته است. در نتیجه، OSM اطلاعات قابل اعتماد و دقیق تری در مورد جاده ها نسبت به منابع داده معتبر در برخی مکان ها ارائه می دهد. در Grass & Green، ما یک برنامه کاربردی ساده برای تأیید رویکرد خود ایجاد کردیم. معدود اشکالات درک شده را می توان با ماژول های هوشمند برطرف کرد. توسعه رابط های بصری و تعاملی برای پروژه های نقشه برداری مبتنی بر VGI یکی از امکان های غلبه بر چالش های طبقه بندی خواهد بود. به عنوان مثال، با مذاکره یا مثال زدن، یک رابط هوشمند ممکن است بتواند شرکت کنندگان را به سمت طبقه بندی دقیق تر و دقیق تر سوق دهد.
از منظر شناختی، درک درک انسان از ویژگی های جغرافیایی مورد نیاز است، زیرا آنها موتور پروژه های نقشه برداری VGI هستند. تنوع فرهنگ ها و علایق شرکت کنندگان دارای عملکرد دوگانه است: غنی سازی منبع داده و تضمین کیفیت داده ها. در Grass & Green، ما با تمرکز بر مفاهیم و بررسی بازنمایی کیفی کلاس ها با تنوع شرکت کنندگان کنار آمدیم. بنابراین، ما از کلاسها، تعاریف و توضیحات ویکیپدیا و دیکشنریها استفاده کردیم. تکنیکهای اکتساب شناختی و نمایش دادههای کافی نیز برای تشویق شرکتکنندگان به تولید دادههای دقیقتر مورد نیاز است. علاوه بر این، مشکلات طبقه بندی را می توان با استفاده از هستی شناسی جغرافیایی-فضایی حل کرد. نیاز به هستی شناسی ژئو فضایی قبلا برای درک بهتر فضا و ساختن کاربردهای GIS کارآمدتر مورد بحث قرار گرفته است [ 77 ].
رویکرد توسعهیافته مبتنی بر پایههای قوی است، و بنابراین میتوان آن را برای سایر ویژگیهای جغرافیایی و مکانهای دیگر نیز پیکربندی کرد. اول، این رویکرد مبتنی بر بررسی توپولوژیکی ویژگیهای هدف با توجه به زمینه آنها است. بنابراین، می توان آن را برای سایر ویژگی های جغرافیایی منطقه (به عنوان مثال، ویژگی های بدنه آبی) اعمال کرد. دوم، رویکرد بر اساس فرض طبقه بندی محلی ساخته شده است. بنابراین، در یک کشور خاص، این رویکرد ممکن است برای غنیسازی طبقهبندی دادهها در مناطق غیر شهری، پس از یادگیری از دادههای مناطق شهری، در صورت در دسترس بودن مورد استفاده قرار گیرد. در مقابل، این رویکرد محدودیت هایی نیز دارد. اولا، طبقه بندی کننده به در دسترس بودن مقادیر زیادی از داده ها بستگی داردبه منظور استخراج دانش قابل اعتماد ثانیاً، یادگیری از دادههای با کیفیت مشکلساز ممکن است باعث عدم اطمینان در طبقهبندیکننده توسعهیافته شود، و از این رو، بررسی دقیق کیفیت دادههای آموزشی مورد استفاده مورد نیاز است.
8. نتیجه گیری
VGI می تواند به عنوان یک منبع داده مکمل برای داده های معتبر و یک عنصر مهم در زیرساخت داده های جغرافیایی-مکانی عمل کند. با این وجود، کیفیت داده های ناهمگون، کاربرد این منبع امیدوارکننده را محدود می کند. به طور خاص، این تحقیق به طبقهبندی مشکلساز VGI میپردازد، جایی که طبقهبندی دادهها به ترجیحات و ادراکات فردی بستگی دارد. در کار قبلی، ما رویکرد طبقهبندی مبتنی بر قانون را توسعه دادیم که از مکانیسمهای یادگیری ماشین برای مدیریت چالشهای طبقهبندی در پروژههای VGI استفاده میکند. این رویکرد از در دسترس بودن داده ها برای یادگیری ویژگی های متمایز استفاده می کند که می تواند به تمایز بین کلاس های مشابه کمک کند. ویژگی های آموخته شده پس از آن برای ایجاد یک طبقه بندی کننده، که قادر به تمایز بین کلاس های مشابه بود، استفاده شد.
به عنوان اعتبار سنجی رویکرد، ما یک برنامه کاربردی مبتنی بر وب به نام Grass&Green ایجاد کردیم. برنامه به کلاس های همپوشانی برخی از موجودیت های مرتبط با علف می پردازد. برای یک مجموعه داده معین، برنامه از طبقهبندی مبتنی بر قانون استفاده کرد و کلاسهای توصیهشده را برای اعتبارسنجی عمومی ارائه کرد. یافتهها نشاندهنده امکانسنجی رویکرد پیشنهادی و موفقیت کاربرد نیز هستند. با استفاده از روش های ساده اعلام، توجه 212 شرکت کننده از بیش از 35 زمینه فرهنگی مختلف را به خود جلب کردیم. حدود 89 درصد از مشارکت ها با توصیه های ما موافق هستند. تجزیه و تحلیل مشارکت ها افزایش بالقوه طبقه بندی داده ها را نشان می دهد. بازخورد شرکتکنندگان به کارگیری رویکرد ما در سایر مجموعههای داده را تشویق کرده است. نتایج توسعه برنامه های کاربردی سفارشی تر را برای اطمینان از کیفیت طبقه بندی یک ویژگی خاص تحریک می کند. در کارهای آینده، ما قصد داریم مکانیزم های شناختی و تعاملی اکتساب داده ها را طراحی کنیم. علاوه بر این، ما میخواهیم از ماهیت VGI و شرکتکنندگان به منظور توسعه تفسیر شهودی دادهها استفاده کنیم.
منابع
- Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ]
- گوویا، سی. Fonseca، A. رویکردهای جدید برای نظارت بر محیط زیست: استفاده از فناوری اطلاعات و ارتباطات برای کشف اطلاعات جغرافیایی داوطلبانه. جئوژورنال 2008 ، 72 ، 185-197. [ Google Scholar ] [ CrossRef ]
- مونی، پی. Corcoran, P. آیا اطلاعات جغرافیایی داوطلبانه می تواند در eEnvironment و SDI شرکت کند؟ در سیستم های نرم افزاری محیطی. چارچوب های محیط الکترونیکی ; Springer: برلین، آلمان، 2011; صص 115-122. [ Google Scholar ]
- روشه، اس. پروپک-زیمرمن، ای. Mericskay، B. GeoWeb و مدیریت بحران: مسائل و دیدگاههای اطلاعات جغرافیایی داوطلبانه. جئوژورنال 2013 ، 78 ، 21-40. [ Google Scholar ] [ CrossRef ]
- زوک، م. گراهام، ام. شلتون، تی. گورمن، اس. داوطلبانه اطلاعات جغرافیایی و امداد رسانی به منابع جمعی: مطالعه موردی زلزله هائیتی. پزشکی جهانی سیاست سلامت 2010 ، 2 ، 7-33. [ Google Scholar ] [ CrossRef ]
- فوث، م. باجراچاریا، بی. براون، آر. هرن، جی. زندگی دوم شهرسازی؟ استفاده از ابزار NeoGeography برای تعامل با جامعه. J. Locat. سرویس مبتنی بر 2009 ، 3 ، 97-117. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- مونی، پی. سان، اچ. Yan, L. VGI به عنوان یک منبع داده بهروزرسانی پویا در خدمات مبتنی بر مکان در محیطهای شهری. در مجموعه مقالات دومین کارگاه بین المللی در جمع سپاری همه جا حاضر: UbiCrowd’11، پکن، چین، 17-21 سپتامبر 2011.
- هاکلی، م. Weber, P. OpenStreetMap: نقشه های خیابانی تولید شده توسط کاربر. IEEE Pervasive Computing 2008 ، 7 ، 12-18. [ Google Scholar ] [ CrossRef ]
- ساولیف، آ. خو، اس. یانوویچ، ک. مولیگان، سی. تاچر، جی. Luo, W. خدمات جغرافیایی داوطلبانه: توسعه یک سرویس مبتنی بر مکان مبتنی بر داده های مرتبط. در مجموعه مقالات اولین کارگاه بین المللی ACM SIGSPATIAL در مورد معناشناسی و هستی شناسی فضایی، شیکاگو، IL، ایالات متحده، 1 نوامبر 2011. صص 25-31.
- الوود، اس. Goodchild، MF; Sui، DZ تحقیق داوطلبانه اطلاعات جغرافیایی: داده های فضایی، تحقیقات جغرافیایی، و عملکرد اجتماعی جدید. ان دانشیار صبح. Geogr. 2012 ، 102 ، 571-590. [ Google Scholar ] [ CrossRef ]
- علی، ال. Schmid, F. تضمین کیفیت داده برای اطلاعات جغرافیایی داوطلبانه. در علم اطلاعات جغرافیایی ; Springer: وین، اتریش، 2014; صص 126-141. [ Google Scholar ]
- دیویلر، آر. استین، ا. Bédard، Y.; کریسمن، ن. فیشر، پی. Shi, W. سی سال تحقیق در مورد کیفیت داده های مکانی: دستاوردها، شکست ها و فرصت ها. ترانس. GIS 2010 ، 14 ، 387-400. [ Google Scholar ] [ CrossRef ]
- Goodchild، MF; Li, L. اطمینان از کیفیت اطلاعات جغرافیایی داوطلبانه. تف کردن آمار 2012 ، 1 ، 110-120. [ Google Scholar ] [ CrossRef ]
- Goodchild، MF ادعا و قدرت: علم محتوای جغرافیایی تولید شده توسط کاربر. در مجموعه مقالات همایش برای شصتمین زادروز اندرو یو. فرانک، وین، ایتالیا، 30 ژوئن تا 1 ژوئیه 2008.
- گوپتیل، SC; موریسون، JL عناصر کیفیت داده های مکانی ; الزویر: آمستردام، هلند، 2013. [ Google Scholar ]
- علی، ال. اشمید، اف. فالومیر، ز. Freksa, C. به سمت طبقه بندی مبتنی بر قانون برای اطلاعات جغرافیایی داوطلبانه. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، II-3/W5 ، 211-217. [ Google Scholar ] [ CrossRef ]
- علی، ال. فالومیر، ز. اشمید، اف. Freksa, C. طبقهبندی انسانی مبتنی بر قوانین اطلاعات جغرافیایی داوطلبانه. ISPRS J. Photogramm and Remote Sens. 2016 ، در دست چاپ. [ Google Scholar ]
- خاطرات کاربران OSM. در دسترس آنلاین: https://www.openstreetmap.org/diary (در 24 مه 2016 قابل دسترسی است).
- OSMstats. در دسترس آنلاین: http://osmstats.neis-one.org/ (دسترسی در 24 مه 2016).
- stensen, OM; اسمیتز، PC ISO/TC211: استانداردسازی اطلاعات جغرافیایی و ژئو انفورماتیک. در مجموعه مقالات سمپوزیوم بین المللی زمین شناسی و سنجش از دور IEEE 2002، IGARSS’02، تورنتو، ON، کانادا، 24-28 ژوئن 2002. جلد 1، ص 261-263.
- ISO/TC211. در دسترس آنلاین: http://www.isotc211.org/ (دسترسی در 24 مه 2016).
- Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی مجموعه دادههای OpenStreetMap و Ordnance Survey. محیط زیست طرح. B طرح. دس 2010 ، 37 ، 682-703. [ Google Scholar ] [ CrossRef ]
- لودویگ، آی. ووس، ا. Krause-Traudes، M. مقایسه شبکه های خیابانی Navteq و OSM در آلمان. در پیشرفت علم اطلاعات جغرافیایی برای جهانی در حال تغییر . Springer: Berlin, Gernany, 2011; صص 65-84. [ Google Scholar ]
- ارسنجانی، ج. مونی، پی. Zipf، A.; Schauss, A. ارزیابی کیفیت اطلاعات استفاده از زمین از OpenStreetMap در مقابل مجموعه دادههای معتبر. در OpenStreetMap در GIScience ; Springer: برلین، آلمان، 2015; صص 37-58. [ Google Scholar ]
- دورن، اچ. تورنروس، تی. Zipf، A. ارزیابی کیفیت VGI با استفاده از دادههای معتبر – مقایسه با دادههای کاربری زمین در جنوب آلمان. ISPRS Int. J. Geo-Inf. 2015 ، 4 ، 1657-1671. [ Google Scholar ] [ CrossRef ]
- واز، ای. جوکار ارسنجانی، جی. نقشه برداری جمع سپاری استفاده از زمین در محیط های متراکم شهری: ارزیابی تورنتو. می توان. Geogr. 2015 . [ Google Scholar ] [ CrossRef ]
- گیرس، جی اف. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS 2010 ، 14 ، 435-459. [ Google Scholar ] [ CrossRef ]
- Flanagin، AJ; Metzger, MJ اعتبار اطلاعات جغرافیایی داوطلبانه. جئوژورنال 2008 ، 72 ، 137-148. [ Google Scholar ] [ CrossRef ]
- بیشر، م. کوهن، دبلیو. اطلاعات مکانی از پایین به بالا: موضوع اعتماد و معناشناسی. در جامعه اطلاعاتی اروپا ; Springer: برلین، آلمان، 2007; صص 365-387. [ Google Scholar ]
- نیس، پ. Zipf، A. تجزیه و تحلیل فعالیت مشارکت کننده یک پروژه داوطلبانه اطلاعات جغرافیایی: مورد OpenStreetMap. ISPRS Int. J. Geo-Inf. 2012 ، 1 ، 146-165. [ Google Scholar ] [ CrossRef ]
- نیس، پ. زیلسترا، دی. Zipf، A. تکامل شبکه خیابانی نقشههای crowdsourced: OpenStreetMap در آلمان 2007-2011. اینترنت آینده 2011 ، 4 ، 1-21. [ Google Scholar ] [ CrossRef ]
- کسلر، سی. de Groot، RTA Trust به عنوان معیاری برای کیفیت اطلاعات جغرافیایی داوطلبانه در مورد OpenStreetMap. در علم اطلاعات جغرافیایی در قلب اروپا ; Springer: برلین، آلمان، 2013; ص 21-37. [ Google Scholar ]
- کسلر، سی. ترام، جی. Kauppinen، T. پیگیری فرآیندهای ویرایش در اطلاعات جغرافیایی داوطلبانه: مورد OpenStreetMap. در مجموعه مقالات کارگاه شناسایی اشیاء، فرآیندها و رویدادها در داده های توزیع شده مکانی-زمانی (IOPE 2011)، بلفاست، ME، ایالات متحده آمریکا، 12-16 سپتامبر 2016.
- D’Antonio، F. فوگلیارونی، پ. تاریخچه ویرایش Kauppinen، T. VGI قابلیت اطمینان داده ها و شهرت کاربر را نشان می دهد. در مجموعه مقالات هفدهمین کنفرانس AGILE در علم اطلاعات جغرافیایی، اتصال اروپای دیجیتال از طریق مکان و مکان، کاستلون، اسپانیا، 3 تا 6 ژوئن 2014.
- نیس، پ. زیلسترا، دی. Zipf، A. مقایسه مشارکت داوطلبانه اطلاعات جغرافیایی و توسعه جامعه برای مناطق منتخب جهان. اینترنت آینده 2013 ، 5 ، 282-300. [ Google Scholar ] [ CrossRef ]
- بالاتوره، آ. Zipf، A. چارچوب کیفیت مفهومی برای اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات دوازدهمین کنفرانس بین المللی نظریه اطلاعات مکانی COSIT 2015، سانتافه، NM، ایالات متحده، 12-16 اکتبر 2015; صص 89-107.
- بارون، سی. نیس، پ. Zipf، A. چارچوبی جامع برای تحلیل کیفی OpenStreetMap ذاتی. ترانس. GIS 2014 ، 18 ، 877-895. [ Google Scholar ] [ CrossRef ]
- هچت، بی. استفنز، ام. داستان شهرها: تعصبات شهری در اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات هشتمین کنفرانس بین المللی وبلاگ ها و رسانه های اجتماعی (ICWSM)، آکسفورد، انگلستان، 27-29 مه 2014.
- کواترون، جی. مشهدی، ع. Capra, L. Mind the map: تأثیر فرهنگ و ثروت اقتصادی بر رفتارهای نقشه برداری جمعیت. در مجموعه مقالات هفدهمین کنفرانس ACM در زمینه کار تعاونی و محاسبات اجتماعی با پشتیبانی رایانه، بالتیمور، MD، ایالات متحده، 15 تا 19 فوریه 2014. ص 934-944.
- اشمید، اف. کوتز، او. فرومبرگر، ال. کاوپینن، تی. Cai, C. رابط های بصری و طبیعی برای طبقه بندی داده های مکانی. در مجموعه مقالات کارگاه تحقیقات کسب دانش مرتبط با مکان (P-KAR)، کلستر سیون، آلمان، 31 اوت 2012.
- اشمید، اف. فرومبرگر، ال. کای، سی. Dylla, F. Lowering the barrier: چگونه الگوی What-You-See-Is-What-You-Map مردم را قادر می سازد تا اطلاعات جغرافیایی داوطلبانه را به اشتراک بگذارند. در مجموعه مقالات چهارمین سمپوزیوم سالانه محاسبات برای توسعه، کیپ تاون، آفریقای جنوبی، 6-7 دسامبر 2013. صص 8-18.
- پورعبدالله، ع. مورلی، جی. فلدمن، اس. جکسون، ام. به سوی نقشه خیابان باز معتبر: تلفیق شبکه جاده ای نقشه های ملی OSM و OS OpenData. ISPRS Int. J. Geo-Inf. 2013 ، 2 ، 704-728. [ Google Scholar ] [ CrossRef ]
- واندکاستیل، ا. Devillers, R. بهبود کیفیت داده های جغرافیایی داوطلبانه با استفاده از اندازه گیری های تشابه معنایی. ISPRS-Int. قوس. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2013 ، 1 ، 143-148. [ Google Scholar ] [ CrossRef ]
- علی، ال. اشمید، اف. السلمان، ر. Kauppinen، T. ابهام و معقولیت: مدیریت کیفیت طبقه بندی در اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات بیست و دومین کنفرانس بین المللی ACM SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، دالاس، تگزاس، ایالات متحده آمریکا، 4 تا 7 نوامبر 2014. صص 143-152.
- یاننکو، او. Schlieder, C. اصول بازی برای افزایش کیفیت مجموعه داده های تولید شده توسط کاربر. در Proceedings of the AGILE، کارگاه Geogames Geoplay، Castellon، اسپانیا، 3-6 ژوئن 2014. صص 1-5.
- کاراگیاناکیس، ن. جیانوپولوس، جی. اسکوتاس، دی. ابزار Athanasiou، S. OSMRec برای توصیه خودکار دستهها در موجودیتهای فضایی در OpenStreetMap. در مجموعه مقالات نهمین کنفرانس ACM در سیستم های توصیه کننده، وین، اتریش، 16-20 سپتامبر 2015. صص 337-338.
- پلاگین OSMRec. در دسترس آنلاین: https://github.com/GeoKnow/OSMRec (در 24 مه 2016 قابل دسترسی است).
- بازرس OSM. در دسترس آنلاین: http://tools.geofabrik.de/osmi/ (در 24 مه 2016 قابل دسترسی است).
- نگه داشتن راست. در دسترس آنلاین: http://keepright.ipax.at/ (دسترسی در 24 مه 2016).
- رولت نقشه. در دسترس آنلاین: http://maproulette.org/ (در 24 مه 2016 قابل دسترسی است).
- گرد و غبار نقشه. در دسترس آنلاین: http://www.mapdust.com/ (در 24 مه 2016 قابل دسترسی است).
- NOVAM. در دسترس آنلاین: http://b3e.net/novam/ (در 24 مه 2016 قابل دسترسی است).
- مدل های فیشر، PF عدم قطعیت در داده های مکانی. جغرافیا. Inf. سیستم 1999 ، 1 ، 191-205. [ Google Scholar ]
- اسپارکس، ک. کلیپل، ا. والگرون، JO; Mark, D. Citizen Science طبقه بندی پوشش زمین بر اساس تصاویر زمینی و هوایی. در نظریه اطلاعات مکانی ; Springer: برلین، آلمان، 2015; صص 289-305. [ Google Scholar ]
- کلیپل، ا. اسپارکس، ک. والگرون، JO دامها و پتانسیلهای علم جمعی: متاآنالیز تأثیرات زمینهای. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، II-3/W5 ، 325-331. [ Google Scholar ] [ CrossRef ]
- فودی، جی. ببینید، L. فریتز، اس. ون در ولده، م. پرگر، سی. شیل، سی. بوید، دی. Comber، A. نقشه برداری دقیق ویژگی از اطلاعات جغرافیایی داوطلبانه: مسائل کمیت و کیفیت داوطلب. کارتوگر. J. 2014 ، 52 ، 1-9. [ Google Scholar ] [ CrossRef ]
- فریتز، اس. مک کالوم، آی. شیل، سی. پرگر، سی. ببینید، L. شپاچنکو، دی. ون در ولده، م. کراکسنر، اف. Obersteiner, M. Geo-Wiki: یک پلت فرم آنلاین برای بهبود پوشش جهانی زمین. محیط زیست مدل. نرم افزار 2012 ، 31 ، 110-123. [ Google Scholar ] [ CrossRef ]
- مونی، پی. Corcoran, P. فرآیند حاشیه نویسی در OpenStreetMap. ترانس. GIS 2012 ، 16 ، 561-579. [ Google Scholar ] [ CrossRef ]
- بالاتوره، آ. برتولتو، ام. استخراج دانش جغرافیایی ویلسون، دی سی و تشابه معنایی در OpenStreetMap. بدانید. Inf. سیستم 2013 ، 37 ، 61-81. [ Google Scholar ] [ CrossRef ]
- باگلاتزی، ع. کوکلا، م. Kavouras, M. معنایی سازی OpenStreetMap. در مجموعه مقالات پنجمین کارگاه بین المللی Terra Cognita، بوستون، MA، ایالات متحده آمریکا، 12 نوامبر 2012; صص 39-50.
- کامبر، ای جی. فیشر، پی. هاروی، اف. گهگان، م. Wadsworth، R. استفاده از فراداده برای پیوند عدم قطعیت و ارزیابی کیفیت داده ها. در مجموعه مقالات دوازدهمین سمپوزیوم بین المللی در مورد مدیریت داده های فضایی، وین، اتریش، 12-14 ژوئیه 2006; صص 279-292.
- گریرا، جی. Bédard، Y.; Roche, S. عدم قطعیت داده های فضایی در دنیای VGI: رفتن از مصرف کننده به تولید کننده. Geomatica 2010 ، 64 ، 61-72. [ Google Scholar ]
- Egenhofer، MJ; آل طه، ک.ک. استدلال درباره تغییرات تدریجی روابط توپولوژیکی. در مجموعه مقالات کنفرانس بین المللی GIS-از فضا تا قلمرو: نظریه ها و روش های استدلال مکانی-زمانی، پیزا، ایتالیا، 21-23 سپتامبر 1992; صص 196-219.
- ثبتاه، اف. بررسی معادن طبقه بندی انجمنی. بدانید. مهندس Rev. 2007 , 22 , 37-65. [ Google Scholar ] [ CrossRef ]
- سرور اوبونتو در دسترس آنلاین: http://www.ubuntu.com/server (در 24 مه 2016 قابل دسترسی است).
- OpenScienceMap. در دسترس آنلاین: http://www.opensciencemap.org/ (دسترسی در 24 مه 2016).
- ورد نت. در دسترس آنلاین: https://wordnet.princeton.edu/ (دسترسی در 24 مه 2016).
- جزوه در دسترس آنلاین: http://leafletjs.com/ (در 1 ژوئن 2016 قابل دسترسی است).
- بوت استرپ در دسترس آنلاین: http://getbootstrap.com/ (در 1 ژوئن 2016 قابل دسترسی است).
- جی کوئری. در دسترس آنلاین: https://jquery.com/ (در 1 ژوئن 2016 قابل دسترسی است).
- OAuth. در دسترس آنلاین: http://oauth.net/ (در 1 ژوئن 2016 قابل دسترسی است).
- Crone، GR Maps و سازندگان آنها: مقدمه ای بر تاریخچه نقشه برداری . کتابخانه دانشگاه هاچینسون: لندن، بریتانیا، 1966. [ Google Scholar ]
- Goodchild، MF; Gopal, S. The Accuracy of Spatial Databases ; CRC Press: Boca Raton، FL، USA، 1989. [ Google Scholar ]
- Goodchild، مدل های داده MF و کیفیت داده: مشکلات و چشم اندازها. در دسترس آنلاین: http://www.geog.ucsb.edu/ good/papers/192.pdf (در 1 ژوئن 2016 قابل دسترسی است).
- تاچر، جی. از اطلاعات جغرافیایی داوطلبانه تا خدمات جغرافیایی داوطلبانه. در جمع سپاری دانش جغرافیایی ; Springer: برلین، آلمان، 2013; صص 161-173. [ Google Scholar ]
- پارکر، سی جی; می، آ. میچل، وی. باروز، الف. گرفتن اطلاعات داوطلبانه برای طراحی خدمات فراگیر: مزایا و چالش های بالقوه. دس J. 2013 , 16 , 197-218. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- فرانک، AU هستی شناسی فضایی: دیدگاه اطلاعات جغرافیایی. در استدلال مکانی و زمانی ; Springer: برلین، آلمان، 1997; صص 135-153. [ Google Scholar ]

شکل 1. نمونه ای از طبقه بندی مشکل ساز در پروژه OSM: موجودیت برجسته شده به عنوان زمین ، مدرسه و ساحل طبقه بندی می شود ، در حالی که در واقع یک زمین بازی والیبال ساحلی در یک مدرسه است.

شکل 2. طبقات همپوشانی مفهومی به دلیل توضیحات داده شده در ویکی OSM. نمونه هایی از ( الف ) طبقات مرتبط با چمن همپوشانی، ( ب ) طبقات مرتبط با آب همپوشانی دارند.

شکل 3. ساختار مفهومی رویکرد طبقه بندی مبتنی بر قانون.

شکل 4. دستورالعمل های برنامه و گزینه های ورود کاربر OSM.

شکل 5. توضیحات متنی و تصویری کلاس های هدف.

شکل 6. واسط اعتبارسنجی برای موجودیت های ارائه شده.

شکل 7. ساختار برنامه Grass &Green .

شکل 8. الگوهای مشارکت و مشارکت با توجه به خاستگاه جغرافیایی شرکت کننده. ( الف ) توزیع منابع جغرافیایی شرکتکنندگان، ( ب ) مشارکتها نسبت به مبداهای جغرافیایی شرکتکننده.

شکل 9. مشارکت کنندگان و مشارکت های مربوط به تجربه شرکت کننده. ( الف ) توزیع شرکتکنندگان و مشارکتها در هر گروه، ( ب ) نگرانیهای شرکتکنندگان در هر گروه.

شکل 10. تعداد شرکت کنندگان در روز نسبت به روش های اعلامی.

شکل 11. توافق شرکت کننده با کلاس های توصیه شده.

شکل 12. تصاویر بصری موجودیت هایی که به طور قابل قبولی به کلاس های همپوشانی مفهومی تعلق دارند. موجودیت های داده شده ( که با خطوط سیاه مشخص شده اند ) توسط شرکت کنندگان تأیید می شوند. ( الف ) یک موجودیت برای طبقهبندی بهعنوان پارک / چمنزار اعتبارسنجی میشود ، ( ب ) یک موجودیت برای طبقهبندی بهعنوان پارک / جنگل تأیید میشود ، ( ج ) یک موجودیت اعتبار برای طبقهبندی بهعنوان پارک / جنگل تأیید میشود .

شکل 13. بررسی بصری مشارکت های شرکت کنندگان در مقایسه با توصیه های ارائه شده توسط رویکرد ما و طبقه بندی داده های پیشرفته حاصل. ( الف ) یک شرکتکننده از توصیه ما پیروی کرد و طبقهبندی نهاد را بهعنوان پارک تأیید کرد ، ( ب ) یک شرکتکننده از توصیه ما پیروی کرد و طبقهبندی نهاد را از پارکی به علفزار اصلاح کرد ، ( ج ) یک شرکتکننده کلاس باغ پیشنهادی ما را نادیده گرفت و نهاد را بهعنوان اشتباه طبقهبندی کرد. چمنزار .

جدول 1. نقشه برداری بین برچسب های OSM و برخی از کلاس های همپوشانی مرتبط با چمن و آب.

جدول 2. نهادهای طبقه بندی شده قبل و بعد از اعتبارسنجی با توجه به کلاس های توصیه شده و نظرات شرکت کنندگان.

جدول 3. کلاس ها با توجه به توصیه ها و پاسخ های شرکت کنندگان پس از اعتبار سنجی.
© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر