ترسیم منطقه ای مناطق خانه از مشارکت و ویرایش الگوها در OpenStreetMap

خلاصه

نوع داده‌هایی که یک مشارکت‌کننده فردی به OpenStreetMap (OSM) اضافه می‌کند بسته به منطقه متفاوت است. دانش محلی یک مشارکت‌کننده داده، امکان جمع‌آوری و ویرایش ویژگی‌های دقیق مانند مسیرهای کوچک، نیمکت‌های پارک یا شیر آتش نشانی، و همچنین افزودن اطلاعات ویژگی‌هایی را فراهم می‌کند که فقط به صورت محلی قابل دسترسی هستند. برخلاف این، تصاویر ماهواره‌ای که به‌عنوان تصاویر پس‌زمینه در ویرایشگرهای داده OSM، مانند ID، Potlatch یا JOSM ارائه می‌شوند، مشارکت داده‌های با جزئیات کمتر را از طریق دیجیتال‌سازی روی صفحه تسهیل می‌کنند، اغلب برای مناطقی که مشارکت‌کننده با آن‌ها کمتر آشنا هستند. بنابراین دانستن اینکه آیا یک منطقه بخشی از منطقه اصلی یک مشارکت کننده است یا خیر، می تواند یک پیش بینی مفید برای کیفیت داده های OSM برای یک منطقه جغرافیایی باشد. این تحقیق تاریخچه ویرایش گره‌ها و راه‌های 13 عضو OSM بسیار فعال را در یک فرآیند خوشه‌بندی دو لایه بررسی می‌کند تا منطقه خانه یک نقشه‌بردار را از مناطق نقشه‌برداری از راه دور مشخص کند. یافته‌ها در برابر آنهایی که با روشی که قبلاً معرفی شده بود، ارزیابی می‌شوند که منطقه اصلی مشارکت‌کننده را تنها بر اساس خوشه‌بندی فضایی گره‌های ایجاد شده تعیین می‌کند. مقایسه نشان می‌دهد که هر دو روش می‌توانند مناطق خانه مشابه را برای 13 مشارکت‌کننده با تفاوت‌هایی مشخص کنند.

کلید واژه ها:

اطلاعات جغرافیایی داوطلبانه (VGI) ; OpenStreetMap ; ترسیم منطقه ای ; الگوهای مشارکت خوشه بندی

چکیده گرافیکی

1. معرفی

تکامل داده‌های جغرافیایی جمع‌آوری‌شده داوطلبانه و توزیع آن در اینترنت منجر به افزایش قابل توجهی در تحقیقات در مورد اطلاعات جغرافیایی داوطلبانه (VGI) شده است [ 1 ]] در سالهای اخیر. طیف منابع داده VGI از وب‌سایت‌های اشتراک‌گذاری تصویر مانند Flickr یا Panoramio، از طریق پلتفرم‌های رسانه‌های اجتماعی مانند Twitter و Foursquare تا پورتال‌های نقشه‌برداری پیچیده‌تر مانند OpenStreetMap (OSM) می‌رسد. با این حال، نوع اطلاعات جمع‌آوری‌شده که می‌توان از پلتفرم‌های جداگانه بازیابی کرد، از نظر پیچیدگی و هدف متفاوت است. بیشتر منابع ذکر شده به سفر فردی و تجربه شخصی مرتبط با یک مکان مربوط می شود. از چنین اطلاعاتی می توان برای تحلیل الگوهای سفر مکانی-زمانی افراد و درک آنها از فضا استفاده کرد. مثال‌ها عبارتند از استخراج مسیر حرکت مردم [ 2 ، 3 ]، رویدادها [ 4 ]، مکان‌های محبوب [ 5 ]، و مناطق بومی [2].6 ] از وب سایت های تصویر مشترک Panoramio و Flickr. علاوه بر این، توییت‌ها برای استخراج دانش در مورد مکان‌های شخصی مهم در زندگی روزمره مردم [ 7 ]، الگوهای فعالیت افراد [ 8 ، 9 ]، احساسات سواران حمل‌ونقل در مورد خدمات حمل‌ونقل [ 10 ] و شادی مردم [ 11 ] استفاده شده‌اند. اطلاعات ورود از وب سایت شبکه اجتماعی مبتنی بر مکان Foursquare برای شناسایی الگوهای حرکتی در محیط های مختلف شهری استفاده شد [ 12]. با این حال، OSM، به دلیل هدف خود برای ایجاد یک نقشه جامع از جهان، بر نقشه برداری از مکان های سفر فرد تمرکز نمی کند و همچنین از اظهارات ذهنی اجتناب می کند. استثناها در مورد دوم برای مثال موقعیت هایی هستند که در آن اختلاف بر سر مکان یا نام ویژگی منجر به ویرایش گسترده ویژگی می شود [ 13 ]. OSM از ساختارهای فضایی پیچیده تری مانند ویژگی های نقطه، خط و چند ضلعی مربوط به ویژگی های فیزیکی و واحدهای اداری در مقایسه با سایر منابع داده VGI استفاده می کند.

تجزیه و تحلیل الگوهای مشارکت OSM اخیراً در جامعه تحقیقاتی زمین فضایی مورد توجه قرار گرفته است زیرا این الگوها ارتباط نزدیکی با کیفیت داده های OSM دارند [ 14 ، 15 ، 16 ]. تجزیه و تحلیل مشارکت OSM شامل طبقه بندی مشارکت کنندگان بر اساس سطح فعالیت آنها [ 17 ، 18 ]، مقایسه فعالیت های OSM بین مناطق مختلف جهان [ 17 ]، ارزیابی تأثیر مشارکت اعضا بر کیفیت ویژگی OSM [ 13 ، 15 ] است. ]، تجزیه و تحلیل الگوهای مشارکتی در ویرایش های ویژگی OSM [ 19 ]، و ارزیابی تغییر الگوهای ویرایش در یک منطقه جغرافیایی در طول زمان [20 ، 21 ]. با این حال، تحقیقات محدودی تاکنون بر روی تجزیه و تحلیل الگوهای مشارکت فضایی یک مشارکت کننده انجام شده است، به عنوان مثال ، تنوع مشارکت بین مناطق مختلف. یکی از ویژگی های اصلی که منابع داده VGI را از مجموعه داده های دولتی و تجاری سنتی متمایز می کند، رویکرد “شهروندان به عنوان حسگرهای داوطلبانه” است [ 1 ].]. از طریق حضور فیزیکی در یک مکان و دانش محلی، مشارکت‌کنندگان فردی می‌توانند اطلاعات جغرافیایی را جمع‌آوری کنند که از بالا قابل مشاهده نیستند و بنابراین نمی‌توانند از تصاویر ماهواره‌ای استخراج شوند. ما فرض می‌کنیم که این اصل مشارکت داده‌های محلی به فرآیند جمع‌آوری داده‌های OSM ترجمه می‌شود، جایی که یک مشارکت‌کننده می‌تواند اطلاعات دقیق‌تری را اضافه کند و مراحل تصحیح داده‌های دقیق‌تری را برای منطقه‌ای که مشارکت‌کننده با آن آشنا است (مثلاً یک منطقه خانگی) ارائه دهد. مناطق دور افتاده تر و کمتر مسافرت شده است. برخلاف این، مناطق دورافتاده اغلب تنها از طریق ردیابی تصاویر ماهواره ای نقشه برداری می شوند، که به احتمال زیاد منجر به انواع مختلفی از مشارکت داده ها یا ویرایش ویژگی ها در مقایسه با منطقه اصلی مشارکت کننده می شود.17 ]، تا کنون هیچ روشی از اطلاعات اضافی در مورد نوع ویرایش های انجام شده در داده های OSM برای شناسایی منطقه اصلی مشارکت کننده استفاده نکرده است. ما فرض می کنیم که چنین اطلاعات ویرایشی می تواند برای شناسایی منطقه اصلی یک مشارکت کننده نیز ارزشمند باشد.

برای آزمایش این فرض ما از یک رویکرد خوشه‌بندی دو لایه استفاده می‌کنیم که الگوهای ویرایش گره‌ها و راه‌های 13 مشارکت‌کننده فعال OSM را تحلیل می‌کند. این روش تلاش‌های جمع‌آوری داده‌های مشارکت‌کننده را در یک منطقه خانگی و مناطقی که احتمالاً مشارکت‌کننده با آن‌ها آشنا نیست (از اینجا به بعد منطقه خارجی نامیده می‌شود) ترسیم می‌کند. ما از چندین روش برای تأیید معقول بودن نتایج ترسیم منطقه استفاده می‌کنیم، به عنوان مثال، با مقایسه تعداد روزهایی که یک نقشه‌بردار در خانه و منطقه خارجی فعال بوده است، یا با مقایسه تعداد انواع ویژگی‌های مختلف نقشه‌برداری شده در خانه و منطقه خارجی به ترتیب. این بینشی در مورد تفاوت در سطح تنوع و فعالیت رفتار نقشه برداری بین مناطق داخلی و خارجی می دهد.

ساختار باقیمانده این مقاله به شرح زیر است: بخش بعدی یافته‌های قبلی الگوهای مشارکت‌کننده OSM را مرور می‌کند، که با بخشی در بازیابی داده‌ها و تجزیه و تحلیل ویرایش، و بخشی در ارزیابی مدل دنبال می‌شود. بخش آخر خلاصه ای از یافته ها را ارائه می دهد.

2. الگوهای مشارکت در OSM

تعدادی از مطالعات تحقیقاتی اخیر OSM بر جنبه های کیفیت داده ها مانند کامل بودن، دقت موقعیتی و به موقع بودن تمرکز داشتند. کیفیت داده VGI ذاتاً به الگوهای مشارکت و رفتار بستگی دارد. هیپکه [ 18] بیان می کند که افرادی که به طور جمعی یک پروژه نقشه برداری را انجام می دهند، بیش از رفتارهای صرفاً نقشه برداری را به اشتراک می گذارند و بنابراین یک گروه مرتبط اجتماعی را تشکیل می دهند. این مقاله طبقه‌بندی نقشه‌برداران جمع‌سپاری را بر اساس انگیزه و تعامل آنها با یکدیگر ارائه می‌کند. این طبقه‌بندی شامل نقشه‌برداران معمولی (مثلاً کوهنوردان)، کارشناسان (مشارکت‌کنندگان برجسته نقشه در سازمان‌هایی مانند نجات کوهستان)، نقشه‌برداران رسانه‌ای (گروه‌های بالقوه بزرگ، که به‌طور پراکنده توسط کمپین‌های رسانه‌ای فعال می‌شوند) و نقشه‌برداران غیرفعال (شامل جمع‌آوری داده‌های غیرفعال در مورد موقعیت افراد است). به عنوان مثال، از طریق تلفن های همراه). Neis و Zipf [ 17 ] مشارکت‌کنندگان OSM را بر اساس تعداد گره‌هایی که مشارکت می‌کنند، به نقشه‌برداران ارشد، نگاشت‌کنندگان جوان، نگاشت‌کنندگان غیرتکرارکننده و اعضایی که هیچ مشارکتی در گره نداشتند، طبقه‌بندی می‌کنند. ررل و همکاران[ 21 ] و گروچنگ [ 22] ویرایش های داده های OSM را به عملیات، اقدامات و فعالیت ها طبقه بندی می کند. عملیات تغییرات یک ویژگی OSM واحد را از طریق هر یک از سه عملیات اصلی: ایجاد، تغییر و حذف توصیف می کند. به عنوان مثال می توان به ایجاد یک گره جدید با شناسه ویژگی جدید (ایجاد)، به روز رسانی مختصات یک گره (اصلاح) یا حذف یک راه (حذف) اشاره کرد. ایجاد، تغییر و حذف را می‌توان روی گره‌ها، راه‌ها و روابط اعمال کرد و از تاریخچه کامل OSM استخراج کرد. یک اقدام VGI به دنباله ای از عملیات متوالی توسط یک مشارکت کننده داوطلبانه در یک بازه زمانی محدود، مانند ایجاد یک راه، که شامل عملیات ایجاد یک ویژگی راه جدید، اضافه کردن گره ها، و افزودن یک برچسب اولیه است، اشاره می کند. فعالیت VGI مجموعه ای از اقدامات توسط یک مشارکت کننده داوطلبانه یا گروهی از مشارکت کنندگان داوطلبانه است که معمولاً از انگیزه خاصی پیروی می کند. مانند بهبود دقت موقعیت. استینمنو همکاران [ 23 ] توسعه زمانی عملیات ویرایش OSM را برای آلمان، اتریش و سوئیس بین سال‌های 2005 تا 2011 تجزیه و تحلیل کرد و دریافت که عملیات «ایجاد» در سال‌های اولیه برجسته‌ترین است، در حالی که نسبت عملیات «اصلاح» و «حذف» وجود دارد. پس از ترسیم اولیه یک منطقه، در طول سال ها افزایش می یابد. استینمن و همکاران [ 24 ] نمایه‌های ویرایشی را از طریق خوشه‌بندی k-means ایجاد کرد که برای کنش‌ها و انواع ویژگی‌های تحت تأثیر این کنش‌ها اعمال می‌شود. نمایه‌های حاصل شامل 10 گروه مشارکت‌کننده برای اقدامات، مانند ایجادکننده اصلی، به‌روزرسانی‌کننده، یا همه‌جانبه اولیه، و 10 گروه مشارکت‌کننده برای انواع ویژگی‌ها، از جمله نقشه‌بردار بزرگراه، نقشه‌بردار ساختمان، یا نقشه‌بردار امکانات رفاهی است.

کامل بودن و دقت موقعیتی داده های جاده OSM در مقایسه با مجموعه داده های دولتی یا اختصاصی برای کشورهای مختلف در مطالعات متعدد مورد بررسی قرار گرفته است [ 25 ، 26 ، 27 ]. نتایج، ناهمگونی کیفیت داده‌های OSM را در هر کشور نشان می‌دهد، با یک الگوی واضح از مشارکت بالاتر اعضای OSM در مناطق شهری در مقایسه با مناطق روستایی. مشارکت کنندگان OSM تمایل دارند اطلاعات دقیق تری را برای عابر پیاده نسبت به ارائه دهندگان تجاری و دولتی در مناطق شهری اضافه کنند [ 28 ] که همچنین می تواند منجر به برآورد واقعی تر از دسترسی عابر پیاده به ایستگاه های حمل و نقل شود [ 29 ]. یک مطالعه اخیر کامل بودن ویژگی های دوچرخه را ارزیابی کرد، خطوط دوچرخه در خیابان و مسیرهای خارج از جاده، بین مناطق شهری انتخاب شده در ایالات متحده [ 30 ]. نتایج نشان داد که مسیرهای خارج از جاده به طور کامل تر از خطوط دوچرخه سواری در خیابان ترسیم شده است. توضیح احتمالی برای دومی این است که مسیرها به غیر از جاده ها هندسه خاص خود را دارند، در حالی که خط دوچرخه به عنوان یک ویژگی جاده بدون هندسه خاص خود کدگذاری می شود. بنابراین، ویژگی‌های مسیرهای جدید نقشه‌برداری شده از نظر بصری متمایزتر از خطوط نقشه‌برداری شده هستند، که ممکن است انگیزه بیشتری را برای نقشه‌بردار OSM ایجاد کند تا مسیرهای دوچرخه را به جای مسیرهای دوچرخه در خیابان اضافه کند.

مطالعات دیگری که بر کاربرد VGI متمرکز شده‌اند نیز پتانسیل OSM را در طول تلاش‌های امدادرسانی در بلایا نشان می‌دهند [ 31 ] یا هنگام تصمیم‌گیری در مورد اینکه آیا VGI یا اطلاعات جغرافیایی حرفه‌ای (PGI) به عنوان منبع داده بهتری هنگام برنامه‌ریزی فعالیت‌های خارج از منزل عمل می‌کند [ 32 ]. اهمیت منابع داده VGI و PGI برای اهداف طراحی نقشه و درک کاربران از اطلاعات نیز با جزئیات بیشتری مورد بررسی قرار گرفت [ 33 ، 34 ]. نتایج نشان داد که طراحان GIS می‌توانند بر سطحی از جزئیات در VGI در مناطق انتخاب شده تکیه کنند که بعید است از طریق PGI ایجاد شود.

بر اساس نتایج یک تجزیه و تحلیل کیفیت گسترده از مجموعه داده OpenStreetMap فرانسه، Girres و Touya [ 35 ] پیشنهاد می کنند که به دلیل فقدان معیارهای کیفیت در OSM باید تعادلی یافت شود که رویکرد رایگان به مشارکت داده ها را حفظ کند، اما به برخی موارد نیز احترام بگذارد . مشخصات داده ها برای بهبود کیفیت داده ها به طور مشابه، Mooney و Corcoran [ 36 ] دریافتند که فقدان یک مکانیسم دقیق برای ارزیابی اینکه آیا کلیدها و مقادیر کمک شده به واژگان کنترل شده OSM پایبند هستند یا خیر، باعث خطاهای املایی و در نتیجه کاهش کیفیت داده های OSM می شود. این فرض که تعداد مشارکت کنندگان کیفیت را افزایش می دهد در جامعه منبع باز به عنوان “قانون لینوس” شناخته می شود. هاکلی و همکاران [ 25] دریافت که قانون به طور کلی در مورد دقت موقعیت OSM اعمال می شود. با این حال، قانون لینوس را نمی توان در زمینه ویژگی های جاده در مطالعه دیگری که اشیاء به شدت ویرایش شده در OSM را تجزیه و تحلیل کرد تأیید کرد. هیچ رابطه قوی بین تعداد مشارکت کنندگانی که یک شی معین را ویرایش می کنند و مقدار اطلاعات ویژگی اختصاص داده شده به آن پیدا نکرد [ 13 ]. در تلاش برای درک اینکه آیا همکاری بین مشارکت‌کنندگان OSM که در مناطق انتخابی وجود دارد می‌تواند به طور بالقوه منجر به افزایش کیفیت داده‌ها شود، مطالعه دیگری نشان داد که بسیاری از مشارکت‌کنندگان اصلی OSM ترجیح می‌دهند به تنهایی کار کنند و در عین حال، ویژگی‌هایی را که اضافه شده است را ویرایش کنند. مشارکت کنندگان کمتر فعال [ 20 ]. کسلر و همکاران [ 37 ، 38] اهمیت اعتماد را به عنوان معیاری برای تخمین کیفیت VGI برجسته کرد. نتایج تجزیه و تحلیل از این فرضیه پشتیبانی می کند که کیفیت داده های VGI سطح ویژگی را می توان با استفاده از یک مدل اعتماد بر اساس منشأ داده ارزیابی کرد.

همه مشارکت‌های OSM را نمی‌توان به فعالیت اعضا تأیید کرد، اما ممکن است نتیجه واردات داده از ارائه‌دهندگان داده شخص ثالث باشد. یکی از نمونه‌های بارز چنین بارگذاری انبوه، واردات مجموعه داده‌های دولتی TIGER/Line ایالات متحده به OSM است. یک مطالعه طولی که تأثیر واردات مجموعه داده TIGER/Line 2005 را بر کیفیت داده OSM تجزیه و تحلیل کرد، نشان داد که بسیاری از خطاها با مجموعه داده‌های قدیمی و اشتباه جاده TIGER/Line 2005 برای ترافیک موتوری مرتبط است که تاکنون توسط جامعه اصلاح نشده است. 39]. برخلاف این، سهم قابل توجهی در داده های شبکه مربوط به عابر پیاده در OSM در مقایسه با داده های TIGER/Line وارد شده اولیه مشاهده می شود. در مطالعه دیگری برای فلوریدا مشخص شد که نقاط مورد علاقه (POI) که از پایگاه داده سیستم اطلاعات نام‌های جغرافیایی (GNIS) به OSM وارد شده بودند، متعاقباً توسط جامعه OSM به‌روزرسانی شدند [ 40 ].

الگوی مشارکت جامعه OSM تا حد زیادی بین شهرهای مختلف جهان متفاوت است [ 19 ]. برخی از این شهرها برای بهبود کیفیت داده ها در مناطق منتخب از طریق گردهمایی داوطلبان، بر مفهوم به اصطلاح احزاب نقشه برداری تکیه می کنند [ 41 ]. با این حال، اگرچه شهرهای اروپایی تمایل دارند از طریق مقادیر بیشتری از داده‌های VGI از تعداد بیشتری از مشارکت‌کنندگان نقشه‌برداری شوند، همچنین نشان داده شد که شهرهای خاصی مانند استانبول، به شدت به داده‌های اعضای خارجی که حوزه فعالیت اصلی آنها نزدیک نیست، متکی هستند. به شهر [ 19]. برای آن مطالعه، ناحیه اصلی هر مشارکت‌کننده از طریق مثلث‌سازی Delaunay برای همه گره‌های ایجاد شده توسط یک عضو منفرد، یا نقاط مرکزی مجموعه‌های تغییرات، به ترتیب تعیین شد، که متعاقباً تمام یال‌های مثلث و نقاط آنها حذف می‌شوند، اگر طول یال‌ها باشد. بیش از 1 کیلومتر [ 17 ]. یک توسعه برای این رویکرد این است که فقط شبکه مثلثی را که بیشترین تعداد مرکز تغییرات را در بر می گیرد به عنوان یک منطقه خانه واحد در صورت وجود چندین نمودار قطع شده، حفظ می کند. این رویکرد در http://hdyc.neis-one.org پیاده سازی شد . در مطالعه ما، ما مناطق اصلی حاصل از آن وب سایت را با چند ضلعی های منطقه اصلی شناسایی شده در رویکرد ترسیم منطقه دو لایه پیشنهادی مقایسه می کنیم.

3. تعیین منطقه ای اطلاعات مشارکت کننده OSM

3.1. آماده سازی داده ها و انتخاب مشارکت کننده

از آگوست 2014، پروژه OSM دارای بیش از 1.7 میلیون عضو ثبت شده است که تنها درصد کمی به طور منظم در مجموعه داده مشارکت فعال دارند [ 17 ]]. برای آزمایش رویکرد پیشنهادی برای ترسیم منطقه داخلی و خارجی، ما 13 عضو OSM بسیار فعال را انتخاب کردیم که نشان دهنده حجم نمونه کافی برای انجام یک تحلیل کیفی و امکان ارزیابی امکان‌سنجی روش پیشنهادی است. هر یک از اعضای منتخب اطلاعاتی را در سه یا چند کشور جمع آوری کردند و بیش از 50 درصد از روزهایی که از زمان ثبت نام خود در پروژه می گذرد، به طور فعال در پروژه مشارکت داشته اند. علاوه بر این، برای حذف کاربرانی که ویرایش‌هایی از ربات‌ها، اسکریپت‌های خودکار یا واردات داشتند، تعداد گره‌های ایجاد شده و اصلاح‌شده را با تعداد مجموعه‌های تغییرات برای هر عضو باقی‌مانده مقایسه کردیم و مشارکت‌کنندگانی را که تعداد گره‌های مشارکت‌شده یا تغییر یافته در هر مجموعه تغییرات بیش از یک تغییر است، حذف کردیم. ارزش 4000 که برای ویرایش دستی غیر منطقی به نظر می رسید. مجموعه تغییرات تمام تغییرات داده‌ها را که توسط یک مشارکت‌کننده در طول یک جلسه انجام می‌شود را ذخیره می‌کند و وسعت آن شامل تمام تغییرات ایجاد شده در پایگاه داده OSM در آن جلسه خاص است. از این فهرست 141 کاربر، 13 نفر به طور تصادفی انتخاب شدند و داده های مشارکت آنها برای تجزیه و تحلیل بیشتر مورد استفاده قرار گرفت. ما تعداد کاربران تجزیه و تحلیل شده را به 13 محدود کردیم زیرا تمرکز این مطالعه تعیین امکان‌سنجی روش خوشه‌ای پیشنهادی بود، که نیازمند آزمایش رویکردهای مختلف خوشه‌ای و مراحل ارزیابی دستی بود. بنابراین، این مطالعه ماهیت اکتشافی دارد و روشی که نتایج اولیه آن برای 13 کاربر منتخب تجزیه و تحلیل می‌شود، می‌تواند در آینده برای تجزیه و تحلیل کمی دقیق‌تر خودکار شود. ما تعداد کاربران تجزیه و تحلیل شده را به 13 محدود کردیم زیرا تمرکز این مطالعه تعیین امکان‌سنجی روش خوشه‌ای پیشنهادی بود، که نیازمند آزمایش رویکردهای مختلف خوشه‌ای و مراحل ارزیابی دستی بود. بنابراین، این مطالعه ماهیت اکتشافی دارد و روشی که نتایج اولیه آن برای 13 کاربر منتخب تجزیه و تحلیل می‌شود، می‌تواند در آینده برای تجزیه و تحلیل کمی دقیق‌تر خودکار شود. ما تعداد کاربران تجزیه و تحلیل شده را به 13 محدود کردیم زیرا تمرکز این مطالعه تعیین امکان‌سنجی روش خوشه‌ای پیشنهادی بود، که نیازمند آزمایش رویکردهای مختلف خوشه‌ای و مراحل ارزیابی دستی بود. بنابراین، این مطالعه ماهیت اکتشافی دارد و روشی که نتایج اولیه آن برای 13 کاربر منتخب تجزیه و تحلیل می‌شود، می‌تواند در آینده برای تجزیه و تحلیل کمی دقیق‌تر خودکار شود.جدول 1 تلاش‌های جمع‌آوری داده‌ها را برای 13 مشارکت‌کننده منتخب که از فایل رونوشت تاریخچه کامل OSM در تاریخ 2 اوت 2013 استخراج شده‌اند، خلاصه می‌کند.

جدول 1. مشارکت کنندگان منتخب OpenStreetMaps (OSM) با آمار فعالیت آنها.

پس از پردازش فایل dump تاریخچه کامل، داده ها برای تجزیه و تحلیل بیشتر به عنوان جدولی که شامل تمام ویژگی ها با نسخه های آنها است، به پایگاه داده PostgreSQL وارد شد. شکل 1گردش کار پردازش داده، ترسیم منطقه ای و تجزیه و تحلیل خوشه سلسله مراتبی پروفایل های ویرایش را به دنبال انتخاب 13 مشارکت کننده فعال OSM و وارد کردن داده های خام OSM به پایگاه داده نشان می دهد. یک ابزار جاوا برای استخراج عملیات روی ویژگی های نقطه یا خط برای هر مشارکت کننده انتخاب شده استفاده شد. برای این منظور، تمام نسخه‌های مجاور هر ویژگی ایجاد شده توسط هر یک از اعضای OSM با توجه به هر نوع ویرایش بین آنها مقایسه و ارزیابی شدند. سپس ویرایش‌های داده‌های انجام‌شده توسط مشارکت‌کننده مورد علاقه به‌عنوان تعدادی عملیات برای هر ویژگی خلاصه شد. در کدگذاری OSM، ویژگی ها (گره ها، راه ها و روابط) از طریق برچسب ها توصیف می شوند. هر تگ از یک کلید و یک مقدار تشکیل شده و به صورت key = value نوشته می شود. یک کلید به طور کلی یک عنصر (به عنوان مثال، یک بزرگراه) یا ویژگی مرتبط با یک عنصر (مانند محدودیت سرعت) را توصیف می کند. و مقدار به طور خاص کلید همراه آن را توصیف می کند. OSM در مجموع از 26 کلید ویژگی اصلی پیشنهادی از جمله ساختمان، بزرگراه یا کاربری زمین استفاده می کند.

اولین مجموعه عملیاتی که برای ترسیم منطقه در نظر گرفته شد شامل کارهای ویرایشی رایج برای گره ها و راه ها می شود، مانند افزودن یک جفت کلید-مقدار اولیه به یک نقطه (مثلاً راحتی = مدرسه) یا افزودن یک گره به ویژگی راه. این مجموعه از عملیات از این پس به عنوان ویرایش های اصلی نامیده می شود. جدول 2 لیستی از عملیات برای گره ها و راه ها برای ویرایش های اصلی در نظر گرفته شده است. سه عملیات اول (خط اول) به ویرایش کلیدها یا مقادیر روی هر تگ (به جز کلید اصلی یا ارزش یا برچسب منبع) اشاره دارد و سه عملیات بعدی فقط به عملیات روی برچسب های کلید-مقدار اولیه اشاره دارد. به دنبال آن دو عملیات هندسه و عملیات خاص دو طرفه انجام می شود.

شکل 1. نمودار جریان تجزیه و تحلیل داده ها.

داده ها همچنین به طور خاص برای عملیات بر روی ویژگی های ویژگی که احتمالاً به دانش محلی نیاز دارند و نمی توانند بر اساس اطلاعات تصاویر هوایی انجام شوند، مورد بررسی قرار گرفتند. اگرچه برخی از این اطلاعات، مانند نام خیابان و آدرس را می توان از منابع جایگزین جستجو کرد، ما معتقدیم که اکثر مشارکت کنندگان داده OSM متعهد به جمع آوری داده ها به تنهایی و ارائه اطلاعات دست اول به پروژه OSM هستند. ویژگی های ویژگی مورد بررسی در قسمت پایین جدول 2 فهرست شده است. برخی از این ویژگی‌ها دارای یک کلید متناظر در مستندات ویژگی OSM مانند نام یا سطح هستند، در حالی که سایر ویژگی‌ها در جدول چندین تگ OSM را به طور همزمان برای مقایسه و تشخیص تغییر در ویژگی‌ها در نظر می‌گیرند. به عنوان مثال، محدودیت‌های کلی برای یک جاده (آخرین ردیف در جدول 2 ) شامل کلیدهای حداکثر (حداکثر ارتفاع)، حداکثر سرعت (حداکثر سرعت)، یا حداکثر عرض (حداکثر عرض) است. تغییر در هر یک از این مقادیر به‌عنوان به‌روزرسانی برای این ویژگی محسوب می‌شود.

جدول 2. عملیات در نظر گرفته شده برای شناسایی خانه و منطقه خارجی.

برای حذف ویرایش‌های جزئی در اطلاعات ارزش ویژگی از شمارش، مانند تغییر حروف بزرگ در نام خیابان بین دو نسخه از یک ویژگی (که نیازی به دانش محلی ندارد)، فقط تغییرات ویژگی در نظر گرفته شد که فاصله لونشتاین بزرگ‌تر از سه بین آن‌ها تشخیص داده شد. هر دو مقادیر رشته ای یک ویژگی را با هم مقایسه کردند.

3.2. خوشه بندی مرحله 1: ترسیم فضایی مناطق فعالیت از طریق خوشه بندی k-Means

ایده اساسی رویکرد ترسیم منطقه ای پیشنهادی برای منطقه داخلی و خارجی این است که الگوهای ویرایش یک مشارکت کننده فردی بین این مناطق متفاوت است، جایی که الگوهای ویرایش را می توان به طور جداگانه برای ویژگی های گره یا راه تجزیه و تحلیل کرد. ویرایش های یک ویژگی می تواند در امتداد هر یک از عملیات فهرست شده در جدول 2 رخ دهد و برای ویژگی به عنوان یک بردار n بعدی حاوی مقادیر 0 و 1 ذخیره شود، جایی که n تعداد عملیات در نظر گرفته شده است. به طور مشابه، می‌توان تحلیل کرد که کدام کلیدها یا جفت‌های کلید-مقدار ویژگی‌های ویرایش‌شده تحت تأثیر ویرایش‌ها قرار می‌گیرند. بنابراین، بردار n بعدی را می‌توان با تعداد دسته‌های کلیدی یا ارزشی در صورت در نظر گرفتن افزایش داد. چنین بردار نمایانگر یک نمایه ویرایش برای یک ویژگی فردی است.

ما انتظار داریم که خوشه‌بندی ویژگی‌ها بر اساس نمایه‌های ویرایش مرتبط، جدایی بین ویژگی‌های واقع در خانه و منطقه خارجی را آشکار کند. اگرچه برخی از ویرایش‌ها عمدتاً در مناطق اصلی یافت می‌شوند، مانند افزودن برچسب محدودیت سرعت به یک جاده، این تعداد ویرایش در مقایسه با همه ویرایش‌هایی که در هر منطقه انجام می‌شود، کم خواهد بود. بنابراین، همانطور که برخی آزمایش‌ها با مجموعه داده‌های موجود نشان دادند، خوشه‌بندی در سطح ویژگی اعمال شد، به عنوان مثال، با استفاده از الگوریتم خوشه‌بندی TwoStep [ 42]، منجر به الگوهای متمایز بین مناطق نشد، بلکه ظاهری درهم از مناطق داخلی و خارجی داشت. گرفتن ویژگی‌های ویرایش‌های ویژگی در مناطق از پیش تعریف‌شده از طریق خلاصه کردن ویرایش‌های مربوط به ویژگی‌ها در این مناطق (مرحله اول)، که نمایه ویرایش انبوهی را برای هر منطقه ارائه می‌دهد، آموزنده‌تر است. در مرحله بعد، می توان مناطق از پیش تعریف شده را بر اساس شباهت بین نمایه های ویرایش انبوه تنها با استفاده از ویژگی های غیر مکانی (مرحله دوم) خوشه بندی کرد. بنابراین، اولین مرحله شامل خوشه‌بندی فضایی گره‌های ویرایش شده (به ترتیب یا نقاط میانی ویژگی‌های راه) با استفاده از مختصات شرقی و شمالی ویژگی‌ها است. اگرچه روش‌های خوشه‌بندی پیشرفته‌تری مانند خوشه‌بندی طیفی وجود دارد، اما ما از خوشه‌بندی k-means استفاده کردیم که روش پیشنهادی را به طور گسترده‌تری قابل اجرا می‌کند. همچنین،این نباید برای این نوع تجزیه و تحلیل هنگام انتخاب k به اندازه کافی بزرگ برای پوشش مناطق با اندازه شهر یا کوچکتر مشکلی ایجاد کند، زیرا می توان انتظار داشت که مناطق خانگی که معمولاً در مناطق شهری یافت می شوند دارای شکل محدب باشند. یعنی حتی اگر یک مشارکت‌کننده داده فعالیت‌های روزانه را در مکان‌های مختلف یک شهر انجام دهد، به عنوان مثال، خانه، محل کار، خرید یا اوقات فراغت، و داده‌های مرتبط با این مکان‌ها را جمع‌آوری کند، مناطق نقشه‌برداری شده را می‌توان از طریق یک چندضلعی محدب محدود کرد.

برای آماده سازی داده ها، هندسه خط راه ها با نقاط میانی آنها جایگزین شد. علاوه بر این، هر ویژگی فقط یک بار نقشه برداری شد، حتی اگر چندین نسخه در فایل dump تاریخ داشته باشد. ما مقادیر k متفاوتی (به عنوان مثال ، خوشه‌های فضایی) را برای گره‌ها و روش‌های هر یک از 13 مشارکت‌کننده امتحان کردیم، و با k-مقدارهای نسبتاً کوچک (در محدوده 5 تا 10) شروع کردیم که به نظر می‌رسید به صورت بصری یک گروه‌بندی فضایی معنادار ارائه می‌کرد. از گره ها بعداً، در ترکیب با مرحله 2 از رویکرد خوشه‌بندی، ما مقادیر k را افزایش دادیم تا بتوانیم ترسیم فضایی دقیق‌تری از منطقه اصلی به دست آوریم. شکل 2 مناطق ایجاد شده از طریق خوشه بندی k-means در گره های (a) و نقاط میانی راه (b) را برای یکی از 13 مشارکت کننده انتخاب شده نشان می دهد.

شکل 2. خوشه‌های k-means برای ( a ) گره‌ها (5 گروه) و ( b ) راه‌ها (هفت گروه – فقط پنج گروه در وسعت قابل مشاهده نشان داده شده‌اند) برای یک مشارکت‌کننده انتخاب‌شده OSM ایجاد شده است.

خلاصه کردن تعداد ویرایش برای هر خوشه k-means یک کاربر به k بردار نمایه ویرایش انبوه می دهد، به عنوان مثال ، یک نمایه برای هر ناحیه از پیش تعریف شده. بنابراین، هر بردار نمایه تجمیع شده یک ردیف با n ستون است که n تعداد عملیات، کلید و دسته‌های کلید-مقدار مورد بررسی است. مقادیر عددی در یک ردیف به‌عنوان تعداد کل ویرایش‌ها برای خوشه‌ای که در دسته ویرایش مورد بررسی قرار می‌گیرد، محاسبه شد و به دنبال آن بر تعداد ردیف‌های ویرایش در آن خوشه k-means تقسیم شد. این برای همه گروه‌های k تکرار شد تا ماتریسی از بردارهای نمایه جمع‌آوری شود. جدول 3بخشی از چنین ماتریسی از ویرایش گره ها را برای یک مشارکت کننده OSM نشان می دهد. در این مثال، ترسیم فضایی به پنج گروه k-means منجر شد. مقدار 0.012، به عنوان مثال، در ردیف اول در زیر ستون «AddTag» یافت می‌شود، نشان می‌دهد که در خوشه k-means #1، 1.2 درصد از ویرایش‌ها شامل افزودن یک برچسب کلید غیراصولی است.

جدول 3. نمونه ویرایش نمایه برای یک مشارکت کننده انتخاب شده.

3.3. مرحله 2 خوشه بندی: شناسایی منطقه داخلی و خارجی از طریق خوشه بندی سلسله مراتبی پروفایل های ویرایش مبتنی بر منطقه

سپس، یک تحلیل خوشه‌ای سلسله مراتبی برای k خوشه‌ها (مورد نامیده می‌شود) با نمایه‌های ویرایش انبوه آن‌ها اعمال شد، جایی که انتظار می‌رود دو خوشه آخر در جدول تجمع، منطقه اصلی (در حالت ایده‌آل شامل تنها یک مورد) و خارجی را نشان دهند. منطقه (خوشه با موارد باقیمانده). ما زیر مجموعه های مختلف عملیات را آزمایش کردیم ( جدول 2 را ببینید) و اطلاعات کلید-مقدار برای استفاده به عنوان اطلاعات در نمایه های ویرایش انبوه در فرآیند خوشه بندی سلسله مراتبی، که (1) ویرایش های اصلی هستند. (2) کلیدها؛ (3) جفت کلید-مقدار. (4) تغییرات ویژگی. و (5) ترکیبی از این اطلاعات. در حالی که تغییرات ویژگی منجر به یک الگوی خوشه‌ای بهم ریخته از مناطق از پیش تعریف شده با توجه به جداسازی منطقه داخلی و خارجی شد، روش‌های (1) تا (3) و ترکیب آنها به طور کلی نتایج بهتری ارائه کردند که بیشتر آنها با موارد قبلی همسو بودند. رویکردهای ترسیم منطقه خانه [ 17 ]. چندین روش خوشه‌بندی سلسله مراتبی مانند روش وارد یا میانگین پیوند بین گروه‌ها به کار گرفته شد، اما هیچ تأثیری بر ترتیب خوشه‌بندی در برنامه تجمع مشاهده نشد.

شکل 3 خوشه‌های نقطه‌ای و دندروگرام‌ها را در نتیجه فرآیند خوشه‌بندی سلسله مراتبی ویرایش‌های گره برای یک مشارکت‌کننده انتخاب شده، با استفاده از ویرایش‌های اصلی (a)، کلیدهای (b) و جفت‌های کلید-مقدار (c) نشان می‌دهد. ما آن موارد از دندروگرام را به عنوان منطقه اصلی در نظر گرفتیم که بخشی از دو خوشه نهایی در برنامه تجمع و در خوشه حاوی تعداد کمتری از موارد بودند. در این مثال، اطلاعات ویرایش اصلی دو خوشه کوچکتر را به عنوان مناطق اصلی شناسایی کرد که شامل یک خوشه تا حدی پراکنده در شرق اتریش است ( شکل 3).الف) (خوشه شماره 3، 8 امتیاز) و یکی در ایالات متحده (خوشه شماره 6، 1 امتیاز). بعید به نظر می رسید که این یک منطقه خانگی باشد هم بر اساس فاصله فضایی بین دو خوشه و هم به دلیل تعداد کم گره ها در هر دو خوشه. این مثال یک محدودیت در رویکرد خوشه‌بندی پیشنهادی را نشان می‌دهد، که این است که گروه‌های k-means متشکل از اعداد بسیار کوچک ممکن است به دلیل چند ویرایش که در فرآیند خوشه سلسله مراتبی به عنوان منطقه اصلی شناسایی می‌شوند، نمایه مجزایی داشته باشند. بنابراین، قبل از تجزیه و تحلیل خوشه سلسله مراتبی، باید حداقل تعداد نقاط را در هر ناحیه k-means نگه داشت.

شکل 3. نتایج تجزیه و تحلیل خوشه سلسله مراتبی با استفاده از ویرایش های اصلی ( a ) (فقط خوشه شماره 3 نشان داده شده در وسعت قابل مشاهده)، کلید ( b ) و اطلاعات کلید-مقدار ( c ) گره های ویرایش شده.

روش دیگر برای جلوگیری از این مشکل، حذف نقاط جدا شده از نظر فضایی قبل از تجزیه و تحلیل خوشه‌ای است، زیرا یک منطقه خانگی از بیش از چند نقطه تشکیل شده است.

اطلاعات کلیدی ویژگی های ویرایش شده به ترسیم دو خوشه از پیش تعریف شده در منطقه بزرگ کوفشتاین (اتریش) ( شکل 3 ب) به عنوان منطقه اصلی (خوشه شماره 2 و 7) کمک کرد. سپس، با استفاده از ترکیب کلید-مقدار به عنوان ویژگی در فرآیند خوشه‌بندی سلسله مراتبی، منطقه خانه بالقوه تنها به یک منطقه، یعنی نزدیکی کوفشتاین (خوشه شماره 2 در شکل 3 ج) محدود می‌شود.

جدول 4 توضیح می دهد که در نتیجه خوشه بندی سلسله مراتبی اعمال شده برای ویرایش گره ها و نقاط میانی راه، چند مورد ( یعنی مناطق k-means از پیش تعریف شده) بخشی از کوچکتر از دو خوشه نهایی در دندروگرام ها (نشان دهنده منطقه اصلی) هستند. . خط تیره (-) نشان می دهد که هیچ منطقه خانگی قابل قبولی را نمی توان بر اساس فرآیند خوشه سلسله مراتبی شناسایی کرد، که یا مناطق قطع شده یا مناطق دورافتاده با تنها چند نقطه بودند. نمونه ای که هر دو این اثرات را نشان می دهد در شکل 3 ارائه شده استآ. اگر فقط به دلیل چند نقطه مجزا ایجاد نشود، مناطق جدا شده که به عنوان موارد در خوشه نهایی ظاهر می شوند به طور کلی نشان می دهد که هیچ منطقه جغرافیایی واحدی وجود ندارد بلکه کاربر در حال سفر است و ویرایش های داده و مشارکت های مشابهی را در بخش های مختلف مناطق نقشه برداری انجام می دهد. . برای مثال، اگر کاربر پس از پیوستن به جامعه OSM جابه‌جا شود و به مشارکت و ویرایش داده‌ها ادامه دهد، ممکن است چنین وضعیتی رخ دهد. با این حال، در جدول 4 ، مناطق قطع شده در ستون‌های ویرایش‌های اصلی و کلیدها زمانی که به‌عنوان یک خط تیره علامت‌گذاری شده‌اند، نتیجه اطلاعات ناکافی برای ترسیم یک خوشه فعالیت اولیه، هم برای گره‌ها و هم برای راه‌ها، بر خلاف نتایج خوشه‌بندی به‌دست‌آمده از در نظر گرفتن کلیدها یا ستون های کلید-مقدار.

جدول 4. تعداد گروه های خوشه ای k-means شناسایی شده در مناطق اصلی.

نتایج حاصل از 13 مشارکت‌کننده آزمایش‌شده همچنین نشان داد که ویرایش‌های اصلی گره‌ها اطلاعات بیشتری را برای تمایز بین مناطق داخلی و خارجی نسبت به روش‌ها دارند، در حالی که این تفاوت در هنگام استفاده از کلیدها یا کلید-مقدارها قابل مشاهده نیست.

4. ارزیابی

4.1. مقایسه روش های خوشه ای

از آنجایی که هنگام ثبت نام برای یک حساب کاربری OSM نیازی به ارائه منطقه خانه نیست، هیچ مجموعه داده مرجعی در دسترس نیست که منطقه خانه خود تعریف شده توسط مشارکت کننده را فراهم کند. بنابراین، رویکرد ترسیم منطقه ای ارائه شده با مقایسه وسعت مناطق خانه شناسایی شده با مناطق استخراج شده از روش معرفی شده قبلی بر اساس مثلث سازی دلونی که از مرکز همه تغییرات ایجاد شده توسط مشارکت کننده مورد بررسی استفاده می کند، ارزیابی شد [ 17 ].

شکل 4. نتایج روش دو سطحی k-means/ خوشه بندی سلسله مراتبی و روش مثلث بندی Delaunay برای دو مشارکت کننده انتخاب شده OSM که همپوشانی بزرگ ( a ) و تفاوت های واضح ( b ) بین نتایج هر دو روش را نشان می دهد.

علاوه بر این، با تمام 13 مشارکت کننده به صورت جداگانه از طریق سیستم پیام OSM تماس گرفته شد که به اعضای OSM اجازه می دهد تا زمانی که هر دو شرکت کننده در پروژه ثبت نام کرده اند، پیام تبادل کنند. از مشارکت کنندگان خواسته شد تا منطقه اصلی را که با «چگونه در OpenStreetMap مشارکت کردید؟» تجسم شده را تأیید یا رد کنند. وب سایت ( http://hdyc.neis-one.org/ )، که از روش مثلث سازی Delaunay ذکر شده برای تعیین منطقه اصلی یک مشارکت کننده استفاده می کند. هفت نفر از 13 مشارکت کننده به پیام ارسال شده اولیه پاسخ دادند و شرحی از منطقه اصلی خود ارائه کردند.

شکل 4 نتایج ترسیم هر دو روش را برای دو نفر از 13 عضو OSM انتخاب شده پوشش می دهد. ابرهای نقطه، ویژگی‌ها (گره‌ها یا نقاط میانی راه) را در منطقه محلی نشان می‌دهند که از طریق رویکرد خوشه‌بندی سلسله مراتبی با استفاده از اطلاعات کلید-مقدار شناسایی شده‌اند. چند ضلعی های با طرح کلی مشکی، ناحیه فعالیت خانه را نشان می دهد که از مثلث سازی دلونای حاصل می شود. شکل 4a موردی را نشان می دهد که در آن دو روش منجر به یک منطقه اصلی یکسان می شوند (براونشوایگ، آلمان). با این حال، رویکرد خوشه‌بندی 2 لایه، به دلیل مناطق k-means از پیش تعریف‌شده بزرگ‌تر، منطقه بزرگ‌تری را پوشش می‌دهد. این مثال همچنین تطابق خوبی بین مناطق اصلی بر اساس ویرایش‌های گره (سبز) و روش (زرد) در رویکرد خوشه‌بندی 2 لایه نشان می‌دهد. دندروگرام سمت راست برای خوشه های گره نشان داده شده است، و نقاط خوشه شماره 1 به سمت چپ نگاشت می شوند. شکل 4b نشان می‌دهد که چگونه استفاده از اطلاعات کلید-مقدار می‌تواند به تعیین یک منطقه خانه تصفیه‌شده‌تر در مقایسه با مثلث Delaunay در برخی موارد کمک کند. در حالی که چند ضلعی مثلثی ناحیه‌ای را پوشش می‌دهد که تقریباً با لوکزامبورگ یکسان است، ابر نقطه‌ای برای گره‌ها نشان‌دهنده منطقه کوچک‌تر اصلی مشارکت‌کننده در منطقه جنوب غربی لوکزامبورگ است که کمی به بلژیک و فرانسه می‌رسد. منطقه اخیر بیشتر با آنچه که مشارکت کننده این منطقه به عنوان یکی از مناطق اصلی نقشه برداری خود در پاسخ خود تعریف کرده بود، مطابقت داشت.

4.2. حساسیت طبقه بندی

یک همپوشانی فضایی کامل بین روش خوشه‌ای دو لایه و روش مثلث‌بندی به دلیل انتخاب دلخواه مناطق خوشه‌ای k-means در مرحله اول، که وضوح فضایی مرحله خوشه‌بندی سلسله مراتبی را تعیین می‌کند، به دست نمی‌آید. به عنوان مثال، در شکل 5 a، خوشه اصلی شناسایی شده برای گره ها (سبز) بر اساس یک مقدار k پایین 9، وین (اتریش) و اطراف آن (خوشه شماره 4) را پوشش می دهد، در حالی که شکل 5 b با یک مقدار k بزرگتر از 30 منطقه اصلی را به چند منطقه شهری محدود می کند (خوشه شماره 27)، با اطلاعات ارائه شده توسط مشارکت کننده در طول تبادل ایمیل بیشتر مطابقت دارد.

در حالی که هر دو دندروگرام در این مورد خاص یک الگوی متمایز را با یک خوشه منفرد به عنوان منطقه اصلی نشان می‌دهند، انتخاب عدد خوشه k-means باید دو هدف متضاد را متعادل کند، که هدف آن تفکیک فضایی بالای منطقه خانه است (به عنوان مثال ، یک k-value بالا)، در حالی که در همان زمان یک نمایه ویرایش انبوه نماینده برای هر خوشه k-means برای خوشه‌بندی سلسله مراتبی موفق پس از آن به دست می‌آید ( به عنوان مثال ، با انتخاب یک مقدار k نسبتاً کم از خوشه‌هایی که حاوی نقاط بسیار کمی هستند اجتناب کنید).

برخی از مشارکت‌کنندگان OSM تلاش‌های جمع‌آوری داده‌های دقیق خود را به یک منطقه محدود نمی‌کنند، در این صورت مشخص‌کردن منطقه‌ای یک منطقه خانگی مشکل‌ساز است. شکل 6 b,c برای عضو OSM 11 ( جدول 4 را مقایسه کنید ) نشان می دهد که چگونه ناحیه اصلی هنگام افزایش مقدار k تغییر می کند. با استفاده از k = 6، دندروگرام ( شکل 6 ب) نشان می دهد که منطقه بزرگتر سنت پترزبورگ (روسیه) (خوشه شماره 4) منطقه اصلی مشارکت کننده را نشان می دهد ( شکل 6 a، نقاط سبز). پس از افزایش مقدار k به 50 برای شناسایی یک منطقه کوچکتر و متمایزتر از خانه، منطقه شناسایی شده به قسمت شرقی قبرس تغییر می کند ( شکل 6 د)، مطابق با مورد #45 در دندروگرام ( شکل 6).ج). دندروگرام بریده شده 13 خوشه از 50 خوشه را در پایان برنامه تجمع نشان می دهد که هشت تای آنها در منطقه سن پترزبورگ قرار دارند و به طور بالقوه می توانند در یک منطقه خانگی بزرگتر ادغام شوند. با این حال، 13 مورد آخر همچنین شامل خوشه هایی برای تنریف و مسکو، علاوه بر قبرس است، که هیچ منطقه جغرافیایی متمایز از محل زندگی خود را نشان نمی دهد.

شکل 5. بهبود ترسیم منطقه خانه از طریق افزایش مقدار k از 9 ( a ) به 30 ( b ).

شکل 6. ترسیم چندین منطقه خانه از طریق افزایش مقدار k.

نتایج به‌دست‌آمده توسط مشارکت‌کننده تأیید شد، او اظهار داشت که ترسیم یک منطقه خانه واحد در مورد خاص او مشکل‌ساز خواهد بود. سفرهای گسترده در سال‌های اخیر و تلاش‌های نقشه‌برداری دقیق مشابه در همه مناطق بازدید شده، تعیین یک منطقه خانگی را دشوار می‌کند. ما انتظار داریم نوع مشابهی از نتایج خوشه‌ای را نیز از مشارکت‌کنندگانی که به‌طور موقت کشور خود را ترک می‌کنند تا داده‌های OSM را در خارج از کشور جمع‌آوری کنند، به عنوان مثال، برای کار NGO یا برای تیم انسان‌دوستانه OpenStreetMap (HOT) [ 44 ]]، جایی که آن‌ها پس از آن به محلی‌های «عملی» تبدیل می‌شوند و رفتار نقشه‌برداری مشابهی را در منطقه قبلی خود نشان می‌دهند. سپس تجزیه و تحلیل خوشه‌بندی سلسله مراتبی، مناطق مختلف خانه را بر اساس مقدار k انتخاب شده نشان می‌دهد، که نشان می‌دهد هیچ منطقه خانه واحدی برای آن کاربر وجود ندارد.

بنابراین، در مقایسه با روش مثلث‌سازی Delaunay کاملاً مبتنی بر فضایی، ادغام ویرایش اطلاعات در ترکیب با خوشه‌بندی k-means ابزار اضافی برای درک اینکه آیا یک مشارکت‌کننده OSM دارای یک منطقه اصلی منسجم است یا یک منطقه فعالیت متشکل از بخش‌های جدا شده، فراهم می‌کند. به طور خاص، تغییر مقادیر k و بررسی بعدی ساختار دندروگرام حاصل می‌تواند به تمایز بین هر دو موقعیت کمک کند. به این معنا که اگر بین مناطقی که به‌عنوان مناطق اصلی شناسایی شده‌اند بر اساس یک مقدار k کوچک اما همچنین بر اساس یک مقدار بزرگ همپوشانی وجود داشته باشد، این نشان‌دهنده یک منطقه منفرد است. یک مثال وضعیتی است که در شکل 5 نشان داده شده است، جایی که منطقه اصلی از طریق یک مقدار k افزایش یافته 30 پالایش می شود و منطقه تصفیه شده هنوز در ناحیه درشت تر است که در ابتدا به عنوان منطقه اصلی با مقدار اولیه k پایین تر 9 شناسایی شده است. ما انتظار داریم این نوع الگوی ترسیم متوالی نیز برای کاربران وجود داشته باشد. که دارای منطقه منسجمی هستند اما در آن احزاب نقشه‌برداری که مشارکت‌کنندگان از خارج از کشور بر روی مناطق مورد توافق تمرکز می‌کنند و ویژگی‌های تصاویر ماهواره‌ای را دیجیتالی می‌کنند، مشارکت می‌کنند [ 45 ]. ویرایش‌های انجام‌شده در این مهمانی‌های نقشه‌برداری از ترکیبی مشابه با سایر مناطق خارجی که توسط کاربر نقشه‌برداری می‌شود، خواهد بود و بنابراین کاربران را «دفاکتو» محلی نمی‌کند.

بر خلاف این، مناطق جغرافیایی مجزا از فعالیت های نقشه برداری با مقادیر k تغییر یافته، همانطور که در رابطه با شکل 6 نشان داده شده است، نشان می دهد که هیچ منطقه خانه واحدی وجود ندارد. برای همین وضعیت، مثلث دلاوی سن پترزبورگ را به عنوان یک منطقه محلی گزارش می‌کند، که تنها تا حدی درست است زیرا سایر بخش‌ها نیز باید به عنوان مناطق اصلی در نظر گرفته شوند. این یکی از مزایای رویکرد خوشه‌بندی دو لایه پیشنهادی را نشان می‌دهد.

4.3. تنوع و فعالیت

پس از ترسیم منطقه ای از خانه و مناطق خارجی، آنالیز شد که چند نوع ویژگی مختلف ویرایش شده و در چند روز ویرایش در خانه و منطقه خارجی برای هر مشارکت کننده انجام شده است. تنوع بیشتر ویژگی ها به این معنی است که مشارکت کننده جزئیات بیشتری را برای یک حوزه خاص مورد علاقه جمع آوری می کند، که نشان دهنده دانش محلی است که بسیاری از علاقه مندان VGI آن را به عنوان یکی از مزایای اصلی پروژه OSM در نظر می گیرند. لازم به ذکر است که تنوع نوع ویژگی به طور مساوی بین مناطق مختلف جغرافیایی توزیع نشده است. به طور خاص، تنوع ویژگی ها، به عنوان مثال، اندازه گیری شده با انواع امکانات رفاهی، در محیط های شهری بزرگتر از مناطق روستایی کم جمعیت است. بدین ترتیب، یک مشارکت‌کننده OSM که تنوع بیشتری از ویژگی‌های نقشه‌برداری شده را در یک منطقه خانگی که در یک محیط شهری واقع شده است در مقایسه با مناطق خارجی که منحصراً در مناطق روستایی واقع شده‌اند، نشان‌دهنده جزئیات سطح بالاتری از تلاش جمع‌آوری داده‌ها در منطقه خانگی نیست، اما محصول توزیع طبیعی تنوع ویژگی. با این حال، هر یک از 13 نقشه نگار منتخب، از آنجایی که بسیار فعال بودند، داده ها را در چندین منطقه پرجمعیت مجزا ارائه کردند. بنابراین، تنوع بیشتری از ویژگی‌های نقشه‌برداری شده در منطقه اصلی (که معمولاً فقط یک شهر یا منطقه شهری را شامل می‌شود)، در واقع نشان‌دهنده تلاش نقشه‌برداری دقیق‌تر نسبت به مناطق خارجی است، که در موارد مورد تجزیه و تحلیل ما، مناطق شهری (سایر) را نیز شامل می‌شود. . از آنجایی که بسیار فعال بود، داده ها را در چندین منطقه پرجمعیت مجزا ارائه کرد. بنابراین، تنوع بیشتری از ویژگی‌های نقشه‌برداری شده در منطقه اصلی (که معمولاً فقط یک شهر یا منطقه شهری را شامل می‌شود)، در واقع نشان‌دهنده تلاش نقشه‌برداری دقیق‌تر نسبت به مناطق خارجی است، که در موارد مورد تجزیه و تحلیل ما، مناطق شهری (سایر) را نیز شامل می‌شود. . از آنجایی که بسیار فعال بود، داده ها را در چندین منطقه پرجمعیت مجزا ارائه کرد. بنابراین، تنوع بیشتری از ویژگی‌های نقشه‌برداری شده در منطقه اصلی (که معمولاً فقط یک شهر یا منطقه شهری را شامل می‌شود)، در واقع نشان‌دهنده تلاش نقشه‌برداری دقیق‌تر نسبت به مناطق خارجی است، که در موارد مورد تجزیه و تحلیل ما، مناطق شهری (سایر) را نیز شامل می‌شود. .

برای 12 تلاش موفقیت آمیز ترسیم منطقه بر اساس حاشیه نویسی های کلیدی-مقدار برای گره ها (مقایسه کنید جدول 4 )، تجزیه و تحلیل نشان داد که تقریباً در بین تمام مشارکت کنندگان، مناطق خانگی دارای تنوع بیشتری از ویژگی ها نسبت به مناطق خارجی بودند ( شکل 7 )، اگرچه وسعت فضایی مناطق خانگی کوچکتر از مناطق خارجی است. لازم به ذکر است که با افزایش مقدار k در داخل خوشه بندی k-means و در نتیجه منطقه خانگی کوچکتر در مقایسه با مناطق خارجی، می توان انتظار داشت که تنوع ویژگی برای منطقه اصلی کاهش یابد. بنابراین، نتایج در شکل 7با مقادیر k که برای نقشه‌نگارهای مختلف در این تحلیل انتخاب شده‌اند، ارتباط نزدیکی دارند. تنوع ویژگی های کوچکتر در مناطق خارجی را احتمالاً می توان به روش نقشه برداری نسبت داد، به عنوان مثال ، دیجیتالی کردن جاده ها، ساختمان ها، یا اطلاعات کاربری زمین از تصاویر ماهواره ای، که بیشتر برای مناطق دورافتاده یا مناطق ناشناخته برای مشارکت کننده استفاده می شود. یک آزمون رتبه‌بندی با جفت‌های همسان ویلکاکسون تأیید کرد که تعداد انواع ویژگی‌های نگاشت‌شده در مناطق اصلی به طور قابل‌توجهی بیشتر از آنهایی است که در مناطق خارجی نگاشت شده است (z = -2.045، p .= 0.019، 1 دنباله). علیرغم تنوع بیشتر ویژگی‌های آماری در مناطق خانگی نسبت به منطقه خارجی در میان مجموعه داده‌های تحلیل‌شده، نتایج برای پنج مشارکت‌کننده سمت راست تصویر کمتر واضح‌تری ارائه می‌دهد. نرخ‌های تنوع مشابه بین مناطق خانگی و خارجی را می‌توان با این واقعیت توضیح داد که برای این مشارکت‌کنندگان، مناطق خانگی شناسایی‌شده در محیط‌های شهری قرار داشتند، جایی که مناطق خارجی در مجاورت ویژگی‌های مشابهی را برای نقشه‌برداری ارائه می‌دهند. این نشان می‌دهد که روش خوشه‌ای ارائه‌شده در شناسایی مرزهای واضح مناطق خانگی که در داخل یک محیط شهری قرار دارند که در آن انتقال بین یک خانه و مناطق خارجی ممکن است تدریجی باشد، غیرقابل اعتماد است.

شکل 7. تنوع تلاش های نقشه برداری در مناطق داخلی و خارجی.

مشابه تنوع ویژگی‌ها، فرض می‌کنیم که منطقه با بیشترین تعداد روز اختصاص داده شده به فعالیت‌های نقشه‌برداری، منطقه اصلی مورد علاقه مشارکت‌کننده را در سطح زمانی مشخص می‌کند. برای تحلیل زمانی تلاش‌های نقشه‌برداری می‌توان یک الگوی مشابه را مشاهده کرد ( شکل 8 ). به استثنای دو مشارکت‌کننده، همه اعضای OSM روزهای بیشتری را به نقشه‌برداری ویژگی‌ها در منطقه خانگی خود نسبت به منطقه خارجی اختصاص دادند. یک آزمون رتبه‌بندی با جفت‌های همسان ویلکاکسون تأیید کرد که تعداد روزهای با فعالیت‌های نقشه‌برداری در مناطق خانگی به طور قابل‌توجهی بیشتر از مناطق خارجی بود (z = -1.961، p .= 0.025، 1 دنباله). دو مشارکت کننده که از این روند پیروی نکردند، به دلیل نزدیکی نزدیک به مناطق داخلی و خارجی، به عنوان مثال مرکز شهر وین (منطقه اصلی) و حومه وین (منطقه خارجی) مقدار قابل توجهی بالاتری را برای روزهای نقشه برداری در منطقه خارجی نشان دادند.

شکل 8. طیف زمانی تلاش های نقشه برداری در مناطق داخلی و خارجی.

تجزیه و تحلیل ارائه شده در رابطه با شکل 7 و شکل 8 نشان می دهد که چرا تعیین منطقه اصلی مشارکت کنندگان OSM مهم است: این نشان دهنده بهبود کیفیت داده در یک منطقه از طریق افزایش فعالیت (تعداد روزهای نقشه برداری) و تنوع بیشتر ویرایش های ویژگی است. توسط یک مشارکت کننده داده فردی کیفیت داده، البته، به تعداد مشارکت‌کنندگان داده‌های مختلف که در یک منطقه خانگی مشترک هستند نیز بستگی دارد. می‌توان انتظار داشت که تعداد بیشتری از مشارکت‌کنندگان در همان منطقه منجر به کیفیت داده‌های بهتری نسبت به این موضوع شود که فقط در مورد یک مشارکت‌کننده وجود دارد. این در مطالعه فعلی آزمایش نشده است، اما می تواند به عنوان بخشی از کار آینده در نظر گرفته شود.

5. خلاصه و نتیجه گیری

الگوهای مشارکت کننده OSM می تواند به طور قابل توجهی بین مناطق نقشه برداری شده یک مشارکت کننده متفاوت باشد. روش خوشه‌بندی دو لایه پیشنهاد شده در این مقاله از ویرایش اطلاعات اشیاء OSM برای ترسیم منطقه داخلی و خارجی یک مشارکت‌کننده استفاده می‌کند. این روش جایگزینی برای روش‌های ترسیم موجود ارائه می‌کند که یک منطقه خانگی را تنها بر اساس اطلاعات موقعیتی ویرایش‌های ویژگی شناسایی می‌کند و بینش بیشتری در مورد تمایز بین خوشه‌های منفرد در مقابل مناطق خانه پراکنده ارائه می‌کند.

تجزیه و تحلیل تنوع ویژگی‌های گره در مناطق خانگی و خارجی نشان داد که بیشتر مشارکت‌کنندگان تنوع بیشتری از ویژگی‌ها را در مناطق خانگی نسبت به مناطق خارجی ویرایش می‌کنند. این الگو از مفهوم دانش محلی پشتیبانی می کند که بسیاری ادعا می کنند یکی از مزایای اصلی پروژه های VGI، مانند OSM است. دانش محلی را می توان از حضور در محل به دست آورد که امکان جمع آوری اطلاعات دقیق تری را نسبت به نقشه برداری از تصاویر ماهواره ای فراهم می کند. به طور مشابه، تجزیه و تحلیل زمانی، با تمرکز بر تعداد روزهایی که یک مشارکت‌کننده به تلاش‌های نقشه‌برداری در هر منطقه اختصاص داده است، ارزش بیشتری را برای مناطق داخلی نسبت به مناطق خارجی برای تقریباً همه مشارکت‌کنندگان نشان داد.

در این مطالعه، تجزیه و تحلیل خوشه‌ای دو لایه پیشنهادی به صورت دستی بر روی مجموعه کوچکی از کاربران فعال برای ارزیابی پتانسیل، نقاط قوت و ضعف آن انجام شد. حجم نمونه 13 کاربر تجزیه و تحلیل شده به وضوح برای ارزیابی کمی تحلیل خوشه‌ای دو لایه پیشنهادی یا مقایسه کیفی بین هر دو روش خوشه‌ای مورد بحث بسیار کوچک است. بنابراین، یک کار آینده، خودکار کردن فرآیند خوشه‌بندی دو لایه است تا آن را برای مجموعه داده‌های کاربر بزرگ‌تر، شبیه به رویکرد مثلث‌سازی دلونای که در [ 17 ] استفاده می‌شود، قابل اجرا کند. این همچنین مستلزم تمایز خودکار بین یک خوشه منفرد در مقابل.منطقه خانه پراکنده، که در مطالعه ارائه شده با کاوش دستی دندروگرام ها و نقشه ها با تغییر k در گام خوشه ای k-means انجام شد. برای کار آینده، می‌توان رویکردهای خوشه‌ای مکانی-زمانی را به جای خوشه‌بندی k-means برای شناسایی مناطق نقشه‌برداری که از نظر مکانی و زمانی متفاوت هستند، در نظر گرفت و سپس می‌تواند برای خوشه‌بندی سلسله مراتبی استفاده شود. علاوه بر این، جابجایی بالقوه یک نقشه‌بردار و تغییر متناظر منطقه اصلی می‌تواند در آینده نزدیک با جزئیات بیشتری مورد بررسی قرار گیرد.

برای 13 کاربر تجزیه و تحلیل شده، مقایسه بین نتایج روش خوشه‌بندی دو لایه پیشنهادی و رویکرد مثلث‌سازی Delaunay که قبلاً معرفی شده بود، به طور کلی تطابق خوبی بین مناطق خانه شناسایی شده نشان داد. در حالی که روش مثلث‌سازی تنها از هندسه‌ها به عنوان منبع استفاده می‌کند، روش خوشه‌بندی به دلیل اطلاعات اضافی در نظر گرفته شده، مانند نوع ویرایش یا حاشیه‌نویسی‌های مقدار کلید، امکان تحلیل عمیق‌تر را فراهم می‌کند. در مواردی که خوشه‌های خانه k-means بیش از حد درشت هستند، نشان داده شد که یک مقدار k افزایش یافته می‌تواند به شناسایی منطقه اصلی کمک کند. با این حال، شناسایی مناطق اصلی هنوز هم برای مشارکت کنندگان با منطقه نقشه برداری مجزا که در آن تلاش های نقشه برداری دقیق انجام شده است، مانند در طول تعطیلات یا فعالیت های دیگر، مشکل ساز است. روش دو لایه پیشنهادی برای نقشه‌برداران فعال که در آن ویرایش‌های متعدد در نواحی مشخص شده فضایی نمایه‌های ویرایش مجزای مجزا ایجاد می‌کنند، به خوبی کار می‌کند. برخلاف این، ویرایش‌های بسیار کم یا مقادیر k بسیار بالا به ترتیب می‌توانند به طور تصادفی به نمایه‌های ویرایش مجزا منجر شوند، بنابراین منطقه اصلی اصلی مشارکت‌کننده را منعکس نمی‌کنند. با این حال، یک هدف تحقیقاتی باقی‌مانده برای آینده ارزیابی این است که آیا روش پیشنهادی برای نقشه‌برداران کمتر فعال نیز کار می‌کند یا خیر. بر اساس مثال‌های آزمایش‌شده، انتخاب یک مقدار k که منجر به اندازه‌های k-means خوشه‌ای می‌شود که تقریباً یک شهر یا برخی مناطق شهر را پوشش می‌دهد، به نظر می‌رسد نتایج معنی‌داری ارائه می‌دهد، بنابراین از مشکل اعداد بسیار کوچک در خوشه‌بندی نمایه جلوگیری می‌کند. همچنین می توان نتایج خوشه ای را از هر دو روش مقایسه کرد، به عنوان مثال، مثلث بندی Delaunay و روش خوشه دو لایه پیشنهادی، برای به دست آوردن اعتماد به نفس در تشخیص منطقه اصلی. هر دو روش به تشخیص خانه از مناطق مشارکت‌کننده خارجی کمک می‌کنند، که پایه‌ای را برای تحقیقات آینده ایجاد می‌کند که بر رابطه متقابل بین رفتار مشارکت‌کننده و ارزیابی کیفیت تمرکز دارد.

منابع

Goodchild، MF Citizens به عنوان حسگرهای داوطلبانه: زیرساخت داده های مکانی در دنیای وب 2.0. بین المللی جی. اسپات. زیرساخت داده Res. (IJSDIR) 2007 ، 2 ، 24-32. [ Google Scholar ]
ژیراردین، اف. بلات، جی. کالابرز، اف. Fiore، FD; راتی، سی. ردپای دیجیتال: کشف گردشگران با محتوای تولید شده توسط کاربر. محاسبات فراگیر 2008 ، 7 ، 36-43. [ Google Scholar ] [ CrossRef ]
آندرینکو، جی. آندرینکو، ن. باک، پ. کیسیلویچ، اس. کیم، دی. تجزیه و تحلیل داده‌های ارجاع‌شده به فضا و زمان مشارکت‌شده توسط جامعه (مثالی از عکس‌های فلیکر و پانورامیو). در مجموعه مقالات سمپوزیوم IEEE در علم و فناوری تجزیه و تحلیل بصری، آتلانتیک سیتی، نیوجرسی، ایالات متحده، 12 تا 13 اکتبر 2009. صص 213-214.
چن، ال. روی، A. تشخیص رویداد از داده های فلیکر از طریق تجزیه و تحلیل فضایی مبتنی بر موجک. در مجموعه مقالات هجدهمین کنفرانس ACM در مدیریت اطلاعات و دانش، هنگ کنگ، چین، 2 تا 6 نوامبر 2009. ACM: نیویورک، نیویورک، ایالات متحده آمریکا؛ صص 523-532.
شلیدر، سی. ماتیاس، سی. عکاسی از یک شهر: تحلیلی از مفاهیم مکان بر اساس انتخاب های فضایی. تف کردن شناخت. محاسبه کنید. 2009 ، 9 ، 212-228. [ Google Scholar ]
هولنشتاین، ال. Purves، RS کاوش مکان از طریق محتوای تولید شده توسط کاربر: استفاده از flickr برای توصیف هسته های شهر. جی. اسپات. Inf. علمی 2010 ، 1 ، 21-48. [ Google Scholar ]
آندرینکو، جی. آندرینکو، ن. بوش، اچ. ارتل، تی. فوکس، جی. یانکوفسکی، پ. تام، دی. الگوهای موضوعی در توییت‌های جغرافیایی ارجاع‌شده از طریق تحلیل بصری فضا-زمان. محاسبه کنید. علمی مهندس 2013 ، 15 ، 72-82. [ Google Scholar ] [ CrossRef ]
کروم، جی. کاروانا، آر. شمارش، S. یادگیری مکان های احتمالی. در مدل سازی کاربر، سازگاری و شخصی سازی ؛ Carberry, S., Weibelzahl, S., Micarelli, A., Semeraro, G., Eds. Springer: برلین، آلمان؛ صص 64-76.
لی، ی. شان، جی. درک الگوی مکانی-زمانی توییت ها. فتوگرام مهندس Remote Sens. 2013 ، 79 ، 769-773. [ Google Scholar ] [ CrossRef ]
کالینز، سی. حسن، س. Ukkusuri، SV یک معیار جدید رضایت سواره حمل و نقل: احساسات سوار که از داده های رسانه های اجتماعی آنلاین اندازه گیری می شود. J. Public Transp. 2013 ، 16 ، 21-45. [ Google Scholar ]
میچل، ال. فرانک، ام آر. هریس، KD; Dodds، PS; دانفورث، سی ام. PLoS One 2013 ، 8 ، e64417. [ Google Scholar ] [ CrossRef ] [ PubMed ]
نولاس، ا. اسکلاتو، اس. ماسکولو، سی. پونتیل، ام. مطالعه تجربی الگوهای فعالیت کاربر جغرافیایی در چهار مربع. در مجموعه مقالات پنجمین کنفرانس بین المللی AAAI در وبلاگ ها و رسانه های اجتماعی، منلو پارک، کالیفرنیا، ایالات متحده آمریکا، 19 تا 21 ژوئیه 2011; Adamic, L., Baeza-Yates, R., Counts, S., Eds.; مطبوعات AAAI: پالو آلتو، کالیفرنیا، ایالات متحده؛ صص 570-573.
مونی، پی. Corcoran, P. خصوصیات اشیاء به شدت ویرایش شده در OpenStreetMap. اینترنت آینده 2012 ، 4 ، 285-305. [ Google Scholar ] [ CrossRef ]
ارسنجانی، ج. بارون، سی. باکی‌الله، م. Helbich، M. ارزیابی کیفیت مشارکت کنندگان OpenStreetMap همراه با مشارکت آنها. در مجموعه مقالات AGILE 2013، لوون، بلژیک، 5 تا 9 اوت 2013.
هاکلی، م. بسیوکا، اس. آنتونیو، وی. Ather، A. برای نقشه برداری خوب یک منطقه به چند داوطلب نیاز است؟ اعتبار قانون لینوس برای اطلاعات جغرافیایی داوطلبانه کارتوگر. J. 2010 , 47 , 315-322. [ Google Scholar ] [ CrossRef ]
نیس، پ. زیلسترا، دی. Zipf، A. مقایسه مشارکت داوطلبانه اطلاعات جغرافیایی و توسعه جامعه برای مناطق منتخب جهان. اینترنت آینده 2013 ، 5 ، 282-300. [ Google Scholar ] [ CrossRef ]
نیس، پ. Zipf، A. تجزیه و تحلیل فعالیت مشارکت کننده یک پروژه داوطلبانه اطلاعات جغرافیایی – مورد OpenStreetMap. ISPRS Int. جی. ژئو. Inf. 2012 ، 1 ، 146-165. [ Google Scholar ] [ CrossRef ]
هیپک، سی. داده‌های جغرافیایی جمع‌سپاری. ISPRS J. Photogramm. Remote Sens. 2010 , 65 , 550-557. [ Google Scholar ] [ CrossRef ]
مونی، پی. Corcoran، P. تجزیه و تحلیل الگوهای تعامل و ویرایش مشترک در میان مشارکت کنندگان OpenStreetMap. ترانس. GIS 2013 ، 18 ، 633-659. [ Google Scholar ] [ CrossRef ]
گروچنیگ، اس. بروناور، آر. رهرل، ک. برآورد کامل بودن مجموعه داده های VGI با تجزیه و تحلیل فعالیت جامعه در طول دوره های زمانی. در اتصال اروپای دیجیتال از طریق مکان و مکان ؛ Huerta, J., Schade, S., Granell, C., Eds. Springer: برلین، آلمان، 2014; صص 3-18. [ Google Scholar ]
ررل، ک. گروچنیگ، اس. Hochmair، HH; لاتینگر، اس. استاینمن، آر. واگنر، الف. یک مدل مفهومی برای تحلیل الگوهای مشارکت در زمینه VGI. در حال پیشرفت در خدمات مبتنی بر مکان ; Krisp، JM، Ed. Springer: برلین، آلمان، 2013; صص 373-388. [ Google Scholar ]
Gröchenig، S. استفاده از الگوهای ویرایش مکانی و زمانی برای ارزیابی داده های نقشه خیابان باز. پایان نامه کارشناسی ارشد، دانشگاه علوم کاربردی کارینتیا، ویلاخ، کارینتیا، اتریش، 2012. [ Google Scholar ]
استاینمن، آر. بروناور، آر. گروچنیگ، اس. Rehrl، K. Wie aktiv sind freiwillige Mapper؟ Ein Vergleich der OpenStreetMap-Aktivitäten in den Jahren 2005–2012 در Beispiel der DACH-Region. در Angewandte Geoinformatik ; Strobl, J., Blaschke, T., Griesebner, G., Zagel, B., Eds. Wichmann: برلین، آلمان، 2013; صص 173-182. [ Google Scholar ]
استاینمن، آر. گروچنیگ، اس. ررل، ک. Brunauer, R. نمایه های مشارکت نقشه برداران داوطلب در OpenStreetMap. در کارگاه آموزشی مجموعه مقالات اقدام و تعامل در اطلاعات جغرافیایی داوطلبانه (ACTIVITY) در AGILE 2013، لوون، بلژیک، 14 مه 2013.
Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی مجموعه داده‌های OpenStreetMap و Ordnance Survey. محیط زیست طرح. B طرح. دس 2010 ، 37 ، 682-703. [ Google Scholar ]
زیلسترا، دی. Zipf، A. OpenStreetMap تحقیق کیفیت داده در آلمان. در مجموعه مقالات ششمین کنفرانس بین المللی علم اطلاعات جغرافیایی (GIScience)، زوریخ، سوئیس، 14 تا 17 سپتامبر 2010.
نیس، پ. زیلسترا، دی. Zipf، A. تکامل شبکه خیابانی نقشه‌های crowdsourced: OpenStreetMap در آلمان 2007-2011. اینترنت آینده 2012 ، 4 ، 1-21. [ Google Scholar ]
زیلسترا، دی. Hochmair، HH استفاده از داده‌های رایگان و اختصاصی برای مقایسه طول‌های کوتاه‌ترین مسیر برای مسیریابی مؤثر عابر پیاده در شبکه‌های خیابانی. ترانسپ Res. رکورد 2012 ، 2299 ، 41-47. [ Google Scholar ] [ CrossRef ]
زیلسترا، دی. Hochmair، HH مطالعه مقایسه ای دسترسی عابر پیاده به ایستگاه های حمل و نقل با استفاده از داده های شبکه رایگان و اختصاصی. ترانسپ Res. رکورد 2011 ، 2217 ، 145-152. [ Google Scholar ] [ CrossRef ]
Hochmair، HH; زیلسترا، دی. Neis، P. ارزیابی کامل بودن مسیر دوچرخه و ویژگی های خط تعیین شده در OpenStreetMap برای ایالات متحده. ترانس. GIS 2014 ، در دست چاپ. [ Google Scholar ]
Zook، MA; گراهام، ام. شلتون، تی. Gorman, S. داوطلبانه اطلاعات جغرافیایی و جمع سپاری امداد رسانی به بلایا: مطالعه موردی زلزله هائیتی. پزشکی جهانی سیاست سلامت 2010 ، 2 ، 7-33. [ Google Scholar ] [ CrossRef ]
پارکر، سی جی; می، ای جی. میچل، وی. نقش VGI و PGI در حمایت از فعالیت های فضای باز. Appl. ارگون. 2012 ، 44 ، 886-894. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
پارکر، سی جی; می، ای جی. میچل، وی. طراحی کاربر محور نئوجغرافی: تأثیر اطلاعات جغرافیایی داوطلبانه بر اعتماد نقشه های آنلاین “ماشاپ”. ارگونومی 2014 ، 57 ، 987-997. [ Google Scholar ] [ CrossRef ] [ PubMed ]
پارکر، سی جی; می، ای جی. میچل، وی. درک طراحی با VGI با استفاده از چارچوب ارتباط اطلاعات. ترانس. GIS 2012 ، 16 ، 545-560. [ Google Scholar ] [ CrossRef ]
گیرس، جی اف. Touya, G. ارزیابی کیفیت مجموعه داده OpenStreetMap فرانسه. ترانس. GIS 2010 ، 14 ، 435-459. [ Google Scholar ] [ CrossRef ]
مونی، پی. Corcoran, P. فرآیند حاشیه نویسی در OpenStreetMap. ترانس. GIS 2012 ، 16 ، 561-579. [ Google Scholar ] [ CrossRef ]
کسلر، سی. de Groot، R. Trust به عنوان یک معیار پراکسی برای کیفیت اطلاعات جغرافیایی داوطلبانه در مورد OpenStreetMap. در علم اطلاعات جغرافیایی در قلب اروپا ; Vandenbroucke, D., Bucher, B., Crompvoets, J., Eds. Springer: هایدلبرگ، آلمان، 2013; ص 21-37. [ Google Scholar ]
کسلر، سی. ترام، جی. Kauppinen، T. منشأ و اعتماد به اطلاعات جغرافیایی داوطلبانه: مورد OpenStreetMap. در مجموعه مقالات کنفرانس تئوری اطلاعات فضایی: COSIT’11، بلفاست، ME، ایالات متحده آمریکا، 12-16 سپتامبر 2011; صص 1-3.
زیلسترا، دی. Hochmair، HH; Neis، P. ارزیابی تأثیر واردات داده بر کامل بودن نقشه خیابان باز – مطالعه موردی ایالات متحده. ترانس. GIS 2013 ، 17 ، 315-334. [ Google Scholar ] [ CrossRef ]
Hochmair، HH; Zielstra، D. توسعه و کامل بودن نقاط مورد علاقه در مجموعه داده های رایگان و اختصاصی: مطالعه موردی فلوریدا. در مجموعه مقالات GI_Forum 2013، ایجاد GISociety، سالزبورگ، اتریش، 2 تا 5 ژوئیه 2013. Jekel, T., Car, A., Strobl, J., Griesebner, G., Eds. Wichmann: برلین، آلمان؛ صص 39-48.
پرکینز، سی. Dodge, M. پتانسیل نقشه برداری توسط کاربر: مطالعه موردی پروژه OpenStreetMap و حزب نقشه برداری Mapchester. جئوگر شمال غرب 2008 ، 8 ، 19-32. [ Google Scholar ]
باچر، جی. ونزیگ، ک. ووگلر، ام. خوشه دو استپ: یک ارزیابی اول. 2004. در دسترس آنلاین: http://www.opus.ub.uni-erlangen.de/opus/volltexte/2004/81/pdf/a_04-02.pdf (در 16 اوت 2014 قابل دسترسی است).
ابوبکر، م. آشور، دبلیو. الگوریتم‌های خوشه‌بندی داده‌های کارآمد: پیشرفت‌ها نسبت به Kmeans. بین المللی جی. اینتل. سیستم Appl. 2013 ، 5 ، 37-49. [ Google Scholar ]
تیم OpenStreetMap بشردوستانه [HOT]. در دسترس آنلاین: http://hot.openstreetmap.org/projects (در 16 اوت 2014 قابل دسترسی است).
OpenStreetMap عملیات کابوی. در دسترس آنلاین: http://wiki.openstreetmap.org/wiki/Operation_Cowboy (در 16 اوت 2014 قابل دسترسی است).

© 2014 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب