1. مقدمه و بیان مسئله
OpenStreetMap (OSM) احتمالاً بهترین نمونه شناخته شده اطلاعات جغرافیایی داوطلبانه (VGI) در اینترنت امروز است [ 1 ، 2]]. پایگاه داده OSM دارای ساختار قابل فهمی است که شامل سه نوع داده است: گره ها (نماینده نقاط جغرافیایی)، راه ها (نماینده اشیاء جغرافیایی به صورت چند ضلعی و چند خطی)، و روابط (نماینده مجموعه های منطقی یا گروه بندی گره ها، راه ها و سایر روابط). هر شی در پایگاه داده OSM می تواند دارای برچسب (جفت کلید-مقدار) به آن اختصاص داده شود. این برچسبها معمولاً ویژگیهای شیء را توصیف میکنند، مانند نام یک ساختمان یا تعیین یک شی جاده. برچسب ها همچنین می توانند حاوی اطلاعات موضوعی و فرهنگی باشند. OSM از یک رویکرد folksonomy برای برچسب گذاری اشیاء در پایگاه داده استفاده می کند. یک شی باید حداقل یک تگ داشته باشد، اما محدودیت نظری برای تعداد تگ هایی که می توان روی هر شیء اعمال کرد وجود ندارد. هنگامی که برچسب ها بر روی یک شی اعمال می شود،
با این حال، یکی از انتقادات به دادههای جغرافیایی جمعسپاری شده مانند OSM این است که هیچ قانون یا هستیشناسی رسمی بر روی برچسبگذاری اعمال نمیشود [ 3 ، 4 ، 5 ]. نزدیکترین چیزی که OSM به یک «کتاب قانون» یا هستیشناسی رسمی میرسد، صفحه ویژگیهای نقشه OSM [ 4 ، 6 ] در ویکی OSM [ 7 ] است. OSM Wiki یک اکوسیستم وسیع از راهنماها، اسناد کمکی، وبلاگها، آموزشها و غیره است. صفحه ویژگیهای نقشه با هدف ارائه راهنمایی به افرادی که در OSM مشارکت میکنند، راهنمایی میکند که چه کلیدها و برچسبهایی باید برای اشیاء خاص اعمال شوند، و چه ترکیبی از برچسبها هستند. تشویق شد. فرض کنید، برای مثال، یک برچسب پرکاربرد مانند amenity=restaurant را در نظر بگیرید. این برچسبی است که کلید آن به عنوان رفاه و ارزش به عنوان رستوران اختصاص داده شده است . در شکل 1 ، یک اسکرین شات از صفحه ویژگی های نقشه برای رفاه=رستوران نشان داده شده است، که در آن تعدادی از برچسب ها – که به عنوان ترکیب های مفید یا پیشنهادی با این برچسب در نظر گرفته می شوند – آورده شده است. برای بسیاری از برچسبهای محبوب در OSM، صفحه ویژگیهای نقشه مربوطه آنها مشاوره و راهنمایی در مورد برچسبها یا کلیدهای برچسب ارائه میکند که میتوانند در ترکیب با یک کلید یا برچسب خاص استفاده شوند. این پیشنهادات برچسب گذاری در طول زمان در جامعه OSM تکامل یافته است [ 4]. این پیشنهادات شامل راهنمایی در مورد چگونگی اطمینان از اینکه اشیاء با یک کلید یا برچسب معین حاوی داده های ویژگی مفید و قابل استفاده از طریق استفاده مناسب از برچسب های اضافی یا همزمان هستند را در بر می گیرد.
با این حال، اگر کسی سرویس TagInfo [ 8 ] را بررسی کند، میتوان دید که این پیشنهادات برای کلیدهای برچسب ممکن است به طور جهانی در میان مشارکتکنندگان به OSM پذیرفته نشوند. سرویس TagInfo تعداد دفعات هر تگ (جفت کلید-مقدار) مورد استفاده در OSM را فهرست می کند. سرویس TagInfo همچنین به ما این امکان را می دهد که ببینیم بیشترین استفاده از ترکیبات کلید-مقدار برای یک کلید برچسب مشخص چیست. شکل 2 تصویری از لیست TagInfo برای amenity=restaurant را نشان می دهد . باید به چند نکته مهم توجه کرد. میبینیم که برای تگ amenity=restaurant ، TagInfo 107 ترکیب از کلیدهای برچسب دیگر را با این برچسب فهرست میکند. همچنین متوجه شدیم که استفاده واضحی از زیرمجموعه خاصی از کلیدهای برچسب که در ترکیب با آنها استفاده می شوند وجود نداردآسایش = رستوران . این ما را مستقیماً به سؤال کلیدی تحقیق در مقاله ما میرساند: آیا مشارکتکنندگان OSM از برچسبها و/یا ترکیبهایی از برچسبهای پیشنهادی که در صفحات ویژگیهای نقشه مشخص شده است پیروی میکنند، و آیا این انطباق از نظر مکانی متفاوت است؟ در پاسخ به این سوال تحقیق، ما همچنین بررسی میکنیم که آیا نشانههایی از تفاوتهای بالقوه در اتخاذ این “ترکیبات مفید” بین شهرها یا مناطق وجود دارد یا خیر. در پاسخ به سؤال تحقیق خود، همچنین بررسی خواهیم کرد که آیا سطح پایبندی به “ترکیبات مفید” نیز بین انواع شی متفاوت است یا خیر.
برای پرداختن به این سوال تحقیقاتی، این مقاله تجزیه و تحلیل ما از 40 شهر از سراسر جهان را برای الگوهای برچسب گذاری و اعمال حدود 10 مورد از محبوب ترین برچسب ها در OSM شرح می دهد. برای هر یک از این برچسبهای محبوب، ما تجزیه و تحلیل میکنیم که پایگاه داده OSM در هر شهر چقدر به پیشنهادات «ترکیب مفید» در صفحه ویژگیهای نقشه مربوطه برای برچسب پایبند است. در این کار، ما به طور خاص کامل بودن مقادیر کلیدهای برچسب را در این کار تجزیه و تحلیل نمی کنیم. کار ما به طور خاص بر روی در نظر گرفتن استفاده واقعی از برچسب ها یا کلیدهای برچسب پیشنهاد شده در صفحات ویژگی های نقشه OSM متمرکز است. به طور حکایتی، بسیاری از محققان OSM بر این باورند که مشارکتکنندگان در OSM بیشتر بر مشارکت و ویرایش هندسه واقعی ویژگیها متمرکز هستند تا برچسبگذاری جامع. متعاقبا، برچسبگذاری ویژگیها اغلب به موقعیت یک وظیفه با اولویت پایینتر در فرآیند نگاشت تنزل داده میشود. در ارتباط با این نکته، در این مطالعه به طور خاص به طور کیفی بررسی نمیکنیم که برچسبها یا مقادیر کلیدها در هر شهر جداگانه چقدر کاربردی هستند. به عنوان مثال، ممکن است تغییرات منطقه ای در زیرساخت فیزیکی و مدیریت فضاهای پارکینگ عمومی خودرو (برچسب شده باامکانات رفاهی = پارکینگ به عنوان مثال، لندن، به احتمال زیاد استراتژی های پارکینگ و زیرساخت های مدیریتی متفاوتی در مقایسه با شهر کوچکی مانند نیس (صربستان) خواهد داشت. به طور کلی، این مقاله شواهد کمی در مورد نحوه انجام برچسب گذاری در 40 شهر ارائه می دهد. در بخش 2 ، ما برخی از کارهای مرتبط اخیر در زمینه برچسب گذاری در OSM و VGI را توضیح می دهیم تا این کار را در دانش فعلی قرار دهیم. در بخش 3 ، روش شناسی خود را شرح می دهیم. در بخش 4 ، ما تجزیه و تحلیل انجام شده را توصیف می کنیم و برخی ارزیابی ها را از نتایج ارائه می دهیم. بخش 5فصل پایانی مقاله است. در این بخش، نتیجهگیریهایی در مورد این کار انجام میدهیم و پیشنهاداتی را در جهت کار آینده در این زمینه ارائه میکنیم.
2. کارهای مرتبط
برچسبگذاری و حاشیهنویسی ویژگیها در VGI و OSM موضوع تحقیقات زیادی در طول سالهای گذشته بوده است. در [ 9 ]، نویسندگان توضیح میدهند که برچسبگذاری اصطلاحی است که برای توصیف فعالیت داوطلبانه کاربرانی استفاده میشود که منابع را با عبارات (یا به اصطلاح «برچسبها») به شیوهای آزاد و منعطف که از واژگان نامحدود و گاهی کنترلشده انتخاب میشوند، حاشیهنویسی میکنند. . در واقع، همانطور که توسط نویسندگان در [ 10]، برچسبگذاری مشارکتی فرآیندی را توصیف میکند که در آن بسیاری از کاربران ابردادهها را در قالب کلمات کلیدی به محتوای اشتراکگذاری شده اضافه میکنند. این نوع برچسبگذاری مشترک در وب بسیار محبوب است، جایی که کاربران میتوانند نشانکها، عکسها، محتوای رسانههای اجتماعی و سایر اشکال محتوا را برچسبگذاری کنند. از نظر محتوای جغرافیایی، رویکردهای سنتی متخصص گرا یا حرفه ای با رویکردهای تولید شده توسط کاربر که به صورت ارگانیک در حال تکامل شناخته می شوند به نام folksonomies تکمیل می شوند [ 11 ]]. این رویکرد انعطافپذیر برای برچسبگذاری و حاشیهنویسی پتانسیل استفاده از اطلاعات غنی ارائهشده توسط دادههای اجتماعی برچسبگذاریشده جغرافیایی را دارد و ممکن است بر بسیاری از مناطق از جمله برنامهریزی شهری، مدیریت هوشمند ترافیک، توصیههای مسیر، امنیت و نظارت بر سلامت تأثیر بگذارد. برچسبگذاری خوب و با کیفیت بالا در محیطهای مشارکتی فرصتهای فوقالعادهای را برای توسعه ابزارهای مؤثر برای تجزیه و تحلیل و بهرهبرداری از دادههای مکانی-زمانی در مقیاس بزرگ فراهم میکند [ 12 ]. در چند سال اخیر، تلاشهای زیادی – هم از دانشگاه و هم از صنعت – برای توسعه چنین ابزارهایی صورت گرفته است. یکی از آنها، به عنوان مثال، YUMA Map Annotation Tool [ 13]. برای حاشیه نویسی معنایی هر نوع نقشه دیجیتالی استفاده می شود. هنگامی که حاشیه نویسی بر روی برخی از نقشه های تاریخی یا تخصصی ساخته شد، بعداً می توان آنها را وارد کرد و از روی نقشه های زنده فعلی موجود در وب استفاده کرد. YUMA همچنین مکانیزمی برای گزارش حاشیه نویسی های نادرست و تأیید داده های درج شده ارائه می دهد. ابزار بسیار محبوب دیگر Google Map Maker است [ 14]. Map Maker یک پروژه گوگل است که به افراد امکان می دهد داده های مکانی (مثلاً فعالیت های تجاری) را اضافه و ویرایش کنند که سپس در پلتفرم های محبوب Google Maps و Google Earth مشاهده می شوند. در حالی که شباهتهای زیادی در نحوه عملکرد Google Map Maker وجود دارد، اما در نحوه مدیریت دادههای ارائهشده با OSM متفاوت است. در OSM، تمام دادههای ارائهشده توسط داوطلبان در پایگاه داده OSM ذخیره میشود، که برای همیشه و برای استفاده توسط هر کسی بهصورت آشکار در دسترس باقی میماند. دادههایی که به این روش با استفاده از Google Map Maker ارائه میشوند، به مالکیت Google تبدیل میشوند، که پایگاه داده جغرافیایی آن بسته است و تحت مجوز دسترسی آزاد در دسترس نیست. از آنجایی که OSM انعطاف پذیری بالایی در برچسب گذاری و حاشیه نویسی می دهد، نویسندگانی مانند [ 15] نشان می دهد که داده های OSM می توانند با مشکل “نویز کلاس” مواجه شوند، جایی که اشیاء چند ضلعی و چند خطی در پایگاه داده OSM به اشتباه برچسب گذاری شده اند. غربالگری دستی برچسبگذاری و حاشیه نویسی میتواند برای مجموعه دادههای بزرگ OSM زمانبر و زمانبر باشد، بهویژه اگر اشیاء OSM زیادی برای بازرسی وجود داشته باشد.
در OSM، کاربران یا مشارکت کنندگان در پایگاه داده OSM می توانند برچسب ها را به ویژگی های جغرافیایی اضافه کنند [ 16 ]. چندین ابزار نرم افزاری معروف وجود دارد که به کاربران امکان می دهد داده ها و اطلاعات را به OSM کمک کنند. اینها شامل JOSM (جاوا برای OSM) و ویرایشگر iD است که یک ویرایشگر آنلاین مبتنی بر جاوا اسکریپت است. هر دوی این ابزارها بسیار مورد استفاده قرار میگیرند و کاربران میتوانند برچسبهای مناسبی را برای اعمال بر روی یک شی جغرافیایی خاص انتخاب کنند. کاربر آزاد است هر برچسب یا کلیدی را که برای توصیف ویژگی ها و ویژگی های شیئی که روی آن کار می کند مناسب می داند انتخاب کند. در حالی که می توان حدس زد که این رویکرد آزاد و انعطاف پذیر برای برچسب گذاری، استفاده و کاربرد بیشتر برچسب ها را تشویق می کند، نویسندگانی مانند [ 17]] نشان می دهد که میانگین تعداد برچسب ها روی اشیاء در OSM اغلب بسیار کم است، تقریباً 2 تا 3 تگ در هر شی. در [ 18 ]، نویسندگان بر اساس اطلاعات برچسب ویژگی های اضافه شده یا ویرایش شده، میزان استفاده از داده های پلتفرم Mapillary VGI در OSM را در نظر می گیرند. در این کار، نویسندگان 26 دسته ویژگی اصلی را از صفحه ویکی ویژگی های نقشه OSM در نظر گرفتند و سپس اقدام به در نظر گرفتن برچسب های خاص از این دسته های ویژگی کردند.
در [ 4 ]، نویسندگان در نظر می گیرند که چگونه وب سایت OSM Wiki از مذاکره بر سر برچسب ها، استفاده از برچسب ها و توسعه مقادیر کلید برچسب پشتیبانی می کند. نویسندگان دریافتهاند که اغلب، مذاکره درباره برچسبها توسط گروه کوچکی از نقشهبرداران در زمینه نابرابری سهم بالا هدایت میشود. این مذاکره همچنان در تنش بین نمایندگان جایگزینی که ترکیب و ادغام آنها دشوار است، آشکار می شود. از جمله مسائلی که باعث اختلاف نظر و سردرگمی در مورد برچسب ها و استفاده از کلید برچسب می شود، درک هستی شناختی، تفسیر فرهنگ و زبان، و بار معنایی و تکراری است. یک کار مرتبط [ 5] استدلال می کند که بیشتر تجزیه و تحلیل کیفیت در VGI بر کیفیت هندسی و موقعیتی متمرکز است و تنها توجه پراکنده به تفسیر داده ها و نحوه حاشیه نویسی چنین داده هایی اختصاص داده شده است. بدون درک بهتر از نحوه برچسب گذاری و حاشیه نویسی داده های OSM، بازسازی معنای اطلاعات مورد نظر تولید کنندگان آن می تواند بسیار دشوار باشد. در کار کوین و یاپا [ 19 ]، نویسندگان برچسب گذاری اشیایی را که نشان دهنده منابع غذایی در فیلادلفیا، ایالات متحده آمریکا هستند، در نظر می گیرند. نویسندگان در مورد عدم برچسب گذاری اشیاء برای این موضوع خاص بحث می کنند. برای بهبود وضعیت، نویسندگان یک مهمانی نقشه برداری برای گرد هم آوردن کارشناسان فنی VGI و علاقه مندان به غذا برای بهبود پایگاه داده OSM در شهر ترتیب دادند. سپس یک نقشه وب آنلاین تعاملی با استفاده از داده های OSM توسعه یافت. که در [20 ]، نویسندگان توسعه یک برنامه کاربردی برای ویرایش کمکی برچسب ها در OSM را در نظر می گیرند. رویکرد آنها به دنبال ایجاد یک سیستم توصیه برای برچسب ها و قابل مدیریت کردن چنین لیست هایی برای کاربران است. این برنامه برچسب ها را با توجه به اطلاعات معنایی در مورد داده های منطقه اطراف کاهش می دهد و مرتب می کند. برنامه پیشنهادی برچسب سعی می کند “پیش فرض های عقل سلیم در مورد جهان را مدل کند، به عنوان مثال، یک دستگاه بلیط همیشه نزدیک یک ایستگاه یا یک سکو خواهد بود”. در این مورد، ما معتقدیم که چنین برنامهای لزوماً از توصیههای صفحات ویکی ویژگی نقشه OSM استفاده نمیکند.
در دیگر برنامههای کاربردی، نویسندگانی مانند [ 21 ] توسعه برنامههایی را در نظر میگیرند که به کاربران اجازه میدهند اطلاعاتی را درباره نشانهها در شهرها و شهرکها تعریف کرده و مشارکت دهند. نویسندگان برچسبهای مورد نیاز برای این کار شناسایی را در نظر میگیرند و معتقدند که OSM حاوی مجموعهای غنی از برچسبها برای توصیف نشانهها نیست. بنابراین، ذخیره برچسبهای مربوط به میراث فرهنگی یک نقطه عطف ساختمان در OSM ممکن است در مدل برچسبگذاری و انتساب OSM نامناسب باشد. در [ 22]، نویسندگان مشکل تشخیص خرابکاری در OSM را در نظر می گیرند، جایی که مشارکت کنندگان عمدا خطاها را به پایگاه داده OSM وارد می کنند. این نوع خرابکاری می تواند به نوع تغییرات ایجاد شده بستگی داشته باشد. خرابکاری یک هندسه در OSM احتمالا راحت تر از خراب کردن اطلاعات معنایی در برچسب ها قابل تشخیص است. تشخیص خودکار برچسب های نامعتبر یا عمداً اشتباه روی اشیاء در OSM یک مشکل دشوار است. یکی از دلایل این واقعیت این است که ساختار برچسبگذاری OSM یک رویکرد folksonomy بسیار منعطف و باز است. در کار [ 23]، نویسندگان روشی را برای تجزیه و تحلیل فرکانس برچسب با استفاده از داده های فلیکر به دست آمده برای شهر ونکوور، کانادا نشان می دهند. آنها استدلال می کنند که ویژگی های برچسب به مقیاس فضایی تجمع بستگی دارد. در مناطق بزرگتر از تجمع، فضای برچسب تحت سلطه چند برچسب مکرر است که جغرافیای بزرگ را توصیف میکند، در حالی که برچسبهای مکان خاص بیشتری در مقیاسهای محلی پدیدار میشوند.
3. روش شناسی و راه اندازی آزمایشی
در این بخش، روش شناسی و تنظیمات تجربی برای تحلیل خود را شرح خواهیم داد. شکل 3 یک نمای کلی از روشی را نشان می دهد که ما برای انجام واردات داده های OSM و تجزیه و تحلیل برچسب ها برای هر یک از شهرها و مناطق شهری که وارد کردیم، ایجاد کردیم. چهار مؤلفه در متدولوژی ما وجود دارد که به شرح زیر توضیح داده شده است:
-
انتخاب تگ های OSM برای تجزیه و تحلیل ( بخش 3.1 )
-
واردات داده های OSM خام برای هر یک از شهرها یا مناطق انتخاب شده ( بخش 3.2 )
-
تجزیه و تحلیل داده های خام OSM که در آن الگوهای برچسب گذاری برای هر یک از برچسب های انتخابی برای هر یک از شهرها یا مناطق انتخاب شده استخراج می شود ( بخش 3.3 )
-
تجزیه و تحلیل آماری نهایی خروجی مرحله 3. این باید به طور مفصل در بخش 4 بررسی شود.
در این بخش، موارد 1، 2، و 3 را در نظر خواهیم گرفت، در حالی که مورد 4 در بخش تجزیه و تحلیل تجربی در بخش 4 مورد بحث قرار خواهد گرفت .
3.1. انتخاب برچسب های OSM برای تجزیه و تحلیل
هزاران تگ OSM کاندید بالقوه وجود دارد که میتوانیم در این تحلیل از آنها استفاده کنیم. در زمان نگارش، TagInfo آماری در مورد بیش از 2000 تگ را نمایش می دهد [ 24 ].
با توجه به این اطلاعات، تگ متداول در OSM تگ building=yes است که به تقریبا 160 میلیون شی اختصاص داده شده است. 4.2 ٪4.2%از تمام اشیاء OSM). تگ بعدی که اغلب در OSM رخ می دهد، برچسب بزرگراه=مسکونی است که به تقریباً 35 میلیون شی اختصاص داده شده است، که نشان دهنده کمی زیر است. 1 %1%از تمام اشیاء OSM در فهرست TagInfo از تگ های متداول در OSM، تگ نهایی فهرست شده – traffic-calming=yes – برای کمی بیشتر از آن اعمال می شود. 10000 _ _10,000اشیاء OSM تجزیه و تحلیل از TagInfo در این آستانه متوقف می شود. از فهرست TagInfo، مجموعه اولیه 30 تگ متداول در OSM جهانی را با استفاده از معیارهای زیر برای انتخاب برچسب خود انتخاب کردیم:
-
برچسب انتخاب شده باید دارای یک صفحه ویکی ویژگی های نقشه اختصاصی [ 7 ] باشد. این تضمین می کند که برچسب برای تجزیه و تحلیل ما مناسب است و از پشتیبانی جامعه OSM برای گنجاندن آن در OSM برخوردار است. اطلاعات مربوط به استفاده واقعی از برچسب در نقشه برداری در OSM در هر صفحه ویکی ویژگی های نقشه اختصاصی ارائه شده است که می تواند به ما کمک کند تا نتایج خود را برای هر برچسب انتخاب شده تفسیر کنیم.
-
برچسب انتخاب شده باید حداقل دو برچسب پیشنهادی به عنوان “ترکیب مفید” داشته باشد. اگر ترکیب های مفیدی با سایر تگ ها پیشنهاد نشده باشد، این تگ در نظر گرفته نمی شود.
-
مقدار اختصاص داده شده به کلید در تگ انتخابی نباید “بله” یا “خیر” باشد. ما به شدت فقط برچسب هایی را در نظر می گیریم که کلید می تواند مقداری ارزش داشته باشد و فقط وجود ویژگی توصیف شده با استفاده از همان کلید را بیان نمی کند. در حالی که روششناسی ما میتواند به راحتی از برچسبهایی پشتیبانی کند که در آن کلید فقط مقادیر “بله” یا “خیر” داشته باشد، چنین برچسبهایی را میتوان در انواع مختلفی از ویژگیها یافت و بررسی آنالیز آنها دشوارتر خواهد بود.
-
برچسب انتخاب شده به عنوان یک برچسب پیشنهادی برای هیچ یک از تگ های انتخابی دیگر فهرست نمی شود. این تضمین می کند که ما برچسب هایی را با اهمیت بالاتر برای تجزیه و تحلیل خود انتخاب می کنیم.
بر اساس این معیار، مجموعه اولیه 30 برچسب پرکاربرد را از TagInfo انتخاب کردیم که واجد شرایط تجزیه و تحلیل بودند. برای اینکه تجزیه و تحلیل قابل کنترل تر باشد، 10 تگ از این مجموعه انتخاب کردیم. جدول 1 10 برچسبی را که انتخاب کرده ایم نشان می دهد. ما معتقدیم که این 10 تگ مجموعه خوبی از برچسب های مربوط به حوزه های موضوعی مختلف (بزرگراه، حمل و نقل، پوشش زمین، امکانات رفاهی) را در اختیار ما قرار می دهد. تگ ها همچنین به گره ها و راه های OSM اعمال می شوند. در جدول 1 ، تعداد اشیاء در پایگاه داده جهانی OSM که حاوی برچسب مربوطه هستند نشان داده شده است. رتبه بندی TagInfo تگ هدف ارائه شده است که با فراوانی استفاده از تگ هدف در پایگاه داده جهانی OSM مطابقت دارد. اطلاعات جدول 1در سرویس TagInfo در 28 ژوئن 2016 صحیح است.
3.2. واردات داده های OSM خام برای هر یک از شهرها یا مناطق انتخاب شده
دسترسی به داده های فضایی خام در OSM تحت مجوز دسترسی باز است. ابزارها و خدمات نرم افزاری مختلفی وجود دارد که دسترسی به داده ها را فراهم می کند. در نتیجه، روشهای مختلفی وجود دارد که از طریق آنها میتوان دادههای OSM خام را دریافت کرد و این دادهها را در یک پایگاه داده فعال فضایی وارد کرد. ما استفاده از سرویس MapZen [ 25 ] را برای منبع داده های OSM خود انتخاب کردیم. MapZen سرویس “Extracts Metro” خود را ارائه می دهد که داده های OSM استخراج شده را بر اساس مرزهای اداری شهر و منطقه برای کل جهان ارائه می دهد. خدمات Metro Extracts داده های به روز شده را به صورت هفتگی ارائه می دهد. داده های OSM در قالب های مختلفی ارائه می شوند. ما انتخاب کردیم که از فرمت داده OSM XML استفاده کنیم، که سپس مستقیماً با استفاده از ابزار osm2pgsql به پایگاه داده PostgreSQL PostGIS وارد می شود.26 ]. این بدان معناست که ما نیازی به توسعه هیچ ابزار نرم افزاری خاص یا جدیدی برای انجام وارد کردن داده نداریم، زیرا این یک روش شناخته شده و استاندارد برای وارد کردن داده های OSM به PostGIS است. دادههای OSM خام مورد استفاده در این مقاله در ژوئن 2016 دانلود و وارد شدند.
40 شهر زیر برای تحلیل ما انتخاب شدند: آستانه، باماکو (مالی)، بانکوک، پکن، بوگوتا، بوستون، بخارست، بوئنوس آیرس، شیکاگو، کرایست چرچ، دوبلین، دوسلدورف، فرانکفورت، هلسینکی، ژوهانسبورگ، کیف، کیوتو، لاگوس، لندن، لیون، مادرید، منچستر (بریتانیا)، مکزیکو سیتی، میلان، مونروویا، نایروبی، دهلی نو، نیس (صربستان)، اسلو، اتاوا، پراگ، سن پترزبورگ، سانفرانسیسکو، سائوپائولو، سنگاپور، سیدنی، ونکوور، وین ، ویلنیوس و ورشو. برای نشان دادن توزیع فضایی این شهرها، نمای نقشه ای از انتخاب خود را در شکل 4 ارائه می کنیم.. این انتخاب پوشش جهانی کافی از شهرها و مناطق را فراهم می کند. همچنین ترکیب بسیار خوبی از شهرها و مناطق با زبان های بومی رسمی مختلف، ترکیب فرهنگی متفاوت و درجات متفاوتی از کامل بودن OSM در شهرها را فراهم می کند. همانطور که [ 2 ، 15] و سایر نویسندگان نشان داده اند، کامل بودن OSM به طور کلی در کشورهای جهان اول، از جمله شهرهای آمریکای شمالی، اروپا و استرالیا بهتر است. ما همچنین برخی از شهرهایی را انتخاب کردیم که مشمول واردات دادههای مکانی از منابع دیگر مانند صنعت یا دادههای باز از آژانسهای نقشهبرداری ملی بودهاند. از جمله این شهرها می توان به بوستون، لیون، شیکاگو و وین اشاره کرد. راهاندازی آزمایشی و روششناسی ما بسیار انعطافپذیر است و اسکریپتهای نرمافزاری ما به ما این امکان را میدهند که در صورت نیاز شهرها و مناطق بیشتری را اضافه کنیم.
3.3. تجزیه و تحلیل داده های OSM خام
هنگامی که تمام داده های OSM خام همانطور که در بخش 3.2 ذکر شد وارد شدند ، پایگاه داده PostGIS شامل مجموعه جداول یکسانی برای هر شهر یا منطقه است. این به ما اجازه می دهد تا تجزیه و تحلیل داده های OSM خام را برای استخراج داده ها و انجام محاسبات لازم برای تجزیه و تحلیل تجربی انجام دهیم، همانطور که در بخش بعدی (بخش 4 ) توضیح داده شده است .
برای هر یک از برچسبهای انتخاب شده در جدول 1 ، ابتدا باید فهرست «ترکیبهای مفید» یا «برچسبهای پیشنهادی» را از صفحه ویژگیهای نقشه مربوطه در ویکی OSM استخراج کنیم. به عنوان مثال، اگر تگ amenity=parking را در نظر بگیریم ، برای شناسایی تسهیلاتی برای استفاده عموم، مشتریان یا سایر کاربران مجاز برای پارک خودرو، کامیون، موتور سیکلت و غیره استفاده می شود. صفحه ویژگی های نقشه برای amenity=parking [ 27 ] ترکیبهای مفید زیر یا کلیدهای برچسب پیشنهادی را نشان میدهد: دسترسی ، ظرفیت ، هزینه ، نام ، maxstay ، و اپراتور. سپس نرمافزار ما باید هر شهر یا منطقه را برای برچسب راحتی=پارکینگ در گرهها و راهها جستجو کند و شمارش کند که چند بار برچسبهایی با کلیدهای فهرستشده در بالا روی همان شی ظاهر میشوند . برای هر تگ یک فایل متنی ایجاد می شود. از آنجایی که 10 برچسب در تجزیه و تحلیل ما وجود دارد، 10 مورد از این فایل ها برای هر یک از 40 شهر در تجزیه و تحلیل ما ایجاد شده است. در بخش 4 ، تجزیه و تحلیل تجربی اطلاعات استخراج شده را برای 40 شهر انتخاب شده بیان می کنیم.
4. تجزیه و تحلیل تجربی
در بخش قبلی، بخشهای قبلی روششناسی خود را شرح دادیم: انتخاب برچسبهای OSM برای تجزیه و تحلیل ( بخش 3.1 )، واردات دادههای OSM خام برای هر یک از شهرها یا مناطق انتخاب شده ( بخش 3.2 )، و تجزیه و تحلیل دادههای OSM خام. ، که در آن الگوهای برچسب گذاری برای هر یک از برچسب های انتخاب شده برای هر یک از شهرها یا مناطق انتخاب شده استخراج می شود ( بخش 3.3 ). ما اکنون نتایج تجزیه و تحلیل تجربی خود را در مورد نتیجه بخش 3.3 شرح می دهیم .
برای ارزیابی انطباق هر شهر یا منطقه با استفاده از برچسبهای پیشنهادی برای هر برچسب هدف، تصمیم گرفتیم از رتبهبندی مقیاس لیکرت [ 28 ، 29 ] استفاده کنیم. ما یک مقیاس پنج قسمتی لیکرت را به شرح زیر اعمال کردیم. برای یک تگ هدف معین، تگ های ترکیبی مفید پیشنهادی را از صفحه ویکی ویژگی های نقشه OSM مربوطه در نظر می گیریم. ما درصد نسبی اشیاء را از منطقه مورد تجزیه و تحلیل محاسبه کردیم که شامل برچسب هدف و یک کلید خاص برای برچسبها در مجموعه تگهای ترکیبی مفید بود. سپس درصد به مقیاس پنج بخشی لیکرت ترسیم شد که در آن اگر 0 %0%– 20 درصد20%از اشیاء با برچسب هدف نیز یک کلید خاص دارند، سپس انطباق ضعیف است، > 20 درصد20%– 40 درصد40%منصفانه، > 40 درصد40%– 60 درصد60%متوسط، > 60 درصد60%– 80 درصد80%خوب، و اگر بزرگتر از 80 درصد80%، پس انطباق عالی است. در بخش بعدی، مثالی از نحوه محاسبه و اعمال مقیاس لیکرت بر اساس یک شهر ارائه میدهیم. در بخشهای فرعی پایانی این بخش، نتایج کلی انطباق را برای هر یک از 10 تگ هدف مندرج در جدول 1 بیان میکنیم . برای هر تگ هدف، ما یک جدول خلاصه از نتایج انطباق را برای لیست برچسب های پیشنهادی ارائه می دهیم تا با تگ هدف همراه شوند. ما همچنین برخی از مشاهدات و نظرات را در مورد جدول خلاصه نتایج ارائه می دهیم.
4.1. نمونه ای از انطباق با برچسب های پیشنهادی در صفحه ویکی ویژگی های نقشه OSM
به عنوان مثال، جدول 2 را در نظر بگیرید ، جایی که انطباق اشیا با برچسب گذاری پیشنهادی در صفحه ویکی ویژگی های نقشه OSM برای برچسب هدف leisure=pitch نشان داده شده است [ 30 ]. در این مورد، 470 شی وجود دارد. دو کلید برچسب پیشنهادی sport=* و سطح=* وجود دارد . برای کلید برچسب sport=* ، 364 شی یا وجود دارد 77.5 %77.5%از همه اشیاء با برچسب هدف leisure=pitch , while only 9 درصد9%اشیاء همچنین دارای برچسب سطح کلید =* هستند . این به ترتیب انطباق با مقیاس لیکرت خوب و ضعیف را نشان می دهد. 26 کلید برچسب مختلف و منحصر به فرد وجود دارد که در ترکیب با برچسب هدف اوقات فراغت = زمین در کرایست چرچ نیوزلند استفاده می شود. در مثالی دیگر، جدول 3 را در نظر بگیرید که خلاصه ای از انطباق همه اشیاء در ورشو، لهستان را برای برچسب هدف راه آهن=راه آهن نشان می دهد . جدول 3 شامل هر پنج بخش مقیاس لیکرت است. راه آهن=راه آهنبرای قطارهای مسافری یا باری با اندازه کامل در گیج استاندارد برای کشور یا منطقه خاص استفاده می شود. این بزرگترین طبقه بندی راه آهن در OSM است. می بینیم که 9 کلید برچسب پیشنهادی وجود دارد. ما شاهد تنوع در مقیاس لیکرت برای انطباق با استفاده از کلیدهای برچسب پیشنهادی هستیم. این یک مثال بسیار جالب است، زیرا برچسب هدف railway=rail حاوی کلیدهای برچسب پیشنهادی با اطلاعات دامنه بسیار خاص و فنی، مانند گیج و ولتاژ است . این نشان می دهد که تعداد کل اشیاء با برچسب راه آهن در ورشو 2922 است. از این تعداد، نام کلید =* را می توان در 67 شی پیدا کرد که فقط 2.3 ٪2.3%. از آنجایی که این مقدار بین 0 %0%– 20 درصد20%، با انطباق ضعیف اختصاص داده شده است. به همین ترتیب، 289 کلید bridge=* و 61 کلید تونل=* وجود دارد که 9.9 درصد9.9%و 2.1 ٪2.1%، به ترتیب. بنابراین، این دو دارای انطباق ضعیف نیز هستند. Key usage=* در استفاده می شود 36.9 %36.9%از اشیاء، که بالاتر از 20 درصد20%و کمتر یا مساوی با 40 درصد40%، و بنابراین دارای انطباق عادلانه است. به طور مشابه، فرکانس=* و ولتاژ=* در یافت می شوند 55.4 %55.4%و 55.6 %55.6%از اشیاء و دارای انطباق متوسط. تنها برچسبی که مطابقت خوب دارد، key service=* with است65.5 ٪65.5%. تنها دو کلید که در بیش از 80 درصد80%از اشیاء با برچسب راه آهن=ریل گیج=* و برقی شده=* هستند و بنابراین دارای انطباق عالی هستند.
4.2. مطابقت با Target Tag بزرگراه=مسکونی
در این بخش، ما در مورد انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای برچسب هدف بزرگراه=مسکونی بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 4 نشان داده شده است . این برچسب برای جاده هایی که به مناطق مسکونی یا جاده های داخل این مناطق مسکونی دسترسی دارند استفاده می شود. این به طور کلی نشان دهنده یک خیابان یا جاده است که عموماً برای ترافیک محلی در یک شهرک مسکونی استفاده می شود. همانطور که در جدول 1 نشان داده شده است ، می بینیم که بزرگراه=مسکونی دومین تگ پرکاربرد در پایگاه داده جهانی OSM است. دو ترکیب کلید برچسب پیشنهاد شده است: name=* برای نام خیابان یا جاده مسکونی، وoneway=* برای نشان دادن محدودیت های دسترسی. صفحه ویژگیهای نقشه OSM برای oneway [ 31 ] نشان میدهد که این کلید برچسب فقط در صورتی باید استفاده شود که محدودیت دسترسی وجود داشته باشد. در اینجا می توان به چند نکته اشاره کرد که به شرح زیر است:
-
تگ name =* تقریباً در نیمی از شهرهای مورد تجزیه و تحلیل مطابقت بسیار خوبی دارد. یکی از دلایل این امر این است که در بسیاری از موارد تگ name=* ممکن است دارای تغییرات محلی برای تطبیق زبان(های) بومی رسمی برای شهر مربوطه باشد، مانند name:fi برای نام فنلاندی یک خیابان در هلسینکی.
-
انطباق کلی oneway=* در همه شهرها خوب نیست. ما معتقدیم این ممکن است ناشی از سردرگمی در مورد نحوه اعمال صحیح برچسب باشد. صفحه ویژگیهای نقشه OSM نشان میدهد که فقط زمانی باید از آن استفاده کرد که شی خیابان با برچسب بزرگراه=مسکونی در واقع یک خیابان یک طرفه باشد ( oneway=yes ). اگر حرکت جریان ترافیک دو طرفه است، این برچسب پیشنهادی نباید استفاده شود. با این حال، ما احساس می کنیم که جالب است بررسی کنیم که چند خیابان یک طرفه این برچسب را ندارند. این کار مستلزم تأیید صحت میدانی در زمین است، زیرا استخراج این اطلاعات به درستی از تصاویر هوایی همیشه امکان پذیر نیست.
-
تنها شهری که دارای حداقل انطباق متوسط از کلید یک طرفه است، شهر میلان است که تنها با مشاهده نقشه OSM میلان به وضوح قابل توجه است.
4.3. مطابقت با Target Tag natural=tree
در این بخش، ما در مورد انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای تگ هدف natural=tree بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 5 نشان داده شده است . این برچسب برای استفاده در درختان منفرد که گاهی اوقات به تنهایی ایستاده اند یا درختانی که اهمیت محلی دارند در نظر گرفته شده است. آنچه ما در مورد این تگ هدف natural=tree احساس می کنیم قابل توجه است فراوانی استفاده در OSM است. رتبه بندی شده است 17 تن ساعت17تیساعتدر سطح جهانی، و برای بیش از هفت میلیون شیء اعمال می شود. 8 ترکیب کلید برچسب پیشنهادی وجود دارد. همه این برچسبهای پیشنهادی به اطلاعات بسیار خاصی در مورد درخت نیاز دارند، که ما معتقدیم به این معنی است که فقط دانش محلی و بررسی روی زمین میتواند این اطلاعات را به دست آورد. مشاهدات ما به شرح زیر است:
-
انطباق با این برچسب کم است زیرا اکثر شهرها فقط دارای تعداد کمی از اشیاء هستند که به عنوان درختان منفرد یا تک برچسب گذاری شده اند. نگاشت صحیح این ویژگی ها مستلزم تایید میدانی و دانش ویژه حوزه و معمولاً زمان و تلاش زیادی است.
-
انطباق بسیار بالایی را می توان در شهر وین در تمام کلیدها مشاهده کرد، به جز جنس کلید . در چند شهر دیگر فقط برخی از کلیدها استفاده می شود. به عنوان مثال، بخارست فقط برای ارتفاع کلیدها و گونه ها انطباق بالایی دارد ، در حالی که سایر کلیدها اصلاً استفاده نمی شوند. سانفرانسیسکو انطباق بالایی با کلید تاکسون نشان می دهد که با 3537 درخت نقشه برداری شده استفاده می شود.
-
وین مشمول واردات داده های باز درختان بود و بیش از آن را شامل می شود 133 , 000133،000درختان.
-
به طور خلاصه، تنها در شهرهای بخارست، دوسلدورف، لندن، لیون، وین، سانفرانسیسکو، و ورشو استفاده واقعی از ترکیب کلیدهای برچسب پیشنهادی برای تگ هدف natural=tree وجود دارد .
4.4. مطابقت با Target Tag بزرگراه=پیاده راه
در این بخش، انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای تگ هدف بزرگراه=پایگاه را مورد بحث قرار میدهیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 6 نشان داده شده است . تگ بزرگراه=پیاده راه برای نقشه برداری مسیرهای فرعی استفاده می شود که عمدتاً یا منحصراً توسط عابران پیاده استفاده می شود. برای مسیرها و مسیرهای چند منظوره یا نامشخص که توسط انواع ترافیک غیر موتوری استفاده میشوند، برچسب بزرگراه=مسیر (به بخش 4.5 مراجعه کنید ) ممکن است مناسبتر باشد. به طور کلی، استفاده از ترکیب کلیدهای برچسب پیشنهادی برای تگ هدف بزرگراه=پیاده راهدر تمام شهرهای مورد تجزیه و تحلیل بسیار ضعیف است. تعدادی از مشاهدات وجود دارد که می توانیم انجام دهیم، به شرح زیر:
-
صفحه ویکی ویژگی های نقشه OSM [ 32 ] نشان می دهد که آداب و رسوم، قوانین و علائم متفاوتی در کشورهای مختلف برای چندین نوع راه در دسترس کاربران عابر پیاده، دوچرخه و اسب وجود دارد. برچسبگذاری آنها حتی قبل از معرفی بزرگراه=مسیر متفاوت بود و به برداشتهای متفاوتی از معنای واقعی هر یک از برچسبهای فعلی منجر شده است.
-
هیچ یک از شهرهای موجود در تجزیه و تحلیل ما مطابقت عالی یا خوب را برای هیچ یک از برچسبهای پیشنهادی نشان نمیدهند.
-
انطباق کم کلیدها بیشتر به دلیل نیاز به تأیید صحت میدانی به منظور نگاشت مناسب برچسب های پیشنهادی است. بهترین تطابق مربوط به سطح کلید برچسب است که هنوز پایین است، اما احتمالاً فقط به این دلیل که نقشهبرداران سطح پیادهروها را در همسایگی خود میشناسند یا میتوانند آنها را از روی تصاویر هوایی تعیین کنند.
-
قابل توجه است که اکثر اشیاء انطباق ضعیفی با کلید نام دارند، که انتظار می رود از آنجایی که مسیرهای پیاده روی معمولاً نامگذاری مناسبی ندارند. فقط شهر بوگوتا انطباق بیشتری برای کلید نام دارد ، زیرا برخی از خیابانها در واقع با استفاده از بزرگراه=پیادهراه نقشهبرداری میشوند .
-
کلید پیادهروی انطباق کمی دارد، اما مقادیر معمول آن پیادهرو یا تقاطع است ، که نباید برای همه اشیایی که با بزرگراه=پیادهراه برچسبگذاری شدهاند اعمال شود .
4.5. مطابقت با Target Tag بزرگراه=مسیر
در این بخش، انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای تگ هدف بزرگراه=مسیر را مورد بحث قرار میدهیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 7 نشان داده شده است . این تگ یک مسیر کلی را نشان میدهد – اعم از استفاده چند منظوره یا استفاده نامشخص – که برای همه وسایل نقلیه غیر موتوری باز است. این مسیر ممکن است هر نوع سطحی داشته باشد و می تواند شامل مسیرهای پیاده روی و پیاده روی، مسیرهای دوچرخه سواری، و مسیرهای پیاده روی، مسیرهای اسب و استوک، مسیرهای دوچرخه سواری کوهستان، و همچنین ترکیبی از موارد فوق باشد. تگ باید برای مسیرهایی اعمال شود که برای آنها برچسب هایی مانند بزرگراه=پیاده راه و بزرگراه=چرخه راه وجود داردنامناسب خواهد بود تعدادی از مشاهدات وجود دارد که می توانیم در اینجا انجام دهیم، به شرح زیر:
-
هیچ یک از شهرهای موجود در تجزیه و تحلیل ما مطابقت عالی یا خوب را برای هیچ یک از برچسبهای پیشنهادی نشان نمیدهند.
-
sac_scale و trail_visibility بخشی از یک طرح طبقه بندی برای مسیرهای پیاده روی به ترتیب با توجه به دشواری مسیر و دید / جهت گیری مسیر هستند. این کلیدهای برچسب مقادیر خود را بر روی Klassifikation des Swiss Alpine Club (SAC) (de) میکشند، زیرا هیچ طرح طبقهبندی استاندارد شده بینالمللی وجود ندارد. فقط Oslo ( trail_visibility ) و Christchurch ( sac_scale ) انطباق عادلانه ای را برای این دو کلید برچسب نشان می دهند. درک ماهیت خاص دامنه این کلیدهای برچسب برای افراد غیر متخصص ممکن است دشوار باشد و متعاقباً به عنوان برچسب اعمال شوند.
-
بوستون، کرایست چرچ، فرانکفورت، ژوهانسبورگ، میلان، نیس و سیدنی دارای انطباق متوسط برای کلید سطح هستند . ما نتوانستیم هیچ رابطه ای بین این شهرها در این زمینه پیدا کنیم، که نشان می دهد نقشه برداری از سطح در این شرایط ممکن است به عملکرد برچسب گذاری جوامع محلی باشد.
4.6. انطباق با بزرگراه برچسب هدف = درجه سوم
در این بخش، ما در مورد انطباق برای ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای تگ هدف بزرگراه=سوال بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 8 نشان داده شده است . برچسب بزرگراه=ثالثیه برای جادههایی که شهرکهای مسکونی کوچکتر را به هم متصل میکنند و در شهرکهای بزرگ برای جادههای متصل به مراکز محلی استفاده میشود. از نظر شبکه حمل و نقل، بزرگراه=ثالثیهجادهها معمولاً خیابانهای کوچک یا جادهها را به جادههای اصلی بیشتری متصل میکنند. خارج از نواحی شهری، جاده های درجه سوم، جاده هایی با ترافیک کم تا متوسط هستند که سکونتگاه های کوچکتر مانند روستاها یا شهرهای کوچک را به هم متصل می کنند. تعدادی از مشاهدات وجود دارد که می توانیم انجام دهیم که به شرح زیر است:
-
بوئنوس آیرس، لاگوس، مادرید، مکزیکوسیتی، سائوپائولو و ونکوور با کلید یک طرفه مطابقت خوبی دارند ، که نشان می دهد اگر این برچسب به درستی اعمال شده باشد، اکثریت بزرگراه= اشیاء درجه سوم در این شهرها در واقع یک طرفه هستند. جاده ها از آنجایی که 16 شهر دارای انطباق عادلانه با oneway هستند در حالی که 12 شهر دارای انطباق متوسط برای این کلید هستند، ما معتقدیم که اشیاء دارای برچسب بزرگراه=ثالث نتیجه شیوه های مختلف برچسب گذاری محلی در این شهرها هستند.
-
فقط اتاوا و بوستون امتیاز عالی برای خطوط =* دارند . ما فکر می کنیم که این به این دلیل است که جاده های درجه سوم در ایالات متحده و کانادا معمولا بیش از یک خط دارند. این معمولاً در سایر نقاط جهان یا اروپا اتفاق نمی افتد.
-
فقط لیون و پراگ حداقل مطابقت خوبی دارند.
-
دهلی نو تنها شهری است که امتیاز ضعیفی به نامش دارد =*
4.7. انطباق با امکانات تگ هدف = پارکینگ
در این بخش، ما در مورد انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای تگ هدف amenity=parking بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 9 نشان داده شده است . برچسب آسایش = پارکینگ برای شناسایی یک مرکز یا ساختمان برای استفاده عموم یا مشتریان یا سایر کاربران مجاز برای پارک خودرو، کامیون، موتور سیکلت و غیره استفاده میشود. این شامل امکانات پارکینگ میشود که برای دسترسی به این امکانات هزینه دریافت میکنند. با توجه به TagInfo در جدول 1 ، بیش از دو میلیون شی با برچسب امکانات = پارکینگ وجود دارد . مشاهداتی وجود دارد که به شرح زیر است:
-
از داده ها، می توان دریافت که کلید هزینه معمولاً با مقادیر yes یا no اعمال می شود ، در حالی که این برچسب ها به ندرت اعمال می شوند. ما معتقدیم که این حذف به این معنی نیست که هزینههای پارکینگ اعمال نمیشود، بلکه احتمالاً نیاز به یک نقشهبردار برای داشتن دانش محلی دارد.
-
برای ویژگی برچسب = پارکینگ ، هیچ یک از 40 شهر ما مطابقت عالی با هیچ یک از برچسبهای پیشنهادی را نشان نمیدهند.
-
تگ name =* به طور شگفت انگیزی کمتر استفاده می شود. سنگاپور انطباق متوسط استفاده از این برچسب پیشنهادی را نشان میدهد، در حالی که دوبلین و کیوتو مطابقت عادلانه را نشان میدهند. بر این اساس، به نظر می رسد که مشارکت کنندگان OSM در ارائه نام برای مکان های پارک خودرو مشکل دارند.
-
در دسترس بودن بیشتر دادههای مربوط به پارکینگ میتواند به ناوبری بهتر و پیشنهادات پارک خودکار بر اساس پارامترهای گزینههای اقامت و پرداخت، بر اساس اپراتور کمک کند. حتی برای مکان های پارکینگ مسکونی، اطلاعات مربوط به اپراتور یا عدم وجود آن می تواند نشان دهنده در دسترس بودن پارکینگ بازدیدکنندگان باشد. در حالی که نگاشت تگ های maxstay یا اپراتور می تواند به تأیید میدانی نیاز داشته باشد، برخی از نویسندگان نگاشت مستقیم این تگ ها را از تصاویر آنلاین مانند Mapillary ([ 18 ]) پیشنهاد کرده اند.
4.8. مطابقت با Target Tag بزرگراه=اولیه
در این بخش، ما در مورد انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای تگ هدف بزرگراه=اولیه بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 10 نشان داده شده است . این برچسب نشان دهنده جاده هایی است که نشان دهنده یک بزرگراه یا جاده اصلی است که شهرها یا شهرهای بزرگ را به هم متصل می کند. در بیشتر موقعیت ها، یک بزرگراه = اصلی حداقل دو خط با یک مانع مرکزی دارد که این خطوط را از هم جدا می کند. در مناطقی با زیرساخت کمتر توسعه یافته، کیفیت جاده ممکن است متفاوت باشد. در این موارد، ترافیک برای هر دو جهت معمولاً با یک مانع مرکزی جدا نمی شود. در حالی که بزرگراه=اولیه فقط رتبه بندی شده است 59 تن ساعت59تیساعتدر TagInfo ( جدول 1 )، مسلماً یکی از شناخته شده ترین برچسب ها در OSM [ 4 ] است. شبکه راه برای اکثر کشورها در OSM بسیار توسعه یافته است [ 33 ]. برخی از مشاهدات از اطلاعات جدول 10 به شرح زیر است:
-
تنها دو شهر باماکو و لاگوس هستند که مطابق با کلید نام عادلانه هستند. اگر دادهها را در باماکو به دقت بررسی کنیم، میتوانیم نتیجه بگیریم که دلیل این انطباق کم کلید نام از روش نقشهبرداری ناشی میشود که در آن بزرگراه= اشیاء اولیه در واقع از چند خط ناهمگون ساخته شدهاند، که تنها برخی از آنها با نام برچسبگذاری شدهاند. برچسب زدن این را می توان از مقادیر تگ ref استنباط کرد .
-
تفاوت زیاد بین سطح انطباق کلیدهای همزمان با برچسب بزرگراه = تگ اصلی ، و همچنین تعداد برچسب های مختلف اعمال شده و تعداد اشیاء – در مقایسه با اندازه شهر – نشان می دهد که شیوه های برچسب گذاری بسیار متفاوتی در سراسر وجود دارد. جهان برای این برچسب خاص. از آنجایی که این اشیاء معمولاً در ابتدای نقشه برداری در مناطق شهری [ 34 ] ترسیم می شوند، ممکن است انتظار داشت که این ویژگی ها در مراحل مختلف توسعه OSM نقشه برداری شوند. بنابراین، شیوههای مشاهدهشده بسیار ناهمگن هستند، زیرا برخی از دادهها احتمالاً قبل از توافق جامعه OSM در مورد رویکرد برچسبگذاری این اشیا، نقشهبرداری شدهاند. با توجه به اهمیت این اشیا و امکان استفاده از آنها در کاربردهای مختلفبزرگراه=اولیه ، برچسبها میتوانند مجدداً برای بررسی برچسبگذاری و حاشیهنویسیشان بازبینی شوند.
-
شهرهایی با انطباق ضعیف برای خطوط=* شامل اسلو، لیون، منچستر، دوبلین و مکزیکوسیتی هستند. شهرهایی که انطباق ضعیف را با کلید برچسب ref=* نشان می دهند عبارتند از: آستانه، بوگوتا، نایروبی، سائو پائولو، سنگاپور و سیدنی.
4.9. انطباق برای بزرگراه برچسب هدف = ایستگاه اتوبوس
در این بخش، ما در مورد انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای تگ هدف بزرگراه=ایستگاه اتوبوس بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 11 نشان داده شده است . برچسب بزرگراه=ایستگاه اتوبوس نشاندهنده یک ایستگاه اتوبوس است که نشاندهنده مکانی است که مسافران میتوانند در آن سوار اتوبوس یا اتوبوس شوند یا از آن پیاده شوند. موقعیت فیزیکی یک ایستگاه اتوبوس معمولاً با یک سرپناه، تیرک، درازکش اتوبوس یا خطکشی جاده مشخص میشود. در مناطق غیر شهری و مناطق با زیرساخت های حمل و نقل عمومی کمتر توسعه یافته، این مکان ها ممکن است علامت گذاری فیزیکی نداشته باشند. تعدادی از مشاهدات وجود دارد که ما به آنها اشاره خواهیم کرد:
-
فقط سه شهر با استفاده از تگ name=* تطابق ضعیفی دارند و بیش از نیمی از شهرها با استفاده از این برچسب مطابقت عالی دارند. شهرهایی که مطابقت ضعیفی با این برچسب دارند، کرایست چرچ، مونروویا و سائوپائولو هستند.
-
برچسبهای پیشنهادی operator=* و public_transport به خوبی مورد استفاده قرار نمیگیرند، تنها 6 شهر با استفاده از این برچسبها با بزرگراه=bus_stop مطابقت عالی نشان میدهند ، یعنی: پکن، بوستون، شیکاگو، مادرید، اتاوا و وین.
-
کلید اپراتور در 28 شهر انطباق ضعیفی دارد، اما ، بر اساس توضیح بر روی شواهد تجربی، این ممکن است به این دلیل باشد که ایستگاههای اتوبوس توسط یک شرکت عمومی یا خصوصی مشترک اداره میشوند. در چنین مواردی، صفحات ویکی ویژگی های نقشه OSM نشان می دهد که فقط اپراتورهای حمل و نقلی که در آن منطقه شهری مشترک نیستند باید نقشه برداری شوند.
-
نگاشت نام bus_stop نیاز به تأیید میدانی و دانش محلی دارد، مگر اینکه نقشه حمل و نقل با مجوز باز دقیقی وجود داشته باشد که بتوان این اطلاعات را از آن استخراج کرد.
4.10. مطابقت با Target Tag railway=rail
در این بخش، ما در مورد انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای برچسب هدف railway=rail بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 12 نشان داده شده است . در بخش 4.1 ، نمونه خاصی از این تگ هدف را برای ورشو در لهستان مورد بحث قرار دادیم. برخی از مشاهدات کلی وجود دارد که می توانیم در اینجا انجام دهیم، به شرح زیر:
-
تونل کلید دارای انطباق ضعیف است، در حالی که پل کلید در اکثر شهرها انطباق ضعیفی دارد. این بدان معنا نیست که انطباق کلی در واقع ضعیف است، زیرا حذف این برچسب ها در واقع به این معنی است که بخش خاصی از راه آهن روی پل یا داخل تونل نیست.
-
انطباق ضعیف کلید گیج در برخی شهرها ممکن است ناشی از عدم دانش مربوط به دامنه از سوی نقشهبرداران باشد. معمولاً اندازه گیج در سراسر منطقه شهری یا حتی یک کشور تغییر نمی کند، بنابراین این پتانسیل وجود دارد که برچسب گیج بر اساس گیج استاندارد در حال استفاده به طور خودکار به روز شود.
-
برچسب گیج=* در پکن، بخارست، مکزیک و اتاوا ضعیف است، در حالی که سیدنی تنها شهری است که امتیاز عالی در ولتاژ=* و فرکانس=* دارد .
-
تفسیر مشابهی را می توان برای سایر کلیدهای خاص دامنه (مانند فرکانس یا ولتاژ ) که می تواند بر اساس مقادیر برچسب موجود یا با اعمال مقادیری که استانداردهای کشور یا منطقه هستند اعمال شود، ارائه داد.
4.11. انطباق با برچسب هدف اوقات فراغت = زمین
در این بخش، ما در مورد انطباق با ترکیبهای برچسب پیشنهادی در صفحه ویژگیهای نقشه OSM برای برچسب هدف leisure=pitch بحث میکنیم . خلاصه ای از انطباق برای هر یک از 40 شهر در تجزیه و تحلیل ما در جدول 13 نشان داده شده است . برچسب اوقات فراغت = زمین برای حاشیه نویسی مناطق طراحی شده برای انجام یک ورزش خاص استفاده می شود که معمولاً با علامت های مناسب مشخص می شود. به عنوان مثال می توان به موارد زیر اشاره کرد: زمین های تنیس، زمین بسکتبال، پارک های بیسبال، زمین های فوتبال و غیره. مشاهدات جالبی در اینجا وجود دارد:
-
برچسب سطح به ندرت استفاده می شود و همه شهرها انطباق ضعیفی را نشان می دهند. کلید سطح می تواند مقادیر چمن، زمین، چمن نجومی، آسفالت و غیره را بگیرد.
-
برچسب ورزش در بیش از 30 شهر کاربرد بسیار خوبی را نشان می دهد. این برچسب نشان می دهد که کدام ورزش در این زمین بازی می شود. ما حدس می زنیم که دلیل انطباق بالای این کلید برچسب از توانایی استخراج ورزش انجام شده در زمین از تصاویر هوایی ناشی می شود، زیرا علامت گذاری روی سطح نشان دهنده ورزش انجام شده در آنجا است.
-
برچسب sport =* در آستانه و کیوتو POOR است.
-
برچسب sport =* در پکن، هلسینکی، کیف، ویلنیوس، سن پترزبرگ، اسلو و ورشو میانگین است.
4.12. خلاصه کلی جداول نتایج
به منظور خلاصه کردن نتایج حاصل از این بخش و ارائه یک نمای کلی، جدول خلاصه ای را در جدول 14 محاسبه کرده ایم . این جدول تمام تگ های هدف و تعداد کلیدهای پیشنهادی برای هر تگ هدف در صفحات ویکی ویژگی های نقشه OSM را فهرست می کند. ستون “کل LV” تعداد کلیدها در تعداد شهرها (40) ضرب می شود. سپس برای هر مرحله در مقیاس لیکرت (ضعیف، منصفانه، متوسط، خوب و عالی) درصد کلی هر مرحله را محاسبه کردیم. هر ستون یک مقدار درصد را نشان می دهد. این جدول خلاصه تعدادی از مشاهدات مهم را برجسته می کند. ابتدا می بینیم که هدف ، امکانات=پارکینگ ، بزرگراه=مسیر ، طبیعی=درخت و بزرگراه=پیاده رو برچسب گذاری می کند.به طور کلی بیشتر از 90 درصد90%انطباق ضعیف در واقع، عملکرد ضعیف بزرگراه=مسیر و بزرگراه=پیاده راه ممکن است ریشه در چیزی داشته باشد که در ویکی OSM به عنوان بحث مسیر [ 32 ] شناخته می شود. صفحه مربوطه OSM ویکی نشان می دهد که آداب و رسوم، قوانین و علائم متفاوتی در کشورهای مختلف برای انواع مختلف مسیرها یا جاده ها در دسترس کاربران عابر پیاده، دوچرخه، و اسب و غیره وجود دارد. برچسب زدن این موارد در OSM تا حدودی متناقض بوده است. معرفی بزرگراه=مسیر برای تلاش برای حل این مشکلات منجر به برداشت های متفاوتی از برچسب ها شده است. بزرگراه اول، سوم و ایستگاه اتوبوس را برچسب گذاری می کندبهترین عملکرد را داشته باشد، با عملکرد کلی خوب که در تمام مراحل مقیاس لیکرت استفاده شده توزیع شده است. اینها از جمله تگ هایی هستند که اغلب در OSM ارائه می شوند. تگ های هدف راه آهن=راه آهن و اوقات فراغت=زمین به طور معقولی از نظر جهانی عملکرد مناسبی دارند، شاید به این دلیل که ترکیب پیشنهادی کلیدهای برچسب به دانش دامنه خاص یا دانش یا بررسی روی زمین نیاز دارد.
5. نتیجه گیری و کار آینده
در این مقاله، ما بررسی کردهایم که آیا ساختارهای برچسبگذاری پیشنهادی مشخص شده در وبسایت ویکی ویژگیهای نقشه OSM توسط مشارکتکنندگان OSM برای 40 شهر و منطقه شهری در سراسر جهان دنبال یا پیادهسازی شدهاند. ما 10 تگ متداول را از پایگاه داده جهانی OSM انتخاب کردیم ( جدول 1 را ببینید) با استفاده از سرویس TagInfo. برای هر یک از این برچسبها (که به عنوان برچسبهای هدف ما نامیده میشود)، برای اطلاعات و راهنمایی در مورد برچسبهای پیشنهادی یا کلیدهای برچسبی که مشارکتکنندگان باید با این برچسبهای هدف هنگام حاشیهنویسی اشیاء در OSM از آنها استفاده کنند، با وبسایت ویکی ویژگیهای نقشه OSM مشورت کردیم. با استفاده از مقیاس پنج قسمتی لیکرت، انطباق هر شهر را برای هر تگ هدف و استفاده از برچسبها یا کلیدهای برچسب پیشنهادی از ویکی OSM ارزیابی کردیم. دادههای OSM در ژوئن 2016 از سرویس داده MapZen بارگیری شد. ما سؤال تحقیقاتی زیر را پرسیدیم: آیا مشارکتکنندگان OSM از برچسبها و/یا ترکیبهای پیشنهادی مطابق با صفحات ویژگیهای نقشه پیروی میکنند، و آیا این انطباق از نظر مکانی متفاوت است؟
در پاسخ به این سوال تحقیقاتی، دریافتیم که انطباق یا استفاده از برچسبها یا کلیدهای برچسب پیشنهادی از وبسایت ویکی ویژگیهای نقشه OSM، برای بسیاری از برچسبهای هدف در جدول 1، به طرز ناامیدکنندهای ضعیف است. برچسبهای هدف مانند راحتی=پارکینگ (به بخش 4.7 مراجعه کنید ) یا بزرگراه=مسیر (به بخش 4.5 مراجعه کنید) نمونههایی از مواردی هستند که مطابقت بسیار ضعیفی در همه 40 شهر وجود دارد. از سوی دیگر، برچسبهای هدف مانند راهآهن=راهآهن (به بخش 4.10 )، بزرگراه=اولیه (به بخش 4.8 مراجعه کنید )، و بزرگراه=ایستگاه اتوبوس (به بخش 4.9 مراجعه کنید) را هدف قرار دهید.) نرخ های بهتری از انطباق و استفاده از برچسب های پیشنهادی را نشان می دهد. ما معتقدیم که همیشه این موردی نیست که مشارکتکنندگان این برچسبها یا توصیههای پیشنهادی را نادیده بگیرند. در عوض، این به طور بالقوه موردی است که بسیاری از مشارکتکنندگان بر جنبههای هندسی ویژگیهای نقشهبرداری تأکید بیشتری میکنند و مجموعهای حداقلی از ویژگیها را به این ویژگیها اضافه میکنند. ممکن است برخی از مشارکتکنندگان اهمیت ویژگیها را از نظر توصیف عملکرد یا ویژگیهای یک ویژگی درک نکنند. مشاهده تعداد نسبتاً کمی از برچسبها که توسط مشارکتکنندگان دیگر برای اشیا یا ویژگیهای مشابه اعمال میشوند، ممکن است بر رفتار برچسبگذاری آنها تأثیر بگذارد. جدول خلاصه ای از تحلیل ما در جدول 14 ارائه شده است . به عنوان بالاتوره و زیپف [ 4] به ما یادآوری می کند، جوامع VGI مجموعه داده ها و طرحواره های آنها را به روشی باز و انعطاف پذیر تولید می کنند. این بدان معنی است که کلاس ها، نمونه ها و ویژگی های آنها اغلب سیال و قابل تغییر هستند. در واقع، در تجزیه و تحلیل ارائه شده در مقاله خود، نویسندگان تجسم هایی از مقدار برچسب های ناسازگار در یک منطقه/منطقه معین ارائه می کنند. سپس این اطلاعات می تواند توسط مشارکت کنندگان برای رفع مشکلات برچسب گذاری استفاده شود. در حالی که عدم انطباق با پیشنهادات در OSM Wiki و ویژگی های نقشه ممکن است برای کلاس های ویژگی مانند بزرگراه ها مشکلی نباشد، نویسندگانی مانند Hecht و همکاران. [ 35 ] استفاده ضعیفی از برچسبگذاری و انتساب در کلاسهای ویژگی مانند ساختمانها و سازههای شهری پیدا کردهاند. در حالی که نویسندگان در [ 36] به شدت در مورد انطباق برچسب گذاری صحبت نمی کنند، آنها متوجه می شوند که داده های ویژگی یا اطلاعات معنایی فقط برای نقاط مورد علاقه OSM (POI) یا ویژگی های چند ضلعی که توسط برنامه های کاربردی تولید نقشه محبوب ارائه می شوند تکمیل می شود. آنها نتیجه می گیرند که اشیاء جغرافیایی و اطلاعات ویژگی که در نقشه های OSM قابل مشاهده نیستند توسط مشارکت کنندگان OSM نادیده گرفته می شوند. علاوه بر این، «اطلاعات معنایی موجود به دلیل ترکیبات تگ متناقض یا اشتباهات تایپی قابل استفاده نیستند. همچنین ممکن است خطاهای برچسبگذاری به دلیل تفاسیر متفاوت برچسبهای OSM توسط نقشهبرداران مختلف OSM یا به دلیل املای نادرست ظاهر شوند.» [ 36 ] (صفحه 15).
تلاش برای درک رویکردهایی که مشارکت کنندگان در OSM هنگام برچسب گذاری یا حاشیه نویسی اشیاء استفاده می کنند یک مشکل پیچیده است [ 37 ]. میتوانیم با قاطعیت بگوییم که، در حالی که تگهای هدف در جدول 1 مطمئناً بسیار گسترده استفاده میشوند، اما همیشه با تگها یا کلیدهای برچسب پیشنهاد شده به عنوان ترکیبهای مفید در وبسایت ویژگیهای نقشه OSM Wiki همزمان نیستند. وبسایت ویکی ویژگیهای نقشه OSM بهعنوان کتاب قوانین واقعی یا راهنمای نقشهبرداری در OSM [ 6 ] در نظر گرفته میشود، و برخی از نویسندگان آن را به عنوان هستیشناسی OSM [ 4] در نظر میگیرند.]. تجزیه و تحلیل ما نشان می دهد که برچسب گذاری یا حاشیه نویسی اشیا در OSM، در مقیاس جهانی، تصویری ناهمگن از کاربرد برچسب را ترسیم می کند. این بدیهی است که پیامدهایی برای کیفیت داده ها و توسعه برنامه های نرم افزاری دارد که به برچسب های روی اشیاء به عنوان ورودی به الگوریتم های داخلی و تصمیم گیری آنها متکی هستند. استفاده از ویژگیهای نقشه OSM صفحات ویکی به عنوان راهنمایی ممکن است از نظر فیزیکی نیاز به مشارکتکنندگان داشته باشد که هنگام نقشهبرداری در OSM به این صفحات مراجعه کنند یا حداقل با محتوای آنها آشنایی کامل داشته باشند. این ممکن است مراحل شناختی اضافی را در فرآیند نقشه برداری معرفی کند. در این شرایط، ما معتقدیم که مشارکت کنندگان از راهنمایی ها و پیشنهادات ارائه شده توسط نرم افزار ویرایش OSM برای انتخاب برچسب ها و کلیدهای برچسب استفاده خواهند کرد. در غیر این صورت، ما متکی هستیم که مشارکت کنندگان با اطلاعات و توصیه های مربوط به ویژگی های نقشه OSM آشنا هستند.
در طول تحقیقات خود، ما همچنین بررسی کردیم که چگونه برچسبهای انتخاب شده در شهرها و مناطق مختلف اعمال میشوند تا بفهمیم که آیا برخی از برچسبها یا کلیدهای پیشنهادی به طور گسترده، کم استفاده میشوند یا اصلا استفاده نمیشوند. از مشاهداتمان، میتوانیم نتیجه بگیریم که کاربرد برچسبها و انطباق کلی آنها مطمئناً بین شهرها و مناطق متفاوت است، اما ما قادر به شناسایی کمی الگوهای متمایز نیستیم که بتوان از آن نتیجهگیری کرد. برای شهرها و مناطق خاص، متوجه شدیم که برخی از کلیدها با برچسب های پیشنهادی در اکثر اشیاء نقشه برداری شده همزمان رخ می دهند. در واقع، ما این مشکل الگوهای منطقهای برچسبگذاری در OSM را در سایر کارهای تحقیقاتی که درگیر آن هستیم در نظر گرفتهایم. در مقاله خود [ 38]]، با استفاده از روشی متفاوت، فراوانی همروی مجموعههای دیگر کلیدهای برچسب، با برچسبهای هدف خاص، را برای برخی از شهرها و مناطق نیز در این مقاله در نظر گرفتهایم. در جدول 15 ، ما اغلب کلیدهای برچسب را برای تگ هدف natural=tree در سه شهر – یعنی وین، دوسلدورف و لندن نشان می دهیم. درصد اشیاء در آن شهرها که این ترکیبات در آنها رخ می دهد، در ستون سوم آورده شده است. وین در معرض حجم زیادی از داده های جغرافیایی در مورد مکان های درختی بوده است. برای سایر تگ های هدف در این مقاله، متوجه شدیم که اغلب تعداد بسیار کمی از کلیدهای برچسب استفاده می شود، با میانگین کمتر از 2 (تقریباً 1.331.33) برچسب های اضافی در هر شی. مثال دیگر برای تگ هدف بزرگراه=پیاده راه است که در آن ما نیز تغییرات منطقه ای را می بینیم. به عنوان مثال، در هلسینکی، سه کلید تگ مشترک رایج هستند l i t ، s n o w p l o u gh i n gs you r f _a c eلمنتی،س���پل�تو�ساعتمن��،ستو��آجه، فرانکفورت ( s m o o t h n e s s , s u r fa c e ، w i dتی ساعتسمتر��تیساعت�هسس،ستو��آجه،�مندتیساعتو سانفرانسیسکو ( n a m e _تی جی _e r : c fج ج ،تی جی _e r : c o u n t y�آمتره،تیمن�ه�:ج�جج،تیمن�ه�:ج�تو�تی�). در مورد سانفرانسیسکو، واردات انبوه دادههای TIGER تأثیر عمدهای بر روی برچسبها و کلیدهای برچسب در دسترس است. ما حدس می زنیم که چنین کلیدهایی، که می توانند همزمان با کلیدها یا برچسب های پیشنهادی در اکثر اشیاء مورد تجزیه و تحلیل یافت شوند، می توانند روی شیوه های برچسب گذاری آینده در برخی مناطق تأثیر بگذارند. با این حال، تحقیقات کمی بیشتر برای بررسی این تغییرات منطقه ای با جزئیات بیشتر مورد نیاز است.
همانطور که در بالا ذکر کردیم، در نظر گرفتن برچسب گذاری اشیاء در OSM یا VGI به عنوان بخشی از تجزیه و تحلیل کیفیت داده ها همچنان چالش برانگیز است. به طور کلی، موضوع کیفیت داده ها یک مشکل پیچیده در مورد در نظر گرفتن مشارکت های داوطلبانه در تولید یک پایگاه داده نقشه مشروح است. در واقع، موضوع کیفیت دادههای مربوط به حاشیهنویسی صرفاً در نظر گرفتن اینکه آیا حاشیهنویسیها وجود دارند و در مقایسه با برخی هستیشناسی مورد توافق به درستی استفاده میشوند، نیست. درعوض، توجه گسترده تر به کیفیت داده ها باید شامل جنبه های شهرت مشارکت کننده، قابلیت اطمینان و اعتماد به صحت حاشیه نویسی ها باشد. همانطور که توسط [ 39]، کار هدف واقعی یا مورد استفاده ای که داده ها برای آن استفاده خواهند شد می تواند در به کارگیری یک روش مناسب – با انگیزه واضح – برای ارزیابی کیفیت داده ها بسیار مفید باشد.
کار آینده
تعدادی جهت برای کار آینده وجود دارد که می تواند از کارهایی که در این مقاله توضیح داده شده است به عنوان پایه استفاده کند. این دستورالعمل ها به شرح زیر خلاصه می شوند:
-
چه تأثیری بر الگوهای برچسبگذاری از سوی مشارکت کنندگان اصلی OSM در شهرها و مناطق شهری دارد؟ در کار [ 2 ، 17 ، 40 ] و دیگران، می بینیم که در OSM، درصد کمی از همه مشارکت کنندگان وجود دارد (بین 5 درصد5%و 10 درصد10%) که تقریباً همه (بین 80 درصد80%و 90 درصد90%) از برچسب گذاری در پایگاه داده OSM. کار آینده این مشارکت کنندگان اصلی را در منتخبی از شهرها و مناطق شهری شناسایی خواهد کرد. با در نظر گرفتن ویرایشهای این مشارکتکنندگان اصلی، تحلیل این که از چه الگوها یا ساختارهای برچسبگذاری استفاده میکنند بسیار مفید خواهد بود. آیا آنها توصیه های صفحات ویژگی های نقشه OSM را دنبال می کنند؟ آیا آنها از برچسب های پیش فرض که توسط نرم افزار ویرایش OSM پیشنهاد شده است (مانند JOSM و ویرایشگر iD مبتنی بر وب) استفاده می کنند؟ شاید آنها بر اساس ایده مفهومی خود در مورد چگونگی برچسب گذاری و حاشیه نویسی یک شی خاص در یک زمینه جغرافیایی معین، اشیا را برچسب گذاری می کنند؟
-
با استفاده از تجزیه و تحلیل مبتنی بر خوشه، میتوانیم شیوههای برچسبگذاری مبتنی بر منطقهای در حال ظهور را شناسایی و شناسایی کنیم. با صفحات ویکی ویژگی های نقشه OSM، این ایده وجود دارد که همه اشیاء در OSM باید و می توانند به شکلی همگن حاشیه نویسی و برچسب گذاری شوند. انعطافپذیری در ساختار برچسبگذاری در OSM وجود دارد تا تغییرات محلی بر اساس زبان و الفبای مورد استفاده و تأثیرات فرهنگی امکانپذیر باشد. این کار آینده می تواند به شناسایی اینکه آیا اشیاء خاص در مناطق مختلف جهان برچسب متفاوتی دارند یا خیر کمک کند. به عنوان مثال، آیا مکانهای پارکینگ ( امکانات=پارکینگ ) در اروپا در مقایسه با آمریکای شمالی متفاوت برچسبگذاری و حاشیهنویسی میشوند؟
-
در برخی از کارهای قبلی ما [ 33 ، 41]، ما تجزیه و تحلیل داده های تاریخچه OSM را انجام دادیم. در کار آینده این مقاله، بررسی خواهیم کرد که آیا امکان تشخیص تکامل تاریخی الگوها یا شیوههای برچسبگذاری در طول زمان با استفاده از دادههای تاریخچه OSM وجود دارد یا خیر. اگر در مقیاس منطقه ای برخی از کلیدها به طور خاص با برچسب خاصی همراه بود، آیا می توانیم نتیجه بگیریم که چه چیزی باعث چنین رفتاری شده است؟ آیا این یک برچسب ترجیحی برخی از اینفلوئنسرهای اصلی (نقشه نگار با مشارکت بالا در OSM)، یک کلید جدید توافق شده در جامعه OSM، یا یک ویژگی جدید مانند “شاخه ماشین الکتریکی” بود؟ اگر امکان شناسایی چنین الگوهایی وجود داشته باشد، آیا میتواند بر تغییرات بخش «ترکیبات مفید» صفحه ویکی ویژگیهای نقشه OSM تأثیر بگذارد یا حتی باعث ایجاد تغییرات منطقهای از بخشهای «ترکیبات مفید» شود؟
-
در پایان این کار، میتوان گفت که تحلیل کمی تغییرات فضایی بالقوه در انطباق با برچسبهای پیشنهادی و/یا ترکیبی از برچسبها یک مشکل دشوار است. در حالی که نتایج در این مقاله نشان میدهد که واریانس قابلتوجهی در انطباق کلی با برچسبهای پیشنهادی و/یا ترکیبی از برچسبها وجود دارد، ما قادر به نشان دادن کمی الگوهای متمایز نبودیم. تعدادی راه ممکن برای بررسی بیشتر برای این مشکل وجود دارد. در [ 42]، نویسندگان مقایسه برچسب های اجتماعی و اصطلاحات موضوعی در حوزه علم اطلاعات را بین منابع چینی و انگلیسی در نظر گرفتند. نویسندگان از روشهای سنتی مانند ضریب شباهت جاکارد و ضرایب همبستگی اسپیرمن دو مجموعه رتبهبندی شده برای مقایسه این مجموعههای برچسب استفاده کردند. در [ 43 ]، نویسندگان کاربرد بیش از 1200 تگ در StackOverflow را برای موضوعات و مکالمات مختلف تجزیه و تحلیل کردند. نویسندگان عملکرد روش خود را با استفاده از معیارهای بازیابی اطلاعات استاندارد دقت، یادآوری و F ارزیابی کردند. 11(امتیاز F یا F-measure). در آثار [ 44 ، 45 ]، نویسندگان از معیار تشابه واژگانی ضریب همپوشانی بین مجموعههای اصطلاحات برچسبها استفاده میکنند. ضریب همپوشانی معیاری است که نشان می دهد چه مقدار از واژگان کوچکتر در بزرگتر گنجانده شده است و به اندازه نسبی دو واژگان حساس نیست. کار قبلی [ 46 ] نشان میدهد که برای تجزیه و تحلیل مجموعههای برچسب، باید برای تجزیه و تحلیل دقیقتر، مجموعهها را به قطعات کوچکتر تقسیم کرد. در [ 5 ]، نویسندگان شش بعد کیفیت مفهومی را برای VGI پیشنهاد کردند. بعد منc mمنجمترانطباق بیشترین کاربرد را در کار ما در اینجا دارد، جایی که این بعد، پایبندی یک ویژگی، ویژگی یا مجموعه ای از ویژگی ها را به منبع معینی در نظر می گیرد. منc mمنجمتربه راحتی محاسبه می شود و می توان آن را در نرم افزار تجزیه و تحلیل ما پیاده سازی کرد. ما معتقدیم که کارهای آینده که این رویکردها را در نظر میگیرند، ممکن است بتوانند شواهد کمی از تفاوتها در انطباق بین شهرها و مناطق مختلف ارائه دهند.
-
تجزیه و تحلیل صحت تگ های مورد استفاده در ترکیب با برچسب های هدف مورد نیاز است. در بخش 4، نتایج آزمایش استفاده یا انطباق شهرها با ترکیب کلیدهای برچسب پیشنهادی را با یک تگ هدف معین ارائه کردیم. اگر یک تگ هدف معین با یک کلید برچسب پیشنهادی همراه باشد، یک شی در یک شهر سازگار تلقی می شود. در این مقاله، ما ارزش کلیدهای برچسب پیشنهادی را بررسی یا تجزیه و تحلیل نمی کنیم. روششناسی ما انعطافپذیر است و به ما امکان میدهد این نوع بررسی را در کارهای آینده ادغام کنیم. چنین بررسی صحت یا اعتبار مقادیر اختصاص داده شده به کلیدهای برچسب پیشنهادی می تواند به ما اجازه دهد تا اظهارات آگاهانه تری در مورد کیفیت برچسب گذاری روی اشیاء برای برچسب های هدف خاص ارائه دهیم. صحت کاربرد برچسب نیز باید در قابلیت کاربرد پیشنهادات ویکی ویژگی های نقشه برای هر شهر در نظر گرفته شود. ما این تغییرات را در این کار در نظر نگرفتیم. هر شهر یا منطقه ممکن است تفاوت هایی را در میزان کاربردی بودن یک پیشنهاد داده شده نشان دهد. مثلا،sac:scale یا mtb:scale برای بزرگراه=مسیر ممکن است همیشه به طور کلی برای هر منطقه شهری قابل استفاده نباشد. این تغییرات محلی باید در هر ارزیابی از انطباق کلی برچسب در نظر گرفته شود. یک پیشنهاد دیگر در اینجا این است که در نظر بگیرید که چگونه این نوع بررسی می تواند به طور موثر در زمان واقعی انجام شود، با توجه به اینکه OSM می تواند به طور قانونی به عنوان داده های بزرگ جغرافیایی در نظر گرفته شود [ 47 ]. رویکرد ما در این مقاله به عنوان یک فرآیند آفلاین توسعه یافته است. اجرای روش ما به عنوان جزئی از موتور پردازش جریان آنلاین [ 48 ] به توسعه نرم افزار اضافی نیاز دارد.
بدون نظر