خلاصه
:
دسترسی روزافزون به دادههای مکانی باز مرتبط، منبع بیسابقهای از اطلاعات جغرافیایی برای توصیف محیطهای شهری است. این انبوه داده باید به دانش عملی تبدیل شود: برای مثال، داده های باز می تواند به عنوان یک پروکسی یا جایگزین اطلاعات بسته یا گران قیمت استفاده شود. استفاده موفق از داده های مکانی باز مرتبط می تواند راه را برای راه حل های نوآورانه برای مشکلات شهر هوشمند هموار کند. در این مقاله، مجموعهای از آزمایشها را نشان میدهیم که با شروع از دادههای مکانی باز مرتبط، فرآیند کشف دانش را برای پیشبینی معناشناسی شهری اجرا میکنند. به طور خاص، ما از اطلاعات جغرافیایی در مورد نقاط مورد علاقه به عنوان ورودی در یک مدل طبقهبندی استفاده از زمین با وضوح فضایی متوسط (250 متر) در مناطق وسیع شهری در اروپا استفاده میکنیم. ما آزمایشهای خود را در شهرهای مختلف اروپایی – میلانو، مونیخ، بارسلونا و بروکسل – تکرار میکنیم تا از تکرارپذیری و عمومیت رویکرد خود اطمینان حاصل کنیم، و شرایط آزمایشی و همچنین مجموعه دادههای به کار رفته را برای تضمین تکرارپذیری توضیح میدهیم. ما به طور گسترده در مورد نتایج ارزیابی کمی و کیفی، برای قضاوت در مورد اعتبار، و همچنین محدودیت های رویکرد پیشنهادی خود، گزارش می دهیم.
کلید واژه ها:
کاربری اراضی شهری ; داده های جغرافیایی-مکانی باز مرتبط ؛ نقاط مورد علاقه ؛ شهرهای هوشمند
چکیده گرافیکی
1. معرفی
دیجیتالی شدن فضای شهری، ناشی از فراگیر شدن روزافزون فناوری های اطلاعات و ارتباطات، به اکوسیستم غنی از تولیدکنندگان اطلاعات و مصرف کنندگان اطلاعات منجر شده است [ 1 ]. با این حال، این انبوه داده، ارزش افزوده پنهانی را که مدیریت هوشمند چنین اطلاعاتی می تواند برای شهرها به ارمغان بیاورد، مخاطره می کند. سوال باز این است که “اطلاعات مرتبط برای رسیدن به هدف من چیست؟”: مصرف کنندگان اطلاعات ممکن است بدون حل وظایف خود در داده های بزرگ غرق شوند و گم شوند. در این تصویر، دادههای مکانی باز مرتبط میتوانند نقش مهمی را ایفا کنند و اطلاعات جغرافیایی معنایی غنی مرتبط با محیطهای شهری را ارائه دهند. همانطور که در زمینه های دیگر اتفاق می افتد، تبدیل اطلاعات خام به دانش عملی چالش کلیدی است [ 2].
علاوه بر این، ظهور اقتصاد به اصطلاح داده محور نشان می دهد که مالکیت و انتقال داده ها به چندین ملاحظات حقوقی و مالی منجر می شود [ 3 ]. علاوه بر این، در زمینه دادههای شهری، منابع مختلف با هزینههای متفاوتی به دست میآیند: در حالی که برخی از اطلاعات تقریباً بهطور رایگان ایجاد و بهروزرسانی میشوند، در نتیجه فعالیتهای دیگر (به عنوان مثال، تحرک وسیله نقلیه ردیابی GPS ایجاد میکند، فعالیت تلفن همراه مکان افراد را در طول زمان جمعآوری میکند. [ 4])، سایر مجموعههای داده همچنان برای تولید و نگهداری بسیار پرهزینه باقی میمانند، مانند آنهایی که نیاز به مداخله دستی دارند (مثلاً دادههای جمعیتی، که به فعالیت سرشماری مبتنی بر انسان نیاز دارد) یا پردازش نیمه خودکار. هزینه های مجموعه داده ها به کل زنجیره ارزش مبتنی بر داده، از تولید تا توزیع، از پردازش تا مصرف مربوط می شود [ 5 ].
آیا می توان از یک یا چند مجموعه داده ارزان قیمت به عنوان «پراکسی» برای منابع داده گرانتر استفاده کرد؟ به عبارت دیگر، آیا بر اساس محتوای سایر منابع اطلاعاتی بهروز، میتوان بهطور (نیمه) خودکار یک مجموعه داده قدیمی را که در غیر این صورت مستلزم کار پرهزینه انسانی است، تولید یا اصلاح کرد؟ این چالشی است که امروزه جامعه مدیریت داده با آن مواجه است. هدف تحقیق ما پاسخگویی به سوالات فوق در زمینه آمایش سرزمین است.
برنامهریزی شهری رشتهای است که با ایجاد مکانهای راحتتر، پایدارتر و جذابتر به بهبود رفاه مردم و جوامع میپردازد. برنامهریزی شهری زمانی که برای کاربری زمین به کار میرود، به مدیریت و تغییرات محیطی توجه میکند و معمولاً با هدف تنظیم انواع فعالیتهای مجاز در مناطق خاص است. در بافت شهرها، نظارت بر تغییرات کاربری زمین برای هدایت و حمایت از فرآیند شهرنشینی پایدار از اهمیت بالایی برخوردار است [ 6 ].
شناسایی و گزارش تغییرات کاربری اراضی به دور از این است که یک کار بی اهمیت باشد. در واقع، معمولاً برای جمعآوری، ادغام و درک اطلاعات شهری برای استخراج دانش مفید برای پشتیبانی از فعالیتهای برنامهریزی، به یک فرآیند گران قیمت و تا حدی دستی نیاز دارد. در اروپا، ابتکار CORINE ( ر.ک. http://www.eea.europa.eu/publications/COR0-landcover ) یک طبقهبندی و رویه مشترک برای حمایت از شرکتهای محلی و منطقهای که بهطور دورهای نقشههای کاربری زمین را تولید یا بهروزرسانی میکنند، ارائه کرد . از تصاویر سنجش از دور
هدف این مقاله آزمایش این است که آیا دادههای مکانی آزاد مرتبط با محیطهای شهری میتوانند به عنوان یک «نماینده» برای منابع اطلاعات جغرافیایی گران قیمت استفاده از زمین با معنایی که در بالا توضیح داده شد، مشابه آنچه [7، 8، 9] استفاده شود ، آزمایش شود . ، 10 ] با استفاده از رسانه های اجتماعی، داده های تلفن همراه یا ردیابی GPS انجام داد.
در ادامه راه حل ابتکاری خود را برای استخراج کاربری اراضی شهری و پشتیبانی از فعالیت های برنامه ریزی شهرهای هوشمند ارائه می دهیم. ما مجموعهای از آزمایشهای طبقهبندی را برای پیشبینی استفاده از زمین CORINE نشان میدهیم که از اطلاعات جغرافیایی نقطهنظر شهرها (POI) مشتقشده از OpenStreetMap، مشابه [ 11 ، 12 ]، اما با وضوح فضایی دقیقتر، استفاده میکند.
به منظور اطمینان از تکرارپذیری و عمومیت رویکردمان، آزمایشهای خود را در شهرهای مختلف اروپایی تکرار میکنیم. از آنجایی که نقشه های CORINE برای کل اروپا در دسترس است، ما چهار شهر را انتخاب می کنیم که ویژگی های مشابهی را از نظر تعداد ساکنان و اندازه منطقه شهری نشان می دهند. ما میلان را در ایتالیا، مونیخ در آلمان، بارسلونا در اسپانیا و بروکسل در بلژیک را انتخاب می کنیم.
ابتکار CORINE که توسط آژانس محیط زیست اروپا ( رجوع کنید به http://www.eea.europa.eu/ ) اتحادیه اروپا هماهنگ شده است، یک طبقه بندی چند سطحی (به نام “نامگذاری پوشش زمین”، آخرین به روز رسانی در سال 2006) ارائه می دهد. طبقه بندی کاربری زمین در دسته های مختلف (آب در مقابل زمین، زمین با پوشش گیاهی در مقابل زمین بدون پوشش گیاهی و غیره )؛ سپس از این طبقهبندی برای توصیف کاربری واقعی زمین در قلمرو اروپا استفاده میشود و نقشههای موضوعی را با وضوح کاملاً دقیق (100 متر) ایجاد میکند. تولید و به روز رسانی نقشه های CORINE یک فرآیند طولانی و پرهزینه است [ 13]: تصاویر به دست آمده توسط سنجش از دور به عنوان منبع اصلی برای استخراج اطلاعات پوشش زمین، از طریق یک سری فعالیتهای تفسیر عکس، تصحیح عمودی و انواع فعالیتهای تضمین کیفیت استفاده میشوند. نقشه های CORINE به عنوان داده های شطرنجی در دسترس هستند. برای مثال، بهروزرسانی دسامبر 2013 بهصورت آنلاین برای دانلود در دسترس است ( ر.ک. http://www.eea.europa.eu/data-and-maps/data/corine-land-cover-2006-raster-3 ) . رویههای استاندارد شده و پیشنهاد شده توسط CORINE سپس در سطح محلی و منطقهای نیز با فرکانس بهروزرسانی بسیار متفاوت اجرا میشوند که اغلب نه تنها به استراتژی برنامهریزی شهری محلی، بلکه به در دسترس بودن منابع انسانی و اقتصادی برای تکمیل فرآیند بستگی دارد. .
به دلیل این هزینهها، یافتن راهحلهای «ارزان» جایگزین یا اضافی برای فرآیند بهروزرسانی و طبقهبندی کاربری زمین سودمند خواهد بود. به عبارت دیگر، ما می خواهیم امکان بهره برداری از مجموعه داده هایی را که باز و/یا رایگان هستند و از تولید یا به روز رسانی مجموعه داده های گران قیمت دیگر مانند نقشه های موضوعی CORINE پشتیبانی می کنند را بررسی کنیم. در این مقاله، ما به صورت تجربی فرضیه خود را با استخراج کاربری زمین شهری از دادههای مکانی باز مرتبط، آزمایش میکنیم.
محبوبترین و جامعترین منبع در به اصطلاح وب جغرافیایی، احتمالاً OpenStreetMap (OSM؛ رجوع کنید به http://www.openstreetmap.org/ )، مجموعه دادههای فضایی رایگان، قابل ویرایش و تولید شده توسط کاربر است که به نامهای دیگر نیز شناخته میشود. ویکی پدیای نقشه ها OpenStreetMap شامل یک پایگاه دانش فضایی بزرگ است که به طور فزاینده ای از طریق تلاش های داوطلبانه اطلاعات جغرافیایی (VGI [ 14 ]) جمع آوری و مدیریت می شود، به عنوان مثال ، از طریق تلاش های مشارکتی که از یک شهروند دانشمند یا رویکرد جمع سپاری [ 15] پیروی می کند.]. این شامل یک توصیف بسیار غنی از زمین از نظر ویژگیهای فضایی (نقاط و چندضلعیها) است، که بیشتر توسط مجموعهای از جفتهای نیمه کنترل شده ارزش کلید (به عنوان مثال، امکانات رفاهی: رستوران یا اوقات فراغت: پارک ) توصیف میشوند . جامعه وب معنایی، با تجزیه و تحلیل استفاده از آن جفت های کلید-مقدار، LinkedGeoData (LGD [ 16 ]) را با نگاشت خصوصیات OSM در یک هستی شناسی و انتشار مجدد مجموعه داده OSM به عنوان داده های پیوندی ایجاد کرد [ 17 ].
ادامه مقاله به شرح زیر است: بخش 2 آماده سازی و پیش پردازش داده ها را نشان می دهد. بخش 3 روش شناسی دنبال شده در آزمایش ها را شرح می دهد. بخش 4 ، بخش 5 و بخش 6 نتایج تجربی ما را با یک بحث مفصل در بخش 7 ارائه می کند . هدف بخش 8 مقایسه یافته های ما با رویکردهای پیشرفته است. در نهایت، در بخش 9 ، ما برخی از نتایج را بیان می کنیم.
2. آماده سازی داده ها
در این بخش، ترکیبی از انتخابهای دستی و رویکردهای خودکار را که در آزمایشهای خود انجام میدهیم، نشان میدهیم. ما انتخاب و خصوصیات فضایی چهار منطقه شهری را توضیح میدهیم، و سپس، برای درک بهتر بخشهای زیر، جزئیاتی در مورد متغیرهای ورودی و خروجی آزمایشهای طبقهبندی خود ارائه میدهیم.
2.1. تفکیک فضایی مناطق منتخب شهری
تفکیک فضایی و همچنین توصیف فضایی مناطق شهری چهار شهر منتخب باید یکسان باشد تا کلیت رویکرد ما آزمایش شود. برای ارائه یک وضوح فضایی معقول و یکنواخت، ما یک شبکه منظم از سلولهای مربعی را برای تقسیم هر فضای شهری اتخاذ میکنیم.
برای داشتن وسعت زمین قابل مقایسه در شهرهای مختلف، مساحتی معادل 625 کیلومتر مربع را برای هر شهر انتخاب می کنیم. بنابراین شبکه از 10000 سلول مربع 250 متری تشکیل شده است. این منطقه هم کل کلان شهر و هم روستاها و اراضی اطراف را شامل می شود. همانطور که در ادامه توضیح داده شد، آن شبکههای شهری در آزمایشهای ما به عنوان یک مرجع و توصیف فضایی یکنواخت برای مجموعه دادههای ورودی و خروجی استفاده میشوند. به عبارت دیگر، هر شهر 10000 نمونه برای آموزش و آزمایش طبقهبندی کاربری اراضی شهری ارائه میکند.
2.2. پیش پردازش داده های CORINE
اطلاعات CORINE به عنوان داده های شطرنجی برای کل قلمرو اروپا ارائه می شود. بنابراین، ما باید (1) روی شهرهای انتخاب شده تمرکز کنیم و (2) اطلاعات CORINE را بر روی شبکه های شهر ارائه دهیم. هر دو فعالیت را می توان از طریق استفاده از یک GIS مانند QGIS پیاده سازی کرد.
فعالیت قبلی با استخراج بخش جغرافیایی از تصویر شطرنجی CORINE در سراسر اروپا، با استفاده از جعبه مرزی شبکههای شهر تحقق مییابد. فعالیت دوم یک عملیات تقاطع بین لایه CORINE و شبکه شهری را اعمال می کند. نتیجه یک لایه برداری است که برای هر سلول شبکه ای شهر، ترکیب آن را با توجه به طبقه بندی CORINE مشخص می کند. به عنوان مثال، یک سلول می تواند ترکیبی از 60٪ منطقه مسکونی متراکم (رده 111، بافت شهری پیوسته)، 15٪ خیابان ها (رده 122، شبکه های جاده ای و ریلی و زمین های مرتبط) و 25٪ پارک (رده 141، مناطق سبز شهری باشد. ). به دلیل مقیاس نسبتاً کوچک شبکه سلولی، ما اطلاعات کاربری زمین را با در نظر گرفتن استفاده از زمین غالب برای هر سلول شبکه ساده می کنیم .، دسته CORINE که بیشترین سهم از مساحت سلول را پوشش می دهد (در مثال بالا، آن سلول دارای رده 111 به عنوان کاربری غالب زمین است، زیرا 60٪ از سطح سلول را نشان می دهد).
مقولههای کاربری زمین CORINE با یک طبقهبندی چند سطحی کاملاً دقیق شامل بیش از 40 کلاس در عمیقترین سطح سلسله مراتب توصیف میشوند [ 13 ]. با این حال، برای هدف آزمایشهای طبقهبندی ما، ترجیح میدهیم تعداد کلاسهای خروجی مورد انتظار را با توجه به دستههای اصلی بیش از 40 CORINE کاهش دهیم. در واقع، معمولاً الگوریتمهای طبقهبندی، مسئله چند طبقهای را بهعنوان مسائل طبقهبندی باینری متعدد مدیریت میکنند: با استفاده از رویکرد یک در برابر یک، k ( k – 1 ) / 2ک(ک–1)/2طبقهبندیکنندههای باینری آموزش داده میشوند، که k تعداد کلاسها است ( برای طبقهبندی چند کلاسه SVM رجوع کنید به [ 18 ]). انتخاب دسته بندی کاربری مناسب به شرح زیر انجام می شود.
با توجه به اینکه هر سلول با بردار درصدهای متعلق به هر کاربری توصیف میشود، ما خوشهبندی K-means [ 19 ] را روی این بردارها انجام میدهیم تا بفهمیم چگونه این مقادیر به طور طبیعی با هم گروهبندی میشوند و بنابراین، کدام نوع کاربریها میتوانند کنار هم قرار گیرد. ما خوشهبندی را در همه شهرها تکرار میکنیم و نتایج قابل مقایسه را هم از نظر تعداد خوشه (همگرایی در k = 5) و هم از نظر ترکیب خوشه به دست میآوریم. بنابراین میتوان این خوشهبندی را قوی، کلی و مناسب برای توصیف محیط شهری دانست.
با تجزیه و تحلیل ترکیب خوشههای حاصل از نظر کاربریها، متوجه میشویم که هر خوشه با مجموعهای از کاربریهای زمین مشخص میشود، که میتوانیم توضیح معناداری در مورد آن ارائه دهیم: خوشه 1 مناطق مسکونی متراکم را شناسایی میکند (مطابق با CORINE رده 111)، خوشه 2 مناطق مسکونی پراکنده (رده 112)، خوشه 3 مناطق صنعتی و تجاری (رده های 12x و 13x)، خوشه 4 مناطق کشاورزی (رده های 2xx) و خوشه 5 پارک ها و مناطق طبیعی (رده ها) 14x، 3xx، 4xx و 5xx).
در نتیجه این مرحله، تصمیم میگیریم دستههای CORINE را که مشخصه خوشهها هستند به عنوان طبقهبندی خروجی خود گروه بندی کنیم. سلول های شبکه شهرهای انتخاب شده با در نظر گرفتن کاربری غالب آنها (همانطور که در بالا توضیح داده شد) به آن پنج طبقه نگاشت می شوند. توزیع سلول در پنج کلاس برای میلان، بروکسل، مونیخ و بارسلونا در شکل 1 نشان داده شده است .

شکل 1. توزیع سلولی در شهرهای انتخاب شده (2013).
در حالی که ما سعی کردیم طبقات را تا حد امکان متعادل از نظر کاردینالیته تعریف کنیم، با مشاهده شکل 1 ، مشهود است که شهرهای ما تفاوت های واضحی را نشان می دهند. این نشان دهنده ساختار و ماهیت ذاتی یک شهر و اطراف آن است: به عنوان مثال، منطقه بارسلون دارای زمین های طبیعی زیادی است (طبقه “طبیعت”)، در حالی که منطقه میلان فاقد این طبقه است و سرشار از زمین های زراعی و مزارع برنج است (” کشاورزی»).
2.3. پیش پردازش داده های مکانی باز پیوند داده شده
به دلیل پوشش جغرافیایی بسیار گسترده، و همچنین وضوح فضایی متوسط، ما OpenStreetMap/LinkedGeoData را به عنوان منبع متغیرهای اطلاعات جغرافیایی خود انتخاب می کنیم تا به عنوان پیش بینی کننده در آزمایش های طبقه بندی استفاده شوند.
به منظور مشخص کردن سلولهای شبکه فضایی با دادههای OSM/LGD، اطلاعات کیفی و مکانی را به مجموعهای از متغیرهای کمی تبدیل میکنیم. برای این منظور، ابتدا مجموعه ای از 50 دسته POI را انتخاب می کنیم که می توانند منظر شهری را مشخص کنند. فهرست 1 فهرست کاملی از مفاهیم هستی شناسی LGD انتخاب شده مورد استفاده در آزمایشات ما را گزارش می دهد. سپس، برای هر دسته POI، یک متغیر عددی ایجاد می کنیم که شبکه های سلولی را توصیف می کند.
ما باید هر سلول شبکه را از نظر محیط اطرافش توصیف کنیم. در ابتدا، ما فکر کردیم که از چگالی POI به عنوان یک معیار کمی استفاده کنیم، اما به دلیل وضوح فضایی بسیار متوسط، این یک بعد نامناسب بود. بنابراین، ما یک روش متداول از تفکر و تحلیل فضای شهری را اتخاذ کردیم، به عنوان مثال در تجارت املاک: هنگام انتخاب محل خرید یا اجاره خانه، معمولاً فاصله تا نزدیکترین مغازه ها، حمل و نقل عمومی، مدرسه و غیره را ارزیابی می کنیم .
فهرست 1. دستههای نقطه مورد علاقه (POI) از LinkedGeoData مورد استفاده در آزمایشهای ما. پیشوند lgdo: فضای نام هستی شناسی LinkedGeoData را مخفف می کند.
| lgdo: اثر هنری | lgdo: پزشکان | lgdo: بیمارستان | lgdo: پارکینگ | lgdo: رستوران |
| lgdo: جاذبه | lgdo: آب آشامیدنی | lgdo: هتل | lgdo: داروخانه | lgdo: مدرسه |
| lgdo: بانک | lgdo: EmergencyThing | lgdo: مهدکودک | lgdo: مکان عبادت | lgdo: SportThing |
| lgdo: بار | lgdo: مزرعه | lgdo: کیوسک | lgdo: پلیس | lgdo: سوپرمارکت |
| lgdo: پارکینگ دوچرخه | lgdo: فست فود | lgdo: کتابخانه | lgdo: PostOffice | lgdo: استخر شنا |
| lgdo: کتابفروشی | lgdo: چشمه | lgdo: بازار | lgdo: PowerThing | lgdo: تاکسی |
| lgdo: BusStop | lgdo: FuelStation | lgdo: موزه | lgdo: میخانه | lgdo: تئاتر |
| lgdo: سینما | lgdo: مبلمان | lgdo: روزنامه فروشی | lgdo: PublicBuilding | lgdo: اطلاعات گردشگری |
| lgdo: لباس | lgdo: ورزشگاه | lgdo: کلوپ شبانه | lgdo: Public TransportThing | lgdo: دانشگاه |
| lgdo: فروشگاه بزرگ | lgdo: HistoricThing | lgdo: پارک | lgdo: ایستگاه راه آهن | lgdo: WaterwayThing |
فهرست 2. الگویی برای جستارهای GeoSPARQL از طریق LinkedGeoData برای بدست آوردن فاصله از یک سلول شبکه تا نزدیکترین نقطه نقطه از یک دسته معین.
PREFIX lgdm: < http://linkedgeodata.org/meta/ > پیشوند geom: < http://geovocab.org/geometry# > PREFIX ogc: < http://www.opengis.net/ont/geosparql# > SELECT ?mydistance # نزدیکترین فاصله را انتخاب کنید جایی که { ?poi a @@ POI_CATEGORY@ @, lgdm:Node ; # POI های متعلق به یک دسته خاص را دریافت کنید geom:geometry [ ogc:asWKT ?wkt ]. # نمایش فضایی POI را دریافت کنید BIND ( bif:st_point(@@ LONGITUDE@ @, @@ LATITUDE@ @) AS ?mypoint ) # مرکز سلول شبکه یک نقطه با مختصات است BIND ( bif:st_distance(?wkt, ?mypoint) AS ?mydistance ) # فاصله بین POI و سلول شبکه را محاسبه کنید FILTER ( ?فاصله من < @@ MAX_DISTANCE@ @ ) # فقط POI را در یک محدوده معین دریافت کنید (مثلاً حداکثر 25 کیلومتر) } ORDER BY ASC(?mydistance) # نتیجه سفارش بر اساس مسافت LIMIT 1 # اولین (نزدیکترین) را بگیرید |
در نتیجه، هر سلول با 50 بعد کمی توصیف میشود، یکی برای هر دسته POI، که نشاندهنده فاصله مرکز سلول تا نزدیکترین POI یک دسته معین است. برای محاسبه این ابعاد، بهجای جستجو در OpenStreetMap، از نسخه حاشیهنویسی معنایی LinkedGeoData استفاده کردیم که به طور خودکار جفتهای کلید-مقدار مختلف OSM را در مفاهیم LGD فهرست 1 ترسیم میکند . پرس و جو برای LinkedGeoData از الگوی پرس و جو GeoSPARQL [ 20 ] نشان داده شده در فهرست 2 پیروی می کند . با 50 دسته POI و چهار شهر اروپایی، که هر کدام با 10000 سلول، در مجموع، دو میلیون پرس و جو را برای استخراج پیش بینی کننده های طبقه بندی اجرا می کنیم.
3. آزمایش های مقدماتی طبقه بندی کاربری زمین
آزمایشهای ما برای آموزش مدلهای پیشبینی طراحی شدهاند که با در نظر گرفتن متغیرهای پیشبینی ورودی مشتقشده از مجموعه داده POI LinkedGeoData، قادر به پیشبینی کاربری زمین شهری هستند. به طور خاص، از آنجایی که CORINE یک طبقه بندی است، ما با یک مشکل طبقه بندی مواجه هستیم، به این معنا که می خواهیم محیط شهری را بر اساس کاربری زمین آن طبقه بندی کنیم.
چندین الگوریتم طبقهبندی وجود دارد، و ما تعدادی از آنها را آزمایش کردیم – طبقهبندیکنندههای آماری خطی، درجه دوم و لجستیک [ 21 ] و جنگلهای تصادفی، شبکههای عصبی و ماشین بردار پشتیبان (SVM) تکنیکهای یادگیری ماشین نظارت شده [ 22 ] – برای درک بهترین تناسب ممکن. برای حل مشکل ما، مشابه [ 23 ] برای پیش بینی ویژگی تصاویر سنجش از دور. با این حال، برخلاف آن کار، در مورد ما، مشاهده کردیم که عملکرد طبقهبندیکنندههای آماری ساده با تکنیکهای پیچیدهتر یادگیری ماشین نظارتشده قابل مقایسه نیست و بهویژه، SVM [24] بهترین نتایج را به دست آورد.
در بخش های بعدی، ما فقط نتایج به دست آمده با استفاده از SVM را نشان می دهیم. طبقهبندیکنندهها با اعتبارسنجی متقاطع 10 برابری آموزش داده شدند و پارامترهای آن با اصطلاح بهینهسازی جستجوی شبکه تنظیم شدند [ 25 ]. بهینه سازی تلاش می کند تا حساسیت هر کلاس را به حداکثر برساند و تفاوت بین کلاس ها را به حداقل برساند. ارزیابی آزمایشهای ما ( ر.ک. بخش 4 ، بخش 5 و بخش 6 ) از نظر دقت طبقهبندی کلی، حساسیت و ویژگی کلاسهای خروجی مختلف، ماتریس سردرگمی و نقشههای خطا ارائه شده است .
آزمایشهای ما بهصورت مجموعهای از مراحل متوالی به شرح زیر طراحی شدهاند: ابتدا، کاربری هر شهر را بهطور جداگانه طبقهبندی میکنیم، مدلی را برای هر شهر آموزش میدهیم و دادههای دیده نشده همان شهر را پیشبینی میکنیم (انتخاب مدل خاص شهر). سپس، روششناسی خود را با ایجاد یک مدل واحد مناسب برای پیشبینی چندین شهر تعمیم میدهیم و با استفاده از دانش قبلی در مورد همه شهرهای درگیر آموزش میدهیم (انتخاب مدل بین شهری با دانش پیشزمینه). در نهایت، با پیشبینی یک شهر با استفاده از مدلهایی که با استفاده از چندین شهر مختلف آموزش داده شدهاند، مدل خود را حتی عمومیتر میکنیم، یعنی بدون هیچ دانش قبلی در مورد شهری که باید پیشبینی شود (انتخاب مدل بین شهری بدون دانش پسزمینه).
تمام مطالب مربوط به پروتکل آزمایشی ما (مجموعه داده ها، پرس و جوها، اسکریپت ها، تجسم ها) در وب سایت همراه این مقاله به آدرس http://swa.cefriel.it/geo/ijgi.html در دسترس است .
4. انتخاب مدل خاص شهر
با فرض اینکه هر منطقه شهری ویژگی های متمایز خود را دارد، ما تصمیم گرفتیم آزمایش های خود را با تجزیه و تحلیل هر شهر به طور جداگانه آغاز کنیم تا مدلی بسازیم که بتواند هر الگوی شهری خاص را توصیف کند.
ما با استفاده از الگوریتم SVM که با بهترین پارامترهای کشف شده در مرحله بهینه سازی جستجوی شبکه ای (همانطور که در بخش 3 توضیح داده شده است ) با اعتبار دهی متقاطع 10 برابری تنظیم شده است، مدلی را برای هر یک از شهرهای انتخابی خود (میلانو، مونیخ، بارسلونا، بروکسل) آموزش دادیم. .
متداولترین و شهودیترین معیاری که برای ارزیابی عملکرد یک طبقهبندیکننده استفاده میشود، بدون شک دقت کلی است، که تعداد موارد طبقهبندی صحیح را بر تعداد کل موارد اندازهگیری میکند. مقادیر دقت کلی در جدول 1 نشان می دهد که SVM یک طبقه بندی قوی است، زیرا در هر چهار آزمایش مختلف بسیار خوب عمل می کند (مقادیر مشابه برای چهار شهر و همه دقت های بیشتر از 0.80). ضریب کاپا کوهن آمار دیگری است که برای اندازهگیری توافق بین ارزیابها برای اقلام طبقهبندی شده استفاده میشود، که عموماً یک معیار کاملاً قوی است، زیرا توافق تصادفی را در نظر میگیرد. ضرایب کاپا در جدول 1نشان می دهد که توافق قابل توجهی بین پیش بینی SVM و کاربری های واقعی زمین (مقادیر بیشتر از 0.74) وجود دارد.
بررسی عمیقتر نحوه رفتار طبقهبندیکنندهها در کلاسهای مختلف نیز میتواند با تجزیه و تحلیل شاخصهای حساسیت و ویژگی که در جدول 1 فهرست شده است انجام شود . این جدول وجود تفاوتهای بین طبقاتی را نشان میدهد که بیشتر در شاخص حساسیت مشهود است، که تنوع بالایی را با مقادیری از حداقل 0.75 تا حداکثر 0.90 نشان میدهد. در مقابل، ویژگی همیشه بسیار بالا و بیشتر از 0.90 است. این بدان معناست که از یک طرف، طبقهبندیکننده ما بهطور متوسط قادر است برخی از کلاسها را بهتر از سایرین پیشبینی کند، و از سوی دیگر، سلولهایی را که به یک کلاس معین تعلق ندارند، به درستی شناسایی میکند.
با نگاه کردن به جدول 1 از منظر بین شهری، اولاً مشاهده می کنیم که مقادیر حساسیت یک طبقه کاملاً با یکدیگر متفاوت است (به جز کلاس “مسکونی متراکم”) و ثانیاً بدترین پیش بینی شده کلاس همیشه یکسان نیست (کلاس «طبیعت» برای میلانو، کلاس «صنعتی» برای مونیخ و کلاسهای «مسکونی پراکنده» و «کشاورزی» برای بارسلونا). اگر به شکل 1 برگردیم، می توانیم یک مطابقت بین کاردینالیته پایین کلاس و مقدار کم حساسیت را مشاهده کنیم (برای مثال کلاس “Nature” در میلانو فقط 387 نمونه و حساسیت 0.75 دارد). اگرچه به نظر می رسد SVM یک الگوریتم بسیار قوی است، این رفتار به ما نشان می دهد که داشتن یک مجموعه داده نامتعادل می تواند تأثیر قابل توجهی بر قدرت پیش بینی مدل داشته باشد.

جدول 1. دقت کلی، ضریب کاپا، حساسیت و ویژگی پنج کلاس (مسکونی متراکم، مسکونی پراکنده، صنعتی، کشاورزی، طبیعت).
برای تجزیه و تحلیل بهتر این نتایج، ما تحقیقات خود را در مورد هر شهر عمیق می کنیم. به دلایل فضایی، از این پس، ما فقط ملاحظات خود را در مورد مونیخ، که شهری است که به طور متوسط، طبقه بندی کننده ما در آن بهتر عمل می کند (87٪ دقت کلی و بالاترین مقادیر حساسیت) و بروکسل، که شهری است، گزارش می کنیم. کمترین دقت کلی (82%). دو شهر دیگر رفتار بسیار مشابهی از خود نشان می دهند و خوانندگان علاقه مند می توانند تمام ماتریس های سردرگمی و نقشه های خطای چهار شهر را در وب سایت همراه بیابند.
با نگاهی به ماتریس های سردرگمی (نرمال شده) (به جدول 2 مراجعه کنید )، می توانیم نحوه انتشار خطاهای پیش بینی در تمام کلاس ها را تجزیه و تحلیل کنیم. به عنوان مثال، اگر به کلاس پیشبینیشده «مسکونی متراکم» در جدول 2 a نگاه کنیم، میبینیم که 88 درصد سلولها به درستی پیشبینی شدهاند و سلولهای باقیمانده عمدتاً بهصورت نادرست بهعنوان کلاس «مسکونی پراکنده» (7 درصد) برچسبگذاری شدهاند. ; این منطقی است، زیرا هر دو مناطق مسکونی را توصیف می کنند. پیشبینی کلاس «صنعتی» سختترین است، زیرا میزان صحت آن چندان بالا نیست (78%)، و خطا به طور مساوی بین سه کلاس دیگر پخش میشود (10 درصد کلاس «مسکونی پراکنده»، 6 درصد طبقه کشاورزی» و 5 درصد کلاس «طبیعت»).
بدترین شهر، بروکسل (جدول 2b)، رفتار مشابهی را نشان می دهد، به جز طبقات «مسکونی پراکنده» و «کشاورزی» که به ترتیب 11 درصد و 17 درصد بالاترین میزان طبقه بندی غلط را دارند.
علاوه بر این تجزیه و تحلیل کمی، ما یک بازرسی کیفی از خطاهای طبقهبندی را با رسم سلولهای طبقهبندی اشتباه مونیخ روی نقشه انجام دادیم. هدف ما شناسایی الگوهای ممکن در توزیع فضایی خطاها است. ما تأیید کردیم که همه شهرها رفتار یکسانی از خود نشان میدهند، هم از نظر جابجایی فضایی خطاها و هم از نظر نوع طبقهبندی اشتباه.
جدول 2. ماتریس سردرگمی مونیخ و بروکسل با پنج طبقه (مسکونی متراکم، مسکونی پراکنده، صنعتی، کشاورزی، طبیعت). مدل مخصوص شهر با 50 پیش بینی و همه مشاهدات. ( الف ) بهترین شهر: مونیخ. ( ب ) بدترین شهر: بروکسل.

( الف )

( ب )
شکل 2 توزیع فضایی سلول های طبقه بندی نادرست در مونش را نشان می دهد. در شکل 2a ، خطاها به صورت سلول های سیاه رنگ در کل منطقه مونیخ نشان داده شده اند، که در غیر این صورت با توجه به کلاس های کاربری زمین به درستی پیش بینی شده رنگ می شوند. بدیهی است که تمام خطاها در “مرز” بین مناطق با کاربری همگن قرار دارند. شکل 2b در بخشی از نقشه بزرگنمایی می کند تا انواع خطاها را بهتر تجسم کند: رنگ مربع کوچک در مرکز هر سلول طبقه بندی اشتباه به صورت بصری کلاس پیش بینی شده (مناسب) را نشان می دهد و بنابراین می تواند با رنگ پس زمینه که نشان دهنده کلاس صحیح است مقایسه شود. .
متوجه می شویم که طبقه بندی کننده همیشه کلاس یک سلول را با کلاس یکی از سلول های مجاور خود اشتباه می کند. این در واقع معقول است: سلولهای موجود در آن «مرزها» به احتمال زیاد از کاربریهای مخلوط تشکیل شدهاند، در حالی که در تحلیل ما، ما فقط کاربری غالب زمین را در نظر گرفتیم (به بخش 2 مراجعه کنید ) . علاوه بر این، هر چه مناطق همگن کوچکتر و “کروی شکل” تر باشند، خطاها بیشتر می شود.

شکل 2. توزیع فضایی سلول های طبقه بندی نادرست در مونش. “مسکونی متراکم” = قرمز؛ “Sparse Residential” = نارنجی; “صنعتی” = زرد؛ «کشاورزی» = سبز؛ و “طبیعت” = آبی. ( الف ) سلول های طبقه بندی شده اشتباه (نقاط سیاه) در کل منطقه مونشن؛ ( ب ) انواع خطا در ناحیه بزرگنمایی شده.
5. انتخاب مدل بین شهری با مقداری دانش پیش زمینه
از آنجایی که ما نتایج رضایت بخشی را در پیش بینی کاربری اراضی یک شهر از نظر دقت کلی، ضریب کاپا کوهن و حساسیت به دست آوردیم، تحقیقات خود را ادامه می دهیم تا بررسی کنیم که آیا امکان ساخت یک مدل بین شهری واحد با استفاده از دانش پیشینه وجود دارد یا خیر. از هر شهر در نظر گرفته شده در تحلیل.
منطقی استفاده از دانش پیشینه این است که آن مدلهای طبقهبندی میتوانند برای بهروزرسانی نقشههای کاربری زمین، به عنوان مثال، برای شناسایی مناطق خاصی که کاربری زمین در آنها تغییر کرده باشد، برای تمرکز بر نگهداری دستی گران قیمت نقشههای کاربری زمین، تنها در جایی که در آن قرار دارد، استفاده شود. در واقع مورد نیاز است.
برای بررسی اینکه آیا مدل بین شهری قادر به پیشبینی طبقهبندی کاربری زمین سلولهای ناشناخته است، ما زیر مجموعههای مختلفی از مجموعه دادههای اصلی خود را ایجاد میکنیم: مجموعهای آموزشی از هر چهار شهر، که مدل با اعتبارسنجی متقاطع 10 برابری بر روی آن ساخته شده است. و یک مجموعه تست برای هر شهر برای بررسی دقت الگوریتم.
ما از دو استراتژی نمونه برداری برای بررسی میزان اطلاعات مورد نیاز در مرحله آموزش استفاده می کنیم: از یک طرف، ما 200 سلول برای هر کلاس و برای هر شهر نگه می داریم، مجموعه آموزشی از 4000 مشاهده (1000 مشاهده برای هر شهر) و سه تست را به دست می آوریم. مجموعههای 9000 واحدی هر کدام، یعنی تفاوت بین 10000 سلول هر شهر و 1000 سلول مورد استفاده در آموزش (متعادل در شهرها، متعادل بر اساس کلاسها (BCi.BCl)). از سوی دیگر، ما از یک سوم از 40000 سلول اصلی به عنوان مجموعه آموزشی استفاده می کنیم، با توجه به نسبت اصلی پنج کلاس در سراسر شهرها، و سلول های باقی مانده را به عنوان مجموعه آزمایشی (طبقه بندی شده در شهرها، طبقه بندی شده بر روی کلاس ها (SCi.SCl) ).
به طور طبیعی، منطقی است که انتظار داشته باشیم هرچه تعداد سلول های مورد استفاده در تمرین بیشتر باشد، مدل پیش بینی در سلول های ناشناخته قابل اعتمادتر است. انتظارات ما با نگاه کردن به جدول 3 تأیید می شود، که دقت کلی پیش بینی و ضریب کاپا کوهن را برای هر شهر و برای هر استراتژی نمونه گیری نشان می دهد: آنها همیشه در آزمایش SCi.SCl بالاتر هستند.

جدول 3. دقت کلی و ضرایب کاپا به دست آمده از یک مدل بین شهری با آموزش دانش پس زمینه (با استفاده از همه 50 پیش بینی کننده). BCi.BCl، متوازن بر شهرها، متوازن بر طبقات. SCi.SCl، طبقه بندی شده در شهرها، طبقه بندی شده بر روی طبقات.
علاوه بر این، در این مجموعه دوم از آزمایشها، طبقهبندی بهترین عملکرد را در مونیخ به دست میآورد، بنابراین ما با تجزیه و تحلیل ماتریس سردرگمی در جدول 4 a که دقت پیشبینی مدل را در همه موارد نشان میدهد، ملاحظات عمیقی را در مورد این شهر ارائه میکنیم. کلاس ها
جدول 4. ماتریس سردرگمی مونیخ و میلانو با پنج طبقه (مسکونی متراکم، مسکونی پراکنده، صنعتی، کشاورزی، طبیعت). نتیجه به دست آمده با یک مدل بین شهری با دانش پس زمینه نمونه برداری شده با SCi.SCl و 50 پیش بینی کننده. ( الف ) بهترین شهر: مونیخ. ( ب ) بدترین شهر: میلانو.

( الف )

( ب )
با نگاه کردن به عناصر مورب، که نشان دهنده درصد سلول های طبقه بندی شده به درستی هستند، می بینیم که مدل به خوبی مناطق کشاورزی را پیش بینی می کند (85%)، در حالی که در طبقه بندی سلول های متعلق به کلاس “مسکونی متراکم” دقت کمتری دارد. (71%). ما میتوانیم این نتیجه بدتر را با تجزیه و تحلیل نحوه انتشار خطاهای این کلاس در کلاسهای دیگر توجیه کنیم: 21٪ از سلولهایی که بهطور اشتباه به عنوان کلاس «مسکونی متراکم» پیشبینی شدهاند، متعلق به کلاس «مسکونی پراکنده» هستند، و باز هم، این معقول است.
علاوه بر این، جدول 4 b نتایج دقیق میلانو، شهری با کمترین دقت جهانی (75%) را نشان می دهد. نتایج مشابه هستند، با مقادیر در مورب کمی کمتر.
6. انتخاب مدل بین شهری بدون هیچ گونه دانش پیش زمینه
با توجه به نتایج رضایتبخش بهدستآمده در پیشبینی کاربری یک شهر با استفاده از مدلی که شامل برخی اطلاعات پیشزمینه در مورد خود شهر است، تصمیم میگیریم تکرارپذیری و عمومیت رویکرد خود را با پیشبینی شهری بدون دانش قبلی، یعنی بدون داده های مربوط به آن شهر در مرحله آموزش مورد استفاده قرار گرفت.
بنابراین، ما یک طبقهبندیکننده را با سه شهر از چهار شهر موجود آموزش میدهیم، و چهارمی را پیشبینی میکنیم، که در مرحله مدلسازی کاملاً کنار گذاشته میشود ( یعنی مونیخ را با استفاده از مدل آموزشدیده در میلان، بارسلونا و بروکسل پیشبینی میکنیم).
6.1. طبقه بندی با پنج سطح
ابتدا، ما یک مدل SVM را با استفاده از همه پیشبینیکنندهها (50 فاصله POI) و همه مشاهدات (30000 سلول، 10000 برای هر شهر مورد استفاده در آموزش) آموزش میدهیم. همانطور که در ادامه به تفصیل خواهیم دید، مقادیر دقت کلی، به دست آمده از پیش بینی تمام 10000 سلول شهر چهارم، بسیار پایین است و از 14٪ تا 40٪ متغیر است. این بدان معناست که طبقهبندیکننده قدرت پیشبینی ضعیفی دارد و میتوانست بیش از حد برازش داشته باشد (مدل به خوبی در مجموعه آزمایش تعمیم نمییابد).
برای پرداختن به این موضوع، آزمایشهای بیشتری را طراحی میکنیم که تعداد متغیرهای پیشبینیکننده و نمونههای آموزشی را کاهش میدهد.
با توجه به تعداد مشاهدات، ما سه استراتژی زیر نمونه برداری را اتخاذ می کنیم: (1) داده های خود را به روشی متعادل نمونه برداری می کنیم، به طور تصادفی 200 مشاهده را برای هر طبقه کاربری زمین و برای هر شهر انتخاب می کنیم (متوازن بر اساس شهرها و متوازن بر طبقات (BCi) BCl))، بنابراین با استفاده از 3000 مشاهدات از مجموعه اصلی. (2) ما یک سوم از 30000 مشاهدات اصلی را به روش طبقه بندی شده بر اساس طبقات کاربری زمین و شهرها (طبقه بندی شده در شهرها و طبقه بندی شده بر روی طبقات (SCi.SCl)) انتخاب می کنیم. (3) ما یک راه حل ترکیبی را اتخاذ می کنیم، یک سوم از 30000 مشاهدات اصلی را به روش طبقه بندی شده بر اساس طبقات و به روشی متعادل با توجه به شهرها (متوازن بر روی شهرها و طبقه بندی شده بر اساس طبقات (BCi.SCl)) نمونه برداری می کنیم. ما آن راه حل های مختلف را آزمایش می کنیم تا با مسائل شناسایی شده در آزمایش شهر واحد روبرو شویم (cf . بخش 4 ) در مورد تأثیر کاردینالیته کلاس های مورد استفاده در مجموعه آموزشی بر نتایج ارزیابی (هرچه کاردینالیته کمتر باشد، شاخص های عملکرد کمتر است).
با توجه به انتخاب متغیر، ما همه پیشبینیکنندهها را بر حسب به دست آوردن اطلاعاتشان، که بر اساس آنتروپی شانون [ 26 ] محاسبه میشود، رتبهبندی میکنیم، که ناهمگونی دادهها را با توجه به طبقات کاربری زمین اندازهگیری میکند. سپس، پنج متغیر برتر و ۱۱ متغیر برتر را بر اساس ناپیوستگیهای آشکار در مقادیر کسب اطلاعات انتخاب میکنیم. هدف این روش تنها انتخاب آموزندهترین پیشبینیکنندهها، اجتناب از برازش بیش از حد مدل است.
متغیرهای انتخابی که در فهرست 3 فهرست شدهاند، نشاندهنده فواصل تا نزدیکترین POI دستههای زیر هستند: امکانات عمومی (مدرسهها، داروخانهها و بانکها)، حملونقل (ایستگاههای اتوبوس، راهآهن و جایگاههای سوخت) و امکانات رفاهی (رستورانها، سینماها و مغازهها) .
شکل 3 توزیع پنج متغیر برتر را برای هر شهر نشان می دهد: در واقع، به نظر می رسد که آن فواصل خاص POI تفاوت مربوطه را بین چهار شهر نشان نمی دهد. این شباهت می تواند نشان دهد که یک مدل بین شهری ساخته شده بر روی این پنج پیش بینی کننده می تواند الگوهای شهرهای مختلف را به طور مناسب تری توصیف کند.
فهرست 3. رتبه بندی پیش بینی کننده ها با توجه به به دست آوردن اطلاعات. پیشوند lgdo: فضای نام هستی شناسی LinkedGeoData را مخفف می کند.
| 1. lgdo: داروخانه | 7. lgdo: رستوران |
| 2. lgdo: بانک | 8. lgdo: مدرسه |
| 3. lgdo: BusStop | 9. lgdo: FuelStation |
| 4. lgdo: Railway Station} | 10. lgdo: BookShop} |
| 5. lgdo: سوپرمارکت} | 11. lgdo: سینما} |
| 6. lgdo: PublicTransportThing} |

شکل 3. توزیع در چهار شهر از پنج پیش بینی رتبه برتر، با توجه به کسب اطلاعات آنها.

جدول 5. دقت کلی به دست آمده توسط چندین مدل آموزش دیده با تعداد متفاوت پیش بینی کننده ها و مشاهدات.
همه آزمونهای انجامشده، با تغییر تعداد پیشبینیکنندهها و روشهای نمونهگیری، در جدول 5 نشان داده شدهاند . به طور کلی، مقادیر دقت کلی چندان هیجان انگیز نیستند (هیچ مقادیر بالاتر از 50٪) و تمایل کلی این است که هرچه تعداد پیش بینی ها کمتر باشد، دقت کلی بالاتر است. ضرایب کاپا کوهن نیز از همین گرایش پیروی می کند.
بهترین نتایج بهطور متوسط با استفاده از روشهای نمونهگیری طبقهای (BCi.SCl و SCi.SCl) با پنج پیشبینیکننده به دست میآید. با نگاهی به جدول از منظر بین شهری، میتوان مشاهده کرد که یک بار دیگر، شهر با بهترین نتایج مونیخ است (50 درصد دقت با پنج پیشبینیکننده و نمونهبرداری SCi.SCl)، و شهری با بدترین نتایج، شهر مونیخ است. بارسلونا که به حداکثر دقت 39 درصد می رسد.
ماتریس سردرگمی برای مونیخ ( جدول 6 را ببینیدالف) حاصل از طبقهبندیکننده آموزشدیده با پنج پیشبینیکننده و با نمونهگیری طبقهبندیشده در هر دو کلاس و شهرها (SCi.SCl) ملاحظاتی را که قبلاً در آزمایشهای قبلی مورد بحث قرار گرفت، تقویت میکند. خطای طبقهبندی اشتباه بین کلاس «مسکونی متراکم» و کلاس «مسکونی پراکنده» حتی واضحتر است (۲۰ درصد سلولها بهدرستی بهعنوان کلاس «مسکونی متراکم» طبقهبندی شدهاند و ۶۴ درصد به اشتباه بهعنوان کلاس «مسکونی پراکنده» برچسبگذاری شدهاند)، و همچنین مشکلات در پیشبینی طبقه «مسکونی صنعتی» (خطاهای بالاتر بین طبقات «مسکونی پراکنده»، «کشاورزی» و «طبیعت» پخش میشود). ماتریس سردرگمی همچنین خطاهای طبقهبندی اشتباه مربوطه را بین کلاسهای «کشاورزی» و «طبیعت» برجسته میکند. با این حال، این معقول است.
در مورد بارسلونا (نگاه کنید به جدول 6 ب)، “مسکونی متراکم” و “طبیعت” بهترین طبقات پیش بینی شده هستند، در حالی که تمایز بین سه طبقه دیگر به درستی مدل سازی نشده است، که مشکلات را در تشخیص این نوع کاربری ها نشان می دهد.
از این نتایج، بدیهی است که آموزش طبقهبندیکننده برای پیشبینی کاربری اراضی شهری، بدون دانش قبلی در مورد خود شهر، دشوار است. در واقع، نتایج نشان داده شده در بخش 5(مدل آموزش داده شده با داده های دریافتی از همه شهرها) بسیار بهتر هستند، حتی اگر اطلاعات پیش زمینه کمی به مرحله آموزش داده شود. این می تواند این فرضیه را تقویت کند که هر شهر ویژگی های خاص و الگوهای ذاتی خود را دارد. بنابراین، یک مدل واحد نمی تواند به اندازه کافی کلی برای پیش بینی سایر محیط های شهری ناشناخته باشد. ما این ایده را با انجام یک آزمون فرضیه (“آزمون Z دو نسبت”) بیشتر بررسی می کنیم تا ارزیابی کنیم که آیا چهار شهر انتخاب شده احتمالاً معیارهای مشابهی را در پنج کلاس دریافت می کنند یا خیر. هدف ما این است که بررسی کنیم آیا تفاوت در مقادیر حساسیت و ویژگی بین شهرها از نظر آماری معنیدار است یا خیر.
جدول 6. ماتریس سردرگمی مونیخ و بارسلونا با پنج طبقه (مسکونی متراکم، مسکونی پراکنده، صنعتی، کشاورزی، طبیعت). نتیجه به دست آمده با یک مدل بین شهری با دانش پس زمینه نمونه برداری شده با SCi.SCl و 50 پیش بینی کننده. ( الف ) بهترین شهر: مونیخ. ( ب ) بدترین شهر: بارسلون.

( الف )

( ب )
جدول 7 مقادیر p آزمون فرضیه را ارائه می دهد که برای معیارهای حساسیت و ویژگی محاسبه شده است ( جدول 1 ) ، برای هر زوج شهر و برای هر طبقه. سلول های رنگی نتایجی را برجسته می کنند که از نظر آماری در سطح معنی داری 5 درصد معنی دار نیستند، بنابراین مواردی که فرضیه صفر را نمی توان رد کرد.
نتایج جدول 7 ثابت میکند که در اکثر موارد، تفاوت بین شهرها از نظر آماری معنیدار است (اکثر گلبولهای سفید در جدول)، به جز طبقه «مسکونی متراکم» که در آن تفاوت تقریباً همیشه از نظر آماری معنیدار نیست. از آنجایی که کلاس “مسکونی متراکم” با رده CORINE 111 “بافت شهری پیوسته” مطابقت دارد، همچنین، این نتیجه منطقی به نظر می رسد: آزمایش های ما بر مناطق شهری متمرکز شده اند، و در واقع، این نوع کاربری زمین برای شهرها معمولی تر است.
به طور خلاصه، دلیل محدودیت مدل آموزش داده شده بدون هیچ دانش قبلی احتمالاً در ویژگی های ذاتی هر شهر نهفته است، که آنقدر در مدل طبقه بندی منعکس می شود که نمی توان آنها را در مکان دیگری اعمال کرد، و در پیش بینی های موجود. ، که از مکانی به مکان دیگر قابلیت اطمینان متفاوتی دارند.

جدول 7. p- مقادیر آزمون های فرضیه در مورد تفاوت در حساسیت و ویژگی بین شهرها (“آزمون Z دو نسبت”). طبقه بندی پنج طبقه (مسکونی متراکم، مسکونی پراکنده، صنعتی، کشاورزی، طبیعت)؛ خاکستری تیره: در سطح معنی داری 5 درصد معنی دار نیست. خاکستری روشن: در سطح 10% معنی دار است اما در سطح معنی داری 5% نه.
6.2. طبقه بندی با دو سطح
با در نظر گرفتن نتایج بهدستآمده در طبقهبندی با پنج کلاس و در آزمون فرضیه جدول 7 ، در نهایت بررسی میکنیم که آیا میتوانیم با ساخت یک مدل طبقهبندی تک شهری تنها برای گونهشناسی کاربری اراضی مسکونی، نتایج بهتری به دست آوریم یا خیر. به عبارت دیگر، ما آزمایش می کنیم که آیا شباهت قوی تری بین شهرها را می توان با تغییر سطح دانه بندی طبقه بندی کاربری زمین پیدا کرد. به همین دلیل است که با ادغام کلاسهای «مسکونی متراکم» و «مسکونی پراکنده» و از سوی دیگر، طبقات باقیمانده (صنعتی/تجاری، کشاورزی و مناطق طبیعی)، یک طبقهبندی دو جملهای ایجاد میکنیم.
ما یک طبقهبندی کننده را با استفاده از استراتژی نمونهگیری SCi.SCl که در بخش قبل نشان داده شده است و پنج پیشبینیکننده برتر آموزش میدهیم. ما مقادیر بالایی از دقت کلی را برای همه شهرها به دست می آوریم (از 71٪ بروکسل تا 83٪ از مونیخ). جدول 8 ماتریس سردرگمی به دست آمده برای مونیخ را نشان می دهد. درصد سلولهایی که به درستی طبقهبندی شدهاند در هر دو کلاس بسیار بالا است (76٪ برای مسکونی و 88٪ برای غیر مسکونی).

جدول 8. ماتریس سردرگمی München با یک مدل دوجمله ای نمونه برداری شده با SCi.SCl و 5 پیش بینی کننده به دست آمده است.
اگر به شکل 4 نیز نگاه کنیم ، که توزیع فضایی سلولهای طبقهبندیشده اشتباه را نشان میدهد، میتوانیم متوجه شویم که بیشتر خطاها دوباره در “مرزهای” بین مناطق مسکونی (به رنگ خاکستری تیره) و مناطق طبیعی (به رنگ سفید) قرار دارند. سلول های آبی نشان دهنده سلول هایی هستند که به اشتباه به عنوان مناطق مسکونی طبقه بندی شده اند (24٪ در جدول 8 )، در حالی که سلول های سبز سلول های غیرمسکونی اشتباه پیش بینی شده هستند.
برای جمعبندی این سومین و آخرین مجموعه آزمایشها، با دو کلاس، با توجه به طبقهبندی پنج کلاس، پیشرفت زیادی به دست میآوریم. بنابراین این نتایج نکات ارائه شده توسط آزمون فرضیه و ملاحظات قبلی ما در مورد آن نتایج را تأیید می کند.

شکل 4. خطاهای طبقه بندی دوجمله ای در München (نمونه برداری با SCi.SCl و پنج پیش بینی کننده). خاکستری تیره نشان دهنده مناطق مسکونی است. نقاط آبی سلول هایی هستند که به اشتباه به عنوان مسکونی طبقه بندی می شوند. نقاط سبز سلول هایی هستند که به اشتباه به عنوان غیر مسکونی طبقه بندی می شوند.
7. بحث
آزمایشهای ما نتایج بسیار خوبی (دقت کلی همیشه بالاتر از 75٪) در پیشبینی کاربری اراضی یک شهر هنگام استفاده از طبقهبندیکنندهای که برخی از دانش پیشزمینه خود شهر را در مرحله آموزش آن در نظر میگیرد، نشان داد. بنابراین، ارزیابیهای کمی و کیفی ارائهشده در مقاله از فرضیه ما حمایت میکنند که دادههای مکانی باز مرتبط میتوانند با موفقیت در پشتیبانی از تولید یا بهروزرسانی منابع داده مکانی گران قیمت، مانند مجموعه داده کاربری زمین CORINE [13] استفاده شوند .]. کاربرد در چهار شهر مختلف اروپایی تکرارپذیری و اعتبار کلی روش شناسی ما را نشان داد، مشروط بر اینکه برخی اطلاعات پس زمینه از محیط شهری ارائه شود. میتوان ثابت کرد که راهحل ما برای نظارت و تشخیص تغییرات کاربری زمین مفید است: برای مثال، اگر مدلهای پیشبینی ما که پس از مدتی در همان منطقه شهری اعمال میشوند، پیشبینیهای کاربری متفاوتی را در مناطق محدود نشان میدهند، نقشههای CORINE. تجدید نظر فقط می تواند بر آن مناطق متمرکز شود. به این ترتیب، فرآیند به روز رسانی اطلاعات کاربری زمین می تواند به روشی کم هزینه تر و متناسب تر انجام شود.
نتایج پایینتر بهدستآمده در پیشبینی کاربری زمین شهری بدون هیچ گونه دانش پیشزمینهای از خود شهر، محدودیتهای روششناسی فعلی ما را نشان میدهد، حداقل هنگام استفاده از طبقهبندی پنج سطحی با تنظیمات تجربی نشاندادهشده. در واقع، ما هنگام استفاده از یک طبقهبندی کاربری دو سطحی سادهتر، با تمرکز بر پیشبینی مسکونی در مقابل، نتایج بهتری به دست آوردیم.. مناطق غیر مسکونی علاوه بر این، حرکت از یک طبقهبندی با سطوح انگشت شمار به طبقهبندی کامل CORINE (که شامل سلسله مراتبی بیش از 40 کلاس است) به بررسی بیشتر نیاز دارد. اولین آزمایش ما در آموزش مدلی از تمام کلاسهای CORINE در منطقه میلانو (که در این مقاله گزارش نشده است) منجر به حساسیتهای بالاتر از 70٪ فقط در دو کلاس مربوط به دستههایی با بالاترین کاردینالیته و در حساسیتهای نزدیک به 0٪ در منطقه شد. طبقات اقلیت، که در تعداد بسیار محدودی از سلول های شبکه غالب بودند.
این به این معنی است که برای نتیجهگیری در مورد امکانسنجی پیشبینی طبقهبندی کامل CORINE، مطالعات آینده باید شامل نمونههای بزرگتر و جامعتر باشد.
به نظر ما، دلیل محدودیتهای طرحشده مدلهای بدون دانش پیشزمینه، از یک سو، در ویژگیهای ذاتی هر شهر نهفته است: ویژگیهای خاص شهرهای مورد استفاده در مرحله آموزش به شدت در طبقهبندیکننده منعکس میشوند. که مدل پیش بینی می تواند برای استفاده در مکان دیگری نامناسب شود. از سوی دیگر، دلیل تفاوت مدلها را میتوان به اطلاعات جغرافیایی که ما به عنوان پیشبینیکننده استفاده میکردیم، یعنی فاصلهها تا نزدیکترین نقطه نقطه از دستههای خاص جستجو کرد. این فواصل بر روی دادههای مکانی باز مرتبط که در نهایت از OpenStreetMap میآیند، محاسبه شدند. زیرا دومی یک VGI است [ 14] ابتکار، تنوع در نتایج ما همچنین می تواند ناشی از ناهمگونی ذاتی تلاش های نقشه برداری داوطلبان OpenStreetMap در شهرهای انتخاب شده باشد. به عبارت دیگر، سطوح مختلف کامل بودن داده ها و قابلیت اطمینان از مکانی به مکان دیگر در OpenStreetMap می تواند در واقع علت اصلی تفاوت های شدید بین شهرها باشد که در طبقه بندی کننده های آموزش دیده منعکس شده است. معیارهای متعددی در ادبیات برای تجزیه و تحلیل “کیفیت” OpenStreetMap [ 27 ، 28 ] پیشنهاد شده است، و ما قصد داریم این اقدامات را در توسعه های آینده رویکرد ارائه شده در نظر بگیریم.
از جنبه مثبت، با توجه به تکامل اطلاعات کاربری زمین در طول زمان، OpenStreetMap در انعکاس پویایی واقعی یک مکان، هم در مکانهای شهری عمومی [29] و به ویژه در پاسخ به موقعیتهای اضطراری [ 30 ] موثر ثابت شده است. در واقع، انگیزههای نقشهبرداران برای مشارکت بلندمدت نشان میدهد که OpenStreetMap بهعنوان منبع اطلاعات جغرافیایی مرجع باقی میماند [ 31]]. علاوه بر این، در این مطالعه، ما به صورت دستی تنها زیرمجموعهای از دستههای POI موجود را برای ساخت متغیرهای پیشبینی کننده طبقهبندی خود انتخاب کردیم. این انتخاب میتواند مشکوک باشد و ما روی بهبود انتخاب POI کار خواهیم کرد تا بهترین پوشش ممکن را از همه انواع کاربریهای زمین داشته باشیم. به عنوان مثال، ما احتمالاً نیاز به انتخاب POI های اضافی خواهیم داشت که مناطق صنعتی/تجاری، کشاورزی و طبیعی یا سایر کاربری های خاص تر زمین را بهتر مشخص کنند.
در نهایت، کار آینده ما بر گسترش آزمایشهایمان برای مؤثرتر و قویتر کردن راهحل حاصل تمرکز خواهد کرد. یکی از گزینههای دستور کار تحقیقاتی ما ترکیب و تکمیل اطلاعات جغرافیایی از OpenStreetMap با منابع ناهمگون دیگر، مانند دادههای فعالیت تلفن است که اغلب به عنوان پیشبینیکننده کاربری زمین استفاده میشود.
8. مقایسه با رویکردهای پیشرفته
طبقه بندی کاربری زمین به دلیل تأثیرات آن در زندگی روزمره ما، به ویژه در زمینه طراحی محیط های شهری، موضوعی است که به طور گسترده در برنامه ریزی شهری، مهندسی محیط زیست و علوم زمین به طور کلی مورد بررسی قرار گرفته است. برای مثال، به خوبی شناخته شده است که چندین جنبه مختلف بر استفاده از زمین و تغییر آن در طول زمان تأثیر میگذارند، مانند عوامل اجتماعی-اقتصادی [ 32 ]، رفتارهای سفر [ 33 ] یا تعاملات با ذینفعان شهری [ 34 ].
هنگام پرداختن به چالشهای تحلیل تغییر کاربری زمین [ 35 ]، همچنین ارزش تمایز بین پوشش زمین، پوشش فیزیکی سطح زمین و کاربری زمین را دارد که انسانها از زمین برای چه استفاده میکنند. در واقع، بیشتر رویکردهای خودکار و نیمه خودکار که بر روی اطلاعات سنجش از دور کار میکنند، مانند تصاویر ماهوارهای، با هدف تعیین معیارهای منظر [ 36 ] و طبقهبندی پوشش زمین [ 37 ] هستند، زیرا آن منابع داده میتوانند تنها به تشخیص بصری کمک کنند. -تغییرات قابل مشاهده این مورد برای طبقهبندی CORINE اروپا [ 13 ] نیز صادق است که تحت یک پردازش طولانی، پیچیده و فقط تا حدی خودکار دادههای سنجش از دور قرار میگیرد.
از سوی دیگر، مردم نقش مرتبط فزایندهای با توجه به اطلاعات جغرافیایی به طور کلی بازی میکنند [ 14 ، 15 ]، به دلیل ظهور به اصطلاح وب جغرافیایی در دهه گذشته: پایگاه کاربر بزرگی در این مجموعه درگیر است. و مدیریت ابرداده های مکانی، به ویژه شبکه های جاده ای و POI، از جمله اطلاعات مربوط به برنامه ریزی شهری. به عنوان مثال، همچنین در زمینه پوشش زمین، ابتکاراتی مانند Geo-Wiki [ 38 ] از تلاشهای جمعسپاری و/یا علوم شهروندی برای بهبود دانش محیطی استفاده میکند.
همچنین به همین دلیل است که تعدادی از روشها، رویکردها و آزمایشها بر بهرهبرداری از منابع اطلاعاتی ناهمگن برای طبقهبندی کاربری اراضی متمرکز شدهاند. در بیشتر موارد، این منابع یا توسط انسان تولید میشوند یا از فعالیتهای روزمره آنها ناشی میشوند. نمونههای قابل توجه عبارتند از اطلاعات کاربری زمین مشتق شده از رسانههای اجتماعی (به عنوان مثال، توییتهای دارای برچسب جغرافیایی مانند [ 7 ])، فعالیت تلفن همراه (مانند الگوهای تماس خوشهای در [ 39 ]، خوشههای مکان برگرفته از الگوهای فعالیت در [ 8 ] و زمان جمعآوری شده است. سری هایی که هم الگوهای زمانی و هم حجم تماس را در [ 9 ] در نظر می گیرند، داده های انتقال و تحرک (به عنوان مثال، مجموعه داده های مسیر GPS، مانند [ 10 ]، یا داده های کارت هوشمند اتوبوس، مانند [ 40]])، و همچنین ترکیبی از منابع مختلف داده باز و سازمانی (مانند کار قبلی ما [ 41 ]).
آخرین، اما نه کم اهمیت، رویکرد ارائه شده در این مقاله اولین رویکردی نیست که از اطلاعات POI از OpenStreetMap استفاده می کند، که همچنین توسط [11] برای استخراج الگوهای کاربری زمین و توسط [ 12 ] برای شناسایی قطعات شهری استفاده می شود. با توجه به آن آثار، سهم اصلی ما در توصیف فضا با فاصله تا نزدیکترین نقطه نقطه از یک نوع معین، تکرارپذیری آزمایشها و وضوح فضایی کاملاً متوسط محیطهای شهری (در حد 250 متر) است. ) از جمله مناطق اطراف شهرها که کاربری های مخلوطی از زمین را نشان می دهند.
9. نتیجه گیری
در چند سال گذشته، افزایش دسترسی به دادههای مکانی باز مرتبط، راه را برای راهحلهای نوآورانه در حوزه شهر هوشمند هموار کرده است. در زمینه برنامه ریزی و نظارت شهری، انبوه داده های موجود امروز فرصتی برای معرفی نوآوری های افزایشی یا مخرب در فرآیندهای مدیریت داده های شهری است.
مطالعه ارائه شده در این مقاله در همین چارچوب است. پژوهش ما بر بهرهبرداری از منابع دادههای متنوع و ناهمگن برای نظارت بر کاربری زمین متمرکز است. به طور خاص، ما نشان دادیم که دادههای فضایی باز در واقع استفاده از قلمرو را منعکس میکند و بنابراین، میتواند اطلاعات ورودی اضافی و مرتبطی باشد که در برنامهریزی شهری مورد استفاده قرار میگیرد. به طور خاص، در این مقاله، ما یک رویکرد کشف دانش برای استخراج کاربری زمین شهری از دادههای باز مرتبط با ماهیت جغرافیایی پیشنهاد کردیم: مدلهای پیشبینیکننده آموزشدیده با اطلاعات جغرافیایی مرتبط با POIهای شهری برای طبقهبندی کاربری شهری بر اساس پنج مورد استفاده شدند. طبقه بندی سطح برگرفته از طبقه بندی CORINE اروپا.
منحصربهفرد بودن روش پیشنهادی ما در تکرار آزمایشهای ما در چهار شهر مختلف اروپایی است، بنابراین تکرارپذیری و عمومیت راهحل پیشنهادی را تضمین میکند. علاوه بر این، مطالعه ما تکرارپذیری را نیز تضمین میکند، زیرا ما با جزئیات آزمایشهای انجامشده و همچنین مجموعه دادههای بکار گرفته شده را که بهصورت آنلاین در دسترس هستند، توضیح دادیم.
یک مشارکت اصلی، بررسی سطح دانش پیشینه مورد نیاز به عنوان ورودی است. ما نشان دادیم که برای به دست آوردن نتایج طبقه بندی بهتر، ضروری است که در مدل اطلاعاتی در مورد شهر پیش بینی شود گنجانده شود. در واقع ما بهترین نتایج را با یک مدل خاص شهر به دست آوردیم که به 87٪ از دقت کلی رسید (آموزش الگوریتم در شهر برای پیش بینی) و با یک مدل بین شهری با دانش پس زمینه که منجر به دقت کلی تا 80٪ می شود. به طور کلی، ما مقادیر حساسیت متعادلی را در بین طبقات به دست آوردیم که قابل مقایسه و در بیشتر موارد بهتر از ادبیات قبلی هستند. با این حال، تحقیقات بیشتری مورد نیاز است تا روششناسی ما برای هر محیط شهری قابل اجرا باشد و آزمایشهای بیشتری برای کشف کاربریهای خاصتر زمین مورد نیاز است.
در حالی که ما ادعا نمی کنیم که روش های پیش بینی پیشنهادی می توانند برای تولید نقشه های کاربری دقیق زمین مورد استفاده قرار گیرند، ما معتقدیم که معرفی اطلاعات آشکارا در دسترس می تواند پشتیبانی معتبری را برای نظارت و به روز رسانی اطلاعات برنامه ریزی شهری، مانند نقشه های CORINE اروپا، ارائه دهد. در واقع، نظارت بر زمین در اروپا با ابتکار EAGLE در حال تجربه یک تجدید نظر اساسی در فرآیندها از نظر روشها و طبقهبندی است [ 6 ]. در این زمینه، راهحلهای نوآورانهای مانند راهحل ما، مبتنی بر استفاده از منابع مختلف اطلاعات جغرافیایی، میتواند کمک ارزشمندی ارائه دهد.
منابع
- سلینو، آی. کوتولاس، S. شهرهای هوشمند. IEEE Internet Compu. 2013 ، 17 ، 8-11. [ Google Scholar ] [ CrossRef ]
- یانوویچ، ک. شیدر، اس. پهله، ت. هارت، جی. معناشناسی جغرافیایی و دادههای مکانی-زمانی مرتبط – گذشته، حال و آینده. سمنت. وب 2012 ، 3 ، 321-332. [ Google Scholar ]
- همرلی، ج. ملاحظات سیاست عمومی برای نوآوری مبتنی بر داده. کامپیوتر 2013 ، 46 ، 25-31. [ Google Scholar ] [ CrossRef ]
- Talbot, D. داده های بزرگ از تلفن های ارزان قیمت. فناوری MIT Rev. 2013 , 116 , 50-54. [ Google Scholar ]
- مندل، ام. فراتر از کالاها و خدمات: افزایش (بدون اندازه گیری) اقتصاد مبتنی بر داده. پیش رفتن. موسسه سیاست گذاری 2012 ، 10 ، 1-14. [ Google Scholar ]
- آرنولد، اس. کوزترا، بی. بانکو، جی. اسمیت، جی. هازو، جی. بوک، ام. والکارسل سانز، ن. مفهوم EAGLE – چشم انداز یک چارچوب نظارت بر زمین اروپا در آینده. در مجموعه مقالات سی و سومین سمپوزیوم EARseL “به سوی افق 2020″، ماترا، ایتالیا، 3 تا 6 ژوئن 2013.
- فریاس مارتینز، وی. سوتو، وی. هوهوالد، اچ. Frias-Martinez، E. مشخص کردن مناظر شهری با استفاده از توییتهای جغرافیایی. در مجموعه مقالات کنفرانس بین المللی محاسبات اجتماعی 2012 (SocialCom) (حریم خصوصی، امنیت، ریسک و اعتماد (PASSAT))، آمستردام، هلند، 3 تا 5 سپتامبر 2012.
- Toole، JL; اولم، ام. گونزالس، ام سی؛ بائر، دی. استنباط کاربری زمین از فعالیت تلفن همراه. در مجموعه مقالات کارگاه بین المللی ACM SIGKDD در محاسبات شهری (UrbComp 2012)، پکن، چین، 12 اوت 2012.
- پی، تی. سوبولفسکی، اس. راتی، سی. شاو، اس ال. لی، تی. ژو، سی. بینشی جدید در طبقه بندی کاربری زمین بر اساس داده های تلفن همراه جمع آوری شده است. بین المللی جی. جئوگر. آگاه کردن. علمی 2014 ، 28 ، 1988-2007. [ Google Scholar ] [ CrossRef ]
- یوان، جی. ژنگ، ی. Xie, X. کشف مناطق با عملکردهای مختلف در یک شهر با استفاده از تحرک انسان و POI. در مجموعه مقالات هجدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، پکن، چین، 12 تا 16 اوت 2012.
- جوکار ارسنجانی، ج. هلبیچ، ام. باکیالله، م. هاگناور، جی. Zipf، A. به سمت نقشه برداری الگوهای کاربری زمین از اطلاعات جغرافیایی داوطلبانه. بین المللی جی. جئوگر. آگاه کردن. علمی 2013 ، 27 ، 2264-2278. [ Google Scholar ] [ CrossRef ]
- لانگ، ی. لیو، ایکس. شناسایی خودکار و مشخص کردن بسته ها (AICP) با نقشه خیابان باز و نقاط مورد علاقه. 2013. موجود به صورت آنلاین: http://arxiv.org/abs/1311.6165 (دسترسی در 25 ژوئن 2015).
- بوتنر، جی. کوزترا، بی. ماوچا، جی. Pataki, R. پیاده سازی و دستاوردهای CLC2006 ; گزارش فنی برای آژانس محیط زیست اروپا (EEA): کپنهاگ، دانمارک، 2012. [ Google Scholar ]
- Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ]
- Goodchild، MF Spatial accuracy 2.0. در مجموعه مقالات هشتمین سمپوزیوم بین المللی ارزیابی دقت فضایی در منابع طبیعی و علوم محیطی، شانگهای، چین، 25-27 ژوئن 2008.
- استدلر، سی. لمان، جی. هافنر، ک. Auer, S. LinkedGeoData: هسته ای برای شبکه ای از داده های فضایی باز. سمنت. وب J. 2012 ، 3 ، 333-354. [ Google Scholar ]
- بیزر، سی. هیث، تی. برنرز-لی، تی. داده های مرتبط – داستان تا کنون. بین المللی ج. سمنت. وب اطلاعات سیستم 2009 ، 5 ، 1-22. [ Google Scholar ] [ CrossRef ]
- Duan، KB; Keerthi، S. بهترین روش SVM چند کلاسه کدام است؟ یک مطالعه تجربی. در سیستم های طبقه بندی کننده چندگانه ؛ Oza, N., Polikar, R., Kittler, J., Roli, F., Eds. یادداشت های سخنرانی در علوم کامپیوتر; Springer: برلین، آلمان، 2005; جلد 3541، ص 278–285. [ Google Scholar ]
- مک کوئین، جی. برخی روشها برای طبقهبندی و تحلیل مشاهدات چند متغیره. در مجموعه مقالات پنجمین سمپوزیوم برکلی در مورد آمار و احتمالات ریاضی، برکلی، کالیفرنیا، ایالات متحده آمریکا، 21 ژوئن تا 18 ژوئیه 1965.
- پری، م. Herring, J. OGC GeoSPARQL—یک زبان پرس و جوی جغرافیایی برای داده های RDF . گزارش فنی برای کنسرسیوم فضایی باز: Wayland، MA، ایالات متحده آمریکا، 2011. [ Google Scholar ]
- هستی، تی. طبشیرانی، ر. فریدمن، جی. عناصر یادگیری آماری . Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2009. [ Google Scholar ]
- Kotsiantis، SB; زهارکیس، آی. پینتلاس، پی. یادگیری ماشینی نظارت شده: مروری بر تکنیک های طبقه بندی. در کاربردهای نوظهور هوش مصنوعی در مهندسی کامپیوتر ; Maglogiannis, I., Karpouzis, K., Wallace, M., Soldatos, J., Eds. IOS Press: آمستردام، هلند، 2007; صص 3-24. [ Google Scholar ]
- وتساوایی، ر.ر. برایت، ای. وارون، سی. بودندرا، بی. چریادات، ع. Grasser، J. رویکردهای یادگیری ماشین برای طبقه بندی پوشش زمین شهری با وضوح بالا: یک مطالعه مقایسه ای. در مجموعه مقالات دومین کنفرانس بین المللی محاسبات برای تحقیقات و کاربردهای جغرافیایی، واشنگتن، دی سی، ایالات متحده آمریکا، 23 تا 25 مه 2011.
- Boser، BE; Guyon، IM; Vapnik، VN یک الگوریتم آموزشی برای طبقهبندیکننده حاشیه بهینه. در مجموعه مقالات پنجمین کارگاه سالانه نظریه یادگیری محاسباتی، پیتسبورگ، پنسیلوانیا، ایالات متحده آمریکا، 27-29 ژوئیه 1992.
- Hsu، CW; چانگ، سی سی; Lin, CJ راهنمای عملی برای پشتیبانی از طبقه بندی برداری . دانشگاه ملی تایوان: تایپه، تایوان، 2010. [ Google Scholar ]
- شانون، سی تئوری ریاضی ارتباطات. SIGMOBILE Mob. محاسبه کنید. اشتراک. Rev. 2001 , 5 , 3-55. [ Google Scholar ] [ CrossRef ]
- مونی، پی. کورکوران، پ. Winstanley، AC به سمت معیارهای کیفیت برای OpenStreetMap. در مجموعه مقالات هجدهمین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، 2 تا 5 نوامبر 2010.
- کسلر، سی. de Groot، RTA Trust به عنوان معیاری برای کیفیت اطلاعات جغرافیایی داوطلبانه در مورد OpenStreetMap. در علم اطلاعات جغرافیایی در قلب اروپا ; انتشارات بین المللی Springer: چم، سوئیس، 2013; ص 21-37. [ Google Scholar ]
- هریستوا، دی. کواترون، جی. مشهدی، عج. Capra, L. زندگی مهمانی: تأثیر نقشه برداری اجتماعی در OpenStreetMap. در مجموعه مقالات هفتمین کنفرانس بین المللی AAAI در وبلاگ ها و رسانه های اجتماعی، کمبریج، MA، ایالات متحده آمریکا، 8 تا 11 ژوئیه 2013.
- پالن، ال. سودن، آر. اندرسون، تی جی; Barrenechea، M. موفقیت و مقیاس در یک سازمان تولید کننده داده: تکامل اجتماعی و فنی OpenStreetMap در پاسخ به رویدادهای بشردوستانه. در مجموعه مقالات سی و سومین کنفرانس سالانه ACM در مورد عوامل انسانی در سیستم های محاسباتی، سئول، جمهوری کره، 18 تا 23 آوریل 2015.
- بوداتوکی، NR; Haythornthwaite، C. انگیزه برای همکاری باز جمعیت و مدل های جامعه و مورد OpenStreetMap. صبح. رفتار علمی 2013 ، 57 ، 548-575. [ Google Scholar ] [ CrossRef ]
- استد، D. روابط بین کاربری زمین، عوامل اجتماعی-اقتصادی، و الگوهای سفر در بریتانیا. محیط زیست طرح. B 2001 , 28 , 499-528. [ Google Scholar ] [ CrossRef ]
- ماات، ک. ون وی، بی. استد، د. استفاده از زمین و رفتار سفر: اثرات مورد انتظار از دیدگاه نظریه مطلوبیت و نظریه های مبتنی بر فعالیت. محیط زیست طرح. ب: برنامه ریزی کنید. دس 2005 ، 32 ، 33-46. [ Google Scholar ] [ CrossRef ]
- جومبا، ا. Dragićević، S. مدل سازی تغییر کاربری زمین شهری با وضوح بالا: رویکرد iCity عامل. Appl. مقعد فضایی. سیاست 2012 ، 5 ، 291-315. [ Google Scholar ] [ CrossRef ]
- اریکسون، ا. راجرز، ال. هورویتز، پی. هریس، جی. چالش ها و راه حل ها برای تجزیه و تحلیل تغییر کاربری زمین منطقه ای. در مجموعه مقالات کنفرانس بین المللی کاربران ESRI، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 8 تا 12 ژوئیه 2013.
- هرولد، ام. اسکپن، جی. Clarke، KC استفاده از سنجش از دور و معیارهای چشم انداز برای توصیف ساختارها و تغییرات در کاربری های شهری. محیط زیست طرح. A 2002 , 34 , 1443-1458. [ Google Scholar ] [ CrossRef ]
- جیانگ، دی. هوانگ، ی. ژوانگ، دی. زو، ی. خو، X. رن، اچ. یک رویکرد نیمه خودکار ساده برای طبقه بندی پوشش زمین از تصاویر سنجش از دور چند طیفی. PloS one 2012 , 7 , e45889. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- فریتز، اس. مک کالوم، آی. شیل، سی. پرگر، سی. ببینید، L. شپاچنکو، دی. ون در ولده، م. کراکسنر، اف. Obersteiner, M. Geo-Wiki: یک پلت فرم آنلاین برای بهبود پوشش جهانی زمین. محیط زیست مدل نرم افزار 2012 ، 31 ، 110-123. [ Google Scholar ] [ CrossRef ]
- سوتو، وی. Frías-Martínez، E. شناسایی خودکار کاربری زمین با استفاده از سوابق تلفن همراه. در مجموعه مقالات سومین کارگاه بین المللی ACM در MobiArch، Bethesda، MD، ایالات متحده آمریکا، 28 ژوئن تا 1 ژوئیه 2011.
- هان، اچ. یو، ایکس. لانگ، ی. کشف مناطق عملکردی با استفاده از داده های کارت هوشمند اتوبوس و نقاط مورد علاقه در پکن. 2015. در دسترس آنلاین: http://arxiv.org/abs/1503.03131 (در 25 ژوئن 2015 قابل دسترسی است).
- ری کالگاری، جی. Celino، I. پشتیبانی از برنامه ریزی شهری هوشمند از طریق علم داده های وب در داده های باز و سازمانی. در مجموعه مقالات بیست و چهارمین کنفرانس بین المللی در مورد همنشین وب جهانی، فلورانس، ایتالیا، 18 تا 22 مه 2015.
© 2015 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر