تعریف تناسب اندام برای استفاده برای نقاط مورد علاقه جمع سپاری (POI)

خلاصه

(1) زمینه: با توجه به ظهور اطلاعات جغرافیایی داوطلبانه (VGI)، مجموعه داده های بزرگی از نقاط مورد علاقه (POI) تولید شده توسط کاربر در حال حاضر در دسترس هستند. با این حال، مانند تمام VGI، عدم اطمینان در مورد کیفیت داده و تناسب استفاده وجود دارد. در حال حاضر، وظیفه ارزیابی تناسب برای استفاده از POI به کاربر داده واگذار شده است، بدون اینکه چارچوب راهنمایی در دسترس باشد، به همین دلیل است که این تحقیق یک رویکرد عمومی برای انتخاب اقدامات مناسب برای ارزیابی تناسب برای استفاده از POI جمع‌سپاری شده پیشنهاد می‌کند. وظایف مختلف (2) روش‌ها: POI به مفهوم سطح بالاتر ژئواتم‌ها به منظور شناسایی و تمایز دو عملکرد اساسی آنها یعنی ارجاع جغرافیایی و ارجاع به شی مرتبط است. سپس برای هر یک از این توابع، معیارهای مناسب کیفیت موضعی و موضوعی بر اساس شاخص های کیفی موجود توسعه می یابد. (3) نتایج: موارد استفاده معمولی از POI با توجه به استفاده آنها از دو عملکرد اساسی POI ارزیابی می‌شوند و اقدامات مناسب برای تناسب اندام برای استفاده تخصیص داده می‌شوند. روش کلی در یک مثال عملی مختصر نشان داده شده است. (4) نتیجه‌گیری: این تحقیق به موضوع تناسب برای استفاده از POI در سطح مفهومی بالاتر با ارتباط آن با مفاهیم اساسی‌تر نمایش اطلاعات جغرافیایی می‌پردازد. انتظار می رود که نتایج به کاربران مجموعه داده های POI جمع سپاری شده در تعیین روش مناسب برای ارزیابی تناسب برای استفاده کمک کند. و اقدامات مناسبی را برای تناسب اندام برای استفاده تخصیص داد. روش کلی در یک مثال عملی مختصر نشان داده شده است. (4) نتیجه‌گیری: این تحقیق به موضوع تناسب برای استفاده از POI در سطح مفهومی بالاتر با ارتباط آن با مفاهیم اساسی‌تر نمایش اطلاعات جغرافیایی می‌پردازد. انتظار می رود که نتایج به کاربران مجموعه داده های POI جمع سپاری شده در تعیین روش مناسب برای ارزیابی تناسب برای استفاده کمک کند. و اقدامات مناسبی را برای تناسب اندام برای استفاده تخصیص داد. روش کلی در یک مثال عملی مختصر نشان داده شده است. (4) نتیجه‌گیری: این تحقیق به موضوع تناسب برای استفاده از POI در سطح مفهومی بالاتر با ارتباط آن با مفاهیم اساسی‌تر نمایش اطلاعات جغرافیایی می‌پردازد. انتظار می رود که نتایج به کاربران مجموعه داده های POI جمع سپاری شده در تعیین روش مناسب برای ارزیابی تناسب برای استفاده کمک کند.

کلید واژه ها:

VGI _ کیفیت داده ها ؛ نقاط مورد علاقه ؛ تناسب اندام برای استفاده

1. معرفی

نقاط مورد علاقه (POI) ویژگی‌های صفر بعدی هستند که به مکان‌های خاص یا موجودیت‌های دنیای واقعی در فضای جغرافیایی، مانند مکان‌های تاریخی، مکان‌های دیدنی، خدمات عمومی، مغازه‌ها، رستوران‌ها یا بارها اشاره می‌کنند [1 ] . POI با ارائه یک منبع داده اصلی برای چندین سرویس مبتنی بر وب و برنامه های کاربردی تجاری جغرافیایی، توسط شرکت هایی مانند Garmin، Facebook یا Yelp، اغلب از طریق جمع سپاری، برای اهداف مختلف، از جمله ناوبری و مسیریابی، ارائه توصیه های فضایی، جمع آوری می شود. یا امکان به اشتراک گذاری اطلاعات مبتنی بر موقعیت مکانی مانند بررسی مکان، ورود به جلسه، یا عکس های دارای برچسب جغرافیایی به کاربران را می دهد. در یک زمینه تحقیقاتی، POI برای استفاده های اضافی از جمله تجزیه و تحلیل پراکندگی جمعیت [ 2 ]، فعالیت اجتماعی شهری در شهر [2] قرار می گیرد.3 ، یا مکان درک شده از مرکز شهر [ 4 ].

در مقایسه با داده‌های مکانی سنتی، همانطور که توسط فروشندگان تجاری یا مقامات ارائه می‌شود، اطلاعات جغرافیایی داوطلبانه (VGI) به روش‌های مناسبی برای ارزیابی کیفیت داده‌ها نیاز دارد، این واقعیت به دلیل عدم آموزش و ناهمگن بودن مشارکت‌کنندگان آن، فقدان رسمی است. مشخصات و اثرات بالقوه عوامل اجتماعی [ 5 ، 6 ، 7 ، 8 ]. از آنجایی که در این زمینه، تضمین کیفیت در بهترین حالت چالش برانگیز است [ 6 ]، می توان استدلال کرد که وظیفه ارزیابی کیفیت تا حدودی از تولیدکننده به استفاده کنندگان داده ها منتقل شده است، که ملزم به ارزیابی مناسب بودن آن با توجه به داده ها هستند. انگیزه خاص، یا مناسب بودن آن برای استفاده [ 9]. با توجه به سازمان بین المللی استاندارد (ISO)، کیفیت اطلاعات جغرافیایی باید به طور کلی با مناسب بودن آن با اشاره به «نیازها یا الزامات کاربردی خاص» [ 10 ] (ص. 1) مرتبط باشد. ارتباط چنین اقدامات وابسته به وظیفه مناسب برای استفاده با این واقعیت که اخیراً، کنسرسیوم فضایی باز (OGC) استانداردهای نامزدی را برای جمع آوری تجربیات کاربر با مجموعه داده ها و ارائه آنها به عنوان ابرداده پیشنهاد کرده است [11]، بیشتر تاکید می شود . بر این اساس، ارزیابی کیفی یک مجموعه داده جغرافیایی-فضایی نباید مستقل از استفاده مورد نظر آن اتفاق بیفتد، بلکه باید ارتباط نزدیکی با مناسب بودن مورد انتظار آن برای این هدف خاص داشته باشد [ 12] .]. در حالی که مناسب بودن داده های OpenStreetMap (OSM) با توجه به وظایف کاربردی خاص مانند ناوبری [ 13 ، 14 ]، بازسازی ساختمان سه بعدی از ردپای ساختمان [ 15 ]، یا نقشه برداری و تحلیل مربوط به دوچرخه [ 16 ] تحلیل شده است. تا جایی که ما می دانیم، در حال حاضر مطالعه ای وجود ندارد که به صراحت تناسب استفاده از مجموعه داده های POI را ارزیابی کند.

بنابراین، در حالی که POI به شدت برای اهداف پژوهشی و کاربردی مورد استفاده قرار می گیرد، هنوز کمبود دانش در رابطه با ویژگی های کلی مرتبط با کیفیت این مجموعه داده ها و همچنین روش های بالقوه برای ارزیابی تناسب آنها برای استفاده وجود دارد. اگر چه در درجه اول بر روی POI تمرکز نمی شود، اما به طور کلی بر روی VGI تمرکز می شود، برای مثال، [ 12 ] به صراحت برای فعالیت های تحقیقاتی آینده “توسعه یک چارچوب سیستماتیک که روش ها و اقداماتی را برای ارزیابی تناسب برای هدف هر نوع VGI ارائه می دهد” توصیه کرده است. 12] (ص 21). بنابراین، به عنوان اولین گام در این جهت، این کار بر POI جمع‌سپاری شده تمرکز می‌کند و یک رویکرد کلی برای ارزیابی تناسب آنها برای استفاده در مورد وظایف مختلف پیشنهاد می‌کند. با این چارچوب، هدف ما این است که به کاربران مجموعه داده POI کمک کنیم تا از طیفی از معیارهای کیفیت موجود و روش‌های ارزیابی، آن‌هایی را انتخاب کنند که برای ارزیابی تناسب آن برای استفاده با توجه به مورد خاص یا کار کاربردی آن‌ها مناسب است. برای این کار، از آنجایی که POI به عنوان یکی از راه های ممکن برای نشان دادن موجودیت های جغرافیایی در سیستم های اطلاعات جغرافیایی (GIS) عمل می کند، ما به موضوع نمایش اطلاعات جغرافیایی مبتنی بر POI در سطح مفهومی بالاتری با ارتباط دادن POI به مفهوم اساسی جغرافیا نزدیک می شویم. اتم های پیشنهاد شده توسط [ 17]. این به ما امکان می‌دهد که ارجاع جغرافیایی و ارجاع به شی را به عنوان دو عملکرد اساسی POI شناسایی و متمایز کنیم، همانطور که در ادامه بحث می‌کنیم، هر کدام به معیارهای کیفیت خاصی نیاز دارند. با تمرکز بر دقت موقعیتی و موضوعی، و بر اساس تحقیقات قبلی در مورد کیفیت داده ها، ما مجموعه ای از روش های مطابق را پیشنهاد می کنیم. این برای کاربران داده مرتبط است، زیرا، همانطور که ما استدلال می کنیم، برای ارزیابی تناسب استفاده از POI برای یک مورد خاص، لازم است یکی از دو عملکرد POI اساسی که در وظیفه مربوطه را انتخاب کنید و معیارهای کیفی را انتخاب کنید. این در یک مثال عملی نشان داده شده است.

ساختار این مقاله به شرح زیر است: ابتدا، بر اساس بررسی مختصری از ادبیات مربوطه، راه‌های بالقوه برای ارزیابی کیفیت داده‌های POI شناسایی می‌شوند. سپس، رویکرد ما نسبت به ارزیابی تناسب برای استفاده از داده‌های POI توضیح داده شده و در یک مثال عملی نشان داده می‌شود. در نهایت، کار ما مورد بحث و نتیجه گیری قرار می گیرد.

2. روش های ارزیابی کیفیت POI

مطالعات متعددی وجود دارد که در آنها کیفیت VGI، در بیشتر موارد با تمرکز قوی بر OSM، مورد بررسی قرار گرفت (به عنوان مثال، [ 18 ، 19 ، 20 ]). برای بسیاری از این موارد، جهت گیری به سمت ویژگی های داده مربوطه توسط مجموعه ای از معیارهای کیفی ارائه شده است که توسط ISO تعریف شده است: کامل بودن، سازگاری منطقی، دقت موقعیتی، کیفیت زمانی، دقت موضوعی، و قابلیت استفاده [10 ] . با توجه به این واقعیت که این لیست در زمینه داده های جغرافیایی به طور کلی توسعه یافته است، با این حال، اعتبار آن برای VGI نیز به چالش کشیده شده است [5]، با رویکردهای جایگزین که تاکید بیشتری بر قابل اعتماد بودن و اعتبار اطلاعات تولید شده دارند [ 21 ،22 ].

با توجه به کار قبلی در مورد ارزیابی کیفیت داده های جغرافیایی-مکانی، دو رویکرد اساسی را می توان بسته به اینکه داده ها با یک مجموعه داده مرجع مقایسه شده است، که فرض می شود از بالاترین استانداردهای کیفیت برخوردار است و بنابراین به عنوان حقیقت پایه استفاده می شود یا خیر، متمایز کرد. در حالت اول، یک ارزیابی بیرونی انجام می‌شود، در حالی که نوع دوم ارزیابی کیفیت درونی نامیده می‌شود، و بر مجموعه‌ای از ویژگی‌های داده‌ای که به عنوان شاخص‌های کیفیت عمل می‌کنند، مانند نسبت نمونه‌گیری یا چگالی برچسب [23]، زمانی متکی است . توسعه مجموعه داده [ 24 ]، اما همچنین ویژگی های جمعیتی یا اجتماعی-اقتصادی منطقه جغرافیایی خاص مورد علاقه (به عنوان مثال، [ 25 ]). در یک مطالعه اخیر، [ 18] یک چارچوب مفهومی برای ارزیابی کیفیت ذاتی VGI ارائه می کند.

در این کار، تمرکز بر رویکردهای بیرونی برای ارزیابی کیفیت است. هنگام ارتباط داده‌های جمع‌سپاری شده به یک مجموعه داده مرجع، که در بیشتر موارد از منابع معتبر یا تجاری به دست آمده‌اند، برای هر معیار کیفیت ISO، روش‌های ارزیابی متعددی پیشنهاد شده‌اند. بنابراین، برای مثال، کامل بودن داده ها را می توان با مقایسه تعداد کل ویژگی ها در هر دو مجموعه داده [ 26 ] یا استخراج یک شاخص کامل بودن بر اساس تعداد ویژگی های ارائه شده در هر دو مجموعه داده در رابطه با تعداد کل آنها [ 27 ] ارزیابی کرد. همچنین چندین روش بالقوه برای ارزیابی سازگاری منطقی مجموعه داده‌های جمع‌آوری‌شده، مانند بررسی توپولوژی [ 28] وجود دارد.]، با این حال، این جنبه بیشتر با کیفیت ذاتی یک مجموعه داده مرتبط است. شاخص‌های معمولی برای دقت موقعیتی عبارتند از فواصل اقلیدسی بین نقاط هم‌ارجاع (به عنوان مثال، [ 26 ، 27 ])، انحراف فاصله در محور X و Y [ 29 ]، یا ارزیابی اینکه آیا، و در مورد ویژگی‌های خط یا چندضلعی. چه مقدار از یک ویژگی از یک مجموعه داده جمع‌سپاری در یک منطقه بافر خاص محاسبه شده حول یک ویژگی مرجع قرار دارد (به عنوان مثال، [ 20 , 30)]). دقت زمانی می‌تواند به واقعی بودن داده‌ها مرتبط باشد، اما، مشابه سازگاری منطقی، با توجه به ارزیابی‌های کیفیت ذاتی نیز مرتبط‌تر است. در نهایت، دقت موضوعی با استخراج درصد طبقه‌بندی صحیح ویژگی‌ها (به عنوان مثال، [ 15 ، 29 ])، فاصله لونشتاین که شباهت رشته‌ها را بیان می‌کند (مثلا [ 26 ])، یا تعداد ویژگی‌هایی که دارای مشخصه هستند، بررسی می‌شود. صفات [ 15 ، 30 ].

در گذشته، چندین مطالعه به طور خاص بر روی ارزیابی کیفیت مجموعه داده‌های POI متمرکز شده‌اند یا حداقل شامل ارزیابی می‌شوند. به عنوان مثال، در [ 26 ]، POI از OSM با IGN BD topo مقایسه می شود، و دقت موقعیتی (روش فاصله اقلیدسی)، دقت معنایی (فاصله لونشتاین و فرکانس صفت) و جریان (ارزیابی داخلی فرکانس به روز رسانی) ارزیابی می شود. [ 30 ] در مورد کاری گزارش می دهد که از داده های Teleatlas به عنوان حقیقت پایه برای مقایسه با OSM POI استفاده می کند و بر دقت موقعیت (روش بافر) و کامل بودن (مقایسه تعداد ویژگی ها در هر سلول شطرنجی) تمرکز دارد. [ 31] دقت موقعیتی عکس‌های برچسب‌گذاری‌شده جغرافیایی از فلیکر و پانورامیو را با ارزیابی فاصله اقلیدسی تا موقعیتی که به احتمال زیاد تصویر از آنجا گرفته شده است را بررسی می‌کند. [ 27 ] POI به‌دست‌آمده از Navteq و Yelp را با یک مجموعه داده مرجع ترکیب می‌کند که داده‌های OSM با آن مقایسه می‌شوند، و بر روی موقعیت (روش فاصله اقلیدسی) و دقت معنایی (فاصله Levenshtein)، و همچنین کامل بودن (شاخص کامل بودن) تمرکز می‌کند.

مطالعات ذکر شده، کیفیت داده ها را به عنوان درجه شباهت به حقیقت زمین، همانطور که توسط یک مجموعه داده مرجع نشان داده می شود، عملیاتی می کند. بنابراین، این کار همچنین به جریان متفاوتی از تحقیقات مربوط می‌شود که بر کیفیت داده‌ها به خودی خود تمرکز نمی‌کند، بلکه بر ارزیابی شباهت POI به‌دست‌آمده از مجموعه داده‌های مختلف برای اهداف ترکیب یا ادغام داده‌ها تمرکز دارد. این بیشتر با هدف شناسایی POI مشترک انجام می شود، که نشان دهنده همان موجودیت واقعی است و بنابراین باید از آنها اجتناب شود یا در یک پایگاه داده POI یکپارچه تطبیق داده شود. [ 1برای مثال، از تئوری مجموعه فازی برای شناسایی و ادغام POI مشترک بر اساس شباهت نحوی آنها با توجه به نام، تناظر مکانی با توجه به مقیاسی که در آن دیجیتالی شده‌اند و نزدیکی معنایی دسته اختصاص داده شده استفاده می‌کند. مثال دیگری توسط [ 32 ] ارائه شده است، که الگوریتم تطبیق خود را بر اساس فاصله اقلیدسی، شباهت نام و شباهت وب سایت دو POI قرار می دهد. [ 33 ] POI به‌دست‌آمده از سایت‌های شبکه‌های اجتماعی مختلف را با مقایسه فاصله جغرافیایی آنها و همچنین شباهت رشته‌ای ویژگی‌های معنایی انتخاب شده مطابقت می‌دهد. با هدف توسعه یک سیستم کمکی برای ویرایش داده ها، [ 34] شباهت POI را در OSM بر اساس تاریخچه تغییر تگ های مربوطه محاسبه کنید. جدای از POI، کارهایی با تمرکز بر تطبیق ژئواشیاء مشترک از انواع هندسه خطی (به عنوان مثال [ 35 ، 36 ، 37 ]) یا چند ضلعی (مثلا [ 15 ، 38 ]) انجام شده است. در یک ارزیابی ترکیبی از اقدامات کنترل کیفیت و تلفیق داده‌ها از منابع مختلف VGI، [ 7 ] بیان می‌کند که در عمل، این دو مرحله اغلب در هم تنیده شده‌اند، که به گفته نویسندگان، امکان ارزیابی مناسب بودن برای استفاده را محدود می‌کند. چنین داده هایی

3. تعریف Fitness-for-Use برای POI

همانطور که قبلاً ذکر شد، کیفیت یک مجموعه داده جغرافیایی باید بر حسب تناسب آن برای استفاده ارزیابی شود [ 9 ]. با این حال، تا جایی که ما می دانیم، در حال حاضر هیچ کار بر روی مورد خاص ارزیابی تناسب برای استفاده از مجموعه داده های POI وجود ندارد. بنابراین، در حال حاضر، یک کاربر آینده نگر از مجموعه داده های POI با طیف گسترده ای از معیارهای کیفی و روش های ارزیابی موجود، همانطور که در فصل قبل ارائه شد، مواجه است و باید یک استراتژی مناسب و مختص کار را برای ارزیابی تناسب ایجاد کند. برای استفاده از مجموعه داده بدون هیچ گونه کمک یا دستورالعملی که بتوان به آن مراجعه کرد. بر این اساس، همانطور که قبلاً بیان شد، توسعه یک چارچوب جهت گیری متناظر به عنوان یک نیاز تحقیقاتی مبرم شناسایی شده است [ 12]]. بنابراین، در این فصل، یک رویکرد کلی برای تعریف تناسب برای استفاده از داده‌های POI ارائه شده است. برای این، بر اساس یک مفهوم رسمی از POI، ما ابتدا ارجاع جغرافیایی و ارجاع به شی را به عنوان دو عملکرد اصلی POI شناسایی و متمایز می کنیم. در مرحله دوم، ما بیشتر استدلال می‌کنیم که هر وظیفه‌ای که شامل استفاده از POI می‌شود، یکی از این دو تابع را فراخوانی می‌کند، و بر این اساس نیاز به روش‌های متفاوتی برای ارزیابی تناسب برای استفاده مجموعه داده دارد. در نتیجه، ما شاخص‌های کیفیت مناسبی را برای هر یک از این عملکردها ایجاد می‌کنیم، که سپس به موارد استفاده معمول داده‌های POI مربوط می‌شوند.

3.1. دو کارکردی POI

هدف از POI توصیف “موقعیت ها یا موجودیت های جغرافیایی در مکان های جغرافیایی” [ 1 ] (ص. 2) بیان شده است. در حالی که این بیانیه قبلاً به یک دوگانگی عملکردی خاص اشاره می کند، منطقی است که به مفهوم POI به روشی رسمی تر نزدیک شویم.

در کار خود بر روی پاکسازی خودکار پایگاه‌های اطلاعاتی POI، [ 1 ] یک تعریف اساسی از POI ارائه می‌کنند: «یک نقطه مورد علاقه (یا POI) به‌طور بدیهی به عنوان بخشی از داده درک می‌شود که یک موجود جغرافیایی را در دنیای واقعی که مدل‌سازی شده است، توصیف می‌کند. توسط E ” [ 1 ] (ص 6). با E ، در این مورد، نویسندگان به جهان مناسبی از ویژگی‌های یک موجودیت اشاره می‌کنند که برای دستیابی به یک مرجع موفق بین POI و موجودیت واقعی، باید با جهان O POI POI مربوطه از طریق یک پیوند مرتبط _شود . تابع سطحی ρ : O _POI → E . جهان O _POIبه طور معمول مرکب است و بنابراین از جهان های غیر مرکب تشکیل شده است O _POI = U ₁ × U ₂ × … × U _n . به عنوان مثال، اینها می توانند شامل کلاس های زیر با برچسب های مربوطه باشند: نام ( U ₁ )، عرض جغرافیایی ( U ₂ )، طول جغرافیایی ( U ₃ )، و دسته ( U ₄ ). در این مورد، U ₂ و U ₃ را می توان به طور منطقی با هم گروه بندی کرد زیرا در ترکیب آنها این را ارائه می دهندمحل POI [ 1 ]. بنابراین، رابطه ارجاع بین POI و موجودیت دنیای واقعی از طریق جهان‌های متناظر آن و مقادیر مربوطه برقرار می‌شود، به عنوان مثال، نام = ” کلیسای جامع سنت پل” ، عرض جغرافیایی = 51.51382 ، طول جغرافیایی = 0.09850- و دسته = ” محل عبادت”. ‘، که باید با ویژگی‌های موجود در دنیای واقعی مطابقت داشته باشد، یا به عبارت دیگر، جهان مرکب آن E .

همانطور که در مقدمه بیان شد، POI برای نشان دادن اطلاعات جغرافیایی عمل می کند، و بنابراین، می تواند با مفهوم انتزاعی تر زمین اتم ها مرتبط باشد [ 17 ]. با هدف ارائه یک نظریه کلی از بازنمایی جغرافیایی مبتنی بر GIS، ژئواتم‌ها به عنوان اتم‌های اولیه انتزاعی معرفی شده‌اند که هم زمینه‌های میدان‌های پیوسته و هم اشیاء گسسته را تشکیل می‌دهند. بر این اساس، یک ژئواتم به عنوان «ارتباط بین یک مکان نقطه در فضا-زمان و یک ویژگی تعریف شده است. ما یک ژئواتم را به صورت یک تاپل <x, Z, z(x)> می نویسیم که در آن x یک نقطه در فضا-زمان را مشخص می کند، Z یک ویژگی را مشخص می کند و z(x) مقدار خاص ویژگی را در آن نقطه تعریف می کند. [ 17] (ص 243). بر اساس این شکل کاهش یافته و اتمی اطلاعات جغرافیایی، اشیاء یا میدان های سطح بالاتر را می توان ساخت. بنابراین، با توجه به اشیاء گسسته، در حالی که یک شی نقطه ای فقط از یک ژئواتم تشکیل شده است، اجسام خطی و چند ضلعی را می توان به عنوان تجمعی از اتم های جغرافیایی که مقادیر مشترک و مشخصی برای ویژگی های خاص دارند، مانند name = ‘ St. کلیسای جامع پل ‘ [ 17 ].

بنابراین، یک ژئواتم دارای عملکرد دوگانه است. از یک طرف، هدف اساسی آن مرتبط کردن یک مکان خاص با یک ویژگی خاص است. در این مرحله، نیاز خاصی به ارتباط این ویژگی با هر نوع شیء جغرافیایی فوق اردینیتی وجود ندارد. با این حال، از سوی دیگر، یک تابع صرفشناختی مشتق شده نیز وجود دارد که بخشی از یک شیء جغرافیایی سطح بالاتر است.

ما استدلال می کنیم که همان توابع برای POI اعمال می شود. معمولاً یک POI به یک موجودیت واقعی مانند یک ساختمان یا یک مکان اشاره دارد که می‌تواند در یک GIS به عنوان یک شیء جغرافیایی سطح بالاتر، به عنوان مثال، یک ویژگی چند ضلعی نشان داده شود. در این زمینه، POI را می توان به عنوان یک مدل کاهش یافته از شی ژئو شی اصلی، یک ژئواتم انتخاب شده که به عنوان نماینده از مجموعه بزرگتر ژئواتم ها انتخاب شده است که این شی ژئو شی خاص را تشکیل می دهند، درک کرد. بنابراین، برای مثال، اگر یک ساختمان دنیای واقعی به عنوان یک چند ضلعی ردپای نمایش داده شود، این نمایش می‌تواند بیشتر به یکی از ژئواتم‌های آن تقلیل یابد، برای مثال اتم‌هایی که دقیقاً در مرکز هندسی چند ضلعی قرار دارد. با این حال، مکان دقیق ژئواتم انتخاب شده ضروری نیست،نام یا یک شناسه بدون ابهام دیگر، به عنوان مثال در روزنامه انجام می شود، که معمولاً یک جفت مختصات مجزا را با نام مکان و در صورت وجود، اطلاعات اضافی مرتبط می کند. به عبارت دیگر، تابع سطحی ρ: O _POI → E که بین جهان‌های مرکب POI و موجودیت دنیای واقعی نقشه‌برداری می‌کند، به تناظر بین جهان‌هایی مانند name = ‘St. کلیسای جامع پل ، و نه لزوما مکان . در ادامه، این تابع به عنوان تابع مرجع شی POI نامیده می شود.

با این حال، مشابه یک ژئواتم، یک POI در درجه اول ارتباط یک مکان خاص با یک ویژگی است. ما از این به عنوان تابع ارجاع جغرافیایی یک POI یاد می کنیم. بنابراین، از یک سو، ممکن است که یک POI مستقل از یک شیء جغرافیایی مافوق باشد، به عنوان مثال، در مورد یک POI که نمایانگر یک دیدگاه مناسب در مسیر پیاده روی است، و بنابراین صرفاً اطلاعاتی را ارائه می دهد که در این مکان خاص، دید ملک = بالا. از سوی دیگر، در چندین مورد استفاده از آنها، POI که در واقع به یک شی جغرافیایی خاص و موجودیت واقعی مطابق با آن اشاره می کنند، به تابع مرجع جغرافیایی خود کاهش می یابند، به عنوان مثال هنگام شمارش تعداد POI در یک منطقه مطالعه، محاسبه سطوح چگالی POI یا محاسبه کوتاه ترین مسیر برای یک POI. در چنین مواردی، تمرکز به وضوح بر روی اطلاعات مکانی POI قرار می گیرد، در حالی که ارتباط معنایی با یک موجودیت واقعی خاص از اهمیت کمتری برخوردار است. بنابراین، با توجه به عملکرد ارجاع جغرافیایی آن، عملکرد یک POI به جای نام یا دسته بندی ، به طول و عرض جغرافیایی جهان که مکان آن را مشخص می کند، بستگی دارد .

3.2. معیارهای کیفیت وابسته به عملکرد برای POI

پس از شناسایی این دو عملکرد اساسی POI، ما بیشتر استدلال می‌کنیم که هنگام ارزیابی تناسب آنها برای استفاده، لازم است مشخص شود که کدام عملکرد اساسی در کار خاص مورد توجه قرار می‌گیرد. به عنوان مثال، چندین مطالعه وجود دارد که توزیع فضایی POI را در ترکیب با اطلاعات تخصیص یافته آنها، به ویژه طبقه بندی اختصاص داده شده، برای استنتاج سایر ویژگی های محیطی، مانند برآورد جمعیت [2]، کاربری زمین شهری [32]، اندازه اشتغال تجزیه و تحلیل می کند . [ 39 ]، مراکز اجتماعی در شهر [ 3 ]، یا مرزهای درک شده مرکز شهر [ 4]]. در چنین زمینه‌هایی، همانطور که قبلاً گفته شد، ارجاع به یک شیء خاص در دنیای واقعی اهمیت کم‌تری دارد، بلکه مکان و تا حدی پایین‌تر، دسته یک POI است که کیفیت نتایج دریافتی را تعیین می‌کند. بنابراین، برای مثال، برای دریافت نتایج دقیق هنگام طبقه‌بندی یک منطقه در یک شهر به عنوان یک منطقه خرید بر اساس دسته‌بندی POI جمع‌سپاری واقع در محدوده آن، دقت موقعیتی بالایی از ویژگی‌های نقطه درگیر مورد نیاز است. در غیر این صورت، POI واقع در حاشیه منطقه می تواند به اشتباه به مناطق همسایه اختصاص داده شود. علاوه بر این، POI باید به درستی به عنوان دسته = فروشگاه طبقه بندی شود. با این حال، مهم این واقعیت است که عدم اطمینان در مورد اینکه یک POI دقیقاً به کدام فروشگاه اشاره می کند، در این مورد هیچ تأثیری بر نتایج تجزیه و تحلیل نخواهد داشت. بنابراین، به منظور ارزیابی تناسب استفاده از یک مجموعه داده POI برای این منظور یا موارد مشابه، یک کاربر آینده نگر داده باید به جای ارجاع به شی، بر معیارهای کیفیت و روش های ارزیابی مربوط به تابع ارجاع جغرافیایی تمرکز کند. تابع.

با این حال، موارد استفاده از POI نیز وجود دارد که تابع دوم را فراخوانی می کند، و بنابراین نیاز به یک ارجاع معنایی بدون ابهام به یک شی در دنیای واقعی خاص دارد، به عنوان مثال در زمینه ورود در مکان های متمایز (مانند فیس بوک). قرار دادن نظرات (به عنوان مثال، Yelp)، یا مکان سیستم های توصیه [ 40]. در اینجا، مکان دقیق یک POI حیاتی نیست، تا زمانی که در یک فاصله آستانه قابل قبول از مکان واقعی قرار دارد، با این حال، یک ارجاع بدون ابهام به یک موجودیت واقعی خاص باید ارائه شود، معمولاً با استفاده از یک نام مکان یا ویژگی دیگری که به عنوان یک شناسه عمل می کند. برای مثال، اگر مشتری از یک سرویس مبتنی بر وب استفاده می‌کند تا رتبه‌بندی را به یک POI نشان دهد که نشان‌دهنده رستورانی است که قبلاً بازدید کرده است، لازم است که POI بدون ابهام به موجودیت واقعی واقعی مراجعه کند، زیرا در غیر این صورت، رتبه را می توان به اشتباه به یک موسسه همسایه نسبت داد. همچنین در این مورد این سوال مطرح است که چگونه یک معیار آستانه فاصله مناسب را می توان تعیین کرد. جدا از ساده ترین حالت تعریف ذهنی یک مقدار مطلق، به عنوان مثال، 50 متر، یک استراتژی دیگر می تواند شامل استفاده از فواصل نسبی باشد که به اندازه واقعی شیء نمایش داده شده در دنیای واقعی بستگی دارد. بنابراین، برای مثال، انحراف 50 متری باید در مورد یک POI که به یک رستوران کوچک به جای یک استادیوم فوتبال یا فرودگاه اشاره دارد، به‌طور جدی‌تر ارزیابی شود. علاوه بر این، مقادیر آستانه قابل قبول می تواند با الگوهای فضایی معمولی POI دسته های مشابه مرتبط باشد. بر این اساس، برای مثال، در حالی که معمولاً کافه‌ها را می‌توان نزدیک‌تر به یکدیگر یافت، ایستگاه‌های پلیس عمداً به شیوه‌ای پراکنده‌تر واقع شده‌اند، که به نوبه خود اجازه می‌دهد تا عدم دقت موقعیت بالاتر از POI مربوطه همچنان قابل قبول باشد. در نهایت، جدای از اندازه‌گیری‌های فاصله اقلیدسی، روابط توپولوژیکی را نباید نادیده گرفت، مانند POI هم‌ارجاعی که عبارتند از:

از این رو، در واقع نیاز به شاخص های کیفیت مناسب وجود دارد که به صراحت تفاوت بین تابع ارجاع جغرافیایی را در مقابل تابع مرجع شی POI ذکر می کند. از نظر ما، از معیارهای کیفیت تعریف شده توسط ISO، کامل بودن، سازگاری منطقی و کیفیت زمانی بر تناسب استفاده از مجموعه داده POI در سطح مفهومی بالاتر تأثیر می‌گذارد، به این معنی که مشکلات مرتبط با کیفیت به همان اندازه بر تناسب آن تأثیر می‌گذارند. بدون توجه به عملکرد POI مورد نظر، استفاده کنید. بنابراین، برای رجوع به موارد نمونه ای که قبلاً استفاده شده بود، استفاده از مجموعه داده POI ناقص بر نتایج یک روش طبقه بندی کاربری زمین تأثیر منفی می گذارد، به دلیل، به عنوان مثال، گم شدن اشیاء طبقه = فروشگاه .در یک منطقه، اما به همان اندازه سودمندی عملی یک سرویس بررسی مکان را کاهش می دهد. همانطور که نشان داده شد، با این حال، مسائل کیفی با توجه به دقت موقعیتی و موضوعی در واقع می توانند در اثر آنها بسته به وظیفه مربوطه متفاوت باشند و بنابراین، باید به شیوه ای خاص و در نهایت کارکرد خاص مورد توجه قرار گیرند. . به همین دلیل، آنها برای رویکرد ما جذابیت خاصی دارند.

با توجه به عملکرد ارجاع جغرافیایی یک POI، تأکید به وضوح بر دقت موقعیت و مکان مطلق آن است. بنابراین، یک روش مناسب برای ارزیابی کیفیت، محاسبه انحراف، به عنوان مثال، بر حسب فاصله اقلیدسی، از محل مرجع صحیح است (به عنوان مثال، [ 27 ، 35]]). با وجود تمرکز بر موقعیت، نمی توان از دقت موضوعی به طور کامل غافل شد. در عوض، صحت همه صفات معنایی باید ارائه شود، اما هیچ تفاوتی بین آنها وجود ندارد. بنابراین، از آنجایی که ارجاع به یک موجودیت واقعی خاص در اینجا اهمیت ثانویه دارد، همانطور که در مثالی از یک کار طبقه بندی کاربری زمین مبتنی بر POI نشان داده شده است، هیچ تمایز اجباری بین شناسه ها وجود ندارد، مانند نام جهان و ویژگی های دیگر مانند دسته POI . با این حال، ممکن است جهان های خاصی از اهمیت نسبی بالاتری برخوردار باشند، مانند دسته بندیدر مثال مورد استفاده، اما این بسیار مختص کار مربوطه است. بر این اساس، به طور کلی، دقت تمام ویژگی های POI را می توان به طور مساوی ارزیابی کرد، به عنوان مثال با محاسبه فاصله معنایی آنها تا مجموعه داده مرجع مربوطه با استفاده از هستی شناسی های واژگانی مانند WordNet [41] یا با محاسبه فاصله لونشتاین (مثلاً [ 26 ]).

در مقابل، تابع ارجاع به شی اساساً به دقت مکان دقیق بستگی ندارد، بلکه بیشتر به امکان استنباط ارجاع بدون ابهام به یک موجودیت واقعی از جهان مرکب POI بستگی دارد، همانطور که در مورد بحث شد. نمونه ای از خدمات رتبه بندی مکان مبتنی بر وب. بنابراین، دقت موقعیتی کافی است اگر POI در مجموعه ژئواتم‌هایی قرار گیرد که ژئو شی فوق‌العاده را تشکیل می‌دهند، به عنوان مثال، ردپای رستوران مربوطه، اما به فاصله اقلیدسی تا مرجع بستگی ندارد. مکان، به عنوان مثال، مرکز جسم. بنابراین، یک روش ارزیابی کیفیت مناسب شامل آزمایش این رابطه توپولوژیکی از طریق یک عملیات متقاطع با ژئو شی مربوطه، به عنوان مثال، ردپای ساختمان است.ویژگی name با مقدار دقیقی که کیفیت آن را می توان با محاسبه فاصله Levenshtein آزمایش کرد. با این حال، اگر نامی ارائه نشده باشد ، در صورت دقت موقعیتی بالا و عدم وجود اطلاعات معنایی متناقض، می توان تا حدی به یک موجودیت واقعی خاص اشاره کرد. به عنوان مثال، اگر یک POI فاقد یک ویژگی نام باشد ، اما در محل دقیق یک رستوران قرار داشته باشد و به طور دقیق به عنوان دسته = رستوران برچسب گذاری شده باشد ، مکانمی‌تواند تا حدودی نقش شناسه شی را بر عهده بگیرد، با این حال، با عدم قطعیت باقی‌مانده، زیرا برای مثال می‌توان تصور کرد که در واقع، POI به رستوران دیگری اشاره می‌کند که قبلاً قبل از بسته شدن در همان مکان بود . بر این اساس، در صورت عدم ارائه نام ، می توان با محاسبه فاصله معنایی از طریق WordNet یا فاصله Levenstein و با استفاده از یکی از روش های پیشنهادی برای محاسبه فاصله قابل قبول، صحت معنایی ویژگی های باقی مانده و همچنین دقت موقعیتی را به طور مناسب ارزیابی کرد. آستانه پیشنهادی قبلا

4. یک برنامه کاربردی برای POI که از فیس بوک به دست آمده است

برای اهداف توضیحی، مفهوم توسعه‌یافته برای مثال فرضی محققی به کار می‌رود که هدفش استفاده از مجموعه داده‌های POI جمع‌سپاری شده برای دو هدف متفاوت است و اکنون با چالش ارزیابی تناسب آن برای استفاده مواجه است. در مثال ساده ما، مجموعه داده POI تنها از یک ویژگی نقطه تشکیل شده است، یعنی نمایش POI فیس بوک از کلیسای جامع سنت پل در لندن، که از طریق Graph API فیس بوک به دست آمده است. از آنجایی که یک مجموعه داده مرجع همیشه برای ارزیابی کیفیت بیرونی مورد نیاز است، POI مشترک از Factual، یک فروشنده تجاری مجموعه داده های POI تضمین شده با کیفیت، گرفته شده است. با این حال، به طور کلی، هنگام انتخاب منابع داده‌های حقیقت زمینی مناسب، باید این واقعیت را تصدیق کرد که امروزه، فرض سنتی مجموعه داده های معتبر یا تجاری که کیفیت بالاتری نسبت به VGI دارند دیگر کاملا قابل اعتماد نیست. بنابراین، مجموعه داده های مرجع باید با دقت و در زمینه خاص مطالعه موردی خاص انتخاب شوند، چالشی که، با این حال، ذاتی روش های ارزیابی کیفیت بیرونی به طور کلی است و بنابراین، از دامنه این کار فراتر می رود.

شکل 1 POI موقعیت جغرافیایی هر دو منبع داده را همراه با ویژگی های موضوعی آنها نشان می دهد. مشاهده می‌شود که تفاوت‌هایی هم از نظر مکان و هم از نظر اطلاعات موضوعی منتسب به POI وجود دارد، یا با استفاده از اصطلاحات ارائه شده توسط [ 1 ]، تابع سطحی ρ: O _POI → E که مرجع بین POI و واقعی را ایجاد می‌کند. – موجودیت جهان در مورد جهان ها متفاوت است O _POI = U ₁ × U ₂ × … × U _n . بنابراین، یک انحراف واضح را می توان از نظر مکان کیهان ، و واریانس های جزئی طبقه بندی اختصاص داده شده مشاهده کرد.برچسب ها. با این حال، جدا از مقادیر متفاوت ویژگی‌های مشترک، تغییراتی نیز با اشاره به جهان‌های تشکیل‌دهنده O _POI وجود دارد . بنابراین، در حالی که فیس بوک اطلاعات عمومی و درباره ویژگی های اضافی را ارائه می دهد ، Factual اطلاعات مربوط به مکان بیشتری را در رابطه با منطقه یا محله و همچنین حقایق دیگری مانند ساعات کار ارائه می دهد .

در سناریوی اول، هدف محقق ما ارزیابی مناسب بودن برای استفاده از نمایش POI فیس بوک از کلیسای جامع سنت پل به منظور توسعه یک سیستم مبتنی بر وب است که امکان ثبت نام در مکان ها را فراهم می کند. مطابق با مفهوم پیشنهادی ما، در اولین گام، او باید مشخص کند که مورد استفاده مورد نظر کدام یک از دو عملکرد اساسی POI را فراخوانی می‌کند. با توجه به این واقعیت که ثبت نام در یک مکان مستلزم وجود یک ارجاع معنایی بدون ابهام بین POI و موجودیت واقعی خاص است، در این مورد به وضوح تابع مرجع شی است. این بینش اطلاعاتی را فراهم می کند که برای مرحله بعدی، یعنی انتخاب روش های ارزیابی کیفیت مناسب، ضروری است. بنابراین، در مورد خاص ارجاع به شی، باید ارزیابی شود که رابطه ارجاع بین POI و موجودیت واقعی با توجه به POI فیس بوک در مقایسه با داده های به دست آمده از Factual، که در نقش خود به عنوان یک مجموعه داده مرجع، از بالاترین سطح در نظر گرفته می شود، چقدر خوب است. کیفیت بنابراین، با توجه به دقت موقعیت، همانطور که بحث شد، باید آزمایش شود که آیا جفت مختصات x، y از POI فیس بوک واجد شرایط بودن آن برای عضوی از مجموعه اتم های جغرافیایی است که جغرافیای فوق مختصات را تشکیل می دهند. شی، بنابراین، رد پای چند ضلعی کلیسای جامع سنت پل. بر این اساس، یک مجموعه داده مرجع دوم در اینجا مورد نیاز است که در این مورد، می توان آن را از Ordnance Survey به دست آورد. با یک عملیات تقاطع ساده، محقق ما می تواند بررسی کند که آیا POI فیس بوک از نظر فضایی با ردپای کلیسای جامع سنت پل تلاقی می کند یا خیر. در این صورت، true را برمی گرداند. با توجه به دقت معنایی، یک شناسه بدون ابهام برای ایجاد مرجع بین POI و شی دنیای واقعی مورد نیاز است. بنابراین، اگر الفویژگی name ارائه شده است، همانطور که در اینجا وجود دارد، از طریق محاسبه فاصله Levenshtein با نام مربوط به مجموعه داده مرجع مقایسه می شود ، که به دلیل عدم وجود اشتباهات املایی، 0 را در اینجا برمی گرداند. با توجه به تابع ارجاع به شی، بنابراین، سایر ویژگی ها مورد نیاز نیست، و به دلیل دقت مکانی و موضوعی کامل، محقق ما بالاترین مقدار ممکن را دریافت می کند، به عنوان مثال 1، برای بیان تناسب استفاده از مجموعه داده فیس بوک به منظور توسعه یک سیستم بررسی مکان.

با این حال، در سناریوی دوم، هدف کاربر داده ما این است که مجموعه داده POI یکسان را برای هدفی متفاوت، یعنی تجزیه و تحلیل توزیع فضایی انواع مختلف POI در لندن، مستقر کند. در اینجا، همانطور که بحث شد، ارجاع به یک موجودیت خاص در دنیای واقعی، به عنوان مثال، کلیسای جامع سنت پل، مرتبط نیست، بلکه دقت اطلاعات مکان و بنابراین تابع ارجاع جغرافیایی است که تعیین کننده تناسب برای استفاده مجموعه داده بنابراین، دقت موقعیت باید بر حسب انحراف دقیق نسبت به موقعیت مرجع مشترک آن در مجموعه داده مرجع ارزیابی شود. بنابراین یک روش مناسب برای ارزیابی کیفیت، محاسبه انحراف بر حسب فاصله اقلیدسی است. بر این اساس، در مثال ما، انحراف تقریباً 36 متری بین POI فیسبوک و فکتوال برای St. کلیسای جامع پل محاسبه می شود، مقداری که سپس می تواند به یک شاخص کیفیت نرمال شده ترجمه شود که دقت موقعیت را بیان می کند. با توجه به دقت موضوعی در زمینه تابع ارجاع جغرافیایی POI، همانطور که گفته شد، تفاوتی بین ویژگی های معنایی وجود ندارد، که به این دلیل است که از آنجایی که ارجاع به یک واقعی خاص است. – موجودیت جهانی بی ربط است،جهان نام در مقایسه با سایر صفات از اهمیت یکسانی برخوردار است. بنابراین، همه صفات معنایی را می توان به روشی جزئی از نظر شباهت معنایی آنها مقایسه کرد. برای ویژگی هایی مانند نام ، آدرس ، شماره تلفن ، وب سایت یا آدرس ایمیل ، فاصله Levensthein را می توان استفاده کرد، در حالی که مقادیر تخصیص داده شده برای دسته ، به عنوان مثال، به طور مناسب تری از طریق محاسبه فاصله معنایی WordNet مقایسه می شوند [ 41] .]. در مورد ما، به دلیل عدم وجود اشتباهات املایی و وجود برچسب‌های دسته‌بندی تا حد زیادی متناظر، بالاترین مقدار شاخص کیفیت برای دقت معنایی توسط محقق ما نسبت داده می‌شود. این واقعیت که تعداد متفاوتی از جهان های سازنده O _POI = U ₁ × U ₂ × … × U _n در فیس بوک در مقابل مجموعه داده واقعی وجود دارد، در اینجا نادیده گرفته شده است، اما برای مثال می توان با مقایسه ساده کل آنها اشاره کرد. در هر دو مجموعه داده شمارش شود.

بنابراین، با پیروی از رویکرد عمومی ما، و در نتیجه تحلیل‌های قبلی، محقق ما متوجه می‌شود که تناسب استفاده از مجموعه داده فیس‌بوک برای موارد استفاده که به تابع ارجاع به شی آن مربوط می‌شود، نسبتاً بالاتر است تا به جغرافیای آن. تابع ارجاع، واقعیتی که ناشی از روش متفاوت محاسبه دقت موقعیت در این مثال خاص است. بنابراین، مجموعه داده برای توسعه یک سیستم بررسی مکان بهتر است تا برای تجزیه و تحلیل توزیع فضایی POI در منطقه مورد مطالعه.

5. بحث

علیرغم ویژگی اکتشافی آن، کاربرد نمونه قبلی سودمندی عملی رویکرد پیشنهادی ما را نشان می‌دهد. بنابراین، نشان داده شد که چگونه، با پیروی از استراتژی ابتدا شناسایی یکی از دو تابع اصلی POI مربوطه، و سپس انتخاب روش‌های ارزیابی کیفیت مناسب، به کاربر یک مجموعه داده POI در ارزیابی تناسب آن برای استفاده کمک می‌شود. به وظایف مختلف در واقع، مجموعه داده استفاده شده در مثال با توجه به تناسب استفاده از آن برای دو سناریو استفاده متفاوت ارزیابی شد، در مورد ما به مقادیر نسبتاً بالاتری برای مورد مربوط به تابع ارجاع به شی نسبت به موقعیت جغرافیایی منجر شد. تابع ارجاع جدا از ارائه اطلاعات در مورد کیفیت مجموعه داده POI با توجه به موارد استفاده خاص، همانطور که نشان داده شده است، چارچوب ما همچنین می‌تواند برای مقایسه POI به‌دست‌آمده از منابع مختلف برای مناسب بودن بسته به مورد استفاده خاص مورد نظر، و راهنمایی انتخاب مناسب‌ترین جایگزین استفاده شود. این به ویژه برای مجموعه داده های POI مفید است که، همانطور که در این مقاله بحث کردیم، از یک طرف اغلب نتیجه جمع سپاری هستند و بنابراین مستعد مسائل مربوط به کیفیت داده ها هستند، و از طرف دیگر برای طیف گسترده ای از داده ها استفاده می شود. وظایف

با چارچوب کمکی پیشنهاد شده در این مقاله، ما یک استراتژی روشن برای شناسایی یک روش مناسب برای ارزیابی تناسب برای استفاده از مجموعه داده‌های POI ارائه می‌کنیم که مبتنی بر ارتباط معیارهای کیفیت موقعیتی و موضوعی مختلف و همچنین روش‌های ارزیابی مناسب آنها است. به عنوان مثال، محاسبه انحراف فاصله اقلیدسی یا فاصله معنایی صفات، به دو تابع اصلی POI، ارجاع جغرافیایی و ارجاع به شی. این موارد به نوبه خود به موارد استفاده مربوطه برای مجموعه داده های POI مانند خدمات بررسی مکان مبتنی بر وب یا محاسبات تراکم POI مربوط می شوند. بدون رویکرد سیستماتیک ما، کاربران مجموعه داده های POI ملزم به ایجاد یک جریان کاری برای ارزیابی تناسب برای استفاده بدون هیچ گونه کمکی هستند. و به طور مستقیم مورد استفاده خاص خود را به معیارهای کیفیت مناسب و روش های ارزیابی مرتبط می کند. با این حال، به نظر ما، این خطر انتخاب های دلخواه و غیربهینه را تا حد زیادی افزایش می دهد و همچنین قابلیت مقایسه مطالعاتی را که مناسب بودن برای استفاده و نتایج آنها را ارزیابی می کنند، کاهش می دهد. بنابراین، اگر هیچ ارتباط انگیزشی واضحی بین مورد استفاده داده شده از یک سو و معیارهای کیفی انتخاب شده و روش‌های ارزیابی از سوی دیگر وجود نداشته باشد، توضیح اینکه چرا به عنوان مثال، تمرکز بر موضعی و نه موضوعی قرار گرفته است دشوار است. دقت برای ارزیابی تناسب برای استفاده، و اینکه کدام عوامل دقیق باعث انتخاب روش‌های ارزیابی کیفیت خاص می‌شوند. در عین حال، رویکردهای مختلف برای ارزیابی تناسب برای استفاده از POI برای یک کار ممکن است از نظر روش اعمال شده متفاوت باشد و بنابراین، فقط تا حدی قابل مقایسه باشد با دنبال کردن توالی مراحل همانطور که در اینجا پیشنهاد شد، که از یک مورد استفاده خاص از طریق تابع POI مربوطه به معیارهای کیفیت مناسب و روش‌های ارزیابی منتهی می‌شود، می‌توان از چنین مشکلاتی اجتناب کرد، زیرا انتخاب دومی به وضوح انگیزه دارد و مستقیماً به هم مرتبط است. به وظیفه مربوطه و کاملاً شفاف.

جدا از ارائه راهنمایی برای انتخاب یک استراتژی مناسب برای ارزیابی تناسب استفاده، همانطور که در بالا ذکر شد، مفهوم پیشنهادی می‌تواند به فرآیند جمع‌سپاری برای خود تولید داده نیز کمک کند. بنابراین، اگر هدف اولیه یک مجموعه داده POI ایجاد شده قبل از فرآیند جمع‌آوری داده‌ها شناخته شده بود، می‌توان اقدامات کنترل کیفیت ویژه کار را به روشی مشابه، یعنی ابتدا شناسایی تابع POI مربوطه، و سپس قرار دادن بر اساس آن، توسعه داد. تمرکز بر یک یا آن شاخص برای دقت موضوعی یا موقعیتی.

با این حال، با توجه به مراحل اولیه این تحقیق، هنوز چندین محدودیت در رویکرد ما وجود دارد. بنابراین، اعتبار روش پیشنهادی ما برای ارزیابی تناسب برای استفاده هنوز با مجموعه داده‌های بزرگتر و موارد استفاده واقعی ارزیابی نشده است. ممکن است در عمل به استفاده از شاخص های کیفیت پیچیده تری نیاز باشد. علاوه بر این، اگرچه ما راه‌های بالقوه استخراج آستانه‌ها را برای انحراف موقعیت قابل تحمل ترسیم کردیم، انتخاب مقادیر مناسب قطعاً چالش برانگیز است و ممکن است تا حد معینی از مقایسه مورد نظر روش‌های مختلف که قبلا ذکر شد، بکاهد. یکی دیگر از مسائل مهم، فرض ساده‌سازی ما است که موارد استفاده به وضوح به یکی از دو عملکرد اصلی POI می‌پردازد، در حالی که نمونه‌های متعددی را ذکر کرده‌ایم که در واقع چنین است. در عمل موارد استفاده ای نیز وجود دارد که به ترکیبی از ارجاع جغرافیایی و ارجاع به شی نیاز دارد، به عنوان مثال، پیمایش به یک POI خاص، که به یک رویکرد ترکیبی برای ارزیابی تناسب برای استفاده نیاز دارد. به طور کلی، یک مرور جامع تر از موارد استفاده بالقوه ارزشمند خواهد بود.

6. نتیجه گیری

انگیزه این کار عدم تطابق بین استفاده مکرر از POI جمع‌سپاری شده برای اهداف تجاری و پژوهش محور از یک سو و فقدان کار بر روی ارزیابی مناسب بودن برای استفاده از چنین مجموعه‌های داده از سوی دیگر بود. قبل از پیش‌زمینه مشکلات مرتبط با کیفیت VGI به طور کلی، اما با تمرکز خاص بر POI جمع‌سپاری، این تحقیق به نیاز تحقیق به یک چارچوب سیستماتیک برای کمک به کاربران داده در انتخاب معیارها و روش‌های کیفیت برای ارزیابی تناسب برای هدف کمک می‌کند. بر اساس نزدیکی مفهومی مفاهیم POI و ژئواتم‌ها، ما در مورد عملکرد دوگانه POI، یعنی ارجاع جغرافیایی در مقابل ارجاع به شی، نظریه‌پردازی کردیم و استدلال کردیم که به منظور ارزیابی مناسب بودن برای استفاده از POI مجموعه داده ها،

از دیدگاه هر کاربر داده، مزیت‌های بالقوه از افزایش مقایسه روش‌ها برای ارزیابی تناسب استفاده و نتایج آن‌ها و همچنین دستورالعمل مفیدی که برای فرآیند انتخاب شاخص‌های کیفیت ارائه می‌شود ناشی می‌شود. به صورت شفاف علاوه بر این، به نظر ما، کار ما به افزایش پتانسیل مجموعه داده‌های POI جمع‌سپاری شده به‌عنوان یک منبع داده با ارزش برای کاربردهای مختلف در حوزه جغرافیایی-فضایی کمک می‌کند. بنابراین، انتظار می‌رود چارچوب پیشنهادی به دستیابی به درک عمیق‌تری از مسائل مربوط به کیفیت POI جمع‌سپاری، به عنوان مثال در رابطه با مشکلات معمولی مرتبط با کیفیت، تفاوت‌های کیفی بین منابع مختلف داده‌های POI، یا موارد استفاده بالقوه که برای POI جمع‌سپاری شده است، کمک کند. کم و بیش مناسب هستند. به علاوه،

کار اولیه ما امکاناتی را برای کارهای آینده باز می کند، مانند تجزیه و تحلیل مقایسه ای POI به دست آمده از منابع داده های مختلف، به عنوان مثال، Facebook، Foursquare یا OSM، با توجه به تناسب نسبی آنها برای استفاده در مورد موارد استفاده مختلف. چنین تحلیل هایی اطلاعات مفیدی را برای کاربران داده های آینده فراهم می کند. علاوه بر این، می توان یک چارچوب جامع برای ارزیابی تناسب اندام برای استفاده برای انواع مختلف موارد استفاده معمولی که شامل POI است، ایجاد کرد. این احتمالاً می تواند به عنوان یک سیستم کمکی خودکار اجرا شود که از تصمیم گیری بین مجموعه داده های مختلف POI پشتیبانی می کند. با این حال، یک پیش نیاز برای این امر شامل آزمایش و اعتبار سنجی مفهوم ما با مجموعه داده بزرگی از POI جمع‌سپاری شده و مقایسه انتقادی نتایج با سایر رویکردهای موجود برای ارزیابی کیفیت داده‌های جغرافیایی-مکانی است.

منابع

دی تره، جی. ون بریتسوم، دی. مت، تی. Bronselaer, A. پاکسازی خودکار پایگاه های داده POI. در مسائل کیفیت در مدیریت اطلاعات وب ; Springer: برلین، آلمان؛ هایدلبرگ، آلمان، 2013; صص 55-91. [ Google Scholar ]
باکی‌الله، م. لیانگ، اس. مبشری، ع. ارسنجانی، ج. Zipf، A. نگاشت جمعیت با وضوح خوب با استفاده از نقاط مورد علاقه OpenStreetMap. بین المللی جی. جئوگر. Inf. علمی 2014 ، 28 ، 1940-1963. [ Google Scholar ] [ CrossRef ]
باوا-کاویا، الف. حس شهری: استفاده از داده های شبکه اجتماعی مبتنی بر مکان در تحلیل شهری. در مجموعه مقالات کارگاه برنامه های کاربردی شهری فراگیر (PURBA) 2011، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 12 ژوئن 2011.
هوانگ، اچ. گارتنر، جی. Turdean, T. رسانه های اجتماعی به عنوان منبعی برای مطالعه درک و شناخت افراد از محیط ها. Mitteilungen der Österreichischen Geographischen Gesellschaft 2013 ، 155 ، 291-302. [ Google Scholar ] [ CrossRef ]
آنتونیو، وی. Skopeliti، A. اندازه گیری ها و شاخص های کیفیت VGI: یک مرور کلی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، II-3/W5 ، 345-351. [ Google Scholar ] [ CrossRef ]
Fonte, CC; باستین، ال. فودی، جی. کلنبرگر، تی. کرل، ن. مونی، پی. اولتئانو-ریموند، A.-M. کنترل کیفیت L. VGI را ببینید. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، II-3/W5 ، 317-324. [ Google Scholar ] [ CrossRef ]
Leibovici، DG; ایوانز، بی. هاجز، سی. ویمن، اس. میک، اس. راسر، جی. جکسون، ام. در مورد تضمین کیفیت داده ها و درهم تنیدگی در جمع سپاری برای مطالعات زیست محیطی. ISPRS Ann. فتوگرام حسگر از راه دور اسپات. Inf. علمی 2015 ، II-3/W5 ، 195-202. [ Google Scholar ] [ CrossRef ]
رویک، او. هوسر، اس. شبکه های اجتماعی مبتنی بر مکان – تعریف، وضعیت فعلی هنر و دستور کار تحقیقاتی. ترانس. GIS 2013 ، 17 ، 763-784. [ Google Scholar ] [ CrossRef ]
Veregin، H. پارامترهای کیفیت داده. در سیستم های اطلاعات جغرافیایی: اصول و مسائل فنی ، ویرایش دوم. جان وایلی و پسران: نیوجرسی، ایالات متحده آمریکا، 2005; صص 177-189. [ Google Scholar ]
سازمان بین المللی استاندارد (ISO). ISO/TC 211 19157: اطلاعات جغرافیایی—کیفیت داده ها . شماره ISO 19157:2013; ISO: ژنو، سوئیس، 2013. [ Google Scholar ]
کنسرسیوم فضایی باز (OGC). OG C به دنبال اظهار نظر عمومی در مورد مدل مفهومی بازخورد کاربر مکانیکی نامزد و استاندارد رمزگذاری xml است. بیانیه مطبوعاتی 2016. در دسترس به صورت آنلاین: http://www.opengeospatial.org/pressroom/pressreleases/2356 (در 20 ژوئیه 2016 قابل دسترسی است).
سناراتنه، اچ. مبشری، ع. علی، ال. کاپینری، سی. هاکلی، ام. مروری بر روش‌های داوطلبانه ارزیابی کیفیت اطلاعات جغرافیایی. بین المللی جی. جئوگر. Inf. علمی 2016 . [ Google Scholar ] [ CrossRef ]
موندزچ، جی. Sester, M. تجزیه و تحلیل کیفیت داده های OSM بر اساس نیازهای برنامه. Cartographica 2011 ، 46 ، 115-125. [ Google Scholar ] [ CrossRef ]
ژانگ، ایکس. Tinghua، A. چگونه جاده ها را در OpenStreetMap مدل کنیم؟ روشی برای ارزیابی تناسب استفاده از شبکه برای ناوبری. در پیشرفت در مدیریت و تجزیه و تحلیل داده های مکانی ؛ Springer: برلین، آلمان؛ هایدلبرگ، آلمان، 2015; صص 143-162. [ Google Scholar ]
فن، اچ. Zipf، A.; فو، س. Neis, P. ارزیابی کیفیت برای ایجاد داده های ردپایی در OpenStreetMap. بین المللی جی. جئوگر. Inf. علمی 2014 ، 28 ، 700-719. [ Google Scholar ] [ CrossRef ]
هوچمیر، اچ. زیلسترا، دی. Neis، P. ارزیابی کامل ویژگی‌های مسیر دوچرخه و مسیر در نقشه خیابان باز برای ایالات متحده. ترانس. GIS 2015 ، 19 ، 63-81. [ Google Scholar ] [ CrossRef ]
گودچایلد، م. یوان، م. Cova، TJ به سوی یک نظریه عمومی نمایش جغرافیایی در GIS. بین المللی جی. جئوگر. Inf. علمی 2007 ، 21 ، 239-260. [ Google Scholar ] [ CrossRef ]
بالاتوره، آ. Zipf، A. چارچوب کیفیت مفهومی برای اطلاعات جغرافیایی داوطلبانه. در مجموعه مقالات دوازدهمین کنفرانس بین المللی نظریه اطلاعات فضایی، COSIT 2015، سانتافه، NM، ایالات متحده آمریکا، 12-16 اکتبر 2015.
دورن، اچ. تورنروس، تی. Zipf، A. ارزیابی کیفیت VGI با استفاده از داده‌های معتبر – مقایسه با داده‌های کاربری زمین در جنوب آلمان. بین المللی J. Geo-Inf. 2015 ، 4 ، 1657-1671. [ Google Scholar ] [ CrossRef ]
Haklay, M. اطلاعات جغرافیایی داوطلبانه چقدر خوب است؟ مطالعه تطبیقی مجموعه داده های نظرسنجی OpenStreetMap و مهمات. محیط زیست طرح. B 2010 , 37 , 682-703. [ Google Scholar ] [ CrossRef ]
بیشر، م. Mantelas، L. یک مدل اعتماد و شهرت برای فیلتر کردن و طبقه بندی دانش در مورد رشد شهری. جئوژورنال 2008 ، 72 ، 229-237. [ Google Scholar ] [ CrossRef ]
فلاناژین، ا. متزگر، ام. اعتبار اطلاعات جغرافیایی داوطلبانه. جئوژورنال 2008 ، 72 ، 137-148. [ Google Scholar ] [ CrossRef ]
مونی، پی. کورکوران، پ. Winstanley، AC به سمت معیارهای کیفیت برای OpenStreetMap. در مجموعه مقالات هجدهمین کنفرانس بین المللی SIGSPATIAL در مورد پیشرفت در سیستم های اطلاعات جغرافیایی 2010، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، 2 تا 5 نوامبر 2010.
بارون، سی. نیس، پ. Zipf، A. چارچوبی جامع برای تحلیل کیفی OpenStreetMap ذاتی. ترانس. GIS 2014 ، 18 ، 877-895. [ Google Scholar ] [ CrossRef ]
زیلسترا، دی. Zipf، A. مطالعه مقایسه ای داده های جغرافیایی اختصاصی و اطلاعات جغرافیایی داوطلبانه برای آلمان. در مجموعه مقالات سیزدهمین کنفرانس بین المللی AGILE در علم اطلاعات جغرافیایی، گیماراس، پرتغال، 11-14 مه 2010.
گیرس، جی اف. Touya, G. عناصر ارزیابی کیفیت داده های OpenStreetMap فرانسه. ترانس. GIS 2010 ، 14 ، 435-459. [ Google Scholar ] [ CrossRef ]
مشهدی، ع. کواترون، جی. Capra, L. تاثیر جامعه بر اطلاعات جغرافیایی داوطلبانه: مورد OpenStreetMap. در OpenStreetMap در GIScience ; انتشارات بین المللی Springer: چم، سوئیس، 2015; صص 125-141. [ Google Scholar ]
کورکوران، پ. مونی، پی. Winstanley، A. تعمیم سازگار توپولوژیکی OpenStreetMap. در مجموعه مقالات GISRUK 2010: GIS Research UK 18 کنفرانس سالانه، لندن، انگلستان، 14-16 آوریل 2010.
استارک، اچ.-جی. ارزیابی کیفیت اطلاعات جغرافیایی داوطلبانه با استفاده از خدمات نقشه وب باز در OpenAdresses. در مجموعه مقالات GI_Forum 2011، سالزبورگ، اتریش، 5-8 ژوئیه 2011.
ارسنجانی، ج. بارون، سی. باکی‌الله، م. Helbich، M. ارزیابی کیفیت مشارکت کنندگان OpenStreetMap همراه با مشارکت آنها. در مجموعه مقالات کنفرانس بین المللی AGILE 2013 در علم اطلاعات جغرافیایی، لوون، بلژیک، 14-17 مه 2013.
هوچمیر، اچ. Zielstra, D. دقت موقعیتی تصاویر فلیکر و پانورامیو در اروپا. در مجموعه مقالات GI_Forum 2012، سالزبورگ، اتریش، 3 تا 6 ژوئیه 2012.
جیانگ، اس. آلوز، آ. رودریگز، اف. فریرا، جی.، جونیور. Pereira، FC داده های نقطه مورد علاقه استخراج از شبکه های اجتماعی برای طبقه بندی و تفکیک کاربری زمین شهری. محاسبه کنید. محیط زیست سیستم شهری 2015 ، 53 ، 36-46. [ Google Scholar ] [ CrossRef ]
شفلر، تی. شیرو، آر. Lehmann, P. تطبیق نقاط مورد علاقه از سایت های مختلف شبکه های اجتماعی. در KI 2012: Advances in Artificial Intelligence 2012 ; Springer: برلین، آلمان، 2012; ص 245-248. [ Google Scholar ]
مولیگان، سی. یانوویچ، ک. بله، م. لی، دبلیو.-سی. تحلیل تعامل مکانی- معنایی نقاط مورد علاقه در اطلاعات جغرافیایی داوطلبانه. در نظریه اطلاعات مکانی 2011 ; Springer: برلین، آلمان، 2011; صص 350-370. [ Google Scholar ]
آناند، اس. مورلی، جی. جیانگ، دبلیو. دو، اچ. جکسون، ام. هارت، جی. وقتی دنیاها با هم برخورد می کنند: ترکیب بررسی مهمات و داده های نقشه خیابان باز. در مجموعه مقالات انجمن ژئوجامعه اطلاعات جغرافیایی کنفرانس 2010، لندن، انگلستان، 30 ژوئن 2010.
لودویگ، آی. ووس، ا. Krause-Traudes، M. مقایسه شبکه های خیابانی Navteq و OSM در آلمان. In Advancing Geoinformation Science for a Changing World 2011 ; Springer: برلین، آلمان، 2011; صص 65-84. [ Google Scholar ]
یانگ، بی. ژانگ، ی. Luan، X. یک رویکرد آرامش احتمالی برای تطبیق شبکه های جاده ای. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 319-338. [ Google Scholar ] [ CrossRef ]
دو، اچ. آلچینا، ن. جکسون، ام. هارت، جی. روشی برای تطبیق داده های مکانی با منبع جمعیتی و معتبر. ترانس. GIS 2016 . [ Google Scholar ] [ CrossRef ]
رودریگز، اف. آلوز، آ. پولیشیوک، ای. جیانگ، اس. فریرا، جی. Pereira، FC برآورد اندازه اشتغال تفکیک شده از نقاط مورد علاقه و داده های سرشماری: از استخراج وب تا پیاده سازی و تجسم مدل. بین المللی J. Adv. هوشمند سیستم 2013 ، 6 ، 41-52. [ Google Scholar ]
برجانی، ب. Strufe, T. یک سیستم توصیه برای نقاط در شبکه های اجتماعی آنلاین مبتنی بر مکان. در مجموعه مقالات چهارمین کارگاه آموزشی سیستم های شبکه های اجتماعی SNS’11، سالزبورگ، اتریش، 10 آوریل 2011.
دانشگاه پرینستون. درباره WordNet در دسترس آنلاین: http://wordnet.princeton.edu (در 20 ژوئیه 2016 در دسترس است).

شکل 1. ارجاعات مشترک POI از Facebook و Factual.

© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب