نقشه راه GIS

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

کاربرد جی ای اس

خلاصه

با فرا رسیدن عصر داده های بزرگ و توسعه سریع و کاربردهای گسترده سیستم های اطلاعات جغرافیایی (GIS)، فناوری کدگذاری جغرافیایی نقش مهمی را در پر کردن شکاف بین منابع داده های غیر مکانی و داده های مکانی در زمینه های مختلف ایفا می کند. با این حال، ژئوکدینگ چینی به دلیل پیچیدگی فرمت رشته آدرس در زبان چینی، که حاوی هیچ مرزبندی بین کلمات چینی نیست، و مدیریت ضعیف آدرس ناشی از وجود چندین مرجع آدرس که در بین سازمان‌های دولتی مختلف پخش شده است، با چالش‌های بزرگی مواجه است. این مقاله یک سرویس کدگذاری جغرافیایی مبتنی بر روش تطبیق آدرس چینی بهینه شده، از جمله مدل‌سازی آدرس، استانداردسازی آدرس و تطبیق آدرس را ارائه می‌کند. مدل آدرس بر معناشناسی فضایی هر عنصر آدرس تمرکز دارد، و فرآیند استانداردسازی آدرس بر اساس مدل درخت آدرس است. یک برنامه خدمات کدگذاری جغرافیایی در عمل با استفاده از مقدار زیادی داده از شهرداری شنژن اجرا می شود. بیش از 1,460,000 رکورد داده برای آزمایش سرویس geocoding استفاده شد و نرخ تطبیق خوبی با سازگاری و هوش خوب به دست آمد.
کلید واژه ها:

سیستم اطلاعات جغرافیایی ; مطابقت آدرس چینی ; مدل آدرس ؛ تطبیق آدرس ؛ خدمات ژئوکدینگ

 

1. معرفی

با ظهور عصر کلان داده ها و توسعه سریع و کاربرد گسترده سیستم های اطلاعات جغرافیایی (GIS) مقادیر فزاینده ای از انواع مختلف داده ها در حوزه های مختلف جمع آوری می شوند [1 ] . به نظر می رسد داشتن توانایی اختصاص مختصات به این داده ها و ادامه تحقیقات عمیق تر در مورد کلان داده ها از منظر فضایی یک ضرورت فوری است [ 2 ]. یکی از موضوعات کلیدی مورد علاقه متون حاوی اطلاعات مکانی است که به عنوان آدرس شناخته می شود و می تواند بیشترین منابعی باشد که شهروندان برای انتقال اطلاعات جغرافیایی یا مکان ها استفاده می کنند [ 3 ]. کتاب منبع جهانی مدیریت داده آدرس، سیستم های آدرس 194 کشور را معرفی کرد [ 4]. بیشتر کاربردهای GIS شهری به فناوری کدگذاری جغرافیایی نیاز دارند که می‌تواند مختصات مکانی را از آدرس‌ها بدست آورد [ 5 ]. تا به امروز، geocoding محبوب ترین و کارآمدترین روش برای تبدیل آدرس ها به مختصات مکانی بوده است و در بسیاری از زمینه ها از جمله بهداشت عمومی [ 6 ، 7 ]، جرم شناسی [ 8 ]، تحقیقات سرطان [ 9 ]، حمل و نقل [ 10 ] استفاده شده است. ، پاسخ تصادفات ترافیکی [ 11 ، 12 ] و دیگران [ 7 ، 13 ، 14 ].
ژئوکدینگ، که به عنوان تطبیق آدرس نیز از آن یاد می شود، فرآیند نگاشت یک آدرس توصیفی مبتنی بر متن به مختصات جغرافیایی دیجیتال است که می تواند در تحلیل و تجسم فضایی استفاده شود [15 ، 16 ، 17 ] . به عبارت دیگر، ژئوکدینگ نوعی فناوری موقعیت‌یابی است که می‌تواند مختصاتی را از متن داده شده یا توضیحات زبان طبیعی اطلاعات مکان مکانی، مانند آدرس شهری، شماره ساختمان، آدرس خیابان، کد پستی، نام ساختمان و نام شرکت استخراج کند. 15 ]. ژئوکدینگ مهمترین ابزار موجود برای پر کردن شکاف بین اطلاعات غیرمکانی و اطلاعات مکانی است و دقت و اطمینان برای سیستم‌ها و خدمات ژئوکدینگ از اهمیت بالایی برخوردار است.5 ، 18 ، 19 ، 20 ، 21 ]. بسیاری از محققان در حال کار برای بهبود نرخ تطبیق کدهای جغرافیایی [ 16 ، 22 ، 23 ، 24 ، 25 ، 26 ] هستند.

ژئوکدینگ یک چالش جهانی است و در حال حاضر در چین نسبت به اکثر کشورهای غربی مشکل‌سازتر است، زیرا زبان چینی از نظر تقسیم‌بندی و معناشناسی بسیار پیچیده‌تر از زبان انگلیسی است [27، 28] : زبان انگلیسی دارای مرزهایی بین کلمات و غربی است. کشورها راه‌حل‌های موفق بسیاری برای انجام چنین وظایفی دارند، مانند راه‌حل ژئوکدینگ آدرس فایل پایه جغرافیایی/ رمزگذاری نقشه مستقل دوگانه (GBF/DIME)، راه‌حل کدگذاری جغرافیایی یکپارچه و مرجع (TIGER، یا TIGER/Line)، کدگذاری جغرافیایی آدرس ESRI. راه حل و غیره [ 29]. تقریباً تمام بسته‌های نرم‌افزار تجاری GIS (به عنوان مثال، ArcGIS و MapInfo) و فروشندگان خدمات نقشه مبتنی بر وب (به عنوان مثال، Google، Bing و MapQuest) ماژول‌های کدگذاری جغرافیایی را ارائه می‌دهند که برای آدرس‌های متنی غیر چینی به خوبی عمل می‌کنند. با این حال، این راه حل ها برای کشورهای غربی طراحی شده اند و برای استفاده در آدرس های چینی نامناسب هستند. ژئوکدینگ چینی به دلیل پیچیدگی نحو و معنای چینی، همانطور که در زیر توضیح داده شده است، یک مشکل دائمی باقی می ماند :

(1)
متن چینی بر خلاف انگلیسی، هیچ مرز بین کلمات ندارد [ 2 ، 28 ]. تجزیه رشته و استخراج عناصر آدرس دقیق، مانند نام مناطق اداری، نام جاده ها، شماره خیابان ها و شماره ساختمان ها برای مطابقت با پایگاه داده مرجع بسیار دشوار است.
(2)
سبک های توصیفی مختلفی در میان آدرس های چینی وجود دارد. مقررات ساختارهای آدرس چینی ضعیف است و قبل از اوایل دهه 1990 توجه کمی از سوی مدیران برنامه ریزی شهری و اداری دریافت می شد. تعداد زیادی از آدرس‌هایی که در پایگاه‌های اطلاعاتی جغرافیایی پایه جمع‌آوری و ذخیره شده‌اند، فاقد ساختار یکنواخت هستند و طبق عرف محلی در غیاب قوانین معتبر صریح برای پیروی تعریف شده‌اند. با افزایش دسترسی به چنین داده های آدرسی، وضعیت آشفته آدرس های چینی آشکارتر می شود.
(3)
برنامه ریزی شهری و مدیریت آدرس در بسیاری از مناطق چین آشفته است. برای مدت طولانی، طرح‌بندی شهرها در چین بدون برنامه‌ریزی شهری کافی توسعه یافته است و شماره ساختمان‌ها به‌طور تصادفی و بدون مقررات اختصاص داده می‌شوند. در نتیجه، افزودن، حذف و به‌روزرسانی برای تطبیق آدرس‌های جدید دشوار است، و درونیابی آدرس و تطبیق آدرس دشوار است، زیرا برای مثال، چندین جاده مختلف به نام جاده ژونگ‌شان نامگذاری شده‌اند. این امر دشواری و عدم دقت کار تطبیق آدرس در چین را بیشتر می کند.
(4)
حقوق نامگذاری و تایید آدرس بین چندین سازمان مختلف دولتی توزیع شده است. حق نام‌گذاری مناطق اداری مانند استان‌ها، شهرها و بخش‌ها متعلق به شورای دولتی است، در حالی که شماره خیابان‌ها و شماره ساختمان‌ها توسط اداره امنیت عمومی اداره می‌شود. در همین حال، ادارات شهرسازی حق نامگذاری معابر و خیابان ها را دارند. به عنوان مثال، در آدرس “شهر شنژن، منطقه فوتیان، شماره جاده غربی هنگلی 8890″، عناصر آدرس “شهر شنژن” و “منطقه فوتین” توسط شورای ایالتی تعیین می شود، در حالی که “جاده غربی هونگلی” توسط شهری تعریف می شود. بخش برنامه ریزی و “شماره 8890” توسط وزارت ایمنی عمومی اختصاص داده شده است. فقدان برنامه ریزی آدرس واحد، مدیریت آدرس ها و انجام تطبیق آدرس را بسیار دشوار می کند زیرا آژانس های مختلف دارای قالب های آدرس و فرم های توصیفی متفاوتی هستند. این وضعیت استاندارد کردن حتی یک آدرس چینی را بسیار دشوار می کند.
در این مقاله، مجموعه‌ای از روش‌های بهینه‌سازی تطبیق آدرس چینی برای حل وضعیت توضیح داده شده در بالا ارائه می‌شود. هدف از روش‌های پیشنهادی: (1) سازگاری با پیچیدگی متن چینی است. (2) روابط توپولوژیکی بین عناصر آدرس را در نظر بگیرید. و (3) بهبود کارایی و دقت الگوریتم‌های geocoding سنتی. در ادامه این مقاله، ابتدا منطقه مورد مطالعه و داده‌ها را در بخش 2 شرح می‌دهیم، سپس روش بهینه‌سازی شده را با جزئیات شامل ساختار مدل آدرس و استانداردسازی آدرس و فرآیند تطبیق آدرس در بخش 3 شرح می‌دهیم . سپس، آزمایش‌های انجام‌شده و نتایج آن‌ها در بخش 4 ارائه شده‌اند . بحث در بخش 5 ارائه شده استو نتیجه گیری در بخش 6 خلاصه شده است .

2. منطقه مطالعه و داده ها

2.1. منطقه مطالعه

شنژن شهر بزرگی است که در جنوب شرقی چین بین طول‌های جغرافیایی ۱۱۳ درجه و ۴۶ دقیقه تا ۱۱۴ درجه و ۳۷ دقیقه شرقی و عرض‌های جغرافیایی ۲۲ درجه و ۲۷ دقیقه و ۲۲ درجه و ۵۲ دقیقه شمالی واقع شده است. مساحت کل شنژن 1952 کیلومتر مربع است و دامنه آن 81.4 کیلومتر از شرق به غرب و 10.8 کیلومتر از شمال به جنوب است. شنژن در جنوب به هنگ کنگ، در شمال به دونگوان و در شرق به هویژو متصل است. شنژن یکی از مناطق ویژه اقتصادی چین است. در حال حاضر، شنژن از 10 ناحیه (لوهو، فوتین، نانشان، یانتیان، بائوان، لونگگانگ، گوانگ‌مینگ، پینگشان، لونگ‌هوا و داپنگ) تشکیل شده است. شکل 1 موقعیت شهرداری شنژن و نقشه ای از مناطق شنژن را نشان می دهد.
با توسعه سریع شهرداری شنژن، دولت شنژن حجم عظیمی از داده ها را در سال های اخیر جمع آوری و ذخیره کرده است. این داده‌ها را می‌توان به دو دسته کلی زیر تقسیم کرد: داده‌هایی که شامل مختصات مکانی، یعنی داده‌های مکانی، و داده‌هایی که فقط شامل توضیحات متنی اطلاعات مکانی مانند آدرس‌ها، کدهای پستی و نام‌ها هستند. نوع دوم داده ها مختصات ندارند و داده های غیر مکانی نامیده می شوند. برای استفاده موثرتر از این داده ها، دولت قصد دارد تلاش هایی را برای ارائه داده های باز آغاز کند. با این حال، این طرح‌ها با مشکل حیاتی نحوه پیوست کردن اطلاعات مکانی به این داده‌های غیرمکانی مواجه هستند. برای این منظور، ژئوکدینگ بهترین راه حل است.

2.2. داده ها

همانطور که در بالا ذکر شد، مقادیر زیادی داده های مکانی و غیر مکانی توسط دولت شنژن در طول سال ها جمع آوری شده است، از جمله داده های مکانی برای جاده ها، نقاط مورد علاقه (POI)، ساختمان ها، شماره خیابان ها و شماره ساختمان ها و غیر مکانی. داده ها برای بیمارستان ها، مدارس و شرکت ها.
داده‌های مکانی که ما در این مطالعه برای ساخت یک پایگاه‌داده مرجع برای توسعه سرویس geocoding پیشنهادی استفاده کردیم، از کمیسیون برنامه‌ریزی شهری، زمین و منابع شهرداری شنژن (SZPL) به‌دست آمد. این پایگاه داده شامل داده‌های اداری، داده‌های جاده، داده‌های POI، داده‌های شماره خیابان، داده‌های نام نامی و داده‌های شماره خانه است (در مجموع تقریباً 708000 رکورد داده).
ما از داده‌های بیماری غیرمکانی مرتبط با آدرس خانه و داده‌های شرکت مرتبط با آدرس شرکت استفاده کردیم. داده های بیماری شامل بیش از 100000 پرونده به دست آمده از مرکز اطلاعات بهداشتی شنژن (SCHI) و داده های شرکت شامل تقریباً 1360000 پرونده است که از کمیسیون نظارت بر بازار و کیفیت شهرداری شنژن (SZSCJG) به دست آمده است.

3. روش‌های تطبیق آدرس

شکل 2 اصول اساسی فرآیند ژئوکدینگ [ 26 و 27 ] را نشان می دهد که شامل ساخت مدل آدرس، استانداردسازی آدرس، تطبیق آدرس و ساخت پایگاه داده مرجع است. مدل آدرس توضیح می دهد که چگونه یک آدرس واحد سازماندهی شده است و روابط بین عناصر آدرس را تعریف می کند. هدف ISO 19160 استقرار یک مدل آدرس فعال شده از نظر جغرافیایی استاندارد شده بین المللی است [ 30]]. متأسفانه، پیشرفت قابل توجه کمی در بین المللی سازی آدرس ها در چین حاصل شده است. استانداردسازی آدرس، فرآیند تجزیه یک رشته آدرس ورودی به لیستی از عناصر آدرس و سپس مرتب سازی مجدد این عناصر بر اساس معنای مکانی آنها است. این فرآیند همچنین شامل حذف خطاها، تصحیح عیوب آدرس و تأیید مقصد رشته آدرس ورودی است. تطبیق آدرس مرحله بعدی ژئوکدینگ است و به فرآیند اختصاص مختصات مکانی به یک آدرس استاندارد شده با جستجو در پایگاه داده مرجع با استفاده از یک الگوریتم تطبیق آدرس خاص اشاره دارد.
دقت ژئوکدینگ یکی از بزرگ‌ترین نگرانی‌های کاربران در هنگام جستجوی مناسب‌ترین سرویس ژئوکدینگ است، زیرا دقت کمتر جغرافیایی منجر به خطا در برنامه‌های کدگذاری جغرافیایی می‌شود. بیشتر راه‌حل‌های کدگذاری جغرافیایی از یک روش کلی استفاده می‌کنند که در آن آدرس‌ها صرفاً بر اساس مقایسه متن مطابقت داده می‌شوند و معنای فضایی عناصر آدرس نادیده گرفته می‌شوند. در مقابل، راه‌حل کدگذاری جغرافیایی پیشنهاد شده در این مقاله به طور کامل معناشناسی فضایی مربوطه، به‌ویژه روابط توپولوژیکی بین عناصر آدرس را در نظر می‌گیرد. با محدودیت های ارائه شده توسط روابط فضایی، قوانین برازش مورد استفاده برای بازسازی آدرس مقصد دقیق تر خواهد بود و عملیات فضایی را می توان در فرآیند geocoding استفاده کرد.

3.1. مدل آدرس

مدل آدرس یک توصیف انتزاعی از نحوه سازماندهی و بیان یک آدرس داده شده حاوی عناصر آدرس خاص است. یک آدرس چینی از سه جزء اصلی تشکیل شده است: عناصر اداری، اشیاء محدودیت اساسی و مکان‌های نقطه محلی [ 31 ، 32 ]. قوانین سازمان برای این عناصر آدرس اغلب به شرح زیر توضیح داده می شود:

<آدرس استاندارد> ::=<نام مدیریت> <شیء محدودیت اساسی> <موقعیت نقطه محلی>

عناصر به صورت زیر تعریف می شوند:

<نام اداری > ::=<کشور<استان> [منطقه] <شهرستان> [روستا]
<شیء محدودیت اساسی> ::=<خیابان>|<کوچه>|<منطقه صنعتی>|<روستای طبیعی>
<موقعیت نقطه محلی> ::=<شماره ساختمان> [شماره خانه]|<نقطه عطف>|<نقطه مورد علاقه>
به عنوان مثال، آدرس “No. 8088، Hongli Road، Futian District، Shenzhen، همانطور که در شکل 3 نشان داده شده است .
قوانین سازمانی برای آدرس ها راهنمایی های مهمی را در مورد چگونگی توصیف یک مکان به زبان طبیعی ارائه می دهند، اما آنها برای نشان دادن روابط فضایی و محدودیت های بین عناصر آدرس، که برای تجزیه و استانداردسازی آدرس مهم هستند، کار چندانی نمی کنند. روابط فضایی خاصی بین عناصر آدرس وجود دارد: تجزیه و تحلیل آدرس های چینی روابط توپولوژیکی (مانند شامل، مجاورت و مجاور)، روابط فاصله و روابط جهت را نشان می دهد. در بیشتر موارد، روابط توپولوژیکی بین عناصر آدرس، به ویژه روابط حاوی، بسیار رایج و آشکار است. یک مدل آدرس با این ویژگی سلسله مراتبی معمولاً مدل آدرس سلسله مراتبی نامیده می شود [ 33 ]. شکل 4نمونه ای از آدرس شنژن را با چندین نوع روابط فضایی نشان می دهد. روابط توپولوژیکی (شامل) بین عناصر آدرس “Shenzhen City”، “Hongli Road” و “Number 8088” وجود دارد. یک رابطه جهت بین عناصر آدرس “شماره 8088” و “غرب”. و یک رابطه فاصله بین عناصر آدرس “شماره 8088” و “200 متر” وجود دارد.
طبق قوانین سازمانی که در بالا ذکر شد، روابط حاوی در بین سه کلاس از عناصر آدرس وجود دارد. عناصر <Administrative name> حاوی عناصر <Basic constraint object> هستند. برای مثال، عناصر استان شامل عناصر شهر و عناصر ناحیه یا عناصر شهرستان در عناصر شهر هستند. عناصر <Basic constraint object> حاوی عناصر <Local point location> هستند . به عنوان مثال، شماره خیابان ها یا شماره ساختمان ها در جاده ها یا بلوک های خاص قرار دارند. در موارد خاص، روابط جهت و روابط فاصله ممکن است به طور همزمان در بین <Local point location> وجود داشته باشدعناصر؛ به عنوان مثال، در توضیحات موقعیت مکانی نقطه محلی «No. 8088 غرب 200 متر، “غرب” جهت و “200 متر” نشان دهنده فاصله است. ترکیبی از توصیفگر نقطه محلی «No. 8088، جهت “غرب” و فاصله “200 متر” مکان دقیق را مشخص می کند. هیچ یک از این عناصر را نمی توان حذف کرد. شکل 5 روابط دقیق در مورد آدرس نمونه را نشان می دهد.

3.2. استاندارد سازی آدرس

استانداردسازی آدرس مهمترین فرآیند درگیر در ژئوکدینگ است. در این فرآیند، یک رشته آدرس ورودی تجزیه و سپس در قالب استاندارد صادر می‌شود. این فرآیند معمولاً شامل دو مرحله [ 34 ] است: تجزیه آدرس و عادی سازی آدرس. هدف از تجزیه آدرس، تقسیم رشته آدرس ورودی به عناصر آدرس معنی دار با معنای مکانی دقیق است. در نرمال‌سازی آدرس، هر عنصر آدرس غیررسمی یا مخفف شده به یک قالب استاندارد تبدیل می‌شود و عناصر آدرسی که اشتباه نوشته شده‌اند در قالب صحیح مجدداً ضبط می‌شوند.

در این مطالعه، ما از یک فرآیند استانداردسازی بر اساس یک مدل درخت آدرس استفاده کردیم که برای اولین بار در مقاله منتشر شده قبلی ما [ 35 ] پیشنهاد شد. این فرآیند بر اساس سه تعریف دقیق زیر تعریف شده است:

(1)
آدرس مجموعه ای از عناصر آدرس است و مجاز است به چندین موجودیت فضایی مختلف اشاره کند.
(2)
هر عنصر آدرس دارای معانی آدرس خاصی است. معنای معنایی عنصر آدرس، شی فضایی است که مقصد واقعی آن است. این تعریف نشان دهنده این پدیده است که یک موقعیت ممکن است چندین آدرس مختلف داشته باشد.
(3)
سطح معنایی یک عنصر آدرس با کلاس آن تعریف می شود. طبق این تعریف، عناصر اداری بالاترین سطح معنایی و عناصر محلی تفصیلی کمترین سطح معنایی را دارند.

همانطور که شکل 6 نشان می دهد، هدف از استانداردسازی آدرس، یافتن یک مسیر متصل در مجموعه معنایی است که دارای روابط قیود مکانی صحیح باشد، و هر مسیر متصلی که یافت می شود را می توان به عنوان زیردرختی از یک مدل درخت آدرس در نظر گرفت. استانداردسازی آدرس را می توان با استفاده از یک مدل درختی بر اساس ویژگی های معنایی آن مدل به طور مناسب انجام داد. فرآیند استانداردسازی دقیق به شرح زیر است:

(1)
رشته آدرس ورودی را تجزیه کنید و آن را به عنوان مجموعه ای از عناصر آدرس X و مجموعه معنایی S سازماندهی کنید .
(2)
گره ریشه را ایجاد کنید، عنصر آدرس 1 را استخراج کنید ، و سپس تمام عناصر معنایی 1 مرتبط با 1 را برای ایجاد گره های معنایی آدرس و اتصال آنها به گره ریشه، طی کنید.
(3)
به استخراج عنصر آدرس i ادامه دهید و تمام گره های فرزند آن را طی کنید. به عنوان مثال، مقایسه i1 با گره برگ فعلی i را در نظر بگیرید . ابتدا مقایسه سطح معنایی را انجام دهید و اگر سطح معنایی i1 کمتر از Li باشد ، سازگاری رابطه محدودیت فضایی بین این دو گره را ارزیابی کنید اگر این رابطه سازگار است، i1 را به گره برگ فعلی i متصل کنید .
اگر سازگاری صحیح نباشد، عملیات باید تکرار شود و در امتداد زیردرخت فعلی ردیابی شود تا زمانی که گره دیگری i پیدا شود که سطح معنایی بالاتری نسبت به i1 دارد و سازگاری این دو گره قابل تایید باشد بنابراین، مرحله 3 یک فرآیند تکراری برای مقایسه Si1 با هر گره بعدی  است . اگر آنها سازگار باشند، i1 در موقعیت فعلی در این زیردرخت درج می شود، و در غیر این صورت، i1 باید با گره برگ بعدی درخت آدرس مقایسه شود.
برای همان عنصر آدرس، اگر AdrLevel( i ) ≠ AdrLevel ( j ) ( i ≠ j ) و j به عنوان یک گره برگ جدید از مدل آدرس تعیین شده باشد، از این گره برگ بگذرید.
از طریق این فرآیند، یک رشته آدرس ورودی با توضیحات گیج، نامرتب و حتی نادرست می تواند به درستی سازماندهی شود تا ساختار معنایی مکانی آدرس برای پردازش بعدی استخراج شود.

3.3. الگوریتم تطبیق آدرس

تطبیق آدرس، فرآیند ترجمه رشته آدرس ورودی به مختصات مکانی است [ 7]، که سپس می تواند به عنوان یک فایل فرمت شده دانلود شود یا بر روی نقشه ها نمایش داده شود. فناوری تطبیق آدرس برای ادغام داده‌های غیرمکانی با داده‌های مکانی از اهمیت بالایی برخوردار است و توانایی انجام نقشه‌برداری مبتنی بر آدرس و تجزیه و تحلیل فضایی را برای کشف الگوهای جدید فضایی و همبستگی‌های فضایی فراهم می‌کند که به سختی از داده‌های آماری مشاهده می‌شود، به عنوان مثال، بیماری. نقشه برداری و نقشه برداری جرم و جنایت. تطبیق آدرس تلاش می کند تا دقیق ترین نتایج تطبیق را برای هر رشته آدرس ورودی برگرداند. ابتدا، تلاش می شود تا آدرس ورودی را در سطح شماره خانه به طور دقیق تطبیق دهد. اگر نتیجه مطابقی پیدا نشد، تطبیق در سطح بالاتر بعدی که در آدرس نشان داده شده است، مانند سطح جامعه، خیابان یا ناحیه انجام می شود تا زمانی که نتیجه پیدا شود. سرانجام،

واضح است که وقتی مجموعه خاصی از داده های آدرس ورودی داده می شود، دو احتمال وجود دارد: وجود یا عدم وجود داده های آدرس متناظر در پایگاه داده مرجع. در حالت اول، تطبیق آدرس بسیار ساده است. در این صورت آدرس مربوطه و مختصات جغرافیایی آن در پایگاه داده مرجع یافت می شود. با این حال، گاهی اوقات داده های آدرس مورد نظر در پایگاه داده مرجع وجود ندارد، شاید به این دلیل که ورودی یک آدرس جدید است. در حالت دوم، برای یافتن محتمل ترین آدرس صحیح، درون یابی لازم است. علاوه بر این، شماره خانه های مجاور و مختصات جغرافیایی آنها باید مشخص شود و از فرمول های زیر برای محاسبه مختصات جغرافیایی تقریبی آدرس مورد نظر استفاده شود [ 22 ، 36] .]:

ایکس=ایکس1+ایکس2-ایکس1ن2-ن1×(ن-ن1)
Y=Y1+Y2-Y1ن2-ن1×(ن-ن1)
متغیرهای فرمول فوق به صورت زیر تعریف می شوند: 1 مختصات طولی اولین خانه در سمت راست شماره خانه داده شده، 2 مختصات طولی اولین خانه در سمت چپ شماره خانه داده شده، Y است. 1 مختصات عرضی خانه اول سمت راست شماره خانه داده شده، 2 مختصات عرضی خانه اول سمت راست شماره خانه داده شده، 1 شماره اولین خانه سمت راست است، 2 شماره اولین خانه سمت چپ است و Nشماره خانه داده شده است.
اگر هیچ شماره خانه ای در سمت راست شماره خانه داده شده وجود نداشته باشد، 2 نزدیک ترین مقدار ممکن را به عدد داده شده و X = 2 اختصاص می دهد . اگر هیچ شماره خانه ای در سمت چپ شماره خانه داده شده وجود نداشته باشد، 1 نزدیکترین مقدار ممکن به عدد داده شده و X = 1 و Y = 1 است . نمودار جریان الگوریتم درون یابی در شکل 7 نشان داده شده است .

4. برنامه خدمات کدگذاری جغرافیایی

برای تأیید روش‌های تطبیق آدرس‌دهی پیشنهادی در این مقاله، یک سیستم خدمات کدگذاری جغرافیایی برای شهرداری شنژن، چین توسعه داده شد. این سیستم ژئوکدینگ از روش های توضیح داده شده در بخش قبل، از جمله مدل آدرس، روش استانداردسازی آدرس و الگوریتم تطبیق آدرس، برای شهرداری شنژن استفاده می کند.
سیستم خدمات رمزگذاری جغرافیایی شامل مجموعه داده های جمع آوری شده از SZPL است. در مجموع، تقریباً 708000 رکورد وجود دارد. به طور خاص، مجموعه داده شامل 714 رکورد از نام های اداری، 9475 رکورد از نام مناطق، 2000 رکورد از نشانه ها، 340،000 رکورد از POI، 25،000 رکورد از جاده ها، 250،000 رکورد از شماره ساختمان و 81،000 رکورد از شماره خانه ها است.

4.1. توسعه سرویس ژئوکدینگ

سیستم ژئوکدینگ برای شهر شنژن چین با استفاده از روش های تطبیق آدرس ارائه شده در بالا ساخته شده است. این سیستم از پنج جزء تشکیل شده است: یک پایگاه داده مرجع، یک موتور تطبیق آدرس، یک سرویس کدگذاری جغرافیایی مبتنی بر موتور تطبیق آدرس، یک سیستم نمایش آنلاین کدگذاری جغرافیایی و یک سیستم مدیریت پایگاه داده ژئوکدینگ که به صورت بصری در شکل 8 خلاصه شده است .
پایگاه داده مرجع بر اساس Oracle 11g Release 2 است و شامل یک مجموعه داده منطقه اداری، یک مجموعه داده جاده، یک مجموعه داده POI، یک مجموعه داده اعداد ساختمان، داده های فهرست، داده های قوانین و برخی از مجموعه داده های کمکی دیگر است.
موتور تطبیق آدرس مهمترین بخش سیستم است و در پایگاه داده ای که در بالا توضیح داده شد اجرا می شود. این شامل یک پیش پردازنده، یک تجزیه کننده آدرس و یک ماژول تطبیق آدرس است. پیش پردازنده نمادهای بی معنی را حذف می کند و تجزیه کننده آدرس سعی می کند هر ورودی آدرس توسط کاربر را مطابق با مدل آدرس و ویژگی های آدرس های چینی تجزیه کند. موتور تطبیق آدرس در جاوا کدگذاری شده است و از Lucene برای تطبیق فازی و هوشمند استفاده می کند.
سرویس کدگذاری جغرافیایی مبتنی بر موتور تطبیق آدرس است و با استفاده از خدمات وب استاندارد ساخته شده است. شکل 9 نمونه ای از خروجی سرویس کدگذاری جغرافیایی را نشان می دهد. سیستم نمایش geocoding آنلاین بر اساس سرویس geocoding است و از کتابخانه OpenLayers برای تجسم نقشه استفاده می کند. شکل 10 و شکل 11 رابط کاربری سیستم نمایش ژئوکدینگ آنلاین را نشان می دهد. در نهایت، ثابت شده است که یک سیستم مدیریتی که شامل ویژگی های نقشه برداری و خواندن داده های یکپارچه است که با تعبیه محصول ArcObjects ارائه شده توسط ESRI پیاده سازی شده است، قادر به مدیریت داده ها است. شکل 12 رابط کاربری اصلی سیستم مدیریت پایگاه داده را نشان می دهد.
با توجه به مدل آدرس توضیح داده شده در بخش قبل، مناسب ترین مدل آدرس را برای شهرداری شنژن شناسایی کردیم که در شکل 13 نشان داده شده است . هنگام محاسبه مدل آدرس، مکان پایدار بالاتر نشان داده شده در یک آدرس توصیفی انتخاب شد. در سطح دقیق‌تری از جزئیات، شماره‌های ساختمان معمولاً مهم‌ترین اطلاعات آدرس هستند و به دنبال آن نشانه‌ها و POI قرار می‌گیرند. هنگامی که مدل آدرس ایجاد شد، از آن در فرآیندهای استانداردسازی آدرس و تطبیق آدرس استفاده شد.

4.2. آزمایش و نتایج

درجه تطبیق آدرس به تناسب یک آدرس مطابق با آدرس مقصد آن اشاره دارد. آدرس نامزد یک آدرس اصلی را می توان بر اساس آدرس نامزدی که به بهترین وجه با آدرس منطبق مطابقت دارد به دست آورد و انتخاب کرد. درجه آدرس مطابق را می توان به صورت زیر بیان کرد:

D=مسOس=س(تی1+تی2+تی3+⋯+تیn)تی1+ایکس1+تی2+تی3+ایکس2+⋯+تیn+ایکسمن≈س1+س2+س3+⋯+سnتی1+ایکس1+تی2+تی3+ایکس2+⋯+تیn+ایکسمن=سnتی1+ایکس1+تی2+تی3+ایکس2+⋯+تیn+ایکسمن

که در آن D درجه تطبیق، Ms آدرس تطبیق آدرس اصلی، Os آدرس مقصد آدرس اصلی، M مجموعه معنایی فضایی نتایج تقسیم‌بندی آدرس اصلی است و می‌تواند به صورت توصیف شود .س(تی1+تی2+تی3+…+تیn)یا س1+س2+س3+…+سn. مفصل ترین آدرس است  سn. آدرس اصلی را می توان به برخی از عناصر آدرس تقسیم کرد، t به این معنی است که عنصر آدرس را می توان شناسایی کرد و x به این معنی است که آدرس را نمی توان شناسایی کرد. می توانیم درجه تطابق را از رابطه (1) محاسبه کنیم.

به عنوان یک روش محاسبه بهتر، ما از مدل فضای برداری اصلاح شده (M-VSM) برای محاسبه درجه تطابق استفاده کردیم که به صورت زیر بیان می شود:

D=cosθ=(م·O)/(||م||||O||)

که در آن M بردار وزن عنصر آدرس منطبق و O بردار وزن بخش بندی آدرس اصلی است.

در نتایج، درجه تطبیق 100٪ به این معنی است که شرح آدرس کاملاً استاندارد است و برای مقررات مدل آدرس مناسب است. با این حال، عوامل متعددی می توانند درجه تطابق را کاهش دهند، مانند یک پایگاه داده مرجع ناقص و آدرس های فرمول نشده بدون مکان های نسبی یا روابط جهت فضایی.
بیش از 100000 رکورد از داده های بیماری از SCHI و تقریباً 1360000 رکورد از داده های شرکت از SZSCJG برای آزمایش سیستم خدمات ژئوکدینگ توسعه یافته استفاده شد. در این مطالعه، داده های ساختمان را به عنوان مجموعه داده مرجع و داده های بیماری و داده های شرکت را به عنوان داده های هدف در نظر می گیریم. اگر آدرس داده‌های هدف را بتوان در مجموعه داده مرجع جستجو کرد، فرض می‌کنیم که داده‌های هدف کاملاً با درجه تطبیق 100٪ مطابقت دارند. اگر برخی از عناصر داده‌های هدف را بتوان در مجموعه داده مرجع جستجو کرد، داده‌های هدف را تطابق جزئی در نظر می‌گیریم، سپس درجه تطابق را برای هر فرآیند تطبیق محاسبه می‌کنیم و بهترین مورد را برای داده‌های هدف با درجه تطابق بین 0% انتخاب می‌کنیم. -100% با این حال، اگر هیچ عنصری از داده‌های هدف را نتوان در مجموعه داده مرجع یافت، نتیجه بی‌همتا است، با درجه تطبیق 0٪. بنابراین، درجات تطبیق بالاتر با فرآیندهای تطبیق دقیق تر مطابقت دارد.
نتایج تجربی در جدول 1 نشان داده شده است . شکل 14 توزیع درجه تطبیق را نشان می دهد. به طور کلی، نتایج موارد زیر را نشان می دهد: (1) برای داده های بیماری، 61.1٪ از سوابق با دقت کامل مطابقت داشتند، 3.3٪ از رکوردها با درجه تطبیق 90٪ -100٪، 8.5٪ از سوابق مطابقت داشتند. با درجه تطابق 80٪ تا 90٪ مطابقت داشتند و تنها 13.9٪ از آدرس ها دارای درجه تطابق کمتر از 60٪ بودند. (2) برای داده های شرکت، 98.6٪ از رکوردها با دقت کامل، 81.1٪ از رکوردها با درجه تطبیق 90٪ تا 100٪، 17.4٪ از رکوردها با درجه تطبیق 70 مطابقت داشتند. %–80% و تنها 1.4% از آدرس‌ها درجه تطابق کمتر از 60% داشتند.
برای یک آدرس غیراستاندارد، مانند «جاده هونگلی، ناحیه نانشان، شنژن» (جاده هنگلی در ناحیه نانشان قرار ندارد)، ماژول استانداردسازی آدرس آدرس را استاندارد و تصحیح می‌کند (در این مورد، به «جاده هونگلی، ناحیه فوتیان، شنژن”).

5. بحث

مطابق با روش‌های تطبیق آدرس پیشنهادی، یک سیستم خدمات کدگذاری جغرافیایی برای شنژن، چین توسعه داده شد. برای سنجش اثربخشی این روش، درجه تطابق، میزان تطابق و معیارهای سازگاری و هوش برای ارزیابی کیفیت روش تطبیق آدرس استفاده شد. درجه تطبیق کیفیت یک رکورد جغرافیایی کد شده را نشان می دهد. یک رکورد به‌طور دقیق تطبیق، نادرست یا بی‌همتا در نظر گرفته می‌شود. این سیستم یک امتیاز مختصر برای هر آدرس همسان ارائه می دهد. نمره بالاتر نشان دهنده تطابق دقیق تر است، جدول 2 تفسیر درجه تطابق را خلاصه می کند.
نرخ تطابق، نسبت آدرس‌هایی است که با موفقیت در یک درجه تطابق معین مطابقت دارند. شکل 15 نرخ تطابق تعیین شده از نتایج تجربی را نشان می دهد.
از نتایج تجربی، می‌توانیم ببینیم که برای داده‌های شرکت، 60.4 درصد از آدرس‌ها با دقت تطبیق داده شده‌اند، 86 درصد از آدرس‌ها با موفقیت در درجه تطابق بیش از 60 درصد، و نرخ تطابق متناظر برای داده‌های بیماری، 49.3 بوده است. ٪ و 98.6٪، به ترتیب، در همان درجات تطبیق. پس از تجزیه و تحلیل گزارش‌های تطبیق، ما دو دلیل اصلی برای این یافته‌ها شناسایی کردیم: اول، داده‌های شرکت به شیوه‌ای منظم‌تر ثبت می‌شوند، و توضیحات آدرس در بیماری بسیار نامنظم است، زیرا توسط افراد مختلف با درک متفاوت ثبت شده است. قالب بندی آدرس دوم، بسیاری از آدرس‌های موجود در داده‌های بیماری در شنژن قرار ندارند. با این حال، نتایج به اندازه کافی دقیق هستند تا برخی تحقیقات در مورد بهداشت عمومی انجام شود [ 37، 38 ].
سرویس کدگذاری جغرافیایی توسعه‌یافته از نظر سازگاری عملکرد خوبی از خود نشان می‌دهد. به عنوان مثال، آدرس «جاده هونگلی، ناحیه نانشان، شنژن» را در نظر بگیرید (جاده هنگلی در ناحیه نانشان واقع نشده است). سیستم می‌تواند این آدرس را به «جاده Hongli، Futian District، Shenzhen» در حالی که آدرس را با استفاده از مدل درخت آدرس تجزیه می‌کند، تصحیح کند.
علاوه بر این، به موجب مدل درخت آدرس (شرح شده در بخش 2.2 ) و آپاچی لوسن، راه حل می تواند برخی از تطابق فازی و هوشمند را پشتیبانی کند. به عنوان مثال، هنگامی که یک کاربر آدرس “KFC، Futian District، Shenzhen” را وارد می کند، سیستم تمام KFC های موجود در Futian District را برمی گرداند.
پس از تجزیه و تحلیل نتایج با درجه تطابق کم، مشاهده کردیم که اکثر نتایج با درجه تطابق کم، شماره خانه هستند، با برخی از آدرس‌ها که تغییر کرده‌اند یا دارای یک شناسه (نام مستعار) متفاوت هستند. توصیف شماره خانه بسیار آشفته است. افراد مختلف اغلب از قالب های مختلفی برای توصیف شماره خانه استفاده می کنند. جدول 3 چندین نمونه از شماره خانه های پیچیده را نشان می دهد که درک آدرس را برای رایانه دشوار می کند.
نقص دیگر سیستم در مورد نام های مستعار یا آدرس های تاریخی رخ می دهد. با توسعه سریع یک شهر، بسیاری از نام ها و آدرس ها ممکن است تغییر کنند. علاوه بر این، برخی از مرزهای اداری ممکن است تغییر کند. با این حال، اسناد تاریخی هنوز از نام‌ها و نشانی‌های قدیمی استفاده می‌کنند. این موضوع همچنان یک چالش مهم است.

6. نتیجه گیری

این مقاله مفهوم geocoding آدرس های چینی را معرفی کرده و چالش های پیش روی در geocoding چینی را تشریح می کند. سپس، این مقاله یک روش تطبیق آدرس بهینه شده برای geocoding چینی با سه جزء: مدل‌سازی آدرس، استانداردسازی آدرس و تطبیق آدرس را پیشنهاد می‌کند. بر اساس روش پیشنهادی، ما یک سیستم خدمات کدگذاری جغرافیایی برای آدرس‌های چینی با استفاده از بیش از 708000 رکورد آدرس از SZPL ایجاد کردیم. در نهایت، ما آزمایشی را با استفاده از بیش از 100000 رکورد از داده‌های بیماری و تقریباً 1360000 رکورد از داده‌های شرکت انجام دادیم. در این آزمایش ها، میانگین نرخ تطابق بیشتر از 90٪ برای درجه تطبیق بالاتر از 60٪ بود. سیستم خدمات ژئوکدینگ به طور گسترده در بسیاری از زمینه ها استفاده شده است. نشان می دهد که روش تطبیق آدرس بهینه می تواند بسیار موثر و دقیق باشد. این واقعیت که سیستم پیشنهادی ما می‌تواند نه تنها آدرس‌های استاندارد، بلکه برخی از آدرس‌های غیراستاندارد را نیز تجزیه کند، سازگاری خوب آن را نشان می‌دهد. علاوه بر این، روش بهینه‌شده پیشنهادی درجاتی از پشتیبانی از قابلیت‌های تطبیق فازی و هوشمند را فراهم می‌کند. پیشرفت‌های آتی بر مدیریت صحیح نام‌های مستعار و آدرس‌های تاریخی و همچنین بر تجزیه بهتر توصیف‌های گاه بی‌نظم شماره ساختمان و شماره خانه تمرکز خواهند کرد.

منابع

  1. کوتزی، اس. بیشاپ، جی. پایگاه‌های اطلاعاتی آدرس برای SDI ملی: مقایسه رویکرد شبکه داده جدید با جمع‌آوری داده و پایگاه‌های اطلاعاتی فدرال. بین المللی جی. جئوگر. Inf. علمی 2009 ، 23 ، 1179-1209. [ Google Scholar ] [ CrossRef ]
  2. جینگ، ز. Qi, L. تحقیق در مورد کاربرد geocoding. Geogr. Geo-Inf. علمی 2003 ، 19 ، 22-25. [ Google Scholar ]
  3. Eichelberger, P. اهمیت آدرس ها: منبع GIS. در مجموعه مقالات کنفرانس سالانه URISA، آتلانتا، GA، ایالات متحده آمریکا، 25-29 ژوئیه 1993. ص 212-222.
  4. Rhind، GR کتاب منبع جهانی مدیریت داده‌های آدرس: راهنمای قالب‌های آدرس و داده‌ها در 194 کشور ؛ Gower: Aldershot، UK، 1999; جلد 615. [ Google Scholar ]
  5. دیویس، کالیفرنیا؛ Fonseca، FT ارزیابی قطعیت مکان های تولید شده توسط یک سیستم کدگذاری جغرافیایی آدرس. Geoinformatica 2007 ، 11 ، 103-129. [ Google Scholar ] [ CrossRef ]
  6. شاه، تی. بل، اس. Wilson، K. Geocoding برای تحقیقات بهداشت عمومی: مقایسه تجربی دو سرویس geocoding اعمال شده در شهرهای کانادا. می توان. Geogr. 2014 ، 58 ، 400-417. [ Google Scholar ] [ CrossRef ]
  7. بالدوین، تی. زنگراندو، دی. Casale، P. Ferrarese، F. برتونچلو، سی. بوجا، ع. مارکولونگو، ا. بالدو، وی. ژئوکدینگ داده‌های سلامت با سیستم‌های اطلاعات جغرافیایی: یک مطالعه آزمایشی در شمال شرقی ایتالیا برای توسعه یک قالب استاندارد شده برای کسب داده. J. قبلی پزشکی هیگ 2015 ، 56 ، 88-94. [ Google Scholar ]
  8. Ratcliffe، JH Geocoding جنایات و اولین برآورد از حداقل نرخ ضربه قابل قبول. بین المللی جی. جئوگر. Inf. علمی 2004 ، 18 ، 61-72. [ Google Scholar ] [ CrossRef ]
  9. راشتون، جی. آرمسترانگ، ام. گیتلر، جی. کدگذاری جغرافیایی در تحقیقات سرطان: مروری. صبح. J. قبلی پزشکی 2006 ، 30 ، 16-24. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  10. Goodchild، M. GIS و حمل و نقل: وضعیت و چالش ها. GeoInformatica 2000 ، 4 ، 127-139. [ Google Scholar ] [ CrossRef ]
  11. Qin، X. پارکر، اس. لیو، ی. گرتینگر، ای جی; Forde, S. سیستم ژئوکدینگ هوشمند برای مکان یابی تصادفات ترافیکی. اسید. آنا. قبلی 2013 ، 50 ، 1034-1041. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  12. Mammadrahimli، A. ارزیابی بهبود موقعیت تصادف در سیستم‌های کدگذاری جغرافیایی مبتنی بر نقشه و مزایای بعدی برای تجزیه و تحلیل تصادف جغرافیایی. در مجموعه مقالات 94 امین نشست سالانه هیئت تحقیقات حمل و نقل، واشنگتن، دی سی، ایالات متحده آمریکا، 11 تا 15 ژانویه 2015.
  13. کریگر، ن. چن، جی تی. Waterman، PD; سوبادر، م.ج. سوبرامانیان، SV; کارسون، آر. ژئوکدینگ و نظارت بر نابرابری‌های اقتصادی-اجتماعی ما در مرگ و میر و بروز سرطان: آیا انتخاب اندازه‌گیری مبتنی بر منطقه و سطح جغرافیایی اهمیت دارد؟: پروژه جغرافیایی نابرابری‌های بهداشت عمومی. صبح. J. Epidemiol. 2002 ، 156 ، 471-482. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  14. Shi, X. ارزیابی عدم قطعیت ناشی از آدرس صندوق پستی در مطالعات بهداشت محیط: یک رویکرد مونت کارلو محدود. بین المللی جی. جئوگر. Inf. علمی 2007 ، 21 ، 325-340. [ Google Scholar ] [ CrossRef ]
  15. گلدبرگ، DW; ویلسون، جی پی؛ Knoblock، CA از متن تا مختصات جغرافیایی: وضعیت فعلی کدگذاری جغرافیایی. URISA J. 2007 ، 19 ، 33-46. [ Google Scholar ]
  16. کریمی، ح. Sharker، MH; Roongpiboonsopit, D. Geocoding Recommender: الگوریتمی برای توصیه خدمات کدگذاری جغرافیایی آنلاین بهینه برای برنامه ها. ترانس. GIS 2011 ، 15 ، 869-886. [ Google Scholar ] [ CrossRef ]
  17. گلدبرگ، DW پیشرفت در تحقیق و عمل کدگذاری جغرافیایی. ترانس. GIS 2011 ، 15 ، 727-733. [ Google Scholar ] [ CrossRef ]
  18. Bonner، MR; هان، دی. نی، جی. راجرسون، پی. Vena, JE; Freudenheim, JL دقت موقعیتی آدرس های جغرافیایی کد شده در تحقیقات اپیدمیولوژیک. اپیدمیولوژی 2003 ، 14 ، 408-412. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  19. گلدبرگ، DW; بالارد، ام. بوید، جی اچ. مولان، ن. گارفیلد، سی. راسمن، دی. Ferrante، AM; Semmens، JB یک چارچوب ارزیابی برای مقایسه سیستم های کدگذاری جغرافیایی. بین المللی J. Health Geogr. 2013 ، 12 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  20. رونگ پیبونسوپیت، دی. کریمی، HA ارزیابی و تحلیل تطبیقی ​​خدمات ژئوکدینگ آنلاین. بین المللی جی. جئوگر. Inf. علمی 2010 ، 24 ، 1081-1100. [ Google Scholar ] [ CrossRef ]
  21. ویتسل، EA؛ Quibrera، PM; اسمیت، RL; Catellier, DJ; لیائو، دی. هنلی، AC; Heiss, G. دقت ژئوکدینگ تجاری: ارزیابی و مفاهیم. اپیدمیول. چشم انداز نوآوری. 2006 ، 3 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  22. گلدبرگ، DW بهبود نرخ تطابق کدگذاری جغرافیایی با معیارهای بلوک متغیر مکانی. ترانس. GIS 2011 ، 15 ، 829-850. [ Google Scholar ] [ CrossRef ]
  23. لواسی، جی اس. ویس، جی سی. هاسکینز، آر. ویتسل، EA؛ برنج، ک. اریکسون، سی اف. Psaty، BM مقایسه روش کدگذاری جغرافیایی تک مرحله‌ای با روش کدگذاری جغرافیایی چند مرحله‌ای: چقدر و کجا مخالف هستند؟ بین المللی J. Health Geogr. 2007 ، 6 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  24. ران، دبلیو. Xuehu، Z. لینفانگ، دی. هاومینگ، ام. Qi، L. نمونه اولیه عامل مبتنی بر دانش برای کدگذاری جغرافیایی آدرس چینی. در مجموعه مقالات ژئوانفورماتیک 2008 و کنفرانس مشترک GIS و محیط ساخته شده: مدل‌ها و تحلیل‌های داده‌های مکانی پیشرفته، گوانگژو، چین، 28-29 ژوئن 2008.
  25. ویهونگ، ال. آئو، ز. کان، دی. الگوریتم تقسیم‌بندی نام مکان مبتنی بر چارچوب بیزی کارآمد برای سیستم ژئوکدینگ. در مجموعه مقالات پنجمین کنفرانس بین المللی طراحی سیستم های هوشمند و کاربردهای مهندسی (ISDEA)، Zhangjiajie، چین، 15-16 ژوئن 2014. صص 141-144.
  26. Zandbergen، PA مقایسه تکنیک‌های ژئوکدینگ نقطه آدرس، بسته و خیابان. محاسبه کنید. محیط زیست سیستم شهری 2008 ، 32 ، 214-232. [ Google Scholar ] [ CrossRef ]
  27. ژانگ، ال. یی، جی. تجزیه و تحلیل مختصری از geocoding. در مهندسی نرم افزار و مهندسی دانش: تئوری و عمل: جلد 2 ; Wu, Y., Ed. Springer: برلین، آلمان، 2012; ص 987-993. [ Google Scholar ]
  28. ژانگ، ایکس. ما، اچ. لی، کیو. یک راه حل کدگذاری جغرافیایی آدرس برای شهرهای چین. In Proceedings of the Geoinformatics 2006: Geospatial Information Science، ووهان، چین، 28-29 اکتبر 2006.
  29. Ratcliffe, J. در مورد دقت داده های آدرس جغرافیایی کدگذاری شده نوع ببر در رابطه با واحدهای منطقه ای کاداستر و سرشماری. بین المللی جی. جئوگر. Inf. علمی 2010 ، 15 ، 473-485. [ Google Scholar ] [ CrossRef ]
  30. گایتانیس، اچ. Winter, S. آیا مدل داده آدرس غنی تری برای پوند مرتبط است؟ در اصول و پیشرفت برنامه در خدمات مبتنی بر مکان ; لیو، سی، اد. Springer: برلین، آلمان، 2014; صص 121-137. [ Google Scholar ]
  31. آکادمی نقشه برداری و نقشه برداری چین GB/T 23705-2009: قوانین کدگذاری آدرس در بستر مشترک خدمات اطلاعات مکانی شهر دیجیتال . مطبوعات استاندارد چین: پکن، چین، 2009. [ Google Scholar ]
  32. هوانجو، ی. Qingwen، Q. Yunling، L. مطالعه بر روی مدل جغرافیایی آدرس شهر بر اساس خیابان. J. Geo-Inf. علمی 2013 ، 15 ، 175-179. [ Google Scholar ]
  33. هایبو، وای. تکنیک‌های ژئوکدینگ در شهرهای دیجیتال و کاربردهای آنها. پایان نامه کارشناسی ارشد، چین، دانشگاه نفت، پکن، چین، 2009. [ Google Scholar ]
  34. Zhaoting، MZ; ژیگانگ، ال. وی، اس. Jie, Y. یک الگوریتم geocoding خودکار بر اساس بخش بندی آدرس. گاو نر Surv. نقشه. 2011 ، 2 ، 59-63. [ Google Scholar ]
  35. منجوون، ک. چینگیون، دی. روش جدید استخراج آدرس چینی بر اساس مدل درخت آدرس. Acta Geod. کارتوگر. گناه 2015 ، 44 ، 99-107. [ Google Scholar ]
  36. بخشی، ر. Knoblock، C. Thakkar, S. بهره‌برداری از منابع آنلاین برای کدگذاری دقیق آدرس‌های جغرافیایی. بین المللی جی. جئوگر. Inf. علمی 2004 . [ Google Scholar ] [ CrossRef ]
  37. هو، تی. دو، س. رن، اف. لیانگ، اس. لین، دی. لی، جی. Chen, Y. تجزیه و تحلیل فضایی آدرس خانه بیماران بیمارستانی مبتلا به عفونت هپاتیت b یا هپاتوم در شنژن چین از سال 2010 تا 2012 . جی. محیط زیست. Res. بهداشت عمومی 2014 ، 11 ، 3143-3155. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  38. وانگ، ز. دو، س. لیانگ، اس. نی، ک. Lin، DN; چن، ی. Li، JJ تجزیه و تحلیل تنوع فضایی بستری شدن در بیمارستان برای بیماری فشار خون بالا در شنژن، چین. بین المللی جی. محیط زیست. Res. بهداشت عمومی 2014 ، 11 ، 713-733. [ Google Scholar ] [ CrossRef ] [ PubMed ]
شکل 1. موقعیت شنژن در چین و نواحی در شنژن.
شکل 2. فرآیند geocoding.
شکل 3. نمونه ای از قوانین سازمان برای آدرس ها.
شکل 4. نمونه ای از مدل روابط فضایی.
شکل 5. روابط بین عناصر آدرس.
شکل 6. رابطه بین آدرس ها، عناصر آدرس و معنایی آدرس.
شکل 7. نمودار جریان الگوریتم درونیابی برای تطبیق آدرس.
شکل 8. معماری سیستم خدمات ژئوکدینگ.
شکل 9. سرویس کدگذاری جغرافیایی آنلاین: ( الف ) تطبیق آدرس و ( ب ) تطبیق آدرس معکوس. توجه: در ( a )، * ​​4 نشانی را نشان می دهد که مطابقت دارد، * 5 درجه مطابقت را نشان می دهد، * 6 مختصات را نشان می دهد، و * 7 نام مکان را نشان می دهد. در ( b )، * 5 فاصله بین نقطه مطابق و نقطه ارائه شده توسط کاربر را نشان می دهد.
شکل 10. سیستم نمایش ژئوکدینگ آنلاین (تطبیق دقیق).
شکل 11. سیستم نمایش ژئوکدینگ آنلاین (تطبیق فازی).
شکل 12. سیستم مدیریت ژئوکدینگ.
شکل 13. مدل آدرس برای شنژن.
شکل 14. توزیع درجه منطبق: ( الف ) نتیجه درجه تطبیق برای داده های بیماری. و ( ب ) نتایج درجه تطبیق برای داده های شرکت.
شکل 15. آمار نرخ تطبیق: ( الف ) برای داده های بیماری. و ( ب ) برای داده های شرکت.
جدول 1. نتایج تجربی.
جدول 2. درجه تطبیق و تفسیر آن.
جدول 3. نمونه هایی از اعداد خانه های پیچیده.

بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *