1. معرفی
نقشه شبکه راه یکی از اساسی ترین ویژگی های اطلاعات مکانی است که کاربردهای متنوعی مانند مدیریت عمومی، برنامه ریزی شهری و ناوبری دارد. با این حال، بهروزرسانی سریع و مداوم نقشههای راه موجود [ 1 ]، بهویژه در کشورهای در حال توسعه که شبکههای جادهای به سرعت در حال تغییر هستند، چالش برانگیز است . تکنیک های مرسوم به روز رسانی نقشه عمدتاً شامل بررسی های زمینی و هوایی است [ 2 ]. بررسیهای زمینی به یک چرخه طولانی کسب اطلاعات محدود میشوند، در حالی که بررسیهای هوایی میتوانند دادههای مقیاس بزرگی را در مورد سطح زمین در مدت زمان کوتاهی به دست آورند. اگرچه بسیاری از الگوریتمها برای استخراج شبکههای جادهای از تصاویر ماهوارهای با وضوح بالا پیشنهاد شدهاند [ 3 ، 4]]، به دلیل پیچیدگی شبکه های جاده ای و انسداد ناشی از درختان و ساختمان ها، تولید شبکه های جاده ای در مقیاس بزرگ با این الگوریتم ها هنوز دشوار است.
به منظور غلبه بر کاستی های نقشه برداری سنتی نقشه راه، محتوای تولید شده توسط کاربر (UGC) [ 5 ] در حال حاضر برای تولید نقشه راه به دو صورت استفاده می شود: (1) برنامه های نقشه برداری مشترک، مانند OpenStreetMap، که بسیار وابسته به کار دستی؛ و (2) تولید جاده خودکار از مسیرهای سیستم موقعیت یاب جهانی (GPS) [ 6 ] که به عنوان استنتاج نقشه از آن یاد می شود و اکنون یک روش رایج و کارآمد برای به روز رسانی شبکه های جاده ای است. مسیرهای GPS توسط وسایل نقلیه مجهز به GPS، دوچرخه ها یا عابران پیاده جمع آوری می شوند و می توانند به صراحت هندسه و توپولوژی جدیدترین شبکه های جاده ای را نشان دهند.
هدف از استنتاج نقشه استخراج موقعیت های هندسی جاده ها، اتصالات توپولوژیکی، و همچنین برخی از اطلاعات ویژگی ها، مانند تعداد خطوط [ 7 ] و نام راه ها [ 6 ] است. بیشتر روشهای استنتاج نقشه موجود با هدف برخورد با ردیابیهای GPS کم نویز، نمونهبرداری متراکم و توزیع یکنواخت انجام میشوند [ 1 ]. با این حال، در بسیاری از موارد، کاوشگرهای GPS ممکن است نرخ نمونه برداری را به دلیل هزینه های انرژی و ارتباطات کاهش دهند [ 8 ]. به طور معمول، این نوع داده ها بخش اصلی ردیابی GPS را تشکیل می دهند. بنابراین، استنباط نقشههای راه با کیفیت بالا از ردیابیهای GPS کم نمونه و پر سر و صدا یک موضوع تحقیقاتی مهم و چالش برانگیز است.
به منظور غلبه بر محدودیت نرخ نمونهگیری پایین GPS، ما یک چارچوب تقسیمبندی و گروهبندی جدید برای تولید نقشههای راه پیشنهاد میکنیم. مشارکت های اولیه روش ما را می توان به صورت زیر خلاصه کرد:
-
یک چارچوب تقسیمبندی و گروهبندی انعطافپذیر برای استنتاج نقشه که در برابر نویز و نرخهای نمونهگیری متغیر ردیابی GPS مقاوم است.
-
یک الگوریتم خوشهبندی فضایی مبتنی بر چگالی پیشرفته توسعهیافته برنامه با نویز (DBSCAN) با یک محدودیت جهتگیری برای تقسیمبندی ابر نقطهای دو بعدی (2 بعدی).
-
الگوریتم تطبیق نقشه مبتنی بر مدل مارکوف پنهان (HMM) برای ساخت رابطه توپولوژیکی خوشه نقطه ای.
-
یک الگوریتم گروه بندی خوشه نقطه مترقی برای بازیابی نقشه راه طبق اصل سکته مغزی [ 9 ].
بقیه مقاله به شرح زیر سازماندهی شده است: بخش 2 مروری بر کار مرتبط ارائه می کند. بخش 3 روند الگوریتم استنتاج نقشه ما را تشریح می کند. بخش 4 آزمایشات روی دو مجموعه داده ردیابی GPS را شرح می دهد. بخش 5 نقشه های راه تولید شده را ارزیابی می کند. و بخش 6 کار آینده روش ما را مورد بحث قرار می دهد.
2. کارهای مرتبط
روشهای استنتاج نقشه کنونی را میتوان تقریباً به چهار دسته طبقهبندی کرد: روشهای مبتنی بر خوشه، روشهای مبتنی بر ادغام ردیابی، روشهای مبتنی بر تخمین تراکم هسته (KDE) و رویکردهای مبتنی بر پیوند تقاطع [10 ، 11 ] .
رویکردهای مبتنی بر خوشهبندی با تعیین مجموعهای از دانههای خوشهای بر اساس مکان، باربری و سرفصل آثار آغاز میشوند. سپس دانه ها به هم متصل می شوند تا بخش های جاده را با توجه به آثار خام تشکیل دهند. روشهای معمولی موجود شامل روشهایی است که توسط Edelkamp و Schrödl [ 12 ]، Schrödl و همکاران پیشنهاد شدهاند. [ 7 ] و آگامنونی و همکاران. [ 13 ، 14 ]. این روش ها می توانند نقشه های راه را با دقت هندسی بالا، یعنی اطلاعات خطوط دقیق و مدل های تقاطع استنباط کنند. با این حال، این روشها برای ردیابیهای GPS با نمونهبرداری متراکم طراحی شدهاند. اطلاعات هندسی دقیق را فقط می توان از ردیابی های دقیق GPS استنباط کرد. آنها در برابر نویز ردیابی GPS مقاوم نیستند.
رویکردهای مبتنی بر ادغام ردیابی شامل ادغام بخشهای ردیابی بر اساس روابط هندسی و شباهت شکل آنها است. سپس خطوط مرکزی جاده ها توسط ردیابی های ادغام شده ایجاد می شود. کائو و کروم [ 15 ] یک تکنیک تجمیع را برای کنار هم کشیدن آثار در یک جاده پیشنهاد کردند. آنها دو نوع نیرو را با هر اثر مرتبط می کنند. نیروی اول باعث می شود که هر ردی توسط ردهای مجاور جذب یا کشیده شود و نیروی دیگر باعث می شود هر ردی توسط موقعیت اصلی محدود شود. برای اصلاح تقاطع شبکه جاده استنباط شده، وانگ و همکاران. [ 16 ] یک رویکرد جدید برای تولید نقشه های راه قابل مسیریابی از ردیابی GPS بر اساس تحقیقات [ 15 ] ارائه کرد. آنها مرزهای دایره ای را برای جداسازی نقاط نزدیک تقاطع ها معرفی کردند و از a استفاده کردندk – به معنای روش خوشهبندی برای اصلاح تقاطعها است. روشهای آنها روی دادههای ردیابی GPS با نمونهبرداری متراکم خوب عمل میکنند، اما در برابر نویز مقاوم نیستند. به منظور بهبود عملکرد روش مبتنی بر ادغام ردیابی، از برخی تکنیکهای ریاضی استفاده میشود. نیهوفر و همکاران [ 17 ] یک مکانیسم فیلتر را برای کاهش نویز ردیابی GPS که توسط تلفن همراه گرفته شده است، اعمال کرد. چن و همکاران [ 18 ] از نظر تئوری دقت هندسی نقشه راه استنباط شده را بر اساس این فرض که آثار به طور متراکم نمونه برداری شده و در سطح جاده باقی می مانند، تضمین می کند. وانگ و همکاران [ 1 ] فاصله Hausdorff را برای اندازه گیری فاصله بین ردیابی GPS برای فیلتر کردن نویز اعمال کرد. رویکرد ادغام ردیابی نوعی روش مبتنی بر خط است [ 19]، و عملکرد آن به شدت به نرخ نمونه گیری بستگی دارد. اگر دو نقطه ردیابی متوالی از یکدیگر دور باشند، به ویژه هنگامی که وسیله نقلیه در یک تقاطع می چرخد، بخش های ردیابی GPS نمی توانند با جاده ها هماهنگ شوند. در این حالت، بخش های جاده ای جعلی تولید می شود.
روشهای مبتنی بر KDE، استنتاج نقشه را به عنوان یک روش پردازش تصویر دیجیتال در نظر میگیرند. ردیابیهای جیپیاس خام به یک تصویر خاکستری دوبعدی تبدیل میشوند و سپس یک آستانه جهانی برای فیلتر کردن تصویر اعمال میشود. در نهایت، رویکردهای اسکلت سازی، مانند نمودار ورونوی و عملیات مورفولوژیکی، برای استخراج خطوط مرکزی بخش های جاده استفاده می شود [ 20 ، 21 ، 22 ]. این نوع روش به توزیع چگالی حساس است و انتخاب یک آستانه جهانی مناسب دشوار است. به منظور غلبه بر محدودیت KDE، Biagioni و Erikson [ 23] یک روش پیشرو مبتنی بر KDE را پیشنهاد کرد. آنها یک خط لوله استنتاج نقشه ترکیبی، از جمله تولید نقشه اولیه با اسکلت بندی در مقیاس خاکستری، هرس نقشه با الگوریتم تطبیق نقشه Viterbi و اصلاح توپولوژی و هندسه جاده ها را توسعه دادند. روش آنها در برابر نویز و نابرابری قوی است. با این حال، از آنجایی که این یک رویکرد مبتنی بر خط است، ردیابیهای نمونهبرداری پراکنده را نمیتوان مدیریت کرد.
رویکردهای پیوند تقاطع شامل دو مرحله اصلی است. اولین قدم تشخیص تقاطع های نقشه راه است. مرحله دوم، پیوند دادن تقاطع ها با توجه به ردیابی های خام است. فتحی و کروم [ 24 ] یک توصیفگر شکل محلی برای نشان دادن توزیع ردپای GPS طراحی کردند و یک طبقهبندی بر روی توصیفگر برای یافتن تقاطعها از ردیابی GPS آموزش دادند. Karagiorgou و Pfoser [ 25 ] الگوریتم مشابهی را پیشنهاد کردند. آنها از آستانه سرعت و تغییر جهت به عنوان شاخص برای شناسایی تقاطع ها استفاده کردند. این روشها برای شبکههای جادهای با تقاطعهای ساده و آثار نمونهبرداری متراکم به خوبی کار میکنند. با این حال، آنها همچنین به نرخ نمونه برداری از ردیابی GPS حساس هستند.
اکثر روشهایی که در بالا توضیح داده شد از ردیابیهای GPS نمونهبرداری متراکم استفاده میکنند و برخی از روشها نویز و نابرابری را در نظر میگیرند [ 23 ]. با این حال، در برخی موارد، ردیابی GPS جمعآوریشده به اندازه کافی برای این الگوریتمها متراکم نیست. اگرچه مقدار کل ردیابی ها بسیار زیاد است، نرخ نمونه برداری برای یک اثر منفرد کم است. روش KDE مبتنی بر نقطه [ 19 ] میتواند با ردیابیهای GPS با نمونهبرداری پراکنده مقابله کند، اما به تفاوتها حساس است.
بررسی بالا نشان می دهد که یک الگوریتم عمومی تر برای استنتاج نقشه باید توسعه یابد. الگوریتم باید توانایی مقابله با ردیابی متراکم و پراکنده را داشته باشد. اخیراً کیو و همکاران. [ 26 ] روشی را برای بخشبندی ردیابیهای GPS با نمونهگیری پراکنده به خوشههای نقطهای برای تولید خطوط مرکزی بخشهای جاده پیشنهاد کرد. بر اساس این کار، ما یک چارچوب تقسیم بندی و گروه بندی جدید برای استنتاج نقشه پیشنهاد می کنیم. تا جایی که ما می دانیم، این اولین بار است که چنین چارچوبی برای استنتاج نقشه از ردیابی GPS ارائه شده است. این روش برای هر دو ردیابی GPS با نمونه متراکم و پراکنده به خوبی کار می کند.
3. روش
مجموعه داده ردیابی GPS تیrبرای روش ما توسط وسایل نقلیه مجهز به GPS جمع آوری شد: تیr={تیrمن|من=1،2،…،ن}، که در آن N تعداد ردیابی ها است. ردیابی GPS تیrمنتوسط یک وسیله نقلیه در یک بازه زمانی مشخص جمع آوری می شود و متشکل از دنباله ای از نقاط GPS است پمن،r، با هر نقطه ای که موقعیت وسیله نقلیه را در یک زمان خاص ثبت می کند که با نشان داده شده است تیrمن={پمن،r|r=1،2،…،n}با پمن،r=(لonمن،r،لآتیمن،r،تیمن،r)، جایی که لonمن،r∈[–180، 180]و لآتیمن،r∈[–90، 90]طول و عرض جغرافیایی نقطه هستند. تیمن،r∈آر+زمانی است که نقطه جمع آوری شده است. n تعداد نقاط است. و زمان تیمن،1<تیمن،2<…<تیمن،n. با مقدار زیادی ردیابی GPS که توسط وسایل نقلیه در مکان و زمان جمعآوری میشود، میتوانیم شبکه جادهای را با آثار انباشته شده ایجاد کنیم. در آزمایش، طول و عرض جغرافیایی تمام نقاط به یک سیستم مختصات پیش بینی شده تبدیل می شود که با نشان داده می شود. (ایکس،y).
روش ما برای استنتاج نقشه از ردیابی های GPS شامل دو جزء است: تقسیم بندی ابر نقطه و گروه بندی خوشه نقطه. برای تقسیم بندی، جهت گیری نقاط را با استفاده از دو نقطه متوالی به عنوان بردار محاسبه می کنیم. سپس تمام نقاط GPS را با یک الگوریتم توسعهیافته DBSCAN پیشرونده با یک محدودیت جهتگیری به خوشههایی تقسیم میکنیم، جایی که هر خوشه نشان دهنده یک منحنی کوتاه و تقریبا مستقیم از جاده است.
در مولفه گروهبندی، خطوط مرکزی خوشههای نقطهای را با الگوریتم قوی Scatterplot Smooth (Lowess) [ 27 ] با وزن محلی ایجاد میکنیم . سپس یک الگوریتم تطبیق نقشه مبتنی بر HMM [ 28 ] برای تطبیق ردیابیهای GPS خام با خطوط مرکزی خوشهها برای ایجاد رابطه توپولوژیکی بین خوشهها استفاده میشود. نزدیکی بین خوشه ها با این فرض ارزیابی می شود که فاصله نقاط تا خط مرکزی با توزیع گاوسی مطابقت دارد. در نهایت، ما خوشه ها را بر اساس رابطه توپولوژیکی و مجاورت گروه بندی می کنیم تا سکته مغزی را برای بازیابی نقشه راه تشکیل دهیم.
قبل از تقسیم بندی، ردیابی ها از قبل پردازش می شوند. اگر فاصله بین دو نقطه متوالی در یک اثر خام بیشتر از یک آستانه (یعنی 300 متر) باشد، رد به دو رد تقسیم می شود. اگر دو نقطه از یکدیگر خیلی دور باشند، پاره خط بین این دو نقطه به درستی با جاده واقعی همسو نخواهد شد.
3.1. الگوریتم DBSCAN با یک محدودیت جهت
الگوریتم DBSCAN [ 29 ] یک الگوریتم خوشه بندی فضایی برای نقاط است. این برای کشف خوشه هایی با اشکال دلخواه با استفاده از یک محدودیت چگالی طراحی شده است که بر اساس تعداد نقاط در یک منطقه خاص تخمین زده می شود. این الگوریتم در برابر نویز مقاوم است و برای تعیین تعداد خوشه ها به کمک کاربران نیازی ندارد. در الگوریتم کلاسیک DBSCAN، ε–nهمنgساعتبoتوrساعتooدبرای نشان دادن چگالی استفاده می شود که با تعریف 1 تعریف شده است. ورودی الگوریتم DBSCAN شامل ε و ممنnپتیس، جایی که ε شعاع جستجو برای یافتن همسایگان یک نقطه است و ممنnپتیسآستانه تعیین اینکه آیا یک نقطه یک نقطه هسته است (تعریف 2) است یا خیر. تولید خوشه نقطه جمتریک روش افزایشی است اول، یک نقطه اصلی یافت می شود. و همسایه های آن برای مقداردهی اولیه استفاده می شود جمتر. سپس، جمتربا افزودن همسایگان نقاط اصلی در گسترش می یابد جمترتا زمانی که هیچ امتیازی اضافه نشود.
تعریف 1.
ε–nهمنgساعتبoتوrساعتooداز نقطه p ، نشان داده شده با نپ، توسط تعریف شده است نپ={q∈پ|دمنس(پ،q)≤ε}، که در آن P مجموعه نقاط و دمنس(پ،q)فاصله اقلیدسی نقاط p و q است .
تعریف 2.
سیorهپoمنnتی. نقطه p را اگر نقطه هسته می گویند ε–nهمنgساعتبoتوrساعتooدنپحداقل شامل ممنnپتیسامتیاز (حداقل تعداد امتیاز).
در زمینه تقسیمبندی ابر نقطهای، ما قصد داریم خوشههای نقطهای را تعیین کنیم که منحنیهای تقریباً مستقیم را نشان میدهند. محدوده مقادیر مختصات x و y ( ایکس،y∈آر) با دامنه جهت گیری نقاط متفاوت است ( [0درجه، 360درجه]یا [0،2π]). بنابراین، همسایگی یک نقطه را با دو جزء دوباره تعریف می کنیم: شعاع جستجو ε و تفاوت جهت α بین دو نقطه (تعریف 3). همچنین نقطه مرکزی را با چگالی ردیابی ها دوباره تعریف می کنیم (تعریف 4.) جهت گیری از 0 درجه شروع می شود که با محور x منطبق است و در جهت خلاف جهت عقربه های ساعت افزایش می یابد.
تعریف 3.
ε،α–nهمنgساعتبoتوrساعتooداز نقطه p که با مجموعه نقطه نشان داده می شود نپ، توسط تعریف شده است نپ={q∈پ|دمنس(پ،q)≤ε∧دمنffOrمن(پ،q)≤α}، که در آن P مجموعه ای از نقاط است، دمنس(پ،q)فاصله اقلیدسی نقاط p و q و استدمنffOrمن(پ،q)تفاوت در جهت گیری نقاط p و q است .
تعریف 4.
سیorهپoمنnتی. نقطه p در صورتی نقطه مرکزی نامیده می شود که مجموعه نقطه آن باشد ε،α–nهمنgساعتبoتوrساعتooدنپمتعلق به کمتر از ممنnLnسردیابی GPS (حداقل تعداد ردیابی GPS).
رویه الگوریتم DBSCAN ما با یک محدودیت جهت گیری به صورت الگوریتم 1 نشان داده شده است.
در مرحله اول از ε , α و استفاده می کنیمممنnLnسبرای تولید خوشه های نقطه ای (خطوط 1 تا 15)، که در آن ε و α شعاع جستجو و تفاوت جهت گیری بین نقاط برای تعیین همسایگی هستند، و ممنnLnستعداد ردیابی های GPS برای تعیین اینکه آیا یک نقطه یک نقطه هسته است یا خیر. در مرحله دوم، از تجزیه و تحلیل مؤلفه اصلی (PCA) برای ایجاد یک پاره خط متناسب با خوشه نقطه استفاده می کنیم و خوشه نقطه را بر اساس طول و جهت قطعه خط فیلتر می کنیم (خطوط 16 تا 21). اگر طول پاره خط کوچکتر از آستانه باشد ممنnLهn(حداقل طول)، خوشه نقطه را دور می اندازیم. اگر جهت پاره خط (محدوده [ 0درجه، 180درجه]) با جهت گیری میانگین نقاط در خوشه (مدول 180 درجه) مطابقت ندارد، یعنی اگر اختلاف جهت ها از آستانه بزرگتر باشد. مآایکسدیoOس(حداکثر اختلاف جهت ها)، سپس خوشه نقطه را نیز کنار می گذاریم. مولفه های ممنnLهnو مآایکسدیoOسهدف آنها ایجاد یک بخش نسبتا طولانی است و همچنین به حذف خوشه های ایجاد شده توسط نویز کمک می کند. متغیر nاستیآrتیمندهویت اولین خوشه نقطه تولید شده است.
پارامترهای مختلف برای یافتن همسایگان منجر به خوشههای نقطهای متفاوت میشود. از بین پارامترهای ε , α و ممنnLnسحساس ترین α است . شکل 1 حساسیت α را نشان می دهد . شکل 1 a مجموعه نقطه ای از ردیابی خام GPS است. ما خوشه های نقطه ای را با α=1درجهو α=5درجه. شکل 1 b,c دو تا از خوشه های نقطه ای را نشان می دهد α=1درجهو α=5درجه، به ترتیب. سپس دو خوشه نقطه با قطعات خط محاسبه شده با PCA (خطوط قرمز در شکل 1 ) متناسب می شوند. در مقایسه شکل 1 b,c، می توانیم مشاهده کنیم که خوشه نقطه ای ایجاد شده با یک α کوچک را می توان به خوبی با یک پاره خط نشان داد. با این حال، در همان زمان، یک محدودیت قوی ( α کوچک ) منجر به نقاط زیادی می شود که نمی توان آنها را خوشه بندی کرد.
به منظور متعادل کردن این مبادله، ما یک الگوریتم پیشرونده DBSCAN با یک محدودیت جهتگیری برای تولید خوشههای نقطهای پیادهسازی میکنیم که به صورت الگوریتم 2 نشان داده شده است. ابتدا، خوشههای نقطهای را با α کوچک تولید میکنیم . سپس α را بزرگ می کنیم و از نقاطی که به عنوان ورودی طبقه بندی نمی شوند برای تولید خوشه های جدید استفاده می کنیم. این مرحله دوم تا زمانی تکرار می شود که محدودیت α به آستانه از پیش تعریف شده برسد.
الگوریتم پیشرو DBSCAN ما با یک محدودیت جهت گیری به سه پارامتر برای تولید خوشه و دو پارامتر برای فیلتر خوشه نیاز دارد. در روش تولید خوشه، شعاع جستجو ε در 15 متر ثابت شد. این مقدار بر اساس عرض خط و تعداد جاده های شهری واقعی برآورد شد. عرض خط در شهرها حدود 3.75 ~ 4.0 متر است و ما فرض می کنیم که جاده هایی که وسایل نقلیه از آنها بازدید کردند حداقل دارای 4 خط بودند. پارامتر α در محدوده [ 1درجه، 30درجه]. تنظیم کران پایین بر این واقعیت استوار بود که نقاط نزدیک به یکدیگر در یک جاده دارای جهت گیری های مشابه هستند. و تنظیم کران بالایی نویز و نرخ نمونه برداری از ردیابی GPS را در نظر گرفت. پارامتر سوم ممنnLnس2 تعیین شد، به این معنی که بخش واقعی جاده در مناطقی که کمتر از دو بار توسط وسایل نقلیه بازدید شده است، قرار نمی گیرد.
در فیلتر خوشه ای، فرض می کنیم که طول قطعه جاده تولید شده بزرگتر از عرض جاده واقعی (15 متر) است. بنابراین، ما رفع شد ممنnLهnتا 15 متر پارامتر مآایکسدیoOسبا توجه به آزمایشات تجربی روی 5 درجه تنظیم شد.
3.2. گروه بندی خوشه های نقطه
بخشهای جادهای که توسط الگوریتم DBSCAN مترقی ما با یک محدودیت جهتگیری تولید میشوند، شامل بخشهای کوتاه بسیاری با جهتگیریهای مشابه هستند. برای کاهش افزونگی، باید آنها را گروه بندی کرد تا منحنی های طولانی تشکیل شود. برای هر خوشه نقطه ای، فرض می کنیم که فاصله نقاط تا خط مرکزی خوشه با توزیع گاوسی مطابقت دارد. جی∼(μ،σ2)، جایی که μ=0نشان دهنده خط مرکزی و σ انحراف استاندارد است. بر اساس این فرض، ما رابطه توپولوژیکی را ایجاد می کنیم و نزدیکی بین خوشه های نقطه ای را برای گروه بندی آنها ارزیابی می کنیم.
در این بخش، از الگوریتم Lowess قوی برای تولید خط مرکزی استفاده میکنیم لمناز خوشه نقطه جمنو از فرمول انحراف مطلق میانه (MAD) برای تخمین مربوطه استفاده کنید σمنتوزیع گاوسی سپس یک الگوریتم تطبیق نقشه مبتنی بر HMM را برای تطبیق ردپای GPS خام با خطوط مرکزی تولید شده برای ایجاد یک رابطه توپولوژیکی بین خوشههای نقطه اعمال میکنیم. در نهایت، خوشههای نقطهای را به روشی پیشرونده بر اساس مجاورت فضایی آنها گروهبندی میکنیم.
3.2.1. ایجاد خط مرکزی از خوشه نقطه
انواع بسیاری از الگوریتم های تولید خط مرکزی برای ابرهای نقطه سازمان نیافته در جامعه علوم کامپیوتر [ 30 ] وجود دارد. خوشه های نقطه ای تولید شده توسط الگوریتم ما منحنی های تقریبا مستقیم را نشان می دهند. منحنی خود تلاقی نمی کند، بلکه توسط نویز و نقاط پرت منحرف می شود. بنابراین، ما از روش لاوس قوی برای ایجاد خط مرکزی خوشه نقطه استفاده می کنیم. این روش از تجزیه و تحلیل باقیمانده برای غلبه بر مشکل ناشی از نویز و نقاط پرت استفاده می کند.
شکل 2 a یک خوشه نقطه معمولی است که با روش استنتاج نقشه ما ایجاد شده است. برای اعمال الگوریتم لاوس قوی، باید خوشه نقطه را از قبل پردازش کنیم. ابتدا نقاط را به سیستم مختصات جدید محاسبه شده توسط PCA می چرخانیم. آبسیسا به صورت خط در شکل 2 الف نشان داده شده است. سپس نقاط را بر اساس مقادیر x آنها در سیستم مختصات جدید به ترتیب صعودی مرتب می کنیم و آنها را به هم وصل می کنیم تا یک منحنی ناهموار ایجاد کنیم که در شکل 2 ب نشان داده شده است. پس از این دو مرحله، همانطور که در شکل 2 ج نشان داده شده است، می توانیم از Lowess قوی برای ایجاد یک منحنی صاف استفاده کنیم . در نهایت، منحنی را به سیستم مختصات اولیه برمیگردانیم.
روش کلی روش لاوس قوی را می توان به صورت زیر خلاصه کرد:
-
برای هموار کردن منحنی، یک رگرسیون حداقل مربعات خطی با وزن محلی برای هر نقطه اعمال کنید.
-
باقیمانده هر نقطه را با توجه به منحنی صاف شده محاسبه کنید.
-
برای حذف مقادیر پرت و به روز رسانی وزن های محلی، مقدار MAD را محاسبه کنید. باقیمانده های پرت بیش از 6 برابر ارزش MAD است.
-
منحنی را همانطور که در مرحله 1 توضیح داده شد، دوباره با استفاده از وزنه های جدید صاف کنید.
-
مراحل 2 تا 4 را در مجموع پنج بار تکرار کنید تا یک منحنی صاف به دست آورید.
در الگوریتم، رگرسیون خطی محلی برای هر نقطه بر روی k نزدیکترین همسایه آن انجام می شود که با مقادیر x آنها در سیستم مختصات چرخشی محاسبه می شود. برای هر خوشه باید k را به صورت دستی تعیین کنیم . از آنجایی که چگالی (تعداد نقاط در یک منطقه ثابت) نقاط GPS خام در فضا متفاوت است، ما از میانگین تعداد نقاط موجود در یک بازه مشخص استفاده می کنیم. داسپآnبرای تخمین k : ک=داسپآn/ل×n، که در آن l طول پاره خط تولید شده از خوشه نقطه با PCA و n تعداد نقاط خوشه است. را تعمیر کردیم داسپآnطبق آزمایشات تجربی تا 10 متر.
برای هر خوشه نقطه جمن={پمن،r|r=1،2،…،متر}، خط مرکزی آن را تولید می کنیم لمن: لمن={vمن،r“|r“=1،2،…،متر“∧متر“≤متر}، جایی که vمن،r“گره هایی است که خط مرکزی را تشکیل می دهند. با توجه به نقاط پرت، تعداد گره ها ( متر“) که خط مرکزی را تشکیل می دهند لمنکمتر یا مساوی تعداد نقاط ( m ) در خوشه استجمن. سپس می توانیم مربوطه را تخمین بزنیم σمنبا فرمول MAD، همانطور که در معادله ( 1 ) نشان داده شده است.
جایی که دمنس(پمن،r،لمن)=دقیقه{دمنس(پمن،r،vمن،r“)}،(r“=1،2،…،متر“)فاصله از نقطه است پمن،rبه خط مرکزی لمن، دمنس(پمن،r،vمن،r“)فاصله اقلیدسی از نقطه است پمن،rبه گره vمن،r“و 1.4826 ضریب مقیاس برای داده های توزیع نرمال است. اگرچه توزیع خوشههای نقطهای دقیقاً با توزیع گاوسی مطابقت ندارد، میتوانیم با فرمول MAD یک تخمین معقول به دست آوریم.
3.2.2. ساخت رابطه توپولوژیکی بین خوشه ها
طبق نیوسون و کروم [ 28 ]، تطبیق ردیابی GPS با نقشه راه واقعی (یعنی تطبیق نقشه) از طریق یافتن محتمل ترین مسیری که وسیله نقلیه بازدید کرده بر اساس موقعیت وسیله نقلیه اندازه گیری شده توسط GPS به دست می آید. آنها مشکل تطبیق نقشه را به عنوان یک HMM مدل کردند که یک فرآیند مارکوف با مجموعه ای از حالت ها و مشاهدات پنهان است. انتقال از حالت به حالت با احتمالات انتقال تعریف می شود. هر حالت دارای یک توزیع احتمال به نام توزیع احتمال انتشار بر روی مشاهدات ممکن است. با توجه به دنباله ای از مشاهدات، می توان با به حداکثر رساندن احتمال کلی، دنباله ای از حالت های پنهان تولید کرد.
در زمینه تطبیق نقشه، حالت های پنهان بخش های جاده هستند. و مشاهدات نقاطی هستند که توسط GPS اندازه گیری می شوند. احتمالات انتقال احتمالات انتقال وسیله نقلیه از یک بخش به بخش دیگر را فراهم می کند. و احتمال انتشار برای یک حالت در یک مشاهده نشان دهنده احتمال این است که وسیله نقلیه واقعاً از بخش بازدید کرده است با توجه به نقطه (موقعیت وسیله نقلیه) اندازه گیری شده توسط GPS.
در الگوریتم تطبیق نقشه مبتنی بر HMM که توسط کروم و همکاران ارائه شده است. [ 28 ، 31]، آنها هر نقطه اندازهگیری شده توسط GPS را به بخشهای جادهای نزدیک آن نشان دادند تا مجموعهای از نامزدها را برای تطبیق ایجاد کنند و احتمال انتشار را بر اساس فاصله نقطه تا نقطه پیشبینیشده هر نامزد محاسبه کردند. برای وسیله نقلیه ای که از یک نقطه به نقطه دیگر حرکت می کند (اندازه گیری شده توسط GPS)، مجموعه ای از انتقال های احتمالی از یک بخش جاده به قسمت دیگر می تواند ایجاد شود. احتمالات انتقال برای بخش ها با توجه به تفاوت دو فاصله محاسبه می شود: (1) فاصله اقلیدسی دو نقطه GPS. و (2) کوتاه ترین طول مسیر دو نقطه پیش بینی شده در بخش های جاده. در نهایت، آنها از الگوریتم Viterbi برای تطبیق ردیابی GPS تولید شده توسط یک وسیله نقلیه با مسیری که بیشترین احتمال را در بین تمام مسیرهای ممکن دارد، استفاده می کنند. الگوریتم به طور همزمان مکان نقاط GPS و رابطه توپولوژیکی نقشه راه واقعی را در نظر گرفت. این روش در برابر نویز مقاوم است.
روش پیشنهادی ردیابیهای خام GPS را با خطوط مرکزی تولید شده توسط خوشههای نقطهای برای ایجاد روابط توپولوژیکی بین خوشههای نقطه مطابقت میدهد. حالت پنهان خط مرکزی است و مشاهده نقطه ای است که توسط GPS اندازه گیری می شود. نتیجه تطبیق همچنین می تواند برای حذف خوشه های نقطه اضافی که در اثر نویز ایجاد می شوند استفاده شود.
احتمالات انتقال در روش ما احتمال حرکت یک وسیله نقلیه از یک خط مرکزی را فراهم می کند لمن(تولید شده توسط جمن) به خط مرکزی دیگر لj(تولید شده توسط جj). از دو خوشه نقطه ای مشتق شده است جمنو جj، جایی که جمن={پمن،r|r=1،2،…،متر}، جj={پj،س|س=1،2،…،n}و m و n اندازه خوشه ها هستند. توالی نقاط با ردیابی خام GPS نشان داده می شود. به طور شهودی، اگر وجود داشته باشد مترمن،j( مترمن،j≤متر) امتیاز در جمنکه نکات بعدی خود را در جj، احتمال انتقال را برای انتقال از حالت تعریف می کنیم لمنبه لjمانند Pr(لمن،لj)=مترمن،j/متر. بر اساس این تعریف، مجموع احتمالات انتقال غیر صفر است Pr(لمن،لj)برای انتقال از لمنبه همه موارد ممکن دیگر لjبرابر با 1 است؛ و با شماره ممکن تماس می گیریم لjفارغ التحصیل د(لمن)از لمن.
در آزمایشات با داده های واقعی GPS، ما دو واقعیت را برای برخی از خطوط مرکزی مشاهده کردیم: (1) Pr(لمن،لمن)≫Pr(لمن،لj)، جایی که من≠j، که به این معنی است که احتمال انتقال برای انتقال از خط مرکزی لمنبه خود بسیار بزرگتر از انتقال از لمنبه دیگران؛ و (2) Pr(لمن،لj)≫Pr(لr،لس)، جایی که د(لمن)≪د(لr)و من≠j، r≠س، که بیانگر این است که احتمالات انتقال برای انتقال از خطوط مرکزی خارج درجه پایین بسیار بزرگتر از احتمالات انتقال برای انتقال از خطوط مرکزی خارج درجه بالاتر است. به منظور اجتناب از اولویت برای تطبیق ردیابی GPS با خطوط مرکزی خارج از درجه پایین، ما احتمالات انتقال را اصلاح کردیم. Pr(لمن،لj)مستقل بودن از درجه خارج از خطوط مرکزی با معرفی ضریب وزن ω . فاکتور وزن از درجه خارج از خطوط مرکزی به دست می آید. نتایج بر اساس این تنظیم معقول تر است. مراحل پالایش به شرح زیر است:
-
برای یک خوشه نقطه جمن∈سی، شماره را بدست آورید متر“از نکات گنجانده شده در جمنکه نقاط متوالی آنها در آن گنجانده نشده است جمن.
-
برای یک خوشه نقطه جj∈سی، شماره را بدست آورید مترمن،jاز نکات گنجانده شده در جمنکه نقاط متوالی خود را در خود دارند جj( من≠j).
-
محاسبه احتمال انتقال برای انتقال از خط مرکزی لمنبه لj، Pr(لمن،لj)=مترمن،j/متر“.
-
مراحل 2 و 3 را تکرار کنید، محاسبات احتمالات انتقال برای انتقال از لمنبه همه ممکن لj.
-
تعريف كردن Pr(لمن،لمن)=حداکثر(Pr(لمن،لj))، ( من≠j).
-
مراحل 1 تا 5 را تکرار کنید و احتمالات انتقال غیر صفر را در تمام خطوط مرکزی محاسبه کنید لمن∈L.
-
حداقل مدرک تحصیلی را پیدا کنید دمترمنnدر میان تمام درجات خارج از تمام خطوط مرکزی لمن∈L.
-
به روز رسانی احتمالات انتقال به عنوان Pr(لمن،لj)=ωمن×Pr(لمن،لj)، جایی که لمن∈L، لj∈L ωمنفاکتور وزن است و ωمن=د(لمن)/دمترمنn.
احتمال انتشار برای یک نقطه خاص پتیتوسط GPS در زمان t مرتبط با خط مرکزی نزدیک اندازه گیری می شودلمن، نشان داده شده با Pr(لمن|پتی)، این احتمال را می دهد که پتیاز مشاهده شد لمن. این احتمال را نشان می دهد که وسیله نقلیه از خط مرکزی بازدید کرده است لمندر زمان t با توجه به اندازه گیری پتی. ما احتمال انتشار را بر اساس این فرض محاسبه می کنیم که توزیع فاصله نقاط تا خط مرکزی با توزیع گاوسی مطابقت دارد. جی∼(μ،σ2). برای هر نقطه از ردیابی خام GPS، احتمالات با معادله ( 2 ) تخمین زده می شود:
جایی که دمنس(پتی،لمن)=دقیقه{دمنس(پتی،vمن،r“)|vمن،r“∈لمن}فاصله از نقطه است پتیبه خط مرکزی لمن.
واریانس σ در روش تولید خط مرکزی تخمین زده می شود. پس از محاسبه σمنبرای هر خوشه نقطه جمن، ما استفاده می کنیم حداکثرمنσمنبه عنوان σ برای تخمین احتمالات انتشار. در عمل، ما تا 10 کاندید خط مرکزی همسان برای هر نقطه را پیدا می کنیم. اگر دمنس(پتی،لمن)بزرگتر است از 6×σ، احتمال انتشار نزدیک به 0 است و ما در نظر نمی گیریم لمنبه عنوان کاندیدای تطبیق با پتی. احتمال انتشار Pr(لمن|پتی)از نقطه پتیبا مقیاس بندی به [0، 1] نرمال می شود.
پس از مقداردهی اولیه احتمالات انتقال و احتمالات انتشار، از الگوریتم تطبیق نقشه ویتربی [ 28 ، 32 ] برای تطبیق ردپای GPS خام با خطوط مرکزی تولید شده برای یافتن احتمالی ترین مسیری که وسایل نقلیه بازدید کرده اند استفاده می کنیم. مسیر با بالاترین احتمال، ارتباط بین خوشه ها را نشان می دهد. خوشه هایی که با هیچ اثر خام مطابقت ندارند به عنوان نویز در نظر گرفته می شوند.
3.2.3. گروه بندی خوشه نقطه
مجموعه ای از مسیرها O={oمن|من=1،2،…،ن}با تطبیق ردیابی های خام GPS با خطوط مرکزی، که در آن N تعداد مسیرها است که با تعداد ردیابی ها مطابقت دارد، به دست می آید. هر مسیر oمنبا تطبیق یک ردیابی تولید می شود تیrمن={پمن،r|r=1،2،…،n}با خطوط مرکزی بدین ترتیب، oمنشامل مجموعه ای از خطوط مرکزی، oمن={لمن1،لمن2،…،لمنn}، جایی که لمنrبا نقطه مطابقت دارد پمن،rاز ردیابی تیrمن. از آنجایی که می دانیم یک وسیله نقلیه از نقطه حرکت می کند پمن،rبه نقطه بعدی، پمن،r+1، می توانیم استنباط کنیم که خطوط مرکزی لمنrو لمنr+1از نظر توپولوژیکی به هم متصل هستند. در مرحله بعد، از موقعیت های هندسی این دو خط مرکزی استفاده می کنیم تا مشخص کنیم که آیا می توان آنها را گروه بندی کرد یا خیر.
مفهوم ضربه این است که یک منحنی را می توان در یک حرکت صاف رسم کرد [ 9 ]. از اصل تداوم خوب گرفته شده است، که نشان می دهد عناصری که از جهت های مشابه پیروی می کنند تمایل دارند با هم گروه شوند. با استفاده از مفهوم stroke، ما خوشه های نقطه را گروه بندی می کنیم تا منحنی های صاف را تا دورترین حد ممکن ایجاد کنیم. برای خوشه های دو نقطه ای جمنو جjکه دو منحنی مرتبط با توپولوژی را ایجاد می کند لمنو لj، به ترتیب، ما به طور موقت گروه جمنو جjبرای به دست آوردن یک خوشه نقطه جدید جgو یک خط مرکزی جدید ایجاد کنید لgتوسط جg. اگر لgاز نظر مکانی نزدیک به لمنو لj، گروه بندی را دائمی می کنیم. در غیر این صورت حفظ می کنیم جمنو جj. بر اساس این ایده، ما یک الگوریتم گروه بندی خوشه نقطه ای جدید را پیشنهاد می کنیم، همانطور که در الگوریتم 3 نشان داده شده است.
| الگوریتم 3: الگوریتم گروه بندی خوشه های نقطه ای. |
|
ورودی : TwoPointClusters جمن، و جj، β |
|
خروجی : NewPointClusters |
| 1 |
تفاوت جهت گیری های میانگین را محاسبه کنید دیoOستوسط نقاط در جمنو جj; |
| 2 |
اگر دیoOس>β سپس |
| 3 |
⌊ دو خوشه را برگردانیدجمنو جj; |
| 4 |
خطوط مرکزی را ایجاد کنید لمنو لjبرای خوشه نقطه جمنو جjتوسط Lowess قوی; |
| 5 |
خطاها را برآورد کنید σمنو σjتوسط MAD برای جمنو جj; |
| 6 |
یک خط مرکزی جدید ایجاد کنید لgتوسط جg=جمن∪جj; |
| 7 |
∀vمن،r“∈لمنپیدا کن دمنس(vمن،r“،لg)=مترمنn{دمنس(vمن،r“،vg،تی)|vg،تی∈لg}به عنوان فاصله تعیین شده دیمنس(لمن،لg); |
| 8 |
∀vj،س“∈لjپیدا کن دمنس(vj،س“،لg)=مترمنn{دمنس(vj،س“،vg،تی)|vg،تی∈لg}به عنوان فاصله تعیین شده دیمنس(لj،لg); |
| 9 |
مرتب سازی فواصل در دیمنس(لمن،لg)و دیمنس(لj،لg)مانند دیمنسس(لمن،لg)و دیمنسس(لj،لg)به ترتیب نزولی؛ |
| 10 |
میانگین فاصله فواصل از ابتدا تا چندک α در مجموعه را محاسبه کنیددیمنسس(لمن،لg)و دیمنسس(لj،لg)مانند دمنسα(لمن،لg)و دمنسα(لj،لg); |
| 11 |
اگر دمنسα(لمن،لg)+ دمنسα(لj،لg)>6×(σمن+σj) سپس |
| 12 |
⌊ دو خوشه را برگردانیدجمنو جj; |
| 13 |
دیگر |
| 14 |
⌊ خوشه گروه بندی شده جدید را برگردانیدجg; |
ابتدا از اختلاف میانگین جهت گیری های دو خوشه نقطه ای استفاده می کنیم جمنو جjبرای تعیین اینکه آیا خطوط مرکزی لمنو لjتولید شده توسط جمنو جjبه هم متصل شوند (خطوط 1 تا 3). به گفته جیانگ و همکاران. [ 33 ]، آستانه زاویه انحراف برای ایجاد ضربه از بخش های جاده با دامنه [30 درجه، 75 درجه] نتایج پایدار ایجاد می کند. زاویه انحراف زاویه بین دو بخش جاده متصل است.
در روش خود، ما قصد داریم یک منحنی تقریبا مستقیم طولانیتر ایجاد کنیم، لg، از خوشه نقطه جgتولید شده توسط گروه بندی خوشه های نقطه جمنو جj. مشابه ایده تولید سکته مغزی، اگر تفاوت میانگین جهت گیری از جمنو جjبزرگتر از آستانه از پیش تعریف شده β است ، ما فرض می کنیم جمنو جjنمی توان گروه بندی کرد ما β را بر اساس آزمایش تجربی روی 60 درجه تنظیم کردیم. با این حال، برای گروه بندی خوشه های نقطه ای با تفاوت جهت گیری های کوچکتر به خوبی جلوتر از خوشه های نقطه ای با تفاوت جهت گیری های بزرگتر، از یک روش پیش رونده استفاده می کنیم: الگوریتم 3 را به مجموعه ای از خوشه نقطه C که با یک β کوچک شروع می شود اعمال می کنیم ( یعنی ، 10 درجه) و به طور مکرر الگوریتم 3 را با افزایش β در اندازه گام (یعنی 10 درجه) اجرا کنید تا به 60 درجه برسد.
اگر تفاوت جهت گیری های میانگین از جمنو جjکوچکتر از β است ، از موقعیت هندسی نقاط در استفاده می کنیم جمنو جjبرای تعیین اینکه آیا دو خوشه نقطه را می توان گروه بندی کرد یا خیر. شکل 3 تصویری از گروه بندی دو خوشه نقطه ای را ارائه می دهد. خطوط چین دار سیاه در شکل 3 مناطق بافر را نشان می دهد لمنو لjبا شعاع 6σمنو 6σj، به ترتیب. با این فرض جمنو جjرا می توان گروه بندی کرد، خوشه نقطه را به دست می آوریم جgو خط مرکزی تولید کنید لgبه عنوان خط قرمز قرمز در شکل 3 . اگر لgدر اتحاد از مناطق بافر از لمنو لj، می توانیم گروه بندی کنیم جمنو جjدائمی با توجه به معادله ( 1 ) σمنو σjبر اساس برآورد می شوند جمن، لمنو جj، لj. ما گروه بندی را اجرا می کنیم جمنو جjبا استفاده از فواصل از نقاط لمنو لjبه نقاط لgبه عنوان یک متریک این روش به صورت خطوط 4 تا 14 در الگوریتم 3 نشان داده شده است.
برای هر گره vمن،r“∈لمن، نزدیکترین گره را پیدا می کنیم vg،تی∈لgبا توجه به فاصله اقلیدسی آنها دمنس(vمن،r“،vg،تی)به عنوان فاصله دمنس(vمن،r“،لg)از گره vمن،r“به خط مرکزی لg. مجموعه ای از راه دور دیمنس(لمن،لg)={دمنس(vمن،r“،لg)|r“=1،2،…،متر“}سپس می توان با محاسبه فاصله از تمام گره های به دست آورد لمنبه خط مرکزی لg، جایی که متر“تعداد گره های موجود در آن است لمن. فاصله ها را مرتب می کنیم دیمنس(لمن،لg)مانند دیمنسس(لمن،لg)به ترتیب نزولی و میانگین فاصله از ابتدا تا چندک α -in را بدست آوریددیمنسس(لمن،لg)به عنوان فاصله میانگین چندک αدمنسα(لمن،لg)از خط مرکزی لمنبه لg. میانگین فاصله چندک αدمنسα(لj،لg)از جانب لjبه لgرا نیز می توان با همین روش به دست آورد. در نهایت، اگر مجموع دو فاصله میانگین چندک α کوچکتر یا مساوی باشد 6×(σمن+σj)، دو خوشه نقطه را گروه بندی می کنیم جمنو جjبدست آوردن جg. میانگین فاصله چندک α نشان دهنده انحراف از دو خط مرکزی اصلی به خط مرکزی جدید است که توسط دو خوشه گروهبندی شده تولید میشود. دمنسα(لمن،لg)+دمنسα(لj،لg)≤6×(σمن+σj)به این معنی که خط مرکزی جدید در اتحاد دو منطقه بافر قرار دارد لمنو لj. با توجه به آزمایش تجربی، α را روی یک مقدار کوچک (یعنی 0.02) قرار دادیم.
موضوع دیگر این است که نرخ نمونهبرداری از ردیابیهای خام GPS یکسان نیست. دو خوشه که از نظر توپولوژیکی به هم متصل هستند ممکن است از نظر مکانی به یکدیگر نزدیک نباشند. ما فاصله بین دو خوشه را مانند رابطه ( 3 ) تعریف می کنیم. اگر فاصله بین دو خوشه دمنس(جمن،جj)بزرگتر از یک آستانه است (یعنی 100 متر)، آنها را نمی توان گروه بندی کرد. در آزمایش ردیابی های GPS با نمونه های پراکنده، متوجه شدیم که احتمالی ترین مسیر نمی تواند رابطه بین دو خوشه مجاور را کشف کند. بنابراین، به عنوان آخرین مرحله از گروه بندی خوشه، ما خوشه ها را برای گروه بندی با توجه به فاصله بین آنها پیدا می کنیم. اگر فاصله بین دو خوشه کمتر یا مساوی یک آستانه (یعنی 100 متر) باشد، الگوریتم گروه بندی را با آستانه زاویه β معادل 60 درجه برای این دو خوشه اعمال می کنیم.
4. آزمایشات
ما از دو مجموعه داده برای آزمایش الگوریتم خود استفاده کردیم. مجموعه داده جمعآوریشده در شیکاگو، ایالات متحده آمریکا (مجموعه داده 1)، شامل آثار نمونهبرداری متراکم است. و دیگر مجموعه داده جمع آوری شده در ووهان، چین (مجموعه داده 2)، از ردپای نمونه برداری پراکنده تشکیل شده است. ویژگی های دو مجموعه داده در زیر توضیح داده شده است:
-
مجموعه داده شیکاگو ردیابی GPS از اتوبوسی بود که به دانشگاه ایلینویز در پردیس شیکاگو خدمت می کرد [ 23 ]. مجموعه دادهها منطقهای به ابعاد 3.8 کیلومتر × 2.4 کیلومتر را پوشش میدهند، با نرخهای نمونهگیری از 1 تا 29 ثانیه (با میانگین 3.61 ثانیه و انحراف استاندارد 3.67 ثانیه). فاصله بین دو نقطه متوالی از 19.97 متر تا 96.6 متر (با میانگین 24.4 متر و انحراف معیار 3.31 متر) متغیر بود. حدود 118000 نقطه وجود داشت.
-
مجموعه داده ووهان ردیابی GPS بود که توسط تاکسی ها جمع آوری شده بود. مجموعه داده منطقه ای به ابعاد 4.8 کیلومتر × 5.5 کیلومتر را پوشش می دهد، با نرخ های نمونه برداری از 1 ثانیه تا 81 ثانیه (با میانگین 37.42 ثانیه و انحراف استاندارد 17.66 ثانیه). فاصله بین دو نقطه متوالی از 0 متر تا 496.255 متر (با میانگین 218.84 متر و انحراف معیار 140.38 متر) متغیر بود. حدود 350000 نقطه وجود داشت.
شکل 4 a ردیابی خام GPS مجموعه داده شیکاگو را نشان می دهد که به عنوان نقاط نمایش داده شده است. ما الگوریتم پیشروی DBSCAN خود را با یک محدودیت جهتگیری به مجموعه داده اعمال کردیم و نتایج تقسیمبندی نقاط GPS دوبعدی را به دست آوردیم، همانطور که در شکل 4 ب نشان داده شده است. در مجموع 1099 خوشه نقطه به دست آمد و آنهایی که از نظر فضایی مجاور یکدیگر بودند در رنگ های مختلف نشان داده شده اند. در شکل 4 ب، ما میتوانیم به صورت بصری تشخیص دهیم که خوشههای مستطیل را میتوان برای ایجاد یک منحنی تقریباً مستقیم، به دلیل جهتگیریهای مشابه و مجاورت فضایی، گروهبندی کرد. دلیل تولید خوشههایی با جهتگیریهای مشابه به شرح زیر است: (1) ما الگوریتم تقسیمبندی را با یک محدودیت قوی شروع کردیم ( α)برای یافتن همسایگان یک نقطه 1 درجه است). و (2) جهت گیری های محاسبه شده توسط دو نقطه متوالی به دلیل نویز نقاط GPS و نرخ نمونه برداری نادرست بود.
سپس ردیابیهای خام GPS را با خطوط مرکزی که توسط خوشههای نقطهای ایجاد شدهاند تطبیق دادیم تا رابطه توپولوژیکی بین خوشهها را ایجاد کنیم. خوشه هایی که از نظر توپولوژیکی به هم متصل بودند بر اساس موقعیت هندسی خود گروه بندی شدند. به عنوان آخرین مرحله از روش گروهبندی پیشرونده خوشههای نقطه، ما همچنین از روش تطبیق نقشه مبتنی بر HMM برای فیلتر کردن خوشهها استفاده کردیم. اگر خط مرکزی لمنما در نظر گرفتیم که تنها با دو (یا کمتر) ردیابی GPS خام مطابقت داشت لمنتوسط نویز ایجاد می شود و خوشه نقطه مربوطه را حذف می کند جمن.
شکل 4 ج نتایج گروه بندی خوشه نقطه ای را نشان می دهد. پنجاه و پنج خوشه به دست آمد. مقایسه شکل 4 b,c نشان می دهد که خوشه های نقطه ای مستطیل توسط الگوریتم ما گروه بندی شده اند. در واقع، خوشه های فضایی مجاور با جهت گیری های مشابه به درستی گروه بندی شدند.
به عنوان آخرین مرحله، ما از الگوریتم Lowess قوی برای تولید خطوط مرکزی از خوشههای نقطه گروهبندی شده استفاده کردیم. نقشه راه استنباط شده (خطوط آبی) با نقشه حقیقت زمینی (خطوط زرد روشن) در شکل 4 d همپوشانی داشت. مطابق شکل 4 d، بخشهای جاده استنباطشده در مستطیل نقشه حقیقت زمین را به خوبی نشان نمیدهند: جادهها اغلب توسط وسایل نقلیه مجهز به GPS بازدید نمیشدند. بنابراین، کمبود نقاط کافی برای بازیابی جاده ها با الگوریتم ما وجود داشت. در بیضی نشان داده شده در شکل 4 d، برخی از بخش های جاده جعلی ایجاد شد. همانطور که در a مشاهده می شود همانطور که در شکل 4، نقاط GPS در این منطقه پر سر و صدا بوده و انباشته شدن نویز باعث ایجاد بخش های جعلی جاده می شود.
ما همین رویه را برای مجموعه داده ووهان اعمال کردیم. شکل 5 a ردیابی های GPS از پیش پردازش شده (خطوط خاکستری) را نشان می دهد که با نقاط مربوطه (نقاط سیاه) همپوشانی دارند. بر اساس این رقم، ردیابی پراکنده جیپیاس بهخوبی با موقعیت واقعی خودروها، بهویژه برای ردیابیهای نزدیک تقاطعهای شبکه جادهای، مطابقت ندارد. سپس از الگوریتم تقسیم بندی خود برای تولید خوشه های نقطه استفاده کردیم، همانطور که در شکل 5 ب نشان داده شده است. به دلیل عدم دقت جهت گیری نقاط GPS، 4970 خوشه تولید شد. پس از گروه بندی، 216 خوشه نشان داده شده در شکل 5 ج به دست آمد. در نهایت، خطوط مرکزی شبکه جادهها را با الگوریتم لاوس قوی تولید کردیم. خطوط مرکزی به صورت خطوط آبی در شکل 5 نشان داده شده استd، و خطوط زرد نشان دهنده نقشه حقیقت زمین است. شکل 5 d نشان می دهد که برخی از بخش های جاده (به عنوان مثال، بخش های جاده در ناحیه مستطیل شکل) به دلیل تعداد ناکافی نقاط GPS قابل بازیابی نیستند.
ما روش استنتاج نقشه خود را با چهار روش معمولی، از جمله خط لوله استنتاج نقشه ترکیبی [ 23 ]، روش مبتنی بر خوشه بندی [ 12 ]، روش مبتنی بر KDE [ 20 ] و روش مبتنی بر ادغام ردیابی [ 15 ] با استفاده از مجموعه داده ووهان نتایج در شکل 6 نشان داده شده است . شکل 6 a جاده های تولید شده توسط روش Edelkamp و Schrödl را نشان می دهد. روش آنها نمی تواند خطوط مرکزی جاده را برای این آثار ایجاد کند. دلیل آن این است که جهت گیری نقاط ردیابی GPS کم نمونه برداری شده دقیق نیست، و از این رو، دانه های خوشه را نمی توان با هم گروه بندی کرد. ما از 3000 ردیابی برای روش استفاده کردیم (تعداد کل ردیابی ها در مجموعه داده ووهان 12832 است). مطابق باشکل 6 الف، 3000 ردیابی شبکه جاده را بر روی نقشه حقیقت زمینی پوشش می دهد. شکل 6 ب شبکه جاده ای را نشان می دهد که با روش بیاجیونی و اریکسون ایجاد شده است. ما تعداد کامل ردیابی را در این روش اعمال کردیم. با این حال، الگوریتم در مرحله فروپاشی گره ها در تقاطع ها شکست خورد. سپس روش را روی 3000 ردیابی اعمال کردیم، همانطور که در شکل 6 ب. با توجه به نرخ نمونه برداری پراکنده، بسیاری از جاده ها نمی توانند توسط الگوریتم بازیابی شوند. شکل 6c شبکه جاده تولید شده با روش دیویس را با تعداد کامل آثار در مجموعه داده ووهان نشان می دهد. این روش نسبت به نرخ نمونه گیری قوی است و ما روش خود را با این روش در بخش بعدی مقایسه می کنیم. ما همچنین روش کائو و کروم را با استفاده از مجموعه داده ووهان ارزیابی کردیم. با این حال، به دلیل نرخ نمونه برداری پراکنده، الگوریتم همگرا نشد و آثار مجاور ادغام نشدند.
تا کنون، ما فقط خطوط مرکزی راه استنباط شده را با نقشه های حقیقت زمینی مقایسه کرده ایم تا الگوریتم استنتاج نقشه خود را به صورت کیفی ارزیابی کنیم. در بخش بعدی، یک ارزیابی کمی برای دقت هندسی الگوریتم استنتاج نقشه خود ارائه میکنیم.
5. ارزشیابی
چندین روش ارزیابی کمی برای دقت هندسه و توپولوژی نقشه های راه استنباط شده اخیرا پیشنهاد شده است. لیو و همکاران [ 19 ] ارزیابی کمی خود را با اندازهگیری یادآوری و دقت جادهها روی نقشه استنتاج شده ( M ) با توجه به جادههای روی نقشه حقیقت زمینی انجام دادند. تیrتوتیساعت). فراخوان نشاندهنده کسری از جادهها در نقشه حقیقت زمینی است که بازیابی شدهاند، و دقت، کسری از جادهها در نقشه استنباطشده مربوطه بود. آنها از فاصله و جهت گیری به عنوان محدودیت برای تطبیق جاده های دو نقشه با یکدیگر با نزدیکترین فاصله و تعیین طول مثبت واقعی استفاده کردند. تیپ=م∩تیrتوتیساعتبا نسبت منطبق سپس فراخوان، دقت و اندازه گیری F به شرح زیر محاسبه شد: rهجآلل=تیپ/||تیrتوتیساعت||، پrهجمنسمنon=تیپ/||م||، و اف–مترهآستوrه=(2×پrهجمنسمنon×rهجآلل)/(پrهجمنسمنon+rهجآلل)، جایی که ||.||طول کل بخش های جاده را در مجموعه مربوطه اندازه گیری می کند. روش آنها دقت هندسی نقشه استنباط شده را ارزیابی کرد.
Biagioni و Eriksson [ 23 ] روش جدیدی را برای اندازه گیری شباهت های هندسی و توپولوژیکی نقشه های حقیقت استنباط شده و زمینی به طور همزمان معرفی کردند. آنها دو نوع نقشه را مجدداً نمونهبرداری کردند و حفرههایی را روی نقشه حقیقت زمین و تیلهها را روی نقشه استنباطشده قرار دادند. سپس تیلهها را با حفرهها با فواصل بین آنها مطابقت دادند و تیلههای بیهمتا و سوراخهای خالی را شمارش کردند. دقت نقشه استنباط شده با توجه به نقشه حقیقت زمینی با تیله های جعلی و سوراخ های خالی اندازه گیری شد.
Karagiorgou و Pfoser [ 25 ] از کوتاه ترین مسیر برای اندازه گیری شباهت نقشه های حقیقت استنباط شده و زمینی استفاده کردند. آنها به طور همزمان مبدا و مقصد را روی دو نقشه قرار دادند و کوتاه ترین مسیر را بین آنها محاسبه کردند تا دو مجموعه از کوتاه ترین مسیرها را به دست آورند. آنها فاصله فرچه گسسته و فاصله عمودی متوسط را برای مقایسه شباهت دو مجموعه از کوتاه ترین مسیرها برای اندازه گیری کمی نقشه استنتاج شده اعمال کردند. روش آنها بر اتصال بخش های جاده متمرکز است.
احمد و همکاران [ 11 ] یک اندازه گیری فاصله مبتنی بر مسیر برای مقایسه نقشه راه پیشنهاد کرد. آنها از فواصل بین دو مسیر (یعنی نقشه ها) که بر اساس فاصله Hausdorff محاسبه شده بود برای اندازه گیری فواصل بین دو شبکه جاده استفاده کردند. روش آنها ویژگی های ساختاری و مکانی نقشه راه را در نظر گرفت.
ما از روش پیشنهادی لیو و همکاران استفاده می کنیم. [ 19 ] برای ارزیابی دقت هندسی نقشه های راه استنباط شده. جزئیات روش ارزیابی هندسه را می توان به شرح زیر توصیف کرد:
-
نقاطی را در جاده های حقیقت زمین و نقشه های استنباط شده با فواصل مساوی (یعنی 1 متر) قرار دهید.
-
جهت گیری همه نقاط را با اتصالات آنها محاسبه کنید (مدول 180 درجه).
-
نقاط نمونه بر روی نقشه استنباط شده را با نقشه حقیقت زمینی با نزدیکترین تطبیق فاصله تحت محدودیت جهت مطابقت دهید. اختلاف جهت دو نقطه ای که با یکدیگر تطبیق داده شده اند بیش از 60 درجه نیست.
-
از آستانه های فاصله متفاوت برای تعیین بهترین نسبت تطابق استفاده کنید.
نقشه حقیقت زمینی (خطوط زرد) و نقشه استنباط شده (خطوط آبی) مجموعه داده شیکاگو، همانطور که در شکل 7 نشان داده شده است، همپوشانی داشتند . شکل 7 a نقشه راه تولید شده توسط الگوریتم بیاجیونی و اریکسون [ 23 ] را نشان می دهد. ما به صورت دستی جاده های نقشه حقیقت زمینی را که در واقع توسط وسایل نقلیه بازدید شده است، با توجه به ردیابی خام GPS انتخاب کردیم. هر جاده با یک خط مرکزی نشان داده می شد، زیرا الگوریتم آنها خطوط مرکزی را با جهت مخالف برای یک جاده دو طرفه جدا نمی کرد. شکل 7b نقشه راه تولید شده توسط روش ما است. همانطور که در جزئیات نشان داده شده است، ما دو خط مرکزی برای جهات مخالف یک جاده دو طرفه ایجاد کردیم. جاده های مربوط به نقشه حقیقت زمینی نیز دارای دو خط مرکزی بودند.
طول کل جاده ها در نقشه حقیقت زمینی در شکل 7 a,b به ترتیب 32.89 کیلومتر و 41.1 کیلومتر است. طول کل نقشه راه استنباط شده در شکل 7 الف (روش بیاجیونی و اریکسون) و شکل 7 ب (روش ما) به ترتیب 50/24 کیلومتر و 9/30 کیلومتر بود. در شکل 7 ب، دو خط مرکزی را برای جاده های دو جهته استنباط می کنیم که با دو خط مرکزی در نقشه حقیقت زمینی نیز نمایش داده می شوند. با این حال، تمام جاده ها در شکل 7 a با خطوط مرکزی منفرد نشان داده شده اند. به همین دلیل است که طول کل جاده ها در نقشه حقیقت زمینی و نقشه راه استنباط شده در شکل 7 ب از جاده های شکل 7 بیشتر است.آ. ما دو نقشه راه استنباطشده را با آستانههای تطبیق متفاوت فاصله ارزیابی میکنیم، جایی که نتایج در جدول 1 و جدول 2 نشان داده شده است . در جدول 1 و جدول 2 ، طول جاده هایی که به خوبی تطبیق داده شده اند، طول کل جاده هایی است که روی نقشه حقیقت زمینی (یا نقشه استنباط شده) با جاده هایی در نقشه استنتاج شده (یا نقشه حقیقت زمینی) مطابقت داده شده اند. آستانه تطبیق فاصله
شکل 8 نمودارهای فراخوان، دقت و اندازه گیری F دو روش را نشان می دهد. شکل 8 a نشان می دهد که مقادیر فراخوان، دقت و معیارهای اندازه گیری F روش بیاجیونی و اریکسون [ 23 ] با افزایش آستانه تطبیق از 5 متر به 20 متر افزایش می یابد و پس از رسیدن آستانه به 20 متر ثابت می شود. شکل 8b نشان می دهد که مقادیر این سه معیار پس از رسیدن به آستانه تطبیق 10 متر با روش ما تغییر چندانی نکرده است. مقادیر معیارهای روش ما بزرگتر از مقادیر روش بیاجیونی و اریکسون بود که آستانه تطبیق کمتر از 20 متر بود. این نتایج نشان میدهد که نقشه راه استنباطشده با روش ما از نظر هندسه از دقت بهتری برخوردار است. بعلاوه، Biagioni و Eriksson با استفاده از همان مجموعه داده [ 23 ] نشان دادند که از نظر هندسه، روش آنها بهتر از روشهای استنتاج نقشه موجود، یعنی روشهای مبتنی بر خوشهبندی، روشهای مبتنی بر ادغام ردیابی و روشهای مبتنی بر KDE عمل میکند.
حقیقت زمین و نقشه های استنتاج شده برای مجموعه داده 2 (مجموعه داده ووهان) در شکل 5 د نمایش داده شده است. ما خطوط مرکزی را با جهت مخالف برای جاده های دو طرفه جدا کردیم. با این حال، نقشه حقیقت زمینی فقط یک خط مرکزی برای هر بخش جاده داشت. بنابراین، تمام نقاط نمونه برداری شده از نقشه حقیقت زمینی را می توان با دو نقطه از جاده های استنباط شده مطابقت داد. طول کل جاده ها در نقشه حقیقت زمینی در شکل 5 d 117.67 کیلومتر است و طول کل جاده های استنباط شده با روش ما 148.38 کیلومتر است. نتایج تطبیق در جدول 3 نشان داده شده است. طول جادههای منطبقشده نشاندهنده طول کل جادهها در نقشه حقیقت زمینی است که با جادههای روی نقشه استنباطشده مطابقت دارد، با توجه به آستانه تطبیق فاصله. طول جادههایی که به درستی استنباط شدهاند، کل طول جادههایی است که در نقشه استنباطشده با جادههای روی نقشه حقیقت زمین مطابقت دارند، با توجه به آستانه تطبیق فاصله. از آنجایی که طول کل جاده ها در نقشه راه استنباط شده بزرگتر از طول کل جاده ها در نقشه حقیقت زمینی بود، ما فرمول استاندارد یادآوری و دقت را به صورت زیر اصلاح کردیم: rهجآلل=||wهللمترآتیجساعتهدroآدس||/||تیrتوتیساعت||، و پrهجمنسمنon=||جorrهجتیلyمنnfهrrهدroآدس||/||م||. جدول 4 نتایج تطبیق شبکه جاده تولید شده با روش دیویس را نشان می دهد ( شکل 6 ج). طول کل جاده های استنباط شده در شکل 6 ج 97.97 کیلومتر است.
شکل 9 نمودارهای گرافیکی یادآوری، دقت و اندازه گیری F را برای مجموعه داده ووهان نمونه برداری شده پراکنده (مجموعه داده 2) نشان می دهد. شکل 9 a نمودار روش ما است. و شکل 9 ب نمودار روش دیویس است. مطابق شکل 9 الف، زمانی که آستانه تطبیق فاصله بزرگتر از 15 متر باشد، دقت بیشتر از 0.9 است. بنابراین، نتیجه میگیریم که روش ما میتواند یک نقشه راه را از ردیابیهای GPS پراکنده با دقت هندسی بالا استنتاج کند. وقتی آستانه برابر با 5 متر است، دقت کمتر از 0.5 است، زیرا ما دو خط مرکزی برای جادههای دو طرفه ایجاد کردیم و نقشه حقیقت زمینی فقط از یک خط مرکزی برای نشان دادن جادههای دو طرفه استفاده میکرد. در مقایسه شکل 9a،b، نتیجه می گیریم که شبکه جاده ای که با روش ما تولید می شود، دقت هندسی بهتری نسبت به شبکه جاده استنباط شده با روش دیویس دارد.
6. نتیجه گیری
ما یک چارچوب تقسیم بندی و گروه بندی جدید برای استنتاج نقشه راه از ردیابی GPS پیشنهاد کرده ایم. جنبه کلیدی پارتیشن بندی کل نقاط ردیابی GPS به خوشه هایی است که منحنی های تقریباً مستقیم را برای بازیابی نقشه راه نشان می دهند. به طور خلاصه، روش ما این قابلیت را دارد که با ردیابی های GPS پراکنده و پراکنده برخورد کند. با توجه به نتایج تجربی و ارزیابی، میتوان نتیجه گرفت که روش ما از نظر دقت هندسی عملکرد خوبی دارد. چارچوبی که ما پیشنهاد کردیم باز و منعطف است. ما میتوانیم الگوریتم تقسیمبندی ابر نقطهای دوبعدی پیچیدهتری را برای جایگزینی الگوریتم فعلی ایجاد کنیم، در نتیجه عملکرد کلی روش پیشنهادی را بیشتر بهبود میبخشیم.
در این تحقیق از دو نقطه متوالی برای تخمین جهت گیری نقاط استفاده شده است. با این حال، نویز و نمونه برداری پراکنده به طور قابل توجهی بر دقت تخمین جهت گیری تأثیر می گذارد. در کار آینده، ما قصد داریم تا ارتباط بین نقاط و توزیع ابر نقطه را برای تخمین جهتگیریها برای بهبود عملکرد الگوریتم ادغام کنیم. این روش برای ایجاد منحنی های تقریبا مستقیم برای بازیابی شبکه جاده طراحی شده است. با این حال، همه جاده ها مستقیم نیستند. در کار آینده، منحنیها را با دنبالهای از بخشهای خط شبیهسازی میکنیم تا جادههای پرپیچپیچ را از ردیابی GPS استنتاج کنیم. علاوه بر این، ما نیاز به پردازش تقاطع خطوط مرکزی برای تولید مدل نمودار شبکه جاده داریم.
بدون نظر