استخراج و بازسازی گذرگاه های گورخر از تصاویر هوایی با وضوح بالا

خلاصه

در این مقاله، یک رویکرد خودکار برای استخراج و بازسازی تقاطع گورخر از تصاویر هوایی با وضوح بالا پیشنهاد شده است. در روش استخراج، گذرگاه‌های گورخر توسط طبقه‌بندی کننده JointBoost بر اساس ویژگی‌های GLCM (ماتریس هم‌وقوع سطح خاکستری) و ویژگی‌های گابور ۲ بعدی استخراج می‌شوند. در روند بازسازی، یک مدل پارامتر هندسی مبتنی بر روابط تکرارپذیری فضایی در سطح جهانی برای بازسازی شکل هندسی گذرگاه‌های گورخر نصب شده است. علاوه بر این، گروهی از آزمایش‌های نشان‌دهنده برای آزمایش روش پیشنهادی تحت شرایط تداخلی، مانند گذرگاه‌های گورخری تحت پوشش عابران پیاده، سایه‌ها و محو شدن رنگ، انجام می‌شود. علاوه بر این، عملکرد روش استخراج پیشنهادی با روش تطبیق الگو مقایسه می‌شود. سرانجام،

کلید واژه ها:

گذرگاه گورخر ; ویژگی GLCM ؛ فیلتر گابور ؛ طبقه بندی کننده JointBoost ; مدل پارامتری ; تکرارپذیری هندسی بازسازی

1. معرفی

جاده‌ها و ویژگی‌های وابسته به آن‌ها، اشیاء ساخت بشر مهمی هستند که با زندگی روزمره انسان مرتبط هستند. از زمان استفاده از تصاویر سنجش از دور، استخراج جاده ها بر اساس تصاویر سنجش از دور برای دهه ها مورد تحقیق قرار گرفته است. رویکردهای موفق برای استخراج جاده ها بر اساس طبقه بندی طیفی- فضایی [ 1 ] و روش های تجزیه و تحلیل تصویر مبتنی بر دانش [ 2 ]، در میان دیگران بوده است. با افزایش وضوح تصاویر سنجش از راه دور، می توان به طور دقیق ویژگی های دقیق جاده های وابسته، مانند گذرگاه های گورخر را استخراج کرد. گذرگاه های گورخر، نوعی گذرگاه عابر پیاده، در بسیاری از نقاط جهان مورد استفاده قرار می گیرد، که اطلاعات بسیار مهمی است که اغلب در جمع آوری داده های جغرافیایی نادیده گرفته می شود [ 3]]. اخیراً، با افزایش تقاضا برای اطلاعات دقیق جاده که توسط تجزیه و تحلیل دسترسی محلی، شبیه‌سازی و پیش‌بینی عابر پیاده، و ناوبری خودروهای بدون راننده تحریک می‌شود، استخراج گذرگاه‌های گورخر به‌ویژه برای اهداف بازسازی، به یک موضوع تحقیقاتی مهم تبدیل شده است [ 4 ، 5 ، 6 ، 7 ]. تصاویر هوایی با وضوح بالا یکی از مهم‌ترین و محبوب‌ترین منابع داده برای بازیابی داده‌های جغرافیایی هستند [ 8 ، 9 ، 10 ، 11 ، 12 ]، و امکانات بیشتری را برای استخراج و بازسازی گذرگاه‌های گورخر فراهم می‌کنند.

استخراج گذرگاه‌های گورخر به نمونه‌های شی طبقه‌بندی شده از تصاویر هوایی اولین و حیاتی‌ترین گام برای پردازش و بازسازی بیشتر داده‌ها است. تصاویر هوایی عمدتاً برای شناسایی گذرگاه‌های گورخری از ناحیه نسبتاً بزرگ‌تر به منظور افزایش اطلاعات مکانی سیستم‌های GIS استفاده می‌شوند. در این مطالعات، از نظم عبور گورخرها برای بهبود میزان تشخیص آنها استفاده شده است. در اوایل دهه 2000، Chunsun Zhang [ 13 ] بر روی استخراج جاده ها و همچنین بر روی استخراج از تقاطع گورخر بر اساس تقسیم بندی اطلاعات رنگ و بسته شدن مورفولوژیکی برای نشانه هایی از وجود جاده ها کار کرد. تورنیر و پاپرودیتیس [ 14] یک رویکرد خودکار برای تشخیص خطوط چین بر اساس تحلیل تصادفی پیشنهاد کرد. هسته اصلی این رویکرد ایجاد مدل های هندسی، رادیومتری و رابطه ای برای اجسام خط چین است. علاوه بر این، جین و همکاران. [ 15 ، 16 ] خط‌کشی‌های جاده‌ها و گذرگاه‌های گورخر را بر اساس تحلیل‌های تصویر سلسله مراتبی و فیلترهای گابور دو بعدی [ 17 ] از نظر ویژگی‌های بافت از تصاویر هوایی با وضوح بالا استخراج کردند و نتایج متوسطی را که توسط سایه‌ها تأثیر می‌گذاشتند، به دست آوردند.

فراتر از نیازهای استخراج گذرگاه گورخر، بازسازی گذرگاه های گورخری با دقت هندسی بالا نیز در بسیاری از کاربردهای عملی مانند شبیه سازی ترافیک، مدیریت، نگهداری و به روز رسانی پایگاه داده های نقشه برداری جاده ها ضروری است [18 ، 19 ] . بهمن و همکاران [ 19 ] یک رویکرد خودکار برای بازسازی تقاطع گورخر با استفاده از جفت های استریو با محدودیت های هندسی شکل و اندازه شناخته شده ارائه کرد. تورنیر و پاپرودیتیس [ 20] همچنین روشی را برای بازسازی مدل های تقاطع اولیه گورخر از تصاویر موبایل کالیبره شده با استفاده از تشخیص لبه، زنجیره لبه، تطبیق لبه و فرآیند پالایش برای بهینه سازی مدل های نهایی معرفی کرد. در همین حال، برای ویژگی‌های اجسام ثابت، گذرگاه‌های گورخر به عنوان اشیاء کنترل زمینی برای ارائه ارجاع جغرافیایی برای سیستم‌های نقشه‌برداری متحرک پس از بازسازی دقیق از تصاویر هوایی استفاده می‌شوند [21 ] .

در تصاویر هوایی با وضوح بالا، گذرگاه های گورخر دارای سه ویژگی اصلی زیر هستند: طیف، بافت و شکل. برای اولین ویژگی، گذرگاه های گورخر تضاد شدید با پس زمینه است. برای مشخصه دوم، گذرگاه های گورخر دارای همبستگی تناوبی قوی است و تاپل های ساده همیشه در یک راستا قرار دارند. برای آخرین مشخصه، تاپل گذرگاه های گورخر همیشه یک مستطیل یا متوازی الاضلاع همگن است. در عمل، تصاویر گذرگاه‌های گورخر اغلب به دلیل پوشش خودروها یا عابران پیاده و سایه‌ها بدتر می‌شوند، که بر ویژگی‌های طیف و بافت تأثیر می‌گذارد. از آنجایی که مشخصه بافت نسبت به شرایط روشنایی و قسمت های مبهم حساس نیست، مشخصه شکل در تغییرات نمونه نسبتاً پایدار عمل می کند. از این رو، در این مقاله،

الگوریتم یک استخراج از گذرگاه های گورخر را انجام می دهد و سپس آنها را بازسازی می کند. برای مرحله استخراج، طبقه‌بندی‌کننده JointBoost [ 22 ] بر اساس الگوهای بافت آن‌ها که توسط ماتریس هم‌وقوع سطح خاکستری (GLCM) [ 23 ، 24 ] و مجموعه‌ای از فیلترهای گابور دو بعدی [ 25] توصیف شده است، استفاده می‌شود.]. GLCM یکی از توصیفگرهای ویژگی بافت در حوزه فضا است که ساده و موثر است. گذرگاه‌های گورخر دارای ویژگی‌های تکراری هستند که پاسخ‌های قوی در حوزه فرکانس مجموعه‌ای از فیلترهای گابور دارند. برای مرحله بازسازی، ما یک مدل هندسی پارامتری را برای توصیف سراسری شکل گذرگاه‌های گورخر پیشنهاد می‌کنیم. در فرآیند برازش مدل، ما تکرارپذیری فضایی گذرگاه‌های گورخر را در نظر می‌گیریم تا خطاهای موضعی ناشی از شرایط ذکر شده قبلی را بازبینی کنیم.

این مقاله به شرح زیر سازماندهی شده است: در بخش 2 ، روش شناسایی و بازسازی گذرگاه های گورخر را شرح می دهیم. روش تشخیص شامل دو جزء زیر است: تعریف ویژگی و استخراج از تقاطع گورخر. روش بازسازی مدل پارامتری تقاطع گورخر و پردازش برازش را پیشنهاد می‌کند. بخش 3 با چندین آزمایش برخی از تصاویر گذرگاه گورخر را که توسط عابران پیاده، سایه ها و اتوبوس ها پنهان شده است، تأیید می کند. در بخش پایانی، با نظراتی در مورد الگوریتم و تحقیقات آتی نتیجه گیری می کنیم.

2. روش شناسی

2.1. مروری بر روش

رویکرد اصلی روش ما بر دو مرحله اصلی متمرکز است: شناسایی و بازسازی تقاطع گورخر. هر دو در شکل 1 نشان داده شده اند . در مرحله اول، مراحل استخراج از تقاطع گورخر انجام می شود که شامل بهبود تصاویر با وضوح بالا، تعریف و استخراج ویژگی بافت و یک طبقه بندی برای آموزش و طبقه بندی می شود. در مرحله دوم، برای هر تقاطع گورخر، مدل هندسی با حل مجموعه ای از پارامترهای از پیش تعریف شده با استفاده از یک سری مراحل بازسازی می شود.

2.2. استخراج متقاطع گورخر

این مرحله استخراج به طبقه‌بندی JointBoost برای تمایز بین گذرگاه‌های گورخر و پس‌زمینه آنها متکی است. از آنجایی که طبقه بندی نیمه نظارتی است، ما فقط به ویژگی های GLCM و پاسخ های فیلترهای گابور دو بعدی با تصاویر چند مقیاسی تکیه می کنیم.

قبل از فرآیند استخراج، رویه‌ای برای بهبود تصویر برای بهینه‌سازی کنتراست برای تشخیص ویژگی و همچنین کاهش اثرات سایه‌ها و نویز سفید در هر تصویر عملی انجام می‌شود. فیلتر والیس یک تبدیل تصویر محلی است که میانگین خاکستری و واریانس قسمت های مختلف را تقریب می زند [ 26 ]. یعنی کنتراست خاکستری را در قسمت هایی که کنتراست کوچک است افزایش می دهد و در جایی که کنتراست زیاد است کنتراست خاکستری را کاهش می دهد. به دلیل عملگر صافی که هنگام محاسبه میانگین و واریانس خاکستری معرفی می شود، فیلتر والیس اطلاعات مفید را افزایش می دهد و همزمان نویز را سرکوب می کند که به صورت زیر بیان می شود.

f (x ، y) = r 1 \times گرم (x ، y) + r 0 r 1 = c \times س f ج \times س g + ( 1 - c ) س f; r 0 = b \times متر f + (1 - b - r 1) متر g

(1)

جایی که $g (x, y)$ مقدار DN (شماره دیجیتال) در موقعیت است $(x, y)$ از تصویر اصلی $g$ ، و $f (x, y)$ مقدار DN بعد از فیلتر والیس است. $r_{1}$ یک ضریب ضربی است و $r_{0}$ یک ضریب افزایشی است. $m_{f}$ مقدار میانگین محلی است و $s_{f}$ مقدار واریانسی است که نسخه اصلی با آن تنظیم می شود. $m_{g}$ مقدار میانگین محلی است و $s_{g}$ مقدار واریانس تصویر اصلی است. $c \in [0, 1]$ ثابت کشش کنتراست تصویر است و $b \in [0, 1]$ یک ضریب روشنایی است. در روش تبدیل والیس، تصویر اصلی به بلوک ها تقسیم می شود و جزئیات تصویر از طریق تنظیم کنتراست هر پنجره کوچک، همانطور که در شکل 2 نشان داده شده است، افزایش می یابد .

2.2.1. تعریف ویژگی ها

ویژگی های GLCM

GLCM برخی اطلاعات جامع از بافت تصویر را منعکس می کند که جهت، فاصله و تغییرات مقیاس خاکستری دو پیکسل را در نظر می گیرد. بنابراین اندازه ابعاد آن با مقدار سطح خاکستری متناسب است. با در نظر گرفتن تعادل بین کارایی محاسباتی و دقت، تعداد کافی از سطوح خاکستری باید برای آمار GLCM انتخاب شود. معمولاً 256 سطح خاکستری در یک تصویر فشرده می شوند تا در زمان محاسبه GLCM صرفه جویی شود [ 27 ]. از آنجا که GLCM نمی تواند مستقیماً به عنوان ویژگی ورودی طبقه بندی کننده استفاده شود، ما پنج معیار انتخاب را از GLCM برای الگوریتم خود استخراج می کنیم.

(1): لحظه دوم زاویه ای:

$ASM = \sum i = 1 L \sum j = 1 L پ 2 (من ، ج)$

(2)

جایی که $L$ نشان دهنده تعداد سطوح خاکستری متمایز در تصاویر و $p (i, j)$ ورودی ( i , j ) در GLCM است . این آمار یکنواختی نیز نامیده می شود که یکنواختی و نابسامانی بافت را اندازه گیری می کند.
(2): همبستگی:

$COR = (\sum i = 1 L \sum j = 1 L (i j) p (i, j) - تو ایکس تو y) / σ ایکس σ y$

(3)

$تو ایکس = \sum i = 1 L من \sum j = 1 L p (i, j) تو y = \sum j = 1 L j \sum i = 1 L p (i, j)$

$σ 2 ایکس = \sum i = 1 L (من - تو ایکس) 2 \sum j = 1 L p (i, j) σ 2 y = \sum j = 1 L (j-_تو y) 2 \sum i = 1 L p (i, j)$

جایی که $u_{x}$ ، $u_{y}$ ، $σ_{x}$ و $σ_{y}$ میانگین و انحراف معیار ردیف ها و ستون های خلاصه شده است. ویژگی همبستگی وابستگی های خطی رنگ خاکستری را در تصویر اندازه گیری می کند.
(3): تضاد:

$CON = \sum i = 1 L \sum j = 1 L (i - j) 2 p (i, j)$

(4)

این آمار کنتراست شدت یا تغییرات محلی بین یک پیکسل و همسایه اش را در کل تصویر اندازه گیری می کند.

(4): همگنی:

$HOM = \sum i = 1 L \sum j = 1 L p (i ، j) / (1 + (i - j) 2)$

(5)

به همگنی لحظه اختلاف معکوس (IDM) نیز گفته می شود که همگنی تصویر را اندازه گیری می کند. ارزش

H O M

برای تصاویر ناهمگن کم است و برای تصاویر همگن ارزش نسبتاً بالاتری دارد.

(5): آنتروپی:

$E ن تی = - \sum i = 1 L \sum j = 1 L پ (i, j) l o g {p (i ، j)}$

(6)

این آمار بی نظمی یا پیچیدگی یک تصویر را اندازه گیری می کند. تصاویر ناهمگن آنتروپی مرتبه اول پایینی دارند، در حالی که یک صحنه همگن آنتروپی بالایی دارد.

برای به دست آوردن ویژگی‌های تغییرناپذیر چرخش، ما از پارامترهای آماری این پنج معیار، به‌جای خود GLCM، به عنوان ویژگی‌های استخراج، از جمله میانگین و انحراف استاندارد، استفاده می‌کنیم. همه این پارامترهای آماری با هم به عنوان ویژگی های نهایی برای استخراج از تقاطع گورخر استفاده می شود. برای سادگی، این پارامترها در اینجا ویژگی های GLCM نامیده می شوند.

به طور کلی، تصاویر اصلی از چندین حوزه فرکانس های فضایی تشکیل شده اند. همانطور که شکل 3 a,b نشان می دهد، جدا کردن گذرگاه های گورخر از پس زمینه تصاویر اصلی دشوار است. خوشبختانه، در مقایسه با پس‌زمینه، گذرگاه‌های گورخر با لبه‌های ظریف فرکانس‌های بالاتری دارند، بنابراین ابتدا یک فیلتر بالا گذر برای تقویت و بهبود کنتراست تصویر قبل از انجام محاسبات GLCM اعمال می‌شود. علاوه بر این، برای در نظر گرفتن تغییرات مقیاس محلی [ 28 ، 29 ، 30 ]، یک عملگر DoG (تفاوت گوسی ها) [ 31 ] استفاده می شود که در الگوریتم SIFT [ 32 ] پیاده سازی شده است. به عنوان مثال، شکل 4نتیجه اعمال یک اپراتور DoG با STD Gaussian را نشان می دهد

σ = 0.5 K (K = 1, 2, 3, 4, 5, 6)

و الف

5 \times 5

هسته

برای آزمایش حساسیت ویژگی‌های GLCM در مقیاس‌های مختلف برای تشخیص گذرگاه‌ها و پس‌زمینه گورخر، آزمایشی با استفاده از 50 نمونه تصویر متقاطع گورخر و 50 نمونه تصویر پس‌زمینه انجام شد. به عنوان مثال، شکل 5 میانگین و انحراف معیار ویژگی های کنتراست را در تصویر اصلی و تصویر فیلتر شده DoG را در دو مقیاس نشان می دهد. همانطور که می بینیم، جداسازی ویژگی های تقاطع گورخرها و نمونه های پس زمینه به طور قابل توجهی با نتایج فیلتر شده DoG در مقایسه با تصویر اصلی، که در شکل 3 نشان داده شده است، برتر است .

ویژگی 2 بعدی گابور

فیلتر گابور یک فیلتر خطی است که برای تشخیص لبه استفاده می شود [ 33 ]. فیلتر 2 بعدی گابور ویژگی های فیلتر اصلی گابور را به دو بعد گسترش می دهد و قادر است تصاویر فرکانس ها، جهت ها و محدوده های فضایی مختلف را تجزیه و تحلیل کند. فیلتر 2 بعدی گابور در توصیف بافت های تصویر با الگوهای تکراری به خوبی عمل می کند [ 34 ]. فرمول زیر شرح عملکرد هسته آن است:

g (x ، y; λ, θ, ψ, σ, γ) = exp (- x ‘ 2 + γ 2 y ‘ 2 2 σ 2) exp (i (2 π ایکس “ λ + ψ)) ایکس “ = x cos θ + y گناه θ y “ = - x sin θ + y cos θ

(7)

جایی که $λ$ طول موج است، $θ$ زاویه جهت است، $ψ$ فاز است، $σ$ واریانس در جهت اصلی تابع گاوسی دوبعدی است و $γ$ نسبت بین دو واریانس تابع گاوسی دو بعدی است.

شکل 6 نتایج اعمال فیلتر گابور را با فرکانس های مختلف بر روی نمونه تصویر تقاطع گورخر نشان می دهد. به وضوح می توان مشاهده کرد که با استفاده از یک فیلتر فرکانس پایین، تصویر به طور کلی بهبود می یابد، در حالی که اعمال فیلتر فرکانس بالا اطلاعات دقیق را افزایش می دهد.

از آنجایی که فرکانس مکانی و جهت گذرگاه های گورخر در تصاویر دلخواه است، سه باند فرکانسی فضایی و چهار جهت مختلف بر اساس دانش قبلی برای پوشش فرکانس مکانی و جهت گذرگاه های گورخر در نظر گرفته شده است. هنگامی که فرکانس فیلتر با فرکانس فضایی عبور گورخر مطابقت داشته باشد، بزرگی پاسخ بزرگ خواهد بود. میانگین و انحراف استاندارد انرژی پاسخ در هر جهت در هر فرکانس مکانی را به عنوان ویژگی بافت در نظر می گیریم. شکل 7سهم ویژگی استخراج شده توسط دو گروه از فیلترهای گابور را بر روی 50 بلوک عبور گورخر و 50 بلوک پس‌زمینه نشان می‌دهد و فرکانس مکانی تقاطع‌های گورخر نزدیک به 0.1 است. واضح است که تفکیک ویژگی های استخراج شده توسط فیلترها با فرکانس 0.1 بسیار بهتر از سایرین است.

2.2.2. استخراج گذرگاه های گورخر

اصل JointBoost

JointBoost یک توسعه مهم برای الگوریتم های تقویت است که برای طبقه بندی چند کلاسه قدرتمند و موثر است [ 35 ، 36]. ایده اصلی JointBoost ساختن یک طبقه‌بندی‌کننده قوی از میان یک سری طبقه‌بندی‌کننده‌های ضعیف بر اساس این تصور است که پیدا کردن طبقه‌بندی‌کننده‌های ضعیف بسیار آسان‌تر از یافتن مستقیم یک طبقه‌بندی‌کننده قوی است. در طول مراحل آموزش، دو ویژگی قابل توجه وجود دارد که به طور قابل توجهی به عملکرد JointBoost کمک می کند. یکی این است که JointBoost بهترین ویژگی ها را برای طبقه بندی کننده های ضعیف در هر مرحله تکرار انتخاب می کند تا از حداقل خطاها اطمینان حاصل کند. این تضمین می کند که JointBoost مناسب ترین ویژگی ها را برای طبقه بندی نهایی انتخاب می کند. مورد دیگر این است که JointBoost می تواند وزن نمونه هایی را که با طبقه بندی مرحله تکرار قبلی مطابقت ندارند، افزایش دهد، بنابراین محاسبات آموزشی در این مرحله می تواند به آن نمونه ها اهمیت بیشتری بدهد. این باعث می شود روند آموزش موثرتر باشد.

استخراج توسط JointBoost

روش استخراج از دو مرحله زیر تشکیل شده است: آموزش طبقه بندی کننده و استخراج از تقاطع گورخر. نمونه های آموزشی و عناصر برای استخراج هر دو بر اساس یک بلوک تصویر کوچک با اندازه ثابت هستند. توجه داشته باشید که قبل از استخراج ویژگی های بافت، همانطور که در بخش 2.2.1 معرفی شد، پیش پردازش شده بود .

برای مرحله آموزش طبقه‌بندی‌کننده، مجموعه‌ای از نمونه‌های آموزشی را به صورت دستی انتخاب می‌کنیم که شامل گذرگاه‌ها و پس‌زمینه‌های گورخر است. نمونه های انتخاب شده باید به اندازه کافی نشان دهنده گذرگاه ها و پس زمینه گورخرهای معمولی باشند. علاوه بر این، نمونه‌های پس‌زمینه‌ای که شبیه به تقاطع گورخر هستند نیز باید انتخاب شوند، زیرا این نمونه‌ها در بهبود عملکرد آموزش طبقه‌بندی‌کننده مهم هستند. شکل 8 نمونه ای از نتیجه استخراج است. پس از استخراج، چندین شیء عبور از گورخر از تصویر مورد نظر به دست می آید. بر اساس آن اشیا، می‌توانیم گذرگاه‌های گورخر را دقیقاً بازسازی کنیم.

2.3. بازسازی گذرگاه گورخر

2.3.1. مدل هندسی

هدف از بازسازی تقاطع گورخر، یافتن یک سری چهارگوش است که دقیقاً با لبه های راه راه های عبور گورخر مطابقت دارند. شکل چهارگوش تقاطع گورخر را می توان برای به روز رسانی پایگاه داده GIS و ارائه بهتر نمایش نقطه عطف استفاده کرد. در [ 20 ]، تشخیص لبه و زنجیره لبه برای بازسازی گذرگاه های گورخر معرفی شده است. گاهی اوقات این روش به دلیل پوشاندن لبه های راه راه توسط عابران پیاده یا اتومبیل ها با شکست مواجه می شود. با این حال، گذرگاه‌های گورخر دارای ویژگی هندسی جهانی تکرارپذیری فضایی در یک منطقه محلی هستند و این اصل می‌تواند برای بازسازی ویژگی‌ها استفاده شود.

به دست آوردن لبه های راه راه دقیق گذرگاه های گورخر برای به دست آوردن نظم های جهانی بسیار مهم است. از آنجایی که لبه های نوار نشان دهنده موقعیتی است که شیب تصویر به حداکثر محلی می رسد، می توانیم مجموع لبه گرادیان (SGE) را با توصیف انرژی لبه های نوار به صورت زیر تعریف کنیم:

S G E = 🔻 E g (x_y) d س

(8)

جایی که $g (x, y)$ مقدار گرادیان در موقعیت است $(x, y)$ و $E$ به عنوان مجموعه ای از موقعیت ها در امتداد لبه های یک گذرگاه گورخر تعریف می شود. بازسازی یک تقاطع گورخر اساساً فرآیندی برای بازسازی لبه های مرزی هر نوار برای تولید حداکثر مقدار SGE است. شکل 9 یک مدل هندسی پارامتریک را برای نشان دادن راه راه های تقاطع گورخر تعریف می کند.

(1): $θ_{m}$ : زاویه تقاطع گورخرها نسبت به جهت اصلی آنها عادی است.
(2): $θ_{p}$ : زاویه نوارها نسبت به جهت اصلی آنها نرمال است.
(3): $W_{p}$ : طول نوار.
(4): $W_{e}$ : پهنای نوار.
(5): $T$ : فاصله دو راه راه همسایه.
(6): $\cup_{i = 1}^{n} (x_{i}, y_{i})$ : مجموعه نقاط مرکزی راه راه ها.

از هندسه مشخص است که یک نوار را می توان با چهار خط مرزی جایگزین کرد. با وسط نوار مشخص شده است

(x_{i}, y_{i})

، تابع هر یک از چهار خط عبارتند از:

⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪ l 1 : x i cos θ m + y i sin θ m - W p 2 = 0 l 2 : x i cos θ m + y i sin θ m + W p 2 = 0 l 3 : x i cos θ p + y i sin θ p - W e 2 = 0 l 4 : x i cos θ p + y i sin θ p + W e 2 = 0

(9)

برای یک نوار یک نقطه مرکزی (

x_{i}, y_{i}

، نقاط مرزی نوار را می توان به صورت زیر توصیف کرد:

E ه (ایکس من ، y من) = ⎧ ⎩ ⎨ (x ، y) ∣ ∣ ∣ ∣ [(ل 1 (x ، y) = 0 \cup را ل 2 (x ، y) = 0) \cap را ل 3 (x ، y) ل 4 (x ، y) \leq 0] \cup را [(ل 3 (x ، y) = 0 \cup را ل 4 (x ، y) = 0) \cap را ل 1 (x ، y) ل 2 (x ، y) \leq 0] ⎫ ⎭ ⎬

(10)

در نهایت، مجموعه نقاط لبه مرزی همه نوارها به صورت زیر خواهد بود:

E = \cup i = 1 N E e (x i, y i)

(11)

بنابراین، اگر پارامترها را بدست آوریم

θ_{m}

θ_{p}

W_{p}

W_{e}

، و

\cup_{1}^{N} (x_{i}, y_{i})

، ما قادر خواهیم بود مدل هندسی را برای توصیف مجموعه نقاط لبه مرزی E در این مدل ایجاد کنیم.

\cup_{1}^{N} (x_{i}, y_{i})

را نمی توان به طور مستقیم به دست آورد، اما هر دو نقطه مرکز مجاور در

\cup_{1}^{N} (x_{i}, y_{i})

دارای فواصل یکسان از

T

. بدین ترتیب،

\cup_{1}^{N} (x_{i}, y_{i})

با محاسبه تقاطع بین خطوط مرکزی هر نوار و خط مرکزی تقاطع گورخر به دست می آیند. خطوط مرکزی هر نوار مطابق با پارامتر ایجاد می شود

T

2.3.2. پارامترها را حل کنید

یافتن مستقیم مقدار E مناسب برای رسیدن به حداکثر مقدار جهانی تابع SGE دشوار است. در عوض، ابتدا شکل ناهموار اولیه تقاطع گورخر را ایجاد می کنیم، سپس SGE را با یک گرادیان بهینه می کنیم تا یک E دقیق بدست آوریم . قبل از محاسبه مدل اصلی، تصاویر فرعی از تقاطع گورخر شناسایی شده در تصاویر باینری پیش پردازش می شوند. در طول پیش پردازش، یکسان سازی هیستوگرام، حذف سایه و پردازش مورفولوژیکی برای افزایش کیفیت تصویر اعمال می شود، همانطور که در شکل 10 نشان داده شده است .

مرحله اول:: دامنه _

تبدیل Hough (HT) برای استخراج خطوط مرزی نوارهای چهار گوش استفاده می شود. در برخی از تصاویر، لبه های امتداد تقاطع گورخر محو شده است که باعث عدم دقت در نتایج تشخیص خط می شود. برای بهبود دقت تشخیص خط مرزی، این روش را به دو مرحله تقسیم می کنیم. ابتدا از HT برای تشخیص خطوط مرزی برای به دست آوردن نتایج اولیه استفاده می کنیم. سپس، جهت خطوط مرزی را با مقادیر گرادیان پیکسل ها در امتداد خطوط شناسایی شده تنظیم می کنیم. با این روش می‌توان لبه‌های خط‌های متقاطع گورخر را پیدا کرد و محدوده تقاطع گورخر و همچنین دو پارامتر زاویه را تخمین زد.

θ_{m}

θ_{p}

. شکل 11 نتایج تشخیص خط مرزی عبور از گورخر را نشان می دهد.

مرحله دوم:: دوره تکراری فضایی

دوره تکراری فضایی، که با T نشان داده می شود، یک پارامتر مهم برای نظم تکراری است. با این حال، فرآیند تشخیص خط شرح داده شده در مرحله I ممکن است همه خطوط را پوشش ندهد، که ممکن است منجر به شکست تخمین تکراری از تحلیل فاصله خط از دیدگاه آمار تصویر شود. تبدیل گابور، که یک مورد خاص از تبدیل فوریه کوتاه مدت است، برای تجزیه و تحلیل سیگنال‌های ناپایدار که بر مشکلات فضای مورد نیاز موجود در تبدیل فوریه معمولی (FT) غلبه می‌کند، خوب است [33 ] . ما می توانیم تصویر را به فضای فرکانس تبدیل کنیم تا T مناسب را پیدا کنیم. شکل 12a مثالی است که توزیع فرکانس را در امتداد جهت اصلی تقاطع گورخر نشان می دهد. فرکانس نسبت به اوج توزیع نشان دهنده بسامد فضایی تقاطع گورخر است که از آن می توانیم دوره مکانی را محاسبه کنیم. شکل 12 ب گروهی از خطوط موازی ایجاد شده توسط این دوره مکانی را نشان می دهد. بدیهی است که نتایج نشان می‌دهد که تمام خطوط لبه‌های نوارها را دقیقاً پوشش نمی‌دهند، که نشان می‌دهد دوره مکانی استخراج‌شده توسط فیلتر گابور دقیق نیست. از این رو، این دوره مکانی تنها می تواند به عنوان یک مقدار اولیه استفاده شود که برای بهینه سازی تنظیم می شود.

مرحله سوم:: عرض و مراکز

شیب های لبه های مخالف یک نوار دارای جهت مخالف هستند که در شکل 13 a,b نشان داده شده است. بنابراین، دو گروه از خطوط که لبه های مخالف نوارها را می پوشانند را می توان به صورت زیر تعریف کرد:

L f = \cup i = 1 N {(x, y) | x cos θ p + y sin θ p - (ρ f + i T 0) = 0}

(12)

L b = \cup i = 1 N {(x, y) | x cos θ p + y sin θ p - (ρ b + i T 0) = 0}

(13)

جایی که $T_{0}$ دوره فضایی به دست آمده در مرحله دوم است، و $ρ_{f}$ ، $ρ_{b}$ موقعیت خطوط اول در بین دو گروه از خطوط است. حل پارامترها $ρ_{f}$ و $ρ_{b}$ در محدوده هستند $[0, T_{0})$ . از این رو، پارامترها را می توان با برشمردن پارامترها و آنهایی که حداکثر می دهند به دست آورد. $S G E$ انتخاب خواهد شد. با این دو گروه از خطوط موازی، عرض نوار را می توان به صورت زیر توصیف کرد:

W 0 e = {ρ f - ρ b (ρ f \geq ρ b) T 0 + ρ f - ρ b (ρ f < ρ b)

(14)

برای دوره مکانی با تعصب، این عرض نیز یک مقدار تقریبی است. شکل 13 a,b دو گروه از خطوط راه راه را نشان می دهد. علاوه بر این،

\cup_{i = 1}^{N} (x, y)

را می توان با استفاده از دوره مکانی، عرض نوار عبور گورخر و چهار خط مرزی آن محاسبه کرد.

مرحله چهارم:: بهینه سازی جهانی

در این مرحله، ما تمام پارامترهای مورد نیاز برای تولید یک مدل هندسی را داریم. از آنجا که جهت اصلی توسط نتایج استخراج از تقاطع گورخر تعیین می شود، ما فقط باید دوره فضایی T و عرض نوارهای W را بهینه کنیم . تابع SGE را می توان به صورت زیر توصیف کرد:

S G E = S G E (T, W e)

(15)

در بهینه‌سازی، از روش Gradient Descent [ 37 ] برای بهینه‌سازی این دو پارامتر استفاده می‌شود که به SGE اجازه می‌دهد به حداکثر محلی برسد. از این رو، ما قالب را به مدل دیفرانسیل برای نزول گرادیان، نشان داده شده در معادله (16) تغییر می دهیم.

\nabla S G E = [\partial S G E \partial T, \partial S G E \partial W e] \approx [S G E ( T , W e 0 ) - S G E ( T 0 , W e 0 ) T - T 0, S G E ( T 0 , W e ) - S G E ( T 0 , W e 0 ) W e - W e 0]

(16)

در مثال زیر، شکل 14 b دو گروه بهینه سازی شده از خطوط را نشان می دهد که لبه های نوارها را با دقت بیشتری نسبت به خطوط قبل از بهینه سازی پوشش می دهند، همانطور که در شکل 14 الف نشان داده شده است.

2.3.3. ناپیوستگی های تعمیر

در برخی موارد، یک گذرگاه گورخر ممکن است به دلیل پوشاندن اشیاء مانند اتومبیل، اتوبوس و عابران پیاده به چندین قسمت جدا شود. اتصال و الگوی تکراری اغلب برای رسیدگی به تعمیر یا ادغام تقاطع گورخر شکسته که با اصول زیر توجیه می شود استفاده می شود: (1) هر قسمت دارای پارامترهای هندسی یکسان یا مشابه است. و (2) نقاط مرکز راه راه بین دو قسمت باید به صورت هم خط باشند. از این اصول، ما می توانیم قوانین معنایی زیر را برای تعمیر و ادغام یک گذرگاه گورخر تعریف کنیم:

قانون 1: فاصله دو قسمت عبور گورخر باید کمتر از یک آستانه باشد.
قانون 2: هنگام اتصال نقاط مرکزی به یک خط، باقیمانده باید کوچکتر از یک آستانه باشد.
قانون 3: هنگام انتخاب دو نقطه مرکزی نوار $p$ و $q$ ، فاصله بین $p$ و $q$ باید مضربی جدایی ناپذیر از دوره تکرار باشد.

برای دو گذرگاه گورخری مجاور، اگر از شرایط ذکر شده در بالا پیروی کنند، می توانیم آنها را در یک گذرگاه گورخر ترکیب کنیم و پارامترهای گذرگاه گورخر جدید را مجدداً محاسبه کنیم.

3. بخش آزمایشات

برای آزمایش روش پیشنهادی، آزمایش از سه مجموعه داده با GSD مختلف استفاده می‌کند. اولین مجموعه داده های آزمون در پاریس، فرانسه با وضوح تقریباً 0.1 متر جمع آوری شد. مجموعه دوم داده های آزمایشی در داتونگ، چین با وضوح تقریباً 0.05 متر جمع آوری شد. مجموعه سوم داده های آزمون در نیویورک، ایالات متحده، با وضوح تقریباً 0.2 متر جمع آوری شد. آزمایش‌ها شامل دو بخش زیر است: استخراج تقاطع گورخر و بازسازی شکل هندسی.

3.1. استخراج متقاطع گورخر

JointBoost به عنوان طبقه بندی کننده برای استخراج تقاطع گورخر بر اساس ویژگی های بافت GLCM چند مقیاسی و گابور 2 بعدی استفاده می شود. علاوه بر این، ما نتایج روش پیشنهادی را با نتایج یک روش تطبیق الگو مقایسه می‌کنیم. ما عملکرد الگوریتم را با دو داده آزمایشی با استفاده از طبقه‌بندی‌کننده یکسان ارزیابی می‌کنیم. مجموعه داده های آموزشی شامل 50 نمونه تلاقی گورخر مثبت و 150 نمونه منفی است. ما همچنین از یک نمونه مثبت به عنوان الگو برای تشخیص تقاطع گورخر در روش تطبیق الگو با آستانه های مختلف استفاده می کنیم.

3.1.1. آزمایش I: تشخیص عبور از گورخر

12 تصویر در سه مجموعه داده از تقاطع های گورخر با شرایط مختلف، از جمله ویژگی هایی که گذرگاه های گورخر را پنهان می کند و همچنین تخریب رنگ وجود دارد. شکل 15 نتایج استخراج از تقاطع گورخر توسط JointBoost را نشان می دهد. در شکل 15 ، تمام گذرگاه های گورخر، علیرغم برخی اختلالات درون تصویر مانند تخریب رنگ (در دایره های زرد) و گذرگاه های سایه دار گورخر (در دایره های قرمز) شناسایی شده اند.

از این آزمایش‌ها متوجه می‌شویم که عملکرد JointBoost خوب است. طبقه‌بندی‌کننده JointBoost بر اساس نظریه‌های تحلیل آماری ساخته شده است که بسیاری از طبقه‌بندی‌کننده‌های ضعیف را برای تولید یک طبقه‌بندی قوی ترکیب می‌کند. هر یک از طبقه‌بندی‌کننده‌های ضعیف به ویژگی خاصی حساس هستند و از نظر آماری احتمال عبور یا پس‌زمینه بودن یک نمونه را تعریف می‌کنند. علاوه بر این، JointBoost توانایی انتخاب تنها ویژگی هایی را دارد که در طول طبقه بندی عملکرد خوبی دارند. JointBoost همچنین از نمونه‌های ناهماهنگ برای بهبود عملکرد استخراج ویژگی استفاده می‌کند، که می‌تواند به طبقه‌بندی کننده کمک کند تا اشیاء پس‌زمینه را با ظاهری مشابه با تقاطع‌های گورخری متمایز کند.

همانطور که در جدول 1 نشان داده شده است ، نتایج در سطح بلوک تصویر به جای سطح شی ارزیابی می شوند. تصاویر را به بلوک 25 × 25 (𝑝𝑖𝑥𝑒𝑙) تقسیم می کنیم و تعداد پیکسل های درست استخراج شده را می شماریم. میز 1تجزیه و تحلیل کمی نتایج استخراج این سه مجموعه داده است. در مجموعه داده I، به ترتیب 472، 439، 398، 143 پیکسل متعلق به گذرگاه های گورخر، 251، 68، 400، 845 در مجموعه داده II، و 352، 468، 395، 368 پیکسل در مجموعه داده III وجود دارد. بر اساس نتایج در مجموعه داده I، نرخ استخراج صحیح 90.3٪، 87.5٪، 94.2٪، 83.9٪، در مجموعه داده II 98.4٪، 91.2٪، 82.8٪، 69.3٪ و آنها 80.7٪، 83.8٪، 81.8٪ هستند. 88.9٪ در مجموعه داده III. درصدهای حذف حذف در مجموعه داده I 9.7٪، 12.5٪، 5.8٪، 16.1٪، در مجموعه داده II 1.6٪، 8.8٪، 17.25٪، 30.7٪ و در مجموعه داده III 19.3٪، 16.2٪، 18.2٪ است. ، 11.1٪.

3.1.2. اثربخشی ویژگی ها

روش استخراج به ویژگی‌های GLCM و ویژگی‌های گابور ۲ بعدی برای قضاوت طبقه‌بندی نهایی متکی است. برای بررسی سهم این دو ویژگی برای استخراج، نتایج اعتبارسنجی را با سه شرط زیر مقایسه می‌کنیم: (1) تنها با استفاده از ویژگی‌های GLCM. (2) تنها با استفاده از ویژگی های 2 بعدی گابور. (3) با استفاده از هر دو نوع ویژگی. ما آن شرایط را روی دو تصویر آزمایش کردیم تا سهم هر ویژگی را در استخراج نهایی ارزیابی کنیم.

در شکل 16 ، ستون سمت چپ نشان دهنده تصویر A شامل 11 گذرگاه گورخر، و ستون سمت راست نشان دهنده تصویر B شامل 5 گذرگاه گورخر است. ما عمداً تصاویری با تفاوت زیاد در آهنگ‌های رنگی انتخاب کردیم تا حساسیت تشخیص ویژگی‌ها را به تن تصویر آزمایش کنیم. تصویر A به طور کلی بسیار روشن تر از تصویر B است. ما طبقه بندی کننده JointBoost را برای هر تصویر با استفاده از روش تشخیص ویژگی GLCM و سپس با استفاده از روش تشخیص ویژگی 2 بعدی گابور آموزش دادیم. شکل 16 a,b نتایج استخراج شده را تنها با استفاده از ویژگی های GLCM نشان می دهد. شکل 16 c,d نتایج استخراج شده را تنها با استفاده از ویژگی های گابور 2 بعدی نشان می دهد. در مقایسه با عملکرد نتایج بر اساس ویژگی‌های گابور دو بعدی همانطور که در شکل 16 نشان داده شده استc،d، نتایج مبتنی بر ویژگی GLCM همانطور که در شکل 16 a,b نشان داده شده است، دقت کمتری دارند. با این حال، هنگامی که از هر دو ویژگی با هم استفاده می کنیم، همانطور که در شکل 16 e,f نشان داده شده است ، نتایج بهتری نسبت به هر کسی که بر اساس GLCM یا 2D Gabor است به دست می دهد.

همانطور که در شکل 16 e,f نشان داده شده است، الگوریتم می تواند با موفقیت برخی از قسمت های تقاطع گورخر را استخراج کند . برای ارائه اطلاعات دقیق از اثربخشی هر ویژگی، نتایج را با همان روش در بخش 3.1.1 ارزیابی کردیم . جدول 2تجزیه و تحلیل کمی از نتایج استخراج این ویژگی ها است. در تصویر A، 478 پیکسل متعلق به تقاطع گورخر، و 408 پیکسل در تصویر B وجود دارد. با استفاده از ویژگی های GLCM، 2D Gabor و ترکیبی از GLCM و 2D Gabor، نرخ استخراج صحیح در تصویر A 66.1٪، 70.5٪ است. و به ترتیب 77.8 درصد و در تصویر B به ترتیب 77.2 درصد، 87.4 درصد و 90.3 درصد هستند. درصد حذف حذف در تصویر A به ترتیب 33.9%، 29.5% و 22.2%، در تصویر B به ترتیب 23.0%، 12.6% و 9.7% می باشد. اگرچه GLCM در استخراج متقاطع گورخر مؤثرتر است، نتایج با در نظر گرفتن ویژگی‌های گابور 2 بعدی نیز بهبود می‌یابد.

3.2. بازسازی شکل هندسی

تصاویر آزمایشی حاوی اطلاعات تداخل قابل توجهی هستند که باعث ایجاد مشکل در بازسازی شکل هندسی می شود. برای ارزیابی استحکام روش ما، آن را تحت شرایط مختلف از جمله تصاویر حاوی گذرگاه گورخر پوشیده، تقاطع گورخر غیر مستطیلی، تخریب رنگ و تقاطع گورخر نیمه سایه دار آزمایش می کنیم.

3.2.1. گذرگاه گورخر که توسط اجسام پوشیده شده است

این احتمال وجود دارد که راه راه ها توسط عابران پیاده، اتومبیل ها یا اتوبوس ها پوشانده شود که مرزهای نوار را به هم می زند. پس از فرآیند باینریزه شدن تصویر، این اختلالات ایرادات هندسی کوچکی را ایجاد می کند که نظم راه راه ها را از بین می برد. در نتیجه، برخی از گذرگاه های گورخر به دو یا چند قسمت تقسیم می شوند. با این حال، مرز هر نوار همچنان می تواند بر اساس ساختار تکراری جهانی گذرگاه های گورخر بازیابی شود.

در شکل 17 ، گذرگاه های گورخری A، B و E نتایج بازسازی هستند که در آن گذرگاه های گورخر توسط اتوبوس، عابران پیاده و سایه ها پوشانده شده است. F نتیجه بازسازی یک تقاطع گورخر تمیز را نشان می دهد. برای گذرگاه های گورخر C و D که با اتوبوس از هم جدا شده اند. آنها را می توان بر اساس قوانین تعریف شده در بخش 2.3.3 به یک گذرگاه متصل کرد، با استفاده از اصل تکرارپذیری فضایی. با توجه به تصویر A که شامل دو تقاطع گورخر است، الگوریتم ما آنها را به عنوان دو تقاطع گورخری مستقل استخراج می کند و آنها را در یکی ادغام می کند زیرا بسیار نزدیک هستند و پارامترهای هندسی بسیار مشابهی دارند. این الگوریتم با موفقیت پارامترهای هندسی را تخمین زده و عبور گورخر E را بازسازی می کند، حتی اگر یکی از گوشه های آن در تصویر ظاهر نشود. الگوریتم در بازسازی تقاطع گورخر G ناموفق است زیرا مساحت G برای الگوریتم برای یافتن مرزهای صحیح بسیار کوچک است.

3.2.2. تقاطع گورخر لوزی

همانطور که در شکل 18 نشان داده شده است، برخی از گذرگاه های گورخر به دلیل جهت گیری جاده ها به شکل لوزی بازسازی شده اند . در الگوریتم ما، معادله (9) توانایی توصیف نوارهای مورب با پارامترها را دارد.

θ_{m}

θ_{p}

. چالش با تقاطع گورخرهای لوزی در تنظیم مناسب پارامترها نیست، بلکه در تعیین مرز صحیح به دلیل شیب تقاطع گورخر است.

3.2.3. تقاطع گورخر با سایه

هنگام در نظر گرفتن اثرات سایه ها، نتیجه دوتایی شدن تحت تأثیر قرار می گیرد که بر بازسازی تأثیر می گذارد. در مرحله پیش پردازش، تصویر را از فضای RGB به فضای HSV [ 38 ] تبدیل می کنیم و یک تبدیل کلاه بالایی [ 39 ] برای کاهش تأثیر سایه اعمال می کنیم. این بر اساس این تصور است که تصویری از یک گذرگاه گورخر باید لحن مشابهی داشته باشد. در مرحله بعد، روش Otsu [ 40 ] را برای انتخاب آستانه مناسب برای باینری سازی تصویر اعمال می کنیم. این مراحل پیش پردازش تضمین می کند که یک مرز پایدار برای بازسازی به دست می آید.

در شکل 19 ، (A) یک گذرگاه گورخر است که تا حدی توسط سایه یک چراغ خیابان پوشیده شده است. و (ب) و (ج) گذرگاه گورخرهایی هستند که نیم سایه دارند. علاوه بر این، ویژگی‌های راه راه سفید شبیه به شکل نوارهای متقاطع گورخر در انتهای (A) و (B) وجود دارد. روش ما بخش اصلی گذرگاه‌های گورخر را استخراج و بازسازی می‌کند، اما راه‌راه‌های انتهای دو تقاطع گورخر را استخراج و بازسازی می‌کند، زیرا نوارهای سفید از نظم تکراری گذرگاه‌های گورخر پیروی نمی‌کنند.

3.2.4. گذرگاه گورخر تار

در شرایطی که گذرگاه‌های گورخر به طور قابل‌توجهی تار هستند، الگوریتم پیشنهادی در فرآیند استخراج و بازسازی مشکلاتی دارد. ویژگی های محاسبه شده از تصاویر تار غیر قابل اعتماد هستند که منجر به شکست استخراج می شود. علاوه بر این، خطاهایی را در فرآیند تخمین پارامتر تقاطع گورخر برای باینری سازی تصویر معرفی می کند.

کشش سطح خاکستری در مرحله پیش پردازش می تواند تصویر را تا حدی بهبود بخشد. شکل 20 تصویر کمی تار و نتایج بازسازی مربوط به آن است. با بهره مندی از استراتژی تنظیم پارامتر جهانی ما، بازسازی تاری تصویر را جبران می کند. با این حال، برای گذرگاه های گورخری که به طور جدی تحت تأثیر قرار گرفته اند، الگوریتم ما شکست می خورد.

4. بحث و نتیجه گیری

در این مقاله، ما یک روش جدید پیشنهاد کرده‌ایم: (1) استخراج گذرگاه‌های گورخر از تصاویر هوایی با وضوح بالا بر اساس طبقه‌بندی کننده JointBoost و (2) بازسازی اشکال هندسی با استفاده از پارامترهای از پیش تعریف‌شده و ویژگی تکرارپذیری. در نهایت، آزمایش‌هایی با استفاده از چندین مثال برای تأیید روش‌شناسی پیشنهادی در این مقاله انجام می‌شود. از آزمایش‌ها، متوجه می‌شویم که الگوریتم JointBoost پیشنهادی و ویژگی‌های استخراج‌شده توسط فیلترهای GLCM و 2D Gabor برای استخراج گذرگاه‌های گورخر کافی هستند. در روش بازسازی شکل هندسی، یک روش برازش شکل جهانی بر اساس مدل پارامتر هندسی و اصل تکرارپذیری فضایی متناظر برای بازسازی شکل هندسی تقاطع گورخر بسیار موثر است.

در طول فرآیند استخراج، مقیاس همچنان یک چالش است. یک طبقه‌بندی‌کننده معمولاً به‌طور خاص برای تصاویر با وضوح‌های فضایی خاص به خوبی کار می‌کند. ویژگی‌های GLCM که ما استفاده می‌کنیم می‌توانند اثربخشی استخراج را بهبود بخشند، اما پیاده‌سازی طبقه‌بندی‌کننده آموزش‌دیده از تصویری با وضوح فضایی برای پردازش تصویری با وضوح دیگر دشوار است. اگر می‌خواهیم امکان‌سنجی طبقه‌بندی‌کننده را بهبود ببخشیم، باید ویژگی‌های کلیدی را پیدا کنیم که مستقل از مقیاس هستند، یا راه‌حلی پیدا کنیم که به‌طور تطبیقی پارامترها را با توجه به وضوح تصویر و اندازه مناسب پنجره برای محاسبه ویژگی‌ها تنظیم کند. اگرچه هر دو روش پیشنهادی بسیار چالش برانگیز هستند، مشکل به عنوان بخشی از کار آینده ما مورد بررسی قرار خواهد گرفت.

انواع مختلفی از نشانه گذاری زمین در جهان وجود دارد، حتی گذرگاه های گورخر نیز در مناطق مختلف اشکال مختلفی دارند. این کار کاربرد الگوریتم ما را محدود می کند. به عنوان مثال، الگوریتم ما برای تصاویر هوایی از سنگاپور، جایی که اکثر گذرگاه‌های گورخر مربعی و بدون نوارهای تکراری هستند، قابل استفاده نیست. با این حال، ما فکر می‌کنیم که طبقه‌بندی‌کننده JointBoost می‌تواند حتی برای انواع دیگر نشانه‌گذاری زمین، مانند جستجوی خودکار تصاویر برای محتوای خاص مانند هواپیماها و کشتی‌ها، مفید باشد. ما کار خود را برای بهبود تشخیص ویژگی و همچنین توسعه الگوریتم‌های برازش مناسب برای بسیاری از انواع علامت‌گذاری زمین گسترش خواهیم داد. در آینده، ما بر چگونگی کاهش وابستگی به تنظیم پارامترهای روش پیشنهادی تمرکز خواهیم کرد و آن را نه تنها در تصاویر با وضوح بالا هوایی در بسیاری از مناطق قابل استفاده خواهیم کرد.

منابع

شی، دبلیو. میائو، ز. Debayle, J. یک روش یکپارچه برای استخراج خط مرکزی جاده اصلی شهری از تصاویر سنجش از دور نوری. IEEE Trans. Geosci. Remote Sens. 2014 , 52 , 3359–3372. [ Google Scholar ] [ CrossRef ]
هینز، اس. Baumgartner, A. استخراج خودکار شبکه های جاده های شهری از تصاویر هوایی چند نمای. ISPRS J. Photogramm. Remote Sens. 2003 ، 58 ، 83-98. [ Google Scholar ] [ CrossRef ]
توماس، جی. دونیکیان، اس. انیمیشن انسان های مجازی در محیط های آگاه شهری. In Proceedings of the Computer Animation 2000, Philadelphia, PA, USA, 3-5 May 2000; صص 112-119.
نرزت، دبلیو. پومبرگر، جی. فرشا، ع. کلب، دی. مولر، آر. ویگاردت، جی. هورتنر، اچ. Lindinger, C. سیستم های ناوبری واقعیت افزوده. دانشگاه دسترسی به Inf. Soc. 2006 ، 4 ، 177-187. [ Google Scholar ] [ CrossRef ]
رد، ج. بنسرهیر، ع. تولمینت، جی. تقسیم‌بندی تصویر و تشخیص الگو برای تحلیل علامت‌گذاری جاده. IEEE Int. علائم الکترون صنعتی 2004 ، 1 ، 727-732. [ Google Scholar ]
رویر، ای. Lhuillier، M. دومه، م. لاوست، جی.-ام. محلی سازی par vision monoculaire pour la navigation autonome d’un robot mobile. در مجموعه مقالات کنگره فرانسوی AFRIF-AFIA de Reconnaissance des Formes et D’Intelligence Artificielle، تورها، فرانسه، 25-27 ژانویه 2006.
سیکلاشمیت، اس. هازلهوف، ا. کومرت، ا. رودر، م. الیاس، بی. برنز، ک. تشخیص گذرگاه عابر پیاده به عنوان بخشی از سیستم ایمنی عابر پیاده شهری. در مجموعه مقالات IEEE 2010 در سمپوزیوم وسایل نقلیه هوشمند (IV)، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 21 تا 24 ژوئن 2010. صص 840-844.
بنز، UC; هافمن، پی. ویلهاک، جی. لینگنفلدر، آی. Heynen، M. تجزیه و تحلیل فازی با وضوح چندگانه، شی گرا داده های سنجش از دور برای اطلاعات آماده GIS. ISPRS J. Photogramm. Remote Sens. 2004 ، 58 ، 239-258. [ Google Scholar ] [ CrossRef ]
فنگ، Q. لیو، جی. سنجش از دور پهپاد Gong، J. برای نقشه برداری پوشش گیاهی شهری با استفاده از تحلیل تصادفی جنگل و بافت. Remote Sens. 2015 ، 7 ، 1074–1094. [ Google Scholar ] [ CrossRef ]
گینزلر، سی. Hobi, M. تطبیق تصویر استریو در سراسر کشور برای به‌روزرسانی مدل‌های سطح دیجیتال در چارچوب فهرست فهرست جنگل‌های ملی سوئیس. Remote Sens. 2015 ، 7 ، 4343-4370. [ Google Scholar ] [ CrossRef ]
لیتلوف، جی. روزنباوم، دی. کورز، اف. مینبرگ، او. Reinartz، P. یک سیستم عملیاتی برای تخمین اطلاعات ترافیک جاده از تصاویر هوایی. Remote Sens. 2014 , 6 , 11315–11341. [ Google Scholar ] [ CrossRef ]
Qin, R. یک روش سلسله مراتبی مبتنی بر شی برای تشخیص تغییر با استفاده از تصاویر وسایل نقلیه هوایی بدون سرنشین. Remote Sens. 2014 , 6 , 7911–7932. [ Google Scholar ] [ CrossRef ]
تورنار، او. Paparoditis، N. یک رویکرد تصادفی هندسی مبتنی بر فرآیندهای نقطه مشخص شده برای تشخیص علامت جاده از تصاویر هوایی با وضوح بالا. ISPRS J. Photogramm. Remote Sens. 2009 , 64 , 621-631. [ Google Scholar ] [ CrossRef ]
Zhang, C. به روز رسانی پایگاه های اطلاعات جاده های نقشه برداری با تجزیه و تحلیل تصویر. Ph.D. Thesis, ETH-Zurich, Zürich, Switzerland, 2003. [ Google Scholar ]
جین، اچ. فنگ، ی. لی، ام. به سوی یک سیستم خودکار برای استخراج خط جاده در تصاویر هوایی در مقیاس بزرگ که با تجزیه و تحلیل تصویر سلسله مراتبی و فیلتر گابور در مناطق روستایی به دست آمده است. بین المللی J. Remote Sens. 2012 ، 33 ، 2747-2769. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
جین، اچ. فنگ، ی. Li، Z. استخراج خطوط جاده از تصاویر هوایی استریو با وضوح بالا بر اساس تقسیم بندی حداکثر احتمال و بهبود بافت. در مجموعه مقالات محاسبات تصویر دیجیتال: تکنیک ها و کاربردها، ملبورن، استرالیا، 1 تا 3 دسامبر 2009. ص 271-276.
جونز، جی پی؛ پالمر، لس آنجلس ارزیابی مدل فیلتر گابور دو بعدی میدان‌های پذیرنده ساده در قشر مخطط گربه. J. Neurophysiol. 1987 ، 58 ، 1233-1258. [ Google Scholar ] [ PubMed ]
بالتساویاس، EP; ژانگ، سی. Grün، A. به روز رسانی پایگاه داده های نقشه برداری جاده ها با تجزیه و تحلیل تصویر. در استخراج خودکار اشیاء ساخته شده توسط انسان از تصاویر هوایی و فضایی (III) . CRC Press: زوریخ، سوئیس، 2001. [ Google Scholar ]
سهیلیان، ب. پاپرودیتیس، ن. بولدو، دی. بازسازی سه‌بعدی علامت‌گذاری جاده از جفت‌های استریو کالیبره‌شده در سطح خیابان. ISPRS J. Photogramm. Remote Sens. 2010 , 65 , 347-359. [ Google Scholar ] [ CrossRef ]
تورنیر، او. پاپرودیتیس، ن. یونگ، اف. Cervelle, B. بازسازی علائم راه سه بعدی از چندین عکس کالیبره شده هوایی. در مجموعه مقالات کمیسیون ISPRS III PCV، بن، آلمان، 20-22 سپتامبر 2006.
تورنیر، او. سهیلیان، ب. Paparoditis، N. به سمت یک ارجاع جغرافیایی زیر دسیمتری سیستم‌های نقشه‌برداری متحرک زمینی در مناطق شهری: تطبیق تصاویر زمینی و هوایی با استفاده از علائم راه. در مجموعه مقالات کمیسیون ISPRS I Symposium، Marne-la-Vallée، فرانسه، 4-6 مه 2006.
تورالبا، ا. مورفی، KP; ویژگی های بصری اشتراک گذاری فریمن، WT برای تشخیص اشیاء چند کلاسه و چند نمای. IEEE Trans. الگوی مقعدی ماخ هوشمند 2007 ، 29 ، 854-869. [ Google Scholar ] [ CrossRef ] [ PubMed ]
هارالیک، آر.ام. شانموگام، ک. ویژگی های بافتی Dinstein، IH برای طبقه بندی تصویر. IEEE Trans. سیستم مرد سایبرن. 1973 ، 3 ، 610-621. [ Google Scholar ] [ CrossRef ]
بنکو، م. روش جدید Hudec، R. برای بافت های رنگی، استخراج بر اساس GLCM را مشخص می کند. رادیو مهندسی 2007 ، 16 ، 64-67. [ Google Scholar ]
روسلان، آر. Jamil, N. استخراج ویژگی بافت با استفاده از فیلترهای 2 بعدی گابور. در مجموعه مقالات سمپوزیوم IEEE در کاربردهای کامپیوتری و الکترونیک صنعتی (ISCAIE)، کوتا کینابالو، مالزی، 3 تا 4 دسامبر 2012. صص 173-178.
Tan, D. بهبود تصویر بر اساس فیلتر میانه تطبیقی و فیلتر والیس. در مجموعه مقالات چهارمین کنفرانس ملی مهندسی برق، الکترونیک و کامپیوتر، شیان، چین، 12 تا 13 دسامبر 2015. صص 767-772.
گادکاری، دی. تحلیل کیفیت تصویر با استفاده از GLCM. پایان نامه کارشناسی ارشد، دانشگاه مرکزی فلوریدا، اورلاندو، فلوریدا، ایالات متحده آمریکا، 2004. [ Google Scholar ]
Lindeberg, T. Scale-space theory: ابزاری اساسی برای تحلیل سازه ها در مقیاس های مختلف. J. Appl. آمار 1994 ، 21 ، 225-270. [ Google Scholar ] [ CrossRef ]
Lindeberg, T. تشخیص ویژگی با انتخاب مقیاس خودکار. بین المللی جی. کامپیوتر. Vis. 1998 ، 30 ، 79-116. [ Google Scholar ] [ CrossRef ]
Lowe، DG تشخیص شیء از ویژگی‌های تغییرناپذیر مقیاس محلی. در مجموعه مقالات هفتمین کنفرانس بین المللی IEEE در بینایی کامپیوتر، کرکیرا، یونان، 20-27 سپتامبر 1999. صص 1150–1157.
مار، دی. هیلدرث، ای. نظریه تشخیص لبه. Proc. R. Soc. لندن. B Biol. علمی 1980 ، 207 ، 187-217. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Lowe, DG ویژگی های تصویر متمایز از نقاط کلیدی تغییرناپذیر مقیاس. بین المللی جی. کامپیوتر. Vis. 2004 ، 60 ، 91-110. [ Google Scholar ] [ CrossRef ]
لی، TS نمایش تصویر با استفاده از موجک های 2 بعدی گابور. IEEE Trans. الگوی مقعدی ماخ هوشمند 1996 ، 18 ، 959-971. [ Google Scholar ]
ترنر، MR تمایز بافت توسط توابع گابور. Biol. سایبرن. 1986 ، 55 ، 71-82. [ Google Scholar ] [ PubMed ]
گوو، بی. هوانگ، ایکس. ژانگ، اف. Sohn, G. طبقه بندی داده های اسکن لیزری هوابرد با استفاده از Jointboost. ISPRS J. Photogramm. Remote Sens. 2015 ، 100 ، 71-83. [ Google Scholar ] [ CrossRef ]
استفان، ا. آتیتسوس، وی. یوان، Q. Sclaroff، S. کاهش طبقه بندی چند طبقه مبتنی بر Jointboost به جستجوی مجاورت. در مجموعه مقالات کنفرانس IEEE در مورد بینایی کامپیوتری و تشخیص الگو، میامی، FL، ایالات متحده آمریکا، 20-25 ژوئن 2009. صص 589-596.
فلچر، آر. پاول، ام جی روش نزول سریع همگرا برای به حداقل رساندن. محاسبه کنید. J. 1963 , 6 , 163-168. [ Google Scholar ] [ CrossRef ]
Manjunath، BS; اهم، J.-R. Vasudevan، VV; یامادا، الف. توصیفگرهای رنگ و بافت. IEEE Trans. سیستم مدار. فناوری ویدئو 2001 ، 11 ، 703-715. [ Google Scholar ] [ CrossRef ]
بای، ایکس. Zhou، F. تجزیه و تحلیل تبدیل جدید کلاه بالا و کاربرد برای تشخیص هدف کوچک کم نور مادون قرمز. تشخیص الگو 2010 ، 43 ، 2145-2156. [ Google Scholar ] [ CrossRef ]
Otsu، N. روش انتخاب آستانه از هیستوگرام های سطح خاکستری. Automatica 1975 ، 11 ، 23-27. [ Google Scholar ]

شکل 1. گردش کار روش پیشنهادی.

شکل 2. نمونه تصاویر تقاطع گورخر قبل و بعد از فیلتر والیس.

شکل 3. نتایج میانگین و انحراف معیار ویژگی کنتراست استخراج شده از 50 نمونه تقاطع گورخر (صلیب های قرمز) و 50 نمونه پس زمینه (صلیب های آبی) بر اساس تصاویر اصلی.

شکل 4. ( الف ) تصویر پس از بهبود. ( b – f ) تصویر با مقدار مطلق هر لایه DoG رنگ شده است که در محدوده 0-255 نرمال شده است.

شکل 5. نتایج میانگین و انحراف معیار ویژگی کنتراست استخراج شده از 50 نمونه تقاطع گورخر (صلیب های قرمز) و 50 نمونه پس زمینه (صلیب های آبی) بر اساس تصاویر فیلتر شده DoG در مقیاس های مختلف. ( الف ) میانگین ( G _1.5 – G _1.0 )؛ ( ب ) انحراف استاندارد ( G _1.5 – G _1.0 ). ( ج ) میانگین ( G _2.0 – G _1.5 ); ( د ) انحراف معیار ( G _2.0 – G _1.5 ).

شکل 6. تصاویر فیلتر شده گابور: ( الف ) تصویر پس از بهبود است و ( ب – د ) تصاویر فیلتر شده با فرکانس فیلترهای گابور دو بعدی به ترتیب با جهت 0.05، 0.08، 0.1 تنظیم شده است.

θ = 135 °

شکل 7. توزیع میانگین مشخصه استخراج شده توسط دو گروه از فیلترهای گابور. فرکانس فیلترهای مورد استفاده در ( a ) 0.1 است. در حالی که 0.2 اینچ ( b ) است .

شکل 8. نمونه ای از نتایج استخراج: ( الف ) نشانگر متقاطع نشان دهنده مرکز بلوک تصویر است که به عنوان یک تقاطع گورخر استخراج می شود و ( ب ) خطوط کلی از گذرگاه های گورخر.

شکل 9. مدل هندسی تقاطع گورخر.

شکل 10. نمونه ای از پیش پردازش تصویر. ( الف ) تصویر اصلی شیء عبور گورخر است. و ( ب ) تصویر از پیش پردازش شده است.

شکل 11. تشخیص خط مرزی. ( الف ) خطوط لبه عرض نوار شناسایی شده توسط HT را نشان می دهد. ( ب ) خطوط لبه طول نوار شناسایی شده توسط HT را نشان می دهد. ( ج ، د ) خطوط مرزی یک گذرگاه گورخر هستند.

شکل 12. تعیین الگوی تکراری عبور از گورخر. ( الف ) توزیع فرکانس در جهت اصلی تقاطع گورخر. ( ب ) خطوط موازی تولید شده نشان دهنده دوره مکانی.

شکل 13. ( الف ) شیب لبه ها در یک طرف نوار. ( ب ) گرادیان لبه ها در طرف مقابل نوار. و ( ج ) دو گروه از خطوط نصب شده در دو طرف نوارها.

شکل 14. ( الف ) دو گروه از خطوط لبه قبل از بهینه سازی. ( ب ) خطوط پس از بهینه سازی. و ( ج ) نمونه ای از نتیجه بازسازی.

شکل 15. نتایج استخراج سه مجموعه داده با روش پیشنهادی.

شکل 16. ( الف ، ب ) نتایج تحت شرایط 1 هستند. ( ج ، د ) نتایج تحت شرط 2 هستند. ( e , f ) نتایج تحت شرط 3 هستند.

شکل 17. نتایج بازسازی تقاطع گورخر در خطوط سبز.

شکل 18. نتایج بازسازی گذرگاه های گورخر لوزی.

شکل 19. بازسازی شکل هندسی تقاطع گورخر در سایه ها.

شکل 20. بازسازی گذرگاه گورخری تار.

جدول 1. نتایج استخراج سه مجموعه داده با روش پیشنهادی.

جدول 2. مقایسه نتایج استخراج تحت سه شرایط مختلف.

© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

درخواست مشاوره

09120049370

8 صبح تا 12 شب