تشخیص خودکار فرودگاه بر اساس تشخیص برجسته و اطلاعات معنایی

خلاصه

شناسایی موثر فرودگاه از تصاویر ماهواره ای و هوایی یک کار چالش برانگیز است. روش‌های سنتی عمدتاً بر استفاده از ویژگی‌های متعدد برای تشخیص باند و برخی نیز دانش فرودگاه‌ها را تطبیق می‌دهند، اما نتایج رضایت‌بخش نبوده و استفاده محدود است. روش جدیدی برای تشخیص فرودگاه ها از تصاویر نوری با وضوح بالا پیشنهاد شده است. این روش شامل تجزیه و تحلیل توزیع برجستگی و استفاده از طبقه بندی مبتنی بر قوانین فازی است. اول، تعدادی از تصاویر با و بدون فرودگاه در مقیاس‌های چندگانه تقسیم می‌شوند تا یک نقشه توزیع برجستگی به دست آید که به بهترین وجه تمایز برجستگی بین فرودگاه‌ها و سایر اشیاء را برجسته می‌کند. سپس بر اساس نتیجه تقسیم بندی و اطلاعات ساختاری فرودگاه ها، ما نتیجه تقسیم بندی را برای استخراج و نمایش اطلاعات معنایی هر تصویر از طریق مدل کیسه کلمات بصری (BOVW) تجزیه و تحلیل می کنیم. درجه همبستگی تصویر با مدل BOVW و محاسبه ابعاد فراکتال ترکیب می‌شود تا توصیف کامل‌تری از فرودگاه‌ها و انجام طبقه‌بندی اولیه انجام شود. در نهایت، ماشین بردار پشتیبانی (SVM) برای طبقه‌بندی دقیق برای طبقه‌بندی تصاویر باقی‌مانده استفاده می‌شود. آزمایش نشان می‌دهد که روش پیشنهادی به دقت 47/89 درصد و فراخوانی 67/90 درصد دست می‌یابد و نسبت به سایر روش‌های پیشرفته در دقت و یادآوری بهتر عمل می‌کند. درجه همبستگی تصویر با مدل BOVW و محاسبه ابعاد فراکتال ترکیب می‌شود تا توصیف کامل‌تری از فرودگاه‌ها و انجام طبقه‌بندی اولیه انجام شود. در نهایت، ماشین بردار پشتیبانی (SVM) برای طبقه‌بندی دقیق برای طبقه‌بندی تصاویر باقی‌مانده استفاده می‌شود. آزمایش نشان می‌دهد که روش پیشنهادی به دقت 47/89 درصد و فراخوانی 67/90 درصد دست می‌یابد و نسبت به سایر روش‌های پیشرفته در دقت و یادآوری بهتر عمل می‌کند. درجه همبستگی تصویر با مدل BOVW و محاسبه ابعاد فراکتال ترکیب می‌شود تا توصیف کامل‌تری از فرودگاه‌ها و انجام طبقه‌بندی اولیه انجام شود. در نهایت، ماشین بردار پشتیبانی (SVM) برای طبقه‌بندی دقیق برای طبقه‌بندی تصاویر باقی‌مانده استفاده می‌شود. آزمایش نشان می‌دهد که روش پیشنهادی به دقت 47/89 درصد و فراخوانی 67/90 درصد دست می‌یابد و نسبت به سایر روش‌های پیشرفته در دقت و یادآوری بهتر عمل می‌کند.

کلید واژه ها:

توزیع برجستگی ; BOVW ; اطلاعات معنایی ؛ طبقه بندی فازی

1. معرفی

پیشرفت های اخیر در کیفیت و در دسترس بودن تصاویر با وضوح بسیار بالا (VHR) چشم اندازهای جدیدی را در زمینه تشخیص خودکار اشیاء مکانی برای اهداف چندگانه باز کرده است [ 1 ، 2 ، 3 ]. در میان این اشیاء، فرودگاه ها به دلیل اهمیتی که در کاربردهای غیر نظامی و نظامی دارند، مورد توجه قابل توجهی قرار گرفته اند. بنابراین، یافتن کارآمد فرودگاه‌ها از تصاویر سنجش از دور VHR توجه بسیاری از محققین را به خود جلب کرده است و روش‌های زیادی برای تشخیص یا شناسایی فرودگاه پیشنهاد شده است [4 ، 5 ، 6 ، 7 ، 8 ، 9 ، 10 ، 11 .، 12 ].

روش‌های کنونی، با توجه به استفاده از اطلاعات معنایی، می‌توانند به دو رشته اصلی طبقه‌بندی شوند. یک رشته بر استفاده از ویژگی‌های چندگانه، از جمله ویژگی‌های خط [ 4 ، 5 ، 6 ]، یا ویژگی‌های بافت [ 7 ، 8 ، 9 ]، یا ویژگی‌های نقطه‌ای [ 10 ، 11 ] برای استخراج مستقیم باندها یا استخراج تکه‌ها برای استخراج تمرکز می‌کند. باند برای شناسایی فرودگاه این روش‌ها، در حالی که از داده‌های تصویربرداری VHR استفاده می‌کنند، تنها بر استخراج ویژگی‌هایی مانند ویژگی‌های خط، ویژگی‌های بافت یا ویژگی‌های نقطه‌ای تمرکز می‌کنند تا فقط بخشی از فرودگاه را شناسایی کنند، مانند باند فرودگاه، و دیگر موارد فرودگاه را در نظر نمی‌گیرند. ،بنابراین آنها قادر به استفاده از اطلاعات معنایی فرودگاه کامل برای دستیابی به عملکرد بهتر نیستند. رشته دیگر از ویژگی های متعدد و دانش فرودگاه ها برای کمک به شناسایی یا تفسیر فرودگاه ها استفاده می کند. مک کئون و همکاران [ 12 ] سیستمی به نام سیستمی برای تفسیر عکس فرودگاه ها با استفاده از MAPS (SPAM) معرفی کرد. این سیستم مبتنی بر دانش است و از پایگاه داده MAPS [ 13 ، 14 ] برای هماهنگی و کنترل تقسیم‌بندی تصویر و ارائه چندین ظرفیت، از جمله استفاده از محدودیت‌های فضایی، مدل‌های دوربین صریح، مدل‌های متریک مستقل از تصویر و نشانه‌های تصویری متعدد برای کمک استفاده می‌کند. معناشناسی را استخراج کنید و صحنه های فرودگاه را بر روی تصاویر VHR تفسیر کنید. ژائو و همکاران [ 15] یک روش محدودیت برجسته برای تشخیص فرودگاه در تصاویر هوایی با وضوح پایین پیشنهاد کرد. این روش از یک محدودیت مبتنی بر برجسته برای شناسایی مناطق احتمالی مورد علاقه (ROI) استفاده می کند و یک نسخه تصفیه شده از مدل معنایی محبوب مدل BOVW را برای تصمیم گیری در مورد اینکه آیا ROI یک فرودگاه است، تطبیق می دهد. این روش ها اطلاعات معنایی را برای بهبود تشخیص یا تفسیر فرودگاه تطبیق می دهند، اما دارای اشکالاتی هستند که استفاده از آنها را محدود می کند. اشکالات شامل محدودیت وضوح تصویر و وابستگی شدید به داده‌ها و اطلاعات خارجی، از جمله داده‌های مختصات ژئودتیکی و پارامترهای مدل دوربین است که به عنوان اطلاعات پیشینی عمل می‌کنند و اغلب برای تصاویر VHR برای استخراج معنای انتزاعی و جزئی در دسترس نیستند. در مجموع،

تشخیص کارآمد فرودگاه ها از روی تصاویر مستلزم درک، یادگیری و بیان اطلاعات معنایی است. اطلاعات معنایی می تواند به بهبود عملکرد تشخیص شی کمک کند. برای یک تصویر معین، صرف نظر از نوع، اطلاعات معنایی به معانی یک تصویر اشاره دارد. معانی یک تصویر را می توان به چهار سطح از پایین ترین سطح تا بالاترین سطح تقسیم کرد: انواع معنایی، ترکیب شیء، معنای انتزاعی و معناشناسی تفصیلی، طبق [ 16] .]. در تشخیص فرودگاه، انواع معنایی همه به تصاویر سنجش از راه دور ثابت می شوند. کاری که قرار است انجام شود استخراج و استفاده از معنای انتزاعی (اجزای تشکیل دهنده شی) و معنای دقیق (رابطه بین جزء، یعنی توصیف دقیق تصویر) برای تصمیم گیری در مورد ترکیب شی (که آیا نوع شی در تصویر فرودگاه است یا خیر). با این حال، استخراج و استفاده از معناشناسی انتزاعی و معناشناسی تفصیلی وظایف چالش برانگیزی است زیرا بین ویژگی‌های سطح پایین و روابط بین مؤلفه‌ها (یعنی معناشناسی تفصیلی) «شکاف‌های معنایی» وجود دارد، و در حالی که از آن زمان تاکنون تحقیقاتی برای رفع این شکاف انجام شده است. در پایان قرن 20 [ 17 ]، هنوز یک موضوع چالش برانگیز باقی مانده است [ 18 ، 19]، 20 ].

در این مقاله، یک روش مبتنی بر محتوا برای شناسایی و بازیابی فرودگاه ها از تصاویر سنجش از دور VHR پیشنهاد شده است. روش پیشنهادی تصاویر معنایی و VHR را ترکیب می کند و تجزیه و تحلیل مبتنی بر تصویر را از اطلاعات ساختاری فرودگاه ها تطبیق می دهد، که در بخش 2.2 بیشتر مورد بحث قرار خواهد گرفت، و همچنین استفاده از ویژگی هایی برای استخراج اطلاعات معنایی برای تشخیص فرودگاه ها از تصاویر سنجش از دور VHR . این روش برای تصاویر VHR مناسب است و نیازی به وابستگی شدید به داده ها یا اطلاعات خارجی ندارد. این مبتنی بر یادگیری ویژگی های تصویر VHR برای استخراج معنایی برای بازنمایی و تشخیص بهتر فرودگاه ها است.

طرح کلی این مقاله به شرح زیر است. بخش 1 پیشینه تحقیق را معرفی می کند. بخش 2 جزئیات روش پیشنهادی را معرفی می کند. بخش 3 آزمایش را معرفی می کند و نتیجه را با روش های رقابتی مقایسه می کند. بخش 4 در مورد کارایی روش های پیشنهادی نتیجه گیری می کند و طرحی را برای تحقیقات آتی ارائه می دهد.

2. روش پیشنهادی

روش پیشنهادی مبتنی بر استفاده از تصاویر سنجش از دور VHR است. از تشخیص برجسته بودن برای بدست آوردن بهترین تقسیم بندی برای توصیف اطلاعات ساختاری فرودگاه استفاده می کند. مدل BOVW و نتیجه تقسیم‌بندی برای کمک به توصیف فرودگاه از ویژگی‌ها ترکیب شده‌اند. درجه همبستگی تصویر با مدل BOVW و تجزیه و تحلیل ابعاد فراکتال برای استخراج ترکیب شی تحت قوانین فازی برای طبقه‌بندی اولیه ترکیب می‌شود. SVM برای طبقه بندی دقیق استفاده می شود. روش کلی روش پیشنهادی در شکل 1 نشان داده شده است .

2.1. تقسیم بندی برای تشخیص برجستگی

تشخیص برجستگی به شناسایی مناطق برجسته در تصویر کمک می کند. نتیجه تشخیص برجسته بودن به بسیاری از زمینه های دیگر مانند بینایی کامپیوتری و سنجش از دور سود می رساند. برای یک صحنه در تصویر داده شده، نوع اشیاء تشکیل دهنده صحنه و رابطه فضایی-زمینه ای بین صحنه ها بخش مهمی از معناشناسی انتزاعی و معناشناسی تفصیلی طبق تعریف در [16] است .]. اشیاء موجود در تصویر یک فرودگاه را می توان به طور خلاصه به باند، ترمینال ها، آسفالت ها و سایر لوازم جانبی طبقه بندی کرد. این اشیاء در مقیاس سطح وصله هستند، به عنوان مثال، اندازه آنها در تصویر از پیکسل بیشتر است، اما همچنان از کل تصویر کوچکتر هستند و از نظر تعداد، اندازه و سایر ویژگی های سطح پایین متفاوت هستند. و ممکن است با هم مخلوط شوند، اما سازگاری آنها با توزیع برجسته نسبتاً متمایز از سایر اشیا یا صحنه ها در تصاویر VHR یکنواخت است. با توجه به [ 21]، سه رشته اصلی برای تعریف برجستگی وجود دارد: نقاط علاقه، برجستگی ویژه کلاس و برجستگی عمومی. در میان این سه روش، برجستگی ویژه کلاس به بهترین شکل تمایز یک کلاس خاص از اشیاء را از دیگران انجام می دهد. با توجه به پیچیدگی و هیبریداسیون بین فرودگاه ها و سایر اشیاء، روش های تشخیص برجستگی باید بر چنین تفاوتی با سایر اشیا و صحنه ها در قالب تفاوت در توزیع برجستگی تأکید کنند. در حال حاضر، بسیاری از روش‌های پیشرفته تشخیص برجسته بودن به برجستگی عمومی تعلق دارند و عمدتاً برای تشخیص هدف از فاصله نزدیک یا تشخیص هدف ساده استفاده می‌شوند [ 22 ، 23 ، 24]]. در این مطالعه، ما بر روی تشخیص برجسته بودن کلاس خاص تمرکز می کنیم. ابتدا، تصاویر نمونه در دو مجموعه، یعنی یکی با فرودگاه و دیگری بدون فرودگاه، گروه بندی می شوند. سپس، هر تصویر به تکه‌هایی تقسیم می‌شود، و اندازه‌های متعددی از تکه‌های تقسیم‌بندی برای استخراج تقسیم‌بندی‌های مختلف برای هر تصویر استفاده می‌شود. در مرحله بعد، برای هر تصویر و هر نتیجه تقسیم بندی، یک روش تشخیص برجسته را از طریق جاسازی مشترک نشانه های فضایی و رنگی اعمال می کنیم [ 25]] برای تشخیص بهترین مقیاس تقسیم بندی که به بهترین وجه تفاوت های برجسته بین فرودگاه ها و سایر اشیاء را برجسته می کند. ما روش تشخیص برجسته بودن را از سطح پیکسل به سطح پچ تطبیق می دهیم. هر وصله به‌عنوان یک پیکسل در نظر گرفته می‌شود و ما برجستگی مبتنی بر محدودیت فضایی، برجستگی دو برابری رنگ و برجستگی مبتنی بر توزیع شباهت را برای استخراج مقادیر برجسته برای هر وصله ترکیب می‌کنیم. در نهایت، برای هر تصویر در دو مجموعه، و برای هر مقیاس، مقادیر برجسته وصله‌ها رتبه‌بندی می‌شوند. تعداد وصله های تصویر برجسته به صورت زیر تنظیم می شود:

نتومتر=⌈م×م/2⌉

(1)

که در آن Num تعداد وصله های برجسته و M پارامتری است که نحوه اعمال تقسیم بندی را تعیین می کند.

برای یک مقدار M ، یک تصویر به تکه های تقسیم بندی M × M با همان اندازه تقسیم می شود. برای همه تصاویر، ما می‌توانیم شمارش کنیم که هر وصله تقسیم‌بندی چند بار در بین وصله‌های برجسته رتبه‌بندی می‌شود و نقشه‌های توزیع برجسته M × M را برای هر مجموعه ایجاد می‌کنیم. شدت هر پیکسل در نقشه توزیع برجستگی برابر است با زمان های ظاهر شدن در بین تکه های برجسته پچ مربوطه.

مقادیر مختلف M منجر به تقسیم بندی های مختلف و نقشه های توزیع برجسته می شود. این نقشه ها متفاوت هستند و تفاوت بین فرکانس وصله های آنها می تواند برجسته باشد. در این تحقیق از معادلات زیر برای ارزیابی عملکرد تقسیم بندی سطوح مختلف استفاده می کنیم:

آD1(م)=|مآایکساس1–ممنnاس1|

(2)

آD2(م)=|مآایکساس2–ممنnاس2|

(3)

اسآ(م)=آD1(م)/آD2(م)

(4)

که در آن AD1(M) قدر مطلق تفاوت بین MaxS1 و MinS1 است . MaxS1 و MinS1 به ترتیب حداکثر و حداقل مجموع هر ردیف در نقشه توزیع برجسته M × M مجموعه تصاویر با فرودگاه هستند. AD2(M) قدر مطلق تفاوت بین MaxS2 و MinS2 است . MaxS2 و MinS2 به ترتیب حداکثر و حداقل مجموع هر ردیف در نقشه توزیع برجسته M × M مجموعه تصاویر با اشیاء دیگر هستند. و Sa(M) نسبت استAD1 (M) تا AD2 (M) . در اینجا، Sa(M) بزرگتر نشان دهنده عملکرد بهتر در برجسته کردن تفاوت توزیع برجستگی بین دو مجموعه است. رابطه بین متغیر M و Sa(M) در شکل 2 نشان داده شده است . هر مجموعه آزمایشی شامل 50 تصویر است.

شکل 2 نشان می دهد که وقتی متغیر مقیاس M به عنوان 6 تنظیم شود، تقسیم بندی بهترین عملکرد را نشان می دهد. با این حال، زمانی که متغیر مقیاس M بالای 9 تنظیم شود، نقشه های توزیع برجسته دو مجموعه یکنواخت می شوند. بنابراین، M به عنوان 6 برای به دست آوردن بهترین عملکرد تنظیم شده است.

2.2. استخراج اطلاعات معنایی

تصاویر نمونه برای استخراج اطلاعات معنایی یک فرودگاه برای راهنمایی تشخیص فرودگاه ها در آزمایش تصاویر استفاده می شود. برای صحنه‌های پیچیده، مانند فرودگاه‌ها، تکه‌های برجسته می‌توانند نماینده‌ترین باشند، در حالی که دیگر اشیاء و پس‌زمینه‌های غیر برجسته نیز می‌توانند با صحنه‌های داده شده مطابقت داشته باشند [ 26 ]. بنابراین، پس از تقسیم‌بندی تصاویر نمونه با فرودگاه‌ها، وصله‌های موجود در همان ردیف را در شش وصله اصلی برای هر تصویر ترکیب می‌کنیم. سپس به تحلیل وصله های اصلی می پردازیم.

فرودگاه ترکیبی از اجزای نسبتاً ساده است، از جمله باند فرودگاه، ترمینال، آسفالت و سایر لوازم جانبی. آنها اجزای فرودگاه (معناشناسی انتزاعی) هستند و رابطه فضایی خاصی دارند [ 27 ]. نتیجه تقسیم‌بندی می‌تواند رابطه فضایی آن‌ها را توصیف کند، که بخشی از معناشناسی تفصیلی است. شکل 3 نتیجه بخش‌بندی فرودگاه‌هایی را نشان می‌دهد که دارای باند در یک طرف ترمینال هستند، و شکل 4 نتیجه تقسیم‌بندی فرودگاه‌هایی را نشان می‌دهد که باند فرودگاه‌هایی در بیش از یک طرف ترمینال دارند. شش تکه اصلی از 1 تا 6 علامت گذاری شده اند.

از شکل 3 و شکل 4 می بینیم که در Major Patch 1 و Major Patch 2، ترمینال ها و آسفالت ها با هم ظاهر می شوند، در حالی که باند و سایر اشیاء نیز زمانی ظاهر می شوند که فرودگاه دارای باند در بیش از یک طرف ترمینال باشد. همچنین می توانیم از شکل 3 و شکل 4 نتیجه بگیریم که در Major Patch 3 و Major Patch 4، آسفالت ها، پایانه ها و باند فرودگاه ها همراه با اشیاء دیگر ظاهر می شوند. علاوه بر این، می توان آن را از شکل 3 و شکل 4 مشاهده کردکه در Major Patch 5 و Major Patch 6، باندها جزء اصلی هستند، در حالی که لوازم جانبی دیگر نیز ظاهر می شوند. به طور کلی، در حالی که اجزای فرودگاه ها با یکدیگر ترکیب می شوند، قوانین توزیع فضایی خاصی دارند و زمانی که تصویر قطعه بندی می شود، این قوانین آشکار می شوند. این شش وصله اصلی شامل بخشی از صحنه فرودگاه است و ما می‌توانیم با توصیف آن‌ها توصیف کاملی از صحنه فرودگاه داشته باشیم. بر اساس تجزیه و تحلیل وصله های اصلی، می توانیم اطلاعات معنایی را برای توصیف بهتر فرودگاه استخراج کنیم. در این مقاله، از مدل BOVW برای توصیف ویژگی‌های وصله‌های اصلی برای کمک به استخراج و بیان اطلاعات معنایی استفاده می‌شود.

مدل BOVW یک روش موثر و سنتی برای نمایش اطلاعات معنایی اشیا است [ 28 ، 29 ]. مدل BOVW برای اولین بار برای تجزیه و تحلیل متن معرفی شد [ 30 ] و به زودی برای طبقه بندی و بازیابی تصاویر مورد استفاده قرار گرفت. برای کمک به استخراج، تجزیه و تحلیل و بیان اطلاعات معنایی، نیاز به استخراج و بازآرایی ویژگی های اولیه به “کلمات” بصری دارد. هنگام استفاده از BOVW، صحنه تصویر به عنوان مجموعه ای از “کلمات” بصری در نظر گرفته می شود. در این مقاله، با توجه به تغییر در وضوح فضایی، روشنایی و چرخش، ما تبدیل ویژگی ثابت مقیاس قوی (SIFT) [ 31] را استخراج می کنیم.] برای مدل BOVW و ایجاد 6 فرهنگ لغت مربوطه برای رمزگذاری ویژگی های SIFT.

2.3. روش مبتنی بر قانون فازی برای طبقه بندی مقدماتی

هنگامی که تعداد “کلمات” بصری بسیار زیاد است، مدل BOVW با این اشکال مواجه می شود که نمی تواند به طور موثر ویژگی های سطح پایین را رمزگذاری کند [32]، که توانایی آن را برای بیان ترکیب شی (چه شی در مورد داده شده است) محدود می کند. تصویر) به طور کامل و دقیق. از زمانی که مدل BOVW پیشنهاد شد، مطالعاتی بر روی بهبود مدل BOVW برای یافتن و بیان دقیق ترکیب شی در یک تصویر انجام شده است. بسیاری از روش‌ها فرض می‌کنند که مدل BOVW دارای ترکیب شی است که مستقیماً در توزیع آماری «کلمات» بصری بیان شده است [ 33 ، 34]. این روش‌ها بر یک فرض آماری قبلی تکیه می‌کنند و فقط برای تصویربرداری از فاصله نزدیک، مانند تصویربرداری پزشکی، عملی هستند. طبقه بندی قاعده فازی یک رویکرد جدید و موثر برای بیان ترکیب شی ارائه می دهد.

در دهه های اخیر، طبقه بندی قوانین فازی کانون توجه قابل توجه محققان در سراسر جهان بوده است [ 35 ، 36 ، 37 ]. طبقه بندی قانون فازی با توانایی آن در مقابله با ناقص بودن دانش مشخص می شود، که نشان می دهد این روش قادر به استخراج اطلاعات معنایی بالقوه از صحنه های مختلف در تصاویر VHR است. برای اهداف مختلف، انواع مختلفی از دانش و قوانین انتخاب می شود. در میان این نوع دانش و قواعد، درجه همبستگی تصویر به دلیل کارایی آن در استخراج ترکیب شی از ویژگی ها برجسته است [ 38] .]. بنابراین، درجه همبستگی تصویر را انتخاب می کنیم و از کلمات بصری تولید شده برای ساخت طبقه بندی فازی برای طبقه بندی اولیه استفاده می کنیم.

ابتدا تصاویر نمونه را به دو گروه تقسیم می کنیم، یعنی گروه 1 با فرودگاه ها و گروه 2 بدون فرودگاه، و میانگین فهرست کلمات Ave1 از گروه 1 را محاسبه می کنیم. در مورد گروه 2، زیرا اشیاء غیر فرودگاهی آنقدر پیچیده هستند که نمی توان با آنها بیان کرد. یک فهرست کلمات متوسط، یک روش محاسبه ابعاد فراکتالی بهبود یافته [ 39 ] برای بدست آوردن ابعاد فرکتالی تخمینی هر تصویر با اشیاء دیگر اقتباس شده است. روش محاسبه ابعاد فراکتال بهبود یافته مبتنی بر استراتژی های شمارش جعبه است و تصویر را به عنوان یک سطح پیوسته سه بعدی در نظر می گیرد. رویه های آن را می توان به صورت زیر خلاصه کرد:

تصویر را به بلوک هایی با اندازه s×s با دو بلوک مجاور که در پیکسل های مرزی همپوشانی دارند، تقسیم کنید.
ستونی از کادرها را که با پیکسل شروع می شود با حداقل سطح خاکستری در بلوک اختصاص دهید.
برای اندازه‌های مختلف جعبه‌ها، Ns را محاسبه کنید، تعداد کل جعبه‌هایی که کل سطح تصویر را پوشش می‌دهند.
برای محاسبه بعد فراکتال، برازش خطی حداقل مربعات log(Ns) در مقابل log(s – 1) را رسم کنید.
پس از محاسبه بعد فراکتال، میانگین C فازی برای تقسیم بیشتر گروه 2 به چندین گروه کوچکتر استفاده می شود. برای ارزیابی طبقه بندی، از شاخص Xie-Beni [ 40 ] برای تعیین تعداد کلاس ها استفاده می کنیم. شاخص Xie-Beni پارتیشن های C فازی فشرده و مجزا را مشخص می کند و شاخص Xie-Beni کوچکتر نشان دهنده طبقه بندی بهتر است. شکل 5 عملکرد تعداد کلاس های مختلف را نشان می دهد.

از شکل 5 ، می توان نتیجه گرفت که وقتی عدد کلاس 5 باشد، شاخص Xie-Beni کوچکترین است و زمانی که عدد کلاس از 20 بیشتر شود، شاخص Xie-Beni بزرگتر از 1 است. بنابراین، گروه 2 را به دو دسته تقسیم می کنیم. 5 کلاس و ایجاد لیست کلمات متوسط مربوطه. سپس فاصله اقلیدسی از فهرست کلمات هر تصویر تا دو فهرست واژه میانگین به صورت زیر محاسبه می شود:

Eدمن(j، ک)=|آvهک–worدلمنستی(j،من)|من=1،2،3،4،5،6j=1،2،…،nک=1،2،3،4،5،6

(5)

که در آن wordlist(ji) فهرست واژه های تصویر j در گروه i و Edi(jk) فاصله اقلیدسی بین فهرست واژه های تصویر j در گروه i و Avek است .

سپس درجات رابطه هر تصویر را با گروه خود و گروه دیگر با استفاده از معادلات زیر محاسبه می کنیم:

آرمن(j،ک)=1–Eدمن(j، ک)∑6ک=1Eدمن(j، ک)،من=1،2،3،4،5،6j=1،2،…،nک=1،2،3،4،5،6

(6)

که در آن Ri(j, k) درجه همبستگی تصویر j در گروه i با گروه k است .

در نهایت مقدار متوسط درجات رابطه ای گروه 1 و آستانه استفاده بیشتر را به صورت زیر محاسبه می کنیم:

f1=∑نUمgroتوپ 1من=1آر1(من،1)نUمgroتوپ 1

(7)

تیاچ1=2∑نUمgroتوپ 1من=1[f1–آر1(من،1)]2نUمgroتوپ 1

(8)

که در آن TH1 آستانه گروه 1 است، NUM _گروه₁ تعداد تصاویر در گروه 1 و f1 میانگین درجه همبستگی تصویر گروه 1 است.

با توجه به f1 و TH1 ، طبقه‌بندی فازی می‌تواند برای شروع طبقه‌بندی اولیه ساخته شود. تصویر آزمایشی در جهت عقربه‌های ساعت به 0 درجه، 90 درجه، 180 درجه و 270 درجه چرخانده می‌شود تا آن را بخش‌بندی کرده و فهرست‌های کلمات مربوطه را ایجاد کند. سپس برای هر جهت، فاصله اقلیدسی و درجه همبستگی هر تصویر آزمایشی تولید می شود. با توجه به اینکه جسم روی تصویر آزمایشی ناشناخته است، فرض می کنیم که یک فرودگاه روی تصویر آزمایشی وجود دارد تا متغیر هر جهت را از طریق معادله زیر بدست آوریم:

D11=|آر1(من،1)–f1|

(9)

که در آن D ₁₁ متغیر است.

برای یک جهت، اگر D ₁₁ کوچکتر از TH1 باشد ، این جهت شامل یک فرودگاه در نظر گرفته می شود. اگر D ₁₁ بزرگتر از TH1 باشد ، این جهت حاوی اجسام دیگر در نظر گرفته می شود. اگر هر چهار جهت دارای D ₁₁ کوچکتر از TH1 باشند ، آنگاه تصویر آزمایشی به عنوان تصویری که حاوی فرودگاه است طبقه بندی می شود . اگر هر چهار جهت دارای D ₁₁ s بزرگتر از TH1 باشند، سپس تصویر آزمایشی به عنوان تصویری که شامل اشیاء دیگر است طبقه بندی می شود. در غیر این صورت، تصویر تست طبقه بندی نمی شود و برای طبقه بندی دقیق باقی می ماند. روش کامل در زیر نشان داده شده است ( شکل 6 ).

2.4. طبقه بندی تفصیلی

صحنه هایی با فرودگاه ها و صحنه هایی با اشیاء دیگر پیچیده هستند. در این مورد، فرودگاه ها ممکن است با سایر اشیاء غیر فرودگاهی مخلوط شوند. به این ترتیب، روش های طبقه بندی فازی قادر به یافتن تنها بخشی از تصاویر با فرودگاه ها هستند. بنابراین، انجام یک طبقه بندی دوم با در نظر گرفتن چندین جنبه و ارائه یک نتیجه طبقه بندی قطعی ضروری است. در این مقاله، ما از SVM در انجام این طبقه‌بندی استفاده می‌کنیم و این طبقه‌بندی به‌عنوان «طبقه‌بندی تفصیلی» تعریف می‌شود، زیرا این طبقه‌بندی یک نتیجه طبقه‌بندی قطعی برای تصویر ارائه می‌دهد که با طبقه‌بندی اولیه قابل طبقه‌بندی نیست. چهار فهرست واژه از جهت های مربوط به هر تصویر نمونه با فرودگاه ها به عنوان نمونه های مثبت برای افزایش پایداری چرخشی تنظیم شده است. در حالی که فهرست کلمات سایر تصاویر نمونه به عنوان نمونه های منفی تنظیم شده است. ما از داده های نمونه برداری برای تولید یک طبقه بندی کننده و استفاده از آن برای طبقه بندی دقیق استفاده می کنیم. برای هر تصویر آزمایشی، اگر دو یا بیشتر از چهار فهرست واژه آن به عنوان دارای فرودگاه طبقه‌بندی شود، آن تصویر حاوی یک فرودگاه در نظر گرفته می‌شود. در غیر این صورت، تصویر حاوی اشیاء دیگری است.

3. آزمایش و تجزیه و تحلیل

3.1. مقایسه و تجزیه و تحلیل بین روش پیشنهادی و سایر روشها

ما از تصاویر با و بدون فرودگاه از Google Earth و Tianditu استفاده کردیم. ما 150 تصویر با فرودگاه ها را از Google Earth جمع آوری کردیم. این فرودگاه ها برای کاربری غیرنظامی هستند و در استانداردهای ساخت و ساز متفاوت و در مقیاس ها و محدوده های متعدد هستند. فرودگاه های موجود در تصاویر در نقاط مختلف جهان از جمله خاور دور، خاورمیانه، اروپا و آمریکای شمالی قرار دارند. ما همچنین به طور تصادفی 250 تصویر حاوی صحنه‌های مختلف مانند بندرگاه‌ها، آب‌ها، مناطق مسکونی، زمین‌های کشاورزی، جنگل‌ها و زمین‌های لخت را از Google Earth و Tianditu در نقاط مختلف جهان به‌دست آوردیم. رزولوشن فضایی از 1 متر تا 4 متر متغیر است. ما 75 تصویر با فرودگاه و 100 تصویر بدون فرودگاه را برای ساخت طبقه‌بندی‌کننده و بقیه تصاویر را برای آزمایش و ارزیابی تنظیم کردیم. شکل 7 وشکل 8 نمونه هایی از تصاویر مورد استفاده در آزمایش را نشان می دهد.

در آزمایش، چندین روش پیشرفته برای مقایسه انتخاب شده‌اند. آنها عبارتند از BOVW، روش تحلیل معنایی نهفته احتمالی (PLSA) [ 41 ]، روش C فازی فراکتال اقتباس شده از [ 42 ] و روش‌های تشخیص سنتی مبتنی بر تطبیق تصویر از طریق SIFT و ویژگی‌های قوی سریع (SURF) [ 43 ] .

برای ارزیابی عملکرد روش پیشنهادی در تشخیص فرودگاه‌ها و مقایسه آن با سایر روش‌های قبلی، ابتدا از دقت، یادآوری و اندازه‌گیری F که با P، R و F _{β نشان داده می‌شود، استفاده می‌کنیم.}P، R و F _β به شرح زیر است:

پ=تیپتیپ+افپ

(10)

آر=تیپتیپ+افن

(11)

افβ=(1+β2)پ×آرβ2×پ+آر

(12)

که در آن TP تعداد تصاویری است که به درستی به عنوان دارای فرودگاه طبقه بندی شده اند، FP تعداد تصاویری است که به اشتباه به عنوان دارای فرودگاه طبقه بندی شده اند، FN تعداد تصاویری است که به اشتباه به عنوان دارای اشیاء دیگر طبقه بندی شده اند و β a یک عدد واقعی غیر منفی است که ارائه می دهد. به عنوان شاخصی برای اهمیت نسبی دقت و یادآوری. یادآوری بالا به این معنی است که یک روش بیشتر اهداف را برمی گرداند، در حالی که دقت بالا به این معنی است که یک روش به طور قابل ملاحظه ای اهداف بیشتری را نسبت به سایر اشیاء غیر مرتبط برمی گرداند. F-measure میانگین هارمونیک دقت و یادآوری است. وزن‌های β بزرگ‌تر ، بیشتر از دقت را به یاد می‌آورند، در حالی که یک β کوچک‌تربیشتر بر دقت تاکید می کند تا یادآوری. در این برنامه، دقت بالا و فراخوانی بالا هر دو مورد نیاز است. بنابراین، باید دقت و یادآوری را به همان اندازه مهم در نظر بگیریم و β = 1 را انتخاب کنیم.

در آزمایش، با توجه به میزان و پیچیدگی تصویر، مراحل لازم برای هر روش تطبیق داده شده است.

برای روش تطبیق SIFT و SURF، اجماع نمونه تصادفی (RANSAC) برای اصلاح نقاط کلیدی تطبیق اعمال می‌شود.

برای روش میانگین C فازی فراکتال و روش PLSA، اندازه گیری F به عنوان ارزیابی برای انتخاب تعداد کلاس هایی که منجر به بزرگترین اندازه گیری F برای این دو روش می شود، انتخاب می شود. شکل 9 تأثیر تعداد کلاس ها را بر اندازه گیری F روش میانگین C فازی فراکتال نشان می دهد و شکل 10 تأثیر تعداد کلاس ها را بر اندازه گیری F روش PLSA نشان می دهد.

از شکل 9 می‌بینیم که وقتی تعداد کلاس‌ها برابر با دو باشد، روش C فازی فراکتال بزرگترین اندازه‌گیری F را دریافت می‌کند و زمانی که تعداد کلاس‌ها از 10 بیشتر شود، اندازه F زیر 0.4 است. همچنین می‌توانیم از شکل 10 مشاهده کنیم که وقتی تعداد کلاس‌ها برابر با دو باشد، روش PLSA بزرگترین F-Measure را دریافت می‌کند و زمانی که تعداد کلاس‌ها از دو بیشتر شود، F-measure زیر 0.5 است. بنابراین، تعداد کلاس‌ها را برای هر دو روش C فازی فراکتال و روش PLSA دو دسته انتخاب می‌کنیم.

برای روش BOVW و روش پیشنهادی ما، اندازه گیری F به عنوان ارزیابی برای انتخاب تعداد “کلمات” بصری انتخاب می شود که می تواند به بزرگترین اندازه گیری F برای این دو روش منجر شود. شکل 11 تأثیر تعداد «کلمات» بصری را بر اندازه گیری F روش BOVW نشان می دهد و شکل 12 تأثیر تعداد «کلمات» دیداری هر پچ اصلی را بر اندازه گیری F روش پیشنهادی ما نشان می دهد. .

از شکل 11 می‌توان دریافت که برای روش BOVW، زمانی که تعداد «کلمات» دیداری به 700 می‌رسد، اندازه‌گیری F به اوج می‌رسد و زمانی که تعداد «کلمات» دیداری افزایش می‌یابد، اندازه‌گیری F شروع به ثابت ماندن می‌کند. . همچنین می‌توانیم از شکل 12 نتیجه بگیریم که وقتی تعداد «کلمات» بصری برای هر وصله اصلی به 100 برسد، روش پیشنهادی ما بزرگترین اندازه‌گیری F را دریافت می‌کند. بنابراین، برای روش BOVW تعداد «کلمات» دیداری را 700 و برای روش پیشنهادی خود، تعداد «کلمات» دیداری را برای هر پچ اصلی 100 تنظیم می‌کنیم.

سپس به مقایسه بزرگ‌ترین F-Measure و دقت و فراخوانی مربوط به هر روش می‌پردازیم. شکل 13 دقت، فراخوانی و اندازه گیری F عملکرد روش پیشنهادی و مدل های رقیب را نشان می دهد.

مطابق شکل 13روش C فازی فراکتال فراکتال فراخوان بسیار بالایی 90.67% دارد، اما کمترین دقت 54.40% است که منجر به اندازه گیری F کوچک می شود. روش PLSA فراخوانی کم 53.33% دارد و دقت آن 55.56% است. بنابراین، اندازه گیری F کوچک است. روش تطبیق SIFT دارای یادآوری متوسط 65.33٪ است، اما دقت نسبتاً پایین 59.04٪، که همچنین منجر به اندازه گیری F کوچک می شود. روش تطبیق SURF دارای دقت متوسط 65.31٪ و کمترین یادآوری 42.67٪ است و F-measure کوچکترین است. روش BOVW دارای دقت نسبتاً بالایی 73.63 درصد و فراخوانی بالای 89.33 درصد است، بنابراین اندازه گیری F در رتبه دوم قرار دارد. روش پیشنهادی ما، در حالی که فراخوانی به اندازه روش C فازی فراکتال دارد، دارای دقت بالای 89.47 درصد است که بسیار بالاتر از روش‌های رقیب است. از این رو، اندازه گیری F روش پیشنهادی ما بزرگترین است. این بدان معناست که روش ما نه تنها می‌تواند اطلاعات معنایی را استخراج کند تا نمایش خوبی از فرودگاه‌ها داشته باشد، بلکه تفاوت بین فرودگاه‌ها و سایر اشیاء را به طور موثر برجسته می‌کند تا از دقت نسبتاً پایین جلوگیری کند، که این اشکال عمده روش‌های رقیب با فراخوان بالا است.

علاوه بر این، ما از منحنی‌های مشخصه عملگر گیرنده (ROC) برای مقایسه کمی عملکرد روش‌ها استفاده می‌کنیم. منحنی‌های ROC با استفاده از نتیجه طبقه‌بندی هر روش در آستانه‌های مختلف مقادیر پیش‌بینی ایجاد شدند. مقادیر پیش بینی از صفر تا یک متغیر است و 0.5 به عنوان آستانه برای تشخیص مثبت و منفی انتخاب می شود. منحنی‌های ROC و مقادیر ناحیه زیر منحنی (AUC) می‌توانند عملکرد روش ما و روش‌های رقیب را نشان دهند. در این نرم افزار، ما فقط به تجزیه و تحلیل موقعیت هایی علاقه مند هستیم که نرخ مثبت واقعی بالا و نرخ مثبت کاذب پایین به طور همزمان تحقق می یابد، یعنی تنها قسمت سمت چپ منحنی های ROC مورد توجه ما عملی است. بنابراین، با توجه به [ 44 ، 45]، مقادیر جزئی AUC را فقط در قسمتی از منحنی‌های ROC مقایسه می‌کنیم. در آزمایش، بخشی از منحنی‌های ROC مربوط به نرخ‌های مثبت کاذب از صفر تا 0.1 را مطابق آزمایش در [ 46 ] برای ارزیابی روش‌های رقیب و روش پیشنهادی خود انتخاب می‌کنیم. شکل 12 و شکل 13 منحنی های ROC جزئی و مقادیر AUC مربوط به نرخ های مثبت کاذب از صفر تا 0.1 روش ها را نشان می دهد.

از شکل 14 ، مشاهده می کنیم که در محدوده صفر تا 0.1 برای نرخ مثبت کاذب، روش ما به بزرگترین مقدار AUC جزئی دست می یابد. همچنین می‌توانیم از شکل 14 و شکل 15 نتیجه بگیریم که وقتی هم نرخ مثبت کاذب پایین و هم نرخ مثبت واقعی بالا مورد نیاز است، روش ما می‌تواند نیاز را با بهترین عملکرد برآورده کند.

به طور کلی، همه این تحلیل ها به این معنی است که روش ما بهتر از روش های رقیب عمل می کند.

3.2. تجزیه و تحلیل عملکرد روش پیشنهادی در انواع مختلف فرودگاه ها

در این قسمت به تحلیل روش پیشنهادی می پردازیم. یادآوری برای تجزیه و تحلیل عملکرد روش پیشنهادی برای شناسایی انواع مختلف فرودگاه استفاده می شود. جدول 1 اعداد کل، اعداد طبقه بندی شده صحیح و فراخوان های مربوط به انواع مختلف فرودگاه ها را در تصاویر آزمایشی نشان می دهد. در این مقاله، فرودگاه‌ها را در تصاویر آزمایشی به دو نوع طبقه‌بندی می‌کنیم: نوع 1 برای آنهایی که باند فرودگاه در یک طرف ترمینال دارند و نوع 2 برای آنهایی که باند فرودگاه در بیش از یک طرف ترمینال دارند.

از جدول 1 می توان نتیجه گرفت که روش پیشنهادی در تشخیص فرودگاه هایی با باند در بیش از یک طرف ترمینال بهتر عمل می کند. فرودگاه‌هایی که باند فرودگاهی در بیش از یک طرف ترمینال دارند، معمولاً فرودگاه‌های بزرگ و بین‌المللی با تقاضای بیشتری برای زمین نسبت به فرودگاه‌های کوچکتر هستند. آنها به مناطق وسیعی از میدان باز نیاز دارند، و این منجر به کمتر شدن اجسام غیر فرودگاهی هیبریدی با فرودگاه ها می شود.

سپس، نرخ مثبت کاذب برای تجزیه و تحلیل اینکه چه نوع اشیاء غیر فرودگاهی ممکن است بیشتر به اشتباه به عنوان فرودگاه طبقه بندی شوند، استفاده می شود. جدول 2 اعداد کل، اعداد طبقه بندی شده اشتباه و نرخ مثبت کاذب مربوط به هر نوع شی غیر فرودگاهی را نشان می دهد. در این مقاله، با توجه به تجزیه و تحلیل در بخش 2.3 و داده های آزمایش، ما اشیاء غیر فرودگاهی در تصاویر آزمایشی را به پنج کلاس طبقه بندی می کنیم: زمین کشاورزی، منطقه مسکونی، جنگل، زمین بایر و بندر.

از جدول 2 می توان مشاهده کرد که زمین های کشاورزی دارای بالاترین نرخ مثبت کاذب هستند، در حالی که جنگل و بندر دارای نرخ مثبت کاذب صفر هستند. کوه دارای نرخ مثبت کاذب بالایی است، در حالی که مناطق مسکونی دارای نرخ مثبت کاذب پایینی هستند. فرودگاه تقاضای زیادی برای زمین باز دارد و معمولاً باید در حومه شهر یا حتی مناطق وحشی قرار گیرد. چنین مناطقی متعلق به مناطق مسکونی کم جمعیت، زمین های کشاورزی یا زمین های برهنه هستند و ممکن است با فرودگاه ها مخلوط شوند.

4. نتیجه گیری

تصاویر VHR در سال های اخیر به طور گسترده ای مورد استفاده قرار گرفته اند. تشخیص و بازیابی اشیا یا صحنه ها از تصاویر VHR یک کار چالش برانگیز است. در میان اشیایی که اغلب شناسایی می‌شوند، فرودگاه‌ها به دلیل اهمیت آن‌ها در زمینه‌های نظامی و غیرنظامی، نقش کلیدی دارند. روش های سنتی بی اثر هستند. بنابراین، روش جدیدی پیشنهاد شد. روش جدید روش سنتی تشخیص برجستگی مبتنی بر پیکسل را با روش مبتنی بر پچ برای برجستگی کلاس خاص تطبیق می‌دهد تا بهترین بخش‌بندی را برای برجسته کردن تفاوت‌های بین فرودگاه‌ها و سایر اشیاء و تجزیه و تحلیل رابطه فضایی بین اجزای فرودگاه برای کمک به پیدا کند. با معناشناسی انتزاعی و تفصیلی روش جدید همچنین روش سنتی BOVW را با تخمین ابعاد فراکتال ترکیب می کند. فازی C به معنای خوشه‌بندی و درجه رابطه تصویر بر اساس طبقه‌بندی مبتنی بر قوانین فازی برای استخراج ترکیب شی برای نمایش بهتر فرودگاه‌ها است. این آزمایش ثابت می کند که روش پیشنهادی از نظر دقت و یادآوری بهتر از روش های سنتی است.

با این حال، هنوز جای پیشرفت وجود دارد. اول، روش پیشنهادی می تواند بگوید که آیا فرودگاه در تصویر داده شده وجود دارد یا نه، زمانی که فرودگاه قسمت غالب تصویر را می گیرد، اما زمانی که یک فرودگاه تنها بخش کوچکی از تصویر داده شده را اشغال می کند، روش نمی تواند به این موضوع پی ببرد. مکان های ممکن دوم، روش پیشنهادی می‌تواند معنای انتزاعی و معنایی دقیق را از ویژگی‌های BOVW و ویژگی‌های فراکتال با تجزیه و تحلیل دانش عمومی فرودگاه استخراج کند، اما توانایی استفاده از دانش خاص فرودگاه یا سایر ویژگی‌های سطح متوسط یا پایین را ندارد. برای تحلیل و استخراج کارآمدتر معناشناسی انتزاعی و معناشناسی تفصیلی. سرانجام،

بنابراین، برای تحقیقات آینده، ما بر جنبه های زیر تمرکز خواهیم کرد. ابتدا بر استخراج و استفاده از ویژگی های چندگانه بر اساس دانش خاص تر از فرودگاه تمرکز خواهیم کرد تا اطلاعات معنایی فرودگاه را با دقت بیشتری بیان کنیم. دوم، روش‌های تشخیص برجسته‌سازی بهبود یافته را برای استخراج منطقه احتمالی فرودگاه‌ها بر روی تصاویر نوری و ارائه دقیق‌تر برجستگی خاص کلاس پیشنهاد خواهیم کرد. در نهایت، ما تحقیقات بیشتری در مورد استفاده از درجه همبستگی تصویر انجام خواهیم داد و مفهوم یادگیری عمیق را برای بهبود دقت و یادآوری تطبیق خواهیم داد.

منابع

گامبا، پی. دل آکوا، اف. لیسینی، جی. بهبود استخراج جاده های شهری در تصاویر با وضوح بالا با استفاده از فیلتر جهت، گروه بندی ادراکی و مفاهیم توپولوژیکی ساده. IEEE Geosci. سنسور از راه دور Lett. 2006 ، 3 ، 387-391. [ Google Scholar ] [ CrossRef ]
سکورد، جی. زاخور، الف. تشخیص درخت در مناطق شهری با استفاده از داده های لایدار هوایی و تصویری. IEEE Geosci. سنسور از راه دور Lett. 2007 ، 4 ، 196-200. [ Google Scholar ] [ CrossRef ]
سیرماچک، بی. Unsalan، C. تشخیص منطقه شهری با استفاده از نقاط ویژگی محلی و رای گیری فضایی. IEEE Geosci. سنسور از راه دور Lett. 2010 ، 7 ، 146-150. [ Google Scholar ] [ CrossRef ]
زویانگ، ک. ژنوی، اس. لیو، ال. تشخیص فرودگاه بر اساس آشکارساز بخش خط. در مجموعه مقالات کنفرانس بین المللی 2012 بینایی کامپیوتر در سنجش از دور (CVRS)، Xiamen، چین، 16-18 دسامبر 2012. صص 72-77.
Huertas، A. کول، دبلیو. نواتیا، آر. تشخیص باند فرودگاه در صحنه های پیچیده فرودگاه. محاسبه کنید. Vis. نمودار. فرآیند تصویر 1990 ، 51 ، 107-145. [ Google Scholar ] [ CrossRef ]
یین ون، دی. Bingcheng، Y.; هانگیو، دبلیو. ژائومینگ، اس. یک الگوریتم تشخیص باند بر اساس استخراج خط اکتشافی. در مجموعه مقالات کنفرانس بین المللی 2011 در تجزیه و تحلیل تصویر و پردازش سیگنال (IASP)، ووهان، چین، 21 تا 23 اکتبر 2011. صص 292-296.
دهونگ، ال. لیهان، اچ. Carin, L. تشخیص فرودگاه در تصاویر نوری هوایی بزرگ. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد آکوستیک، گفتار و پردازش سیگنال، مونترال، کانادا، 17-21 مه 2004. جلد 765، صص 761–764.
جون وی، اچ. لی، جی. یونگ شنگ، بی. روشی برای یافتن خودکار باندهای فرودگاه در تصاویر هوایی. در مجموعه مقالات ششمین کنفرانس بین المللی پردازش سیگنال 2002، پکن، چین، 26 تا 30 اوت 2002. جلد 731، ص 731–734.
آیتکین، او. Zongur، U. هالیچی، تشخیص باند فرودگاه مبتنی بر بافت U. IEEE Geosci. سنسور از راه دور Lett. 2013 ، 10 ، 471-475. [ Google Scholar ] [ CrossRef ]
چائو، تی. تان، ی. هواجی، سی. Jinwen، T. تشخیص فرودگاه از تصاویر ikonos بزرگ با استفاده از نقاط کلیدی غربال خوشه‌ای و اطلاعات منطقه. IEEE Geosci. سنسور از راه دور Lett. 2011 ، 8 ، 128-132. [ Google Scholar ]
وانگ، ایکس. وانگ، بی. Zhang, L. تشخیص فرودگاه در تصاویر سنجش از دور بر اساس توجه بصری. در پردازش اطلاعات عصبی؛ مجموعه مقالات هجدهمین کنفرانس بین المللی، ICONIP 2011، شانگهای، چین، 13–17 نوامبر 2011. Lu, B.-L., Zhang, L., Kwok, J., Eds.; Springer: برلین، آلمان، 2011; ص 475-484. [ Google Scholar ]
McKeown، DM; هاروی، WA; مک درموت، جی. تفسیر مبتنی بر قانون از تصاویر هوایی. IEEE Trans. الگوی مقعدی ماخ هوشمند 1985 ، PAMI-7 ، 570-585. [ Google Scholar ] [ CrossRef ]
Mckeown, D. Maps: سازماندهی یک سیستم پایگاه داده فضایی با استفاده از تصاویر، زمین و داده های نقشه. در مجموعه مقالات کارگاه آموزشی درک تصویر دارپا، آرلینگتون، ویرجینیا، ایالات متحده آمریکا، 23 ژوئن 1983. صص 105-127.
Mckeown، D. کارتوگرافی دیجیتال و تفسیر عکس از دیدگاه پایگاه داده . Academic Press Professional, Inc.: San Diego, CA, USA, 1984. [ Google Scholar ]
ژائو، دی. شی، ج. وانگ، جی. جیانگ، زی. یادگیری معنایی با محدودیت برجستگی برای تشخیص هدف فرودگاه از تصاویر هوایی. APPRES 2015 , 9 . [ Google Scholar ] [ CrossRef ]
وانگ، جی. لی، جی. Wiederhold، G. Simplicity: تطبیق یکپارچه حساس به معنایی برای کتابخانه های تصویر. IEEE Trans. الگوی مقعدی ماخ هوشمند 2001 ، 23 ، 947-963. [ Google Scholar ] [ CrossRef ]
اسمولدرز، AWM; نگران، م. سانتینی، اس. گوپتا، ا. جین، آر. بازیابی تصویر مبتنی بر محتوا در پایان سال‌های اولیه. IEEE Trans. الگوی مقعدی ماخ هوشمند 2000 ، 22 ، 1349-1380. [ Google Scholar ] [ CrossRef ]
ما، اچ. ژو، جی. لیو، MRT؛ King, I. پر کردن شکاف معنایی بین محتویات تصویر و برچسب ها. IEEE Trans. چندتایی. 2010 ، 12 ، 462-473. [ Google Scholar ] [ CrossRef ]
تانگ، جی. ژا، زجی؛ تائو، دی. Chua، TS یادگیری فعال مبتنی بر شکاف معنایی برای حاشیه نویسی تصویر چند برچسبی. IEEE Trans. فرآیند تصویر 2012 ، 21 ، 2354-2360. [ Google Scholar ] [ CrossRef ] [ PubMed ]
ژانگ، ال. Shum، HP; Shao, L. تجزیه و تحلیل زیرفضای معنایی متمایز برای بازخورد مربوط. IEEE Trans. فرآیند تصویر 2016 ، 25 ، 1275-1287. [ Google Scholar ] [ CrossRef ] [ PubMed ]
الکس، بی. دیزلرز، تی. فراری، V. شی چیست؟ در مجموعه مقالات کنفرانس IEEE 2010 در مورد بینایی کامپیوتری و تشخیص الگو، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 13 تا 18 ژوئن 2010. صص 73-80.
گوفرمن، اس. زلنیک-منور، ال. تال، ای. تشخیص برجستگی با آگاهی از زمینه. IEEE Trans. الگوی مقعدی ماخ 2012 ، 34 ، 1915-1926. [ Google Scholar ] [ CrossRef ] [ PubMed ]
لیو، تی. یوان، ز. سان، ج. وانگ، جی. ژنگ، ن. تانگ، ایکس. Shum، HY یادگیری برای تشخیص یک شی برجسته. IEEE Trans. الگوی مقعدی ماخ هوشمند 2011 ، 33 ، 353-367. [ Google Scholar ] [ PubMed ]
یانگ، سی. ژانگ، ال. لو، اچ. روان، ایکس. یانگ، MH تشخیص برجستگی از طریق رتبه بندی چندگانه مبتنی بر نمودار. در مجموعه مقالات کنفرانس IEEE 2013 در مورد بینایی کامپیوتری و تشخیص الگو، پورتلند، OR، ایالات متحده آمریکا، 23 تا 28 ژوئن 2013. صص 3166–3173.
لینفنگ، ایکس. هونگلیانگ، ال. Zhengning، W. تشخیص برجستگی از جاسازی مشترک نشانه های فضایی و رنگی. در مجموعه مقالات سمپوزیوم بین المللی IEEE در سال 2012 در مورد مدارها و سیستم ها، سئول، کره، 20-23 می 2012. صص 2673-2676.
فن، ز. بو، دی. Liangpei، Z. یادگیری ویژگی بدون نظارت با هدایت برجسته برای طبقه بندی صحنه. IEEE Trans. Geosci. Remote Sens. 2015 , 53 , 2175–2184. [ Google Scholar ]
یائو، ایکس. هان، جی. گوا، ال. اتوبوس.؛ لیو، زی. یک مدل درشت به ریز برای تشخیص فرودگاه از تصاویر سنجش از راه دور با استفاده از برجستگی بصری هدف گرا و CRF. محاسبات عصبی 2015 ، 164 ، 162-172. [ Google Scholar ] [ CrossRef ]
فیفی، ل. Perona، P. یک مدل سلسله مراتبی بیزی برای یادگیری دسته بندی صحنه های طبیعی. در مجموعه مقالات کنفرانس IEEE Computer Society در سال 2005 در مورد دید رایانه و تشخیص الگو، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 20-25 ژوئن 2005. صص 524-531.
بوش، آ. زیسرمن، آ. Muoz، X. طبقه‌بندی صحنه با استفاده از رویکرد مولد/تبعیض آمیز ترکیبی. IEEE Trans. الگوی مقعدی ماخ هوشمند 2008 ، 30 ، 712-727. [ Google Scholar ] [ CrossRef ] [ PubMed ]
سیویک، جی. Zisserman, A. Video google: رویکرد بازیابی متن برای تطبیق اشیا در ویدئوها. در مجموعه مقالات نهمین کنفرانس بین المللی IEEE در بینایی کامپیوتر، نیس، فرانسه، 13 تا 16 اکتبر 2003. جلد 1472، ص 1470–1477.
Lowe, DG ویژگی های تصویر متمایز از نقاط کلیدی تغییرناپذیر مقیاس. بین المللی جی. کامپیوتر. Vis. 2004 ، 60 ، 91-110. [ Google Scholar ] [ CrossRef ]
فیلبین، جی. چام، او. ایسارد، م. سیویک، جی. Zisserman، A. بازیابی اشیاء با واژگان بزرگ و تطابق سریع فضایی. در مجموعه مقالات کنفرانس IEEE 2007 در مورد بینایی کامپیوتری و تشخیص الگو، مینیاپولیس، MN، ایالات متحده، 17-22 ژوئن 2007. صص 1-8.
پدروسا، جی وی؛ Traina، AJM; Traina, C. استفاده از فرهنگ لغت فرعی برای نمایش تصویر بر اساس رویکرد کیسه ای از کلمات بصری. در مجموعه مقالات بیست و هفتمین سمپوزیوم بین المللی IEEE در سال 2014 در سیستم های پزشکی مبتنی بر کامپیوتر، نیویورک، نیویورک، ایالات متحده آمریکا، 27-29 مه 2014. صص 165-168.
روشا، BM; نوگیرا، EA؛ گولیاتو، دی. فریرا، DLP؛ Barcelos، CAZ بازیابی تصویر از طریق واگرایی i تعمیم یافته در چارچوب کیسه ای از کلمات بصری. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی IEEE در سال 2014 در مورد الکترونیک، مدارها و سیستم ها (ICECS)، مارسی، فرانسه، 7 تا 10 دسامبر 2014. صص 734-737.
ناگاراجان، جی. بازیابی اطلاعات معنایی چندوجهی مبتنی بر هستی شناسی فازی Minu، R. Procedia Comput. علمی 2015 ، 48 ، 101-106. [ Google Scholar ] [ CrossRef ]
سو، جی. وانگ، بی. هسو، تی. چو، سی. Tseng، V. بازیابی تصویر چند وجهی با ادغام حاشیه نویسی تصویر وب، تطبیق مفهوم و تکنیک های رتبه بندی فازی. بین المللی J. فازی سیست. 2010 ، 12 ، 135-149. [ Google Scholar ]
آتاناسیادیس، تی. میلوناس، پ. Avrithis، Y. کولیاس، اس. تقسیم بندی تصویر معنایی و برچسب گذاری اشیا. IEEE Trans. سیستم مدار. فناوری ویدئو 2007 ، 17 ، 298-312. [ Google Scholar ] [ CrossRef ]
ژائوبائو، ز. لی، پی. Hong, Z. کاربرد درجه همبستگی تصویر در طبقه بندی فازی تصویر. Geomat. Inf. علمی دانشگاه ووهان 2015 ، 40 ، 574-577. (به زبان چینی) [ Google Scholar ]
لی، جی. دو، س. Sun، C. یک روش شمارش جعبه بهبود یافته برای تخمین ابعاد فراکتال تصویر. تشخیص الگو 2009 ، 42 ، 2460-2469. [ Google Scholar ] [ CrossRef ]
ژوانلی لیزا، ایکس. بنی، جی. معیار اعتبار برای خوشه بندی فازی. IEEE Trans. الگوی مقعدی ماخ هوشمند 1991 ، 13 ، 841-847. [ Google Scholar ]
هافمن، تی. نمایه سازی معنایی نهفته احتمالی. در مجموعه مقالات بیست و دومین کنفرانس بین المللی سالانه ACM SIGIR در مورد تحقیق و توسعه در بازیابی اطلاعات، برکلی، کالیفرنیا، ایالات متحده آمریکا، 15 تا 19 اوت 1999. ACM: نیویورک، نیویورک، ایالات متحده آمریکا؛ صص 50-57.
ژو، ز. زنگ، ی. لی، ی. ژانگ، ی. وانگ، پی. Luo, X. الگوریتم‌های تشخیص و طبقه‌بندی آلودگی گیاه برنج بر اساس مقادیر ابعاد فراکتال و میانگین c فازی. ریاضی. محاسبه کنید. مدل. 2013 ، 58 ، 701-709. [ Google Scholar ] [ CrossRef ]
بی، اچ. اس، ا. تویتلارس، تی. ون گول، ال. ویژگی‌های قوی با سرعت بالا (موج‌گردی). محاسبه کنید. Vis. تصویر زیر. 2008 ، 110 ، 346-359. [ Google Scholar ] [ CrossRef ]
داد، ال. Pepe, M. تخمین و رگرسیون auc جزئی. بیومتریک 2003 ، 59 ، 614-623. [ Google Scholar ] [ CrossRef ] [ PubMed ]
سلام.؛ اسکوبار، M. روش استنتاج آماری ناپارامتریک برای مناطق جزئی زیر منحنی‌های مشخصه عملکرد گیرنده، با کاربرد در مطالعات ژنومی. آمار پزشکی 2008 ، 27 ، 5291-5308. [ Google Scholar ] [ CrossRef ] [ PubMed ]
مک کلیش، دی. تجزیه و تحلیل بخشی از منحنی ROC. پزشکی تصمیم می گیرد. ماک 1989 ، 9 ، 190-195. [ Google Scholar ] [ CrossRef ]

شکل 1. روش کلی روش پیشنهادی.

شکل 2. رابطه بین متغیر مقیاس تقسیم بندی M و Sa(M) .

شکل 3. نتیجه تقسیم بندی فرودگاه های دارای باند در یک طرف ترمینال. ( الف ) تصویر اصلی؛ ( ب ) نتیجه تقسیم بندی.

شکل 4. نتیجه تقسیم بندی فرودگاه هایی با باند در بیش از یک طرف ترمینال. ( الف ) تصویر اصلی؛ ( ب ) نتیجه تقسیم بندی.

شکل 5. رابطه بین تعداد کلاس ها و شاخص Xie-Beni.

شکل 6. روش طبقه بندی اولیه.

شکل 7. نمونه هایی از فرودگاه ها.

شکل 8. نمونه هایی از اشیاء غیر فرودگاهی.

شکل 9. تأثیر تعداد کلاس ها برای اندازه گیری F روش میانگین C فازی فراکتال.

شکل 10. تأثیر تعداد کلاس ها برای اندازه گیری F از روش BOVW.

شکل 11. تأثیر تعداد “کلمات” بصری برای اندازه گیری F از روش BOVW.

شکل 12. تأثیر تعداد “کلمات” بصری هر پچ اصلی برای اندازه گیری F روش پیشنهادی ما.

شکل 13. دقت، فراخوان و اندازه گیری F عملکرد روش پیشنهادی و مدل های رقیب.

شکل 14. منحنی های ROC جزئی روش پیشنهادی و روش های دیگر. PLSA، تحلیل معنایی پنهان احتمالی.

شکل 15. AUC روش پیشنهادی و روش های دیگر.

جدول 1. تعداد و فراخوان انواع مختلف فرودگاه ها.

جدول 2. تعداد و نرخ مثبت کاذب انواع مختلف اشیاء غیر فرودگاهی.

© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب