بهینه سازی ژنتیکی برای مدل های رتبه بندی معنایی انجمنی تصاویر ماهواره ای بر اساس پوشش زمین

چکیده

روش‌های انجمنی برای رتبه‌بندی تصاویر مبتنی بر محتوا بر اساس معناشناسی به دلیل شباهت مدل‌های تولید شده به مدل‌های درک انسانی جذاب هستند. اگرچه آنها تمایل به بازگشت نتایجی دارند که توسط تحلیلگران تصویر بهتر درک می شوند، القای این مدل ها به دلیل عواملی که بر پیچیدگی آموزش تأثیر می گذارند دشوار است، مانند همزیستی الگوهای بصری در تصاویر مشابه، بیش از حد برازش یا کم تناسب بودن و معنایی. تفاوت های بازنمایی در بین تحلیلگران تصویر این مقاله روشی را برای کاهش پیچیدگی رتبه‌بندی تصاویر ماهواره‌ای برای روش‌های انجمنی پیشنهاد می‌کند. رویکرد ما از عملیات ژنتیکی برای ارائه مدل‌های سریع‌تر و دقیق‌تر برای رتبه‌بندی بر اساس معنایی با استفاده از ویژگی‌های سطح پایین استفاده می‌کند. دقت افزوده شده با کاهش احتمال رسیدن به حداقل های محلی یا بیش از حد مناسب ارائه می شود. آزمایش‌ها نشان می‌دهند که با استفاده از بهینه‌سازی ژنتیکی، روش‌های تداعی بهتر یا در سطوح مشابه به عنوان روش‌های گروهی پیشرفته برای رتبه‌بندی عمل می‌کنند. میانگین دقت متوسط (MAP) رتبه‌بندی براساس معنایی 14 درصد نسبت به روش‌های انجمنی مشابهی که از تکنیک‌های بهینه‌سازی دیگر استفاده می‌کنند در حالی که اندازه کوچک‌تر را برای هر مدل معنایی حفظ می‌کنند، بهبود یافت.

کلید واژه ها:

رتبه بندی تصاویر مبتنی بر محتوا ؛ داده کاوی ; رتبه بندی ; ژنتیکی ؛ تصاویر ماهواره ای ; انجمنی

1. مقدمه

ارزیابی تصاویر مکانی به دلیل ابعاد بالای داده های مکانی و همزیستی الگوهای بصری مرتبط با معناشناسی چندگانه در تصاویر چالش برانگیز است [ 1 ]. همانطور که سرعت جمع آوری تصاویر به طور تصاعدی رشد می کند، استخراج دستی دانش از تصاویر مکانی به منظور ارائه اطلاعات متمرکز برای تصمیم گیری برای تحلیلگران تصویر بسیار دشوار می شود. این امر نیاز به تجزیه و تحلیل و ارزیابی خودکار داده های سنجش از دور را ضروری می کند. رویکردهای سنتی داده‌ها، مانند روش‌های آماری، محدودیت‌هایی از نظر مفروضات توزیعی و محدودیت‌هایی در ورودی داده‌ها دارند که ممکن است آنها را از تجزیه و تحلیل روابط ناشناخته و غیرمنتظره در تصاویر مکانی بازدارد [ 2 ].]. سایر روش‌های سنتی داده‌کاوی مانند شبکه‌های عصبی مصنوعی و الگوریتم‌های ژنتیک (GA) دارای ویژگی جعبه سیاه هستند که استفاده از قوانین استخراج‌شده را برای سایر موارد برای کاربران دشوار می‌کند [ 3 ]. علاوه بر این، مقادیر داده‌ها تنها در زمینه حوزه مکانی و وجود تفاسیر معنایی متعدد برای یک تصویر [ 4 ، 5 ] معنا پیدا می‌کنند، که استفاده از روش‌های سنتی تحلیل داده‌ها را برای تصاویر دشوار می‌کند. بنابراین، رویکردهای جدیدی که ویژگی‌های منحصربه‌فرد داده‌های تصویر را در نظر می‌گیرند، برای الگوهای استخراج از تصاویر پدید آمده‌اند.

در بازیابی تصویر مبتنی بر محتوا، تصاویر با محتوای بصری خود مانند رنگ و شکل نمایه می شوند. با این حال، این ویژگی های سطح پایین نمی توانند به درستی معنای تصویر سطح بالا را در ذهن کاربر ثبت کنند. بنابراین، مطالعات اخیر بر روی بازیابی تصویر مبتنی بر محتوا بر کاهش شکاف معنایی بین ویژگی‌های سطح پایین و معناشناسی انسانی سطح بالا با ساخت مدل‌های معنایی که می‌توانند برای پیش‌بینی استفاده شوند، تمرکز دارند. بررسی جامع مدل‌های معنایی مختلف در [ 6 ] ارائه شده است] که در آن روش‌هایی برای کاهش شکاف معنایی شامل استفاده از هستی‌شناسی شی برای تعریف مفاهیم، استفاده از روش‌های یادگیری ماشین برای مرتبط کردن ویژگی‌های سطح پایین با معنایی کاربران، معرفی بازخورد مرتبط برای یادگیری اهداف کاربران، تولید یک الگوی معنایی برای ترسیم ویژگی‌های سطح پایین است. به مفاهیم سطح بالا و ترکیب محتوای بصری و متنی برای بازیابی تصاویر وب.

تحقیقات اخیر در حوزه ژئوفضایی راه حل های عمیق متنوعی را ارائه کرده است [ 7 ، 8 ، 9 ، 10 ، 11 ، 12 ، 13 ، 14 ، 15 ، 16 ، 17 ، 18 ]، برای نشان دادن دانش جغرافیایی پیچیده و اغلب همپوشانی و برای کمک به تحلیلگران تصویر در تولید فراداده های خاص دامنه ضروری. تحقیق در [ 7] چارچوبی را برای مدل سازی و بازیابی تصویر با استفاده از روابط فضایی جهت دار بین اشیا توصیف می کند. روش‌های بازیابی تصویر مبتنی بر محتوا (CBIR) برای رتبه‌بندی تصاویر ماهواره‌ای با استفاده از ارتباطات احتمالی بین ویژگی‌های سطح پایین و معنایی مورد علاقه [ 8 ] استفاده شد. محققان در [ 9 ، 10 ، 13 ] از روش‌های نیمه نظارتی تخصیص دیریکله پنهان (LDA) برای حاشیه‌نویسی تصاویر با کلاس‌های معنایی استفاده می‌کنند. هر دو روش نظارت شده و بدون نظارت در چارچوب I ³ KR [ 11 ] ترکیب شده اند تا قابلیت های جستجوی تصویر را با استفاده از اطلاعات معنایی و مبتنی بر محتوا افزایش دهند. تحقیقات در [ 12 ، 15] به طور موثر تصاویر را با استفاده از ساختارهای نمایه سازی در فضای ویژگی بازیابی می کند. کاربرد نقشه های خودسازماندهی برای تجزیه و تحلیل ساختارهای دست ساز در تصاویر چند طیفی در [ 14 ] بررسی شده است. تحقیق در [ 16 ] ادغام یک سیستم مبتنی بر محتوای چندوجهی را با روش های پیچیده پرس و جو در مورد شکل، روابط چند شیء، و معناشناسی پیشنهاد می کند، در حالی که تحقیق در [ 17 ] به طور خودکار تغییرات در تصاویر جغرافیایی را شناسایی می کند و خوشه بندی را اعمال می کند. تکنیک هایی برای سازماندهی تغییرات الگوی بصری رویکرد در [ 18] از دانش هستی شناسی و شبکه های عصبی مصنوعی برای ساخت مدل های معنایی الگوهای بصری با استفاده از ویژگی های تصویری سطح پایین و توصیفی استفاده می کند. از این مدل ها می توان برای اندازه گیری شباهت معنایی بین اشیاء تصویر استفاده کرد. برای بررسی عمیق داده کاوی مکانی و کشف دانش، خواننده به [ 3 ] هدایت می شود.

در میان راه‌حل‌های پیشنهادی، ارتباط بین ویژگی‌های سطح پایین و الگوهای بصری با استفاده از تکنیک‌های داده کاوی [ 8 ، 19 ] ایجاد می‌شود و بینش قابل‌خوانایی بیشتری در مورد ساختار مدل‌های تولید شده برای انسان ارائه می‌کند. هر قانون تداعی یک قانون تصمیم ایجاد می کند که در آن مجموعه ای از ویژگی های سطح پایین به عنوان مقدم و یک معنایی منحصر به فرد به عنوان نتیجه قاعده تصمیم انتخاب می شوند. سپس قوانین تداعی برای ارتباط آنها با الگوهای بصری سطح بالا ارزیابی و رتبه بندی می شوند. الگوریتم‌های مختلفی برای کاوی قوانین تداعی فضایی پیشنهاد شده‌اند. در میان آنها، الگوریتم های Apriori و AprioriTid [ 20] برای ایجاد قوانین کارآمد و فیلتر کردن قوانینی که پیش پا افتاده یا رایج هستند، پیشرفت های قابل توجهی انجام داده اند. یکی از چالش‌های موجود در این زمینه، سربار محاسباتی مرتبط با محمولات فضایی مختلف به منظور استخراج قوانین ارتباط از مجموعه داده‌های بزرگ است. رویکردی که قوانین تداعی را با استفاده از تکنیک های داده کاوی فازی استخراج می کند در [ 21 ] برای مقابله با عدم قطعیت موجود در داده های مکانی پیشنهاد شده است. در [ 22 ]، نقشه های خودسازماندهی برای بررسی اینکه آیا تصاویر ماهواره ای، و سپس قوانین انجمن وابسته به زمان، با استفاده از الگوریتم Apriori استخراج شده اند یا خیر، استفاده می شود. برای بررسی عمیق استخراج طبقه‌بندی انجمنی و کاوی قوانین انجمنی فضایی، خواننده به [ 23 ] هدایت می‌شود.

روش انتخاب ویژگی از تصاویر اصلی خام، گام مهمی در بهبود عملکرد روش‌های استخراج قانون انجمنی است. این فرآیند با حذف ویژگی‌های نامربوط و زائد، ابعاد و پیچیدگی داده‌های تصویر خام را کاهش می‌دهد. اندازه‌گیری شباهت/عدم شباهت بین مجموعه انتخاب شده از ویژگی‌های سطح پایین و معناشناسی سطح بالا، اثربخشی مدل‌های انجمنی را تعیین می‌کند. یک مشکل مهم در کشف دانش مکانی، انتخاب استراتژی‌های بهینه‌سازی است که می‌تواند در یک فضای ویژگی اعمال شود. یافتن یک راه حل منحصر به فرد در یک فضای ویژگی با ابعاد بالا که حاوی مقدار زیادی از متغیرهای پیوسته است، یک کار چالش برانگیز است. به طور خاص، در کاوی تداعی فضایی،24 ]. الگوریتم‌های انتخاب ویژگی تلاش می‌کنند تا پیچیدگی فضای ویژگی را با حذف ویژگی‌های نامربوط [ 25 ] با استفاده از روش‌های فیلتر یا بسته‌بندی کاهش دهند. الگوریتم‌های انتخاب ویژگی Brute-force نیز از نظر محاسباتی گران هستند، در حالی که الگوریتم‌های انتخاب ویژگی اخیراً پیشنهاد شده ماهیت طمع‌آمیز دارند و ممکن است عملکرد پایین‌تری داشته باشند. سایر الگوریتم‌های تصمیم‌گیری حریصانه [ 26 ، 27 ] تلاش می‌کنند تا پیچیدگی مسئله را کاهش دهند، اما ممکن است در راه‌حل‌های حداکثر محلی و غیربهینه به دام افتاده باشند. برای غلبه بر این مشکل، از مدل‌های انجمنی افزایشی استفاده می‌شود که قانون ارتباط تازه کشف‌شده تنها در صورتی به مدل اضافه می‌شود که ارتباط قاعده با مدل معنایی بیشتر از یک آستانه از پیش تعریف‌شده باشد [ 9 ]]. به عنوان مثال در [ 8 ، 28 ] مدل‌های افزودنی با الگوریتم‌هایی مانند الگوریتم انتخاب شناور متوالی به جلو (SFFS) ترکیب شدند، که تا زمانی که تابع هدف نتایج بهتری را برمی‌گرداند، تعدادی گام به عقب را اعمال می‌کند. انتخاب ویژگی از طریق قوانین تداعی نیز در [ 29 ] برای کاهش ابعاد بردارهای ویژگی به کار گرفته شده است.

الگوریتم‌های تکاملی روش‌های بهینه‌سازی خود تطبیقی هستند که جستجوی سراسری را در فضای راه‌حل انجام می‌دهند. آنها در مقایسه با الگوریتم‌های تصمیم‌گیری حریصانه [ 30 ] تمایل دارند با تعاملات ویژگی‌ها بهتر عمل کنند . الگوریتم های ژنتیک (GAs) [ 31 ، 32] فضای محلول های کاندید در ساختار کروموزوم را مدل کنید که در آن موفقیت هر کروموزوم با یک تابع تناسب ارزیابی می شود. بهترین راه‌حل یا رضایت‌بخش‌ترین راه‌حل مبتنی بر روش‌های انتخاب طبیعی است که ویژگی‌های موفق موجود در مجموعه‌ای از مدل‌های تولید شده قبلی را با انتخاب، متقاطع و جهش ترکیب می‌کند. از آنجایی که دانش در مورد فضای جستجو در طول فرآیند جستجو انباشته می‌شود، GAs می‌تواند با حرکت تطبیقی فضای راه‌حل برای نزدیک شدن به یک بهینه جهانی، تله‌های حداکثر محلی را حذف کند. GA ها در حوزه های مختلف داده کاوی مکانی اعمال می شوند. در [ 33 ]، برنامه نویسی تکاملی برای طبقه بندی تصاویر چند طیفی با استفاده از ترکیب غیر خطی معیارهای طیفی و بافت استفاده می شود. تحقیق در [ 34] از گازهای گازی برای بهینه سازی درون یابی داده های آلودگی هوا استفاده می کند در حالی که تحقیق در [ 2 ] برای GAها برای طبقه بندی پوشش زمین با استفاده از شکل جسم موجود در تصویر اعمال می شود. در [ 35 ]، یک روش خوشه بندی فضایی مبتنی بر GAs و k-medoids برای رسیدگی به خوشه بندی فضایی با محدودیت های مانع پیشنهاد شده است. تحقیق در [ 36 ] از GA برای کشف قوانین ارتباطی برای داده کاوی تصویر استفاده می کند. در [ 37 ]، یک الگوریتم بهینه سازی چند هدفه برای جستجوی تعدادی از توابع هدف متضاد برای یافتن راه حل پارتو بهینه برای طبقه بندی پیکسل استفاده می شود.

GA همچنین برای انتخاب ویژگی در وظایف بازیابی تصویر استفاده شده است. در [ 38 ]، الگوریتم انتخاب ویژگی مبتنی بر GA برای انتخاب مجموعه ای از ویژگی های متمایز برای تصاویر ماهواره ای استفاده می شود. شاخص تفکیک پذیری به عنوان تابع تناسب برای ارزیابی زیرمجموعه های ویژگی استفاده می شود و اثربخشی الگوریتم بر روی یک طبقه بندی شبکه عصبی آزمایش می شود. در [ 39 ]، توابع ارزیابی رتبه بندی به عنوان توابع تناسب در انتخاب ویژگی مبتنی بر GA برای جستجوی بهترین مجموعه ویژگی پیشنهاد شده است. در [ 40 ]، روش انتخاب ویژگی شامل یک انتخاب ویژگی مبتنی بر فیلتر با استفاده از الگوریتم ژنتیک برای بهبود تخمین بارش از یک تصویر سنجش از راه دور است.

در این مقاله، ما کار در [ 41 ] را برای کشف روش های ژنتیکی حالت پایدار [ 42 ] گسترش می دهیم.] برای بهینه سازی مدل های انجمنی برای رتبه بندی مناطق تصویر جغرافیایی بر اساس پوشش زمین. هدف ما ارائه یک روش تداعی برای نگاشت معناشناسی به الگوهای بصری در تصاویر دامنه خاص است. این روش‌ها به دلیل اینکه می‌توانند به راحتی توسط متخصصان تفسیر شوند، جذاب هستند که در نهایت می‌توان از آن‌ها در روش‌های آموزشی متخصص استفاده کرد. در رویکردهای قبلی، ما از تکنیک‌های استخراج قانون انجمن Apriori برای تعیین اولیه زیرفضاهای ویژگی استفاده کرده‌ایم. با این حال، ثابت شد که آموزش پیچیده است و بسیاری از روش‌های مورد استفاده برای کاهش پیچیدگی، محدودکننده بوده و مستقیماً بر کیفیت شوخی تأثیر می‌گذارد. بنابراین، در رویکرد جدید تنها از روش‌های ژنتیکی برای تولید، انتخاب و تنظیم دقیق نگاشت‌های بین فضاهای ویژگی و معناشناسی استفاده می‌کنیم. حوزه اصلی این مقاله ارزیابی این است که آیا روش‌های ژنتیکی برای استخراج قوانین انجمنی منجر به عملکردی بهتر یا مشابه با عملکرد سایر تکنیک‌های پیشرفته می‌شوند. ما دو مدل از الگوریتم ژنتیک را برای تولید فرزندان بررسی کردیم. GA نسلی (GA استاندارد) و GA حالت پایدار و استفاده از بعدی را انتخاب کرد. در GA استاندارد، عملگرهای ژنتیکی کل نسل قدیم را با جمعیت تازه بهار جایگزین می‌کنند، در حالی که در GA حالت پایدار، جمعیت به‌طور تدریجی جایگزین می‌شود به طوری که یک عضو جدید به جمعیت جدید وارد می‌شود. یک استراتژی جایگزینی تعیین می کند که کدام یک از اعضای جمعیت با فرزندان جدید جایگزین می شوند [ GA نسلی (GA استاندارد) و GA حالت پایدار و استفاده از بعدی را انتخاب کرد. در GA استاندارد، عملگرهای ژنتیکی کل نسل قدیم را با جمعیت تازه بهار جایگزین می‌کنند، در حالی که در GA حالت پایدار، جمعیت به‌طور تدریجی جایگزین می‌شود به طوری که یک عضو جدید به جمعیت جدید وارد می‌شود. یک استراتژی جایگزینی تعیین می کند که کدام یک از اعضای جمعیت با فرزندان جدید جایگزین می شوند [ GA نسلی (GA استاندارد) و GA حالت پایدار و استفاده از بعدی را انتخاب کرد. در GA استاندارد، عملگرهای ژنتیکی کل نسل قدیم را با جمعیت تازه بهار جایگزین می‌کنند، در حالی که در GA حالت پایدار، جمعیت به‌طور تدریجی جایگزین می‌شود به طوری که یک عضو جدید به جمعیت جدید وارد می‌شود. یک استراتژی جایگزینی تعیین می کند که کدام یک از اعضای جمعیت با فرزندان جدید جایگزین می شوند [43 ]. هر ارتباط بین یک ویژگی و پوشش زمین مورد علاقه به عنوان یک اگزون k -bit مدل‌سازی می‌شود که حاوی اطلاعاتی در مورد ویژگی‌ها و ویژگی‌های زیرفضای ویژگی مورد استفاده است. تازگی رویکرد ما استفاده از عملیات ژنتیکی در هر دو سطح ویژگی و زیرفضا است. ما تناسب مدل‌ها را در جمعیت‌های ژنتیکی با استفاده از MAP ارزیابی می‌کنیم و آن را با الگوریتم بهینه‌سازی SFFS مورد استفاده در [ 8 ] مقایسه و مقایسه می‌کنیم. این مقاله به شرح زیر سازماندهی شده است: در بخش 2 روش مورد استفاده برای پیاده سازی الگوریتم های ژنتیک را معرفی می کنیم، نتایج تجربی را در بخش 3 ارائه می کنیم و سپس مقاله را در بخش 4 به پایان می رسانیم .

2. روش شناسی

در این بخش روش خود را برای رتبه‌بندی مناطق تصاویر ماهواره‌ای با استفاده از عملیات ژنتیکی ارائه می‌کنیم. برای هر تصویر در پایگاه داده یک فضای ویژگی F ایجاد می کنیم . ویژگی کلیدی الگوریتم این است که ما از مجموعه‌ای از قوانین ارتباط بین زیرفضاهای ویژگی و معنایی در فضای معنایی S برای رتبه‌بندی تصاویر بر اساس معنایی استفاده می‌کنیم. هر مجموعه ای از تداعی ها با استفاده از عملیات ژنتیکی در دو سطح ایجاد و تکامل می یابد: سطح ویژگی و زیرفضا. در سطح ویژگی، مجموعه ویژگی‌های مورد استفاده برای شناسایی قوانین مرتبط را تغییر می‌دهیم، در حالی که در سطح زیرفضا، منطقه را برای مجموعه ویژگی‌های مشابهی که در رتبه‌بندی استفاده می‌شود، تغییر می‌دهیم. به عنوان مثال، برای یک فضای 38 بعدی، 2 ^{38 وجود دارد}ترکیبی از ویژگی های منحصر به فرد با استفاده از عملیات ژنتیکی، ما به طور تصادفی ترکیبی از ویژگی ها را با استفاده از روش هایی مانند جهش متقاطع، کوچک، ثابت یا رشد، انتخاب و تکامل می دهیم. هنگامی که ترکیبی از ویژگی‌ها انتخاب می‌شود، به‌طور تصادفی زیرفضاهای ویژگی‌ها را که توسط توابع احتمالی سیگموئید مدل‌سازی شده‌اند، تولید و تکامل می‌دهیم. علاوه بر این، مجموعه‌ای از فضاهای ویژگی به صورت افزودنی برای مدل‌سازی همبستگی با معنایی مورد علاقه استفاده می‌شوند. برای ارزیابی اینکه کدام زیرفضا مرتبط‌تر است، عملیات ژنتیکی را نیز در این سطح اعمال می‌کنیم.

2.1. عملکرد تناسب اندام

تابع تناسب برای هر مدل معنایی توسط الگوریتم بهینه‌سازی استفاده می‌شود تا مشخص کند کدام ترکیبی از قوانین تداعی ارتباط بین زیرفضاهای ویژگی و معنایی مورد علاقه را بهتر مدل‌سازی می‌کند. در مطالعه خود، ما از MAP برای تعیین ارتباط هر زیرفضای ویژگی استفاده می کنیم، مجموعه ای از تداعی ها که یک مدل معنایی را تشکیل می دهند. با این حال، از آنجایی که هر مدل معنایی مجموعه‌ای از تداعی‌ها است، با مقادیر مرتبط غیرصفر متعدد، تابع تناسب به صورت زیر اعمال می‌شود: هر قانون تداعی منطقه فضای ویژگی را در معنایی مورد علاقه ترسیم می‌کند. Ijgi 02 00531 i007

(1)

(2)

تابع g یک توزیع احتمالی سیگموئید دوتایی نامتقارن است ( L— چپ و R— راست) که ارتباط یک اندازه گیری را با ς معنایی مدل می کند . هر نیم سیگموئید توسط دو پارامتر کنترل می شود: (الف) مرکز ( ، ) و (ب) عرض ( ، ) در حالی که wg وزن مربوط به بازیابی شده توسط _g است . هر توزیع احتمال با استفاده از ارزیابی‌های مرتبط ارائه شده توسط تحلیل‌گران تصویر شکل می‌گیرد، که ما آن را به عنوان اطلاعات معنایی واقعی برای هر معنایی مورد علاقه در نظر گرفتیم. برای جزئیات این تابع نگاشت، خواننده به [ 8 Ijgi 02 00531 i009

ارتباط یک تصویر ι با یک ς معنایی با ارتباط مقادیر ویژگی تصویر در ناحیه فضای ویژگی Θ تعیین می شود :

(3)

جایی که وزنی از زیرفضای ویژگی Θ است که ارتباط آن را در نگاشت F به ς تعیین می کند. علاوه بر این، برای هر ς معنایی یک مدل معنایی ایجاد می کنیم که به عنوان مجموعه ای از نگاشت زیرفضاهای Θ از F در فضای معنایی S تعریف شده است :

(4)

ارتباط کلی یک تصویر ι با اندازه‌گیری ویژگی ، با یک ς معنایی با مرتب‌سازی مقادیر مربوط (عملکرد رتبه) اندازه‌گیری‌های ویژگی تصویر به هر زیرفضای ویژگی به ترتیب نزولی محاسبه می‌شود و سپس محاسبه می‌شود:

(5)

در این معادله، به‌عنوان میانگین وزنی تمام مقادیر ارتباط سیگموئیدی انجمن‌ها در مدل معنایی محاسبه می‌شود. ما این میانگین را انتخاب کرده‌ایم زیرا می‌خواهیم بر مرتبط‌ترین ارتباط تأکید کنیم و در عین حال بر ارتباط کمتر مرتبط که فقط تأثیر حاشیه‌ای دارند، تأکید نکنیم.

در نهایت، برای هر یک از آزمایش‌ها، تابع تناسب را به‌عنوان نقشه رتبه‌بندی محاسبه می‌کنیم، که یک مقیاس کلی از دقت (چه تعداد از تصاویر بازیابی شده در جستجوی معنایی واقعاً مرتبط هستند) در تمام سطوح یادآوری برای هر مدل ارائه می‌کند. برای بیش از یک فضای ویژگی F. اندازه گیری MAP در زیر نشان داده شده است:

(6)

در این فرمول مجموعه ای از تصاویر j رتبه بندی شده از بالا تا k امین تصویر است.

2.2. رمزگذاری

هر تابع عضویت تولید شده یک اگزون ε در نظر گرفته می شود و به عنوان یک رشته اعشاری برای دنباله ( φ , , , , ) با استفاده از مجموع 20 رقم اعشاری کدگذاری می شود. ویژگی φ به عنوان شاخص ویژگی در فضای ویژگی با استفاده از چهار رقم اعشاری ثبت می‌شود، در حالی که برای هر یک از پارامترهای سیگموئید، مهم‌ترین چهار رقم را بعد از نقطه اعشار که پس از فرآیند عادی‌سازی به‌دست آمده ذخیره می‌کنیم . برای خوانایی مقاله، یک توالی ژنتیکی را در قسمت‌های کوچک‌تر می‌شکنیم و هر گروه چهار رقمی را با متناوب کردن متن‌های ایتالیک و پررنگ برجسته می‌کنیم. به عنوان مثال، بیش از یک ویژگی F 1 به صورت کدگذاری می شود

ε = 0001 0100 0500 6240 0100 .

یک ژن مجموعه‌ای از اگزون‌های پیوندی است و توسط توالی کدگذاری می‌شود که در آن η تعداد اگزون‌های موجود در ژن است و نشان‌دهنده ارتباط عضویت کامل مجاز توسط ژن است. به عنوان مثال، ژنی را در نظر بگیرید که دارای دو اگزون و حاوی دو اگزون در فضای ویژگی دو بعدی { F 1, F 2} است. هر اگزون معادل توابع سیگموئید زیر است: و . این ژن 0002 7210 0001 8870 0150 9980 0010 0002 0100 0500 6240 0100 رمزگذاری شده است . برای این ژن، هر نقطه در ویژگی &فضای فرعی F Ijgi 02 00531 i022

1 ∈ [0.887, 0.998] ˄ F 2 ∈ [0.01، 0.624] دارای ارتباط 0.721 = Θ است در حالی که نقاط مشخصه خارج از این ناحیه ارتباط کمتری دارند که توسط توابع سیگموئید دیکته می شود.

کروموزوم χ مجموعه‌ای از ژن‌های جداکننده است که می‌توانند با استفاده از تابع جمع شوند و به عنوان ترکیبی از ژن‌های سازنده χ = ( ) کدگذاری می‌شوند. به عنوان مثال، در نظر بگیرید که ما یک کروموزوم با دو ژن داریم: = 0002 7210 0001 8870 0150 9980 0010 0002 0100 0500 6240 0100 ، که در پاراگراف قبلی توضیح داده شد، که در پاراگراف قبلی توضیح داده شد، که در پاراگراف قبلی توضیح داده شد : 18001 تا 1801 = 1801 . بیش از ویژگی F 1 و با Ijgi 02 00531 i017

. این کروموزوم χ = 0002 7210 0001 8870 0150 9980 0010 0002 0100 0500 6240 0100 0001 2018 0001 66070 0001 8818 کدگذاری شده است . هر کروموزوم یک منطقه سفارشی شده از فضای ویژگی را نشان می دهد. هدف روش شناسی ما شناسایی منطقه بهینه است که می تواند کیفیت رتبه بندی را برای یک معنایی به حداکثر برساند. این مجموعه از تداعی ها یک مدل معنایی برای آن معنایی تشکیل می دهد و برای رتبه بندی تصاویر جدید و بدون برچسبی که به پایگاه داده اضافه می شوند استفاده می شود.

در نهایت، یک جمعیت مجموعه‌ای از کروموزوم‌ها (χ1 ، _… ،χn ₎ است که برای توضیح ارتباط بین یک فضای ویژگی و یک معنایی با هم رقابت می‌کنند، در حالی که یک ماده ژنتیکی مجموعه‌ای از کروموزوم‌ها است که بالاترین عملکرد را در مدل‌سازی تمام موارد نشان می‌دهد. معناشناسی مورد علاقه

2.3. عملیات ژنتیکی

ما عملیات ژنتیکی را در سه سطح اگزون، ژن و کروموزوم انجام می دهیم. در زیر عملیات ژنتیکی انجام شده بر روی هر جمعیت را برمی شمریم که در شکل 1 در یک فضای ویژگی دوبعدی ساده شده متشکل از کشش ناحیه محدب جسم ( F 1) و چولگی جهت ( F 2) مثال زده شده است. در این شکل، محور عمودی، ویژگی مربوط به یک معنایی مورد علاقه است.

شکل 1. مثالی از دنباله ای از عملیات ژنتیکی: ( الف ) تصادفی. ( ب ) تغییر اگزون لامبدا 1. ( ج ) تغییر اگزون لامبدا 2; ( د ) جهش رشد ژن. ( ه ) جهش مربوط به ژن. ( f ) جهش ثابت ژن. ( g ) تلاقی ژن با جایگزینی اگزون دوم در (e) با اگزون اول در (a). ( h ) جهش کوچک شدن ژن; ( من ) جهش رشد کروموزوم. ( j ) جهش ثابت کروموزوم. ( k ) کروموزوم با اولین ژن در (d) تلاقی می کند. ( l ) جهش کوچک شدن کروموزوم.

نسل تصادفی کروموزوم: اولین جمعیت از نسل کاملاً تصادفی کروموزوم ها استفاده می کند. تعداد ژن ها در هر کروموزوم به طور تصادفی بین سه تا دوازده انتخاب می شود، در حالی که هر ژن حداکثر دارای پنج اگزون است. محدوده ژن‌ها در یک اگزون به‌طور تجربی توسط آزمایش‌های ما نشان داده شد که توسط مدل انجمنی بازگردانده می‌شوند، در حالی که ما می‌خواهیم تعداد اگزون‌ها را در یک مدل حفظ کنیم تا ماهیت جعبه سفید مدل‌های معنایی خود را حفظ کنیم. شکل 1 (a) ارتباط فضای ویژگی را هنگام استفاده از یک کروموزوم تصادفی تولید شده با یک ژن، یک اگزون در F 2 و با کد 0001 6510 0002 1012 3410 0200 0513 نشان می دهد . این معادل تابع سیگموئید است Ijgi 02 00531 i034

Exon Shift پارامتر λ ₁ : این عملیات با تغییر تصادفی و تا ± 5٪ ، تغییراتی را به فاصله ویژگی حداکثر ارتباط اضافه می کند . شکل 1 (ب) ارتباط فضای ویژگی را هنگام تبدیل ژنتیکی 0001 6510 0002 1012 3410 0200 0513 به 0001 6510 000 2 3763 4586 0200 0513 نشان می دهد . این معادل یک تابع سیگموئید جدید با تغییرات در نسل قبلی و بیش از آن است. Ijgi 02 00531 i010

Exon Shift از پارامتر λ ₂ : این عملیات با تغییر تصادفی و تا 5±٪ ، به فاصله ویژگی حداکثر ارتباط تغییر می‌دهد. شکل 1 (ج) ارتباط فضای ویژگی را هنگام تبدیل ژنتیکی 0001 6510 0002 1012 3410 0200 0513 به 0001 6510 0002 3763 4586 2130 0500 نشان می دهد. این معادل یک تابع سیگموئید جدید با تغییرات در نسل قبلی و نسبت به نسل قبلی است. Ijgi 02 00531 i012

جهش رشد ژن : این عمل یک اگزون جدید را به یک ژن انتخاب شده در کروموزوم به طور تصادفی اضافه می کند. شکل 1 (د) ارتباط فضای ویژگی را هنگام اضافه کردن اگزون با کد 0001 2001 6011 0100 0055 در ویژگی F 1 به ژن در کروموزوم موجود نشان می دهد. کد ژنتیکی جدید کروموزوم 0002 6510 0002 3763 4586 2130 0500 0001 2001 6011 0100 0055 است. این معادل یک کروموزوم با ارتباط Θ = 0.651 و و است. Ijgi 02 00531 i039

جهش مربوط به ژن : این عمل با تغییر تصادفی وزن یک ژن در کروموزوم، تغییراتی را به ژن اضافه می کند. شکل 1 (e) ارتباط فضای ویژگی را هنگام افزایش ارتباط از 0.651 به 0.9999 نشان می دهد. کد ژنتیکی جدید کروموزوم 0002 9999 0002 3763 4586 2130 0500 0001 2001 6011 0100 0055 است. Ijgi 02 00531 i015

جهش ثابت ژن : این عمل جایگزین یک اگزون در یک ژن به طور تصادفی انتخاب شده می شود. انتخاب اگزون جدید با یک عملیات تصادفی انجام می شود. شکل 1 (f) ارتباط فضای ویژگی را پس از جایگزینی اگزون 0002 3763 4586 2130 0500 با 0001 5160 7613 0501 0500 نشان می دهد. اگزون جدید معادل . کد نهایی کروموزوم 0002 9999 0001 5160 7613 0501 0500 0001 2001 6011 0100 0055 است. Ijgi 02 00531 i038

Gene Cross Over : این عملیات زیرمجموعه اگزون ها را بین دو ژن انتخاب شده به طور تصادفی تغییر می دهد. هر زیرمجموعه اگزونهایی که باید سوئیچ شوند نیز به صورت تصادفی انتخاب می شوند. شکل 1 (g) ارتباط فضای ویژگی را پس از جایگزینی اگزون دوم در ژن 0001 2001 6011 0100 0055 با اگزون از اولین جهش تصادفی 0002 1012 3410 0200 0513 نشان می دهد . کد نهایی کروموزوم 0002 9999 0001 5160 7613 0501 0500 0002 1012 3410 0200 0513 است.

جهش کوچک شدن ژن : این عملیات یک اگزون را در یک ژن به طور تصادفی انتخاب شده حذف می کند. انتخاب اگزونی که باید حذف شود با یک عملیات تصادفی انجام می شود. شکل 1 (h) ارتباط فضای ویژگی را پس از حذف اگزون 0002 1012 3410 0200 0513 از ژن شرح داده شده در بالا نشان می دهد. کد نهایی کروموزوم 0001 9999 0001 5160 7613 0501 0500 است.

جهش رشد کروموزوم : این عمل یک ژن را به یک کروموزوم انتخاب شده به طور تصادفی با احتمالی که مستقیماً با ارتباط کروموزوم متناسب است، اضافه می کند. ژن جدید به صورت تصادفی تولید می شود. شکل 1 (i) ارتباط فضای ویژگی را پس از افزودن یک ژن جدید با دو اگزون نشان می دهد: 0001 1210 4100 0200 0500 و 0002 6200 8522 0300 0050 و وزن = 0.712. ژن جدید اضافه شده دارای کد: 0002 7120 0001 1210 4100 0200 0500 0002 6200 8522 0300 0050 است. Ijgi 02 00531 i015

در حالی که کد نهایی کروموزوم 0001 9999 0001 5160 7613 0501 0500 0002 7120 0001 1210 4100 0200 0500 0002 62003002 6200 3002 است .

جهش ثابت کروموزوم : این عمل به طور تصادفی یک کروموزوم را انتخاب می کند و ویژگی مرتبط با یکی از ژن های آن را تغییر می دهد. شکل 1 (j) ارتباط فضای ویژگی را پس از تغییر ویژگی اولین ژن از F 1 به F 2 با کد حاصل نشان می دهد: 0002 9999 0002 5160 7613 0501 0500 . کروموزوم جدید دارای کد 0001 9999 0002 5160 7613 0501 0500 0002 7120 0001 1210 4100 0200 0500 0002 6200 8502 0050 .

کروموزوم متقاطع : این عملیات زیر مجموعه‌های ژن‌ها را بین دو کروموزوم انتخاب شده به‌طور تصادفی تغییر می‌دهد. هر زیرمجموعه ای از ژن هایی که قرار است تعویض شوند نیز به صورت تصادفی انتخاب می شوند. شکل 1 (k) ارتباط فضای ویژگی را پس از تعویض اولین ژن کروموزوم در شکل 1 (د) با اولین ژن در کروموزوم توصیف شده قبلی نشان می دهد. کد نهایی کروموزوم 0002 6510 0002 3763 4586 2130 0500 0001 2001 6011 0100 0055 0002 7120 0001 1210 2002 1210 2002 0002 3763 0050 .

جهش کوچک شدن کروموزوم : این عمل یک ژن را از کروموزوم با هدف کاهش پیچیدگی توالی DNA حذف می کند. احتمال این عمل با ارتباط هر کروموزوم نسبت معکوس دارد. شکل 1 (l) ارتباط فضای ویژگی را پس از حذف ژن دوم از کروموزوم نشان می دهد. کد نهایی کروموزوم 0002 6510 0002 3763 4586 2130 05 00 0001 2001 6011 0100 0055 است.

تولید مثل کروموزوم : این عمل یک کپی دقیق از یک کروموزوم می سازد و آن را به توالی DNA جدید اضافه می کند. انتخاب کروموزوم‌های مورد استفاده در عملیات ژنتیکی با استفاده از الگوریتم انتخاب چرخ رولت [ 44 ] تعیین می‌شود، که شانس انتخاب را متناسب با تناسب هر مدل معنایی در جامعه اختصاص می‌دهد.

شکل 2. فلوچارت برای تولید یک مدل معنایی با استفاده از عملیات ژنتیکی.

شکل 2 فلوچارت برای تولید یک مدل معنایی با استفاده از عملیات ژنتیکی را نشان می دهد. پارامترهای ورودی برای این فرآیند یک مجموعه آموزشی حاوی ویژگی های تصویری است که توسط تحلیلگران تصویر با یک یا چند معناشناسی برچسب گذاری شده است. Ijgi 02 00531 i019

. این الگوریتم همچنین پارامترهای زیر را به‌عنوان ورودی می‌گیرد: تعداد کروموزوم‌ها در هر نسل از جمعیت، حداکثر تعداد نسل‌ها (تکرار) که الگوریتم اجرا می‌کند، و آستانه‌ای در کیفیت رتبه‌بندی که الگوریتم برای آن خاتمه می‌یابد. الگوریتم با جمعیتی شروع می شود که در آن هر کروموزوم، ژن و اگزون به طور تصادفی تولید شده است. سپس کیفیت رتبه بندی با استفاده از اندازه گیری MAP ارزیابی شده و در رابطه (6) نشان داده شده است. سپس کروموزوم های برتر به عنوان والدین کروموزوم های نسل بعدی انتخاب می شوند که با استفاده از عملیات ژنتیکی توضیح داده شده در بخش 2.3 تولید می شود.. در نهایت، هنگامی که معیار خاتمه برآورده شد – یا کیفیت رتبه بندی کروموزوم برتر از آستانه از پیش تعیین شده فراتر رفت یا حداکثر تعداد تکرارها تکمیل شد – الگوریتم برازش ترین کروموزوم را برمی گرداند. این کروموزوم به یک مدل معنایی تبدیل می شود که برای رتبه بندی تصاویر جدید و بدون برچسب استفاده می شود.

3. ارزیابی

ما سه آزمایش را برای ارزیابی ارتباط استفاده از روش‌های بهینه‌سازی ژنتیکی برای رتبه‌بندی تصاویر بر اساس معناشناسی طراحی کردیم: (1) عملکرد رویکرد پیشنهادی را در تعداد زیادی از عملیات ژنتیکی ارزیابی می‌کنیم. (2) ما یک ارزیابی مقایسه ای عمیق از Associative & SFFS و رویکرد پیشنهادی (Associative & Genetic) انجام می دهیم. و (3) ما عملکرد روش پیشنهادی را با شش روش دیگر مقایسه می کنیم. برای هر آزمایش ما از روش نشان داده شده در شکل 3 پیروی کردیم : ابتدا داده های اصلی با استفاده از یک استراتژی طبقه بندی شده به ده زیر مجموعه تقسیم شدند [ 45 ]] برای اطمینان از اینکه هر کلاس معنایی به طور متناسب در هر فولد نمایش داده می شود. سپس، با استفاده از رویکرد تکرار ده برابری، داده‌ها به آزمون‌هایی که شامل زیرمجموعه‌ای متفاوت برای هر فولد بود و آموزش حاوی تا‌های باقی‌مانده تفکیک شدند. سپس مدل‌های رتبه‌بندی بر روی داده‌های آموزشی ساخته شد و بر اساس داده‌های آزمایشی مورد ارزیابی قرار گرفت. این رویکرد با Associative & SFFS متفاوت است زیرا دومی از روش زیر استفاده می کند: (1) از الگوریتم Apriori برای تولید تعداد زیادی زیرفضاهای ویژگی نامزد استفاده کنید. (2) تداعی های ایجاد شده را با میانگین هارمونیک اطمینان و پشتیبانی مرتب کنید. (3) مدل سیگموئید پارامتری را با استفاده از روش حداقل مربع با استفاده از توزیع داده ها در زیر فضای ویژگی ایجاد کنید. و (4) با افزودن و اعمال مکرر روش های SFFS به بهترین مدل کاندید، مدل های معنایی کاندید را تولید کنید.

برای آزمایشات خود از دو مجموعه داده استفاده کردیم: تصاویر ماهواره ای WROC 2010 از ویسکانسین [ 46 ] و ماهواره چند طیفی UCI Statlog Landsat [ 47 ]]. تصاویر ماهواره ای WROC 2010 شامل 18 کاشی تصویر GeoTIFF 3 باندی با ابعاد 15678 × 11105 پیکسل است که در بهار 2010 جمع آوری شد. برای هر کاشی، یک الگوریتم استخراج ویژگی اعمال شد که شامل موارد زیر می‌شود: برای رنگ، ویژگی‌ها را از کانال خاکستری، R، G، B، H، S، V و همچنین بافت رنگ استخراج می‌کنیم. برای بافت، خودهمبستگی، کنتراست، همبستگی، انرژی، آنتروپی، گشتاور اختلاف معکوس و همگنی را استخراج می کنیم. برای اجسام، میانگین خاکستری، مساحت، مرکز، کادر محدود، طول محور اصلی و فرعی، خروج از مرکز، جهت، ناحیه محدب، ناحیه پر، عدد اویلر، قطر معادل، جامد، محیط و همخوانی فاز را استخراج می‌کنیم. ما استخراج ویژگی را با استفاده از جعبه ابزار پردازش تصویر از MatLab انجام می دهیم. برای هر یک از این ویژگی ها به طور متوسط، چارک، انحراف معیار، چولگی و کشیدگی محاسبه شد که منجر به یک بردار ویژگی 292 برای هر کاشی شد. علاوه بر این، ما تعدادی از 100 کاشی را انتخاب کردیم که با یک یا چند برچسب ازمنطقه شهری (L100)، کشاورزی (L110)، علفزار (L150)، جنگل (L160)، آبهای آزاد (L200)، تالاب (L210)، بایر ( L240 )، بوته زار ( L250 ). در این زیرمجموعه، تعدادی از 72 کاشی با دو معنی‌شناسی برچسب‌گذاری شدند: همپوشانی بی‌ثمر ( L240 ) با کشاورزی (L110) در 26 کاشی، با Grassland (L150) در 4 کاشی، با جنگل (L160) در 5 کاشی، و با تالاب . (L210) در 4 کاشی. همچنین، بوته زار ( L250 ) با Grassland (L150) در 4 کاشی و با جنگل همپوشانی دارد.(L160) در 29 کاشی. مجموعه داده دوم، مجموعه داده های ماهواره چند طیفی UCI Statlog Landsat است که شامل 6435 تصویر ماهواره ای است که با یکی از شش نوع مختلف خاک برچسب گذاری شده است: خاک قرمز (L1)، محصول پنبه (L2)، خاک خاکستری (L3)، خاکستری مرطوب . خاک (L4)، خاک با کلش گیاهی (L5)، یا خاک خاکستری بسیار مرطوب(L7). برای هر تصویر، یک فضای ویژگی 36 بعدی با ویژگی مربوط به 9 مقدار شدت یک ناحیه 3 × 3 پیکسل (با مناطق همپوشانی) در دو باند طیفی مرئی و دو باند طیفی مادون قرمز نزدیک استخراج شد. مدل‌های معنایی بر روی یک مجموعه آموزشی به‌طور تصادفی انتخاب شدند که شامل 90 درصد داده‌ها است، در حالی که آزمایش بر روی 10 درصد باقی‌مانده داده‌ها انجام شد.

شکل 3. فلوچارت برای تنظیمات آزمایشی.

3.1. ارزیابی عمیق عملیات ژنتیکی در روش پیشنهادی

برای روش پیشنهادی، هر عمل ژنتیکی که بر روی جمعیت ژنتیکی انجام شده است را ثبت کرده ایم. این منجر به تعداد 90000 عملیات ژنتیکی برای آزمایش‌ها روی مجموعه داده‌های UCI Statlog Landsat و 120000 عملیات ژنتیکی برای آزمایش‌ها روی مجموعه داده‌های WROC شد. درصد برای هر عملیات جداگانه انجام شده در شکل 4 نشان داده شده است . برای مثال، عملیات متقاطع 57 درصد از تمام عملیات‌هایی را تشکیل می‌دهد که به طور مساوی روی جهش‌های کروموزوم و ژن توزیع شده‌اند. با توجه به تصادفی بودن عملیات ژنتیکی، ما حداقل تغییرات صدک را برای آزمایش‌ها روی دو مجموعه داده مشاهده کردیم.

شکل 4. عملیات ژنتیکی به عنوان درصد در هنگام رتبه بندی تصاویر بر اساس معناشناسی انجام می شود.

ما همچنین عملیات ژنتیکی را ثبت کرده‌ایم که منجر به بهترین عملکرد کروموزوم برای هر جمعیت جهش‌یافته برای هر ترکیب داده-مجموعه-معنای تا شد. از 21000 جمعیت جهش یافته، تنها 6491 مدل بهتر با 3517 و 2974 جمعیت برای مجموعه داده های UCI Statlog Landsat و WROC یا نرخ موفقیت جهش ژنتیکی 30.9 درصد را برگرداندند. شکل 5درصد عملیاتی را نشان می دهد که مدل های معنایی بهبود یافته را برمی گرداند. برای مثال، این شکل نشان می‌دهد که جهش‌های متقاطع کلی کمتر از حد متوسط برای بهبود مدل‌های معنایی کمک می‌کنند. آنها بهترین مدل ها را به ترتیب در 44 درصد و 34 درصد برای مجموعه داده های UCI Statlog Landsat و مجموعه داده های WROC برگرداندند. از سوی دیگر، جابه‌جایی اگزون‌ها به ترتیب با درصدهای 22 و 33 درصد موفق‌ترین در بهبود مدل‌های معنایی بودند، اگرچه تنها 14 درصد از کل عملیات ژنتیکی را تشکیل می‌دادند. همچنین خاطرنشان می شود که کمترین احتمال بهبود مدل هایی با درصدهای کمتر از 0.5 درصد است.

شکل 5. عملیات ژنتیکی مربوطه به عنوان درصد هنگام رتبه بندی تصاویر بر اساس معناشناسی در ( الف ) مجموعه داده UCI Statlog Landsat و ( ب ) مجموعه داده های WROC.

3.2. ارزیابی عمیق روش های انجمنی برای رتبه بندی

برای ارزیابی تفاوت بین دو روش انجمنی (Associative & SFFS و Associative & Genetic) ما اندازه گیری MAP را در هر تکرار برای مجموعه داده آموزشی و آزمایشی ثبت کرده ایم. در این آزمایش، هر مدل تولید شده یک تکرار در نظر گرفته می شود. به عنوان مثال، روش Associative و Genetic با جمعیت 10 کروموزوم و 150 نسل، 1500 تکرار ایجاد می کند. در هر تکرار یک کروموزوم/مدل معنایی جدید ارزیابی می شود. به طور مشابه، برای روش Associative & SFFS، یک تکرار جدید با افزودن یک ارتباط جدید به مدل ایجاد می‌شود. شکل 6 ، شکل 7هنگام رتبه‌بندی تصاویر از مجموعه داده‌های WROC برای Associative & SFFS و Associative & Genetic، محدوده MAP را نشان می‌دهد. نتایج مجموعه داده های UCI Statlog Landsat به دلیل کمبود فضا حذف شدند، اما از نظر رفتار مشابه هستند. به عنوان مثال، در شکل 6، در تکرار 1250 میانگین MAP برگردانده شده با روش Associative & SFFS در مجموعه آموزشی 72.33٪ و 59.99٪ در مجموعه تست بود. این نشان می دهد که به طور متوسط روش Associative & SFFS مدل را با داده های آموزشی به میزان 12.32 درصد اضافه می کند. برای همان تکرار، مقدار MAP بین 49.94٪ و 98.54٪ در مجموعه آموزشی و بین 30.81٪ و 87.71٪ برای مجموعه تست متغیر بود. همچنین، این شکل نشان می‌دهد که 150 تکرار آخر که MAP بهتری روی مجموعه آموزشی تولید کرده‌اند، مدل را بیش از حد برازش داده‌اند، زیرا آنها MAP را در مجموعه آزمایشی 0.4٪ کاهش داده‌اند.

شکل 6. محدوده MAP بر اساس تکرار برای ( a ) آموزش و ( b ) مجموعه داده های آزمایشی هنگام رتبه بندی تصاویر از مجموعه داده WROC با استفاده از Associative & SFFS.

شکل 7. محدوده MAP بر اساس تکرار برای ( a ) آموزش و ( b ) مجموعه داده های آزمایشی هنگام رتبه بندی تصاویر از مجموعه داده WROC با استفاده از Associative & Genetic.

شکل 7 نتایج مشابهی را برای روش Associative & Genetic نشان می دهد. در تکرار 1250 میانگین MAP برگشتی با این روش به ترتیب 78.06% و 72.34% در مجموعه آموزش و تست بود. این نشان می دهد که به طور متوسط روش Associative & Genetic مدل را به طور متوسط 5.72٪ به داده های آموزشی اضافه می کند که کمتر از نیمی از تغییرات اندازه گیری شده برای Associative & SFFS است. به طور مشابه، دامنه مقادیر MAP نسبت به روش Associative و SFFS با مقادیر بین 53.09٪ و 98.86٪ برای مجموعه آموزشی و 44.45٪ و 97.27٪ برای مجموعه تست، کوچکتر بود. برای همان تکرار، مقدار MAP بین 49.94٪ و 98.54٪ در مجموعه آموزشی و بین 30.81٪ و 87.71٪ برای مجموعه تست متغیر بود.

نتایج در این شکل‌ها نشان می‌دهد که مزایای روش Associative و Genetic به دو صورت است: (الف) مدل‌های آموزش‌دیده بهتر که میانگین MAP بالاتری را در داده‌های آموزشی به دست می‌آورند و (ب) بیش از حد برازش مدل‌ها با داده‌های آموزشی. برای ارزیابی بیشتر دلایل برازش روش‌های Associative و SFFS، ما همچنین تعداد قوانین را در مدل‌های معنایی تولید شده توسط دو روش ثبت کردیم. نتایج این آزمایش در شکل 8 برای مجموعه داده های UCI Statlog Landsat و در شکل 9 برای مجموعه داده های WROC نشان داده شده است. به عنوان مثال، در شکل 8(الف)، میانگین تعداد قوانین در یک مدل معنایی تولید شده توسط Associative و SFFS در تکرار 1250 در مجموعه داده UCI Statlog Landsat 65.25٪ با حداقل و حداکثر 27 و 1224 قانون است. برای همان تکرار و مجموعه داده، روش Associative & Genetic به طور متوسط 12.85 قانون با حداقل و حداکثر 4 و 18 قانون را برگرداند. این نشان می‌دهد که مزیت روش پیشنهادی نسبت به Associative & SFFS توسط مدل‌های صرفه‌جویی [ 48 ] آن ارائه می‌شود که به‌طور متوسط، پنج برابر اندازه کوچک‌تر هستند.

شکل 8. محدوده شمارش قوانین بر اساس تصاویر رتبه بندی تکراری با استفاده از روش Associative & SFFS در ( a ) UCI Statlog Landsat و ( b ) مجموعه داده های WROX.

شکل 9. محدوده شمارش قوانین بر اساس تصاویر رتبه بندی تکراری با استفاده از روش Associative & Genetic در ( الف ) UCI Statlog Landsat و ( ب ) مجموعه داده های WROX.

3.3. مطالعه تطبیقی رتبه بندی عملکرد

برای این آزمایش، ما هفت آزمایش رتبه‌بندی ده برابری را طراحی کردیم: (1) انجمن افزایشی همراه با SFFS [ 8 ]، (2) رتبه‌بندی گروهی با استفاده از شبکه‌های عصبی مصنوعی (ANN) [ 49 ] با AdaBoost [ 50 ]، (3) رتبه بندی گروه با استفاده از درخت تصمیم C4.5 (C4.5) [ 27 ] با AdaBoost، (4) درختان مدل لجستیک [ 51 ]، (5) رتبه بندی گروه با استفاده از TreeRank با هسته SVM [ 52 ]، (6) رتبه بندی گروه با استفاده از جنگل درختی با هسته SVM [ 52 ] و (7) رتبه بندی انجمنی افزودنی همراه با عملیات ژنتیکی همانطور که در بخش 2 توضیح داده شد . همه این آزمایش ها در محیط آماری R [ 53 ] اجرا شد]. برای آزمایش‌های (2) تا (6) از بسته‌های موجود در R استفاده کرده‌ایم. برای آزمایش‌های (1) و (7) از 1500 مرحله بهینه‌سازی استفاده کرده‌ایم. داده ها با استفاده از الگوریتم Boruta [ 54 ] برای انتخاب متغیر پیش پردازش شدند.

شکل 10مقایسه ای از هفت روش برای رتبه بندی تصاویر در دو مجموعه داده توصیف شده در بالا با استفاده از میانگین میانگین دقت (MAP) رتبه بندی را نشان می دهد. هنگام رتبه‌بندی تصاویر از مجموعه داده‌های UCI Statlog Landsat، روش پیشنهادی بهترین نتایج را با میانگین MAP 87.93٪ و به دنبال آن LMT با MAP 86.11٪ به دست آورد. هر دو روش انحراف استاندارد پایین 2.49% برای روش Associative & Genetic و 3.44% برای LMT را نشان دادند. عملکرد پایین توسط ANN و Adaboost – که مستعد بیش از حد برازش است – و SVM & TreeRank – که یک روش غیر گروهی است – به ترتیب با میانگین MAP 66.01٪ و 71.79٪ بازگشت داده شد. این دو روش همچنین انحراف استاندارد بالاتری از MAP را به ترتیب با 6.56% و 6.61% نشان دادند. هنگام رتبه‌بندی تصاویر از مجموعه داده‌های WROC، روش پیشنهادی بهترین نتایج را با میانگین MAP 73 بازیابی کرد. 30٪ در کنار SVM & TreeForest با نقشه 74.26٪. با این حال، روش پیشنهادی انحراف استاندارد کمی کمتر را در 9.55٪ در مقایسه با 10.29٪ برای SVM & TreeForest نشان داد. LMT برای این مجموعه داده پس از C4.5 و Adaboost در رتبه چهارم قرار گرفت. مشابه نتایج قبلی، عملکرد پایین توسط ANN & Adaboost، Associative & SFFS، و SVM & TreeRank به ترتیب با میانگین MAP 59.06٪، 60.12٪ و 60.47٪ بازگردانده شد.

شکل 10. نتایج MAP برای آزمایش‌های مقایسه‌ای برای رتبه‌بندی تصاویر بر اساس معناشناسی با استفاده از روش‌های رتبه‌بندی مختلف در ( الف ) مجموعه داده‌های UCI Statlog Landsat و ( ب ) مجموعه داده‌های WROC.

هنگام بررسی نتایج MAP برای هر برچسب معنایی، ما تغییرات گسترده ای را در عملکرد مشاهده می کنیم. برای مثال، روش Associative & SFFS هنگام رتبه‌بندی خاک قرمز معنایی (L1) در مجموعه داده‌های UCI Statlog Landsat، MAP 51.25% را برمی‌گرداند. این 24.65٪ کمتر از روش بعدی (SVM & TreeRank) است. در همان مجموعه داده، روش ANN و Adaboost MAP بسیار کم را برای خاک خاکستری مرطوب (L4) و خاک با کلش گیاهی (L5) با مقادیر MAP 37.40٪ و 37.80٪ نشان می دهد. ANN & Adabost همچنین عملکرد پایینی را برای Grassland (L150) و Barren ارائه کردند(L240) معنای مجموعه داده های WROC با مقادیر MAP 27.92٪ و 29.15٪ به ترتیب. تغییرات در روش‌های با عملکرد برتر نیز مشاهده می‌شود: روش پیشنهادی هنگام رتبه‌بندی پنج معنایی در بین دو مجموعه داده بهترین است، در حالی که SVM و TreeRank هنگام رتبه‌بندی نه معنایی در بین دو مجموعه داده بهترین هستند. با این حال، به طور متوسط، روش پیشنهادی بهترین نتایج را در بین دو مجموعه داده با میانگین 80.61٪، به دنبال LMT با 78.85٪ و SVM & TreeForest با 78.69٪ به دست آورد. این رفتار سازگارتر روش پیشنهادی را با احتمال کمتر برازش/زیاد برازش نشان می‌دهد.

برای تجزیه و تحلیل عمیق تر از دقت نتایج رتبه بندی شده، معیارهای دقیق و یادآوری را ارائه می دهیم. دقت اندازه گیری می کند که چه تعداد از تصاویر بازیابی شده در جستجوی معنایی واقعاً مرتبط هستند، در حالی که یادآوری اندازه گیری می کند که چه تعداد از تصاویر مرتبط با معنایی هدف واقعاً بازیابی شده اند. شکل 11معیارهای فراخوان دقیق درون یابی شده را برای هفت روش رتبه بندی نشان می دهد. به عنوان مثال، هنگام رتبه‌بندی تصاویر از مجموعه داده‌های UCI Statlog Landsat، روش پیشنهادی به طور متوسط دقت 95.47% را هنگام فراخوانی 20% از تصاویر مربوطه برمی‌گرداند. برای همان مجموعه داده ها و سطح فراخوان، LMT 94.76٪ بازده در حالی که SVM & TreeForest بازده 86.61٪. نتایج روی مجموعه داده‌های WROC نشان می‌دهد که روش پیشنهادی بهترین دقت را در نرخ‌های فراخوان پایین‌تر از 30 درصد برمی‌گرداند اما در سطوح بالاتر فراخوان بدتر عمل می‌کند. به عنوان مثال، در مجموعه داده‌های WROC و فراخوانی 60%، روش Associative & Genetic با دقت 68.81% پس از SVM & TreeForest، C4.5 و Adaboost، و SVM & TreeRank با دقت 77.09% در رتبه چهارم قرار می‌گیرد. به ترتیب 75.85 درصد و 74.01 درصد. این روند برای روش Associative & SFFS نیز مشاهده می‌شود که سه عملکرد برتر برای فراخوان‌های کمتر از 20 درصد است اما در سطوح بالاتر کاهش عملکرد را نشان می‌دهد. Associative & SFFS، Associative & Genetic، و LMT کمترین سطوح دقت را در 100% یادآوری نشان می‌دهند که به این واقعیت اشاره دارد که این روش‌ها نمی‌توانند کل جهان ویژگی را پوشش دهند و در نتیجه برخی از تصاویر را رتبه‌بندی نمی‌کنند. این نشان می دهد که برخی از مشکلات بیش از حد مدل های ایجاد شده با استفاده از این روش ها که برای روش هایی مانند SVM & TreeForest، SVM & TreeRank یا C4.5 و Adaboost کمتر مشهود هستند. و LMT کمترین سطوح دقت را در یادآوری 100% نشان می‌دهند که به این واقعیت اشاره دارد که این روش‌ها نمی‌توانند کل جهان ویژگی را پوشش دهند، و در نتیجه برخی از تصاویر را رتبه‌بندی نمی‌کنند. این نشان می دهد که برخی از مشکلات بیش از حد مدل های ایجاد شده با استفاده از این روش ها که برای روش هایی مانند SVM & TreeForest، SVM & TreeRank یا C4.5 و Adaboost کمتر مشهود هستند. و LMT کمترین سطوح دقت را در یادآوری 100% نشان می‌دهند که به این واقعیت اشاره دارد که این روش‌ها نمی‌توانند کل جهان ویژگی را پوشش دهند، و در نتیجه برخی از تصاویر را رتبه‌بندی نمی‌کنند. این نشان می دهد که برخی از مشکلات بیش از حد مدل های ایجاد شده با استفاده از این روش ها که برای روش هایی مانند SVM & TreeForest، SVM & TreeRank یا C4.5 و Adaboost کمتر مشهود هستند.

شکل 11. میانگین نتایج فراخوان دقیق برای آزمایش‌های مقایسه‌ای برای رتبه‌بندی تصاویر بر اساس معناشناسی با استفاده از هفت روش رتبه‌بندی مختلف در ( الف ) مجموعه داده‌های UCI Statlog Landsat و ( ب ) مجموعه داده‌های WROC.

به طور کلی، نتیجه گیری ما برای این آزمایش این است که چندین دلیل وجود دارد که باعث ایجاد تغییرات در عملکرد روش هایی می شود که ما تحلیل کردیم. به عنوان مثال، Associative & SFFS قادر است تنها آن دسته از تصاویری را رتبه بندی کند که الگوریتم Apriori برای آنها پیوندهای قوی را برگرداند و کاهش دقت در مقادیر فراخوان بالا نشان می دهد که برخی از تصاویر وجود دارند که در هیچ زیرفضای ویژگی تولید شده نگاشت نشده اند. الگوریتم SVM & TreeRank تنها الگوریتمی است که از روش‌های گروهی استفاده نمی‌کند و احتمالاً بیش از حد برازش می‌کند. مشاهده می کنیم که کیفیت رتبه بندی به طور قابل توجهی افزایش می یابد، زمانی که رویه های گروه جایگزین TreeRank شوند. برازش بیش از حد احتمالاً دلیل عملکرد ضعیف است که توسط ANN و AdaBoost بازگردانده شده است که به شدت به ویژگی شبکه عصبی در حالی که C4 بستگی دارد.

4. نتیجه گیری و کار آینده

ما یک رویکرد برای تولید مدل‌های انجمنی برای رتبه‌بندی مناطق تصویر ماهواره‌ای بر اساس پوشش زمین ایجاد کرده‌ایم. نتایج مطالعات تطبیقی ما نشان می‌دهد که روش پیشنهادی عملکرد بهتری دارد یا عملکردی مشابه با روش‌های دیگر مجموعه دارد. روش ما از روش‌های ژنتیکی برای بازگرداندن دقت بهتر در داده‌های آزمایش‌نشده جدید استفاده می‌کند، در حالی که با کاهش حداقل‌های محلی موجود در مدل‌های افزایشی، از برازش بیش از حد جلوگیری می‌کند. به طور کلی نتایج ما نشان می دهد که روش ژنتیکی قوانین ارتباط بهتری را سریعتر از روش افزایشی موجود کشف کرد. این نشان می‌دهد که روش‌های تداعی جایگزین‌های امیدوارکننده‌ای برای الگوهای بصری موجود در تصاویر ارائه می‌دهند، اگرچه آنها مستعد بیش از حد برازش هستند. کلید موفقیت آنها یک روش یادگیری کافی است که بتواند از حداقل های محلی جلوگیری کند. رویکردهای انجمنی قبلی از الگوریتم‌های استخراج قانون انجمن برای شناسایی فضاهای ویژگی مربوطه استفاده می‌کنند، اما از اندازه‌گیری ناکافی مربوط به قوانین انجمن، مانند پشتیبانی و اطمینان رنج می‌برند، که برای رتبه‌بندی مسائل بهینه نیستند. اگرچه آزمایش‌های ما در مقایسه با سایر روش‌های پیشرفته، شواهد روشنی از برتری روش پیشنهادی ارائه نکرد، اما درک آسان ماهیت مدل‌های تولید شده، برای تحقیقات آینده در زمینه‌هایی مانند تخصص و تخصص مفید است. آموزش تحلیلگران تصویر مدل‌های ژنتیکی همچنین دارای مزیت انتخاب تصادفی و آزمایش زیرفضاهای ویژگی جدید هستند که منجر به مدل‌های بهتر در زمان کوتاه‌تر می‌شود. اگرچه به طور خاص اندازه گیری نشده است، اما زمان آموزش یک جزء مهم در هر الگوریتم رتبه بندی است. مانند هر روش گروه دیگری، آموزش روش پیشنهادی متناسب با اندازه مجموعه آموزشی، تعداد قوانین در یک مدل معنایی و تعداد تکرارها است. این یک پیشرفت نسبت به روش‌های SFFS است که کاهش تعداد قوانین در یک مدل نیازمند پیچیدگی درجه دوم تعداد قوانین است.

کار آینده ما شامل یک ارزیابی جامع تر در مورد روش های مختلف تصویر و مجموعه های معنایی است، به ویژه برای مجموعه داده هایی که الگوهای بصری همپوشانی را نشان می دهند و رتبه بندی آنها دشوارتر است. به طور خاص در مورد عملیات ژنتیکی، ما قصد داریم ترکیب بهتری از عملیات ژنتیکی را ارزیابی کنیم که عملکرد را بیشتر بهبود بخشد. ما همچنین می خواهیم به زمان آموزش بپردازیم، که یک نقص شناخته شده در روش های گروهی است. رتبه‌بندی تصاویر متقابل منطقه‌ای نیز حوزه‌ای برای تحقیقات آینده است، زیرا روش‌های رتبه‌بندی برای داده‌های مناطق مختلف جهان، دقت کمتری را نشان می‌دهند.

منابع

داتکو، ام. سیدل، ک. مفاهیم انسان محور برای کاوش و درک تصاویر رصد زمین. IEEE Trans. Geosci. Remote Sens. 2005 ، 43 ، 601-609. [ Google Scholar ] [ CrossRef ]
Tseng، M.-H.; چن، اس.-جی. هوانگ، جی.-اچ. شن، ام.-ای. یک رویکرد مبتنی بر قانون الگوریتم ژنتیک برای طبقه‌بندی پوشش زمین ISPRS J. Photogramm. 2008 ، 63 ، 202-212. [ Google Scholar ] [ CrossRef ]
منیس، جی. گوو، دی. داده کاوی فضایی و کشف دانش جغرافیایی – مقدمه. محاسبه کنید. محیط زیست سیستم شهری 2009 ، 33 ، 403-408. [ Google Scholar ] [ CrossRef ]
داتکو، ام. سیدل، ک. کاوی اطلاعات تصویر: کاوش محتوای تصویر در آرشیوهای بزرگ. در مجموعه مقالات کنفرانس هوافضای IEEE 2000، Big Sky، MT، ایالات متحده آمریکا، 18-25 مارس 2000. جلد 3، ص 253-264.
هسو، دبلیو. لی، ام ال. ژانگ، جی. تصویر کاوی: روندها و تحولات. جی. اینتل. Inf. سیستم 2002 ، 19 ، 7-23. [ Google Scholar ] [ CrossRef ]
لیو، ی. ژانگ، دی. لو، جی. ما، W.-Y. بررسی بازیابی تصویر مبتنی بر محتوا با معناشناسی سطح بالا. تشخیص الگو 2007 ، 40 ، 262-282. [ Google Scholar ]
آکسوی، اس. Cinbis، R. تصویر کاوی با استفاده از محدودیت های فضایی جهت دار. IEEE Geosci. سنسور از راه دور Lett. 2010 ، 7 ، 33-37. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
بارب، ا. شیو، سی.- آر. مدل‌سازی بصری- معنایی در بازیابی اطلاعات مکانی مبتنی بر محتوا با استفاده از تکنیک‌های کاوی انجمنی. IEEE Geosci. سنسور از راه دور Lett. 2010 ، 7 ، 38-42. [ Google Scholar ] [ CrossRef ]
بلانچارت، پ. Datcu، M. یک الگوریتم نیمه نظارت شده برای حاشیه نویسی خودکار و کشف ساختارهای ناشناخته در پایگاه داده های تصاویر ماهواره ای. IEEE J. انتخاب کنید. موضوعات کاربردی رصد زمین. Remote Sens. 2010 ، 3 ، 698-717. [ Google Scholar ] [ CrossRef ]
براتاسانو، دی. ندلکو، آی. Datcu، M. پل زدن شکاف معنایی برای حاشیه نویسی تصاویر ماهواره ای و برنامه های نقشه برداری خودکار. IEEE J. انتخاب کنید. موضوعات کاربردی رصد زمین. Remote Sens. 2011 ، 4 ، 193-204. [ Google Scholar ] [ CrossRef ]
دوربا، اس. کینگ، آر. چارچوب فعال معناشناسی برای کشف دانش از آرشیو داده های رصد زمین. IEEE Trans. Geosci. Remote Sens. 2005 ، 43 ، 2563-2572. [ Google Scholar ] [ CrossRef ]
کلاریچ، م. اسکات، جی. شیو، سی.- آر. بازیابی مبتنی بر محتوای چند شیء چند شاخصه. IEEE Trans. Geosci. Remote Sens. 2012 , 50 , 4036–4049. [ Google Scholar ] [ CrossRef ]
لینو، م. مایتر، اچ. Datcu، M. حاشیه نویسی معنایی تصاویر ماهواره ای با استفاده از تخصیص دیریکله نهفته. IEEE Geosci. سنسور از راه دور Lett. 2010 ، 7 ، 28-32. [ Google Scholar ] [ CrossRef ]
مولینیر، ام. لاکسونن، جی. Hame، T. تشخیص ساختارهای دست‌ساز و تغییرات در تصاویر ماهواره‌ای با یک سیستم بازیابی اطلاعات مبتنی بر محتوا که بر روی نقشه‌های خود سازماندهی شده است. IEEE Trans. Geosci. Remote Sens. 2007 , 45 , 861-874. [ Google Scholar ] [ CrossRef ]
اسکات، جی. کلاریچ، م. دیویس، سی. شیو، سی.- آر. درخت بیت مپ متعادل با آنتروپی برای بازیابی اشیاء مبتنی بر شکل از پایگاه داده های تصاویر ماهواره ای در مقیاس بزرگ. IEEE Trans. Geosci. Remote Sens. 2011 ، 49 ، 1603-1616. [ Google Scholar ] [ CrossRef ]
شیو، سی.-ر. کلاریچ، م. اسکات، جی جی; بارب، ع. دیویس، CH; Palaniappan، K. GeoIRIS: بازیابی اطلاعات مکانی و سیستم نمایه سازی – محتوا کاوی، مدل سازی معناشناسی، و پرس و جوهای پیچیده. IEEE Trans. Geosci. Remote Sens. 2007 , 45 , 839-852. [ Google Scholar ] [ CrossRef ]
Sjahputera، O. اسکات، جی. کلایول، بی. کلاریچ، م. هادسون، ن. کلر، جی. دیویس، سی. خوشه بندی تغییرات شناسایی شده در تصاویر ماهواره ای با وضوح بالا با استفاده از یک الگوریتم تراکم رقابتی تثبیت شده. IEEE Trans. Geosci. Remote Sens. 2011 , 49 , 4687–4703. [ Google Scholar ] [ CrossRef ]
لی، دبلیو. راسکین، آر. Goodchild، M. سنجش تشابه معنایی مبتنی بر دانش کاوی: یک رویکرد شبکه عصبی مصنوعی. بین المللی جی. جئوگر. Inf. علمی 2012 ، 26 ، 1415-1435. [ Google Scholar ] [ CrossRef ]
آگراوال، آر. ایمیلینسکی، تی. سوامی، الف. قوانین انجمن معدن بین مجموعه ای از آیتم ها در پایگاه های داده بزرگ. در مجموعه مقالات کنفرانس بین المللی ACM SIGMOD در سال 1993 در مدیریت داده ها (SIGMOD ’93)، واشنگتن، دی سی، ایالات متحده آمریکا، 26-28 مه 1993. ص 207-216.
آگراوال، آر. Srikant، R. الگوریتم های سریع برای قوانین انجمن معدن در پایگاه های داده بزرگ. در مجموعه مقالات بیستمین کنفرانس بین المللی پایگاه های داده بسیار بزرگ (VLDB ’94)، سانفرانسیسکو، کالیفرنیا، ایالات متحده آمریکا، 12 تا 15 سپتامبر 1994. ص 487-499.
لدنر، آر. پتری، FE; Cobb، MA فازی رویکردهایی را برای داده کاوی مکانی قوانین تداعی مجموعه ای تنظیم کرد. ترانس. GIS 2003 ، 7 ، 123-138. [ Google Scholar ]
هوانگ، ی. چانگ، تی. Kao, L. استفاده از استراتژی SOM فازی برای بازیابی تصاویر ماهواره ای و استخراج اطلاعات. جی. سیست. سایبرن. Inf. 2008 ، 6 ، 56-61. [ Google Scholar ]
ثبتاه، اف. بررسی معادن طبقه بندی انجمنی. بدانید. مهندس Rev. 2007 , 22 , 37-65. [ Google Scholar ] [ CrossRef ]
هستی، تی. طبشیرانی، ر. Friedman, J. The Elements of Statistical Learning, Ser ; Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2009. [ Google Scholar ]
بلوم، آل. Langley, P. انتخاب ویژگی ها و مثال های مرتبط در یادگیری ماشین. آرتیف. هوشمند 1997 ، 97 ، 245-271. [ Google Scholar ] [ CrossRef ]
لی، دبلیو. هان، جی. Pei, J. CMAR: طبقه‌بندی دقیق و کارآمد بر اساس قوانین انجمن‌های چندگانه. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد داده کاوی (ICDM 2001)، سن خوزه، کالیفرنیا، ایالات متحده آمریکا، 29 نوامبر تا 2 دسامبر 2001. صص 369-376.
Quinlan, J. بهبود استفاده از ویژگی های پیوسته در C4.5. جی آرتیف. هوشمند Res. 1996 ، 4 ، 77-90. [ Google Scholar ]
پودیل، پ. نووویکووا، جی. کیتلر، جی. روش های جستجوی شناور در انتخاب ویژگی. تشخیص الگو Lett. 1994 ، 15 ، 1119-1125. [ Google Scholar ] [ CrossRef ]
ریبیرو، MX؛ بوگاتی، PH; ترینا، سی، جونیور؛ مارکز، PMA; رزا، NA; Traina، AJM پشتیبانی از بازیابی تصویر مبتنی بر محتوا و سیستم‌های تشخیص به کمک رایانه با تکنیک‌های مبتنی بر قوانین مرتبط. دانستن داده ها مهندس 2009 ، 68 ، 1370-1382. [ Google Scholar ] [ CrossRef ]
Freitas، A. مروری بر الگوریتم های تکاملی برای داده کاوی. در کتاب داده کاوی و کشف دانش ; Maimon, O., Rokach, L., Eds. Springer: New York, NY, USA, 2010; صص 371-400. [ Google Scholar ]
گلدبرگ، الگوریتم‌های ژنتیک DE در جستجو، بهینه‌سازی و یادگیری ماشین ، ویرایش اول. Addison-Wesley Longman Publishing Co., Inc.: Boston, MA, USA, 1989. [ Google Scholar ]
هالند، سازگاری JH در سیستم‌های طبیعی و مصنوعی: تحلیل مقدماتی با کاربردهای زیست‌شناسی، کنترل و هوش مصنوعی . انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 1992. [ Google Scholar ]
مامان، اچ. ایسون، جی. Kuszmaul, J. ارزیابی استفاده از اطلاعات طیفی و بافتی توسط یک الگوریتم تکاملی برای طبقه بندی تصاویر چند طیفی. محاسبه کنید. محیط زیست سیستم شهری 2009 ، 33 ، 463-471. [ Google Scholar ] [ CrossRef ]
شاد، ر. مسگری، ام اس; آبکار، ع. شاد، الف. پیش بینی آلودگی هوا با استفاده از کریجینگ عضویت خطی ژنتیکی فازی در GIS. محاسبه کنید. محیط زیست سیستم شهری 2009 ، 33 ، 472-481. [ Google Scholar ]
ژانگ، ایکس. وانگ، جی. وو، اف. فن، ز. Li، X. یک خوشه بندی فضایی جدید با محدودیت های موانع بر اساس الگوریتم های ژنتیک و k-Medoids. در مجموعه مقالات ششمین کنفرانس بین المللی طراحی و کاربردهای سیستم های هوشمند (ISDA ’06)، واشنگتن، دی سی، ایالات متحده آمریکا، 16-18 اکتبر 2006. جلد 1، ص 605–610.
گائو، ال. دای، اس. ژنگ، اس. Yan, G. استفاده از الگوریتم ژنتیک برای بهینه سازی داده کاوی در یک پایگاه داده تصویر. در مجموعه مقالات چهارمین کنفرانس بین المللی سیستم های فازی و کشف دانش (FSKD 2007)، هایکو، هاینان، چین، 24-27 اوت 2007. جلد 3، ص 721–723.
Bandyopadhyay، S.; Maulik، U. Mukhopadhyay، A. خوشه بندی ژنتیکی چند هدفه برای طبقه بندی پیکسل در تصاویر سنجش از دور. IEEE Trans. Geosci. Remote Sens. 2007 , 45 , 1506-1511. [ Google Scholar ] [ CrossRef ]
دی استفانو، سی. فونتانلا، اف. Marrocco, C. الگوریتم انتخاب ویژگی مبتنی بر GA برای تصاویر سنجش از دور. در مجموعه مقالات کنفرانس 2008 در مورد کاربردهای محاسبات تکاملی (Evo’08)، ناپل، ایتالیا، 26 مارس 2008. Springer-Verlag: برلین/هایدلبرگ، آلمان؛ ص 285-294.
داسیلوا، اس.اف. ریبیرو، MX؛ باتیستا نتو، جیدز; ترینا، سی، جونیور؛ Traina، AJM بهبود کیفیت رتبه بندی بازیابی تصویر پزشکی با استفاده از روش انتخاب ویژگی ژنتیکی. تصمیم می گیرد. سیستم پشتیبانی 2011 ، 51 ، 810-820. [ Google Scholar ] [ CrossRef ]
محروقی، م. یونان، ن. آنانتارج، وی. آنستوس، ج. یاراحمدیان، س. در مورد استفاده از تکنیک انتخاب ویژگی مبتنی بر فیلتر الگوریتم ژنتیک برای تخمین بارش ماهواره ای. IEEE Geosci. سنسور از راه دور Lett. 2012 ، 9 ، 963-967. [ Google Scholar ] [ CrossRef ]
بارب، ع. روش‌های ژنتیکی Barb، CS برای رتبه‌بندی معنایی انجمنی مناطق تصویر Landsat بر اساس پوشش زمین. در مجموعه مقالات کارگاه آموزشی کاوی اطلاعات تصویری، Oberpfaffenhofen، آلمان، 24-26 اکتبر 2012; آژانس فضایی اروپا و کمیسیون های تحقیقات مشترک: Oberpfaffenhofen، آلمان. صص 102-105.
Syswerda, G. A Study of Reproduction in Generational and Staady-state Genetic Algorithms. در مجموعه اولین کارگاه آموزشی مبانی الگوریتم های ژنتیک، پردیس بلومینگتون، IN، ایالات متحده آمریکا، 15-18 ژوئیه 1990. صص 94-101.
واوک، ف. فوگارتی، تی. مقایسه الگوریتم‌های ژنتیک حالت پایدار و نسلی برای استفاده در محیط‌های غیر ساکن. در مجموعه مقالات کنفرانس بین المللی IEEE در محاسبات تکاملی، ناگویا، ژاپن، 20-22 مه 1996. صص 192-195.
Davis, L. Handbook of Genetic Algorithms ; ون نوستراند راینهولد: نیویورک، نیویورک، ایالات متحده آمریکا، 1991. [ Google Scholar ]
شووه، جی. Tillé، Y. یک الگوریتم سریع برای نمونه برداری متعادل. محاسبه کنید. آمار 2006 ، 21 ، 53-62. [ Google Scholar ] [ CrossRef ]
کنسرسیوم ارتفوتوگرافی منطقه ای ویسکانسین (WROC). 2012. در دسترس آنلاین: http://www.ncwrpc.org/WROC/ (در 1 اوت 2012 قابل دسترسی است).
آسونسیون، آ. Newman، DJ UCI Machine Learning Repository. 2007. در دسترس آنلاین: http://www.ics.uci.edu/∼mlearn/MLRepository.html (در 1 مارس 2012 قابل دسترسی است).
Sober, E. مشکل سادگی چیست؟ Zellner, A., Keuzenkamp, H., McAleer, M., Eds. انتشارات دانشگاه کمبریج: کمبریج، انگلستان، 2002. [ Google Scholar ]
Bishop, C. Neural Networks for Pattern Recognition , 1st ed; انتشارات دانشگاه آکسفورد: نیویورک، نیویورک، ایالات متحده آمریکا، 1996. [ Google Scholar ]
فروند، ی. Schapire، R. یک تعمیم نظری تصمیم گیری از یادگیری آنلاین و یک کاربرد برای تقویت. جی. کامپیوتر. سیستم علمی 1997 ، 55 ، 119-139. [ Google Scholar ] [ CrossRef ]
لندور، ن. هال، م. فرانک، ای. درختان مدل لجستیک. ماخ فرا گرفتن. 2005 ، 59 ، 161-205. [ Google Scholar ] [ CrossRef ]
کلمنکن، اس. Vayatis، N. روش های رتبه بندی مبتنی بر درخت. IEEE Trans. Inf. نظریه 2009 ، 55 ، 4316-4336. [ Google Scholar ] [ CrossRef ]
تیم اصلی توسعه R. R: زبان و محیطی برای محاسبات آماری، R Foundation for Statistical Computing ; وین، اتریش، 2011. در دسترس آنلاین: http://www.R-project.org (در 1 نوامبر 2012 قابل دسترسی است).
Kursa، MB; Rudnicki، WR انتخاب ویژگی با بسته Boruta. J. Stat. نرم افزار 2010 ، 36 ، 1-13. [ Google Scholar ]

© 2013 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/3.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

چکیده

1. مقدمه