مجموعه ای از ابزارها برای تجزیه و تحلیل ROC مدل های فضایی

چکیده

ویژگی عملیاتی گیرنده (ROC) به طور گسترده ای برای ارزیابی عملکرد الگوریتم های طبقه بندی استفاده می شود. در GIScience، ROC برای ارزیابی مدل‌هایی با هدف پیش‌بینی رویدادها، مانند تغییر کاربری/پوشش زمین (LUCC)، توزیع گونه‌ها و خطر بیماری استفاده شده است. با این حال، بسته‌های نرم‌افزاری GIS تست‌های آماری و ابزارهای راهنمایی کمی برای تحلیل و تفسیر ROC ارائه می‌دهند. این مقاله مجموعه‌ای از ابزارهای GIS را ارائه می‌کند که برای تسهیل تجزیه و تحلیل منحنی ROC برای کاربران GIS با استفاده از آزمون‌های آماری مناسب و روش‌های تحلیل طراحی شده‌اند. ابزارها به صورت رایگان به عنوان مدل و زیرمدل نرم افزار رایگان Dinamica EGO در دسترس هستند. ابزارها منحنی ROC، ناحیه زیر منحنی (AUC)، AUC جزئی، AUCهای پایین و بالایی، فاصله اطمینان AUC را ارائه می دهند. چگالی رویداد در محفظه‌های احتمال و آزمون‌هایی برای ارزیابی تفاوت بین AUCهای دو مدل. ما ابتدا رویه‌ها و آزمون‌های آماری اجرا شده در Dinamica EGO را ارائه می‌کنیم، سپس ابزارهایی را برای ارزیابی LUCC و مدل‌های توزیع گونه‌ها ارائه می‌کنیم. در نهایت، ما آمار مربوط به ROC را که از مطالعات موردی مختلف حاصل می‌شود، تفسیر و بحث می‌کنیم.

کلید واژه ها:

دقت ؛ AUC ; دینامیکا ایگو ; LUCC ; پیش بینی ؛ ROC _ مدل سازی توزیع گونه ها ; عدم قطعیت ؛ اعتبار سنجی

1. مقدمه

تجزیه و تحلیل ویژگی های عملیاتی گیرنده (ROC) به فرد اجازه می دهد تا عملکرد روش های طبقه بندی باینری را با ترتیب رتبه یا مقادیر خروجی پیوسته ارزیابی کند. تجزیه و تحلیل ROC به طور گسترده در بسیاری از حوزه ها استفاده شده است، مانند تشخیص پزشکی [ 1 ]، مالی کمی [ 2 ]، بیوانفورماتیک [ 3 ] و GIS [ 4 ، 5 ، 6 ].

کاربردهای اصلی ROC در مطالعات مبتنی بر GIS به ارزیابی مدل‌های داده‌های شطرنجی با هدف پیش‌بینی تغییر کاربری/پوشش زمین، توزیع گونه‌ها، بیماری‌ها و خطرات بلایا و غیره مربوط می‌شود. تجزیه و تحلیل ROC برای ارزیابی عملکرد مدل‌های فضایی که یک نقشه «احتمال» تولید می‌کنند، استفاده می‌شود، که دنباله‌ای را ارائه می‌دهد که در آن مدل سلول‌های شبکه را برای تعیین وقوع یک رویداد خاص، به عنوان مثال، تغییر کاربری زمین، حضور یک گونه، انتخاب می‌کند. رانش زمین، آتش سوزی و غیرهما از اصطلاح “احتمال” استفاده می کنیم، اگرچه مقدار آن همیشه درست نیست، یک احتمال به معنای آماری بسته به الگوریتم مورد استفاده برای تولید مقدار. این مقدار اغلب به عنوان مناسب بودن، تمایل، پتانسیل انتقال، شاخص، احتمال یا ارزش امتیاز نامیده می شود. اگرچه ادبیات تجزیه و تحلیل ROC چند کلاسه را گزارش می کند [ 7 ]، ROC استاندارد بیشتر برای رویدادهای باینری استفاده می شود، به عنوان مثال، تغییر در مقابل عدم تغییر، حضور در مقابلعدم وجود یک گونه در رویکرد استاندارد ROC، نقشه احتمال پیش‌بینی‌کننده با نقشه رویداد باینری واقعی به منظور ارزیابی همزمانی فضایی بین رویداد و مقادیر احتمال مقایسه می‌شود. مدلی با قدرت پیش‌بینی بالا نقشه‌ای از احتمال تولید می‌کند که در آن احتمالات بسیار رتبه‌بندی شده با رویداد واقعی منطبق هستند. ROC آستانه های مختلفی را برای نقشه احتمال اعمال می کند تا دنباله ای از نقشه های رویداد پیش بینی شده باینری تولید کند ( شکل 1 ) و برای ارزیابی همزمانی بین رویدادهای پیش بینی شده و واقعی همانطور که در جدول 1 خلاصه شده است.

شکل 1. ( الف ) نقشه احتمال و ( ب ) نقشه باینری رویداد، برای 100 سلول شبکه. سلول‌های شبکه‌ای با احتمال زیاد تا متوسط (سلول‌های سیاه و خاکستری تیره) تمایل دارند با سلول‌های شبکه مشکی ۱۱ رویدادی منطبق شوند.

جدول 1. جدول احتمالی مورد استفاده برای محاسبه یک نقطه آستانه در منحنی ROC. Ht ، _Ft ، Mt و _Ct به ترتیب نسبت سلول‌های شبکه مربوط به ضربه‌ها، آلارم‌های کاذب، اشتباهات و رد صحیح هستند (اصلاح شده از Pontius و _Parmentier[ 6 _]) .

در منحنی ROC، محور افقی نرخ مثبت کاذب را نشان می‌دهد (نسبت سلول‌های هیچ رویدادی که به عنوان رویداد مدل‌سازی شده است، یعنی _Ft /( Ft + C t ₎₎ و محور عمودی نرخ مثبت واقعی (نسبت رویداد واقعی) را نشان می‌دهد. سلول‌هایی که به‌عنوان رویداد مدل‌سازی می‌شوند، یعنی _Ht / ₍Ht + M _t)). یک متریک خلاصه محبوب ناحیه زیر منحنی (AUC) است که نقاط به دست آمده توسط آستانه های مختلف را به هم متصل می کند. اگر رویدادهای واقعی کاملاً با احتمالات با رتبه بالاتر منطبق باشند، آنگاه مساحت زیر منحنی (AUC) برابر با یک است زیرا منحنی از نقطه (0,0) شروع می شود و از محور افقی تا نقطه (0,1) بالا می رود. ، و به سمت راست به نقطه (1،1). یک نقشه احتمال تصادفی یک منحنی ROC مورب تولید می کند که در آن نرخ مثبت واقعی برابر با نرخ مثبت کاذب در تمام نقاط آستانه است. هر نقشه احتمالی که دارای منحنی ROC زیر قطر باشد، نسبت به نقشه تصادفی قدرت پیش بینی کمتری دارد. در ادبیات، نرخ های مثبت کاذب و درست نیز به ترتیب به عنوان (1-ویژگی) و حساسیت نامیده می شوند ( شکل 2 ).

شکل 2. منحنی ROC برای نقشه های شکل 1 . نرخ های مثبت درست و غلط برای هر آستانه اعمال شده بر روی نقشه احتمال محاسبه می شود. برای تعریف اولین نقطه در مربع قرمز، مشاهده می‌کنیم که سطل اول دارای سلول‌هایی با کد 1 در یک نقشه آستانه است که 10 تاریک‌ترین سلول را با بیشترین احتمال ثبت می‌کند. چهار مورد از آنها با 11 سلول رویداد منطبق است، بنابراین یک نرخ مثبت واقعی = 4/11 ایجاد می کند. شش سلول دیگر با 89 سلول بدون رویداد منطبق است، بنابراین نرخ مثبت کاذب = 6/89 ایجاد می کند. نقطه بعدی در منحنی ROC با در نظر گرفتن تمام سلول های بالاتر از آستانه احتمال پایین بعدی تعریف می شود.

AUC اغلب برای مقایسه نقشه های احتمال استفاده می شود. هنگامی که داده های مورد استفاده برای ساخت منحنی ROC با نمونه گیری به دست آمد، چنین مقایسه ای باید با تجزیه و تحلیل آماری مناسب انجام شود. در برخی موارد، ارزیابی عملکرد باید بر روی بخش خاصی از منحنی ROC با استفاده از یک AUC جزئی متمرکز شود. بسته های نرم افزاری مختلفی برای تجزیه و تحلیل ROC در حال حاضر وجود دارد. به طور خاص، pROC یک بسته منبع باز برای R و S+ است که شامل تست های آماری متعدد برای مقایسه منحنی های ROC است [ 8 ]]. با این حال، این برنامه‌ها داده‌های شطرنجی را به‌عنوان ورودی نمی‌پذیرند و برای مجموعه‌های داده نسبتاً کوچک، مانند پایگاه‌های داده پزشکی با صدها یا هزاران مشاهدات، طراحی شده‌اند، و بنابراین هنگام پردازش صدها هزار مشاهدات معمولی از مجموعه داده‌های شطرنجی، عملکرد پایینی دارند. از سوی دیگر، نرم افزار GIS تست های آماری و ابزارهای تحلیلی کمی برای تجزیه و تحلیل ROC ارائه می دهد.

ابزارهای ارائه شده در این مقاله برای تسهیل تجزیه و تحلیل منحنی ROC برای کاربران GIS با ارائه چندین ابزار برای تجزیه و تحلیل و آزمون‌های آماری مناسب برای مقایسه طراحی شده‌اند. این ابزارها به کاربران اجازه می دهند منحنی های ROC را تولید کنند، نقاط استراتژیک را شناسایی کنند، AUC های کامل یا جزئی را به همراه فواصل اطمینان خود محاسبه کنند و دو منحنی ROC را از نظر آماری مقایسه کنند. ما این ابزارها را به عنوان مدل‌ها و زیرمدل‌های Dinamica EGO، یک پلتفرم نرم‌افزار رایگان برای مدل‌سازی محیطی [ 9 ] ( www.csr.ufmg.br/dinamica/ ) پیاده‌سازی کردیم.

مقاله به شرح زیر سازماندهی شده است: بخش 2 به طور خلاصه دینامیکا EGO را معرفی می کند و بخش 3 اجرای ابزارها را شرح می دهد. بخش 4 استفاده از این ابزارها را برای ارزیابی نقشه های بدست آمده از دو برنامه کاربردی مدل سازی رایج نشان می دهد. در نهایت، بخش 5 نتایج را تفسیر و بحث می کند.

2. دینامیکا ایگو

Dinamica EGO (از این پس Dinamica) بستری برای مدل‌سازی محیطی است که طراحی از مدل‌های فضایی استاتیک ساده تا پیچیده پویا را امکان‌پذیر می‌سازد. این مدل‌ها می‌توانند شامل تکرارهای تودرتو، بازخوردهای پویا، رویکردهای چند منطقه‌ای و چند مقیاسی، فرآیندهای تصمیم‌گیری برای انشعاب و پیوستن به خطوط لوله اجرا، دستکاری و ترکیب‌های جبری داده‌ها در قالب‌های مختلف، مانند نقشه‌ها، جداول، ماتریس‌ها و ثابت‌ها باشند. مجموعه‌ای از الگوریتم‌های فضایی کاربران را قادر می‌سازد تا شبیه‌سازی‌های فضا-زمان، از جمله تجزیه و تحلیل ساختار چشم‌انداز، کالیبراسیون مدل، شبیه‌سازی الگوهای فضایی تغییر و اعتبارسنجی مدل را توسعه دهند. نسخه 64 بیتی این نرم‌افزار از معماری پردازنده‌های متعدد بهره می‌برد و کتابخانه GDAL آن مجموعه‌های داده بزرگ را در بسیاری از قالب‌های شطرنجی و تقریباً هر طرح نقشه‌کشی یا مبنا را مدیریت می‌کند. مدل‌هایی که می‌توانند به عنوان گردش‌های کاری تعریف شوند که دنباله‌ای از عملیات ژئوپردازش را اجرا می‌کنند، با کشیدن و اتصال تابع‌های داده (اپراتورهای داده) در یک نمودار مدل نمایش داده شده در رابط گرافیکی ایجاد می‌شوند. در نهایت، مدل‌های موجود در Dinamica EGO را می‌توان به‌عنوان مدل‌های فرعی ذخیره کرد و به‌عنوان تابع‌های جدید در کتابخانه تابع ذخیره کرد، بنابراین به کاربران کمک می‌کند تا مدل‌ها را بهتر سازمان‌دهی، استفاده مجدد و به اشتراک بگذارند.9 ]. در مطالعه حاضر، ما یک کتابخانه جدید به نام “تحلیل ROC” متشکل از هفت مدل فرعی ایجاد کردیم که کاربر را قادر می‌سازد تا عملیات مختلف مربوط به تجزیه و تحلیل ROC را انجام دهد، به عنوان مثال، محاسبه AUC و AUC جزئی، تخمین اطمینان فاصله AUC، راه‌اندازی و نمونه‌برداری مجدد تصویر. . این کتابخانه برای دانلود در csr.ufmg.br/dinamica و http://www.ciga.unam.mx/ciga/images/proyectos/vigentes/modelos/images/ROC_tools.zip در دسترس است.

3. پیاده سازی تجزیه و تحلیل ROC برای نقشه های شطرنجی

برای ایجاد یک منحنی ROC، کاربر باید یک نقشه احتمال و یک نقشه رویداد ارائه دهد. به عنوان مثال، یک نقشه احتمال جنگل زدایی از یک بازه زمانی و یک نقشه باینری از جنگل زدایی واقعی در همان بازه زمانی. در بسته‌های نرم‌افزاری دیگر، یک الگوریتم اسکن خطی مشاهدات (سلول‌ها) را با کاهش احتمال مرتب می‌کند و سپس به پایین فهرست می‌رود، هر بار یک مشاهده را پردازش می‌کند و تعداد موارد مثبت درست و غلط را به‌روزرسانی می‌کند [ 7 ]]. در مورد مجموعه داده‌های شطرنجی، تعداد مشاهدات (سلول‌ها) اغلب برای انجام اسکن خطی بسیار زیاد است، بنابراین داده‌های ورودی با گروه‌بندی سلول‌هایی با احتمالات مشابه در سطل‌ها ساده می‌شوند. سه روش برای انتخاب آستانه های برش برای تعریف سطل ها وجود دارد. گزینه اول یک روش افزایش احتمال برابر است که در آن افزایش آستانه برش 0.1 که مقدار پیش فرض است، 10 بازه و در نتیجه 10 بن تولید می کند. افزایش آستانه 0.2 پنج فاصله و در نتیجه پنج سطل و غیره ایجاد می کند.این بازه‌ها محدوده احتمال یکسانی دارند، اما لازم نیست تعداد سلول‌های یکسانی داشته باشند، زیرا برای مثال، فاصله احتمال از 0.0 تا 0.1 لزوماً شامل 10٪ سلول‌ها نیست. گزینه دوم یک روش افزایش مساحت مساوی است که در آن می توان نقشه را با استفاده از سطل های مساوی طبقه بندی کرد، جایی که هر سطل تقریباً تعداد سلول های مشابهی دارد. مقدار پیش‌فرض آستانه 10 درصدی، 10 بن را تولید می‌کند که هر بن 10 درصد سلول‌ها را شامل می‌شود. برای این گزینه‌های اول و دوم، افزایش آستانه کوچک‌تر به سطل‌های بیشتر منجر می‌شود، که اجازه می‌دهد منحنی ROC دقیق‌تر و تخمین AUC دقیق‌تری داشته باشد، اما به زمان رایانه بیشتری نیاز دارد. گزینه سوم استفاده از آستانه های استراتژیک انتخاب شده توسط کاربر است. به عنوان مرحله زیر،

در مورد ارزیابی نقشه‌ها از مدل‌های پراکنش گونه‌ها، نقشه رویداد از نقاط وقوع (حضور گونه) استخراج شده و پس‌زمینه (یا بخشی از آن) به عنوان شبه غیبت در نظر گرفته می‌شود. پایگاه‌های اطلاعاتی بیولوژیکی به طور کلی شواهدی از غیبت ارائه نمی‌دهند، زیرا یک گونه می‌تواند در یک منطقه مشخص وجود داشته باشد بدون اینکه در طی بررسی میدانی شناسایی شود. علاوه بر این، اطلاعات غیبت برای مدل‌سازی پراکنش بالقوه کاربرد مشکوکی دارد، زیرا فقدان یک گونه به این معنی نیست که منطقه به عنوان یک زیستگاه بالقوه مناسب نیست [ 10 ]. ابزار Dinamica به کاربران اجازه می دهد منحنی ROC را با یک محور افقی جایگزین پیشنهاد شده توسط [ 10 ] بسازند.]، که پیشنهاد می کنند که محور افقی به جای نرخ مثبت کاذب، نسبت مساحت مطالعه پیش بینی شده موجود در محور افقی ( Ht + F _t_{) را نشان می دهد.}در واقع، این تغییر محور افقی باعث ایجاد تغییر زیادی در منحنی ROC نمی‌شود، زمانی که تعداد ضربه‌ها بسیار کمتر از تعداد آلارم‌های کاذب ( Ht << F _t₎ و تعداد سلول‌های حضور (نقاط وقوع) باشد. بسیار کوچکتر از تعداد شبه غیبت است ( H _t + M _t << F _t + C _t، اما محور افقی جایگزین می تواند به بینش های بیشتری در مورد منحنی ROC منجر شود.

3.1. تخمین AUC و pAUC

AUC ها با ذوزنقه ها محاسبه می شوند. به منظور محاسبه یک AUC جزئی (pAUC)، که با مساحت AEFD در شکل 3 نشان داده شده است، کاربران محدوده ای از منحنی ROC را برای تجزیه و تحلیل بر روی محور افقی (نرخ هشدارهای نادرست) یا محور عمودی (نرخ مثبت واقعی) تعریف می کنند ( شکل ). 3). ذوزنقه های خارج از محدوده جزئی نادیده گرفته می شوند. اگر محدوده جزئی با نقاط آستانه منطبق نباشد، ذوزنقه‌های جدیدی با استفاده از درونیابی خطی از طریق نقاط روی منحنی ROC کامل به منحنی اضافه می‌شوند. ابزار Dinamica به گزینه ای اجازه می دهد تا یک pAUC را محاسبه کند که با استفاده از رابطه (1) استاندارد شده است تا تفسیر مشابه AUC را ارائه دهد، به این معنی AUC = 0.5 برای یک منحنی ROC غیر متمایز که از نقشه احتمال تصادفی مشتق شده است، و AUC = 1.0 برای یک منحنی ROC کامل [ 8 ، 11 ].

(1)

که در آن pAUCs pAUC استاندارد شده است، تصادفی AUC pAUC است که توسط مدل تصادفی (مساحت ABCD) در همان محدوده منحنی ROC به دست می‌آید، و perfectAUC pAUC در همان محدوده منحنی ROC کامل (منطقه AGHD) است.

شکل 3. ناحیه جزئی زیر منحنی (AUC) برای محدوده ای در محور افقی. pAUC مربوط به منطقه AEFD است. مقدار آن با استفاده از pAUC یک مدل تصادفی (ناحیه ABCD) و یک مدل کامل (منطقه AGHD) استاندارد شده است.

در طول آستانه‌سازی نقشه احتمال، یک سطل منفرد ممکن است حاوی سلول‌هایی با احتمالات مختلف باشد. رویکرد ذوزنقه ای تغییرات درون یک سطل را نادیده می گیرد، زیرا رویکرد ذوزنقه ای از یک پاره خط مستقیم برای اتصال دو نقطه متوالی منحنی ROC استفاده می کند. آستانه‌های اضافی که سطل‌های کوچک‌تر را تعریف می‌کنند، می‌توانند منحنی ROC را اصلاح کنند، از لحاظ نظری تا جایی که هر سلول در یک سطل است. با این حال، این معمولا به دلیل محدودیت های محاسباتی امکان پذیر نیست. اگر تعداد bin ها بسیار کمتر از تعداد مقادیر احتمال یکتا باشد، در این صورت عدم قطعیت در مورد منحنی ROC و در نتیجه AUC وجود دارد که از نحوه تعریف بن ها ناشی می شود. برای این وضعیت، [ 6] دو ارزیابی اضافی از ROC به نام‌های ROClower و ROCupper را پیشنهاد کرد که بر اساس منحنی‌های شکل پلکانی هستند که به ترتیب در زیر و بالای منحنی ذوزنقه‌ای ROC قرار دارند. از این دو منحنی اضافی، دو مقدار AUC به ترتیب به نام‌های AUClower و AUCupper استخراج می‌شوند. مقادیر آنها برای ارزیابی عدم قطعیت مربوط به انتخاب آستانه برای نقشه احتمال مفید است.

3.2. فاصله اطمینان

هنگامی که AUC یا pAUC از یک نمونه مشتق می شود، فواصل اطمینان (CIs) را می توان با نمونه گیری مجدد طبقه بندی شده بوت استرپ تخمین زد. نقشه‌های تکراری جدید احتمال با نمونه‌گیری مجدد با جایگزینی از نقشه احتمال اولیه تولید می‌شوند. ابزار Dinamica از طبقه‌بندی استفاده می‌کند تا اطمینان حاصل کند که هر نمونه همان نسبت سلول‌های رویداد را در داده‌های اصلی دارد. تجزیه و تحلیل ROC بر روی هر نقشه تکرار شده برای محاسبه AUC یا pAUC انجام می شود. سپس CI ها با استفاده از دو رویکرد برآورد می شوند. اولین مورد بر اساس یک فرض توزیع نرمال است و مرزهای CI را با استفاده از انحراف استاندارد AUCهای تکرار شده و یک جدول نرمال استاندارد برای به دست آوردن احتمال مشاهده AUC در زیر، بالاتر یا بین مقادیر معین تخمین می زند. روش دوم روش فاصله صدک بوت استرپ است،

برای انجام بوت استرپینگ، احتمال Pk برای سلولی که k بار در یک تکرار بوت استرپ انتخاب _شود با رابطه (2) محاسبه می شود :

(2)

که در آن Pk احتمال انتخاب یک سلول _k بار در یک نسخه بوت استرپ است که در آن n تعداد سلول‌های لایه‌ای است که سلول به آن تعلق دارد .

به منظور جلوگیری از سرریز محاسباتی، فرمول سرریز قوی برای محاسبه ضرایب دو جمله ای ارائه شده توسط [ 12 ] اصلاح شد، بنابراین معادلات (3a) و (3b) تولید شد:

اگر n − k < k

(3a)

دیگر

(3b)

3.3. مقایسه دو منحنی ROC

معمولاً مقایسه مقادیر AUC یا pAUC بین منحنی‌های ROC جفت شده مفید است. این جفت ها ممکن است از مفاهیم مختلفی ناشی شوند. به عنوان مثال، یک مجموعه واحد از داده ها می تواند دو نقشه احتمال متفاوت را به دلیل دو روش تحلیل متفاوت تولید کند. وقتی منحنی‌های ROC از یک نمونه استخراج می‌شوند، ارزیابی اینکه آیا تفاوت از نظر آماری معنی‌دار است یا اینکه آیا این تفاوت را می‌توان به تغییرپذیری ناشی از نمونه‌گیری نسبت داد، مهم است. برای این وضعیت، یک آزمون بوت استرپ بر اساس روش هانلی و مک نیل اصلاح شده توسط [ 8 ] بر اساس محاسبه Z با استفاده از رابطه (4) اجرا شد:

(4)

که در آن AUC ₁ و AUC ₂ دو AUC هستند و sd (AUC ₂– AUC ₁) انحراف استاندارد تفاوت بین دو AUC با تکرارهای متعدد است. از آنجایی که Z تقریباً یک توزیع نرمال را نشان می دهد، مقادیر p یک یا دو دنباله به ترتیب برای انجام تست های یک یا دو دنباله محاسبه می شوند. همین مفاهیم در مورد AUC های جزئی نیز صدق می کند.

با در نظر گرفتن تغییرات ناشی از تخصیص مکان تصادفی در نقشه تصادفی، آزمایش اینکه آیا یک نقشه تناسب جمعیت کامل AUC متفاوتی نسبت به نقشه تصادفی ایجاد می کند یا خیر، می تواند مفید باشد. بنابراین، شبیه‌سازی مونت کارلو را می‌توان توسط دینامیکا انجام داد تا آزمایش کند که آیا مدل مکان‌هایی را به طور قابل‌توجهی متفاوت از تصادفی اختصاص می‌دهد [ 13 ]. در این مورد از همان آماره Z استفاده می شود.

3.4. بهبود در استفاده و تفسیر منحنی های ROC

بهبودهای استفاده از ROC و AUC آن که توسط [ 6 ] پیشنهاد شده بود در مجموعه ابزارها اجرا شد. این پیشرفت‌ها انتقاداتی را مطرح می‌کنند که AUC نباید به عنوان تنها شاخص عملکرد مدل استفاده شود، زیرا AUC یک معیار بالقوه گمراه‌کننده است [ 10 ، 14 ]. ما یک مدل دینامیکا را برای تولید تابع توزیع تجمعی (CDF) طراحی کردیم، که یک هیستوگرام تجمعی از فرکانس سلول ها به عنوان تابعی از احتمال است. محققان می‌توانند از CDF برای انتخاب آستانه‌های مهمی برای منحنی ROC استفاده کنند، مانند آستانه‌هایی که چارک اول، میانه، چارک سوم منطقه مورد مطالعه و آستانه‌ای که در آن Ht + M _{t را در بر}_{می‌گیرد.}برابر H _t + F _t است. به منظور برجسته کردن نقاط آستانه مهم در منحنی ROC، ابزاری برای نشان دادن احتمال متناظر آستانه و نسبت منطقه مورد مطالعه که احتمال زیر آستانه دارد طراحی شد. در نهایت، چگالی وقوع رویداد در هر سطل منحنی ROC به عنوان نسبت بین سلول‌های وقوع و سلول‌های کاندید یک سطل معین محاسبه شد (معادله (5)). نتیجه را می توان با نمودار میله ای یا نقشه نشان داد.

(5)

که در آن D _t تراکم سلول های رخداد در bin t است، Ht و Ht + 1 به ترتیب در آستانه t و t + 1 و M t و M _t + 1 به _ترتیب در آستانه _t_و t + 1 رد می شوند.

3.5. کاهش زمان محاسبات

روش های مونت کارلو و بوت استرپ شامل تعداد زیادی تکرار است. هر تکرار به چندین عملیات جبر نقشه از کل نقشه ها نیاز دارد، بنابراین نیاز به زمان محاسباتی قابل توجهی دارد. به منظور سرعت بخشیدن به پردازش، ابزاری ایجاد کردیم که به صورت تصادفی از تصاویر احتمال و وقوع نمونه برداری می کند تا از داده های کمتری هنگام محاسبه شاخص ها بر اساس این فرآیندهای تکراری استفاده شود. نمونه برداری به منظور کنترل نسبت نمونه برداری برای سلول های رویدادی و بدون رویداد طبقه بندی می شود. به عنوان مثال، در مدل سازی طاقچه، تعداد سلول های شبه غیبت به طور کلی بسیار بیشتر از سلول های حضور است، بنابراین باید تنها داده های شبه عدم حضور را کاهش داد. در نتیجه، نقشه‌های جدید حاوی تعداد کمتری سلول از سلول‌های نمونه‌برداری شده برای فرآیندهای بعدی تولید می‌شوند. ساختار فضایی نقشه های اصلی حفظ نشده است. با این حال،شکل 4 روش نمونه گیری مجدد را با استفاده از داده های شکل 1 نشان می دهد. از نمونه‌گیری طبقه‌ای تصادفی برای انتخاب پنج سلول به ترتیب برای دسته‌های رویداد و بدون رویداد استفاده می‌شود. سپس با استفاده از اطلاعات این ده سلول انتخابی، نقشه‌های رویداد و احتمال «کاهش‌شده» جدید (1 × 10 سلول) ساخته می‌شوند. فرآیندهای تکراری شامل تعداد زیادی تکرار با استفاده از این تصاویر “کاهش یافته” انجام می شود. ما تأثیر روش نمونه‌گیری مجدد را بر دقت AUC در بخش 4.2 بررسی می‌کنیم.

شکل 4. روش نمونه گیری. تصویر اصلی خط به خط خوانده می شود و سلول های انتخاب شده در یک نقشه نمونه برداری مجدد یک خطی مرتب می شوند.

4. برنامه های کاربردی

ما مجموعه ای از ابزارها را در دو تمرین مدل سازی اعمال کردیم. اولین مورد شامل یک مدل تغییر کاربری و پوشش زمین (LUCC) در آمازون برزیل است که با استفاده از Dinamica EGO اجرا شده است. دومی مدلی از توزیع تنبل سه انگشتی گلو قهوه ای ( Bradypus variegatus ) است که با استفاده از MaxEnt [ 15 ] و Dinamica EGO [ 16 ] پیاده سازی شده است.

4.1. مدل تغییر کاربری/پوشش (LUCC).

داده های مطالعه موردی با بسته نصبی Dinamica EGO ارائه می شود. هدف آن مدل سازی الگوهای فضایی جنگل زدایی در شمال ماتو گروسو، مرز کشاورزی در آمازون برزیل است. مدل جنگل زدایی از وزن شواهد (WofE) برای تهیه نقشه احتمال جنگل زدایی پس از سال 1994 ( شکل 5 ) با استفاده از لایه های داده زیر استفاده کرد: پوشش جنگلی 1991، پوشش جنگلی 1994، فاصله تا جاده ها، فاصله. به جنگل و شیب [ 17]. در بسیاری از مدل‌های LUCC، از این نوع نقشه احتمالی برای تهیه نقشه‌های پوشش زمین با تخصیص جنگل‌زدایی در آینده استفاده می‌شود. روش شبیه سازی معمولاً تغییرات را در مناطقی که احتمال انتقال بالاتری را نشان می دهند اختصاص می دهد. به منظور ارزیابی قدرت پیش بینی نقشه احتمال، نقشه احتمال جنگل زدایی را از طریق تحلیل ROC با جنگل زدایی واقعی بین سال های 1994 و 1999 مقایسه کردیم ( شکل 6 ).

شکل 5. ( الف ) نقشه تغییر پوشش جنگلی مشاهده شده طی سال های 1994-1999 و ( ب ) احتمال جنگل زدایی پس از سال 1994. مناطق سفید غیر جنگلی در سال 1994 از تجزیه و تحلیل حذف شدند.

شکل 6. منحنی ROC با مقایسه احتمال نقشه جنگل زدایی پس از سال 1994 با جنگل زدایی مشاهده شده بین سال های 1994 و 1999، با استفاده از 100 سطل و روش افزایش احتمال برابر به دست آمد. نقطه شناسایی شده در منحنی ROC مربوط به منطقه ای است که انتظار می رود در طول سال های 1994-1999 جنگل زدایی شود، با فرض اینکه روندهای قبل از 1994 پس از سال 1994 ادامه یابد. در محور نرخ مثبت کاذب.

AUC 0.67 است که تفاوت قابل توجهی با یک مدل تصادفی دارد. آزمون Z با 2000 تکرار مونت کارلو Z = 118، p-value = 5 × ^10-89 بود.

بر اساس برون یابی خطی نرخ جنگل زدایی مشاهده شده در بازه کالیبراسیون 1991-1994 (14100 هکتار در سال)، انتظار می رود که حدود 37٪ از مساحت جنگل 1994 طی سال های 1994-1999 پاکسازی شود که معادل 70500 هکتار از 1906000 است. هکتار از جنگل 1994. بنابراین، یک آستانه استراتژیک مربوط به 37 درصد از مساحت جنگلی در سال 1994 است. این نقطه با احتمال 0.87 مطابقت دارد و در مختصات (0.25، 0.47) روی منحنی ROC قرار دارد. اگر pAUC را به بازه 0-0.25 در محور نرخ مثبت کاذب محدود کنیم، آنگاه pAUC روی قسمتی از منحنی متمرکز خواهد شد که نقشه احتمال بالاترین مقادیر خود را دارد. pAUC نرمال شده 0.602 برای این بخش از منحنی ROC پیدا شد. مدل‌های تصادفی، مانند Dinamica، برخی از تغییرات شبیه‌سازی شده را در سلول‌های با احتمال کم تخصیص می‌دهند.18 ]، از این رو عملکرد مدل به بخش وسیع تری از منحنی ROC بستگی دارد.

ارزیابی مدل‌های LUCC از طریق تجزیه و تحلیل ROC بر اساس همزمانی تغییرات مشاهده‌شده و نقشه احتمال تغییر تولید شده توسط مدل، بدون توجه به تخصیص فضایی ضربه‌ها، خطاها، آلارم‌های کاذب و رد صحیح است. جنبه های فضایی اضافی را می توان در نظر گرفت مانند واقع گرایی الگوهای مناظر شبیه سازی شده [ 18 ] و تطابق تغییرات در یک محله جستجو [ 19 ]. از این نظر، یک سری از معیارهای مقایسه نقشه موجود در دینامیکا می تواند ارزیابی ROC [ 9 ] را تکمیل کند.

4.2. مدل های توزیع گونه ها

ما نقشه‌های توزیع بالقوه Bradypus variegatus را با استفاده از داده‌های (موجود در http://www.cs.princeton.edu/~schapire/maxent/ ) [ 15 ] با استفاده از بسته برنامه MaxEnt (رویکرد حداکثر آنتروپی، [ 15 ]) تولید کردیم. ) و روش Weights of Evidence (WofE) که در Dinamica EGO موجود است. داده های وقوع به طور تصادفی به دو زیر مجموعه تقسیم شدند. ما مدل‌هایی را با استفاده از زیرمجموعه اول، متشکل از 81 رخداد به اضافه 699719 سلول شبه غیبت، آموزش دادیم. سپس تجزیه و تحلیل ROC را با استفاده از زیرمجموعه دوم انجام دادیم که شامل 34 رخداد به علاوه 651316 سلول شبه عدم وجود است. تجزیه و تحلیل ROC نیز پس از نمونه برداری مجدد از داده های زیرمجموعه دوم با استفاده از روشی که در بخش 3.5 توضیح داده شده است، انجام شد.. ما از 100 درصد داده‌های وقوع (34 سلول) و تقریباً 10 درصد از داده‌های شبه غیبت (حدود 65000 سلول تصادفی) استفاده کردیم. در نتیجه، نمونه‌برداری مجدد ما را قادر می‌سازد تا نقشه‌هایی را با 65034 سلول به جای نقشه‌های اصلی با 1929504 (1592 × 1212) سلول پردازش کنیم. این ما را قادر می سازد تا بوت استرپ را با 2000 تکرار در زمان معقول انجام دهیم، به ویژه 6 ساعت و 35 دقیقه با استفاده از یک رایانه رومیزی با پردازنده i7-3770k 3.50 گیگاهرتز و 24 گیگابایت رم.

شکل 7 ، شکل 8 نقشه های احتمال و توابع توزیع تجمعی (CDF) به دست آمده از WofE و MaxEnt را نشان می دهد. نقشه احتمال به دست آمده با روش WofE دارای مقادیر پیوسته کمتری است زیرا در این روش از نقشه های طبقه بندی شده به دست آمده از طبقه بندی مجدد متغیرهای توضیحی پیوسته استفاده می شود. حدود 97 درصد از سلول‌های MaxEnt دارای مقادیر احتمالی زیر 0.6 هستند، در حالی که 74 درصد از سلول‌های WofE دارای مقادیر احتمالی زیر 0.6 هستند.

شکل 7. نقشه‌های احتمال حضور B. variegatus به‌دست‌آمده با روش‌های Weights of Evidence (WofE) و MaxEnt.

شکل 8. توابع توزیع تجمعی (CDF) برای نقشه های احتمال از WofE و MaxEnt. محور عمودی نسبتی از ناحیه کاندید است که مقادیر احتمالی آن کمتر یا مساوی با مقدار روی محور افقی است.

شکل 9 نشان می دهد که منحنی ROC از MaxEnt ناگهانی تر از WofE افزایش می یابد. شکل منحنی نزدیک به مبدأ نشان می‌دهد که مناطق با احتمال بالا از MaxEnt سلول‌های حضور بیشتری را نسبت به مناطق با احتمال بالا به‌دست‌آمده از WofE می‌گیرند. هر دو منحنی بسیار نزدیک به سمت راست بالای منحنی ROC هستند، که نشان می دهد که احتمالات کم مربوط به مناطقی است که گونه وجود ندارد.

مقدار دقیق AUC به دست آمده از دو روش با استفاده از بسته pROC [ 8 ] که از الگوریتم اسکن خطی شرح داده شده توسط [ 7 ] استفاده می کند، محاسبه شد. AUC برای WofE و MaxEnt به ترتیب 0.7478 و 0.8110 محاسبه شد. جدول 2مقادیر AUC محاسبه شده با استفاده از چهار افزایش آستانه برای روش افزایش احتمال برابر و برای روش افزایش مساحت مساوی به همراه تفاوت بین این مقادیر و مقدار دقیق AUC (در درصد مقدار دقیق) را نشان می دهد. نتایج به‌دست‌آمده با استفاده از سطل‌های 100 و 20 دارای اختلاف کمتر از 2 درصد (افزایش احتمال برابر) هستند، در حالی که نتایج مبتنی بر 10 و 5 بن‌ها تخمین‌های دقیق‌تری ندارند (خطای بین 2 تا 10 درصد برای افزایش احتمال مساوی). استفاده از داده‌های نمونه‌گیری مجدد تأثیر مهمی بر تخمین‌های AUC ندارد. روشی که برای آستانه گذاری نقشه احتمال استفاده می شود تأثیر بیشتری نسبت به تعداد bin ها دارد. هر دو رویکرد منجر به دست کم‌گرفتن سیستماتیک AUC شدند، در حالی که برای روشی که از افزایش مساحت مساوی استفاده می‌کند، برای مطالعه موردی ما، کمتر برآورد شدیدتر است (خطای بین 0.3٪ و 9.3٪ و بین 5).

شکل 9. منحنی های ROC به دست آمده با روش WofE و MaxEnt. ناحیه سایه دار خاکستری نشان دهنده AUC جزئی مدل WofE بین 0.95 و 1 در محور نرخ مثبت واقعی است. pAUCها برای WofE و MaxEnt مشابه هستند، که نشان می‌دهد نقشه‌های احتمال در مورد جایی که احتمالات نسبتاً پایین‌تر تخصیص داده می‌شوند مشابه هستند.

جدول 2. مقادیر AUC به دست آمده با استفاده از افزایش آستانه های مختلف و روش های برش بر روی داده های کل و نمونه برداری مجدد. مقادیر دقیق AUC برای WofE و MaxEnt به ترتیب 0.7478 و 0.8110 است. عدد بین پرانتز خطای تخمینی است که به صورت تفاوت نسبی بین مقدار و مقدار دقیق (در درصد مقدار دقیق) بیان می‌شود.

افزایش احتمال برابر

افزایش مساحت مساوی

جدول 3 AUClower و AUCupper را نشان می دهد که با چهار افزایش احتمال برابر متفاوت (0.01، 0.05، 0.10 و 0.20) محاسبه شده اند، که دلالت بر چهار اندازه سطل مختلف (100، 20، 10 و 5) دارد. ما از کل منطقه مورد مطالعه و نقشه احتمال WofE استفاده کردیم. همانطور که انتظار می رود، در افزایش برش درشت، عدم قطعیت تخمین AUC بزرگ است (0.5952-0.8218 برای 5 سطل) و با استفاده از فواصل باریک تر (0.7299-0.7617 برای 100 سطل) به طور قابل توجهی کاهش می یابد. اثر فواصل مورد استفاده برای برش تصویر احتمال را می توان در شکل 10 درک کرد .

ما AUC جزئی را برای محدوده بین 0.95 و 1 در محور نرخ مثبت واقعی (عمودی) همانطور که توسط [ 10 ] پیشنهاد شده است محاسبه کردیم. در نهایت، ما فواصل اطمینان را برای AUC و pAUC از طریق روش فاصله صدک راه‌اندازی با 2000 تکرار محاسبه کردیم و سپس تفاوت مقادیر AUC و pAUC بین دو مدل را آزمایش کردیم ( جدول 4 ).

جدول 3. مقادیر AUC بالایی، ذوزنقه ای و پایینی در تعداد سطل های مختلف برای روش افزایش احتمال برابر.

شکل 10. منحنی های ذوزنقه ای، پایین و بالایی ROC از همان نقشه احتمال با افزایش 0.05 ( چپ ) و 0.2 ( راست ) افزایش می یابد. وقتی افزایش آستانه 0.2 باشد، تعداد بن ها 5 است. وقتی افزایش آستانه 0.05 باشد، تعداد بن ها 20 است.

جدول 4. مقادیر AUC و AUC جزئی به همراه فاصله اطمینان آنها با استفاده از آلفا = 0.05 به دست آمده با استفاده از WofE و MaxEnt. AUC جزئی بین 0.95 و یک در محور نرخ مثبت واقعی (عمودی) محاسبه شد، مقادیر گزارش شده نرمال می شوند.

آزمون مورد استفاده برای مقایسه AUC و pAUC به‌دست‌آمده از هر دو مدل نشان داد که AUC به‌دست‌آمده از MaxEnt به‌طور قابل‌توجهی با AUC به‌دست‌آمده از WofE متفاوت است (Z = 1.73، دو دنباله p-value = 0.084). با این حال تفاوت معنی داری بین دو pAUC وجود ندارد (Z = 0.00، دو دنباله p-value = 0.999). این نشان می‌دهد که اگر نقشه‌های توزیع پتانسیل با اعمال آستانه‌ای در نقشه‌های احتمال با احتمالی مطابق با نرخ مثبت واقعی 0.95 به دست آیند، آن‌گاه MaxEnt و WofE هر دو نقشه‌های توزیع بالقوه را تولید خواهند کرد که مناطق و تعداد نقاط وقوع مشابه را ثبت می‌کنند.

روش دیگر برای مقایسه دو نقشه احتمال، ارزیابی چگالی نقاط وقوع در هر سطل است ( شکل 11 ). شکل 11 نشان می دهد که سطل های احتمال زیاد MaxEnt دارای تراکم نقاط وقوع بیشتری نسبت به سطل های احتمال بالا WofE هستند. این با منحنی ROC MaxEnt که به طور ناگهانی در نزدیکی مبدا فضای ROC نسبت به منحنی ROC WofE افزایش می یابد مطابقت دارد ( شکل 9 ).

شکل 11. تراکم وقوع گونه ها به صورت نسبت (%) در هر سطل بیان شده است (معادله (5)). سطل ها با احتمال کمتر در سمت چپ و احتمال بیشتر در سمت راست با استفاده از روش افزایش احتمال برابر مرتب می شوند.

5. بحث

برای مجموعه داده های بزرگ، تعداد مشاهدات (سلول ها) برای اجرای الگوریتم اسکن خطی [ 7 ] بسیار زیاد می شود. بنابراین، ابزار ما نقشه احتمال را با گروه بندی مجدد سلول ها در سطل ها ساده می کند. علاوه بر این، نقشه‌های ورودی مجدداً نمونه‌برداری شدند تا ابعاد آنها کاهش یابد. همانطور که در جدول 2 نشان داده شده است ، برخی از این عملیات می تواند منجر به تغییرات تخمین AUC شود. در مطالعه موردی ما، انتخاب بین مساحت مساوی در مقابلروش فاصله برابر تأثیر بیشتری بر AUC نسبت به تعداد سطل‌ها و نمونه‌گیری مجدد داشت، زیرا رویکرد مساحت مساوی AUC را به طور سیستماتیک دست‌کم گرفت. با استفاده از روش احتمال برابر، تعداد افزایش‌ها در صورت کافی (0.01 و 0.05 معادل 100 و 20 بن به ترتیب) و نمونه‌برداری مجدد (10% عدم وقوع) منجر به خطای تخمین AUC کمتر از 2% می‌شود. این نتایج به مطالعه موردی خاص وابسته است و نمی توان آن را به عنوان قوانین کلی تفسیر کرد. به عنوان مثال، تاثیر روش برش به توزیع مقادیر احتمال بستگی دارد که توسط CDF نشان داده شده است ( شکل 8)). محاسبه AUClower و AUCupper به فرد امکان می دهد عدم قطعیت را به دلیل آستانه بودن تصویر احتمال ارزیابی کند. علاوه بر این، برآورد AUC می تواند تحت تأثیر عوامل دیگری غیر از محاسبات باشد. به عنوان مثال، در مدل های طاقچه، داده های وقوع اندک است، که اغلب از یک نمونه مغرضانه به دست می آیند و می توانند خطاهایی داشته باشند که بر محل نقاط مشاهده یا شناسایی گونه تأثیر بگذارد. در مدل‌سازی LUCC، داده‌ها را می‌توان تحت تأثیر خطاهای طبقه‌بندی در تصاویر مورد استفاده برای نظارت بر تغییرات قرار داد.

محاسبه فاصله اطمینان AUC توسط بوت استرپ به فرد اجازه می دهد تا تأثیر اندازه نمونه را بر دقت AUC ارزیابی کند. با این حال، فواصل اطمینان، سوگیری احتمالی نمونه را در نظر نمی گیرند. برای مثال، اگر داده‌های حضور یک گونه به‌دلیل دسترسی آسان‌تر، به‌طور سیستماتیک به سمت ارتفاع کم سوگیری شود، آن‌گاه مجموعه داده‌هایی که برای آموزش و آزمایش نقشه توزیع استفاده می‌شوند، این تعصب را به ارث خواهند برد. در نتیجه، AUC محاسبه‌شده و فاصله اطمینان آن می‌تواند AUCهای بزرگ‌تری نسبت به یک تخمین بی‌طرف داشته باشد، زیرا هم داده‌های آموزشی و هم ارزیابی حضور گونه‌ها را در مناطق مرتفع‌تر دست‌کم می‌گیرند. در نتیجه، زمانی که نمونه گیری نماینده کل جامعه نیست، کاربران باید با این شاخص ها محتاط باشند.

با وجود افزایش کارایی محاسباتی رویکرد ما در مقایسه با الگوریتم اسکن خطی، برخی از الگوریتم‌های ما هنوز می‌توانند به زمان‌های محاسباتی طولانی نیاز داشته باشند. به عنوان مثال، بوت استرپ باید همه داده ها را دوباره ترکیب کند و سپس مقادیر AUC را هنگام استفاده از روش فاصله صدک راه انداز مرتب کند. این آخرین عملیات با استفاده از یک الگوریتم مرتب‌سازی حبابی انجام می‌شود که یک روش مرتب‌سازی مستقیم اما آهسته است. بنابراین، اگر زمان‌های محاسباتی بیش از حد طولانی باشد، کاربران می‌توانند نسبت‌های نمونه‌گیری و افزایش آستانه را که پردازش را سرعت می‌بخشد، شناسایی کنند. برای مثال، در مطالعه موردی ما با استفاده از راه‌اندازی، AUC با استفاده از برش داده‌های نمونه‌گیری مجدد با افزایش احتمال مساوی 0.05 محاسبه شد، بنابراین 20 bin تولید شد.

6. نتیجه گیری

مجموعه ابزارهای ارائه شده در این مقاله امکان تجزیه و تحلیل و مقایسه منحنی های ROC را با استفاده از داده های شطرنجی فراهم می کند. همانطور که برای دو مطالعه موردی نشان داده شد، مجموعه اجازه ایجاد منحنی ROC، مشخص کردن نقاط مرتبط در این منحنی، محاسبه AUC و pAUC، دو نوع فاصله اطمینان، محاسبه AUClower و AUCupper، مقایسه دو منحنی ROC جفتی و محاسبه چگالی رویداد در هر سطل احتمال. ما معتقدیم که این مجموعه ابزارهای مناسبی را برای تفسیر خروجی از مدل‌های فضایی مختلف در اختیار محققان، به‌ویژه در جامعه GIS قرار می‌دهد. با توجه به اینکه دینامیکا به کاربران اجازه می دهد ابزارهای خود را بسازند، کاربران همچنین می توانند این ابزارهای ROC موجود را بهبود بخشند یا آنها را با ابزارهای جدید تکمیل کنند.

منابع

Swets, JA Signal Detection Theory and ROC Analysis in Psychology and Diagnostics , 1st ed.; Lawrence Erlbaum Associates: Mahwah, NJ, USA, 1996. [ Google Scholar ]
ساچل، اس. Xia, W. مدل‌های تحلیلی منحنی ROC: برنامه‌های کاربردی برای اعتبارسنجی مدل رتبه‌بندی اعتباری. در تجزیه و تحلیل اعتبار مدل ریسک ، ویرایش اول. Christodoulakis, G., Satchell, S., Eds. Elsevier: لندن، انگلستان، 2008. [ Google Scholar ]
سونهگو، پ. کوچور، ا. تجزیه و تحلیل Pongor، S. ROC: برنامه های کاربردی برای طبقه بندی توالی های بیولوژیکی و ساختارهای سه بعدی. مختصر. بیوانفورم. 2008 ، 9 ، 198-209. [ Google Scholar ] [ CrossRef ]
لی، آر. گوان، کیو. Merchant, J. چارچوب مدل‌سازی جغرافیایی برای ارزیابی تغییر کاربری و پوشش زمین مرتبط با سوخت‌های زیستی. Agr. اکوسیستم. محیط زیست 2012 ، 161 ، 17-26. [ Google Scholar ] [ CrossRef ]
پونتیوس، آر جی، جونیور؛ باچو، ک. استفاده از مشخصه عملیاتی نسبی برای تعیین کمیت اطمینان در پیش‌بینی مکان تغییر پوشش زمین در هند. ترانس. GIS 2003 ، 7 ، 467-484. [ Google Scholar ]
پونتیوس، آر جی، جونیور؛ Parmentier، B. توصیه هایی برای استفاده از مشخصه عملیاتی نسبی (ROC). Landsc. Ecol. 2013 . برای انتشار ارائه شده است. [ Google Scholar ]
Fawcett, T. مقدمه ای بر تجزیه و تحلیل ROC. الگو. تشخیص. Lett. 2006 ، 27 ، 861-874. [ Google Scholar ] [ CrossRef ]
رابین، ایکس. تورک، ن. هاینارد، ا. تیبرتی، ن. لیزاچک، اف. سانچز، جی سی. Müller, M. pROC: یک بسته منبع باز برای R و S+ برای تجزیه و تحلیل و مقایسه منحنی های ROC. اطلاعات زیستی BMC. 2011 ، 12 . [ Google Scholar ] [ CrossRef ]
Soares-Filho، BS; رودریگز، هو. Follador, M. یک روش ترکیبی تحلیلی-اکتشافی برای کالیبره کردن مدل‌های تغییر کاربری زمین. محیط زیست مدل. نرم. 2013 ، 43 ، 80-87. [ Google Scholar ] [ CrossRef ]
پترسون، AT; پاپش، م. Soberón, J. بازاندیشی گیرنده کاربردی تجزیه و تحلیل مشخصه در مدل‌سازی طاقچه اکولوژیکی. Ecol. مدل. 2008 ، 213 ، 63-72. [ Google Scholar ] [ CrossRef ]
McClish، DK تجزیه و تحلیل بخشی از منحنی ROC. پزشکی تصمیم می گیرد. ساخت 1989 ، 9 ، 190-195. [ Google Scholar ] [ CrossRef ]
سانتینی، اس. محاسبه دو جمله ای. ضرایب . 2007. در دسترس آنلاین: http://arantxa.ii.uam.es/~ssantini/writing/notes/s667_binomial.pdf (در 21 ژوئن 2013 قابل دسترسی است).
پونتیوس، آر جی، جونیور؛ Schneider، LC اعتبار مدل تغییر پوشش زمین با روش ROC برای حوضه آبخیز ایپسویچ، ماساچوست، ایالات متحده آمریکا. Agr. اکوسیستم. محیط زیست 2001 ، 85 ، 239-248. [ Google Scholar ] [ CrossRef ]
لوبو، جی.ام. جیمنز والورده، آ. Real، R. AUC: اندازه گیری گمراه کننده عملکرد مدل های توزیع پیش بینی. گلوب. Ecol. Biogeogr. 2008 ، 17 ، 145-151. [ Google Scholar ] [ CrossRef ]
فیلیپس، اس جی. اندرسون، آر.پی. Schapire، RE مدل‌سازی حداکثر آنتروپی توزیع‌های جغرافیایی گونه‌ها. Ecol. مدل. 2006 ، 190 ، 231-259. [ Google Scholar ] [ CrossRef ]
Mas، JF; فارفان، م. گیلن، سی. لیما، تی. Soares Filho، B. Una Comparación de dos Enfoques de Modelación de Nicho Ecológico. در مجموعه مقالات Memorias de la XX Reunión SELPER، سان لوئیس پوتوسی، مکزیک، 21 تا 25 اکتبر 2013.
Soares-Filho، BS; آلنکار، ا. نپستاد، دی. سرکیرا، جی. ورا دیاز، م. ریورو، اس. سولورزانو، ال. Voll, E. شبیه سازی واکنش تغییرات پوشش زمین به آسفالت جاده و حکمرانی در امتداد بزرگراه اصلی آمازون: کریدور Santarém-Cuiabá. گلوب. Biol را تغییر دهید. 2004 ، 10 ، 745-764. [ Google Scholar ] [ CrossRef ]
Mas، JF; پرز-وگا، آ. Clarke، KC ارزیابی نقشه های کاربری/پوشش زمین شبیه سازی شده با استفاده از شاخص های تشابه و تکه تکه شدن. Ecol. مجتمع 2012 ، 11 ، 38-45. [ Google Scholar ] [ CrossRef ]
پونتیوس، آر جی، جونیور؛ Pacheco، P. کالیبراسیون و اعتبار مدلی از اختلال جنگل در گات غربی، هند 1920-1990. ژئوژورنال 2004 ، 61 ، 325-334. [ Google Scholar ] [ CrossRef ]
تیم اصلی توسعه R، R: زبان و محیطی برای محاسبات آماری . بنیاد R برای محاسبات آماری: وین، اتریش، 2013.

© 2013 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/3.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب