sgdm : یک بسته R برای انجام مدل‌سازی ناهمسانی تعمیم‌یافته پراکنده با ابزار برای gdm

خلاصه

تغییر تنوع زیستی جهانی نیاز به روش های نظارت استاندارد را ایجاد می کند. مدل‌سازی و نقشه‌برداری الگوهای فضایی ترکیب جامعه با استفاده از داده‌های سنجش از راه دور با ابعاد بالا، نیازمند روش‌های مناسب برای چنین مجموعه‌های داده‌ای است. مدل‌سازی عدم تشابه تعمیم‌یافته پراکنده برای مقابله با مجموعه داده‌های با ابعاد بالا، مانند داده‌های سنجش از دور سری زمانی یا فراطیفی طراحی شده است. در این دست نوشته ما sgdm را ارائه می دهیمیک بسته R برای انجام مدل‌سازی عدم تشابه تعمیم‌یافته پراکنده (SGDM). این بسته شامل برخی ابزارهای کلی است که هم به مدل‌سازی عدم تشابه تعمیم‌یافته و هم به مدل‌سازی عدم شباهت تعمیم‌یافته پراکنده، قابلیت‌هایی را اضافه می‌کند. همچنین شامل یک مجموعه داده نمونه است که امکان استفاده از SGDM را برای نقشه برداری از الگوهای فضایی جوامع درختی در منطقه ای از پوشش گیاهی طبیعی در سرادوی برزیل فراهم می کند.

کلید واژه ها:

درختان سرادو ; گردش مالی جامعه ؛ داده های با ابعاد بالا ؛ سنجش از دور فراطیفی ; مدلسازی عدم تشابه تعمیم یافته ; تجزیه و تحلیل مولفه های متعارف پراکنده ; بسته R

1. معرفی

تغییر تنوع زیستی جهانی ممکن است منجر به کاهش و تغییر در عملکرد اکوسیستم و ارائه خدمات شود [ 1 ]، که نیاز به روش‌های استاندارد شده را نشان می‌دهد که قادر به استخراج اطلاعات مفید از مشاهدات بیولوژیکی درجا برای استفاده از نظارت بر تنوع زیستی جهانی است [ 2 ، 3 ]. به طور خاص، توصیف ترکیب و گردش جامعه گونه ها بسیار مرتبط است، زیرا آنها مستقیماً به عملکرد اکوسیستم مربوط می شوند [ 4 ، 5]]. مدل‌سازی تنوع زیستی در سطح جامعه دارای چندین مزیت در رابطه با مدل‌سازی گونه‌های فردی است، زیرا امکان ترکیب گونه‌های کمیاب را از طریق تشخیص الگوهای مشترک واکنش‌های محیطی در بین گونه‌ها فراهم می‌کند، در حالی که به طور مستقیم ترکیب و گردش جامعه را پیش‌بینی می‌کند [6 ، 7 ] . علاوه بر این، از مشکلات انباشتن مدل‌های گونه‌های فردی با قدرت‌های توضیحی متفاوت، که به طور کلی منجر به استنتاج مغرضانه می‌شود، اجتناب می‌کند [ 8 ]. دو رویکرد اصلی مورد استفاده برای مدل‌سازی جوامع گونه‌ها، رویکردهایی هستند که بر اساس ترتیب داده‌ها، مانند تجزیه و تحلیل همبستگی متعارف [ 5 ]، یا از طریق معیارهای عدم تشابه [ 9 ، 10] است.]. مدلسازی عدم تشابه تعمیم یافته (GDM) یک تکنیک آماری مبتنی بر عدم تشابه به خوبی تثبیت شده برای تجزیه و تحلیل و پیش بینی تغییرات بیولوژیکی به عنوان تابعی از محیط است [ 10 ]. این به طور خاص به عدم شباهت در ترکیب یک جامعه بیولوژیکی (به عنوان مثال، تفاوت در گونه ها یا صفات) بین جفت مکان ها با تفاوت های محیطی مربوطه که توسط پیش بینی ها توضیح داده شده است، مربوط می شود. این از طریق یک ترکیب خطی از توابع پایه I-Spline (یکنواخت) انجام می شود، با این فرض که افزایش جدایی مکان ها در امتداد یک گرادیان محیطی تنها می تواند منجر به افزایش عدم تشابه ترکیبی شود [10 ]]. پیش‌بینی‌های عدم تشابه تولید شده توسط GDM را می‌توان برای تجسم الگوی فضایی در تغییر ترکیبی جامعه از طریق ترتیب‌بندی غیرخطی بعدی استفاده کرد. بنابراین GDM ابزار مفیدی برای ارزیابی تغییرات تنوع زیستی در مناطق وسیع است، اگرچه پتانسیل آن برای استفاده گسترده بستگی به در دسترس بودن داده‌های زیست محیطی با کیفیت بالا استاندارد دارد.

داده های سنجش از دور به ویژه برای توصیف جهانی و سیستماتیک فرآیندهای اکولوژیکی و محیط مناسب هستند [ 11 ، 12 ]. محصولات داده سنجش از دور، مانند سری‌های زمانی طولانی داده‌های ماهواره‌ای نوری، یا تصاویر فراطیفی فضایی، امکان توصیف سطح زمین را با کیفیت و جزئیات بی‌سابقه‌ای فراهم می‌کنند [13 ، 14 ] . این به بوم شناسان فرصت های بزرگی برای استفاده از آنها در ارزیابی های تنوع زیستی می دهد [ 15 ، 16 ]. با این حال، انتخاب متغیرهای سنجش از دور مناسب برای مدل‌سازی تنوع زیستی، حوزه‌ای از تحقیقات در حال انجام است [ 17]]. در حالی که استفاده از اطلاعات مستمر سنجش از دور، مانند شاخص های طیفی یا داده های سری زمانی، برای توصیف توزیع گونه ها مفید است [ 18 ، 19 ]، ماهیت بسیار بعدی (و بالقوه چند خطی) این داده ها چالش هایی را برای تجزیه و تحلیل [ 20 ]، که معمولاً منجر به از دست دادن عملکرد مدل و تعمیم می شود.

اخیراً یک پیشرفت روش‌شناختی ایجاد شده است که امکان برازش داده‌های با ابعاد بالا در GDM را فراهم می‌کند. این افزایش، مدل‌سازی عدم تشابه تعمیم‌یافته پراکنده (SGDM) [ 21 ] نامیده می‌شود و یک رویکرد دو مرحله‌ای است که شامل کاهش اولیه داده‌های محیطی (یعنی متغیرهای پیش‌بینی‌کننده) با استفاده از تحلیل همبستگی متعارف پراکنده (SCCA) است [22] .]، و سپس برازش فضای محیطی تبدیل شده با یک مدل GDM. SCCA شکلی از تجزیه و تحلیل همبستگی متعارف جریمه‌شده است، بنابراین ماتریس داده‌های بیولوژیکی و محیطی را به منظور به حداکثر رساندن همبستگی بین هر دو تغییر می‌دهد. جریمه در SCCA از طریق تابع جریمه L1 (کند) انجام می شود که برای مقابله با مجموعه داده های چند بعدی و چند خطی طراحی شده است [ 23 ، 24]. SCCA داده های با ابعاد بالا را کاهش می دهد در حالی که به طور همزمان امکان استخراج اطلاعات محیطی مربوط به تنوع داده های جامعه را فراهم می کند. برای اجرای یک SCCA، لازم است پارامتر جریمه برای هر یک از ماتریس های داده های محیطی و جامعه اعمال شود. در SGDM، پارامترسازی به روش جستجوی شبکه اکتشافی انجام می‌شود، به منظور به حداقل رساندن باقیمانده‌ها (به شکل خطای میانگین مربعات ریشه اعتبار متقابل؛ RMSE) در تفاوت‌های پیش‌بینی‌شده یک مدل GDM [21 ] .

SGDM برای انجام مدل‌سازی عدم تشابه تعمیم‌یافته با داده‌های سنجش از دور با ابعاد بالا مفید است [ 21 ]. در حالی که رویکرد مدل‌سازی GDM در بسته gdm R پیاده‌سازی شده و از مخزن CRAN در دسترس است [ 25 ، 26 ]، هنوز هیچ پیاده‌سازی SGDM در دسترس بوم‌شناسان و محققان محیط‌زیست وجود ندارد. در زمان افزایش دسترسی به داده‌های سنجش از دور، و در نتیجه افزایش ابعاد، بسیار مهم است که ابزارهای مفیدی که قادر به مقابله با این داده‌ها هستند در دسترس جامعه اکولوژیست‌های جهانی باشد. در مقاله فعلی، هدف ما پر کردن این شکاف و ارائه sgdm استیک بسته R برای انجام مدل‌سازی عدم تشابه تعمیم‌یافته پراکنده، شامل برخی ابزارهای اضافی مناسب برای SGDM و GDM.

2. توضیحات بسته کلی sgdm

بسته sgdm از GitHub ( https://github.com/sparsegdm/sgdm_package ) در دسترس است و برای اجرا به نصب چند بسته R دیگر بستگی دارد. یعنی به بسته gdm [ 25 ] برای اجرای مدل GDM، بسته PMA [ 27 ] برای اجرای SCCA، و بسته گیاهخواری [ 28 ] برای چندین عملیات داخلی نیاز دارد. توابع برای نگاشت صریح فضایی نتایج مدل بیشتر به نصب بسته های رستر [ 29 ] و yalmpute [ 30 ] نیاز دارند. sgdm _بسته را می توان مستقیماً با استفاده از دستورات زیر در R نصب و بارگذاری کرد:

R> # نصب بسته از GitHub
R> devtools::install_github(“sparsegdm/sgdm_package”)
R> در حال بارگیری بسته
R> کتابخانه (sgdm)

این بسته شامل نه تابع و سه مجموعه داده نمونه است. در شکل 1 ما تمام توابع و مجموعه داده ها و همچنین یک گردش کار ممکن برای استخراج یک نقشه شطرنجی از جوامع درختی Cerrado را بر اساس مجموعه داده های نمونه ارائه می کنیم.

مجموعه داده های ارائه شده با بسته شامل یک مجموعه داده بیولوژیکی و یک مجموعه داده پیش بینی کننده (هر دو به عنوان چارچوب داده)، و همچنین یک نقشه پیش بینی به عنوان شی شطرنجی ( شکل 2 ) است. مجموعه داده بیولوژیکی درختان از 30 مشاهده با مقادیر فراوانی برای 48 خانواده درختی مختلف در منطقه ای از پوشش گیاهی طبیعی در سرادوی برزیل تشکیل شده است. طیف _مجموعه داده پیش‌بینی‌کننده از همان 30 مشاهدات تشکیل شده است، با مقادیر بازتاب برای 83 باند طیفی باریک که بخش‌های مادون قرمز مرئی، نزدیک و موج کوتاه طیف الکترومغناطیسی را پوشش می‌دهند. این طیف ها از تصاویر فراطیفی هایپریون فضایی که در 27 ژوئن 2014 پس از پیش پردازش و غربالگری با کیفیت به دست آمد، استخراج شده اند. هر دو مجموعه داده شامل یک ستون ID و دومی نیز شامل دو ستون مختصات جغرافیایی (X و Y) است. نقشه پیش‌بینی تصویر طیفی زیرمجموعه‌ای (100 × 100 پیکسل) از تصویر Hyperion مربوطه را تشکیل می‌دهد.

3. اجرای یک مدل SGDM در بسته sgdm

برای اجرای یک مدل SGDM در بسته sgdm ، لازم است SCCA داخلی را پارامتر کنیم، که شامل تعریف مقادیر جریمه برای اعمال تبدیل متعارف مبتنی بر کمند برای ماتریس‌های بیولوژیکی و محیطی است. این کار از طریق جستجوی شبکه اکتشافی با آزمایش ترکیبی از جفت پارامترها با استفاده از تابع sgdm.param انجام می شود . در جستجوی شبکه، تمام جفت‌های پارامتر ممکن در یک اعتبارسنجی متقابل پنج برابری آزمایش می‌شوند و با حداقل کردن ریشه میانگین مربعات خطا (RMSE) بین تفاوت‌های پیش‌بینی‌شده و مشاهده‌شده بین جفت‌های نمونه بهینه‌سازی می‌شوند. مقادیر جریمه مورد آزمایش می تواند از 0 (جریمه قوی) تا 1 (جریمه ضعیف) متغیر باشد. همانطور که توسط Leitão و همکاران توضیح داده شده است. [ 21]، از سطوح بالای جریمه (مقادیر جریمه پایین) باید اجتناب شود تا از ارتباط قوی بین پیش بینی تبدیل شده و داده های بیولوژیکی اطمینان حاصل شود. به دنبال این توصیه، مقادیر جریمه پیش‌فرض (برای هر دو ماتریس داده) در بسته sgdm از 0.6 تا 1 در مراحل 0.1 متغیر است، اگرچه این مقادیر را می‌توان به صورت دستی پیکربندی کرد تا بهتر با نیازهای کاربر مطابقت داشته باشد (برای مثال، مجموعه داده‌هایی با ابعاد بالاتر ممکن است به سطوح بالاتری از مجازات نیاز دارند). تابع sgdm.param همچنین به تعریف تعداد مؤلفه هایی که باید در SCCA استخراج شوند، متریک فاصله مورد استفاده در مدل های GDM و استفاده اختیاری از فاصله جغرافیایی به عنوان متغیر در مدل GDM نیاز دارد. همانطور که در شرح روش پیشنهاد شده است [ 21]، در ابتدا باید از حداکثر تعداد ممکن اجزا (یعنی تعداد نمونه) استفاده شود تا بعداً به مقادیر معنی دار آماری کاهش یابد. اگرچه این گزینه در اینجا موجود است، استفاده از فاصله جغرافیایی به عنوان یک متغیر با SGDM آزمایش نشده باقی می ماند. توجه داشته باشید که اجرای فعلی این تابع فقط به داده‌های فراوانی بیولوژیکی اجازه می‌دهد که به عنوان فرمت 1 در بسته gdm [ 25 ] توضیح داده شده است. تابع پارامترسازی مدل SGDM توسط:

R> # SGDM را پارامتر کنید
R> sgdm.gs <− sgdm.param(predData = طیف، bioData = درختان، k = 30)

تابع sgdm.param یک ماتریس عملکرد با مقادیر RMSE برای هر جفت پارامتر تست شده در مدل SGDM ارائه می دهد ( شکل 3 ). در این مورد، بهترین مدل مربوط به استفاده از مقدار جریمه 0.7 در هر دو ماتریس زیست‌محیطی و بیولوژیکی است که منجر به مقدار RMSE 0.114 می‌شود.

برای اجرای بهترین مدل SGDM (به دنبال مرحله پارامترسازی)، این ماتریس می تواند به تابع sgdm.best وارد شود :

R> # بازیابی و ساخت بهترین مدل SGDM
R> sgdm.model <− sgdm.best (perf.matrix = sgdm.gs، predData = طیف، bioData = درختان، خروجی = ”m”، k = 30)

مرحله قبلی یک مدل GDM با 30 متغیر پیش‌بینی‌کننده، یعنی 30 مؤلفه متعارف تولید شده در SCCA (با مقادیر جریمه 0.7 برای هر دو ماتریس) ایجاد کرد و 73.36٪ از انحراف (مطابق با عملکرد برازش مدل) را توضیح داد. با بررسی مدل GDM (با تابع summary.gdm بسته gdm )، می توان تأیید کرد که هر متغیر پیش بینی کننده به طور مؤثر در مدل استفاده نشده است. در واقع، در مثال داده شده، تنها 12 متغیر حداقل یک ضریب غیر صفر داشتند.

از طرف دیگر، تابع sgdm.best همچنین به کاربر این امکان را می دهد که اجزای متعارف پراکنده یا بردارهای متعارف مربوطه را با تنظیم آرگومان خروجی به ترتیب روی ” c ” یا ” v ” بازیابی کند. کد زیر کد لازم برای بازیابی مولفه ها و بردارهای متعارف پراکنده حاصل را با استفاده از داده های مثال نشان می دهد:

R> # بازیابی اجزای متعارف پراکنده مربوط به بهترین مدل GDM
R> sgdm.sccbest <− sgdm.best(perf.matrix = sgdm.gs، predData = طیف، bioData = درختان، خروجی = ”c”، k = 30)
R> # بازیابی بردارهای متعارف پراکنده مربوط به بهترین مدل GDM
R> sgdm.vbest <− sgdm.best(perf.matrix = sgdm.gs، predData = طیف، bioData = درختان، خروجی = ”v”، k = 30)

تبدیل متعارف انتخاب شده همچنین می تواند در نقشه پیش بینی اعمال شود تا امکان پیش بینی فضایی مدل SGDM فراهم شود. این کار را می توان با تابع predData.transform ، مطابق شکل زیر انجام داد.

R> # اعمال تبدیل SCCA بر روی نقشه پیش بینی
R> component.image <− predData.transform(predData = spectral.image, v = sgdm.vbest)

مراحل زیر از رویکرد SGDM به ساده سازی مدل به دنبال آزمون معناداری [ 21 ] مربوط می شود. توابع ارائه شده برای انجام این کار مختص SGDM نیستند، بلکه به طور کلی برای GDM مفید هستند.

4. ابزارهای اضافی مفید برای GDM و SGDM

علاوه بر توابع خاص که در بالا توضیح داده شد، بسته sgdm همچنین برخی از توابع کلی را ارائه می دهد که عملکرد را به SGDM و GDM اضافه می کند. سهم افت متغیر یک مدل GDM را می توان از طریق تابع gdm.varcont محاسبه کرد، که هر متغیر منفرد را به یکباره حذف می کند و ضرر مربوطه را در انحراف مدل محاسبه می کند. اهمیت مشارکت‌های متغیر را می‌توان با تابع gdm.varsig بررسی کرد ، زیرا اینها در برابر تصادفی بودن از طریق جایگشت‌های ماتریس داده‌های بیولوژیکی آزمایش می‌شوند [ 10 ]. سطح معنی داری که مشارکت های متغیر در آن آزمایش می شوند، روی p تنظیم می شود< 0.05 در هر پیش فرض، اگرچه می توان آن را به صورت دستی تعریف کرد. این تابع یک بردار با طول یکسان با تعداد متغیرها ارائه می‌کند، با مقادیر منطقی که نشان می‌دهد آیا سهم متغیرها قابل توجه است یا خیر—همه متغیرهای بدون مشارکت به طور خودکار به عنوان غیر معنی‌دار اختصاص داده می‌شوند. پس از آزمون معناداری، مدل ها را می توان با حذف متغیرهای غیر معنی دار با استفاده از تابع data.reduce ساده کرد . کد زیر نمونه‌ای از مشارکت متغیرها و بررسی‌های معنی‌داری است، و به دنبال آن متغیرهای غیر مهم حذف می‌شوند و مدل نهایی (کاهش‌شده) با استفاده از داده‌های نمونه بازیابی می‌شود.

R> # ترکیب جفت داده‌های سایت برای بررسی سهم متغیر مدل GDM
R> spData.sccbest <− gdm:: formatsitepair(bioData = درختان، bioFormat = 1، dist = “bray”، فراوانی = TRUE، siteColumn = “Plot_ID”، XColumn = “X”، YColumn = “Y”، predData = sgdm.sccbest)
R> # بررسی سهم افت متغیر SGDM
R> gdm.varcont(spData = spData.sccbest)
R> # بررسی اهمیت مشارکت های متغیر
R> sigtest.sgdm <− gdm.varsig(predData = sgdm.sccbest، bioData = درختان)
R> # به استثنای متغیرهای غیر معنی دار
R> sgdm.sccbest.red <− data.reduce(data = sgdm.sccbest، datatype = “pred”، sigtest = sigtest.sgdm)
R> # ترکیب جفت داده های سایت برای ورودی در GDM
R> spData.sccbest.red <− gdm:: formatsitepair(bioData = درختان، bioFormat = 1، dist = “bray”، فراوانی = TRUE، siteColumn = “Plot_ID”، XColumn = “X”، YColumn = “Y”، predData = sgdm.sccbest.red)
R> # مدل نهایی SGDM
R> sgdm.model.red <− gdm:: gdm(data = spData.sccbest.red)

در این مورد، کاهش مدل منجر به یک مدل نهایی GDM با شش متغیر پیش‌بینی می‌شود که 70.09 درصد از انحراف را در داده‌ها توضیح می‌دهد. مدل برازش شده و I-splines مربوطه را می توان با استفاده از تابع plot.gdm بسته gdm رسم کرد ( شکل 4 ).

برای بازرسی بیشتر از نتایج مدل نهایی، تفاوت های پیش بینی شده را می توان در برابر تفاوت های مشاهده شده بین تمام جفت های سایت رسم کرد ( شکل 5 ). این بینش خوبی در مورد توزیع مقادیر عدم تشابه و همچنین پیش‌بینی‌های مدل می‌دهد.

این بسته همچنین شامل دو قابلیت برای اعتبارسنجی مدل GDM است. یعنی تابع gdm.cv که اعتبارسنجی متقابل مدل n برابری را انجام می‌دهد و تابع gdm.validate که اعتبار مدل را با استفاده از یک مجموعه داده مستقل انجام می‌دهد. این تابع می تواند هم RMSE و هم r-square (محاسبه شده بر اساس مجذور ضریب همبستگی پیرسون) را محاسبه کند. به عنوان مثال، اعتبارسنجی متقابل GDM را می توان با استفاده از موارد زیر انجام داد:

R> # 10 برابر اعتبار متقابل مدل نهایی SGDM
R> gdm.cv(spData = spData.sccabest.red، nfolds = 10، عملکرد = “r2”)

در این مثال، مدل نهایی (کاهش یافته) یک r مربع اعتبار متقاطع 64.34٪ ارائه کرد. از سوی دیگر، با مقایسه آن با یک مدل GDM ساخته شده با باندهای طیفی اصلی (4 از 83؛ بدون تبدیل قبلی SCCA)، می توان مشاهده کرد که دومی منجر به عملکرد تایید متقابل ضعیف تری می شود (r -مربع 53.38٪.

الگوهای ترکیب اصلی جامعه را می توان در امتداد محورهای اصلی تغییر بین تفاوت های پیش بینی شده بین همه جفت سایت ها از طریق اعمال تبدیل مقیاس بندی چند بعدی غیر متریک (NMDS) ترسیم کرد [10 ] . این تبدیل در تابع gdm.map بسته sgdm پیاده سازی شده است که از تابع monoMDS پیاده سازی شده در بسته وگان استفاده می کند . این نیاز به تعریف تعداد محورهای NMDS برای استخراج دارد، که می تواند به صورت دستی یا خودکار بر اساس مقادیر تنش NMDS انجام شود [ 31 ]:

R> # ترکیب جامعه نقشه برداری
R> map.sitepairs <− gdm.map(spData = spData.sccabest.red، model = sgdm.model.red)

در این مثال، تعداد مؤلفه‌های NMDS به‌طور خودکار تنظیم شد (با استفاده از آستانه مقدار تنش پیش‌فرض 0.1)، که منجر به هشت مؤلفه شد. این هشت مولفه بیشتر واریانس در ساختار جامعه درختی موجود در منطقه مورد مطالعه را خلاصه کردند.

پیش‌بینی‌های مدل را می‌توان به کل منطقه مورد مطالعه تعمیم داد، همانطور که توسط نقشه پیش‌بینی‌کننده توضیح داده شده است. از آنجایی که اجرای یک NMDS بر روی تفاوت‌های بین تمام جفت‌های ممکن پیکسل‌های تصویر [ 10 ] غیرممکن است، می‌توان پیکسل‌ها را از جفت‌های نمونه از طریق یک knn-imputation به محورهای NMDS اختصاص داد [ 32 ]. این امر مستلزم کاهش نقشه مؤلفه متعارف (به دست آمده از تابع predData.transform ) به اجزای مهم با استفاده از تابع data.reduce است . در نهایت، هنگامی که یک تصویر پیش‌بینی (مثلاً نقشه مولفه‌های مهم) را به عنوان آرگومان در gdm.map اضافه کنید .تابع، این پیکسل های تصویر را در امتداد محورهای NMDS، همانطور که برای جفت های نمونه محاسبه می شود، اختصاص می دهد. این روش منجر به نقشه برداری فضایی صریح از الگوهای ترکیب جامعه در سراسر منطقه مورد مطالعه می شود. یک مثال نقشه برداری در زیر آورده شده است:

R> # کاهش نقشه مؤلفه متعارف به مؤلفه های مهم
R> component.image.red <− data.reduce(data = component.image، datatype = “pred”، igtest = sigtest.sgdm)
R> # نگاشت ترکیب جامعه در فضا
R> map.image <− gdm.map(spData = spData.sccabest.red، predMap = component.image.red، model = sgdm.model.red، k = 8)

در این مثال آخر، الگوهای اصلی انتقال جامعه، مطابق با هشت دستور NMDS پیش‌بینی‌های مدل SGDM ترسیم شده‌اند ( شکل 6 ).

با بررسی نقشه های حاصل می توان مشاهده کرد که جنبه های مختلف انتقال جامعه توسط محورهای مختلف NMDS به تصویر کشیده شده است. به عنوان مثال، محور اول بیشتر نشان دهنده گردش گونه ها در مناطق معمولی ساوانا (آبی به قرمز) است، در حالی که محور دوم بیشتر نشان دهنده گردش بین مناطق جنگلی (آبی) و ساوانا (قرمز) است. با این حال، محور سوم عمدتاً چرخش گونه‌ها را بین سازندهای ساوانای پراکنده (آبی) و متراکم‌تر (قرمز) نشان می‌دهد – این استنتاج را می‌توان برای همه محورهای حاصل انجام داد. بررسی متقاطع محورهای NDMS حاصل با جامعه گونه های مربوطه (برای نمونه ها) بینش های بیشتری را برای استنتاج معقول الگوهای فضایی مدل شده ارائه می دهد. در این مطالعه موردی، تنوع طبقه‌بندی بالای درخت Cerrado در تعداد نسبتاً زیادی محورهای NMDS حاصل به خوبی نشان داده شده است.

5. بحث

بسته sgdm امکان استفاده از داده‌های با ابعاد بالا، مانند داده‌های سنجش از دور فراطیفی یا سری زمانی، را در چارچوب مدل‌سازی GDM برای نقشه‌برداری الگوهای فضایی جوامع گونه‌ای در مناطق بزرگ فراهم می‌کند . در واقع، در مطالعه موردی نشان‌داده‌شده، ما از یک تصویر فراطیفی از سنسور ماهواره‌ای Hyperion برای نقشه‌برداری موفقیت‌آمیز انتقال جامعه درختی در سرادو برزیل استفاده کردیم. مدل حاصل شامل شش متغیر مهم (مولفه‌های متعارف) بود که از 83 باند طیفی اصلی متراکم شدند و در نتیجه منجر به بهبود قابل‌توجهی در عملکرد مدل پیش‌بینی‌کننده (متقابل تایید شده) مربوطه شد.

بر خلاف خود مدل GDM (که قطعی است)، رویکرد SGDM یک رویکرد احتمالی است، زیرا پارامترسازی آن به جستجوی شبکه اکتشافی بر اساس یک روش اعتبار سنجی متقابل بستگی دارد [21 ] . این به این معنی است که چندین اجرا از مدل SGDM بر روی داده‌های یکسان ممکن است به پارامترهای مدل کمی متفاوت منجر شود، با عملکردهای مدل متفاوت و الگوهای پیش‌بینی‌شده، که ممکن است باعث بی‌ثباتی در پارامترسازی مدل شود. ما دریافتیم که با تنظیم پارامترهای پیش‌فرض روی جریمه‌سازی متوسط تا ضعیف (از 0.6 تا 1)، همانطور که در شرح روش توصیه می‌شود [ 21]]، انتخاب پارامتر به دست آمده قوی بود. با این حال، این موضوع به طور عمیق مورد تجزیه و تحلیل قرار نگرفته است و نیاز به تحقیقات بیشتری دارد. علاوه بر این، بهترین جفت پارامتر جریمه کاملاً به داده‌ها وابسته است و جفت‌های پارامتر کاندید برای آزمایش در جستجوی شبکه ممکن است نیاز به تطبیق با مجموعه داده‌های مورد استفاده داشته باشند. در واقع، مجموعه داده‌هایی با ابعاد بسیار بالا ممکن است به سطوح بالاتری از جریمه (مقادیر پارامتر پایین‌تر) نسبت به آنهایی با ابعاد پایین‌تر نیاز داشته باشند.

نگاشت الگوهای فضایی ترکیب جامعه با استفاده از یک تصویر طیفی بر روی یک منطقه جغرافیایی بزرگ ساده و سرراست نیست. در حالت ایده‌آل، تفاوت‌های بین تمام جفت‌های پیکسل تصویر از مدل GDM یا SGDM پیش‌بینی می‌شود و سپس با استفاده از NMDS تبدیل می‌شود. با این حال، برای مناطق بزرگ (یعنی میلیون ها پیکسل) این مراحل به دلیل منابع محاسباتی مورد نیاز غیرممکن است [ 10 ، 21 ]. در اجرای بسته فعلی یک رویکرد جایگزین پیشنهاد شد، که در آن پیکسل‌های تصویر از طریق یک رویکرد انتساب نزدیک‌ترین همسایه به محورهای NMDS اختصاص داده می‌شوند [ 32]. این نقشه ای از پیکسل ها با جوامع مشابه ارائه می دهد که گردش جامعه را در فضا، با شرایط محیطی متفاوت نشان می دهد. یک رویکرد جایگزین، که در حال حاضر در بسته sgdm پیاده‌سازی نشده است ، بازگشت به رویکرد رگرسیون برای تخصیص پیکسل‌های تصویر در امتداد محورهای NMDS است.

6. نتیجه گیری

بسته ارائه شده در این مطالعه یک پیاده سازی در حال اجرا از رویکرد روش شناختی SGDM است و به صورت آنلاین (در GitHub) تحت مجوز Creative Commons برای استفاده عمومی در دسترس است. بنابراین، این نسخه امکان مدل‌سازی و نقشه‌برداری گردش مالی در ساختار جامعه را در مناطق بزرگ جغرافیایی با تسهیل استفاده از داده‌های با ابعاد بالا از نسل‌های جدید ماهواره‌های رصد زمین موجود و آینده در چارچوب GDM فراهم می‌کند.

منابع

Chapin، FS، III; زاوالتا، ES; Eviner، VT; نایلور، RL; Vitousek، PM; رینولدز، اچ ال. هوپر، DU; لاورل، اس. سالا، OE; Hobbie, SE; و همکاران پیامدهای تغییر تنوع زیستی طبیعت 2000 ، 405 ، 234-242. [ Google Scholar ] [ CrossRef ] [ PubMed ]
پریرا، اچ ام. ناوارو، ال.ام. مارتینز، IS تغییر تنوع زیستی جهانی: بد، خوب و ناشناخته. آنو. کشیش محیط زیست. منبع. 2012 ، 37 ، 25-50. [ Google Scholar ] [ CrossRef ]
Ferrier, S. استخراج ارزش بیشتر از مشاهدات تغییر تنوع زیستی از طریق مدل سازی یکپارچه. BioScience 2011 ، 61 ، 96-97. [ Google Scholar ] [ CrossRef ]
هوپر، DU; چاپین، FS; ایول، جی جی. هکتور، ا. اینچاوستی، پ. لاورل، اس. لاتون، جی اچ. Lodge, DM; لورو، ام. نعیم، س. و همکاران اثرات تنوع زیستی بر عملکرد اکوسیستم: اجماع دانش فعلی Ecol. مونوگر. 2005 ، 75 ، 3-35. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
لژاندر، پ. بورکارد، دی. Peres-Neto، PR تجزیه و تحلیل تنوع بتا: تقسیم بندی تغییرات فضایی داده های ترکیب جامعه. Ecol. مونوگر. 2005 ، 75 ، 435-450. [ Google Scholar ] [ CrossRef ]
گیسان، ع. ویس، SB; Weiss، AD GLM در مقابل مدل سازی فضایی CCA توزیع گونه های گیاهی. بوم گیاهی. 1999 ، 143 ، 107-122. [ Google Scholar ] [ CrossRef ]
فریر، اس. گیسان، الف. مدلسازی فضایی تنوع زیستی در سطح جامعه. J. Appl. Ecol. 2006 ، 43 ، 393-404. [ Google Scholar ] [ CrossRef ]
گیسان، ع. Rahbek، C. SESAM – چارچوب جدیدی که مدل‌های توزیع کلان اکولوژیکی و گونه‌ها را برای پیش‌بینی الگوهای مکانی-زمانی مجموعه‌های گونه‌ها ادغام می‌کند. J. Biogeogr. 2011 ، 38 ، 1433-1444. [ Google Scholar ] [ CrossRef ]
دی کاسرس، ام. لژاندر، پ. او، F. اندازه گیری های عدم تشابه و ساختار اندازه جوامع بوم شناختی. روش ها Ecol. Evolut. 2013 ، 4 ، 1167-1177. [ Google Scholar ] [ CrossRef ]
فریر، اس. مانیون، جی. الیت، جی. ریچاردسون، ک. استفاده از مدل‌سازی عدم تشابه تعمیم‌یافته برای تحلیل و پیش‌بینی الگوهای تنوع بتا در ارزیابی تنوع زیستی منطقه‌ای. غواصان. توزیع کنید. 2007 ، 13 ، 252-264. [ Google Scholar ] [ CrossRef ]
کر، جی تی؛ Ostrovsky، M. از فضا تا گونه: کاربردهای اکولوژیکی برای سنجش از دور. Trends Ecol. Evolut. 2003 ، 18 ، 299-305. [ Google Scholar ] [ CrossRef ]
جتز، دبلیو. کاوندر-بارز، جی. پاولیک، آر. شیمل، دی. دیویس، FW; آسنر، GP; گورالنیک، آر. کاتگ، جی. لاتیمر، AM; مورکرافت، پی. و همکاران نظارت بر تنوع عملکردی گیاه از فضا نات Plants 2016 , 2 , 16024. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Wulder، MA; سفید، JC; لاولند، TR; Woodcock، CE; بلوارد، ع. کوهن، WB; Fosnight، EA؛ شاو، جی. ماسک، جی جی. روی، DP آرشیو جهانی لندست: وضعیت، تثبیت و جهت. سنسور از راه دور محیط. 2015 . [ Google Scholar ] [ CrossRef ]
گوانتر، ال. کافمن، اچ. سگل، ک. چابریلات، س. فورستر، اس. روگاس، سی. کوستر، تی. هالشتاین، ا. راسنر، جی. چلبیک، سی. و همکاران ماموریت طیف‌سنجی تصویربرداری فضایی EnMAP برای رصد زمین. Remote Sens. 2015 ، 7 ، 8830–8857. [ Google Scholar ] [ CrossRef ]
لاوش، آ. بنهر، ال. بکمن، ام. بوهم، سی. فیلهاور، اچ. هکر، JM; هیوریچ، ام. یونگ، آ. کلنکه، آر. نیومن، سی. و همکاران پیوند رصد زمین و تنوع زیستی طبقه‌بندی، ساختاری و عملکردی: دیدگاه‌های محلی به اکوسیستم Ecol. اندیک. 2016 ، 70 ، 317-339. [ Google Scholar ] [ CrossRef ]
کندی، RE; آندرفوئه، اس. کوهن، WB; گومز، سی. گریفیث، پی. هایس، م. هیلی، SP; هلمر، EH; هاسترت، پ. لیون، مگابایت؛ و همکاران ارائه دیدگاه اکولوژیکی از تغییر به سنجش از دور مبتنی بر لندست. جلو. Ecol. محیط زیست 2014 ، 12 ، 339-346. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
سیم، AF؛ Meentemeyer، RK; لیتائو، پی جی. Václavík، T. مدل‌سازی توزیع‌های گونه‌ها با داده‌های سنجش از دور: پل زدن دیدگاه‌های انضباطی. J. Biogeogr. 2013 ، 40 ، 2226-2227. [ Google Scholar ] [ CrossRef ]
پروینن، م. Zimmermann، NE; Heikkinen، RK; Luoto، M. استفاده از داده های سنجش از دور مستمر طبقه بندی نشده برای بهبود مدل های توزیع گونه های گیاهی در فهرست قرمز. تنوع زیستی حفظ کنید. 2013 ، 22 ، 1731-1754. [ Google Scholar ] [ CrossRef ]
سیم، AF؛ کلاین، دی. مورا، اف. Dech, S. مقایسه مناسب بودن داده های طبقه بندی شده پوشش زمین و متغیرهای سنجش از دور برای مدل سازی الگوهای توزیع گیاهان. Ecol. مدل. 2014 ، 272 ، 129-140. [ Google Scholar ] [ CrossRef ]
Dormann، CF; الیت، جی. باچر، اس. بوخمن، سی. کارل، جی. کاره، جی. مارکوز، جی آر جی؛ گروبر، بی. لافورکید، بی. لیتائو، پی جی. و همکاران هم خطی: مروری بر روش های مقابله با آن و یک مطالعه شبیه سازی که عملکرد آنها را ارزیابی می کند. اکوگرافی 2013 ، 36 ، 27-46. [ Google Scholar ] [ CrossRef ]
لیتائو، پی جی. شویدر، ام. سوس، اس. کاتری، من. میلتون، ای جی; موریرا، اف. آزبورن، PE; پینتو، ام جی. وان در لیندن، اس. Hostert، P. نگاشت تنوع بتا از فضا: مدلسازی ناهمسانی تعمیم یافته پراکنده (SGDM) برای تجزیه و تحلیل داده های با ابعاد بالا. روش ها Ecol. Evolut. 2015 ، 6 ، 764-771. [ Google Scholar ] [ CrossRef ]
ویتن، دی.ام. طبشیرانی، ر. Hastie, T. تجزیه ماتریس جریمه شده، با کاربردهایی برای اجزای اصلی پراکنده و تجزیه و تحلیل همبستگی متعارف. آمار زیستی 2009 ، 10 ، 515-534. [ Google Scholar ] [ CrossRef ] [ PubMed ]
تبشیرانی، آر. انقباض و انتخاب رگرسیون از طریق کمند. JR Stat. Soc. 1996 ، 58 ، 267-288. [ Google Scholar ]
رینکینگ، بی. شرودر، ب. محدودیت برای انجام: منظم کردن مدل‌های زیستگاه. Ecol. مدل. 2006 ، 193 ، 675-690. [ Google Scholar ] [ CrossRef ]
مانیون، جی. لیسک، ام. فریر، اس. نیتو-لوژیلد، دی. فیتزپاتریک، MC GDM: توابع برای مدلسازی عدم تشابه تعمیم یافته. پکیج R نسخه 1.2.3. در دسترس آنلاین: http://CRAN.R-project.org/package=gdm (در 18 ژانویه 2017 قابل دسترسی است).
R Development Core Team R. A Language and Environment for Statistical Computing, 3.2.2 ; بنیاد R برای محاسبات آماری: وین، اتریش، 2016. [ Google Scholar ]
ویتن، دی. طبشیرانی، ر. گراس، اس. نراسیمهان، B. PMA: تجزیه و تحلیل چند متغیره مجازات. بسته R نسخه 1.0.9. در دسترس آنلاین: http://CRAN.R-project.org/package=PMA (در 18 ژانویه 2017 قابل دسترسی است).
وگان: بسته اکولوژی جامعه; بسته R نسخه 2.3-5. در دسترس آنلاین: http://CRAN.R-project.org/package=vegan (در 18 ژانویه 2017 قابل دسترسی است).
Hijmans، RJ Raster: تجزیه و تحلیل داده های جغرافیایی و مدل سازی; بسته R نسخه 2.5-8. در دسترس آنلاین: http://CRAN.R-project.org/package=raster (در 18 ژانویه 2017 قابل دسترسی است).
کروکستون، NL; Finley، AO yaImpute: یک بسته R برای انتساب kNN. J. Stat. نرم افزار 2008 ، 23 ، 1-16. [ Google Scholar ] [ CrossRef ]
Clarke، KR تحلیل های چند متغیره ناپارامتریک تغییرات در ساختار جامعه. اوست جی. اکول. 1993 ، 18 ، 117-143. [ Google Scholar ] [ CrossRef ]
تسلر، اس. روکولاینن، ک. تومیستو، اچ. Tomppo، E. نقشه‌برداری تدریجی تغییرات گل‌شناسی در مقیاس چشم‌انداز در جنگل‌های بارانی اولیه آمازون با ترکیب تنظیم و سنجش از دور. گلوب. Ecol. Biogeogr. 2005 ، 14 ، 315-325. [ Google Scholar ] [ CrossRef ]

شکل 1. گردش کار گویا برای استخراج یک نقشه شطرنجی از جوامع درختی Cerrado در بسته sgdm .

شکل 2. ترکیب RGB رنگ نادرست نقشه پیش‌بینی تصویر طیفی : زیرمجموعه‌ای از تصویر فراطیفی Hyperion که منطقه‌ای از پوشش گیاهی طبیعی در سرادوی برزیل را پوشش می‌دهد، که در 27 ژوئن 2014 به دست آمد (DOY 178). مثلث های زرد پوشانده شده نشان دهنده مکان های نمونه هستند که هر دو مجموعه داده های بیولوژیکی ( درختان ) و پیش بینی کننده ( طیف ) برای آنها مشتق شده اند.

شکل 3. نمایش ماتریس عملکرد با مقادیر ریشه مدل میانگین مربعات خطا (RMSE) برای هر جفت پارامتر. در محور x مقادیر جریمه برای ماتریس محیطی (از 0.6 تا 1) و در محور y برای ماتریس بیولوژیکی (همچنین از 0.6 تا 1) وجود دارد.

شکل 4. نمودار مدل سازی عدم تشابه تعمیم یافته برازش شده (GDM) و I-splines مربوطه.

شکل 5. نمودار تفاوت های مشاهده شده در مقابل پیش بینی شده مدل نهایی.

شکل 6. نمودارهای هشت محور مقیاس‌بندی چند بعدی غیر متریک (NMDS) که نشان‌دهنده انتقال جامعه درختی در منطقه مورد مطالعه، با توجه به پیش‌بینی مدل‌سازی ناهمسانی تعمیم‌یافته پراکنده (SGDM) است.

© 2017 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

خلاصه

1. معرفی

2. توضیحات بسته کلی sgdm

3. اجرای یک مدل SGDM در بسته sgdm

4. ابزارهای اضافی مفید برای GDM و SGDM

5. بحث

6. نتیجه گیری

منابع

قبلیاطلاعات جغرافیایی معتبر و داوطلبانه در یک کشور در حال توسعه: مطالعه موردی مقایسه ای مجموعه داده های جاده در نایروبی، کنیا

بعدییک رویکرد سازماندهی و مدیریت ترکیبی NoSQL-SQL برای داده‌های مکانی بی‌درنگ: مطالعه موردی نظارت تصویری امنیت عمومی

بدون نظر

دیدگاهتان را بنویسید لغو پاسخ