خلاصه
:
این مقاله به بررسی طیف وسیعی از پلتفرمهای تحویلی میپردازد که برای کتابخانه PySAL منبع باز Python برای تجزیه و تحلیل فضایی توسعه یافتهاند. این شامل نرمافزار دسکتاپ سنتی (با رابط کاربری گرافیکی، خط فرمان یا تعبیهشده در یک نوتبوک محاسباتی)، میانافزار تحلیل فضایی باز، و تحلیلهای مکانی باز وب، ابر و توزیعشده برای پشتیبانی از تصمیمگیری است. یک موضوع مشترک در سراسر بحث تاکید بر باز بودن، قابلیت همکاری و مدیریت منشأ در یک گردش کار علمی است. پایه کد کتابخانه PySAL چارچوب محاسباتی مشترکی را که زیربنای همه مکانیسمهای تحویل است، فراهم میکند.
کلید واژه ها:
تحلیل فضایی ; اقتصاد سنجی فضایی ; سیستم های پشتیبانی تصمیم گیری فضایی ; cyberGIS ; نرم افزار متن باز ; محاسبات با کارایی بالا
1. معرفی
پیشرفتهای اخیر در فناوریهای زمینفضایی، بهمنی از منابع جدید و مقادیر دادههای جغرافیایی ارجاعشده را ایجاد کرده است [ 1 ، 2 ]. اینها هم پتانسیل عظیمی برای علم و جامعه و هم چالش های اساسی را نشان می دهند. از دیدگاه اجتماعی، جریانهای دادههای زنده و سیستمهای داشبورد برای تجسم الگوهای این جریانها نه تنها زیرساختهای فناوری جدید در شهرهای هوشمند را مشخص میکنند، بلکه در بسیاری از مناطق شهری رایجتر میشوند [ 3 ]]. در این زمینه، فرصتی برای تکمیل راهحلهای دسکتاپ جعبه بسته سمت کلاینت برای تجزیه و تحلیل دادههای فضایی با کتابخانههای نرمافزار تحلیل فضایی مدولارتر و قابل توسعهتر وجود دارد. اینها را می توان به طور انعطاف پذیر با جریان های داده های زنده، کتابخانه های تجسم و ابزارهای پشتیبانی تصمیم ادغام کرد تا بخشی از راه حل های پایان به انتها از داده ها تا تجزیه و تحلیل و تجسم برای ایجاد بینش های مبتنی بر شواهد در زمان واقعی باشد. علاوه بر این، از آنجایی که دادههای دولتی باز بهطور منظم در قالبهای قابل خواندن ماشین منتشر میشوند، نیاز به تجزیه و تحلیل باز، از جمله تجزیه و تحلیل فضایی، برای درک الگوها در این مجموعه دادههای بزرگتر وجود دارد. فقدان هزینه مجوز به تحلیلگران در مؤسسات دولتی، غیرانتفاعی و آموزشی که در حال حاضر از دادههای باز استفاده میکنند، این امکان را میدهد تا تحلیلهای قدرتمندتری را به کار گیرند. سرانجام،4 ].
از منظر علمی، این منابع کلان داده جدید، احتمالات وسوسه انگیزی را برای مطالعه انواع جدیدی از پدیده های اجتماعی-اقتصادی، و به روش های جدید نشان می دهند که ظهور علم اجتماعی محاسباتی را تحریک کرده است [ 5 ، 6 ، 7 ، 8 ]. تعدادی از برنامه های کاربردی اخیر و با مشخصات بالا مانند ابتکار پزشکی دقیق کاخ سفید [ 9 ]، یا سیستم های شهرهای هوشمند [ 10 ، 11 ] حاکی از پتانسیل نهفته در داده های بزرگ هستند. با این حال، اغلب اوقات، این پیاده سازی ها به عنوان اثبات مفهوم یا نمونه های اولیه تولید می شوند، و برخی از پیچیدگی های روش شناختی به طور کامل در نظر گرفته نمی شوند (به عنوان مثال، بحث در [12 ]). به طور مشابه، “مش آپ” های بی شماری وجود داشته است که از داده های مکانی بزرگ استفاده می کند که پتانسیل سیستم های تحلیلی مبتنی بر وب را نشان می دهد، مانند مورد نقشه برداری جرم، نقشه برداری آنفولانزا و مرزهای محله (به عنوان مثال، [ 13 ، 14 ]؛ اما همچنین ببینید [ 15 ]، برای ارزیابی انتقادی).
در حالی که همه این برنامه ها الهام بخش و نوآورانه هستند، آنها همچنین چالش های اساسی را کشف کرده اند که تجزیه و تحلیل جغرافیایی قبل از اینکه بتواند به طور کامل با عصر کلان داده درگیر شود، با آن مواجه است. اینها در درجه اول به توانایی نرم افزار در مقیاس فراتر از مطالعه موردی نمونه اولیه و همچنین پشتیبانی از قابلیت همکاری با سایر خدمات و نرم افزارهای تحلیلی فضایی و تکرار علمی و تکرارپذیری مربوط می شود. چالش مقیاسپذیری به این دلیل به وجود میآید که بیشتر نرمافزارهای آماری و اقتصادسنجی فضایی که در این سیستمهای نمونه اولیه استفاده میشوند، در اصل برای عصر دادههای بزرگ یا برای بهرهبرداری از انواع جدیدی از محیطهای محاسباتی با کارایی بالا طراحی نشده بودند [ 16 ].]. علاوه بر این، در حالی که درخواستها برای تکرار و تکرارپذیری اخیراً به خط مقدم دستور کار علم باز رفته است، این مفاهیم در تابلوی سفید طراحان نرمافزار تحلیلی فضایی نسل قبلی ما نبود.
در این مقاله، تلاشهای پژوهشی جمعی خود را که بر روی پرداختن به این چالشها متمرکز شدهاند، گزارش میکنیم. ما نمونههای اخیر تجزیه و تحلیل فضایی باز را ارائه میکنیم که از کتابخانه تحلیل فضایی رایگان و منبع باز مبتنی بر پایتون (PySAL) توسعهیافته در مرکز تحلیل و محاسبات مکانی GeoDa استفاده میکند. چندین نمونه از فرمتهای تحویل انعطافپذیر PySAL مورد بحث قرار گرفتهاند که شامل برنامههای دسکتاپ (مستقل و پلاگین)، برنامههای کاربردی مبتنی بر وب (سرویسهای وب، مدیریت دادههای مکانی مبتنی بر وب)، و یک سیستم پشتیبانی تصمیم (چارچوب سیستمهای پیچیده) است. CSF). اینها نمونههای خاصی از یک چارچوب روششناختی انعطافپذیر بزرگتر را برای کشف و توضیح الگوهای دادههای ناحیه فضایی از طریق تکنیکهای جدید برای تحلیل فضا-زمان و اقتصادسنجی فضایی ارائه میکنند. تجزیه و تحلیل جغرافیایی انعطاف پذیر به موارد زیر اشاره دارد: (1) جعبه ابزاری از چارچوب های روش شناختی از تجزیه و تحلیل بصری جغرافیایی تا مدل سازی اقتصاد سنجی فضایی. (2) پیادهسازی نرمافزاری که مدولار، منبع باز و کراس پلتفرم است. و (3) ارائه عملکرد از طریق چندین رابط کاربری. این جعبه ابزار از طریق نرمافزار دسکتاپ رایگان سنتی، توسعههای جعبه ابزار به سیستمهای اطلاعات جغرافیایی تجاری، و ادغام در برنامههای مبتنی بر وب مانند خدمات وب و سیستم داشبورد برای پشتیبانی تصمیمگیری ارائه میشود.
بقیه مقاله به شرح زیر سازماندهی شده است. در بخش 2 مروری بر کتابخانه PySAL ارائه میکنیم و در مورد انگیزه و تاریخچه توسعه آن بحث میکنیم. سپس مجموعهای از ابزارهای تحلیل جغرافیایی مبتنی بر دسکتاپ را ارائه میکنیم که با استفاده از PySAL در بخش 3 ساخته شدهاند . اینها شامل CAST، یک ابزار مستقل برای تجزیه و تحلیل داده های فضا-زمان اکتشافی و GeoDaSpace است که بر اقتصاد سنجی فضایی مدرن تمرکز دارد. همچنین استفاده از PySAL با نوتبوکها و پوستههای محاسباتی، مانند IPython [ 17 ]، و گنجاندن PySAL با توزیعهایی برای محاسبات علمی در پایتون مورد بحث قرار گرفت. در بخش 4ما برخی از چالشهایی را که هنگام انتقال PySAL از عرصه دسکتاپ به محاسبات با کارایی بالا و زمینه توزیع شده با آن مواجه هستیم، در نظر میگیریم. ما در مورد کار بر روی توسعه معماری برای ردیابی منشأ جریانهای تحلیلی فضایی و طراحی یک API REST با هدف پشتیبانی از قابلیت همکاری بین PySAL و سایر بستههای نرمافزاری بحث میکنیم. سپس در بخش 5 نمونه هایی از PySAL را در شبکه، ابر و سیستم های پشتیبانی تصمیم توزیع شده ارائه می کنیم. مقاله با بحث در مورد مسیرهای آینده برای این کار پایان می یابد.
2. PySAL
2.1. انگیزه برای PySAL
PySAL یک کتابخانه بین پلتفرمی منبع باز از توابع تحلیل فضایی است که در پایتون [ 18 ] نوشته شده است. این از بحث و گفتگو بین رهبران نهایی پروژه که در اوایل دهه 2000 اتفاق افتاد، متولد شد. در زمانی که پایتون تازه شروع به نفوذ به محاسبات علمی کرده بود، با این حال تحلیل جغرافیایی تا حد زیادی در پشته نرم افزار علمی پایتون وجود نداشت. ما نیاز به آوردن تحلیل فضایی، آمار فضایی و اقتصادسنجی فضایی را در این جامعه دیدیم. همزمان، ما همچنین پروژههای نرمافزاری موجودی داشتیم که از Python، STARS (Rey) و PySpace (Anselin) استفاده میکردند که احساس میکردیم میتوانند از اشتراکگذاری الگوریتمها و ساختارهای دادهای مشترک بهره ببرند تا کپیسازی را کاهش داده و منابع تلفیقی را در بهینهسازی موارد جدید و بهبود یافته فراهم کنیم. پایه کد
از ابتدا، PySAL به عنوان کتابخانه ای در نظر گرفته شده است که توسط اهداف ما برای استفاده از مدولارسازی کد و پشتیبانی از استفاده مجدد انعطاف پذیر و ترکیبی از اجزای موجود در کتابخانه هدایت می شود. همانطور که در بخشهای بعدی به طور کامل بحث میکنیم، این طراحی به PySAL اجازه میدهد تا در پلتفرمهای مختلف و برای طیف وسیعی از موارد استفاده مختلف ارائه شود. بنابراین ما تلاش قابل توجهی را در طراحی کتابخانه و زیرساخت های مربوطه برای حمایت از پذیرش گسترده برای توسعه برنامه های کاربردی سطح بالا برای تجزیه و تحلیل فضایی انجام داده ایم. از دیدگاه ما میبینیم که PySAL هم بهعنوان هدف تحقیقات خودمان در مورد پیشبرد تحلیلهای مکانی و هم بهعنوان یک مکانیسم انتشار قدرتمند برای فعال کردن اکتشافات علمی در سراسر علوم اجتماعی، زیستی و فیزیکی عمل میکند. برنامه های تحقیقاتی خود ما به شدت با توسعه PySAL همراه است. اعضای تیم اصلی در توسعه تجزیه و تحلیل های جدید مکانی و فضا-زمانی که به طور گسترده در جامعه علمی پذیرفته شده اند، بسیار فعال هستند. همانطور که به این خط از تحقیقات ادامه می دهیم، پیشرفت های جدید به طور مداوم به کتابخانه اضافه می شود. ما همچنین نمونه بسیاری از دانشمندان علوم اجتماعی دیگر هستیم زیرا PySAL را برای تحقیقات تجربی خود در مورد انواع مختلف مشکلات اساسی بسیار مفید میدانیم.
PySAL که ابتدا در جولای 2010 تحت مجوز توزیع نرم افزار برکلی منتشر شد، به طور مداوم در یک چرخه انتشار 6 ماهه به روز می شود و در زمان نگارش نسخه پایدار 1.91 است. از زمان انتشار اولیه، PySAL بیش از 60000 بار دانلود شده است. این محبوبیت همچنین در PySAL که به عنوان یک بسته ویژه در توزیع های نرم افزاری پیشرو برای محاسبات علمی در Python، Enthought و Anaconda گنجانده شده است، منعکس شده است.
2.2. اجزای PySAL
PySAL به عنوان مجموعه ای یکپارچه از ماژول ها با تمرکز ویژه بر داده های مکانی مبتنی بر برداری طراحی شده است. ماژول وزن ها ساخت، دستکاری و تبدیل وزن های فضایی را فراهم می کند که در بسیاری از انواع تحلیل های فضایی نقش اساسی دارند. به طور کلی وزن های فضایی روابط همسایگی بین جفت مشاهدات فضایی را رسمیت می بخشد. از آنجایی که معیارهای مختلفی را می توان برای تعریف روابط همسایه استفاده کرد، ماژول وزن ها از سه دسته بزرگ وزن پشتیبانی می کند: (1) بر اساس مجاورت. (2) بر اساس فاصله؛ و (3) هیبریدی. کلاسهایی که وزنها را پیادهسازی میکنند از نظر ردپای حافظه و سرعت محاسبات بسیار بهینه شدهاند. وزنه هاماژول همچنین از خواندن و نوشتن حدود 13 فرمت خارجی مختلف برای وزن های فضایی برای تسهیل قابلیت همکاری با سایر بسته های تحلیلی فضایی پشتیبانی می کند.
معیارهای جهانی و محلی خودهمبستگی فضایی جنبه های کلیدی ماژول تحلیل داده های فضایی اکتشافی را شامل می شود: esda . هر دو شاخص جهانی و محلی برای تداعی فضایی [ 19 ] برای Moran’s I، Geary’s c و کلاس آمار Getis-Ord اجرا می شوند. علاوه بر این، آمار تعداد پیوستن برای ویژگیهای باینری نیز ارائه شده است و برای همه معیارها، هم رویکردهای تحلیلی و هم مبتنی بر جایگشت برای استنتاج موجود است. ماژول esda همچنین شامل طیف گسترده ای از طرح های طبقه بندی برای نقشه های choropleth است.
ماژول نابرابری آمارهای مختلفی را برای تحلیل نابرابری در توزیعهای فضایی پیادهسازی میکند. معیارهای جهانی نابرابری مانند آمار مبتنی بر اطلاعات Theil و شاخص جینی گنجانده شده است. نسخههای فضایی این معیارهای نابرابری شامل تجزیه فضایی آمار Theil [ 20 ] و تجزیه فضایی Gini [ 21 ] است. آمار اخیر در مورد درجه ای که نابرابری سطوح کلی ممکن است تفاوت در نابرابری بین جفت مشاهدات همسایه و غیر همسایه را پنهان کند، گزارش می دهد.
روشهایی برای تشکیل مناطق مشاهدات مرتبط فضایی توسط ماژول منطقهسازی ارائه شدهاند. اینها شامل الگوریتم max-p [ 22 ] است، یک اکتشافی که پارتیشنی از حداکثر تعداد نواحی از مناطق متصل فضایی را ایجاد میکند که هر منطقه محدودیت آستانه ( به عنوان مثال ، جمعیت) را مشخص میکند. همچنین در منطقهبندی ، روشهایی برای تولید مناطق تصادفی برای اهداف شبیهسازی و روشهایی برای استنتاج راهحلهای منطقهسازی وجود دارد.
ماژول دینامیک فضایی متشکل از مجموعهای از روشها است که روشهای کلاسیک ESDA را برای گنجاندن یک بعد زمانی از جمله LISA فضا-زمان و تجسمهای مرتبط گسترش میدهد [ 23 ]. به طور مشابه، تحقیقاتی که روشهایی را از ادبیات دینامیک توزیعی گسترش داده است، مانند زنجیرههای مارکوف، به نسخههای صریح فضایی جدیدی از این رویکردها یا به اصطلاح روشهای دینامیک توزیع فضایی [ 24 ] منجر شده است که مؤلفه اصلی دیگر دینامیک فضایی را تشکیل میدهد. مدول.
روش های مدرن اقتصاد سنجی فضایی از طریق ماژول spreg ارائه می شود. شامل تکنیک هایی برای آزمایش و برآورد اثرات فضایی در مدل های رگرسیون خطی است. وابستگی فضایی از طریق مدل های خودبازگشت فضایی انجام می شود در حالی که ناهمگونی فضایی با مدل های رژیم فضایی درمان می شود. روشهای تخمین شامل برآورد حداکثر احتمال کلاسیک و تکنیکهای اخیراً توسعهیافتهتر بر اساس اصل روش تعمیمیافته گشتاورها (GMM) است. [ 25 ] یک راهنمای جامع برای ماژول spreg ارائه می دهد.
جدیدترین ماژول تحلیلی اصلی اضافه شده شبکه است . این روشهایی را برای تحلیل فضایی پدیدههایی که به فضای شبکه محدود شدهاند، اجرا میکند [ 26 ]. شبکه شامل روشهایی برای تداعی فضایی جهانی و محلی در شبکهها و همچنین روشهای مبتنی بر الگوی نقطهای از جمله توابع G، F و K است. روشهای کاربردی برای اتصال دادههای نقطه به لبههای شبکه و همچنین تقسیمبندی شبکه نیز در ماژول گنجانده شده است.
علاوه بر این ماژولهای اصلی، ماژولهای مشارکتی در PySAL وجود دارد که میتوان ماژولهای شخص ثالث را توسعه داد که به وابستگیهایی فراتر از وابستگیهای PySAL NumPy و SciPy نیاز دارند. اینها شامل پشتیبانی از رابط با شکل ، خوشه ای ، و ماژول viz است که رابط هایی را برای تجسم به چارچوب هایی مانند folium و d3 فراهم می کند .
3. Geospatial Analytics را روی دسکتاپ باز کنید
از آنجایی که اکثر کاربران نهایی PySAL معمولاً در محیطهای دسکتاپ کار میکنند، ما سه رویکرد اصلی را برای دسترسی به عملکرد PySAL در این پلتفرم توسعه دادهایم. اولین شامل برنامه های کاملاً جدیدی است که از ابتدا توسعه یافته اند و در آنها اجزای PySAL نقش موتور محاسباتی را ایفا می کنند. رویکرد دوم ادغام PySAL در یک برنامه دسکتاپ موجود از طریق معماری پلاگین برنامه بوده است. رویکرد نهایی PySAL روی دسکتاپ، تکیه بر پارادایم جدید نوتبوکهای محاسباتی بوده است.
3.1. برنامه های دسکتاپ ساخته شده با PySAL
CAST که مخفف Crime Analytics in Space-Time است [ 27 ] یک برنامه رومیزی مستقل برای تشخیص الگوهای مکانی و روند دادههای نقطهای (مانند جنایات یا بیماریها) است. کاربران میتوانند ویژگیها و زمینههای فضایی مختلف رویدادها را در نماهایی مانند نقشهها، نمودارها و تقویمها که میتوانند در طول زمان متحرک شوند، نمایش دهند ( شکل 1 ). همه این نماها به هم پیوند خورده اند تا به تحلیلگران اجازه دهند شناسایی کنند که چگونه زیرمجموعه های انتخاب شده از داده ها در این ابعاد مشخص می شوند. آزمونهای معنیداری آماری برای شناسایی خوشههای فضایی رویدادها و غلظتهای زمانی جنایات اعمال میشوند.
CAST بر تجزیه و تحلیل در پویایی فضایی و ماژولهای esda در PySAL تأکید دارد. رابط آن از کارهای قبلی در GeoDa و STARS [ 28 ] برای پیاده سازی کامل براشینگ و پیوند الهام گرفته شده است، اما عملکرد رابط را به روش های مهمی گسترش می دهد. CAST امکان نمایش چندین لایه فایل شکل را فراهم می کند و این کار را می توان در یک نمای واحد یا با هر نما به عنوان یک پنجره جداگانه انجام داد. پرس و جوهای مکانی، زمانی و فضا-زمان نیز پشتیبانی می شوند. این برنامه بر روی سه سیستم عامل اصلی Windows، MacOSX و Linux اجرا می شود.

شکل 1. PySAL به عنوان یک برنامه کاربردی دسکتاپ مستقل (CAST) ارائه شده است.
GeoDaSpace [ 25 ] نمونه دومی از یک برنامه کاربردی دسکتاپ است که زیرمجموعه ای از عملکرد PySAL را برای ارائه یک رابط گرافیکی دوستانه برای تجزیه و تحلیل های فضایی پیشرفته می پوشاند. در این مورد تمرکز بر زیر مجموعه ای از مدل ها و روش ها در جزء spreg کتابخانه است. شکل 2 نمونه ای از استفاده از GeoDaSpace را ارائه می دهد که یک گفتگوی رابط کاربری گرافیکی خاص را برای تعیین یک مدل به همراه نتایج تخمین مدل و تست های تشخیصی در پنجره سمت راست آن نشان می دهد.
در نگاه اول، ایده نوشتن یک برنامه کاملاً جدید دسکتاپ برای تجزیه و تحلیل جغرافیایی، کاری دلهره آور و شاید اتلاف منابع توسعه دهنده به نظر می رسد. با این حال، دو دلیل وجود دارد که معلوم می شود اینطور نیست. اول، یک آژانس تامین مالی ممکن است الزامات خاصی برای یک برنامه تخصصی داشته باشد و در واقع، این مورد برای CAST بود. ثانیاً، از آنجا که PySAL موتور تحلیلی را برای برنامههای فوق ارائه میکند، تلاش توسعه فقط بر روی رابط متمرکز است (گرافیک تعاملی برای CAST، و رابط مبتنی بر منو برای GeoDaSpace).

شکل 2. GeoDaSpace برای عملکرد اقتصاد سنجی فضایی از PySAL.
3.2. جعبه ابزار PySAL برای دسکتاپ GIS
دومین استراتژی برای PySAL روی دسکتاپ، استفاده از رابط برنامه نویسی برنامه (API) یا معماری پلاگین یک برنامه دسکتاپ موجود است. یکی از نمونههای آن توسعه ما از Takeit PySAL برای برنامه ArcGIS ESRI است. زیرمجموعه های عملکرد موجود در GeoDaSpace به عنوان بخشی از ابزار PySAL ArcGIS گنجانده شده اند ( شکل 3 ). منتخبی از برآوردگرها از اسپرگماژول همراه با روشهایی برای ساخت وزنهای فضایی مجاورت، فاصله یا هسته از طریق گفتگوی منوی ArcGIS در معرض دید قرار میگیرد. همچنین از کاربر خواسته می شود که متغیرهای وابسته و مستقل را برای تعیین مدلی که باید تخمین زده شود، انتخاب کند. با ادغام PySAL با ArcGIS، تمرکز روشهای فضایی کتابخانه با زیرساخت GIS ArcGIS ترکیب میشود. برای مثال، نتایج مدل از جعبه ابزار PySAL، مانند مقادیر پیشبینیشده یا باقیماندهها، میتوانند متعاقباً در ArcGIS نگاشت شوند.
علاوه بر جعبه ابزار متمرکز بر اقتصاد سنجی فضایی برای ArcGIS، ما با اعضای اصلی تیم توسعه QGIS برای نمونه سازی اولیه یک پلاگین PySAL برای جعبه ابزار پردازش همکاری کرده ایم. شکل 4 کاربرد کلاس LISA را در ماژول esda PySAL و تجسم آن از طریق رابط QGIS نشان می دهد. ماژول های دیگر PySAL نیز در جعبه ابزار نشان داده شده اند، در حالی که برنامه هایی برای تبدیل افزونه PySAL به یک ماژول اصلی در چارچوب پردازش و انتشار آن به عنوان جزئی از QGIS در حال انجام است.

شکل 3. PySAL به عنوان جعبه ابزار ArcGIS ارائه شده است.

شکل 4. PySAL در جعبه ابزار پردازش QGIS.
این استراتژی دوم استفاده از معماری پلاگین یک برنامه دسکتاپ GIS دارای چندین مزیت است. اول، پردازش جغرافیایی، پیشبینی نقشه و پشتیبانی از طیف گستردهای از انواع دادههای مکانی را میتوان توسط برنامه GIS ارائه کرد، در حالی که عملکرد خاص PySAL به عنوان یک افزونه یکپارچه شده است. این تا حد زیادی هزینه توسعه بزرگ را برای تیم PySAL حذف میکند، تیمی که قبلاً باید عملکرد مشابهی را برای راهاندازی کار تحلیلی ما توسعه میداد. اکنون، بدون نیاز به صرف زمان توسعهدهنده برای این نگرانیها، تیم ما میتواند به جای آن بر تجزیه و تحلیلهای جغرافیایی جدید در کتابخانه تمرکز کند.
3.3. محاسبات تعاملی روی دسکتاپ
رویکرد نهایی PySAL بر روی دسکتاپ از کاربرد یک محقق واحد که بر روی تجزیه و تحلیل داده ها از دیدگاه اکتشافی کار می کند الهام گرفته شده است. در این حالت، محقق پیچیده میخواهد به تمام قابلیتهای موجود در کتابخانه دسترسی داشته باشد و به وضوح یک رابط مبتنی بر رابط کاربری گرافیکی که تنها زیرمجموعهای از PySAL را نشان میدهد، این عملکرد را محدود میکند. PySAL را می توان به روش های مختلفی برای این نوع تحلیل به کار برد. اول، از آنجایی که یک ماژول پایتون است، وارد کردن کتابخانه PySAL به یک مفسر پایتون در حال اجرا در خط فرمان، یک رابط کاربری بسیار انعطافپذیر برای محاسبات تعاملی ارائه میدهد. ثانیا، PySAL همچنین می تواند برای استفاده در پردازش دسته ای و کار شبیه سازی به اسکریپت ها وارد شود. اغلب این دو حالت اول با هم در انجام کارهای اکتشافی استفاده می شوند. به عنوان محقق در اعلان تعاملی شروع به کشف روش های خاص و آزمایش دنباله های مختلف عملیات می کند. پس از رضایت از گردش کار، توالی دستورات را می توان در یک اسکریپت برای استفاده بعدی یا برای اهداف تکراری ترکیب کرد.
رویکرد سوم برای استفاده از PySAL برای محاسبات علمی اکتشافی بر روی دسکتاپ، نوت بوک IPython [ 17 ] است. این نوت بوک یک محیط محاسباتی تعاملی مبتنی بر مرورگر است که در آن محقق می تواند اسکریپت اکتشافی را با نظرات متنی در قالب LaTeX یا Markdown همراه با تجسم های علمی جاسازی شده و سایر رسانه های غنی ترکیب کند. این یک چارچوب انقلابی برای انجام محاسبات علمی روی دسکتاپ ارائه می دهد. شکل 5 استفاده از PySAL و folium را در یک جلسه نوت بوک نشان می دهد. نوت بوک از سلول هایی تشکیل شده است که می توانند بلوک های کد را با هم گروه بندی کنند، مانند سلول های “In [ 29 ]:” و “In [ 30 ]]:” در شکل، و همچنین خروجی یا تجسم حاصل از اجرای یک بلوک، مانند نقشه در “Out [ 30 ]:”.

شکل 5. PySAL در نوت بوک IPython.
4. میان افزار تجزیه و تحلیل فضایی را باز کنید
برنامه های دسکتاپ معمولاً توسط یک محقق روی یک ماشین واحد استفاده می شود. حرکت به یک زمینه محاسباتی توزیع شده و با کارایی بالا مستلزم معماری هایی است که بتواند از قابلیت همکاری بین اجزا و سرویس ها پشتیبانی کند و همچنین از قابلیت های جدید سخت افزار موجود بهره برداری کند. این یک موضوع ساده نصب نسخه دسکتاپ کتابخانه PySAL بر روی سخت افزار جدید نیست، بلکه تعدادی چالش اساسی وجود دارد که اگر بخواهیم پتانسیل محاسبات با کارایی بالا (HPC) برای تجزیه و تحلیل فضایی محقق شود، باید مورد توجه قرار گیرد. در میان این موارد، مسائل مربوط به منشأ و متا دادهها برای گردشهای کاری تحلیلی فضایی است که به ویژه هنگام در نظر گرفتن محاسبات توزیعشده و قابلیت همکاری بین سرویسهای مختلف حیاتی میشوند [ 16 ]]. در حالی که کار زیادی روی منشأ و فراداده برای دادههای مکانی و ژئوپردازش انجام شده است، چارچوبهای مشابه برای زنجیرهای کردن روشهای تحلیلی فضایی در مراحل ابتدایی خود هستند. بدون این چارچوب ها، تکرار و تکرارپذیری تجزیه و تحلیل مکانی در HPC و پلت فرم های توزیع شده دور از دسترس باقی می ماند.
مجموعه دوم از چالش ها مربوط به الزامات قابلیت همکاری است. برای اطمینان از اینکه بستهها و سرویسهای تحلیلی مختلف فضایی میتوانند برای حل مسئله با هم زنجیره شوند، ضروری است که هر ماژول در زنجیره یک رابط قابل کشف ارائه دهد تا عملکرد آن قابل درک و بهرهبرداری باشد. اتوماسیون این فرآیند کشف، جام مقدس خدمات و محاسبات توزیع شده باقی می ماند.
ما در حال بررسی چالشهای منشأ و قابلیت کشف تحلیلی از طریق میانافزار هستیم که به ما امکان میدهد PySAL را به HPC و دامنههای توزیعشده منتقل کنیم. در زیر به این تلاش ها می پردازیم.
4.1. منشأ و متا داده برای پشتیبانی از گردش کار علمی
معماری منشأ PySAL [ 31 ] بر اساس اصول زیر طراحی شده است: (1) باید سبک وزن باشد. (2) باید از ادغام آسان با ماژول های تحلیلی و تجسمی فضایی در داخل و خارج از قلمرو PySAL پشتیبانی کند. (3) باید فراخوانی خودکار توابع PySAL و زنجیرهای از گردشهای کاری تحلیلی فضایی را تسهیل کند. (4) باید یک ساختار داده قابل فهم و قابل خواندن برای انسان فراهم کند. و (5) باید امکان تکرار نتایج تحلیلی را فراهم کند.
مانع اصلی که طرحهای منشأ موجود، مانند W3C PROV مبتنی بر XML (زبان نشانهگذاری توسعهیافته) را از پذیرش گسترده در سیستمهای نرمافزاری عملیاتی نگه میدارد، رمزگذاری پیچیده اطلاعات منشأ است. این پیچیدگی یک بار محاسباتی اضافی ایجاد می کند. در نتیجه، ما تصمیم گرفتهایم که ساخت ماژول منشأ PySAL را به جای XML بر اساس JSON (Notation Object JavaScript) قرار دهیم. شکل 6a نمونهای از ساختار منشأ وزنهای فضایی را نشان میدهد، یک عملیات اساسی در آمار فضایی لازم برای تعیین کمیت وابستگی فضایی در بین مشاهدات. به طور کلی، علاوه بر فرمت فایل ورودی و عملکرد، پارامترهای اضافی، مانند اینکه آیا مقادیر در یک ماتریس وزن فضایی نیاز به استانداردسازی دارند یا خیر، نیز توسط کلید “تبدیل” کدگذاری می شوند. پذیرش JSON به عنوان طرح رمزگذاری برای منشأ، خواندن ساختار را هم توسط ماشین و هم توسط محققان آسان می کند. علاوه بر این، ادغام با پایتون تسهیل میشود زیرا فایل JSON از همان تعریف جفت کلید-مقدار مشابه ساختار دادههای دیکشنری داخلی پایتون پیروی میکند. بنابراین، یکپارچگی یکپارچه PySAL و ماژول منشأ را می توان تحقق بخشید. همچنین، چون ساختار JSON تگهای باز و بسته اضافی مورد نیاز در XML را حذف میکند،

شکل 6. متا داده های منشأ برای گردش های کاری تحلیلی فضایی در قالب جاوا اسکریپت Object Notation (JSON).
چارچوب منشأ به گونه ای طراحی شده است که قابل توسعه باشد و بازتولید و اعتبارسنجی خودکار داده ها را به عنوان بخشی از یک گردش کار تحلیلی امکان پذیر می کند. شکل 6 b محتویات یک فایل منشأ را برای فراخوانی عملکرد Local Moran’s I از ماژول همبستگی فضایی PySAL نشان می دهد. بهجای تعریف دادههای ورودی واقعی به این صورت، یک رویکرد بازگشتی با ارائه پیوندی به فایل منشأ دیگری که جزئیات ایجاد وزنهای فضایی را نشان میدهد (مانند شکل 6 a) اتخاذ میشود. بنابراین، این طراحی تعبیهشده توانایی پیمایش منشأ بازگشتی و اعتبارسنجی دادههای میانی را فراهم میکند.
از طریق این ماژول منشأ و موتور منشأ مرتبط، همه مراحل اتمی در یک گردش کار تحلیل فضایی را می توان به طور خودکار در قالب قابل خواندن ماشین و انسان ثبت کرد و در نتیجه اعتبارسنجی متقابل یافته های علمی را تسهیل کرد. همچنین میتواند از طریق یک رابط وب سرویس، مانند OGC WPS، یا REST API ارائه شود تا قابلیت همکاری ماژولهای تحلیلی فضایی را در بستههای نرمافزاری مختلف افزایش دهد.
4.2. PySAL REST API برای قابلیت کشف و همکاری
PySAL-REST یک API سمت سرور است که با درون سنجی پایه کد PySAL، بسته بندی کتابخانه PySAL، و افشای عملکردهای تحلیلی فضایی از طریق یک رابط RESTful تولید می شود. انتقال دولت نمایندگی [ 32] مجموعه ای از محدودیت های پیاده سازی است که برای پشتیبانی از قابلیت همکاری بین اجزای نرم افزار توزیع شده طراحی شده است. این الزامات عبارتند از: (1) جدایی واضح از نگرانی ها که توسط معماری لایه ای مشتری-سرور تجسم یافته است. (2) ارتباط بدون حالت که در آن هر پیام باید شامل تمام اطلاعات مورد نیاز برای انجام برخی کارها باشد، به عنوان مثال، شروع یک کار پردازش فضایی. و در نهایت (3) استانداردسازی پروتکل های ارتباطی، ضروری برای اجازه دادن به تغییر مستقل مشتری یا سرور. PySAL-REST طراحی شده است تا با این الزامات مطابقت داشته باشد و یک پلت فرم تجزیه و تحلیل فضایی باطن را فراهم کند که از طریق افعال استاندارد HTTP (GET، POST، PUT، DELETE) در یک محیط بسیار توزیع شده قابل دسترسی باشد.
PySAL-REST از JSON به عنوان پروتکل ارتباطی استاندارد استفاده می کند. JSON یک قالب متنی استاندارد و ساده برای پشتیبانی از ارتباط بین اجزای محاسباتی [ 33 ] است که به عنوان یک قالب ارتباطی کارآمد در سراسر وب کاربرد گسترده ای پیدا می کند [ 30 ، 34 ]. شکل 7 ، زیر، دنباله ای از مراحل تحلیلی مورد نیاز برای: (1) دریافت اطلاعات درخواستی در مورد یک مجموعه داده موجود را نشان می دهد. (2) درخواست GET برای آرگومان های مورد نیاز برای اجرای یک روش تحلیلی معین. (3) درخواست POST برای انجام یک کار تحلیلی اتمی. و (4) درخواست دریافت برای دسترسی به یک جزء از نتیجه تحلیلی.

شکل 7. PySAL REST-API.
در چارچوب PySAL-REST، درون نگری و بازتاب کد خودکار مزایای کلیدی را نسبت به توسعه لایههای رابط مستقل فراهم میکند. اول، با تحقق عملکرد جدید در کتابخانه PySAL، بلافاصله از طریق PySAL-REST بدون تلاش های اضافی برای توسعه در دسترس است. دوم، متا دادههایی که هر عملیات تحلیل فضایی اتمی را توصیف میکنند، مستقیماً از کد منبع PySAL استخراج میشوند و یک API مستندسازی را ارائه میدهند که اطلاعات ضروری برای تجزیه و تحلیل زنجیرهای را بدون مداخله بهروزرسانی میکند. در نهایت، بازتاب کد اجازه میدهد تا نتایج تحلیلی با فرادادههای تحلیلی بوت استرپ شوند و اطلاعات منشأ ضروری را ارائه دهند. هنگامی که این سه مورد با هم ترکیب شوند، یک راه حل باطن ارائه می دهند که به طور ایده آل برای ارائه قابلیت همکاری مناسب است.
5. تجزیه و تحلیل جغرافیایی باز وب، ابر و توزیع شده
میان افزار مورد بحث در بالا از حرکت PySAL به وب، ابر، گرید و محیط های محاسباتی توزیع شده پشتیبانی می کند. در اینجا مجموعهای از این پیادهسازیها را که طیف وسیعی از موارد استفاده برای تحلیل فضایی HPC را پوشش میدهند، تشریح میکنیم.
5.1. دروازه های علمی
CyberGIS Gateway [ 35 ] یک محیط نرم افزاری آنلاین CyberGIS است که از تجزیه و تحلیل جغرافیایی و حل مسئله با قابلیت زیرساخت سایبری پشتیبانی می کند. Gateway تعدادی بستهها و برنامههای کاربردی مشترک و با کارایی جغرافیایی را در زیرساختهای NSF XSEEDE و Open Science Grid پیادهسازی میکند و دسترسی به منابع قدرتمند رایانه را از طریق رابطهای کاربر مبتنی بر مرورگر فراهم میکند. شکل 8 مولفه CG-PySAL دروازه را نشان می دهد که اجزای ماژول spreg PySAL را در پشتیبانی از تحلیل اقتصادسنجی فضایی نشان می دهد.
علاوه بر پشتیبانی از دروازه CyberGIS، یک جعبه ابزار CyberGIS مجموعه ای از ماژول های نرم افزاری منبع باز منبع باز را با تأکید بر مقیاس پذیری گرد هم می آورد. این پلت فرمی را برای تحقیق در مورد مقیاس پذیری الگوریتم های تحلیل فضایی و جفت شدن آنها با بسته های دیگر برای پشتیبانی از جریان های کاری انعطاف پذیر فراهم می کند. شکل 9 ادغام یک تلاش تحقیقاتی را با تمرکز بر موازی سازی یک جزء از کتابخانه PySAL، یعنی پیاده سازی مقیاس پذیر طبقه بندی های نقشه choropleth بهینه برای مجموعه داده های عظیم، گزارش می کند [ 29 ، 36 ].

شکل 8. PySAL در دروازه CyberGIS.
5.2. PySAL-Cloud
عملکرد PySAL همچنین می تواند در یک پلت فرم محاسبات ابری برای ارائه خدمات تحلیل فضایی مبتنی بر ابر قرار گیرد. این سرویسها به کاربران اجازه میدهند تا با استفاده از قابلیتهای محاسباتی قدرتمند ارائهشده توسط ابر، تجزیه و تحلیل فضایی را روی دادههای موجود در دسکتاپ یا ذخیرهشده در هر نقطه از ابر اعمال کنند. از آنجایی که تمام کارهای محاسباتی روی ابر در حال اجرا است، کاربران می توانند از هر دستگاهی به این خدمات مبتنی بر ابر در سراسر جهان دسترسی داشته باشند. شکل 10 PySAL-cloud را نشان می دهد که نمونه اولیه یک سرویس تحلیل فضایی مبتنی بر ابر است. این به کاربران اجازه می دهد تا به داده های خود به صورت محلی، در یک ابر خصوصی (به عنوان مثال، از طریق Dropbox یا CartoDB؛ به شکل 10 a مراجعه کنید)، یا برای بازیابی داده ها از یک ابر عمومی (مانند خزیدن خودکار داده ها از Google Maps یا جستجوی داده ها از Socrata) دسترسی داشته باشند. دیدنشکل 10 ب). سرویس PySAL-Cloud همچنین از آخرین تکنیکهای HTML5 برای تجسم نقشهها، جداول و نمودارها به سبک داشبورد قابل تنظیم استفاده میکند و قابلیت براشینگ و پیوند را پیادهسازی میکند ( شکل 10 ج را ببینید). از طریق یک رابط کاربری گرافیکی، عملکرد PySAL را می توان برای کاوش داده های مکانی و اجرای رگرسیون های فضایی فراخوانی کرد ( شکل 10 را ببینید.د). برای توسعه دهندگان بخش سوم، تمام عملکردهای PySAL را می توان به عنوان APIهای ابری قرار داد، که می تواند برای ادغام با سایر سرویس های مبتنی بر ابر برای ایجاد برنامه های مختلف استفاده شود. سرویس ابری PySAL بر روی یک زیرساخت محاسباتی با کارایی بالا پیاده سازی شده است. این امکان بهینهسازی کد را برای مدیریت دادههای فضایی بزرگ با استفاده از قابلیت محاسبات موازی و توزیعشده تخصصی که از زیرساخت HPC بهره میبرد، میدهد. این سفارشیسازی و بهینهسازی فراتر از آن چیزی است که میتوان در نسخه استاندارد پایدار و متقاطع کتابخانه پیادهسازی کرد. به عنوان مثال، در [ 37 ] یک رویکرد تجربی ترسیم شده است که از Hadoop برای ایجاد وزن های فضایی از مجموعه داده های فضایی بسیار بزرگ استفاده می کند.

شکل 9. PySAL موازی در جعبه ابزار CyberGIS.

شکل 10. PySAL-Cloud: نمونه اولیه یک پلت فرم تحلیل فضایی مبتنی بر ابر.
5.3. چارچوب سیستم های پیچیده و پشتیبانی تصمیم
چارچوب سیستم های پیچیده ( CSF ) یک نمونه منبع باز از یک سیستم پشتیبانی تصمیم گیری انعطاف پذیر است که طیفی از ماژول های محاسباتی مانند PySAL را در یک چارچوب سایبری مشترک به طور خاص برای استفاده در زمینه تصمیم گیری طراحی شده است [ 38 ]. این یک محیط سطح بالا را فراهم می کند که می تواند مدل های محاسباتی پیچیده مختلف را به هم پیوند دهد تا خروجی یک مدل فرعی یا فرآیند بتواند ورودی به دیگری ارائه کند. برنامه های کاربردی CSF بر روی یک خوشه محاسباتی متشکل از 1200 هسته پردازشی و ترکیبی 2400 گیگابایت رم اجرا می شوند تا بتوانند در زمان تصمیم گیری نتایج ایجاد کنند ( شکل 11 ).
شکل 12نمونه ای را برای کشف الگوهای جرایم در سطوح مختلف تجمع فضایی و برای دوره های زمانی مختلف نشان می دهد. نتایج بر روی داشبوردهای متعددی نمایش داده میشوند که میتوانند روی صفحههایی با اندازههای مختلف، از محیطهای تصمیمگیری مانند Decision Theater گرفته تا تلویزیونهای با صفحهنمایش بزرگ در مراکز همجوشی دادهها، نمایشگرهای رومیزی و دستگاههای همراه مانند تلفنها و پد لمسی، نمایش داده شوند. از آنجایی که نمایشگرها مبتنی بر مرورگر هستند، مستقل از پلتفرم هستند (مثلاً روی iPad، Android، Windows، Mac یا Linux اجرا میشوند). ورودی داده برای تجزیه و تحلیل می تواند ثابت (داده های قبلاً جمع آوری شده) یا تقریباً واقعی باشد، در این صورت نمایشگرها به محض به روز رسانی پایگاه داده به طور خودکار به روز می شوند. این سیستم به گونه ای طراحی شده است که انعطاف پذیر و قابل تنظیم باشد: به عنوان مثال،

شکل 11. اجزای چارچوب سیستم های پیچیده.

شکل 12. PySAL ارائه شده در سیستم پشتیبانی تصمیم مبتنی بر وب چارچوب سیستم های پیچیده.
در حالی که دروازه، جعبه ابزار، ابر و CSF نمونه های عملیاتی خاصی از انتقال PySAL به HPC و زمینه توزیع شده را نشان می دهند، ما چالش ها و فرصت های جدیدی را در این تلاش ها کشف کرده ایم. با حرکت رو به جلو، ما چارچوب یکپارچه سازی گسترده تری را متصور می شویم که از این تلاش ها مطلع شده است که در شکل 13 نشان داده شده است.. این پلتفرم از یک اصل طراحی ماژولار و اتصال شل پیروی می کند تا توسعه آسان در معماری و عملکردهای خود را تسهیل کند و همچنین قابلیت استفاده مجدد از اجزای نرم افزار موجود را افزایش دهد. از پایین به بالا، این چارچوب از پنج لایه تشکیل شده است: لایه محاسباتی، لایه نرم افزار، لایه برنامه وب، لایه پشتیبانی تصمیم و لایه برنامه. از آنجایی که هدف ما ارائه یک ابزار تجزیه و تحلیل فضایی آنلاین و تصمیمگیری قدرتمند است، منابع محاسباتی یا سختافزاری که اجزای نرمافزار را میزبانی میکند به یک ملاحظات مهم در طراحی نرمافزار تبدیل میشود. مقیاس پذیری با اجرای ماژول نرم افزار بر روی یک مرکز HPC، مانند ابر رایانه های ASU Advanced Computing Center (A2C2)، خوشه با کارایی بالا GeoDa، یا سایر منابع HPC موجود، به دست می آید.

شکل 13. چارچوب یکپارچه سازی تجزیه و تحلیل مکانی باز
تجزیه و تحلیل فضایی واقعی توسط منبع باز GeoDa [ 39] و کتابخانه PySAL. برای به اشتراک گذاری آشکار این روال ها در یک محیط توزیع شده، مجموعه ای از API های RESTful برای قرار دادن توابع اتمی در هر دو بسته توسعه داده شد. این APIها به پنهان کردن پیچیدگی نصب نرم افزار و پیکربندی سخت افزار از مصرف کنندگان ابزار کمک می کنند. در بالای لایه نرم افزار، لایه برنامه وب قرار دارد که نسخه وب GeoDa و PySAL را برای تجزیه و تحلیل آنلاین ارائه می دهد. این دو ماژول مستقیماً با REST-API برای دسترسی از راه دور به توابع تحلیل فضایی تعامل دارند. آنها همچنین رابطهای آنلاینی را ارائه میکنند تا به کاربر نهایی اجازه دهند تا زمانی که اتصال اینترنتی برای او وجود دارد، تجزیه و تحلیل را به راحتی انجام دهد. برای اطمینان از تکرارپذیری نتایج تجزیه و تحلیل، یک مدل منشأ توسعه داده شده است تا امکان تولید همزمان فراداده را فراهم کند که ردپای محصولات داده (متوسط و نهایی) را در یک گردش کار تحلیلی فضایی ردیابی کند. در همین حال، یک موتور منشأ در PySAL-Web ادغام شده است تا تفسیر ابرداده منشأ برای بازتولید و تأیید نتایج به طور خودکار امکان پذیر باشد. با رفتن به یک لایه به بالا، چارچوب سیستم پیچیده را برای فعال کردن ترکیب تجزیه و تحلیل و گردش کار از GeoDa-Web و PySAL-Web برای تقویت تصمیمگیری مؤثر، گسترش دادیم. این ابزار تصمیم گیری می تواند برای پشتیبانی از انواع برنامه های کاربردی اجتماعی-اقتصادی و علوم زمین استفاده شود. یک موتور منشأ در PySAL-Web ادغام شده است تا تفسیر ابرداده منشأ برای بازتولید و تأیید نتایج به طور خودکار امکان پذیر باشد. با رفتن به یک لایه به بالا، چارچوب سیستم پیچیده را برای فعال کردن ترکیب تجزیه و تحلیل و گردش کار از GeoDa-Web و PySAL-Web برای تقویت تصمیمگیری مؤثر، گسترش دادیم. این ابزار تصمیم گیری می تواند برای پشتیبانی از انواع برنامه های کاربردی اجتماعی-اقتصادی و علوم زمین استفاده شود. یک موتور منشأ در PySAL-Web ادغام شده است تا تفسیر ابرداده منشأ برای بازتولید و تأیید نتایج به طور خودکار امکان پذیر باشد. با رفتن به یک لایه به بالا، چارچوب سیستم پیچیده را برای فعال کردن ترکیب تجزیه و تحلیل و گردش کار از GeoDa-Web و PySAL-Web برای تقویت تصمیمگیری مؤثر، گسترش دادیم. این ابزار تصمیم گیری می تواند برای پشتیبانی از انواع برنامه های کاربردی اجتماعی-اقتصادی و علوم زمین استفاده شود.
6. نتیجه گیری
ارائه انعطافپذیر تجزیه و تحلیل بصری فضایی باز در برنامههای کاربردی مختلف دسکتاپ و مبتنی بر وب، سرمایهگذاری اولیه در توسعه کتابخانه PySAL برای اهداف و مخاطبان متعدد را افزایش میدهد. به ویژه برنامه های کاربردی مبتنی بر وب به یک زیرساخت فناوری کمک می کنند که نوید بهبود نظارت مستمر بر نتایج مورد نظر را از طریق تجزیه و تحلیل تقریباً زمان واقعی منابع مختلف داده (شامل داده های باز، اداری و منبع جمعی) می دهد. بنابراین، این برنامهها به انتشار روشها و ابزارهای توسعهیافته در دانشگاه برای استفاده توسط تحلیلگرانی که به چالشهای مرتبط با سیاست در حوزههای دیگر میپردازند، کمک میکند.
با تکیه بر تجربیات ما در توسعه تجزیه و تحلیل بصری جغرافیایی، چندین جهت برای تحقیقات آینده می بینیم. به منظور مقیاسبندی روشهای تحلیلی فضایی موجود برای استفاده از پلتفرمهای HPC، لازم است که پیادهسازیهای فعلی به ویژگیهای خاص سختافزار رایانه در دست تغییر داده شوند. با توجه به ناهمگونی چنین سخت افزاری، یک راه حل یک اندازه برای همه امکان پذیر نیست. ما در حال بررسی پیادهسازیهای بسیار بهینهشده در خوشههای تحقیقاتی خود و ارائه دسترسی به آن روشها از طریق رابطهای مبتنی بر وب هستیم.
چالش دوم و مرتبط، اجتناب از دام پیاده سازی های یکباره است که اساساً اثبات مفاهیم هستند. تنش ذاتی بین کد تحقیقاتی که برای توسعه راه حلی جدید برای یک مشکل محاسباتی استفاده می شود و فقدان عمومی کد کیفیت تولید که برای استفاده توسط جامعه تحقیقاتی گسترده تر در نظر گرفته شده است وجود دارد. این مانع از پیشرفت علم می شود، زیرا نمونه های اولیه اغلب به راحتی گسترش نمی یابند و قادر به پشتیبانی از قابلیت همکاری با ابزارهای دیگر نیستند. از طریق کار خود در PySAL نشان دادهایم که با ساختن بر روی یک کتابخانه اصلی، نه تنها میتوان رویکردها و نمونههای اولیه را کشف کرد، بلکه میتوان پیشرفتها و درسهای آموخته شده از نمونه اولیه را دوباره در کتابخانه ادغام کرد. این فرآیند تکراری مستلزم آن است که مکانیسم هایی را برای افزایش مدولار بودن و قابلیت همکاری PySAL در نظر بگیریم. با حرکت رو به جلو، ما می بینیم که تمرکز بر چارچوب های منشأ، متا داده و پشتیبانی تکراری برای تحلیل های مکانی باز اهمیت فزاینده ای پیدا می کند.
منابع
- میلر، اچ جی بهمن داده اینجاست. آیا نباید حفاری کنیم؟ J. Reg. علمی 2010 ، 50 ، 181-201. [ Google Scholar ] [ CrossRef ]
- Arribas-Bel، D. تصادفی، باز و همه جا: منابع داده در حال ظهور برای درک شهرها. Appl. Geogr. 2014 ، 49 ، 45-53. [ Google Scholar ] [ CrossRef ]
- باتی، م. Axhausen، KW; جیانوتی، اف. پوزدنوخوف، ا. بذانی، ع. واچوویچ، ام. اوزونیس، جی. پرتغالی، ی. شهرهای هوشمند آینده. یورو فیزیک J.-Spec. بالا. 2012 ، 214 ، 481. [ Google Scholar ] [ CrossRef ]
- ری، SJ علوم منطقه ای باز. ان Reg. علمی 2014 ، 52 ، 825-837. [ Google Scholar ] [ CrossRef ]
- لازر، دی. پنتلند، ای. آدامیک، ال. آرال، س. برعباسی، ع.-ل. برویر، دی. کریستاکیس، ن. پیمانکار، ن. فاولر، جی. گاتمن، ام. و همکاران علوم اجتماعی محاسباتی. Science 2009 , 323 , 721-723. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- کینگ، جی. تضمین آینده پر داده علوم اجتماعی. Science 2011 ، 331 ، 719-721. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- Edelman, B. استفاده از داده های اینترنتی برای تحقیقات اقتصادی. جی. اکون. چشم انداز 2012 ، 26 ، 189-206. [ Google Scholar ] [ CrossRef ]
- گلدر، SA; میسی، MW ردپای دیجیتال: فرصت ها و چالش ها برای تحقیقات اجتماعی آنلاین آنو. کشیش سوسیول. 2014 ، 40 ، 129-152. [ Google Scholar ] [ CrossRef ]
- کاخ سفید. برگه اطلاعات: ابتکار پزشکی دقیق پرزیدنت اوباما ؛ دفتر وزیر مطبوعات: واشنگتن، دی سی، ایالات متحده آمریکا، 2015. [ Google Scholar ]
- Batty, M. The New Science of Cities ; انتشارات MIT: کمبریج، بریتانیا، 2013. [ Google Scholar ]
- تاونسند، الف. شهرهای هوشمند: داده های بزرگ، هکرهای مدنی و تلاش برای مدینه فاضله جدید . WW Norton & Co.: نیویورک، نیویورک، ایالات متحده آمریکا، 2014. [ Google Scholar ]
- Goodchild، MF کیفیت داده های بزرگ (جغرافیایی). دیالوگ هام Geogr. 2013 ، 3 ، 280-284. [ Google Scholar ] [ CrossRef ]
- کرنشاو، جی. شوارتز، آر. هونگ، جی. Sadeh, N. پروژه زندگی: استفاده از رسانه های اجتماعی برای درک پویایی یک شهر. در مجموعه مقالات ششمین کنفرانس بین المللی AAAI در وبلاگ ها و رسانه های اجتماعی (ICWSM)، کالج ترینیتی، دوبلین، ایرلند، 4 تا 8 ژوئن 2012.
- کومار، اس. مورستاتر، اف. لیو، اچ . تحلیل داده های توییتر ; Springer-Verlag: برلین، آلمان، 2013. [ Google Scholar ]
- روث، دی. Pfeffer, J. رسانه اجتماعی برای مطالعات بزرگ رفتار. Science 2014 ، 346 ، 1063-1064. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- آنسلین، ال. ری، SJ اقتصاد سنجی فضایی در عصر علم CyberGIS. بین المللی جی. جئوگر. Inf. علمی 2012 ، 26 ، 2211-2226. [ Google Scholar ] [ CrossRef ]
- پرز، اف. Granger, B. IPython: سیستمی برای محاسبات علمی تعاملی. محاسبه کنید. علمی مهندس 2007 ، 9 ، 21-29. [ Google Scholar ] [ CrossRef ]
- ری، اس جی. Anselin, L. PySAL: کتابخانه پایتون از روش های تحلیلی فضایی. در کتابچه راهنمای تحلیل کاربردی فضایی ; Fisher, MM, Getis, A., Eds. Springer: برلین، آلمان، 2010; صص 175-193. [ Google Scholar ]
- Anselin، L. شاخص های محلی ارتباط فضایی-LISA. Geogr. مقعدی 1995 ، 27 ، 93-115. [ Google Scholar ]
- ری، SJ تحلیل فضایی نابرابری درآمد منطقه ای. در علوم اجتماعی یکپارچه فضایی: نمونه هایی در بهترین عمل . Goodchild, MF, Janelle, D., Eds. انتشارات دانشگاه آکسفورد: آکسفورد، انگلستان، 2004; ص 280-299. [ Google Scholar ]
- ری، اس جی. اسمیت، RJ تجزیه فضایی ضریب جینی. Lett. تف کردن منبع. علمی 2013 ، 6 ، 55-70. [ Google Scholar ] [ CrossRef ]
- دوک، جی. آنسلین، ال. Rey, S. مشکل مناطق max-p. J. Reg. علمی 2012 ، 53 ، 397-419. [ Google Scholar ] [ CrossRef ]
- ری، اس جی. موری، AT; Anselin, L. تجسم پویایی توزیع درآمد منطقه ای. Lett. تف کردن منبع. علمی 2011 ، 4 ، 81-90. [ Google Scholar ] [ CrossRef ]
- ری، SJ دینامیک فضایی و تحلیل دادههای فضا-زمان. در کتابچه راهنمای علوم منطقه ای ; Fischer, MM, Nijkamp, P., Eds. Springer: برلین، 2014; صص 1365–1383. [ Google Scholar ]
- آنسلین، ال. ری، SJ اقتصاد سنجی فضایی مدرن در عمل: راهنمای GeoDa، GeoDaSpace و PySAL . GeoDa Press: Chicago, IL, USA, 2014. [ Google Scholar ]
- اوکابه، ا. Sugihara, K. تجزیه و تحلیل فضایی در طول شبکه ها: روش های آماری و محاسباتی . Wiley: نیویورک، نیویورک، ایالات متحده آمریکا، 2012. [ Google Scholar ]
- ری، اس جی. آنسلین، ال. لی، ایکس. Koschinsky, J. Guide to Use Crime Analytics for Space-Time (CAST) Desktop Program Software ; گزارش فنی؛ مرکز GeoDa برای تحلیل و محاسبات مکانی، دانشگاه ایالتی آریزونا: Tempe، AZ، ایالات متحده آمریکا، 2013. [ Google Scholar ]
- ری، اس جی. جانیکاس، MV STARS: تحلیل فضا-زمان سیستم های منطقه ای. Geogr. مقعدی 2006 ، 38 ، 67-86. [ Google Scholar ] [ CrossRef ]
- لورا، جی. Rey, SJ طبقهبندی بهینه نقشه choropleth موازی را بهبود بخشید. در فن آوری های شتاب دهنده مدرن برای علم اطلاعات جغرافیایی ; Shi, X., Kindratenko, X., Yang, C., Eds. Springer: برلین، آلمان، 2013; صص 197-212. [ Google Scholar ]
- لارنس، آر. کارایی فضای XML. Inf. نرم افزار فنی 2004 ، 46 ، 753-759. [ Google Scholar ] [ CrossRef ]
- آنسلین، ال. ری، اس جی. Li، W. فراداده و منشأ تحلیل فضایی: مورد وزنهای فضایی. بین المللی جی. جئوگر. Inf. علمی 2014 ، 28 ، 2261-2280. [ Google Scholar ] [ CrossRef ]
- فیلدینگ، سبک های معماری RT و طراحی معماری های نرم افزاری مبتنی بر شبکه. Ph.D. پایان نامه، دانشگاه کالیفرنیا، ایروین، کالیفرنیا، ایالات متحده آمریکا، 2000. [ Google Scholar ]
- ECAM. فرمت تبادل داده JSON ECAM-404 2013; ECAM International: ژنو، سوئیس، 2014. [ Google Scholar ]
- Severance, C. کشف نشانه گذاری شی جاوا اسکریپت. کامپیوتر 2012 ، 45 ، 6-8. [ Google Scholar ] [ CrossRef ]
- وانگ، اس. آنسلین، ال. بهادوری، بی. کرازبی، سی. گودچایلد، م. لیو، ی. نرم افزار Nyerges، T. CyberGIS: یک بررسی ترکیبی و نقشه راه یکپارچه. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 2122-2145. [ Google Scholar ] [ CrossRef ]
- ری، اس جی. آنسلین، ال. پهله، ر. کانگ، ایکس. Stephens, P. طبقه بندی نقشه choropleth بهینه موازی در PySAL. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 1023-1039. [ Google Scholar ] [ CrossRef ]
- لی، ایکس. لی، دبلیو. آنسلین، ال. ری، اس جی. Koschinsky، J. الگوریتم کاهش نقشه برای ایجاد وزن مجاورت برای تجزیه و تحلیل فضایی داده های بزرگ. در مجموعه مقالات سومین کارگاه بین المللی ACM SIGSpatial در تجزیه و تحلیل برای داده های مکانی بزرگ، دالاس، تگزاس، ایالات متحده آمریکا، 4 نوامبر 2014. صص 50-53.
- Pahle، R. چارچوب سیستم های پیچیده-ادغام تجزیه و تحلیل، تجسم و همکاری. مقاله کاری مرکز GeoDa برای تحلیل و محاسبات جغرافیایی. اثر منتشر نشده 2014. [ Google Scholar ]
- آنسلین، ال. سیبری، آی. Kho, Y. GeoDa: مقدمه ای بر تجزیه و تحلیل داده های مکانی. Geogr. مقعدی 2006 ، 38 ، 5-22. [ Google Scholar ] [ CrossRef ]
© 2015 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر