نقشه راه GIS

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

کاربرد جی ای اس

خلاصه

منابع داده باز در مورد درگیری ها به طور فزاینده ای توسط رسانه های اجتماعی گسترده غنی می شوند. اینها حجمی از اطلاعات را به دست می دهند که فراتر از قابلیت های فرآیند ما است. یکی از عوامل مهم این است که استخراج دانش از فرمت های داده های مختلط نیاز به مدل سازی سیستماتیک و پیچیده دارد. در اینجا، ما استفاده از ابزارهای مدل‌سازی متن کاوی را برای ایجاد ارتباط داده‌های نیمه ساختاریافته ناهمگن برای افزایش تصمیم‌گیری پیشنهاد می‌کنیم. با استفاده از نمودارهای روایی، نمایش متن و تجزیه و تحلیل خوشه‌ای، ما یک چارچوب ارتباط داده ارائه می‌کنیم که می‌تواند داده‌های مکانی-زمانی را که در زمینه‌های مشابه رخ می‌دهند استخراج کند. این چارچوب شامل مراحل زیر است: (1) یک نمایش متن جدید برای بردار کردن معناشناسی متن با یادگیری هر دو ویژگی های هم واژه و ترتیب کلمات در یک فرم یکپارچه ارائه می شود. (2) فناوری خوشه‌بندی متن برای مرتبط کردن رویدادهای مورد علاقه با رویدادهای مشابه در گزارش‌های تاریخی، صرفاً بر اساس طرح‌های روایی رویدادها استفاده می‌شود. و (3) روند فعالیت استنباط شده از طریق یک نقشه مکانی-زمانی در حال تکامل از طریق الگوریتم کریجینگ تجسم می شود. نتایج ما نشان می‌دهد که این رویکرد تبعیض عمیق‌تری را در روندهای زیربنایی درگیری‌ها ممکن می‌سازد و دارای یک پیش‌بینی روایی استدلال روایی با دقت 0.4817، علاوه بر سازگاری بالا با نتایج مطالعات موجود است.
کلید واژه ها: 

توطئه های روایی ; رویدادهای درگیری مسلحانه ؛ ارتباط داده ها ؛ نقشه در حال تحول مکانی – زمانی ; درون یابی کریجینگ ; تجزیه و تحلیل خوشه ای ; تصویر پیکسل روایت ; ACLED ; نیجریه

 

1. معرفی

رسانه های جدید و مجموعه داده های عمومی نشان داده اند که درگیری های مسلحانه و فعالیت های تروریستی در سراسر قاره آفریقا رواج داشته است [ 1 ، 2 ]. کانون های درگیری، طیف گسترده ای از خبرنگاران یا غیرنظامیان محلی را برای گزارش آخرین پیشرفت درگیری جذب می کنند. مقادیر واقعی داده‌ها که از منابع اطلاعاتی غیردولتی متعدد ارائه می‌شوند، نظارت و پیش‌بینی درگیری‌ها را تسهیل می‌کنند. معمولاً خدمات مشاوره ای عمدتاً به شکل گزارش های مطالعه ای است که بر آمار ماهانه یا فصلی برای هر جنبه از یک درگیری تمرکز دارد [ 3 ، 4 ، 5] .]. مقیاس زمانی تقریبی یک تحقیق برای حمایت مستقیم از اقدامات مشخص کافی نیست، اما در تصمیم‌گیری‌های مربوط به دیدگاه‌های ماکروسکوپی، به عنوان مثال، طرح عملیاتی تجارت یا حمل‌ونقل برای یک منطقه مشخص در یک دوره زمانی مشخص، مفید است. به همین دلیل، فناوری‌های بازیابی اطلاعات جغرافیایی و متن کاوی برای حوزه امنیت داخلی [ 6 ] توسعه یافته‌اند، اگرچه مدل‌سازی آن‌ها همچنان چالشی برای استخراج خودکار دانش عمیق‌تر از حجم عظیمی از داده‌ها است. به طور خاص، استخراج روابط بین اهداف و رویدادها هنوز در درجه اول به برچسب‌گذاری دستی و دانش تخصصی وابسته است [ 7 ].
آن سیاهه‌های خام که شامل درگیری‌های مسلحانه یا رویدادهای خشونت سیاسی است، برای بررسی الگوهای رفتاری و تحول بازیگران سازماندهی مجدد شده‌اند. یکی از این مجموعه داده‌های رایج، مجموعه داده‌های مکان و رویداد درگیری مسلحانه (ACLED) است [ 8]]. این مجموعه داده تقریباً روزانه در بیش از 60 کشور در حال توسعه در آفریقا و آسیا به روز می شود. این محتوا شامل تاریخ، مکان رویدادهای درگیری، محتوای متنی، بازیگران و تلفات گزارش شده است. این دامنه شامل تمام کشورهای آفریقایی از سال 1997 تا کنون، علاوه بر جنوب و جنوب شرق آسیا، به صورت بلادرنگ است. این نوع مجموعه داده‌ها به دلیل متن و مختصات جغرافیایی قابل‌توجه و دقت تاریخ قابل اعتماد، به منابع ارزشمندی برای بررسی مسائل منطقه‌ای تبدیل شده‌اند. به عنوان مثال، تجزیه و تحلیل خشونت علیه غیرنظامیان (VAC) برای ارزیابی اثربخشی نیروهای حافظ صلح در کاهش VAC در سراسر آفریقا از سال 2000 استفاده شده است [ 9 ]. ارتباط بین درگیری های مسلحانه و تنوع آب و هوا بر اساس پایگاه داده ACLED بررسی شده است [ 10]. برای برخی ارزیابی‌های امنیتی، این مجموعه داده برای شناسایی الگوهای رفتاری [ 11 ] گروه‌های مسلح ناشناس، علاوه بر ایجاد نقشه‌هایی از رویدادهای بحران، به‌عنوان مثال، گزارش‌های ماهانه روند درگیری ACLED [ 12 ، 13 ، 14 ]، اعمال می‌شود. آنها همچنین به عنوان برنامه های کاربردی وب از طریق تجسم اطلاعات گرافیکی پویا و استاتیک عمل می کنند [ 15 ].
در عمل، این گونه از مجموعه داده ها شامل رایج ترین ویژگی ها، مانند مهر زمانی، مکان و اهمیت یک رویداد است، در حالی که جزء متن و روابط بین رویدادها معمولا حذف می شوند. کمبود تحلیل معنایی متن، کاربرد آنها را به حوزه های مطالعاتی اضافی محدود می کند. اول، تکامل تعارض [ 2 ، 16 ] شامل یک فرآیند روایی از رویدادهای مرتبط است [ 17 ]. این فرآیند فرد را قادر می‌سازد تا رویدادهای مبتنی بر جدول زمانی یا بازیگر محور را به‌عنوان توطئه‌های روایی سازماندهی کند تا استدلال در مورد زمان، کجا و چه چیزی برای بازیگران تسهیل شود [ 18 ، 19 ، 20 ]. دوم، نتایج تحلیلی از [ 4 ، 5، 12 ، 13 ، 14 ] کیفی هستند، با فقدان تحلیل کمی و پیش بینی در مورد شرایط اضطراری درگیری مسلحانه. بدون آموزش کمی، این رویکردها برای تخمین روند توالی رویدادها از نظر زمان و مکان کافی نیستند. سوم، سازماندهی اقلام داده عمدتاً به مداخله انسان بستگی دارد، به عنوان مثال، تبعیض انواع رویدادها و استخراج تلفات و مشارکت کنندگان [ 21 ، 22 ]. محتوای متنی یک رویداد تعارض به ندرت در انواع مشابه مجموعه داده ها در نظر گرفته شده است [ 23] به دلیل شکل سازمانی غیر یکنواخت آن. متن موجود در مجموعه داده دارای توصیفات اساسی است که نیاز به تحلیل عمیق تری دارد، به عنوان مثال، کلماتی که رفتارهای مجرمانه، ویژگی های قربانیان و محیط را توصیف می کنند.
این مطالعه به طور خاص یک چارچوب داده کاوی را برای پیش بینی روندها در توالی رویدادهای تعارض مورد علاقه پیشنهاد می کند. در این چارچوب، تمام داده‌های مرتبط به هم در گزارش‌ها به حمایت از تصمیم‌گیری در مورد تکامل مکانی و زمانی تعارض کمک می‌کنند. ما انواع مختلفی از داده‌ها را در سطح طرح روایی سازماندهی می‌کنیم، جایی که تکامل رویدادها با استفاده از طرح داستانی بررسی می‌شود. هدف این رویکرد ارائه یک رویکرد تداعی داده مبتنی بر روایت برای پشتیبانی از نظارت و پیش‌بینی فضایی-زمانی نزدیک به زمان واقعی است. مورد مطالعه از بخش نیجریه ای مجموعه داده ACLED استفاده می کند. بخش یادداشت در پایگاه داده ACLED هسته اصلی سازماندهی داده در نظر گرفته می شود که با عناصر داده باقیمانده مانند تاریخ و مکان و بازیگر ارتباط برقرار می کند. عقل سلیم نشان می دهد که یک سکانس رویداد از یک بازیگر مشخص، روایت خاصی را در یک دوره زمانی دارد. ما از این ویژگی برای مرتبط کردن تحولات رویداد مشابهی استفاده می‌کنیم که ممکن است توسط همان بازیگر یا شخص دیگری در تاریخ انجام شود. تحت حمایت چنین تداعی‌های داده‌ای، تاریخ، مکان و رفتار، علاوه بر انواع دیگر داده‌ها، می‌توانند با هم سازماندهی شوند تا قابلیت استدلال در مورد زمان، کجا و چه چیزی افزایش یابد. کمک های ما به شرح زیر است: می توان با هم سازماندهی کرد تا توانایی استدلال در مورد کی-کجا-چی را افزایش دهد. کمک های ما به شرح زیر است: می توان با هم سازماندهی کرد تا توانایی استدلال در مورد کی-کجا-چی را افزایش دهد. کمک های ما به شرح زیر است:

  • ما یک نمایش متنی مبتنی بر تصویر ارائه می‌کنیم که هم توزیع کلمات ویژگی و هم ترتیب کلمات را در هر رویداد توسط یک تصویر پیکسل مربعی یاد می‌گیرد.
  • بر اساس نمایش پیشنهادی، یک ابزار فرآیند خوشه سلسله مراتبی برای استخراج رویدادهای تاریخی همولوگ که دارای معنایی مشابه با رویدادهای مورد علاقه هستند، استفاده می‌شود.
  • یک نقشه تکامل مکانی-زمانی، که توسط الگوریتم کریجینگ تولید شده است، برای ارتقاء درک توسعه یک سری از تعارض ها ارائه شده است. نتایج نشان می‌دهد که رویکرد ما پتانسیل ارائه یک پیش‌بینی‌کننده مکانی-زمانی به‌موقع برای کار پیش‌بینی زمان واقعی را دارد.
این مقاله به شرح زیر سازماندهی شده است: بخش 2 پیشینه مرتبط را بررسی می کند. بخش 3 منابع داده تجربی را تشریح می کند. بخش 4 روشی را ارائه می‌کند که با نمایش متن رویداد ( بخش 4.2 )، ارتباط داده مبتنی بر خوشه‌ای نمودار ( بخش 4.3 ) و تولید نقشه تکامل مکانی – زمانی استنباط‌شده ( بخش 4.4 ) ساخته شده است. بخش 5 و بخش 6 به ترتیب بحث و نتیجه گیری را ارائه می کنند.

2. مرور کنید

2.1. مدل سازی دینامیک تعارض

مطالعه دینامیک تضاد همیشه مورد توجه سیستم‌های اطلاعات جغرافیایی (GIS) و جوامع داده‌کاوی بوده است، زیرا درک یک تعارض نیاز به همکاری چند رشته‌ای دارد. موضوعات فعال مرتبط تحقیق شامل مدل سازی فرآیند تعارض و جنبه های منابع اطلاعات جغرافیایی، مانند دسترسی به داده ها، انتشار و کیفیت می باشد. در مدل‌سازی تعارض، یک چارچوب آماری فرآیند نقطه‌ای برای مجموعه داده‌های ناهمگن که می‌تواند استنتاج‌های مکانی-زمانی، مانند اثرات انتشار و فرارفت در داده‌های تعارض را انجام دهد، ارائه شده است [24 ] . به طور کلی، مطالعات دینامیک تعارض، فرآیندهای اساسی را به عنوان پدیده‌های انتشار و فرارفت مدل می‌کنند [ 25 ، 26]]. برای مدل‌سازی مشاهدات پیوسته و گسسته، یک روش آماری توصیفی مبتنی بر رویکرد متغیر-لاپلاس برای استنتاج در مورد فرآیندهای مکانی-زمانی ارائه شده است [ 24 ، 27 ]. برای تجسم توزیع‌های مکانی-زمانی، رویکرد زمین‌آماری به نام Kriging به طور گسترده برای توسعه نقشه‌های پیش‌بینی ماهانه استفاده شده است [ 28]]. از آثار ارائه شده، روش‌های آماری و تجسم داده‌ها نقش مهمی در تخمین تکامل تعارض دارند، اما برای انواع داده‌های محدود، مانند مختصات جغرافیایی، مهرهای زمانی و ویژگی‌های منفرد قابل استفاده هستند. به طور خاص، روابط معنایی و متنی متنی که در لاگ‌ها ذاتی هستند، به ندرت در مدل‌سازی پویایی تضاد در نظر گرفته می‌شوند. چنین متنی معمولاً شرح مفصلی در مورد تعارض ارائه می دهد که می تواند ماهیت تعارض را از نظر چرایی-کجا-چه زمانی-چه-چگونه- آشکار کند.
از سوی دیگر، به عنوان پاسخ به درگیری، مدیریت اضطراری بر این اساس توسعه یافته است. برای تخمین خسارات و خسارات ناشی از درگیری، منابع اطلاعات مکانی در توسعه سیستم های مدیریت اضطراری مفید نشان داده شده است. اطلاعات جغرافیایی داوطلبانه، که توسط آماتورها با استفاده از خدمات به اشتراک گذاری نقشه مانند OpenStreetMap ایجاد می شود، به یک منبع داده امیدوارکننده در پشتیبانی از موقعیت های بحرانی زمان تبدیل شده است [ 29 ]. این جمع سپاری تولید داده می تواند از طریق شبکه های اجتماعی منتشر شود [ 30]. به دلایل خوب، مدل سازی تضاد با انواع مختلفی از داده ها مواجه می شود تا فرآیند تعارض را در دیدگاه های مختلف منعکس کند. این بدان معنی است که استفاده از داده های تضاد ممکن است به برخی مدل ها یا سیستم های اطلاعاتی پیچیده نیاز داشته باشد.

2.2. تجزیه و تحلیل انجمن

ارتباط داده‌ها مرحله‌ای میانی از برنامه‌های کاربردی به کمک GIS است و ترتیب داده‌های پایین را به برنامه‌ریزی وظایف بالا متصل می‌کند. انتظار می رود که منابع داده ناهمگن مختلف [ 31 ] را برای تجزیه و تحلیل مرتبط با جغرافیایی ادغام کند. به عنوان مثال، برای اطلاع از تراکم جمعیت یک منطقه شهری، داده های مربوطه در یک منطقه مشخص باید با توجه به محدوده جغرافیایی و بازه زمانی در پایگاه ملی جمعیت تهیه شود. برای دو یا سه شی مورد مطالعه، روش های زیر به طور گسترده برای تجزیه و تحلیل تداعی استفاده شده است. ضریب همبستگی یک معیار رایج برای تشخیص ارتباط باینری است [ 32 ]. برخی از مدل‌های رگرسیون خطی برای دو یا چند وجه استفاده شده‌اند [ 33]. یک سازمان داده مبتنی بر جدول زمانی برای تجزیه و تحلیل اثرات متوالی استفاده شده است [ 34 ]. تابع همبستگی متقابل دیدگاهی را در رابطه با مطالعه روابط بین شهرها در یک سیستم شهری منطقه ای ارائه می دهد [ 35 ]. با این حال، این رویکردها برای مدلسازی اشیاء نامشخص نامناسب هستند و باید موارد قابل توجه را در مرحله پیش پردازش از طریق استفاده از تکنیک های داده کاوی [ 36 ] استخراج کنند، به عنوان مثال، کاوی قانون انجمن Apriori [ 37 ]. برای سازماندهی داده ها بر اساس معناشناسی عمومی تر، چارچوب روایت اغلب به عنوان بستری برای ارسال انواع مختلف داده ها در نظر گرفته می شود [ 17]]. هنگام ادغام داده ها در سطح معنایی، چنین چارچوبی می تواند اثری شبیه به داستان گویی ارائه دهد. یکی از جنبه های رایج، روش روایی خبر است که اغلب برای سازماندهی عناصر رویداد (مثلاً شرایط و مشارکت کنندگان) برای بازگرداندن سناریویی که رخ داده است، برای تحریک حافظه مخاطب استفاده می شود. تحلیل تداعی عمومی‌تر در سطح روایی، استدلال کیفی است، مانند استدلال اثباتی [ 20 ] و استدلال هستی‌شناختی [ 18 ]، که به عنوان رویکردهایی برای کشف دانش نیز در نظر گرفته شده‌اند.

2.3. مدل محاسباتی روایت

در فضای داده، هر آیتم داده را می توان در سطح معنایی سازماندهی کرد. با این بستر، تحول رویداد روایت خاصی دارد. انسانها آن را بهتر از مجموعه داده های ادغام شده ساده که همبستگی بین داده ها ندارند درک می کنند. برخی از روش‌های روایت‌شناسی برای سپرده‌گذاری و بازیابی اسناد مرتبط با جغرافیا به کار گرفته شده‌اند. حالت کنار هم قرار دادن روایت برای تجسم چندین عنصر روایت، مانند زمان، مکان و احساسات در مسیرهای زندگی استفاده می شود [ 38 ]. ترکیبی از نقشه های حرارتی و کلمات موضوع داستان، ناوبری جغرافیایی یک مجموعه بسیار بزرگ را فراهم می کند [ 39 ]. در [ 19]، نویسندگان مدلی از ترسیم قصد داستان از معنای روایی را برای حاشیه نویسی پیکره و استنتاج محاسباتی پیشنهاد می کنند. این مطالعات ارائه شده به روش رسمی سازی [ 19 ، 38 ] و ایجاد روابط عددی بر روی اشیاء معین [ 39 ] بستگی دارد. یک ناراحتی این است که دانش قبلی برای انطباق با نیازهای مختلف انعطاف ناپذیر است. با استفاده از فناوری های داده کاوی، به نظر می رسد که دانش اساسی روایت شناسی می تواند در زمینه های خلاصه دانش [ 40 ] و استخراج [ 41 ] اعمال شود. ما قصد داریم روشی برای یادگیری دانش ارائه کنیم که از کمک کارشناسان حوزه دور می زند.

2.4. متن کوتاه در روایت

روایت در وسایل متداول اطلاعات، مانند اجسام، ویدئو، صدا و استریپ های کمیک وجود دارد. در شبکه های اجتماعی، متن کوتاه موثرترین وسیله تعامل است. به عنوان مثال، در پیام‌رسانی عظیم در توییتر، توییت‌ها کوتاه هستند، بیش از 140 کاراکتر [ 42 ، 43 ] و اغلب حاوی عناصر رویداد کامل، به عنوان مثال، بازیگران، رفتارها و نتیجه هستند. با استفاده از مفهوم ارتباط داده ها، نمایش متنی عددی و ابزارهای خوشه ای به طور مشترک برای کمک به بازیابی اطلاعات استفاده می شوند [ 44 ]. برای نمایش متن عددی، مدل کیسه کلمات یک رویکرد اساسی برای گسترش سایر انواع است [ 45 ]:

  • مدل فضای برداری (VSM)، که هر متن رویداد را به عنوان بردار کیسه ای از کلمات نشان می دهد. روش محاسبه تشابه باید برای مقایسه بردارهای نمایشی طراحی شود که در فضای با ابعاد بالا کم هستند [ 45 ].
  • مدل موضوع یک الگوریتم مبتنی بر آمار بیزی است که اجزای موضوع و ضرایب مخلوط هر متن را یاد می‌گیرد. مدل‌های موضوعی مرسوم، موضوعات پنهان را در یک پیکره با گرفتن الگوهای هم‌وقوع کلمه در سطح سند نشان می‌دهند [ 46 ].
با این حال، این دو مدل تنها ویژگی بسامد واژه‌های منتخب را در نظر گرفته‌اند، اما از ترتیب واژه‌ها که اصلی‌ترین ویژگی مورد استفاده در نمایش یک طرح روایی است، غفلت کرده‌اند. به همین دلیل، ما یک نمایش متن کوتاه جدید را ارائه می‌کنیم که شامل ویژگی‌های فراوانی هم‌کلمه و ترتیب کلمات است. توجه به این نکته مهم است که ما به جای مقایسه با سایر مدل های مشابه، بر استفاده از مدل نمایش متن پیشنهادی تمرکز می کنیم.

3. منابع داده

ACLED برای تجزیه و تحلیل تضادهای تفکیک شده و نقشه برداری بحران طراحی شده است. این مجموعه داده تاریخ و مکان تقریباً همه خشونت های سیاسی و رویدادهای اعتراضی گزارش شده را کد می کند. داده‌های رویداد از منابع مختلفی مشتق شده‌اند، از جمله گزارش‌های کشورهای در حال توسعه و رسانه‌های محلی، آژانس‌های بشردوستانه، و نشریات تحقیقاتی، مانند خبرگزاری شین هوا و رویترز [8 ]]. مجموعه داده شامل تمام کشورهای آفریقایی از سال 1997 تا کنون، علاوه بر جنوب و جنوب شرق آسیا، به صورت بلادرنگ است. این داده ها حاوی اطلاعات مربوط به موارد زیر است: تاریخ و مکان رویدادهای درگیری. انواع خاص رویدادها، مانند نبردها و کشتار غیرنظامیان؛ رویدادهای طیفی از بازیگران، مانند شورشیان و دولت ها؛ تغییرات در کنترل سرزمینی؛ و تلفات گزارش شده است. به طور خاص، داده های رویداد، دقت موقعیت مختصات را با توجه به مقیاس نفوذ درگیری نشان می دهد. دقت جغرافیایی به سه سطح به شرح زیر طبقه بندی می شود: ناحیه، فرماندهی و شهرها، که از یک ترتیب نزولی از اندازه مناطق درگیری پیروی می کنند [ 22 ].
برای استفاده از ایده کاوی سناریوی تاریخی برای حمایت از تصمیم‌گیری، مجموعه داده‌ای که شامل 6781 گزارش در مورد درگیری‌های نیجریه از سال 1997 تا 2014 است، از ACLED استخراج شد تا نمایش‌های برداری داده‌ها را بیاموزد. براساس فیلتر خوشه‌ای چنین نمایش‌هایی، توالی‌های گزارش تاریخی که به شباهت یکسان یا نزدیک معنا اشاره دارند، می‌توانند برای ورودی دنباله‌های گزارش مورد علاقه نمایه شوند. زمینه مختصات جغرافیایی که با محتوای متنی گزارش‌های نمایه‌سازی شده مرتبط هستند، نتیجه استنباط‌شده برای پیش‌بینی تکامل مکانی و زمانی دنباله‌های درگیری فرض می‌شود. به عنوان مثال، یک توالی درگیری در مورد اعتراضات به کاهش آموزش در پایتخت نیجریه در حال انجام است. و با اشاره به نتیجه استنباط شده از وقایع مشابه تاریخی که در یک منطقه مجاور رخ داده است، بر وضعیت کلی آینده نیجریه تمرکز می کنیم. ارزیابی روش ما با آزمایش بر روی 1690 سیاهههای مربوط از سال 2015 انجام شده است. تمام رویدادهای درگیری مسلحانه در منطقه داخلی رخ داده است، جایی که ما مرز سرزمین نیجریه را قرمز رنگ می کنیم (شکل 1 ). نقشه پس‌زمینه از منبع Wiki OpenStreetMap [ 47 ] با فایل اطلاعات مختصات (pgw.) و فایل پیش‌بینی (prj.) گرفته شده است.
از 25 نوع داده اصلی، ما 10 نوع داده را انتخاب می کنیم که شامل «EVENT_DATE»، «TIME_PRECISION»، «ACTOR1»، «ALLY_ACTOR1»، «COUNTRY»، «ADMIN1»، «LATITUDE»، «LONGITUDE»، «NOTES» است. و “تلفات”. بیشتر آنها را می توان با برچسب هایشان فهمید. برای توضیح بیشتر، نویسندگان [ 21 ، 22 ] یک دستورالعمل مفصل برای هر مورد فهرست می کنند. داده های هر رویداد به عنوان مثال، ” 2014/12/30; 1 بوکوحرام؛ غیرنظامیان (نیجریه)؛ هیچ یک؛ نیجریه؛ کوتاکاری؛ 10.83981; 13.02201; حمله مظنون بوکوحرام به کوتاکاری، پانزده تن از ساکنان را کشت. شاهدان گفتند که تعداد زیادی از شورشیان مسلح به تفنگ و بمب های بنزینی حدود ساعت 7 صبح به کاوتاکاری یورش بردند. Kautakari در منطقه Chibok است. 15“. بخش “یادداشت ها” شامل طرح های روایی تعارض ها به عنوان داده های اصلی برای تجزیه و تحلیل خوشه ای است. توالی نمایه شده مختصات برای تولید نقشه تحول مکانی و زمانی استفاده می شود.
یک وضعیت اساسی از داده هایی که کمیت شده اند در شکل 2 نشان داده شده است . در شکل 2 a، ما برای سرشماری تعداد رویدادها در هر سال (1997 تا 2014) به “EVENT_TYPE” وابسته هستیم. سه نوع اصلی رویداد عبارتند از “خشونت علیه غیرنظامیان”، “نبرد – بدون تغییر قلمرو” و “شورش/اعتراضات”. نتیجه تقریباً با نتیجه [ 11 ] مطابقت دارد. از شکل 2ب، «گروه مسلح ناشناس» بیشترین نسبت را در بین سازمان ها دارد و سازمان تروریستی معروف «بوکوحرام» نیز برجسته است. فقدان یک بازیگر مشخص، دشواری تحلیلی درگیری را افزایش می دهد. بخش «یادداشت‌ها» دارای جزئیات غنی برای درک تعارض است زیرا توطئه‌های روایی در سیاهه‌ها می‌توانند تفکر و استدلال انسان‌ها را ارتقا دهند. استفاده از ایده نمودارهای روایی به جهت مدل سازی با داده های ناهمگن تر اشاره می کند [ 18 ، 19 ].

4. روش شناسی

4.1. چارچوب پردازش

چارچوب مدل سازی در شکل 3 نشان داده شده است. در مرحله 1، داده های متنی (ورودی 1) نیاز به تبدیل برداری با روش یادگیری بازنمایی دارند. برای غلبه بر نقصی که در مدل فضای برداری و مدل موضوعی وجود دارد، یک تصویر پیکسلی جدید برای یادگیری معنای متن پیشنهاد می کنیم. در مرحله 2، متن ورود رویدادهای تضاد (ورودی 2) به عنوان تصویر پیکسل مربوطه بیان می شود. ترکیب با متون رویداد تاریخی، داده‌های ورودی برای نمایه‌سازی سناریوهای تاریخی مشابه، تنها بر اساس شباهت‌های طرح‌های روایی، خوشه‌بندی می‌شوند. در مرحله 3، ما از زمینه داده های نمایه شده برای استدلال تکامل مکانی و زمانی استفاده می کنیم. هم مختصات جغرافیایی مرتبط و هم ترتیب زمانی برای تولید یک نقشه در حال تکامل مکانی-زمانی استفاده می شود که درک و پیش بینی درگیری ها را تسهیل می کند.
ارتباط داده های مبتنی بر نمودارهای روایت در شکل 4 نشان داده شده است . در ابتدا، داده های ورودی به عنوان ده داده از پیش تعریف شده Ψ ساده می شوند . داده های انتخاب شده Ψ در یک فایل جدول ذخیره می شوند. در مرحله بعد، “یادداشت ها” در مورد هر رویداد باید از طریق روش خوشه بندی تجزیه و تحلیل شوند. ما فرض می کنیم که توالی رویدادهای مورد علاقه شامل روابط زیربنایی است. ما از طرح‌های روایی برای نشان دادن چنین روابط متقابلی استفاده می‌کنیم. از طریق ارتباط داده ها، انواع دیگری از داده ها که به یک سناریوی زمینه مشابه اشاره دارند می توانند با هم نمایه شوند. به طور رسمی، اجازه دهید ن، ن=1،2،،منبه دنباله ای از زمان گسسته از “NOTES” اشاره می کند، که دلالت بر نوعی طرح داستانی دارد، در حالی که منقسمت یادداشت مرتبط با یک رویداد درگیری را نشان می دهد. سپس فرآیند خوشه را به صورت تعریف کردیم :نکنمن، جایی که نک=1،2،،کنشان دهنده ترتیب ورودی رویدادها و نمنمجموعه نمایه شده است. به دنبال ویژگی های فرآیند خوشه ای، مشخص می شود که موجود مننمننزدیک است به کنکاز نظر فاصله بردارها. با فرض اینکه زمینه از نمنبا نشان داده می شود ن، زمینه ننتیجه استنتاج رویکرد ما است. علاوه بر این، داده های زمانی و مکانی مرتبط، نتیجه استدلالی تکامل تعارض هستند.
برای مدل‌سازی فرآیند فوق، موارد زیر را مطالعه می‌کنیم: تبدیل داده‌های متنی به یک نمایش برداری ( بخش 4.2 ). روشی برای مرتبط کردن یک دنباله متن ورودی با مجموعه متن تاریخی بر اساس روش خوشه‌بندی ( بخش 4.3 ). و رویکردی برای تجسم نتیجه استنباط شده از فرآیند تکامل مکانی – زمانی ( بخش 4.4 ).

4.2. نمایش متن رویداد

ما با یادگیری بازنمایی برداری از متن شروع می کنیم. همانطور که در شکل 5 نشان داده شده است ، باید کیسه ای از کلمات بسازیم دبلیو. هر کلمه مندبلیوقرار است از طریق روش مقیاس بندی چند بعدی (MDS) به یک بردار 4 بعدی تبدیل شود [ 48 ]. در مرحله 1، متن ورودی را برای نمونه عبارت 2 گرمی برش می دهیم که منجر به ماتریس ویژگی می شود. ، که می تواند یک ویژگی آماری بین دو کلمه ارائه دهد. هدف از یادگیری بازنمایی یافتن فضای برداری کلمه است که در آن فاصله بین بردارهای کلمه می تواند فواصل در را تقریبی کند آتا حد امکان. به این فرآیند تعبیه کلمه می گویند. برای جاسازی کلمه، ماتریس فاصله نامتقارن باید به عنوان تجزیه شود

=م+ن

جایی که م=+/2منعکس کننده ویژگی های فرکانس دو کلمه و ن=/2نشان دهنده ویژگی متنی ترتیب کلمات [ 49 ] است. ما از روش نامتقارن MDS [ 49 ] برای به دست آوردن دو فضای برداری استفاده می کنیممو ن. سپس این دو فضا را در یک فضای برداری 4 بعدی ترکیب می کنیم با استفاده از روش [ 49 ]. خطوط کوتاه نشان دهنده کلمات مربوطه نشان داده شده در مرحله 2 است.

پس از به دست آوردن کلمه بردار ویژگی، ما یک نمایش سند جدید به نام تصویر پیکسل روایت را پیشنهاد می کنیم که به طور ماهرانه فضای برداری کلمه را شطرنجی می کند و پیوندهای مستقیمی را بین کلمات همسایگی ترسیم می کند (مرحله 3 را ببینید). چنین نمایشی می تواند معنایی طول های مختلف جملات را با اندازه یکپارچه شکل برداری بیان کند. بر اساس فضای برداری کلمه، هر دو داده متن از مننمنو کنکباید قبل از رفتن به مرحله بعدی تبدیل شود. همانطور که در شکل 6 نشان داده شده است، ما یک فضای برداری کلمه اصلی (a) را یاد گرفتیم، و سپس، شطرنجی سازی را در فضای (b)، که از 3832 کلمه تشکیل شده است، اعمال کردیم. مقادیر مختصات نقاط قرمز ایکسهدآر2×1و نقاط آبی ایکسبلتوهآر2×1به ترتیب با عملیات MDS با M و N در معادله ( 1 ) تعیین می شوند. راه حل MDS برای M یک فرآیند مقیاس بندی چند بعدی کلاسیک است، به طوری که ایکسهدرا می توان به دست آورد

ایکسهد=س++

جایی که +یک ماتریس مورب از دو بزرگترین مقادیر ویژه مثبت است و س+ماتریسی است که ستون های آن بردارهای ویژه متعارف متناظر در محلول MDS هستند. برای ایکسبلتوه، ما از روش نامتقارن MDS در [ 49 ] برای تبدیل استفاده می کنیمایکسبلتوهدر همان فضای مختصات با ایکسهد. یک جفت نقطه قرمز و آبی نشان دهنده یک بردار کلمه 4 بعدی است. آن کلماتی که در این کیسه کلمات وجود ندارد دبلیوفیلتر خواهد شد. گروهی از نمایش‌های واقعی پیکسلی روایت در شکل 7 نشان داده شده است . خطوط قرمز یک کلمه را در جمله ورودی نشان می دهد و خطوط سبز نشان دهنده ترتیب کلمات مرتب شده در جمله است. بعد، نشان خواهیم داد که چگونه می توان از این نمایش برای ارتباط داده استفاده کرد.

4.3. تجزیه و تحلیل خوشه ای برای ارتباط داده ها

برای بازیابی توالی رویدادهای مشابه، از روش خوشه سلسله مراتبی [ 50 ] با نمایش متن ارائه شده استفاده می کنیم. با توجه به دنباله ای از متن تضاد نک، خروجی تبدیل تصویر پیکسل از نکاست نک=پ1،،پک، جایی که پمنآر100×100. دنباله متن-تصویر نکباید به گروهی از نقاط 2 بعدی کاهش یابد نک2به روش کاهش ابعادی سپس ابزار خوشه بندی را بر روی اتحاد اجرا می کنیم نک2و 2، جایی که 2نتیجه کاهش 2 بعدی Ψ است . به طور خاص، ما حداکثر تعداد اعضا را 20 تنظیم می کنیم زیرا فرض می کنیم که 20 رویداد جستجو شده برای هر ورودی می تواند تعداد کافی سناریوهای تضاد را ارائه دهد.
برخی از رویدادهای مرتبط که مختصات آنها از تضادهای ورودی دور است، ارتباط کمی با حوزه های مورد علاقه دارند. ما باید نتیجه را بر اساس موارد “ADMIN1-3” و دقت جغرافیایی آنها فیلتر کنیم. نتیجه فیلتر شده نمنبه عنوان مرجع برای استدلال تعارض استفاده می شود. تضادهای بعدی را انتخاب می کنیم که پس از آن رخ داد نمنظرف دو سه روز دلایل آن این است که (1) الگوهای فعالیت درگیری دارای ویژگی های انفجاری است [ 51 ] که اغلب یک یا دو روز طول می کشد. (2) ما بر پاسخ به یک وضعیت اضطراری تمرکز می کنیم، جایی که پیش بینی چند روز می تواند برای مدیریت اضطراری مناسب تر باشد.

4.4. روش ارزشیابی

برای ارزیابی، ما سه معیار را به شرح زیر طراحی می‌کنیم: اول، یک نقشه در حال تکامل مکانی-زمانی را پیشنهاد می‌کنیم تا تحولات تعارض را با توجه به گسترش مکانی و زمانی نشان دهد. تجسم نقشه نقاط رویداد با استفاده از رنگ های ساده برای درک روند تضادها بصری نیست. ما از ابزار Kriging [ 52 ] برای درون یابی فضاهای بین این نقاط استفاده می کنیم. فرآیند تعارض را می توان در سطح بالاتری برای تسهیل تصمیم گیری نشان داد. با فرض اینکه رویدادهای استنباط شده باشند و رویدادهای واقعی ، داده های مختصات جغرافیایی و رویدادهای صادر کننده دستور که درگیر هستند با نشان داده می شوند ،تیو ،تی، به ترتیب. در صورت وجود نقشه برداری تی=ز، سپس دو گروه از مشاهدات ،تیو ،تیتوابع را دارند تی=زو تی=ز. انتظار داریم تخمین بزنیم تی*=ز**برای سایر نکات *در دو نقشه که شامل و ، به ترتیب. به طور خلاصه، روابط زمانی سایر مختصات جغرافیایی را می توان بر اساس مشاهدات تخمین زد. تخمین را می توان به صورت یک ترکیب خطی بیان کرد که باید به صورت حل شود

ز**=من=1منزمن

جایی که منضرایبی است که باید حل شود.

حل معمولی معادله (2) یک مسئله کلاسیک از یک مدل آماری جغرافیایی است [ 53 ]. از این رو، ما از فرآیند کریجینگ برای محاسبه برآورد استفاده می کنیم. سپس نتیجه درونیابی شده باید فیلتر شود تا ناحیه نامرتبط از بین برود. به عنوان مثال، نقشه تولید شده و ماسک مربوطه در شکل 8 نشان داده شده است. انتقال نواحی رنگی از گرم به سرد برای نمایش روند زمانی رویدادها در نظر گرفته شده است، در حالی که پوشش رنگ نشان دهنده تأثیر فضایی رویدادها است. به عنوان مثال، مناطق آبی تیره نشان دهنده رویدادهای قبلی است و مناطق قرمز نشان دهنده مراحل پایانی درگیری ها هستند. ماسک های (b) و (d) با فیلتر کردن مقادیر استثنایی که از درون یابی کریجینگ تولید می شوند، تعیین می شوند. Kriging در اینجا نه تنها می تواند ارزش پیش بینی را ارائه دهد ز*(*)اما همچنین می تواند واریانس ارزش پیش بینی را ارزیابی کند 2(*)توسط

2(*)=من=1منمن*+

جایی که تابع نیمه متغیری است که ما تابع رگرسیون گاوسی را انتخاب کردیم و μ ضریب لاگرانژ است که می توان با حل کریجینگ به دست آورد. مقادیر پیش‌بینی که حداکثر واریانس مربوط به آنها است، به عنوان مقادیر استثنایی تعیین می‌شوند.

بر این اساس، ما از ناحیه تقاطع پوشش بین نقشه پیش‌بینی و نقشه واقعی برای ارزیابی دقت پیش‌بینی استفاده می‌کنیم.

پ=پ1پ2پ1

جایی که پ1مساحت نقشه استنباط شده را نشان می دهد و پ2نشان دهنده منطقه نقشه درگیری واقعی است. منطقه تقاطع با عملیات تصویر به دست می آید پ1پ2. مقدار پوشش p یک نتیجه بصری برای توصیف مناطق درگیری زیربنایی به دست می دهد.

در شرایط عدم برآورد قبلی، ما توزیع حجم رویدادها را در هر ناحیه از نیجریه علاوه بر توزیع مرگ و میر محاسبه می کنیم. در مقایسه با تفاوت بین داده های استنباط شده و واقعی، می توان اثربخشی روش ارائه شده را از زوایای دیگر ارزیابی کرد. توزیع رویداد استنباط شده را به نرمال می کنیم و توزیع رویداد واقعی به ، علاوه بر توزیع تلفات استنباط شده به افو توزیع تلفات واقعی به اف. ارزیابی را می توان به سادگی به صورت نوشتاری نوشت

دههتی=
دآتیآ=افاف

جایی که دههتیو دآتیآمیانگین تفاوت در توزیع رویداد و مرگ و میر به ترتیب، و n تعداد مناطق در نیجریه است.

5. نتایج و تجزیه و تحلیل

ما ارتباط داده‌ها را از سال 1997 تا 2014 یاد می‌گیریم و چارچوب را با استفاده از داده‌های سال 2015 ارزیابی می‌کنیم. این رویکرد بر استفاده از فناوری داده‌کاوی در چند روز پیش‌بینی تعارض متمرکز است. ما داده های سال 2015 را به 48 مجموعه داده برای انجام ارزیابی ها تقسیم می کنیم. به طور کلی، در هر مجموعه داده، داده های سه یا چهار روز اول به عنوان ورودی استفاده می شود زیرا تاریخ در ACLED ممکن است ناپیوسته باشد. ما امیدواریم که داده های ورودی برای بازگرداندن روند تضاد کافی باشد. سپس رویدادهای مشابه را از داده‌های تاریخی بر اساس توطئه‌های روایی مرتبط می‌کنیم و بسته به ترتیب تاریخ در ACLED ظرف چند روز رویدادهای آینده را استنباط می‌کنیم. نقشه های در حال تکامل مکانی-زمانی هم برای رویدادهای استنباط شده و هم برای رویدادهای واقعی آینده تولید می شوند. ما پیش بینی را با استفاده از معادله (3 ). بخشی از نتیجه تجسم از اوت تا اکتبر در شکل 9 نشان داده شده است و نتیجه مربوط به دقت پیش بینی در شکل 10 نشان داده شده است .
از یک مقایسه شهودی، نتایج پیش‌بینی 4-6، 18-20 و 25-27 اوت را به دست می‌آوریم. 28 تا 30 سپتامبر؛ و 11 تا 13 اکتبر، که به وضوح یک ارتباط قوی با داده های واقعی مربوط به مناطق نقاط داغ را نشان می دهد. انتقال در نواحی رنگی می تواند بیانگر فرآیند مکانی-زمانی تکامل درگیری باشد. تکامل تعارض استنباط شده را می توان از طریق درون یابی مختصات جغرافیایی و دستورات صادره رویدادها مشاهده کرد. ما فقط ترتیب زمانی تاریخ استنباط‌شده را از دوره‌های مختلف می‌پذیریم، در حالی که تاریخ وقوع آنها را حذف می‌کنیم، زیرا حالت روایتی روایت می‌تواند برای سازمان‌دهی دنباله‌های تعارض نسبتاً مستقل مناسب‌تر باشد. به عنوان مثال، اگر نتیجه استنباط شده از دو مرحله 6 اوت 2004 تا 10 اوت 2004 و 22 اکتبر 2012 تا 26 نوامبر 2012 باشد. 1،2،3،4،5.
در شکل 10 ، میانگین دقت 0.4817 است، در حالی که مقدار حداقل 0.0426 است که در هفته چهارم مارس ظاهر می شود، و حداکثر مقدار 0.9315 است که در هفته اول ژانویه ظاهر می شود. وقوع کمترین مقدار به دلیل عدم رخدادهای استنباط شده است. نتایج نشان می‌دهد که میانگین دقت خیلی زیاد نیست، اما نتایج پیش‌بینی مناسبی را به دست آوردیم که در هفته‌های ژانویه، مارس و می از 0.7 فراتر می‌رود. این دو نتیجه می‌توانند به ما اجازه دهند مرجع ارزشمندی برای تصمیم‌گیری مکانی-زمانی فعالیت‌های تعارض تنها بر اساس طرح‌های روایی در داده‌ها ارائه کنیم. برای ارزیابی‌های بیشتر، توزیع‌های فراوانی رویداد و تلفات را در هر ناحیه از نیجریه شمارش کردیم. نتایج در شکل 11 نشان داده شده استو شکل 12 .
ما یک تفاوت میانگین 0.0112 را از توزیع های نشان داده شده در شکل 11 و یک تفاوت میانگین 0.0171 را از توزیع های نشان داده شده در شکل 12 به دست می آوریم . توزیع ها در 37 ناحیه نیجریه که به سطح اول تقسیمات اداری تعلق دارند، شمارش می شود. نتایج آماری نشان می‌دهد که تمایلات تغییرات در مورد فرکانس‌های حوادث استنباط‌شده و تلفات استنباط‌شده تقریباً با نتایج آماری واقعی مطابقت دارد. سازگاری‌ها می‌توانند اثربخشی چارچوب تداعی داده‌ها و این فرض را که لاگ‌های تضاد شامل نمودارهای روایی خاصی از ساختار است که زیربنای انواع مختلف داده‌ها هستند را تأیید کند.

6. بحث

بارزترین نتیجه تحلیل ما توانایی پیش‌بینی تحولات تعارض از طریق یک مفهوم داستانی-استدلال است که مبتنی بر یادگیری بازنمایی برداری از معناشناسی متن در رویدادهای تعارض است. با یک نمایش عددی، چارچوب تداعی داده‌ها ما را قادر می‌سازد تا از موارد تاریخی برای پشتیبانی از پیش‌بینی یک فرآیند مکانی-زمانی شرایط اضطراری استفاده کنیم. ما نتایج خوب و بد یک پیش‌بینی را انتخاب می‌کنیم تا محدوده کاربرد رویکرد را تحلیل کنیم. از نتیجه 0.9315، توطئه‌های روایی خوشه‌ای شباهت نسبتاً بالاتری نسبت به توالی رویدادهای واقعی در توصیف متنی درگیری نشان می‌دهند که هر دو درگیری‌های خونینی را که در سازمان تروریستی بوکوحرام علیه غیرنظامیان و نظامیان نیجریه رخ داده است، نشان می‌دهند. رویکرد ما کاهش شدید را با دقت 0.0426 پیش‌بینی می‌کند، زیرا بازیگران درگیر در رویدادهای مشابه بسیار متفاوت هستند، به عنوان مثال، رویدادهای خوشه‌ای شامل مسلمانان، پلیس و ستیزه‌جویان می‌شوند، در حالی که رویدادهای واقعی شامل اعضای حزب دموکراتیک، شورش‌گران و ارتش می‌شوند. بدیهی است که انواع بازیگران در رویدادهای خوشه ای نقش مهمی ایفا می کنند و بر نتایج استدلال تأثیر می گذارند. یادگیری بازنمایی روابط بین طرح‌های روایی و بازیگران می‌تواند راهی برای بهبود بیشتر در این روش‌ها باشد. نتیجه ای که در بدیهی است که انواع بازیگران در رویدادهای خوشه ای نقش مهمی ایفا می کنند و بر نتایج استدلال تأثیر می گذارند. یادگیری بازنمایی روابط بین طرح‌های روایی و بازیگران می‌تواند راهی برای بهبود بیشتر در این روش‌ها باشد. نتیجه ای که در بدیهی است که انواع بازیگران در رویدادهای خوشه ای نقش مهمی ایفا می کنند و بر نتایج استدلال تأثیر می گذارند. یادگیری بازنمایی روابط بین طرح‌های روایی و بازیگران می‌تواند راهی برای بهبود بیشتر در این روش‌ها باشد. نتیجه ای که درشکل 9 ارتباط مشخصی را بین الگوهای فضایی پیش‌بینی‌شده و مشاهده‌شده نشان می‌دهد، اما نمی‌تواند یک پیش‌بینی الگوی زمانی نسبتاً دقیق ارائه دهد. این مشکل ممکن است تأثیر کمی بر درگیری های کوتاه مدت داشته باشد که در عرض یک هفته طول می کشد، در حالی که مناطق پیش بینی شده که برای هشدار استفاده می شوند ممکن است در عمل قابل ارجاع تر باشند.
در مقایسه با رویکرد ما، برخی از تحقیقات برای مطالعه به تجزیه و تحلیل ارتباط جغرافیایی یا مکانی-زمانی بستگی دارد، مانند رابطه بین پیامدهای نامطلوب تولد و آرسنیک در آب‌های زیرزمینی [32] و پتانسیل شهرستان [ 35 ]. این رویکردهای مدل‌سازی پارامتریک [ 40 ، 44 ، 46 ] بر روی چند عضو داده تمرکز می‌کنند، در حالی که چارچوب ما می‌تواند انواع داده‌های گسترده‌تری را که شامل داده‌های مکانی و زمانی بیش‌تر هستند، مرتبط کند. در این مورد، اطلاعات مربوط به بازیگران و تلفات را می توان با استفاده از طرح های روایی برای حمایت از تصمیم گیری مرتبط کرد. داده های مربوط به بازیگران برای شناخت الگوهای رفتاری گروه های مسلح نامشخص بررسی شده است [ 11]] و گروههای اسلامگرای خشن [ 6 ]. تلفات برای ارزیابی شدت درگیری ها در [ 12 ، 13 ، 14 ] استفاده شده است. بر اساس اصول یادگیری بازنمایی متنی، می‌توانیم دامنه داده‌های قابل استفاده را برای تسهیل تحلیل‌های همبستگی چند عاملی کاهش دهیم.
مقادیر متوسط ​​نتیجه پیش‌بینی از آگوست تا اکتبر (نگاه کنید به شکل 13 ) برجسته هستند، که با شدت تعارض ارائه شده توسط [ 12 ، 13 ، 14 ] سازگار است. در [ 12 ، 13 ، 14 ]، که در مورد نیجریه است، شدت به طور متوالی به دنبال «افزایش» (اوت)، «کاهش» (سپتامبر) و «در حال انجام» (اکتبر) است، که در آن ترتیب شدت «افزایش» > «در حال انجام است». ” > “کاهش”. تمام نقشه های تکامل مکانی-زمانی دامنه فعالیت بوکوحرام را نشان می دهد که با نتایج ارائه شده در [ 3] موافق است.]. علاوه بر این، رویکرد ما می‌تواند برای سطح بالاتری از استخراج اطلاعات، مانند نمودار روند پیکان دستی، که می‌تواند به عنوان ارزیابی بصری تکامل تعارض استفاده شود، اساسی باشد. نمونه ای از برنامه در شکل 14 نشان داده شده است .

7. نتیجه گیری

این مطالعه یک چارچوب ارتباط داده برای پیش‌بینی‌های مکانی-زمانی رویدادهای درگیری مسلحانه پیشنهاد می‌کند. یک نمایش متن جدید از متن رویداد، که تصویر پیکسلی روایت نامیده می شود، ارائه شده است. نمایش عددی می تواند هم ویژگی های هم واژه و هم ترتیب کلمات را به شکل یکپارچه بیان کند. هنگام استفاده از ابزار خوشه سلسله مراتبی پیاده سازی شده، چندین نوع داده را می توان با هم در سناریوهای تضاد مشابه مرتبط کرد. ما مختصات جغرافیایی و تاریخ رویدادهای خوشه‌ای را استنباط می‌کنیم که برای تولید نقشه‌های تکامل مکانی-زمانی بر اساس روش درونیابی کریجینگ استفاده می‌شوند. نتایج ارزیابی نشان می‌دهد که رویکرد ما می‌تواند از تصمیم‌گیری مکانی-زمانی در مورد شرایط اضطراری و درگیری‌ها پشتیبانی کند.

منابع

  1. Owutu، IU جهانی سازی و مدیریت درگیری های منطقه ای و امنیت در آفریقا: مورد ECOWAS. Net J. Soc. علمی 2014 ، 2 ، 37-43. [ Google Scholar ]
  2. رالی، سی. دوبلین، TC خشونت علیه غیرنظامیان: تجزیه و تحلیل تفکیک شده. بین المللی تعامل داشتن. 2012 ، 38 ، 462-481. [ Google Scholar ] [ CrossRef ]
  3. Mundell, J. Africa Conflict Monthly Monitor ; انتشارات A Consultancy Africa Intelligence (CAI): Gauteng، آفریقای جنوبی، 2014. [ Google Scholar ]
  4. شماره فصلنامه مانیتور غرب آفریقا 3. موجود به صورت آنلاین: http://www.afdb.org/fileadmin/uploads/afdb/Documents/Publications/Quarterly_West_Africa_Monitor_-_Issue_3.pdf (دسترسی در 13 فوریه 2016).
  5. شماره 4 فصلنامه مانیتور غرب آفریقا. به صورت آنلاین موجود است: http://www.afdb.org/fileadmin/uploads/afdb/Documents/Publications/Quarterly_West_Africa_Monitor_-_Issue_4.pdf (در 13 فوریه 2016 در دسترس است).
  6. MacEachren، A. تشخیص رویداد مکانی-زمانی، تشخیص خودکار رویداد بر اساس محتوای سند، ویژگی‌های مکانی و زمانی. در دسترس آنلاین: http://www.geovista.psu.edu/resources/flyers/NEVAC_Event_Detection.pdf (در تاریخ 13 فوریه 2016 قابل دسترسی است).
  7. سان، ی. هان، جی. پیش‌بینی رابطه مبتنی بر مسیر متا. در مجموعه مقالات کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، پکن، چین، 12 تا 16 اوت 2012.
  8. Raleigh, C. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). در دسترس آنلاین: http://www.acleddata.com/data/ (در 13 فوریه 2016 قابل دسترسی است).
  9. رالی، سی. Dowd, C. ACLED Working Paper No. 9 Peacemeeing and Civil Protection. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). در دسترس آنلاین: http://www.acleddata.com/wp-content/uploads/2015/10/ACLED-Working-Paper-No.-9_Peacekeeping-and-Civilian-Protection_2015.pdf (در 13 فوریه 2016 قابل دسترسی است).
  10. رالی، سی. Kniveton، D. بیا باران یا بدرخش: تجزیه و تحلیل درگیری و تنوع آب و هوا در شرق آفریقا. J. Peace Res. 2012 ، 49 ، 51-64. [ Google Scholar ] [ CrossRef ]
  11. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). گروه های مسلح ناشناس در دسترس آنلاین: http://www.acleddata.com/wp-content/uploads/2012/07/ACLED_Unidentified-Armed-Groups-Working-Paper_July-2012.pdf (در 11 فوریه 2016 دسترسی پیدا کرد).
  12. رالی، سی. داود، سی. Moody, J. ACLED روندهای درگیری گزارش شماره 40 اوت 2015. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). در دسترس آنلاین: http://www.acleddata.com/wp-content/uploads/2015/08/ACLED_Conflict-Trends-Report-No.40-August-2015_pdf.pdf (در 13 فوریه 2016 دسترسی پیدا کرد).
  13. رالی، سی. داود، سی. Moody, J. ACLED Trends Conflict Report شماره 41 سپتامبر 2015. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). در دسترس به صورت آنلاین: http://www.acleddata.com/wp-content/uploads/2015/09/ACLED_Conflict-Trends-Report-No.41-September-2015_pdf.pdf (در 13 فوریه 2016 دسترسی پیدا کرد).
  14. رالی، سی. داود، سی. Moody, J. ACLED گزارش روندهای درگیری شماره 42 اکتبر 2015. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). در دسترس آنلاین: http://www.acleddata.com/wp-content/uploads/2015/10/ACLED_Conflict-Trends-Report-No.42-October-2015_pdf.pdf (در 13 فوریه 2016 دسترسی پیدا کرد).
  15. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). در دسترس آنلاین: http://www.acleddata.com/visuals/trends/ (در 13 فوریه 2016 قابل دسترسی است).
  16. کلیوناد، آر. چوی، اچ جی. Kniveton، D. شیطان در جزئیات است: بررسی روابط بین درگیری، قیمت غذا و آب و هوا در سراسر آفریقا. تغییر جهانی محیط زیست گلوب. محیط زیست چانگ. 2015 ، 32 ، 187-199. [ Google Scholar ]
  17. بهات، ام. والگرون، JO روایات جغرافیایی و دینامیک مکانی-زمانی آنها: استدلال متعارف برای تحلیل های سطح بالا در سیستم های اطلاعات جغرافیایی. ISPRS Int. J. Geo-Inf. 2014 ، 3 ، 166-205. [ Google Scholar ] [ CrossRef ]
  18. دامیانو، آر. لیتو، الف. بازنمایی هستی‌شناختی روایات: مطالعه موردی در مورد داستان‌ها و کنش‌ها. در مجموعه مقالات کارگاه آموزشی مدل‌های محاسباتی روایت 2013، هامبورگ، آلمان، 4 تا 6 اوت 2013.
  19. Elson، DK تشخیص قیاس‌های داستانی از حاشیه‌نویسی‌های زمان، عمل و عاملیت. در مجموعه مقالات سومین کارگاه در مورد مدل های محاسباتی روایت، استانبول، ترکیه، 26-27 مه 2012.
  20. Vlek، CS; پراکن، اچ. رنویج، س. Verheij, B. بازنمایی و ارزیابی روایات حقوقی با سناریوهای فرعی در یک شبکه بیزی. در مجموعه مقالات کارگاه آموزشی مدل‌های محاسباتی روایت 2013، هامبورگ، آلمان، 4 تا 6 اوت 2013.
  21. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). ضمیمه 2 – جداسازی خشونت AFRC/RUF در گزارش نقشه کشی درگیری NPWJ. در دسترس به صورت آنلاین: http://www.acleddata.com/wp-content/uploads/2015/01/SLL-Appendix_Specific-Notes-on-seperation-AFRC-RUF-Violence.pdf (در 11 فوریه 2016 قابل دسترسی است).
  22. ACLED (پروژه داده های مکان و رویداد درگیری مسلحانه). ضمیمه 1 – کتاب کد برای گزارش نقشه کشی درگیری NPWJ. در دسترس آنلاین: http://www.acleddata.com/wp-content/uploads/2015/02/Annex-1_Codebook_Main.pdf (در 11 فوریه 2016 دسترسی پیدا کرد).
  23. رالف، اس. لیندگرن، ام. Padskocimaite, A. UCDP Georeference Event Dataset (GED) Codebook نسخه 1.5. در دسترس آنلاین: http://www.ucdp.uu.se/ged/data/ucdp-ged-points-v-1-5-codebook.pdf (در 13 فوریه 2016 قابل دسترسی است).
  24. Zammit Mangion، A.; سانگوینتی، جی. Kadirkamanathan، V. تخمین متغیر در سیستم‌های مکانی-زمانی از مشاهدات پیوسته و نقطه‌ای فرآیند. سیگنال IEEE روند. 2012 ، 60 ، 3449-3459. [ Google Scholar ] [ CrossRef ]
  25. شوته، اس. ویدمن، NB الگوهای انتشار خشونت در جنگ های داخلی. سیاسی. Geogr. 2011 ، 30 ، 143-152. [ Google Scholar ] [ CrossRef ]
  26. ژوکوف، YM Roads و انتشار خشونت شورشیان: تدارکات درگیری در قفقاز شمالی روسیه. سیاسی. Geogr. 2012 ، 31 ، 144-156. [ Google Scholar ] [ CrossRef ]
  27. Zammit-Mangion، A.; دوار، م. کادیرکاماناتان، وی. Sanguinetti، G. Point مدل‌سازی فرآیند جنگ افغانستان. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2012 ، 109 ، 12414-12419. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  28. Tran، CC; Yost، RS; یاناگیدا، جی اف. ساکسنا، س. فاکس، جی. Sultana، N. مدل‌سازی وقوع فضایی-زمانی آنفلوانزای فوق‌العاده پرندگان H5N1: مطالعه موردی در دلتای رودخانه قرمز، ویتنام. ISPRS Int. J. Geo-Inf. 2013 ، 2 ، 1106-1121. [ Google Scholar ] [ CrossRef ]
  29. Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ]
  30. لی، ال. Goodchild، MF نقش شبکه های اجتماعی در مدیریت اضطراری: یک دستور کار تحقیقاتی. بین المللی J. Inf. سیستم مدیریت واکنش به بحران 2010 ، 2 ، 49-59. [ Google Scholar ] [ CrossRef ]
  31. پرومال، م. ولومانی، بی. صداسیوام، ع. راماسوامی، ک. رویکردهای داده کاوی فضایی برای GIS – مروری کوتاه. Adv. هوشمند سیستم محاسبه کنید. 2015 ، 2 ، 579-592. [ Google Scholar ]
  32. شی، ایکس. آیوت، جی دی. اوندا، ا. میلر، اس. ریس، جی. گیلبرت-دیاموند، دی. اونگا، تی. گی، جی. کاراگاس، م. Moeschler، J. ارتباط جغرافیایی بین پیامدهای نامطلوب تولد و آرسنیک در آب های زیرزمینی در نیوهمپشایر، ایالات متحده. محیط زیست ژئوشیمی. سلامت 2015 ، 37 ، 333-351. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  33. کارلسون، جی. Saelens، BE; کر، جی. شیپرین، جی. کانوی، تی ال. فرانک، LD; چپمن، جی. گلنز، ک. کاین، KL; سالیس، JF ارتباط بین پیاده‌روی محله و زمان پیاده‌روی، دوچرخه‌سواری و وسیله نقلیه اندازه‌گیری شده با GPS در نوجوانان. Health Place 2015 ، 32 ، 1-7. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  34. Luong، NV; تطیشی، ر. Hoan، NT تجزیه و تحلیل تأثیر انجمن جنگل حرا با استفاده از سنجش از دور و فناوری GIS. جی. جئوگر. جئول 2015 ، 7 ، 106-116. [ Google Scholar ]
  35. می، ز. خو، اس. Ouyang، J. تجزیه و تحلیل ارتباط فضایی-زمانی پتانسیل شهرستان در دلتای رودخانه مروارید در سال 1990 C2009. جی. جئوگر. علمی 2015 ، 25 ، 319-336. [ Google Scholar ] [ CrossRef ]
  36. لی، دی. دیوگان، جی. Harms، S. تکنیک‌های درون‌یابی برای استخراج قانون تداعی جغرافیایی فضایی. در مجموعه مقالات نهمین کنفرانس بین المللی، RSFDGrC 2003، چونگ کینگ، چین، 26-29 مه 2003; صص 573-580.
  37. کوین، اس. لیو، اف. وانگ، سی. آهنگ، ی. Qu، J. تجزیه و تحلیل مکانی-زمانی و طرح ریزی ذرات شدید (PM 10 و PM 2.5 ) سطوح با استفاده از قوانین ارتباط: مطالعه موردی منطقه Jing-Jin-Ji، چین. اتمس. محیط زیست 2015 ، 120 ، 339-350. [ Google Scholar ] [ CrossRef ]
  38. چن، AT; یون، ا. شاو، آر. مردم، مکان‌ها و احساسات: بازنمایی بصری بافت تاریخی در شهادت‌های شفاهی. در مجموعه مقالات سومین کارگاه در مورد مدل های محاسباتی روایت، استانبول، ترکیه، 26-27 مه 2012.
  39. برادول، PM; Tangherlini، TR TrollFinder: کاوش ژئومعنایی مجموعه بسیار بزرگی از فولکلور دانمارکی. در مجموعه مقالات سومین کارگاه در مورد مدل های محاسباتی روایت، استانبول، ترکیه، 26-27 مه 2012.
  40. باتال، آی. فرادکین، دی. هریسون، جی. موئرچن، اف. Hauskrecht، M. استخراج الگوهای زمانی اخیر برای تشخیص رویداد در داده‌های سری زمانی چند متغیره. در مجموعه مقالات هجدهمین کنفرانس ACM SIGKDD در مورد کشف دانش و داده کاوی، پکن، چین، 12 تا 16 اوت 2012.
  41. ماتسوبارا، ی. ساکورای، ی. فالوتسوس، سی. ایواتا، تی. یوشیکاوا، ام. استخراج سریع و پیش‌بینی رویدادهای پیچیده زمان‌بندی شده. در مجموعه مقالات هجدهمین کنفرانس ACM SIGKDD در مورد کشف دانش و داده کاوی، پکن، چین، 12 تا 16 اوت 2012.
  42. هان، بی. بالدوین، تی. عادی سازی واژگانی پیام های متنی کوتاه: مکن حس یک توییتر. در مجموعه مقالات چهل و نهمین نشست سالانه انجمن زبانشناسی محاسباتی، پورتلند، ایالات متحده آمریکا، 19 تا 24 ژوئن 2011.
  43. هوآ، دبلیو. وانگ، ز. وانگ، اچ. ژنگ، ک. ژو، ایکس. درک متن کوتاه از طریق تحلیل واژگانی- معنایی. در مجموعه مقالات سی و یکمین بین المللی IEEE 2015، سئول، کره، 13 تا 17 آوریل 2015؛ صص 495-506.
  44. یین، جی. وانگ، جی. رویکرد مبتنی بر مدل مخلوط چند جمله‌ای دیریکله برای خوشه‌بندی متن کوتاه. در مجموعه مقالات بیستمین کنفرانس ACM SIGKDD در مورد کشف دانش و داده کاوی، نیویورک، نیویورک، ایالات متحده آمریکا، 24 تا 27 اوت 2014.
  45. آهنگ، ی. راث، دی. تراکم بردار پراکنده بدون نظارت برای تشابه متن کوتاه. NAACL 2015. موجود به صورت آنلاین: http://aclweb.org/anthology/N/N15/N15-1138.pdf (در 13 فوریه 2016 قابل دسترسی است).
  46. یان، ایکس. گوا، جی. لان، ی. چنگ، ایکس. مدل موضوعی دوترمی برای متون کوتاه. در مجموعه مقالات کنفرانس بین المللی وب جهانی، ریودوژانیرو، برزیل، 13 تا 17 مه 2013.
  47. OpenStreetMap. در دسترس آنلاین: http://www.openstreetmap.org/#map=5/44.277/10.942 (در تاریخ 13 فوریه 2016 قابل دسترسی است).
  48. استیورز، ام. Shiffrin، RM; نلسون، فضاهای معنایی DL بر اساس ارتباط آزاد که عملکرد حافظه را پیش‌بینی می‌کنند. در دسترس آنلاین: http://lsa.colorado.edu/LexicalSemantics/SteyversShiffrinNelson.pdf (دسترسی در 14 فوریه 2016).
  49. بورگ، آی. Groenen، مقیاس‌بندی چند بعدی مدرن PJF، نظریه و کاربردها . Springer: برلین، آلمان، 2005. [ Google Scholar ]
  50. کریستین، بی. فیدلر، اف. اسوالد، ا. گیاه، سی. بیانکا، دبلیو. پیتر، W. ITCH: سلسله مراتب خوشه ای نظری اطلاعات. در مجموعه مقالات کنفرانس: یادگیری ماشین و کشف دانش در پایگاه های داده، بارسلون، اسپانیا، 20-24 سپتامبر 2010.
  51. طاها، ی. رابرت، اس. رانگ، ا. کورنای، الف. دینامیک درگیری ها در ویکی پدیا. PLoS ONE 2012 , 7 . [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  52. لوفاون، SN; Nielsen, HB A MATLAB Kriging Toolbox نسخه 2.0، 1 اوت 2002. در دسترس آنلاین: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.73.5824 (در 14 فوریه 2016 در دسترس است).
  53. Quinonerocandela، J.; ادواردراسموسن، سی. یک دیدگاه واحد از رگرسیون فرآیند گاوسی تقریبی پراکنده. جی. ماخ. فرا گرفتن. Res. 2005 ، 6 ، 1935-1959. [ Google Scholar ]
شکل 1. منطقه مورد مطالعه – کل سرزمین نیجریه.
شکل 2. اطلاعات آماری در مورد بخش نیجریه پایگاه داده مکان و رویداد درگیری مسلحانه (ACLED). ( الف ) تعداد انواع انواع رویدادهای درگیری، از سال 1997 تا 2014. ( ب ) 9 سازمان برتر درگیری مسلحانه که بر اساس تعداد رویدادها رتبه بندی شده اند.
شکل 3. چارچوب مدل سازی.
شکل 4. نمودار روایی برای سازماندهی داده ها.
شکل 5. روش مدل سازی یک تصویر پیکسلی روایت.
شکل 6. فضای جاسازی کلمه ایجاد شده ( a ); و شطرنجی آن ( ب ). در مجموع 3832 کلمه استفاده شد و هر کلمه با یک جفت نقطه قرمز و آبی نشان داده شد.
شکل 7. نمونه ای از 10 تصویر پیکسل روایت تولید شده از آیتم “EVENT_ID_NO_CNTY” 53233 تا 53241.
شکل 8. نمونه ای از مقایسه بین نقشه پیش بینی و نقشه واقعیت: ( الف ) نقشه درون یابی شده توسط داده های مکانی و زمانی استنباط شده. ( ب ) ماسک فیلتر ( a )؛ ( ج ) نقشه تولید شده از داده های مکانی و زمانی واقعی بعدی. ( د ) ماسک فیلتر ( ج ).
شکل 9. مقایسه تحولات مکانی و زمانی درگیری ها از اوت تا اکتبر.
شکل 10. دقت پیش بینی تقریباً هفتگی.
شکل 11. مقایسه بین نسبت های فرکانس های صادر شده توسط رویداد.
شکل 12. مقایسه بین نسبت تلفات صادر شده.
شکل 13. روند پیش بینی از آگوست تا اکتبر مشابه نتیجه ارائه شده در [ 12 ، 13 ، 14 ] است.
شکل 14. نمونه ای از مقایسه نمودار روند پیکانی برای هفته 1 اکتبر.

بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *