1. معرفی
تجزیه و تحلیل داده های تحرک، به دست آمده از ردیابی اجسام متحرک، توجه تحقیقاتی بالایی را به خود جلب کرده است. با این حال، همانطور که توسط مطالعات اخیر در این حوزه اشاره شده است [ 1 ، 2] پیشرفت در تجزیه و تحلیل داده های تحرک عموماً زمینه حرکت را کنار گذاشته است که عامل مهمی برای درک حرکت است. زمینه حرکت مجموعه عناصری است که می تواند موقعیتی را که حرکت در آن اتفاق می افتد مشخص کند. عناصر زمینه شامل، از جمله، اشیاء ایستا، فضای جغرافیایی که حرکت در آن صورت می گیرد، و رویدادهایی که در این فضا رخ می دهد. یک عنصر زمینه ممکن است ایستا یا پویا باشد. برای یک عنصر زمینه ایستا، مقادیر ویژگی های آن در نظر گرفته شده توسط یک مطالعه بدون تغییر در طول دوره مطالعه باقی می ماند. به عنوان مثال، در یک سیستم توصیهکننده مکان که هدف آن ارائه مکانهای مکانهای جذاب و انواع جاذبههای مربوطه به گردشگران است، مکان و فعالیت یک مکان بدون تغییر باقی میماند و از این رو مکان یک عنصر بافت ساکن است. از سوی دیگر، برای یک عنصر زمینه پویا، مقادیر برخی از ویژگی های مورد بررسی توسط مطالعه در طول دوره مطالعه تغییر می کند. به عنوان مثال، در یک برنامه برنامه ریزی حمل و نقل با هدف انطباق ظرفیت حمل و نقل با تقاضا، رویدادهای اجتماعی عمومی عناصر زمینه پویا هستند. این به دلیل این واقعیت است که ویژگی های مورد علاقه برنامه مانند مکان رویداد و حرکت توده ای مرتبط با آن تغییر می کند (رویداد از نظر جغرافیایی در یک دوره زمانی قرار دارد و سپس ناپدید می شود – اندکی قبل از شروع آن یک حرکت توده ای بزرگ در مقایسه با مدتی پس از شروع…). در یک برنامه برنامه ریزی حمل و نقل با هدف تطبیق ظرفیت حمل و نقل با تقاضا، رویدادهای اجتماعی عمومی عناصر زمینه پویا هستند. این به دلیل این واقعیت است که ویژگی های مورد علاقه برنامه مانند مکان رویداد و حرکت توده ای مرتبط با آن تغییر می کند (رویداد از نظر جغرافیایی در یک دوره زمانی قرار دارد و سپس ناپدید می شود – اندکی قبل از شروع آن یک حرکت توده ای بزرگ در مقایسه با مدتی پس از شروع…). در یک برنامه برنامه ریزی حمل و نقل با هدف تطبیق ظرفیت حمل و نقل با تقاضا، رویدادهای اجتماعی عمومی عناصر زمینه پویا هستند. این به دلیل این واقعیت است که ویژگی های مورد علاقه برنامه مانند مکان رویداد و حرکت توده ای مرتبط با آن تغییر می کند (رویداد از نظر جغرافیایی در یک دوره زمانی قرار دارد و سپس ناپدید می شود – اندکی قبل از شروع آن یک حرکت توده ای بزرگ در مقایسه با مدتی پس از شروع…).
چندین مطالعه بر روی داده های تحرک، عناصر زمینه ایستا مانند اشیاء ساکن موجود در فضای جغرافیایی [ 3 ، 4 ] و سایر ویژگی های فضای جغرافیایی [ 5 ] را در نظر گرفته اند. با این حال، عناصر زمینه پویا به ندرت مورد توجه قرار گرفته اند، علیرغم اینکه در کاربردهای واقعی تجزیه و تحلیل داده های تحرک بسیار رایج هستند. مقاله ما به پر کردن این شکاف کمک می کند.
از آنجایی که زمینه حرکت بسیار گسترده است، این مقاله روشی را برای ادغام یک دسته خاص از عناصر زمینه حرکت در تجزیه و تحلیل داده های تحرک پیشنهاد می کند. اینها با موقعیت جغرافیایی و دوره زمانی که در آن وجود دارند مشخص می شوند. ما از آن به عنوان بافت جغرافیایی یاد می کنیم . ما از اصطلاح بافت جغرافیایی برای تعیین محدوده مطالعه خود در مورد زمینه جنبش استفاده می کنیم. زمینه خود جنبش بسیار گسترده است. همچنین میتواند شامل عناصر داخلی جسم متحرک باشد که ممکن است بر حرکت آن تأثیر بگذارد، که خارج از محدوده مطالعه ما هستند. با این حال، مانند بافت جغرافیاییدر مطالعه ما، زمینه درونی جسم متحرک نیز ثابت است (مثلاً جنسیت) یا پویا (مثلاً سطح گرسنگی). به ویژه، ما علاقه مندیم که رویدادهای بزرگ را به عنوان زمینه جنبش در نظر بگیریم. این بدان معناست که ما بر روی رویدادهایی تمرکز می کنیم که تعداد زیادی از مردم را به خود جذب می کنند و مورد توجه عموم هستند. علاوه بر این، رویدادی که در این مقاله در نظر گرفته شده، رویدادی است که در یک مکان شناخته شده خاص مانند یک مسابقه فوتبال در یک استادیوم خاص یا یک کنسرت بزرگ در یک تئاتر خاص اتفاق میافتد.
همانطور که توسط مطالعات قبلی نشان داده شده است، رویدادهای بزرگ تأثیر عمده ای بر رفتار جامعه از جمله الگوی تحرک آن دارند [ 6 ، 7]]. تحت این بررسی، ما یک روش برای تجزیه و تحلیل تحرک انسان برای حمایت از درک بهتر پویایی رویدادهای بزرگ پیشنهاد می کنیم. این روش برای پاسخ به سؤالات زیر طراحی شده است: با توجه به داده های مربوط به تحرک در همسایگی مکانی شناخته شده برای میزبانی رویدادهای بزرگ، (1) آیا یک رویداد بزرگ رخ داده است؟ در صورت وقوع، (2) تا چه حد می توانیم زمان شروع و پایان آن را تخمین بزنیم؟ (3) الگوی زمانی ورود و خروج شرکت کنندگان در رویداد چگونه است: (الف) آیا آنها به طور تدریجی یا بلافاصله قبل از شروع رویداد وارد شدند. (ب) آیا آنها بلافاصله پس از پایان رویداد حرکت کردند یا به تدریج ترک کردند و احتمالاً قبل از ترک محل، زمان بیشتری برای لذت بردن از مکان و/یا تجربه صرف کردند؟
بقیه مقاله به شرح زیر سازماندهی شده است. بخش 2 کار مرتبط را مورد بحث قرار می دهد در حالی که روش پیشنهادی در بخش 3 توضیح داده شده است . بخش 4 یک ارزیابی تجربی از روش بر اساس داده های واقعی ارائه می دهد و نتایج این ارزیابی در بخش 5 مورد بحث قرار می گیرد . در نهایت، بخش 6 نتیجه گیری می کند و دستورالعمل هایی را برای کار آینده پیشنهاد می کند.
2. کارهای مرتبط
کار ارائه شده در این مقاله به تعداد قابل توجهی از مطالعات در مورد تجزیه و تحلیل داده های تحرک مربوط می شود. این مطالعات شامل روش هایی برای استخراج مکان های مهم از داده های تحرک است. به طور خاص، ما خوشهبندی را به عنوان یک روش داده کاوی برای شناسایی مکانهای توقف اعمال میکنیم و توقف را با اطلاعات معنایی مربوطه مانند انجام شده در [ 8 ] مرتبط میکنیم. ما مفاهیم توقف و حرکت را برای تقسیمبندی مسیرها به قسمتها، همانطور که در [ 9 ، 10 ] بحث شد، اتخاذ میکنیم و الگوهای تحرک را استخراج میکنیم که بر روی آن تجزیه و تحلیل دقیقی انجام میدهیم. تحرک انسان با استفاده از اشکال مختلف ردیابی از جمله آثار افراد استخراج شده از داده های تلفن همراه آنها مورد مطالعه قرار گرفته است.11 ] یا پلتفرم های شبکه های اجتماعی [ 12 ]، مسیرهای ماشین های شخصی [ 13 ]، و مسیرهای تاکسی ها [ 14 ]. به دلیل نگرانی های مربوط به حفظ حریم خصوصی، این داده ها به سختی قابل دسترسی هستند زیرا نشان دهنده ردپای افراد هستند. یکی دیگر از مشکلات خاص داده های تلفن همراه و داده های رسانه های اجتماعی این است که وضوح زمانی بسیار پایینی دارند. این مشکل یافتن الگوهای تحرک از تلفن همراه و داده های رسانه های اجتماعی با استفاده از الگوریتم های داده کاوی را به چالش بزرگی تبدیل می کند.
مطالعات مربوط به این مقاله به ویژه در مورد ادغام زمینه حرکت در تجزیه و تحلیل داده های تحرک و تجزیه و تحلیل رفتار افراد در صورت وقوع حوادث است. Andrienko، Andrienko و Heurich [ 15 ] یک مدل مفهومی برای تحلیل بافت آگاه از حرکت ارائه کردند. آنها انواع مختلف عناصر زمینه (مانند رویدادها، زمان و مکان) را شناسایی کردند و نمونه هایی از تجزیه و تحلیل روابط بین شی متحرک و برخی از انواع عناصر زمینه شناسایی شده ارائه کردند. بوچین و همکاران [ 16] همچنین انواع مختلفی از زمینه (مانند موانع، شبکه و زمین) را ارائه کرد که آنها را به عنوان یک زیربخش چند ضلعی برچسبگذاری شده مدلسازی کردند و در حین مطالعه شباهت مسیرها در نظر گرفتند. جدای از دو مطالعه فوق که بافت جغرافیایی را به طور کلی مدل میکنند، سایر تحلیلهای آگاه از زمینه دادههای تحرک، یک نوع عنصر زمینه واحد را در نظر میگیرند. عناصر زمینه که معمولاً در نظر گرفته می شوند، نقاط مورد علاقه جغرافیایی (به عنوان مثال، [ 8 ، 17 ]) و عوامل محیطی هستند، که اغلب به عنوان تصاویر سنجش از دور مانند دما و ارتفاع در دسترس هستند (به عنوان مثال، [ 5 ، 18]]). علیرغم سهم مهم مطالعات فوق در مدلسازی بافت حرکت و نمونهسازی ادغام برخی از انواع عناصر زمینه، هنوز نیاز به در نظر گرفتن یک زمینه پویا وجود دارد که در آن بعد زمان به طور صریح مورد مطالعه قرار گیرد. در مقاله ما، علاوه بر اشیاء ایستا، رویدادهایی را در نظر می گیریم که برای یک دوره زمانی خاص وجود دارند و در طول دوره وجود، تعدادی از مراحل مشخصه را طی می کنند.
Bagrow، Wang و Barabási [ 6 ] سوابق تماس از یک ارائه دهنده خدمات تلفن همراه را تجزیه و تحلیل کردند تا واکنش اجتماعی به انواع مختلف رویدادها را بررسی کنند. آنها دو نوع رویداد را تجزیه و تحلیل کردند: رویدادهایی که به عنوان موارد اضطراری (مثلاً سقوط هواپیما و زلزله) و غیر اضطراری (مثلاً کنسرت) طبقه بندی می شوند. Calabrese [ 7 ] ردهای تلفن همراه را برای شناسایی منشاء افرادی که در رویدادهای خاص شرکت می کنند، تجزیه و تحلیل کرد. رویدادهای تحلیل شده در [ 7 ] و رویدادهای غیر اضطراری مورد مطالعه در [ 6] شبیه رویدادهایی است که در مطالعه ما در نظر گرفته شده است. با این حال، این مطالعات مبتنی بر شخص هستند به این معنا که رویداد شناخته شده است و تمرکز بر افراد است، در حالی که مطالعات ما مبتنی بر رویداد است که تلاش میکند یک رویداد را در یک مکان خاص شناسایی کند. علاوه بر این، مطالعات موجود بر اساس ردیابی افراد (به عنوان مثال، [ 19 ])، که نیاز به همکاری بالایی دارند، یا سوابق تماس تلفن همراه است که به راحتی قابل دسترسی نیستند و دقت مکانی و زمانی پایینی دارند [11 ] . به طور غیر مشابه، از مسیرهای وسایل نقلیه عمومی استفاده می کنیم که دقت مکانی و زمانی بالایی دارند و نیازی به همکاری مسافران ندارند.
3. روش پیشنهادی
روشی که ما برای ادغام زمینه حرکت در تجزیه و تحلیل داده های تحرک پیشنهاد می کنیم بر اساس استعاره “حرکت به عنوان تعامل” است [ 20 ]. در این استعاره، الگوی حرکتی مشاهده شده نتیجه تعامل بین جسم متحرک و عناصر بافت در نظر گرفته شده است. فعل و انفعالات نشان دهنده تغییرات روابط فضایی در طول زمان هستند (مانند عبور، نزدیک شدن، توقف و غیره). مفهوم تعامل در این مقاله رابطه مکانی-زمانی [ 15 ] و الگوی [ 21 ] نیز نامیده شده است. به طور خاص، این مقاله تعاملات بین اجسام متحرک را دنبال یک مسیر از پیش تعریف شده و رویدادهایی که در مجاورت مسیر رخ میدهند، تجزیه و تحلیل میکند.
3.1. مفاهیم و تعاریف اساسی
دادههای حرکتی تحلیلشده در این مقاله نشاندهنده حرکت جسمی است که بین نقاط انتهایی یک مسیر از پیش تعریفشده به جلو و عقب حرکت میکند. این مورد در مورد وسایل نقلیه عمومی برنامه ریزی شده مانند اتوبوس و تراموا از یک خط شناخته شده است. فرض اساسی در مورد این نوع حرکت در مطالعه ما این است که وسیله نقلیه لزوماً در هر نقطه توقف تعیین شده در طول مسیر متوقف نمی شود. به عنوان مثال، هنگامی که اتوبوس در طول مسیر به نقطه توقف تعیین شده می رسد، اگر مسافرانی در انتظار خروج یا ورود باشند، معمولاً متوقف می شود. برخی از ویژگی های مرتبط با توقف، نشانی از تعداد افرادی است که در جهت مربوطه حرکت می کنند. مثلا، توقف طولانی نشان دهنده این است که افراد زیادی در حال سوار شدن و/یا خروج از اتوبوس هستند. به همین ترتیب، داشتن تعداد زیادی توقف، نشاندهنده این است که افراد زیادی در اتوبوس وارد و/یا خارج میشوند. این دو مورد به طور مثبت با تعداد افرادی که اتوبوس را به آن سمت میبرند همبستگی دارد. با این حال، حضور این مسافران در این رویداد را میتوان با بررسی تعداد توقفها در محل رویداد نیز تأیید کرد. در این بخش به معرفی مفاهیم اساسی مربوط به چنین حرکتی می پردازیم که در روش پیشنهادی مورد استفاده قرار می گیرد. اینکه آیا این مسافران در رویداد حضور دارند یا خیر، میتوان با بررسی تعداد توقفها در محل رویداد نیز تأیید کرد. در این بخش به معرفی مفاهیم اساسی مربوط به چنین حرکتی می پردازیم که در روش پیشنهادی مورد استفاده قرار می گیرد. اینکه آیا این مسافران در رویداد حضور دارند یا خیر، میتوان با بررسی تعداد توقفها در محل رویداد نیز تأیید کرد. در این بخش به معرفی مفاهیم اساسی مربوط به چنین حرکتی می پردازیم که در روش پیشنهادی مورد استفاده قرار می گیرد.
تعریف 1.
سفر. سفر یک توالی مرتب شده زمانی از نقاط GPS است که در طول حرکت از یک نقطه انتهایی مسیر از پیش تعریف شده به نقطه پایانی دیگر ثبت شده است.
تعریف 2.
بافت جغرافیایی (یا به سادگی زمینه). زمینه جغرافیایی یک جنبش مجموعه ای از عناصر است که محیطی را که حرکت در آن انجام می شود مشخص می کند. عناصر زمینه می توانند انواع مختلفی داشته باشند از جمله فضای جغرافیایی (به عنوان مثال، بزرگراه و جاده فرعی)، اشیاء ساکن (مانند ایستگاه اتوبوس، چراغ راهنمایی)، اشیاء متحرک (مانند سایر اتومبیل های متحرک و عابران پیاده)، و رویدادها (مثلاً مسابقه فوتبال در یک استادیوم در مجاورت مسیر مورد استفاده توسط جسم متحرک).
تعریف 3.
اثر متقابل. ما از اصطلاح تعامل برای اشاره به فرآیندی استفاده می کنیم که در آن یک رابطه فضایی بین جسم متحرک و یک عنصر زمینه حرکت در طول زمان تغییر می کند. بسته به نوع عنصر زمینه می توان انواع مختلفی از تعاملات را تعریف کرد، اما در این مقاله ما فقط به سه تعامل (توقف، نزدیک شدن و دور شدن) علاقه مندیم که در شکل 1 نشان داده شده و در ادامه تعریف شده است .
تعریف 4.
توقف یک تعامل توقف زمانی اتفاق میافتد که جسم متحرک اولیه برای یک آستانه زمانی معین در همسایگی عنصر زمینه باقی بماند. فرض کنید A یک شی متحرک باشد، C یک عنصر زمینه مدلسازی شده به عنوان یک نقطه، و t یک لحظه زمانی باشد که موقعیت جسم متحرک در آن ثبت شده است. فرض کنید d(A, C, t) نشان دهنده فاصله بین A و C در لحظه t باشد، nParam یک پارامتر همسایگی باشد و Smin حداقل مدت زمانی باشد که یک توقف باید طول بکشد. تعامل توقف به صورت زیر رسمیت می یابد:
تعریف 5.
نزدیک شدن. تعامل نزدیک هنگامی مشاهده می شود که فاصله بین جسم متحرک و عنصر زمینه کاهش یابد. این به شرح زیر رسمیت یافته است:
تعریف 6.
دور شدن. تعامل دور شدن زمانی مشاهده می شود که فاصله بین جسم متحرک و عنصر زمینه افزایش یابد. این به شرح زیر رسمیت یافته است:
3.2. مواد و روش ها
این مقاله بر دو عنصر زمینه تمرکز دارد: نقاط توقف شناخته شده در طول مسیر، و یک رویداد بالقوه در یک مکان شناخته شده. دسته اول یک زمینه ایستا را تشکیل می دهد در حالی که دسته دوم یک زمینه پویا را با توجه به تعریف بافت حرکتی ارائه شده در بخش 1 تشکیل می دهد . رویکردی که ما پیشنهاد میکنیم شامل دو مرحله اصلی است: استخراج تعاملات از دادههای تحرک، و انجام یک تحلیل مکانی-زمانی از تعاملات استخراجشده.
3.2.1. استخراج تعاملات
داده های تحرک عموماً حاوی نویز و خطاهایی هستند که باید در مرحله پیش پردازش پاک شوند. تمیز کردن مورد نیاز به کیفیت داده های موجود بستگی دارد. به عنوان حداقل نیاز، نوع داده های پردازش شده در این مقاله نیاز به پیش پردازش برای شناسایی سفرهای فردی دارد. پس از مرحله پیش پردازش، هر سفر برای تشخیص وقوع فعل و انفعالات توقف ، نزدیک شدن و دور شدن تجزیه و تحلیل می شود .
(1) توقف تعامل
استخراج فعل و انفعالات توقف ، مکان نقاط توقف (به عنوان مثال، ایستگاه های اتوبوس یا تراموا) در طول مسیر را به عنوان عناصر زمینه در نظر می گیرد. هدف استخراج رخدادهای واقعی توقف در این عناصر زمینه است. ملاحظات پشت این فرآیند این واقعیت است که جسم متحرک اولیه حداقل برای مدت زمان مشخصی در همسایگی عنصر زمینه باقی می ماند. ما استخراج توقف ها را در دو مرحله به دنبال رویکرد در [ 22 ] اجرا می کنیم. در مرحله اول، با توجه به اینکه ثبت موقعیت معمولی نقاط نزدیک تری را در طول توقف ایجاد می کند ، ما یک شکل از خوشه بندی مبتنی بر چگالی را برای استخراج نامزد اتخاذ می کنیم.توقف ها ( شکل 2 الف را ببینید). پارامترهای این خوشه بندی بر اساس ویژگی های داده ها تنظیم می شوند. در مرحله دوم، تمام توقف های کاندید به دست آمده از مرحله اول را که در همسایگی یک نقطه توقف شناخته شده قرار ندارند، بررسی و دور می اندازیم ( شکل 2 ب را ببینید).
(2) تعاملات نزدیک شدن و دور شدن
هدف، برای هر سفر، شناسایی بخشی است که جسم متحرک به رویداد نزدیک می شود و بخشی که در آن از رویداد دور می شود. از هر انتهای مسیر، نزدیکترین نقطه توقف شناخته شده به محل رویداد را با در نظر گرفتن بخش جاده ای که دسترسی به محل رویداد را از مسیر فراهم می کند، شناسایی می کنیم. این دو نقطه توقف، نقاط مرجع را در دو جهت مسیر برای شناسایی مقاطع سفر تشکیل می دهند. بر اساس جهت سفر و تغییر فاصله در طول مسیر تا نقطه مرجع مربوطه، نقاط سفر را علامت گذاری می کنیم. وقتی فاصله کاهش مییابد، نقطه روی قسمتی که نزدیک میشود و وقتی افزایش مییابد، در مسیر دور شدن علامتگذاری میشود.بخش. هنگامی که فاصله تغییر نمی کند، علامت گذاری به تغییر بعدی موکول می شود. این فرآیند از تعاریف نزدیک شدن و دور شدن که قبلاً ارائه شد پیروی می کند.
پس از استخراج فعل و انفعالات، هر موقعیت سفر با توجه به اینکه بخشی از یک تعامل توقف است یا نه، و در بخش نزدیک یا در حال دور شدن از سفر علامت گذاری می شود. از تعاملات محاسبه شده، مرحله بعدی ویژگی هایی را استخراج می کند که سپس برای تجزیه و تحلیل مکانی-زمانی استفاده می شود.
3.2.2. تحلیل مکانی – زمانی تعاملات
این مرحله با استخراج ویژگی های مشخصه تحرک شروع می شود. برای هر سفر، توقفهایی را که در حین نزدیک شدن به رویداد ( توقفهای نزدیک شدن ) و توقفهایی که هنگام دور شدن از رویداد انجام شدهاند ( توقفهای در حال دور شدن ) را شمارش میکنیم . از آنجایی که تعداد نقاط توقف در بخش نزدیک میشود با قسمت در حال دور شدن متفاوت است، ما دو متغیر (تعداد توقفهای نزدیک (Sa) و تعداد توقفهای در حال حرکت (Sg) ) را نرمال میکنیم، از این رو مقدار را به دست میآوریم. نسبت توقف های نزدیک (Sa’) و نسبت توقف های در حال حرکت (Sg’):
که در آن n تعداد نقاط توقف در بخش نزدیک و m تعداد نقاط توقف در بخش در حال دور شدن است.
ما هر روز حرکت را به فواصل 1 ساعته تقسیم می کنیم. سپس تراز توقف (V) را از دو متغیر بالا استخراج میکنیم ، با تراز توقفها میانگین تفاوت بین نسبت توقف نزدیک و نسبت توقف در حال حرکت است که هر دو را میتوان برای هر بازه زمانی محاسبه کرد. . برای یک بازه زمانی معین i مقدار V به صورت زیر محاسبه می شود:
که در آن n تعداد سفرهایی است که در محل رویداد در بازه زمانی i انجام شده است .
سپس تراز توقف عادی (W) را به عنوان میانگین تعادل توقف در “شرایط عادی” تعریف می کنیم. به عبارت دیگر، برای یک بازه زمانی معین، تعادل توقف عادی W میانگین تعادل توقف فواصل زمانی همان ساعت از روز و همان روز هفته است، اما فقط در دورههایی که بدون رویداد در رویداد مورد نظر تأیید شده است. محل. برای یک بازه زمانی معین i مقدار W به صورت زیر محاسبه می شود:
که در آن k تعداد بازههای زمانی است که دارای ساعتی از روز و همان روز هفته با i هستند ، اما بدون رویداد در محل رویداد تأیید شدهاند.
از تعریف W چنین استنباط می شود که این متغیر برای هر بازه 1 ساعته هر روز هفته یک مقدار دارد و هر چه تعداد روزهای بدون رخداد در این بازه زمانی بیشتر در نظر گرفته شود این مقدار دقیق تر است.
ما همچنین تعداد توقفها در نزدیکی محل برگزاری (P) را بهعنوان تعداد توقفها در یک محله از محل رویداد محاسبه میکنیم که امکان در نظر گرفتن تمام نقاط توقفی که مستقیماً به محل برگزاری خدمات میدهند، صرف نظر از خط، را میدهد. به عنوان مثال، ما از شعاع 650 متری (نگاه کنید به شکل 3 a) در اطراف استادیوم استفاده کردیم تا توقفها را در تمام ایستگاههای اتوبوس که مستقیماً از خطوط اتوبوس مختلف به استادیوم سرویس میدهند، ضبط کنیم. به همان ترتیبی که تعادل توقف های عادی را از تعادل توقف ها استخراج کردیم، تعداد عادی توقف های نزدیک محل برگزاری (Q) را به عنوان میانگین تعداد توقف های نزدیک محل برگزاری محاسبه می کنیم.در دوره های بدون رویداد در محل رویداد.
تشخیص یک رویداد بر اساس تجزیه و تحلیل تغییرات چهار متغیر فوق ( V ، W ، P ، Q ) است. دلیل استفاده از این متغیرها این است که در صورت وقوع یک رویداد، انتظار داریم دو بازه زمانی با افزایش زیاد مقدار P بالاتر از مقدار Q را مشاهده کنیم . این دو بازه مربوط به ورود و خروج شرکت کنندگان در رویداد است. فاصله خاص مربوط به ورود و مربوط به خروج را می توان از تغییر V نسبت به W شناسایی کرد . به منظور تجزیه و تحلیل تغییرات این متغیرها، مرزهای بالا و پایین را محاسبه می کنیم. حد بالایی(UV) و کران پایین ( LV ) V به صورت زیر محاسبه می شوند:
جایی که α ضریب مقیاس و σw�wانحراف معیار V در شرایط عادی است.
به طور مشابه، کران بالایی ( UP ) P را به صورت زیر محاسبه می کنیم:
جایی که α ضریب مقیاس و σس�سانحراف معیار P در شرایط عادی است.
مقدار بالای V بالاتر از W به معنای نزدیک شدن به توقف های بیشتر از توقف های دور شدنی است، که ممکن است به معنای حرکت افراد زیادی به محل برگزاری رویداد و در نتیجه ورود شرکت کنندگان در رویداد باشد. به دنبال همین استدلال، مقدار کم V زیر W ممکن است به معنای حرکت افراد زیادی از محل برگزاری رویداد باشد، که ممکن است نشان دهنده خروج افراد از محل رویداد باشد. مقایسه P با متغیرهای مرتبط آن ( Q و UP ) زمانهای نامزد ورود و خروج را ایجاد میکند که با استفاده از مقایسه V تأیید یا رد میشوند.به متغیرهای مرتبط آن ( W ، UV ، و LV ). تأیید زمان ورود و خروج نامزدها در نهایت منجر به تشخیص وقوع رویداد و تخمین زمان شروع و پایان آن می شود.
به منظور بررسی ورود و خروج از رویداد، ما یک تجزیه و تحلیل محلی را در سطح دانه بندی زمانی دقیق تر انجام می دهیم. برای این منظور، تعداد توقفها را در نزدیکی محل برگزاری در فواصل زمانی کوچکتر در حول و حوش زمانهای خروج و رسیدن که در مرحله قبل تأیید شدهاند، تجزیه و تحلیل میکنیم .
4. ارزیابی تجربی
در این بخش، روش پیشنهادی را بر روی داده های واقعی اعمال می کنیم تا کاربرد آن را ارزیابی کنیم. ما دو مطالعه موردی زیر را انتخاب کردیم: یکی شامل یک استادیوم به عنوان محل برگزاری رویدادهای بزرگ و دیگری شامل یک سالن کنسرت به عنوان مکانی برای رویدادهای در مقیاس متوسط تا بزرگ. ما از مورد اول برای توضیح جزئیات نحوه استفاده از روش استفاده می کنیم، در حالی که برای مورد دوم برخی از نتایج را ارائه کرده و آنها را مورد بحث قرار می دهیم. ابتدا داده های مورد استفاده را تشریح می کنیم و سپس با استفاده از روش پیشنهادی به تحلیل این داده ها می پردازیم.
4.1. شرح داده ها و پیش پردازش
4.1.1. توضیحات داده ها
دادههایی که در آزمایشهای خود استفاده میکنیم شامل دادههای تحرک و مکانهای عناصر زمینه است. داده های تحرک، مسیر اتوبوس هایی هستند که در خطوط 4 و 44 اتوبوس دوبلین حرکت می کنند. این زیر مجموعه ای از مجموعه داده های GPS اتوبوس دوبلین [ 23 ] از کنترل ترافیک شورای شهر دوبلین است. هر اتوبوس به طور متوسط هر 20 ثانیه یک رکورد در مورد موقعیت و وضعیت خود ایجاد می کند. این رکورد شامل مهر زمانی، طول و عرض جغرافیایی مکان، شناسه خط اتوبوس، شناسه وسیله نقلیه، الگوی سفر (نشان دهنده جهت)، شناسه نزدیکترین ایستگاه اتوبوس، تأخیر (تعداد ثانیهها) است. اتوبوس عقب مانده است که اگر اتوبوس جلوتر از برنامه باشد منفی است)، آیا اتوبوس در ایستگاه اتوبوس است و آیا اتوبوس در ازدحام است.
دادههای مربوط به عناصر زمینه شامل مکانهای ایستگاههای اتوبوس در طول مسیرهایی است که دو خط اتوبوس استفاده میکنند، و مکانهای استادیوم آویوا و سالن کنسرت ملی که رویدادها در آن برگزار میشوند. این عناصر زمینه در شکل 3 نشان داده شده است . قسمت سمت چپ شکل (الف) مسیری را نشان می دهد که اتوبوس خط 4 از آن استفاده می کند. این مسیر تقریباً 20 کیلومتر طول دارد و شامل 65 ایستگاه اتوبوس در یک جهت و 61 ایستگاه در جهت دیگر می باشد. قسمت سمت راست شکل (ب) مسیر استفاده شده توسط اتوبوس خط 44 را نشان می دهد که شامل 80 ایستگاه اتوبوس در یک جهت و 76 ایستگاه در جهت دیگر می باشد. همچنین در شکل 3 نشان داده شده استمحله های محل برگزاری رویداد هستند که با شعاع 650 متر در اطراف استادیوم و 350 متر در اطراف سالن کنسرت تعریف شده اند. اندازههای این محلهها به گونهای انتخاب میشوند که تمام ایستگاههای اتوبوسی را که مستقیماً به مکانها خدمات میدهند، در بر بگیرد، به طوری که مسافری که در آنجا رها شده است، ممکن است برای رسیدن به محل برگزاری، با اتوبوس دیگری نرود. برای هر ایستگاه اتوبوس، داده ها شامل یک شناسه منحصر به فرد، یک نام، مختصات GPS و فاصله ای است که از ابتدای مسیر در آن قرار دارد.
ما اطلاعات مربوط به رویدادهای بزرگی را که در دوره زمانی تحت پوشش داده های تحرک در استادیوم آویوا رخ داده است، از اینترنت بازیابی کردیم. این اطلاعات (به جدول 1 مراجعه کنید ) از وب سایت سرویس پلیس ملی ایرلند [ 24 ] و وب سایت ویکی پدیا بازیابی شده است. به همین ترتیب، ما اطلاعات مربوط به کنسرت هایی را که در دوره تحت پوشش داده های تحرک در سالن کنسرت ملی برگزار شد، از اینترنت بازیابی کردیم. رویدادها به طور منظم در حوالی ساعت 8:30 بعد از ظهر سازماندهی می شدند، همانطور که از وب سایت آرشیو رویداد مشاهده می شود [ 25 ].
4.1.2. پیش پردازش داده ها
به منظور آماده سازی داده ها برای تجزیه و تحلیل، ما عملیات پیش پردازش زیر را انجام دادیم. ما فرمت زمان و تبدیل سیستم مختصات را انجام دادیم. در مرحله بعد، داده ها را با حذف موقعیت های غیر واقعی پاک کردیم. به عنوان مثال، اگر قطعه بین یک موقعیت و سلف مستقیم آن به نظر می رسید که با سرعت متوسط بالاتر از 50 کیلومتر در ساعت حرکت کرده است، ما این موقعیت را غیرواقعی در نظر گرفتیم و آن را دور انداختیم. اگرچه هر موقعیت اتوبوس ثبتشده با یک شناسه نزدیکترین ایستگاه اتوبوس مرتبط بود، اما شناساییهای اشتباهی را پیدا کردیم که در آن شناسهها با شناسههای منحصربهفرد ایستگاههای اتوبوس متفاوت بودند. بنابراین، نزدیکترین ایستگاه اتوبوس را برای هر موقعیت اتوبوس ثبت شده مجدداً محاسبه کردیم. گاهی اوقات از توالی موقعیت ها، نوسان به عقب و جلو در طول مسیر را می دیدیم. از آنجایی که هر رکورد GPS متوالی باید در طول مسیر پیشرفت کند، سوابق GPS را که باعث چنین نوسانی شده بودند شناسایی و آنها را حذف کردیم. چنین رکوردهایی با مقایسه فواصل نزدیکترین ایستگاه اتوبوس و ایستگاه قبلی مستقیم آن شناسایی شدند. موقعیت های اتوبوس تمیز شده به خوبی با شبکه جاده مطابقت دارد.
از آنجایی که پردازش و تجزیه و تحلیل مسیرهای اتوبوس بر سفرها متمرکز است، ما به دنبال یافتن سفرهای فردی و اختصاص شناسه های منحصر به فرد به آنها هستیم. ما همچنین هر سفر را با جهت خود برچسب گذاری کردیم زیرا جهت سفر در مرحله تجزیه و تحلیل مهم است. گام بعدی پاکسازی سفرها با حذف سفرهای ناقص بود. ما سفرهایی را حذف کردیم که دارای شکاف بزرگی در فضا یا زمان بین هر دو موقعیت ثبت شده متوالی هستند. ما در نظر داریم که یک سفر باید با فاصله معقولی از اولین و آخرین ایستگاه اتوبوس در طول مسیر خود شروع و به پایان برسد. با بررسی نزدیکترین ایستگاه اتوبوس برای اولین و آخرین موقعیت در هر سفر، ما سفرهایی را که در شروع یا پایان ناقص بودند شناسایی و حذف کردیم. ما سفرهایی را بین ساعت 6:00 تا 23 در نظر گرفته ایم: 00 زیرا کاوش در داده ها به ما نشان داد که این دوره شامل تعداد کافی سفر برای هر روز مطالعه شده است. اطلاعات نهایی اتوبوس تمیز شامل 2249 سفر است که در 28 روز بین نوامبر 2012 و ژانویه 2013 انجام شده است. این دوره شامل سه روز (10، 14، و 24 نوامبر 2012) با رویدادهای بزرگ در استادیوم آویوا است.
4.2. استخراج تعاملات از داده های تحرک و زمینه رویدادهای بزرگ در استادیوم آویوا
برای استخراج فعل و انفعالات توقف ، از روش توضیح داده شده در بخش 3.2.1 پیروی کردیم . پس از آزمایش با ترکیبهای مقادیر پارامترهای مختلف برای تشخیص توقف آشکار (به عنوان مثال، توقفی که در آن چندین نقطه در پایان یک سفر ثبت میشود) ما 20 متر را به عنوان فاصله همسایگی و حداقل دو نقطه را برای خوشهبندی بر اساس تراکم انتخاب کردیم. با در نظر گرفتن دقت GPS 20 متری، متوجه شدیم که یک موقعیت GPS معمولی که در ایستگاه اتوبوس ثبت میشود، میتواند تا 20 متری ایستگاه اتوبوس خارج شود، بدون اینکه چیزی دور از ذهن باشد که باید دور انداخته شود. بنابراین، 20 متر را به عنوان پارامتر همسایگی در ایستگاههای اتوبوس انتخاب کردیم ( nParam). برای اطمینان از اینکه حتی توقف کوتاهی را تشخیص می دهیم، حداقل دو نقطه را برای خوشه بندی انتخاب کرده ایم، با توجه به اینکه نرخ نمونه برداری GPS 20 ثانیه نقاط زیادی را در ایستگاه اتوبوس ایجاد نمی کند. علاوه بر این، با همین هدف برای جلوگیری از توقف کوتاه مدت و بر اساس عقل سلیم، حداقل مدت توقف ( S دقیقه ) 10 ثانیه را انتخاب کردیم.
برای استخراج فعل و انفعالات نزدیک شدن و دور شدن ، از فاصله در طول مسیر از ایستگاه های اتوبوس مرجع همانطور که در بخش 3.2.1 توضیح داده شد استفاده کردیم . اگر فاصله از نقطه مرجع تا نقطه فعلی کوچکتر از فاصله تا نقطه قبلی است، نقطه فعلی در بخش نزدیک است، در غیر این صورت در بخش در حال دور شدن است . نمونه ای از نتیجه استخراج تعامل در شکل 4 نشان داده شده است . در بخش سفر نشان داده شده، هر موقعیت یا به عنوان بخشی از یک توقف یا به عنوان بخشی از یک توقف نزدیک یا به عنوان بخشی از یک توقف شناسایی شده است.حرکت دور توقف .
4.3. تحلیل فضایی-زمانی تعاملات برای زمینه رویدادهای بزرگ مقیاس در استادیوم آویوا
4.3.1. تشخیص زمان ورود و خروج
برای کشف یک رویداد و تخمین زمان شروع و پایان آن، الگوی کلی را در بازه زمانی 6:00 تا 23:00 در روزهای مختلف تجزیه و تحلیل می کنیم. برای این منظور، دوره را به فواصل 1 ساعته تقسیم می کنیم و سپس تعادل توقف ها (V) ، تعادل توقف های عادی (W) ، تعداد توقف ها در نزدیکی محل برگزاری (P) و تعداد عادی توقف ها در نزدیکی مکان (Q) برای هر بازه به دنبال روش توضیح داده شده در بخش 3.2.2 . از این مقادیر، ما مقادیر کران های بالا و پایین را به دنبال روشی که در بخش 3.2.2 توضیح داده شد، استخراج کردیم . ما از مقدار 1 به عنوان ضریب مقیاس (α) استفاده می کنیم. از آنجایی که باید از بالاترین و کمترین مقدار متغیر استفاده کنیمV ما هر دو کران بالا ( UV ) و کران پایین ( LV ) آن را محاسبه می کنیم. از سوی دیگر، ما فقط کران بالایی را برای P محاسبه میکنیم ، زیرا فقط باید از بالاترین مقادیر استفاده کنیم. شکل 5 تغییر P و متغیرهای مربوط به آن Q و UP را در یک روز نمونه بدون رویداد نشان میدهد در حالی که شکل 6 تغییر V و متغیرهای مربوط به آن W ، UV ، و LV را در همان روز نشان میدهد.
در مرحله بعد تغییرات زمانی این متغیرها را تحلیل می کنیم. از تغییر P با توجه به متغیرهای مرتبط آن، شاخصهای رویداد کاندید را دریافت میکنیم که باید با استفاده از تغییر V نسبت به متغیرهای مرتبط آن تأیید شوند. یعنی قلههای P که از مقادیر کران بالایی متناظر تجاوز میکنند، جداکنندههای رویداد کاندید در زمان (ورود و خروج) هستند. توجه به این نکته مهم است که اوج P نسبت به کران بالایی در نظر گرفته می شود. آن مربوط به بالاترین جابجایی بالای کران بالایی است (به عنوان مثال در شکل 8 را ببینید؛ اوج در ساعت 9:00 است و نه در 10:00). از مثال نشان داده شده در شکل 5، ما چهار تعیین کننده رویداد نامزد داریم: 10:00، 12:00، 15:00، و 19:00. برای هر نامزد، فاصله زمانی را از آخرین ساعت روز (قبل از آن) که در آن P زیر کران بالایی بود تا ساعت روز اول (بعد از نامزد) که در آن P زیر کران بالایی بود، در نظر می گیریم. این بازه به ما امکان می دهد تا عدم قطعیت های ناشی از جمع آوری داده ها را در فواصل 1 ساعته در نظر بگیریم. از این رو ما آن را “فاصله عدم قطعیت” می نامیم.
ما برای یک پیک در تغییر V (نگاه کنید به شکل 6 ) در بازه عدم قطعیت جستجو می کنیم. ما دو نوع قله را تشخیص می دهیم. اگر مقدار در یک زمان معین در بازه بیشتر از همه مقادیر قبلی و بعدی در بازه باشد، یک “اوج مثبت” داریم. اگر مقدار در یک زمان معین در بازه کمتر از همه مقادیر قبلی و بعدی در بازه باشد، “اوج منفی” داریم. زمان مربوط به یک اوج مثبت زمان ورود نامزد است زیرا مربوط به تعداد فوق العاده بالایی از توقف های نزدیک است . از سوی دیگر، زمان مربوط به “اوج منفی” زمان خروج نامزد است، زیرا مربوط به تعداد فوق العاده بالایی از توقف های حرکتی است .
هنگام جستجوی پیک ها در بازه عدم قطعیت، پیک یافت شده با سطح و نوع پیک خود برچسب گذاری می شود. این مقادیر برای تعیین نوع نامزد (زمان ورود، زمان خروج) و تأیید یا رد نامزد استفاده می شود. جستجو برای پیک در بازه عدم قطعیت یکی از هفت نتیجه ممکن زیر را به همراه دارد:
هر نامزدی که تأیید برای آن به نوع پیک = 0 (مورد 1) یا سطح اوج = 0 (موارد 2c و 3c) منجر شود، بلافاصله رد می شود. نامزدهای باقیمانده به ترتیب زمانی ترتیب داده شده اند.
ما در نظر می گیریم که در موردی که رویدادی رخ داده است، اوج مربوط به ورود شرکت کنندگان و به دنبال آن اوج مربوط به خروج آنها وجود دارد. بنابراین، اگر چنین ترتیبی وجود داشته باشد، وقوع رویداد در این روز را تأیید میکنیم و قلههای اصلی مربوط به دو نامزد را به ترتیب زمان ورود و خروج در نظر میگیریم. کاندیدهای باقیمانده (که تأیید برای آنها سطح اوج > 0 را ایجاد می کند، اما اوج بخشی از یک ترتیب ورود-خروج صحیح نیست ) موارد ناشناخته هستند. موارد ناشناخته مربوط به تحرک غیر طبیعی در مجاورت استادیوم است که نیاز به تجزیه و تحلیل بیشتر برای شناسایی علت دارد.
با استفاده از مثال نشان داده شده در شکل 5 و شکل 6 ، روش فوق را توضیح می دهیم. ما جداکننده رویداد نامزد را 10:00 در نظر می گیریم که به عنوان فاصله عدم قطعیت “9:00 تا 11:00” است ( شکل 5 را ببینید ). سپس، ما برای یک اوج در این بازه در تنوع تفاوت بین توقف های نزدیک و دور شدنی جستجو می کنیم ( شکل 6 را ببینید ). جستجو هیچ پیکی در این بازه پیدا نمیکند و بنابراین نوع پیک را صفر میکند، که نشان میدهد کاندید باید رد شود. دلیل این تصمیم این است که فاصله زمانی نمیتواند حاوی یک جداکننده رویداد باشد، اگر حاوی یک اوج در نزدیک شدن به توقف یا توقف نباشد.توقف های حرکتی روند تأیید همه نامزدها ادامه دارد.
در حالی که شکل 5 و شکل 6 کاربرد این روش تحلیل را برای یک روز بدون رویداد نشان می دهد، شکل 8 و شکل 9 کاربرد آن را برای داده های یک روز با وقوع یک رویداد نشان می دهد. همانطور که در شکل 8 مشاهده می شود، چهار جداکننده رویداد نامزد وجود دارد: 9:00، 13:00، 16:00، و 20:00 که در فواصل عدم قطعیت از 8:00 تا 11:00، 11:00 تا 14:00 قرار دارند. به ترتیب 15:00 تا 18:00 و 19:00 تا 21:00. جستجوی پیک ها در این فواصل از داده های ارائه شده در شکل 9به ترتیب سه قله مربوط به سه نامزد اول یافت شد، در حالی که هیچ قله ای برای آخرین نامزد یافت نشد. فواصل پیک ها به شرح زیر ارزیابی شد:
-
اوج در ساعت 9:00 در بازه زمانی 8:00 تا 11:00، نوع اوج: -1، سطح اوج: 0.667
-
اوج در ساعت 13:00 در بازه زمانی 11:00 تا 14:00، نوع پیک: 1، سطح پیک: 1
-
اوج در ساعت 16:00 در فاصله زمانی 15:00 تا 18:00، نوع اوج: −1، سطح اوج: 1
-
اوج ساعت 20:00 در بازه زمانی 19:00 تا 21:00، نوع پیک: 0
با اعمال روش تایید وقوع رویداد همانطور که قبلا توضیح داده شد، آخرین پیک بلافاصله رد می شود. سه نامزد باقی مانده یک توالی خروج-ورود-خروج را تشکیل می دهند . دو اوج آخر در سکانس (مربوط به ساعت 13:00 و 16:00) به ترتیب زمان ورود و خروج تایید شده است. فواصل اطراف این دو قله به عنوان ورودی به مرحله بعدی برای تجزیه و تحلیل بیشتر گرفته می شود. اوج ساعت 9:00 یک مورد ناشناخته است که نشان دهنده یک رویداد بزرگ در ورزشگاه نیست.
4.3.2. تجزیه و تحلیل الگوهای زمانی ورود و خروج
ما اقدام به انجام یک تجزیه و تحلیل محلی در سطح دانه بندی زمانی دقیق تر کردیم. برای این منظور، ما همان تحلیل را در مورد تعداد توقفها در نزدیکی محل برگزاری (یعنی ورزشگاه در این مورد) انجام دادیم. تجزیه و تحلیل بر روی فواصل زمانی حاوی زمان تایید شده ورود و خروج متمرکز است. ما هر بازه زمانی 1 ساعته را به چهار بازه فرعی 15 دقیقه ای تقسیم کردیم. شکل 10 تغییرات زمانی متغیرها را در فواصل کوچکتر حول زمان ورود و خروج نشان می دهد. این تجزیه و تحلیل به ما امکان می دهد تا پاسخ به سؤال تخمین زمان شروع و پایان رویداد را با فرض اینکه بالاترین اوج مربوط به شروع یا پایان رویداد است، اصلاح کنیم. از شکل 10a می بینیم که زمان شروع تخمین زده شده در مرحله قبل 13:00 حدود ساعت 13:30 است. به طور مشابه، شکل 10 ب اصلاح زمان پایان را از ساعت 16:00 تا حدود 16:15 نشان می دهد.
تجزیه و تحلیل بیشتر الگوهای زمانی ورود و خروج شرکت کنندگان در رویداد را نشان می دهد. الگوی زمانی ورود ارائه شده در شکل 10 a نشان می دهد که برخی از شرکت کنندگان رویداد قبل از زمان شروع رویداد زودتر وارد شده اند، همانطور که با قله های کوتاه تر که از حد بالایی بین ساعت 11:00 تا 13:00 فراتر می روند، نشان داده شده است. پس از شروع رویداد (تقریباً پس از 15 دقیقه) تعداد توقفها در محل به شدت به زیر حد بالایی کاهش یافت و تقریباً عادی شد. این نشان می دهد که به طور کلی شرکت کنندگان در رویداد به موقع می آمدند. الگوی زمانی حرکت نشان داده شده در شکل 10 ب نشان می دهد که کمتر از 30 دقیقه پس از پایان رویداد برای توقف ها طول کشیده است.در نزدیکی محل برگزاری برای بازگشت به حالت عادی، به این معنی که شرکت کنندگان در رویداد پس از پایان رویداد زمان زیادی را در محل سپری نکردند.
رویدادهای بزرگ مختلف ممکن است الگوهای زمانی متفاوتی از ورود و خروج شرکت کنندگان را نشان دهند. برای مثال، بر خلاف شرکت کنندگان رویداد در 24 نوامبر 2012 که به موقع رسیدند و به محض پایان رویداد رفتند (شکل 10 را ببینید )، شرکت کنندگان در رویداد در 14 نوامبر 2012 همچنان پس از شروع رویداد به آنجا میرسند. با تعداد توقفهایی که در نزدیکی محل برگزار میشوند که برای مدتی پس از اوج در بالای محدوده بالایی باقی ماندهاند نشان داده شده است ( شکل 11 a را ببینید). شرکت کنندگان رویداد اخیر نیز به تدریج ترک کردند، همانطور که با تعداد توقف ها در نزدیکی محل برگزاری، که در یک فاصله زمانی طولانی پس از اوج بالاتر از حد بالایی باقی ماندند، نشان داده شده است ( شکل 11 ب را ببینید).
4.4. مطالعه موردی 2: تحرک انسان و زمینه رویدادهای مقیاس متوسط در سالن کنسرت ملی
ما مطالعه موردی دوم را با همان مراحلی که در بخش 4.2 به تفصیل توضیح داده شده است، انجام دادیم . از آنجایی که اکثر رویدادها هر هفته در یک ساعت از یک روز برگزار میشد، نمیتوانستیم شرایط عادی را برای آنها الگوبرداری کنیم و به همین دلیل روزهای آنها را مطالعه نکردیم. روز 17 نوامبر 2012 که در آن رویدادی در ساعتی متفاوت (2:30 بعد از ظهر) در مقایسه با روزهای دیگر (8:30 بعد از ظهر) سازماندهی شد، در اینجا به عنوان نمونه ای از نتایج نمونه ارائه شده است. شکل 12 تغییر تعداد توقف های اتوبوس در همسایگی محل برگزاری را نشان می دهد در حالی که شکل 13 تغییر تعادل بین تعداد توقف های نزدیک و توقف های در حال حرکت را نشان می دهد.. زمان وقوع رویداد کاندید در ساعت 15:00 (به اوج در شکل 12 مراجعه کنید ) تأیید شد که شروع یک رویداد است (به اوج مثبت در بازه عدم قطعیت مربوطه در شکل 13 مراجعه کنید) که از طریق تجزیه و تحلیل فاصله عدم قطعیت پالایش شد. در سطح دانه بندی ریزتر ( شکل 14 را ببینید ).
از شکل 14 متوجه می شویم که برخی از شرکت کنندگان در رویداد زودتر از موعد حضور پیدا کردند (قله های کوچک را در حدود 14:15 و 14:45 ببینید) اما تعداد بیشتری در حدود ساعت 15:45 دیر رسیدند. دومین اوج کوچکی که در ساعت 21:00 شناسایی شد ( شکل 12 را ببینید ) و تایید شد (به اوج در ساعت 21:00 در شکل 13 مراجعه کنید ) مربوط به رویداد دومی است که در ساعت 20:30 همان روز سازماندهی شد. همانطور که از شکل 12 مشاهده می شود، این رویداد دوم به سختی شناسایی می شود. با توجه به اینکه در این ساعت محل برگزاری (تقریباً) همیشه رویدادهایی دارد، دلیل ممکن است مشکل روش شناسی برای به دست آوردن یک مدل خوب از الگوی حرکت عادی در این ساعت باشد. همچنین می تواند به دلیل تعداد کمی از افرادی باشد که به دلیل اهمیت کمتری که به آن نسبت داده می شود برای شرکت در این رویداد نقل مکان کرده اند یا برخی از شرکت کنندگان پس از حضور در اولین رویداد می مانند و در نتیجه حرکت نمی کنند. مانند مطالعه موردی اول، ما عدم وجود رویدادها را شناسایی کردیم (به عنوان مثال، در 28 نوامبر 2012)، اما این نتایج به دلیل محدودیت فضا به صورت گرافیکی در اینجا ارائه نشده است. در مقایسه با رویدادهای مقیاس بزرگ در مطالعه موردی اول، تشخیص یک رویداد در مقیاس متوسط مانند این مطالعه موردی دوم دشوارتر است (هم شروع و هم پایان)،
5. بحث
کاربرد روش پیشنهادی بر روی دادههای واقعی نشان میدهد که این روش پتانسیل پاسخگویی به سؤالات مربوط به وقوع یک رویداد بزرگ، تخمین زمان شروع و پایان آن، و نشان دادن الگوهای زمانی پیرامون ورود و خروج شرکتکنندگان در رویداد را دارد. نتایج بهدستآمده در آزمایشها با اطلاعات مربوط به وقوع رویدادهای بزرگ در طول دوره مورد مطالعه مقایسه شده است (به عنوان مثال، جدول 1 را ببینید.). اگرچه تنها سه رویداد بزرگ در طول دوره مورد مطالعه ما در ورزشگاه رخ داد، نتایج به دست آمده از دو مطالعه موردی متفاوت امیدوارکننده است. دو مورد از سه رویداد در ورزشگاه با موفقیت کشف شد در حالی که مورد سوم به عنوان یک مورد ناشناخته طبقه بندی شد که نیاز به تحلیل بیشتری دارد. در مطالعه موردی دوم، دو روز را برای وقوع حوادث در مقیاس متوسط مورد آزمایش قرار دادیم و اتفاقاتی را که در یکی از آنها رخ داده بود، پیدا کردیم. در هر دو مطالعه موردی، روش قادر به تایید عدم وجود رویداد در روزهای بدون رویداد بود.
برای تخمین زمان شروع و پایان رویداد، روش فواصل زمانی را در نظر گرفت که در آن تعداد توقفها در نزدیکی محل برگزاری به طور استثنایی بیشتر از مقدار عادی آن بود. علاوه بر این، ما فرض کردیم که اوج (یعنی بالاترین تغییر از مقدار نرمال) مربوط به زمان شروع یا پایان رویداد است. مقایسه نتایج با حقیقت زمینی ( به عنوان مثال جدول 1 را ببینید ) نشان می دهد که خطای این تخمین بین 15 تا 30 دقیقه است. با توجه به اینکه رویدادها حداقل 1 ساعت و 30 دقیقه به طول انجامید و ما داده ها را در فواصل زمانی 15 دقیقه جمع آوری کردیم، این تخمین را قابل قبول و قابل استفاده می دانیم.
این روش برای بررسی الگوهای زمانی ورود و خروج شرکتکنندگان در رویداد، تجزیه و تحلیل محلی را در سطح دانهبندی زمانی دقیقتر انجام داد. این روش میتوانست شرکتکنندگانی را که کمی قبل از شروع رویداد میآمدند، علیرغم باز شدن پایههای اولیه، و مواردی که آنها به تدریج پس از پایان رویداد ترک میکردند، شناسایی میکرد که به برگزاری جشن احتمالی در محل قبل از حرکت اشاره میکرد. از این الگوهای زمانی، در صورت موجود بودن دادههای رویداد بیشتر، میتوان ویژگیهای انواع رویدادهای خاص را کشف کرد. برای مثال، میتوانیم الگوهای زمانی مرتبط با یک مسابقه راگبی (به عنوان مثال، شکل 10 را ببینید ) با الگوهای مرتبط با یک مسابقه فوتبال مقایسه کنیم (به عنوان مثال، شکل 11 را ببینید.) و برخی ویژگی های خاص این دو نوع رویداد را تعیین کنید. برای ارزیابی این الگوهای زمانی، توزیع زمانی عکسهای فلیکر را که در روزهایی که رویدادها و بررسیهای چهار ضلعی همان دوره را شناسایی کردیم، گرفته شدهاند، بررسی کردیم. توزیع این داده ها از نظر تعداد آیتم ها و برچسب های مربوطه با نتایج مطالعات موردی استادیوم مطابقت داشت، در حالی که ما هیچ داده ای برای مورد سالن کنسرت پیدا نکردیم.
یک کلید برای کاربرد موفقیت آمیز روش، نتیجه استخراج تعاملات متوقف شده است . این مرحله برای تشخیص زمانی که وسیله نقلیه حداقل برای مدت زمان مشخصی در همسایگی یک نقطه توقف مانده است، به تعدادی پارامتر متکی است. مقادیر این پارامترها پس از چند آزمایش برای یافتن مقادیر بهینه تنظیم شده است. با این حال، تجزیه و تحلیل حساسیت گسترده مقادیر پارامتر در یک مجموعه داده متفاوت می تواند در تنظیم مقادیر بهینه کمک کند.
ما پیشبینی میکنیم که روش پیشنهادی با توجه به توانایی آن برای در نظر گرفتن موردی که در آن رویداد متوسط یا بزرگ دیگری تقریباً در همان زمان در نزدیکی محل برگزاری رویداد تحت نظارت (استادیوم یا سالن کنسرت در موارد مثال ما) اتفاق میافتد، محدودیت داشته باشد. ). ما انتظار داریم که در چنین حالتی، وقوع رویداد دیگر ممکن است بر تعداد توقفها تأثیر بگذاردبه رویداد اصلی نسبت داده می شود، و شناسایی دو زمان در نظر گرفته شده به عنوان زمان ورود و خروج برای رویداد را دشوارتر می کند. با این حال، چنین مواردی که دو رویداد در مقیاس بزرگ یا متوسط در مجاورت یکدیگر و تقریباً در یک زمان اتفاق میافتند، بسیار نادر هستند. یک مشاهده کلی از مقایسه دو مطالعه موردی ما این است که هر چه رویداد بزرگتر باشد، توسط روش شناسی آسانتر تشخیص داده می شود.
یکی دیگر از محدودیت های روش این است که نمی توان آن را به طور کامل در مورد مسیر دایره ای که همیشه در یک جهت طی می کند، اعمال کرد. در این مورد، روششناسی قادر خواهد بود تا وقوع رویدادهای نامزد را تشخیص دهد، اما نمیتواند آنها را تأیید کند یا تجزیه و تحلیل بیشتری را همانطور که توضیح دادیم انجام دهد. در چنین حالتی روش شناسی را می توان با استفاده از داده های رسانه های اجتماعی تکمیل کرد که در آن سایر مراحل تجزیه و تحلیل از طریق معناشناسی مرتبط (مثلاً در عناوین، توضیحات و برچسب ها) امکان پذیر خواهد بود. با این وجود، روش ما می تواند نقش محدود کردن دوره جستجو را به یک بازه زمانی کوچک ایفا کند.
این روش علاوه بر پشتیبانی از درک الگوهای ورود و خروج شرکت کنندگان در رویداد، اطلاعاتی در مورد تأثیر رویداد بر تحرک در طول مسیر ارائه می دهد. فرض بر این است که اتوبوس لزوماً در هر نقطه توقف تعیین شده توقف نمی کند. در بیشتر موارد فقط زمانی متوقف می شود که مسافرانی وجود داشته باشند که نیاز به پیاده شدن یا سوار شدن دارند. در نتیجه، توقف در (تقریبا) هر ایستگاه اتوبوس، همانطور که ممکن است در زمان یک رویداد در مسیری که محل برگزاری رویداد را ارائه می دهد، ممکن است باعث تاخیر در سفرها شود. دانستن اینکه اتوبوس هر چند وقت یکبار توقف میکند و اتوبوس در جایی که توقف مکرر واقعاً اتفاق میافتد، میتواند در برنامهریزی یک خط اضافی یا اتوبوسهای اضافی برای پاسخ به تقاضای افزایش تحرک ناشی از این رویداد مفید باشد. یکی از مشکلات مطالعه ما در حال حاضر این است که چنین اطلاعاتی برای یک خط اتوبوس ارائه می شود. ما تصدیق می کنیم که این روش باید حوزه وسیع تری را برای حمایت از مسائل برنامه ریزی بزرگتر پوشش دهد. در این جهت، روش را می توان با تکرار موثر فرآیند در چندین خط اتوبوس گسترش داد. با این حال، در مورد تشخیص رویداد، این روش برای کار بر روی رویدادهای مقیاس بزرگ تنها با یک مکان از پیش تعریف شده طراحی شده است. برای رویدادهای مقیاس کوچک، روشهای دیگری مانند روشهایی که مبتنی بر دادههای رسانههای اجتماعی هستند [ این روش برای کار بر روی رویدادهای مقیاس بزرگ تنها با مکان از پیش تعریف شده طراحی شده است. برای رویدادهای مقیاس کوچک، روشهای دیگری مانند روشهایی که مبتنی بر دادههای رسانههای اجتماعی هستند [ این روش برای کار بر روی رویدادهای مقیاس بزرگ تنها با مکان از پیش تعریف شده طراحی شده است. برای رویدادهای مقیاس کوچک، روشهای دیگری مانند روشهایی که مبتنی بر دادههای رسانههای اجتماعی هستند [12 ] قابل استفاده است.
برای پشتیبانی بهتر از برنامههای کاربردی برنامهریزی، روش باید برای ارائه اطلاعات غنیتر بهبود یابد. برای این منظور، ما قصد داریم از ترکیب تعداد و مدت توقف و اطلاعات معنایی دادههای رسانههای اجتماعی استفاده کنیم. تا کنون از تعداد توقف ها به تنهایی استفاده کرده و مدت توقف را به عنوان جایگزین امتحان کرده ایم، اما هیچ تفاوتی در نتایج پیدا نکردیم. ما فکر میکنیم که ترکیب این دو ویژگی و معناشناسی دادههای رسانههای اجتماعی میتواند اطلاعات غنیتری ارائه کند و میزان موفقیت روش را بهبود بخشد.
مزیت روش ما این است که از دادههایی با دقت مکانی و زمانی بالا استفاده میکند که در مقایسه با ردپای تلفن همراه یا آثار خودروهای شخصی که در کارهای مرتبط استفاده میشوند، راحتتر جمعآوری و به دست میآیند. علاوه بر این، روش ما تجزیه و تحلیل را در سطوح دانه بندی زمانی چندگانه برای کشف الگوهای جهانی و محلی انجام می دهد، ویژگی که در تجزیه و تحلیل داده های تحرک بسیار مهم است همانطور که در [ 1 ، 26 ] بحث شد.
6. نتیجه گیری و کار آینده
تجزیه و تحلیل داده های تحرک توجه مهمی را به خود جلب کرده است، اما کمتر برای در نظر گرفتن زمینه حرکت انجام شده است. به عنوان کمکی به پر کردن این شکاف، این مقاله روشی را برای ادغام عناصر بافت جغرافیایی در تجزیه و تحلیل داده های تحرک پیشنهاد کرد. عناصر بافت جغرافیایی که ما در نظر گرفتیم رویدادهای بزرگ و نقاط توقف شناخته شده در طول مسیر به دنبال شی متحرک هستند. این روش شامل استخراج سه نوع تعامل بین شی متحرک و عناصر زمینه است: نزدیک شدن به رویداد، دور شدن از رویداد، توقف.(در رویداد، و در یک نقطه توقف شناخته شده)، و تجزیه و تحلیل این تعاملات برای کشف وقوع یک رویداد بزرگ و کشف پویایی آن. پس از آزمایش روش بر روی دادههای واقعی، نتیجه میگیریم که میتوان با موفقیت از دادههای تحرک، وقوع یک رویداد بزرگ در یک مکان خاص شناخته شده را شناسایی کرد، زمان شروع و پایان آن را در برخی از حاشیههای خطا تخمین زد و الگوهای زمانی مرتبط را آشکار کرد. با ورود و خروج شرکت کنندگان در رویداد.
روش پیشنهادی پتانسیل برای کاربردهای عمدتاً در برنامه ریزی و مدیریت حمل و نقل و رویداد دارد. همانطور که توسط Calabrese و همکاران نشان داده شده است. [ 7]، احتمالاً افرادی از همان مناطق در همان نوع رویدادها شرکت می کنند. ما یافتههای آنها را اینطور تعمیم میدهیم که این شرکتکنندگان رویداد احتمالاً رفتار یکسانی در مورد شرکت در رویدادها دارند، زیرا شرکتکنندگان رویدادهایی از همان نوع از مناطق یکسان احتمالاً افراد مشابهی را تا حد زیادی شامل میشوند. بنابراین، دانش در مورد رفتار شرکت کنندگان در یک رویداد می تواند به بهبود برنامه ریزی منابع و استفاده از رویدادهای آینده از همان نوع کمک کند. به عنوان مثال، آگاهی از زمان نسبی که در آن نیاز به حمل و نقل افزایش می یابد و سرعت شرکت کنندگان در رویداد در پایان رویداد محل برگزاری را ترک می کنند، به برنامه ریزی کنترل حمل و نقل عمومی و امنیت کمک می کند.
ملاحظات برای کار آینده شامل جمعآوری مجموعه دادههای حقیقت زمینی بزرگتر، ارزیابی دقیق میزان موفقیت روش، و یکپارچهسازی استفاده از دادههای رسانههای اجتماعی برای بهبود میزان موفقیت در تشخیص رویداد و گسترش کاربردپذیری است.
بدون نظر