نقشه راه GIS

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

کاربرد جی ای اس

 

خلاصه

درک الگوهای تحرک انسانی برای برنامه ریزی شهری، مدیریت ترافیک و حتی کمپین بازاریابی از اهمیت بالایی برخوردار است. با این حال، توانایی ثبت حرکات دقیق انسان با دانه بندی مکانی و زمانی ریز هنوز محدود است. در این مطالعه، ما داده‌های تحرک با وضوح بالا را از مجموعه‌ای از بیش از 1.3 میلیارد پیام توییتر در موقعیت جغرافیایی استخراج کردیم. با توجه به نگرانی‌های مربوط به نقض حریم خصوصی افراد، مانند سوابق تماس تلفن همراه با دسترسی محدود، مجموعه داده از جریان‌های داده توییتر در دسترس عموم جمع‌آوری می‌شود. در این مقاله، ما از یک رویکرد تحلیلی بصری برای مطالعه الگوهای حرکتی کاربر توییتر فضایی-زمانی چند مقیاسی در ایالات متحده در طول سال 2014 استفاده کردیم. رویکرد ما شامل یک چارچوب تجزیه و تحلیل بصری مقیاس‌پذیر برای ارائه کارایی و مقیاس‌پذیری در فیلتر کردن حجم زیادی از توییت‌های موقعیت جغرافیایی، مدل‌سازی و استخراج حرکات کاربر توییتر، ایجاد مسیرهای کاربر فضا-زمان، و خلاصه‌سازی الگوهای حرکتی کاربر در مقیاس‌های مختلف مکانی-زمانی بود. ما مجموعه‌ای از تحلیل‌های آماری را برای درک الگوهای تحرک کاربر توییتر در مقیاس‌های فضایی چند سطحی و محدوده‌های زمانی انجام دادیم. به طور خاص، الگوهای تحرک کاربر توییتر که با جابجایی و شعاع چرخش افراد اندازه‌گیری شد، الگوهای تحرک کاربر توییتر چند مقیاسی یا چند وجهی را نشان داد. با مطالعه بیشتر چنین الگوهای تحرکی در محدوده های زمانی مختلف، هم نوسانات ثبات و هم نوسانات فصلی را در رابطه با اثرات زوال فاصله در الگوهای تحرک مربوطه شناسایی کردیم. همزمان،
کلید واژه ها: 

توییت های موقعیت جغرافیایی ؛ الگوهای تحرک ؛ تجزیه و تحلیل فضایی-زمانی چند مقیاسی ; چارچوب تحلیلی بصری مقیاس پذیر

 

1. معرفی

درک الگوهای تحرک انسانی برای طیف وسیعی از کاربردها از برنامه ریزی شهری [ 1 ]، مدیریت ترافیک [ 2 ] و حتی گسترش فضایی بیماری های همه گیر [ 3 ] اهمیت زیادی دارد. تلاش‌های تحقیقاتی قبلی بر داده‌های تحرک با وضوح پایین برای درک الگوهای تحرک انسانی، مانند استفاده از سوابق سرشماری برای مطالعه الگوهای مهاجرت انسان [ 4 ]، یا ارائه پرسش‌نامه‌ها و درخواست از داوطلبان برای گزارش مسیر اسکناس‌ها برای استنباط الگوهای سفر انسان [ 5] متکی بود.]. با این حال، چنین داده‌های تحرکی، حرکات انسانی دقیق با دانه‌ریزی مکانی و زمانی را که معمولاً جمع می‌شوند و بنابراین محدود به الگوهای تحرک افراد است، ارائه نمی‌کنند [ 6 ، 7 ]. علاوه بر داده‌های تحرک جمع‌آوری‌شده توسط ردیاب‌های GPS [ 1 ، 8 ] و سوابق تماس‌های تلفن همراه [ 6 ، 9 ، 10 ]، پلت‌فرم‌های فراگیر رسانه‌های اجتماعی مبتنی بر مکان (LBSM) امروزی (به عنوان مثال، توییتر) به عنوان یک منبع داده تحرک جدید در حال ظهور هستند. و Foursquare) جریان‌های داده‌های بزرگ فضایی را با مقدار انبوهی از ردپای دیجیتالی کاربر با جزئیات و اغلب به‌روزرسانی‌شده در قالب ردپای و ردپای کاربر در دنیای واقعی ارائه می‌دهند [ 11]]. یک مزیت مهم استفاده از جریان های داده LBSM به عنوان پروکسی برای مطالعه الگوهای تحرک انسان، پوشش فضایی زیاد است. به عنوان مثال، محققان از توییت‌های موقعیت جغرافیایی برای مطالعه الگوهای تحرک جهانی [ 12 ] استفاده کرده‌اند که در غیر این صورت برای سایر مجموعه‌های داده تحرک غیرممکن است (به عنوان مثال، ردیابی GPS و سوابق تماس تلفن همراه). با توجه به نگرانی‌های مربوط به نقض حریم خصوصی افراد، مانند سوابق تماس تلفن همراه با دسترسی محدود [ 7 ، 13 ، 14 ]، جریان‌های داده LBSM در دسترس عموم فرصت‌های منحصربه‌فردی را برای انجام یافته‌های علمی تکرارپذیر و مقایسه‌ای در مناطق مختلف جغرافیایی ارائه می‌دهند.
بسیاری از مطالعات اخیر از جریان های داده LBSM برای مطالعه الگوهای تحرک انسان استفاده کرده اند. برای مثال، آنها مسیرهای افراد را مدل‌سازی و استخراج کردند و تجزیه و تحلیل آماری را با تمرکز بر اثرات کاهش فاصله در حرکات جمعی کاربر انجام دادند [ 6 ]، که برای آشکار کردن حالت‌های مختلف سفر [ 7 ]، تقاضاهای سفر [ 15 ، 16 ] و استفاده شد. تأثیر ارتباطات اجتماعی [ 17]. این مطالعات پشتیبانی قوی برای استفاده از داده های LBSM به عنوان پروکسی برای مطالعه الگوهای تحرک افراد و بینش های ارزشمند در مورد پویایی تحرک انسان ارائه کرده است. با این حال، تغییرات حرکات در مقیاس‌های مکانی و محدوده‌های زمانی مختلف در این مطالعات نادیده گرفته می‌شوند، جایی که اندازه‌گیری‌های فواصل یا در یک محدوده زمانی مشخص یا در یک منطقه جغرافیایی خاص ثابت می‌شوند. برای مثال، بررسی‌ها در مورد اینکه آیا تغییرات زمانی (مثلاً ماهانه یا فصلی) در حرکات وجود دارد یا خیر، یا اینکه چگونه الگوهای تحرک مشاهده‌شده در مقیاس‌های مختلف فضایی (مثلاً سطوح درون شهری یا بین‌شهری یا ملی) متفاوت است، وجود ندارد. چنین بینش هایی برای پیشبرد درک ما از الگوهای تحرک جمعی برای کاربردهای مختلف، مانند بررسی الگوهای تحرک در شهرهای مختلف، حیاتی هستند.18 ، الگوهای گسترش بیماری [ 19 ، 20 ] و فعالیت های توریستی [ 12 ]. از سوی دیگر، در حالی که سوابق مکانی-زمانی با وضوح بالا از LBSM فرصت‌های تحقیقاتی منحصربه‌فردی را در این راستا ارائه می‌دهند، حجم داده‌های بزرگ ذاتی چالش‌های مهمی را برای توسعه روش‌های تحلیل فضایی-زمانی چندمقیاس برای مقابله با پیچیدگی‌های حرکات فیلتر کردن ایجاد می‌کند. افراد، مدل سازی و تجمیع مسیرهای کاربر در مقیاس های مکانی و زمانی متعدد [ 21 ].
در این مقاله، ما از یک رویکرد تحلیلی بصری برای بررسی الگوهای تحرک کاربر توییتر در مقیاس‌های فضایی چند سطحی و محدوده زمانی در ایالات متحده (به استثنای آلاسکا و هاوایی) در طول سال 2014 استفاده کرده‌ایم. داده‌های تحرک عبارتند از استخراج شده از بیش از 1.3 میلیارد پیام توییتر در موقعیت جغرافیایی (یعنی توییت ها) از 1 ژانویه تا 31 دسامبر 2014 در آمریکای شمالی با بیش از 6 میلیون کاربر توییتر و حجم داده بیش از 1 ترابایت. برای رسیدگی به چالش فشرده داده‌ای که در این مجموعه داده تعبیه شده است، ما یک چارچوب تجزیه و تحلیل بصری مقیاس‌پذیر را ایجاد کرده‌ایم که برای گنجاندن حجم زیادی از توییت‌های موقعیت جغرافیایی طراحی شده است. این چارچوب بر اساس محیط محاسباتی توزیع شده با عملکرد بالا با استفاده از Apache Hadoop ( http://hadoop.apache.org/ ) پیاده سازی شده است.) که یک چارچوب نرم افزار منبع باز است که پردازش توزیع شده مجموعه داده های بزرگ را در میان خوشه های محاسباتی امکان پذیر می کند. با فعال‌سازی این چارچوب، مجموعه‌ای از تحلیل‌های آماری را برای درک الگوهای حرکتی کاربر توییتر فضایی-زمانی چند مقیاسی انجام داده‌ایم. ما تعداد بازدید کاربران توییتر از مکان‌های مختلف را مدل‌سازی کرده‌ایم تا رفتارهای بازدید جمعی کاربر را مطالعه کنیم، جایی که شباهت‌های زمانی در توزیع‌ها را شناسایی کرده‌ایم. به طور خاص، الگوهای تحرک کاربر توییتر اندازه‌گیری شده با جابجایی کاربر و شعاع چرخش افراد [ 6 ] گروه‌های مختلفی از کاربران توییتر را با الگوهای تحرک چندمقیاس یا چند وجهی و حالت‌های سفر چندگانه نشان داده است [ 7] .]. با مطالعه بیشتر چنین الگوهای تحرک در محدوده های زمانی مختلف، ما هم نوسانات ثبات و هم نوسانات فصلی را در رابطه با اثرات زوال فاصله در الگوهای تحرک مربوطه شناسایی کرده ایم. علاوه بر این، رویکرد ما یک رابط نقشه برداری وب کره مجازی سه بعدی تعاملی را فراهم می کند تا تجزیه و تحلیل های اکتشافی جغرافیایی بصری را برای درک دقیق جریان های حرکت کاربر توییتر در یک مقیاس فضایی و پنجره زمانی معین فراهم کند.
ادامه این مقاله به شرح زیر سازماندهی شده است. بخش 2 کار مرتبط را در زمینه مطالعه الگوهای تحرک با استفاده از داده های LBSM، به ویژه داده های توئیتر با موقعیت جغرافیایی توصیف می کند. ما بر چالش‌های پژوهشی در استفاده از روش‌های تحلیل بصری تمرکز می‌کنیم تا تجزیه و تحلیل فضایی-زمانی چند مقیاسی را با مجموعه داده‌های حرکتی عظیم، از جمله مدیریت داده‌ها، مدل‌سازی مسیر کاربر فضایی-زمانی چند سطحی و تجسم فعال کنیم. بخش 3 جزئیات فرآیندهای استخراج، تجمیع و خلاصه سازی الگوهای حرکتی چندسطحی فضایی-زمانی کاربر توییتر را شرح می دهد. بخش 4مطالعه موردی انجام تجزیه و تحلیل بصری برای جستجوی الگوهای تحرک فضایی-زمانی چند مقیاسی توییتر در ایالات متحده در سال 2014 ارائه می‌کند. بخش 5 مقاله را به پایان می‌رساند.

2. الگوهای تحرک در داده های رسانه های اجتماعی مبتنی بر مکان

2.1. داده های توئیتر با موقعیت جغرافیایی برای مطالعه حرکات کاربران در مقیاس بزرگ

برای درک دقیق الگوهای تحرک افراد، توانایی ثبت حرکات انسانی با دانه بندی ریز مکانی و زمانی بسیار مهم است. در این ارتباط، استفاده از ردیاب‌های GPS تا به امروز، دقیق‌ترین رکوردها را از حرکات افراد در رابطه با دقت مکان‌های کاربر ثبت‌شده و فرکانس به‌روزرسانی تولید می‌کند [ 1 ]. با این حال، چنین داده‌هایی اغلب در مقیاس فضایی (مثلاً در یک شهر یا منطقه خاص) از یک گروه کوچک از مردم محدود می‌شوند، برای مثال، 226 و 182 داوطلب در جمع‌آوری داده‌های تحرک در [8] و [22] شرکت کردند .] به ترتیب. به غیر از ردیابی مستقیم افراد، ردیابی های GPS مبتنی بر وسیله نقلیه اغلب به وسایل نقلیه خاصی (مثلاً تاکسی) گره خورده است که فقط برای گروه خاصی از افراد قابل دسترسی است [10 ] .
رویکرد دیگر از متون برای مطالعه تحرک انسان، استفاده از داده‌های تماس تلفن همراه است، مانند سوابق جزئیات تماس (CDR)، که در آن مکان‌های کاربران تلفن همراه توسط مثلث‌سازی برج‌های سلولی با دقتی در حد کیلومتر تخمین زده می‌شود [ 6 ، 9 ، 10 ]. چنین مجموعه داده ای می تواند مقیاس فضایی نسبتاً بزرگ [ 23 ، 24 ] (به عنوان مثال، سطح ملی) و بخش بزرگی از جمعیت در منطقه مورد مطالعه را پوشش دهد [ 10]]. با این حال، به دلیل نگرانی های مربوط به نقض حریم خصوصی افراد، داده های تماس تلفن همراه به هیچ وجه در دسترس عموم نیست. حتی چنین داده هایی در مطالعات ذکر شده به دست آمده است، آنها از ارائه دهندگان خدمات مختلف که گروه های مختلف کاربران را پوشش می دهند، به دست آمده اند. این مسائل توانایی انجام یافته های علمی قابل تکرار برای تحقیقات تحرک، مانند اعتبار یا گسترش اکتشافات موجود را محدود می کند.
در این ارتباط، استفاده از داده‌های تحرک در دسترس عموم که از پلتفرم‌های رسانه‌های اجتماعی مبتنی بر مکان (LBSM) فراگیر امروزی (مثلاً Foursquare و Twitter) گرفته شده است، به طور فزاینده‌ای محبوب می‌شود. LBSM به کاربران امکان می دهد مکان فعلی خود را به عنوان یک برچسب جغرافیایی به پیامی که ارسال می کنند متصل کنند، که از موقعیت یابی GPS یا Wi-Fi با وضوح موقعیت بالا تا 10 متر مشتق شده است [7 ]]. یک سناریوی کلان داده زمانی پدیدار می‌شود که میلیون‌ها کاربر رسانه‌های اجتماعی دائماً پیام‌هایی ارسال می‌کنند. در این مطالعه، داده‌های توئیتر با موقعیت جغرافیایی به عنوان منبعی برای مطالعه الگوهای تحرک دقیق انتخاب شده‌اند. در مقایسه با سایر پلتفرم‌های LBSM، توییتر یکی از محبوب‌ترین پلتفرم‌ها است و به طور فعال در بسیاری از کشورها استفاده می‌شود. این یک API جریان قابل دسترسی برای عموم برای دسترسی آسان به داده ها فراهم می کند [ 25 ]. در واقع، بسیاری از داده های LBSM دیگر را می توان از جریان های داده جمع آوری کرد، مانند داده های چک در چهار ضلعی [ 16 ، 26 ].
با این حال، شایان ذکر است که برخی محدودیت ها و پیچیدگی ها در استفاده مستقیم از داده های LBSM برای مطالعه الگوهای تحرک انسان وجود دارد. به عنوان مثال، در مقایسه با ردیابی های GPS، فرکانس به روز رسانی مکان یک فرد بسته به زمانی که کاربر در حال ارسال یک پیام موقعیت جغرافیایی جدید یا اعلام حضور در یک مکان جدید است، متفاوت است. اگرچه توییت های موقعیت جغرافیایی تمایل به ارائه مکان های جغرافیایی با وضوح موقعیت بالا همانطور که در بالا ذکر شد [ 7]، اطلاعات مربوط به کیفیت مکان های جغرافیایی در هر توییت وجود ندارد. این امر به عدم قطعیت در محاسبه فاصله حرکات کاربران توییتر، به ویژه در محیط های متراکم کمک می کند. همچنین یک عدم تطابق بالقوه در مورد نماینده جمعیت کلی وجود دارد، زیرا همه افراد از رسانه های اجتماعی استفاده نمی کنند یا پیام های موقعیت جغرافیایی ارسال نمی کنند [ 10 ]، اطلاعات جمعیت شناختی کاربران توییتر را نمی توان به راحتی شناسایی کرد. الگوهای تحرک مشتق شده ممکن است منجر به نمایش بیش از حد یا کمتر از الگوهای تحرک انسان در دنیای واقعی شود. بسیاری از مطالعات شروع به بررسی اطلاعات جمعیت شناختی داده های LBSM، به ویژه داده های توییتر کردند [ 27 ، 28]]. اگرچه روش‌های مورد استفاده هنوز قابل بحث هستند، اما مطمئناً این مسائل ما را ملزم می‌کند تا معیارهای سخت‌گیرانه‌تری را در درک الگوهای تحرک انسانی با استفاده از داده‌های توئیتر در موقعیت جغرافیایی تعیین کنیم. از سوی دیگر، مجموعه داده های توئیتر با موقعیت جغرافیایی، مزایای منحصر به فردی را ارائه می دهد که آن را به یک پروکسی ارزشمند برای مطالعه الگوهای تحرک انسان تبدیل می کند. به عنوان مثال، اطلاعات موقعیت مکانی با وضوح بالا، امکان شناسایی حالت های سفر چندگانه در الگوهای تحرک کاربر را فراهم می کند [ 7 ]. پوشش فضایی بزرگ امکان مطالعه الگوهای تحرک جهانی را فراهم می کند [ 12]، که برای سایر مجموعه داده های تحرک تقریبا غیرممکن است. مهمتر از آن، با نظارت مداوم بر جریان‌های داده‌های توییتر در موقعیت جغرافیایی با حجم زیادی از سوابق مکانی-زمانی دقیق و مکرر به روز شده کاربران توییتر، پتانسیل زیادی برای مطالعه الگوهای تحرک گروه‌های بزرگی از افراد در مقیاس‌های فضایی مختلف ارائه می‌کند (به عنوان مثال، حرکت در سراسر شهرها، ایالت ها یا حتی کشورها) و دانه بندی زمانی (مثلاً حرکات هفتگی، ماهانه و فصلی) که یکی از انگیزه های این مطالعه است.

2.2. چالش های فشرده داده برای تجزیه و تحلیل جغرافیایی و تصویری چند مقیاسی

داده‌های تحرک اساساً مجموعه‌ای از سوابق مکانی-زمانی افراد هستند که در فضای جغرافیایی مجدداً تخصیص داده می‌شوند. برای مطالعه الگوهای تحرک افراد، یک مسیر فضا-زمان هر کاربر جداگانه باید مدل‌سازی و ساخته شود تا حرکات جمعی در فضا و زمان را کمی‌سازی کند. بر اساس مسیرهای فضا-زمان استخراج شده، مطالعات فوق قادر به انجام تحلیل هایی مانند اندازه گیری جابجایی کاربر و شعاع چرخش افراد برای مطالعه پویایی تحرک هستند. در واقع، مسیر فضا-زمان یکی از مفاهیم اصلی در جغرافیای زمانی هاگرستراند برای درک دینامیک فضایی-زمانی تعبیه شده است [ 29]]، که بینش های مفیدی را برای کشف حرکات در مقیاس های جغرافیایی و محدوده های زمانی مختلف ارائه کرده است. به عنوان مثال، یک رویکرد تجسم جغرافیایی برای مطالعه الگوهای فعالیت انسانی مورد استفاده قرار گرفت، که در آن مسیرهای کاربر در یک فضای سه بعدی به ترتیب توسط مهرهای زمانی در بعد سوم ترسیم شدند [30 ] . در حالی که چنین رویکردی تجسم مسیرهای فردی را امکان پذیر می کند، توانایی آن در برخورد با مجموعه داده های حرکتی با حجم زیاد محدود است [ 31]]. به جای تجسم مستقیم مسیرهای یک کاربر، یک رویکرد مکعب فضا-زمان برای تجزیه و تحلیل و تجسم مسیرهای جمعی پیشنهاد شد. انعطاف‌پذیری‌هایی را در تنظیم مقیاس‌های مکانی و محدوده‌های زمانی فراهم می‌کند، و بنابراین برای مطالعه الگوهای تحرک در واحدهای فضایی مختلف (مانند کشورها، ایالت‌ها، و شهرها و غیره) و شناسایی تغییرات در فضا و زمان استفاده می‌شود [32 ، 33 ] ]. در این راستا، روش‌های تحلیلی بصری برای انتقال بهتر یافته‌ها از نظر تحلیل و تجسم الگوهای تحرک فضایی-زمانی چند سطحی پیشنهاد شده‌اند [ 31 ، 34]. روش‌های تحلیل بصری بر هم‌افزایی روش‌های محاسباتی و تحلیلی برای کاهش شلوغی بصری تمرکز می‌کنند، جایی که روش‌های تجمع برای انجام گروه‌بندی/تقسیم مسیرهای متحرک افراد در دانه‌بندی‌های مختلف مکانی و زمانی، به عنوان مثال، استفاده از رویکرد مکعب فضا-زمان [31] پیشنهاد می‌شود . ]. استفاده از روش‌های تحلیل بصری که با مجموعه داده‌های حرکتی عظیم سروکار دارند، نه تنها برای بهینه‌سازی تجسم‌ها سودمند است، بلکه انعطاف‌پذیری زیادی برای انجام تحلیل‌های آماری در جستجوی الگوهای تحرک با سطوح مختلف جزئیات مکانی-زمانی فراهم می‌کند.
با این حال، در زمینه مطالعه الگوهای تحرک با استفاده از حجم زیادی از داده‌های توییتر با موقعیت جغرافیایی، حجم داده‌های بزرگ ذاتی چالش‌های مهمی را برای روش‌های تحلیل بصری ایجاد می‌کند تا با حجم داده و الزامات محاسباتی مقیاس شوند (مثلاً استخراج حرکت). و مدلسازی مسیر) [ 35]. به طور خاص، در مطالعه ما، 1.3 میلیارد توییت با موقعیت جغرافیایی با حجم داده بیش از 1 ترابایت جمع‌آوری شد. برای ساخت یک مسیر فضا-زمان یک فرد، لازم است که از مجموعه داده های عظیم عبور کنیم تا هر زمان که مکان جدیدی پیدا شد، مسیر را مرتب کنیم و به روز کنیم. چنین کاری در حال حاضر از نظر محاسباتی نیازمند است، اجازه دهید با شکستن مسیرها، مکعب فضا-زمان با مقیاس فضایی و محدوده زمانی متعدد بسازید. در واقع، توسعه یک رویکرد تحلیل فضایی-زمانی چند مقیاسی به عنوان یکی از چالش‌های پژوهشی برای مقابله با داده‌های بزرگ رسانه‌های اجتماعی شناسایی می‌شود [ 21]]. برای پرداختن به چالش‌های فشرده داده، نیاز به توسعه یک چارچوب تجزیه و تحلیل بصری مقیاس‌پذیر است که برای گنجاندن حجم زیادی از توییت‌های جغرافیایی برای مطالعه الگوهای تحرک کاربر توییتر فضایی-زمانی چند سطحی طراحی شده است.

3. مواد و روشها

3.1. داده های توییتر با موقعیت جغرافیایی

توییت‌های موقعیت جغرافیایی، توییت‌هایی هستند که با یک برچسب جغرافیایی اضافی به شکل یک جفت مختصات جغرافیایی اضافه می‌شوند که نشان‌دهنده مکانی است که توییت در آن ارسال شده است. در این مطالعه، توییت‌های موقعیت جغرافیایی با استفاده از Twitter Streaming API دانلود شدند، جایی که ما یک کادر مرزی جغرافیایی را به عنوان منطقه مورد علاقه برای بازیابی همه توییت‌های موقعیت جغرافیایی که در آن قرار دارند، مشخص کردیم. برای اطمینان از پوشش کامل در سراسر ایالات متحده، خزنده‌ای را پیاده‌سازی کردیم که آمریکای شمالی را به‌عنوان منطقه مورد علاقه اولیه انتخاب می‌کند، جایی که مرز جغرافیایی با سمت چپ پایین (عرض جغرافیایی: 5.4، طول جغرافیایی: 167.3-) و بالا سمت راست (راست) مشخص می‌شود. عرض جغرافیایی: 83.2، طول جغرافیایی: -52.2). خزنده دائماً با بیش از 2 میلیون توئیت خام (حدود 2 گیگابایت) در روز در حال اجرا است. ما بیش از 1 را جمع آوری کرده ایم.
به طور خاص، این مجموعه داده های سال 2014 در ابتدا برای نقشه برداری از گسترش فضایی آنفولانزا در آمریکای شمالی در طول دوره زمانی استفاده شد [ 36 ]. از آنجایی که یک حساب رسانه اجتماعی با یک شخص واقعی در دنیای فیزیکی برابری نمی‌کند [ 21 ]، برای اطمینان از کیفیت داده، توییت‌های خام جمع‌آوری‌شده بیشتر با مراحل زیر فیلتر شدند: ابتدا پیام‌های تکراری را در مجموعه داده حذف کردیم [ 37 ]. و سپس کاربران غیر انسانی را بر اساس اکتشافی سرعت جابجایی غیرمعمول که در [ 7 و 12 ] بحث شد حذف کردیم. در این مورد، ما مقدار محدودیت سرعت را به عنوان 240 متر بر ثانیه در [ 7] اتخاذ کردیم]، که در آن همه مکان‌های متوالی هر کاربر را بررسی کردیم و مکان‌هایی را که سرعت جابه‌جایی بیش از حد مجاز داشتند را حذف کردیم. توجه داشته باشید که اطلاعات مکان اصلی تعبیه شده در هر توییت موقعیت جغرافیایی بر حسب واحد طول و عرض جغرافیایی داده می شود، فاصله با فاصله دایره بزرگ بین دو نقطه روی یک کره با فرمول هارسین محاسبه می شود. در نهایت، ما از مرزهای جغرافیایی ایالات متحده (به استثنای آلاسکا و هاوایی) برای محدود کردن بیشتر توییت‌های باقی مانده استفاده کردیم، جایی که جزئیات فنی در بخش زیر ارائه می‌شود. بر اساس این تقویت‌ها، مجموعه داده شامل 1,052,861,000 توییت و 4,559,205 کاربر منحصر به فرد است.

3.2. یک چارچوب مقیاس پذیر ویژوال تحلیلی

برای پرداختن به چالش‌های فشرده داده، ما یک چارچوب تجزیه و تحلیل بصری مقیاس‌پذیر ایجاد کرده‌ایم که برای تطبیق حجم زیادی از توییت‌های موقعیت‌یافته جغرافیایی برای مطالعه الگوهای حرکتی کاربر توییتر فضایی-زمانی چند سطحی طراحی شده است. چارچوب تجزیه و تحلیل بصری مقیاس پذیر از دو واحد اصلی تشکیل شده است: (1) واحد پردازش داده: یک محیط محاسباتی توزیع شده با استفاده از Apache Hadoop برای مدل‌سازی و استخراج حرکات کاربر توییتر، تولید مسیرهای کاربر فضا-زمان، و خلاصه کردن حرکات در مقیاس‌های مکانی-زمانی چندگانه. (2) واحد تجسم جغرافیایی: یک رابط نقشه برداری وب کره مجازی سه بعدی تعاملی برای تجزیه و تحلیل های اکتشافی جغرافیایی بصری برای درک دقیق جریان های حرکت کاربر توییتر در مقیاس های مکانی و محدوده های زمانی مختلف.
Apache Hadoop یک سیستم فایل توزیع شده، یعنی Hadoop Distributed File System (HDFS) [ 38 ] را با پارادایم برنامه نویسی MapReduce [ 39] ترکیب می کند.]، که می تواند برای طیف گسترده ای از مشکلات داده فشرده اعمال شود. چارچوب ما از استفاده از Hadoop در مدیریت و پردازش داده ها سود می برد. اول، از آنجایی که داده های ورودی بزرگ هستند، مطلوب است که آن را در چندین ماشین ذخیره کنید. این مقیاس‌پذیری را در رابطه با رشد اندازه داده‌ها فراهم می‌کند، جایی که Hadoop می‌تواند به گره‌های محاسباتی بیشتری در یک خوشه مقیاس شود تا عملکرد را حفظ کند. دوم، با استفاده از Hadoop می‌توانیم وظایف محاسباتی را موازی کنیم، جایی که MapReduce کل محاسبات را به وظایف کوچک تقسیم می‌کند و آنها را در میان گره‌های محاسباتی مختلف زمان‌بندی می‌کند تا پردازش داده‌ها سریع‌تر و کارآمدتر شود. یک معماری کلی سیستم از چارچوب در شکل 1 نشان داده شده است . جزئیات مربوط به عملکرد و اجرای هر واحد در بخش های بعدی ارائه شده است.

3.3. مسیرهای کاربری فضا-زمان توییتر

برای به دست آوردن الگوهای تحرک معنادار افراد، یک مسیر فضا-زمان برای هر کاربر جداگانه باید ساخته شود [ 29 ]. هر توییت خام دارای موقعیت جغرافیایی حاوی چندین زمینه اطلاعاتی است، مانند زمان ایجاد شده، کشور، کد زبان، و مکان و غیره . ، مکان، مُهر زمانی ، که می تواند با یک تاپل نمایش داده شود  من دمند،لج،تی، که در آن id یک رشته منحصر به فرد است که شناسه یک کاربر توییتر را نشان می دهد. loc محل ضبط شده پیام است که به صورت یک جفت مختصات پیش بینی شده نمایش داده می شود  x ، yایکس،; و t مهر زمانی است که پیام ارسال شده است. مسیر فضا-زمان کاربر توییتر به صورت زیر تعریف می شود.

تعریف  1.

مسیر فضا-زمان کاربر توییتر: مسیر فضا-زمان یک کاربر توییتر به عنوان مجموعه ای از مکان های جغرافیایی ثبت شده به ترتیب زمانی تعریف می شود (یعنی بر اساس مهر زمانی پیوست شده):

تیryتو ای _rمن d≡ ⟨ d، oج1،تی1 ، ⟨ من د، oج2،تی2 ، ⟨ من د، oجمن،تیمن ، ، ⟨ من د، oجn،تیn } ،i=1،2،3،.،nتیآهجتیتوسهمند{مند،لج1،تی1،مند،لج2،تی2،مند،لجمن،تیمن،...،مند،لج،تی}،من=1،2،3،...،

برای حذف کاربران غیر انسانی بر اساس سرعت جابجایی غیرمعمول، در صورتی که سرعت بین هر دو مکان متوالی در مسیر کاربر با dسپههد oجمن– oجمن – 1>(لجمنلجمن1)>240 متر بر ثانیه بر اساس این تعریف برای مدل‌سازی مسیرهای کاربر فضا-زمان توییتر، ما فرآیند استخراج مسیرها را از داده‌های جغرافیایی توئیتر خام به عنوان یک کار MapReduce تبدیل کردیم. به طور خاص، هر نقشه‌بردار از شناسه کاربری منحصربه‌فرد به‌عنوان کلید برای آماده‌سازی رکوردهای متعلق به همان کاربر و ارسال آنها به کاهنده استفاده می‌کند. هنگامی که کاهنده ها دریافت می کنند ⟨ yکه،آلتوهجفت، مسیر فضا-زمان کاربر توییتر با مرتب‌سازی مکان‌ها به ترتیب زمانی و در نظر گرفتن محدودیت سرعت شکل می‌گیرد.

تعریف  2.

رفتار بازدید، جابجایی و شعاع چرخش: از آنجایی که هر مسیر حرکت کاربر فضا-زمان توییتر تمام مکان‌هایی را که کاربر بازدید کرده است را ثبت می‌کند، رفتار بازدید به دفعات بازدید کاربر از مکان‌های مختلف در یک بازه زمانی خاص اشاره دارد. این معیار یک ارزیابی کلی در رابطه با تنوع و شباهت در الگوی تحرک جمعی ارائه می دهد [ 40 ].
به طور خاص، اندازه گیری جابجایی ها و شعاع چرخش افراد دو معیار رایج برای بررسی و تعیین کمیت اثرات زوال فاصله در الگوهای تحرک جمعی است [ 6 ]. جابجایی اشاره به تخصیص مجدد یک فرد در سراسر فضای جغرافیایی اندازه گیری شده در فاصله دارد، به عنوان مثال، دoجمن– oجمن – 1)دمنستیآجه(لجمنلجمن1). برای مثال، معادل “سفر” یک فرد نیست، به عنوان مثال، حتی فاصله زمانی بین دو مکان ثبت شده یک ماه است، همچنان به عنوان جابجایی محسوب می شود. با مطالعه جابجایی‌های جمعی از افراد گروه، به شناسایی محدوده‌های فاصله مرتبط با حالت‌های مختلف سفر [ 7 ] و تمایز کمی الگوهای تحرک از پیاده‌روی‌های تصادفی کمک می‌کند [ 5 ]. از سوی دیگر، شعاع چرخش (اهدا شده به عنوان rg) معیاری برای تشخیص الگوهای تحرک افراد [ 6 ] است که به شرح زیر تعریف می شود.

rg=1n1n(پمنپd)2، کجاپd=1n1nپمن=1من=1(پمنپجهتیمند)2،جایی کهپجهتیمند=1من=1پمن

فواصل انباشته شده انحراف از مرکز جرم مسیر یک کاربر را اندازه گیری می کند، و بنابراین پوشش فضایی فرد را نشان می دهد، جایی که پمنپمنو پdپجهتیمندهستند من تا ساعتمنتیساعتمکان و مرکز هندسی مسیر کاربر به ترتیب. هنگام اعمال اندازه‌گیری برای جمعیت مورد مطالعه، گروه‌های مختلف مردم را از نظر پوشش فضایی از الگوهای تحرک متناظر آنها شناسایی می‌کند. توجه داشته باشید که هم جابجایی ها و هم شعاع چرخش ها با “فاصله پرواز کلاغ” در این مطالعه اندازه گیری می شوند (یعنی فاصله دایره بزرگ مستقیم بین دو مکان ثبت شده). از آنجایی که این معیارها بر اساس مسیرهای تولید شده است، با شکستن و تجمیع مسیرها در مقیاس‌های فضایی و بازه‌های زمانی چندگانه، امکان انجام تجزیه و تحلیل فضایی-زمانی چند مقیاسی بر روی این اندازه‌گیری‌ها و مطالعه الگوهای تحرک مربوطه را فراهم می‌کند.

3.4. تجمع مسیر فضایی-زمانی چند سطحی

یک استراتژی مهم برای روش‌های تحلیل بصری برای مقابله با مجموعه داده‌های حرکتی عظیم، انجام تجمع‌های فضایی برای ارائه سطوح مختلف جزئیات [ 31 ، 34 ] است. این شبیه به رویکرد تعمیم نقشه است که وقتی یک کاربر در حال تعامل با یک رابط نقشه است، جزئیات تجسم باید با منطقه مورد علاقه کاربر تطبیق داده شود [ 41 ]. برای فعال کردن تجمیع مسیرهای توییتر در مقیاس های فضایی چندگانه، ما مدل مکعب فضا-زمان سلسله مراتبی توسعه یافته در [ 35] را گسترش داده ایم.]، که در آن فضای جغرافیایی ایالات متحده را به 10 لایه فضایی سلسله مراتبی تقسیم کردیم و هر مکعب فضا-زمان با یک پنجره زمانی ثابت با فاصله یک هفته ایجاد می‌شود. به طور خاص، مرزهای ایالتی ایالات متحده به عنوان لایه پایه (به عنوان مثال، سطح 0) برای تجمیع حرکات کاربر توییتر در سطح ایالت در نظر گرفته می شود، آلاسکا و هاوایی برای در نظر گرفتن جلوه های تجسم بهتر در رابط نقشه برداری چارچوب حذف می شوند. . سپس یک تور ماهی سلسله مراتبی را با غوطه ور کردن منطقه مورد مطالعه در سلول های منظم، که در آن بهترین سطح (سطح 10) شامل سلول های 1 کیلومتر × 1 کیلومتر است، ایجاد کردیم. چنین اندازه سلولی با وضوح فضایی در LandScan سازگار است ( http://web.ornl.gov/sci/landscan) محصول برای اندازه گیری تراکم جمعیت جهانی. در مورد ما، عرض/ارتفاع سلول برای سطح i-1 دو برابر اندازه سطح i است. شکل 2 واحدهای فضایی شبکه ماهیگیری سلسله مراتبی را برای نگاشت حرکات چند سطحی کاربر توییتر نشان می دهد. توجه داشته باشید که هر مرز جغرافیایی از پیش تعریف شده را می توان در این چارچوب استفاده کرد و به آن اضافه کرد تا حرکات با جزئیات مختلف را نشان دهد (به عنوان مثال، سطح ملی و سطح سرشماری)، در مورد ما، لایه شبکه ماهی سطح 8 را با ایالات متحده جایگزین کردیم. مرزهای شهرستان
برای انجام یک تجمع فضایی چند سطحی از مسیرهای کاربر توییتر با استفاده از لایه‌های فضایی سلسله مراتبی، هر مکان در مسیر یک کاربر به واحدهای فضایی مربوطه توزیع می‌شود. یک الگوریتم MapReduce برای تجمیع فضایی پیاده سازی شده است، که در آن شناسه واحد در هر لایه فضایی (به عنوان مثال، چند ضلعی در لایه حالت و کشور و سلول در بقیه) به عنوان کلید در مرحله نقشه در نظر گرفته می شود. این یک عملیات جغرافیایی “نقطه در چندضلعی” را انجام می دهد تا مشخص کند که نقطه متعلق به کدام چند ضلعی است. اگر مکان به هیچ چند ضلعی تعلق نداشته باشد، حذف می‌شود، به این ترتیب از مرزهای جغرافیایی ایالات متحده استفاده کردیم تا مجموعه توئیت‌های خامی را که در ابتدا آمریکای شمالی را پوشش می‌داد و توئیت‌های «داخلی» را حفظ می‌کرد، بایگانی کنیم.42 ] برای هر لایه فضایی برای سرعت بخشیدن به فرآیند. در نهایت، کاهنده ها دو خروجی داده تولید می کنند: (1) مسیرهای فضا-زمان کاربر توییتر بازسازی شده در هر سطح فضایی (2) جریان حرکت به شکل شار حرکتی درون و بیرون بین واحدهای فضایی. جریان‌های حرکتی در پایگاه داده برای کاوش‌های تعاملی در رابط نقشه‌برداری وب سه بعدی ذخیره می‌شوند، در حالی که مسیرهای بازسازی‌شده را می‌توان برای تولید اندازه‌های فاصله در مقیاس‌های فضایی مختلف پردازش کرد، که به شرح زیر نشان داده شده است: تیryتو ای _rمن d≡ ⟨ d، oج1،تی1، iتی1 ، ⟨ من د، oج2،تی2، iتی2 ، ⟨ من د، oجمن،تیمن، iتیمن ، ⟨ من د، oجn،تیn، iتیn }تیآهجتیتوسهمند{مند،لج1،تی1،تومنتی1،مند،لج2،تی2،تومنتی2،مند،لجمن،تیمن،تومنتیمن،...مند،لج،تی،تومنتی}جایی که ، ، nمن=1،2،3...

4. الگوهای تحرک کاربر توییتر فضایی و زمانی چندمقیاس

4.1. الگوهای تحرک کاربر فضایی-زمانی توییتر

وضعیت استفاده از توییت‌های موقعیت جغرافیایی به‌عنوان پراکسی برای استنباط حرکات افراد پیچیده است، زیرا رفتار توییت‌کردن کاربران می‌تواند به طور قابل‌توجهی از یکدیگر متفاوت باشد، به ویژه، فرکانس و فاصله زمانی بین دو توییت متوالی. به عنوان مثال، برخی افراد ممکن است یک بار در روز توییت کنند در حالی که برخی دیگر بیشتر انجام می دهند. برخی از افراد ممکن است به طور منظم توییت کنند در حالی که دیگران این کار را نمی کنند. این رفتارهای توییتی انتظار می رود زیرا چنین پویایی انسانی در داده های تماس تلفن همراه نیز دیده می شود [ 6]. بسیاری از مطالعات جمع آوری داده ها را در یک دوره زمانی معین (مثلاً یک سال در مورد ما) انجام داده اند. با این حال، از آنجایی که توییت‌های موقعیت جغرافیایی به روشی محدود جمع‌آوری شده‌اند، لازم است حساسیت مربوط به این رفتارها را بررسی کنیم تا مطمئن شویم که فقط یک عکس فوری تصادفی از کل جریان‌های داده نمی‌گیریم.
در این مطالعه، ما توزیع تجمعی فراوانی بازدیدکنندگان توییتر از مکان‌های مختلف را در سال 2014 (و هر ماه) تحلیل کردیم که از روش‌های توسعه‌یافته در [43] استفاده می‌کند . فرکانس بر اساس مسیر حرکت افراد استخراج شده از یک بازه زمانی ماهانه خلاصه می شود. توجه داشته باشید که گروه های مختلفی از کاربران توییتر ممکن است در هر ماه وجود داشته باشند. به نظر می رسد که توزیع رفتارهای بازدید جمعی از کاربران توییتر در سال 2014 از توزیع های قانون قدرت دو لایه (نشان داده شده در شکل 3) پیروی می کند. اکثریت (قسمت جلویی) توزیع از یک توزیع قانون قدرت کوتاه پیروی می کند. ) ∼ایکس– αه– λ xپ(ایکس)ایکسهایکس، که در آن x تعداد مکان های بازدید شده و مقدار α 1.32 است. قسمت دم (کمتر از 2٪ از کل جمعیت) از توزیع قانون قدرت پیروی می کند ) ∼ایکس– αپ(ایکس)ایکسبا مقدار α 3.5 است. این یافته در تمام 12 ماه سازگار است، با میانگین مقدار α 0.05 ± 1.34 (انحراف استاندارد) و میانگین مقدار λ به عنوان 0.0002 ± 0.00178 (انحراف استاندارد).
توزیع قانون توان دو لایه نشان می‌دهد که رفتارهای جمعی کاربران توییتر که از مکان‌های مختلف بازدید می‌کنند را می‌توان به خوبی با مدل Lévy Walk (مقاطع) تقریب زد [ 8 ، 44 ]، که همچنین در بسیاری از مطالعات تحرک انسانی با استفاده از داده‌های حرکتی مختلف شناسایی شده است. [ 45]. شباهت‌های میان توزیع‌های انباشته نشان می‌دهد که داده‌های تحرک جمع‌آوری‌شده از توییت‌های موقعیت جغرافیایی، حداقل در بازه زمانی ماهانه، موقتاً پایدار هستند، که نشان می‌دهد توییت‌های جغرافیایی جمع‌آوری‌شده در یک ماه می‌توانند به طور بالقوه یافته‌های مشابهی را به عنوان یافته‌های جمع‌آوری‌شده در چندین نشان دهند. ماه ها. علاوه بر این، قانون قدرت دو لایه نیز تنوع در رفتارهای بازدید کاربر توییتر را نشان می دهد: (1) یک گروه کوچک از کاربران توییتر مکان های بیشتری را نسبت به بقیه (2) در هر گروه بازدید کردند، احتمال بازدید کاربر توییتر از مکان های بیشتری. با یک تابع قدرت به طور قابل توجهی کاهش می یابد.
همانطور که قبلا ذکر شد، اندازه گیری جابجایی ها و شعاع چرخش افراد دو معیار رایج برای تعیین کمیت اثرات کاهش فاصله در الگوهای تحرک جمعی است [ 6 ]. در این مورد، ما ابتدا جابه‌جایی‌ها را از همه کاربران توییتر جمع‌آوری‌شده در ایالات متحده در سال 2014 جمع‌آوری کردیم، جایی که آن دسته از کاربران توییتر با تنها یک توییت موقعیت جغرافیایی فیلتر شدند. برای بررسی الگوهای تحرک افراد، جابجایی‌های انباشته شده و شعاع چرخش‌های هر کاربر توییتر را بر اساس مسیرهای فضا-زمان متناظر در دوره یک ساله استخراج کردیم. توجه داشته باشید که هم جابجایی ها و هم شعاع چرخش ها با فاصله دایره بزرگ ( d) بین دو مکان ثبت شده متوالی در مسیر یک کاربر.
برای جستجوی الگوهای تحرک از این اندازه‌گیری‌ها، ما تجزیه و تحلیل آماری را در رابطه با توزیع احتمال جابجایی‌ها و شعاع چرخش‌ها انجام دادیم که به عنوان هسته پراکندگی فضایی نیز شناخته می‌شود. پد)پ(د)5 ]. توزیع احتمال جابجایی های کاربر (و همچنین جابجایی های انباشته شده) در شکل 4 نشان داده شده است ، در حالی که توزیع احتمال شعاع چرخش ها در شکل 5 نشان داده شده است . در این مطالعه، ما از روش های برازش توسعه یافته توسط [ 7 ] استفاده کردیم. توزیع احتمال جابجایی های کلی و جابجایی های انباشته شده و شعاع چرخش افراد را می توان با ترکیبی از سه تابع تقریب زد: یک تابع نمایی، یک تابع نمایی کشیده و یک تابع قانون توان.
شکل 4 a توزیع احتمال جابجایی های کلی را نشان می دهد که به صورت تقریبی است پد) ∼λ1هλ1ددn)،دn10پ(د)1ه1(ددمترمن)،دمترمن=10متر از [10 متر، 70 متر] (2٪ از جمعیت را تشکیل می دهد)، پد) ~ βλ1دβ– 1هλ1(دβدβn)،دn100پ(د)1د1ه1(ددمترمن)،دمترمن=100متر از [100 متر، 80 کیلومتر] (93٪ از جمعیت را تشکیل می دهد)، و پد) ∼د– αپ(د)د[> 80 کیلومتر] (5٪ از جمعیت را تشکیل می دهد). علاوه بر این، جابجایی در فاصله محدود شده از 100 متر و 80 کیلومتر در شکل 4 ب را می توان تقریباً با دو توزیع قانون قدرت با نقطه برش در 5 کیلومتر (53٪ فواصل کمتر از 5 کیلومتر و 40٪ فاصله بین 5 کیلومتر و 80 کیلومتر) که نشان دهنده دو حالت مختلف سفر مانند حرکت های درون شهری یا درون شهری است. به طور کلی، توابع برازش با محدوده‌های فاصله متفاوت وجود الگوهای تحرک چند مقیاسی یا چندوجهی [ 7 ] کاربران توییتر را در ایالات متحده نشان می‌دهند، برای مثال، جابه‌جایی‌های بزرگ‌تر از 80 کیلومتر می‌تواند به بین سفرهای حالت و اثرات زوال مسافت قوی تر در سفرهای مسافت طولانی تر مشاهده می شود.
توزیع احتمال شعاع چرخش افراد در سطح ملی ( شکل 5 الف) با تقریب پ(rg) ∼λ2هλ2(rgrgn)،rgn10پ()2ه2(مترمن)،مترمن=10متر از [10 متر، 50 متر]، پ(rg) ~ βλ2rgβ– 1هλ1(rgβrgβn)،rgn50 مترپ()21ه1(مترمن)،مترمن=50متراز [50 متر، 30 کیلومتر]، و پ(rg) ∼rg– αپ()[> 30 کیلومتر]. به طور خاص، شعاع چرخش بین 50 متر و 30 کیلومتر را می توان تقریباً با دو توزیع قانون توان با نقطه برش در 6 کیلومتر بیشتر کرد ( شکل 5 ب)، که دو نوع اصلی پوشش فضایی از کاربران توییتر جمع آوری شده را نشان می دهد. ایالات متحده مرزی توزیع نشان می دهد که در اطراف 10 %10%شعاع چرخش جمعیت توییت‌ها کمتر از 50 متر است، که نشان می‌دهد آن دسته از کاربران توییتر عمدتاً در یک مکان خاص مانند خانه یا محل کار توییت می‌کنند. حدود 60 درصد از جمعیت شعاع چرخش کمتر از 30 کیلومتر دارند، که نشان می‌دهد بیشتر حرکات جمع‌آوری‌شده کاربران توییتر فواصل «کوتاه» هستند، مثلاً در محدوده شهری. توجه داشته باشید که دقت این مقادیر برای تعریف فاصله محدود به دقت اطلاعات مکان هر توییت با موقعیت جغرافیایی بستگی دارد.
ما همچنین توزیع شعاع چرخش کاربران توییتر را در مقیاس‌های فضایی مختلف، به‌ویژه، سطح ایالت و شهر اندازه‌گیری کردیم. در این مطالعه، ایالت ایلینویز و کالیفرنیا را برای مقایسه در سطح ایالت انتخاب کردیم ( شکل 5 ج)، در حالی که شهر شیکاگو را به عنوان نمونه ( شکل 5 د) در سطح شهر انتخاب کردیم. جالب است اما تعجب آور نیست که P( rg) در سطح حالت را می توان با ترکیبی از سه تابع تقریب زد: یک تابع نمایی، یک تابع نمایی کشیده و یک تابع قانون قدرت. ما متوجه شدیم که فاصله محدود شعاع چرخش در سطح ایالتی به جای 30 کیلومتر در سطح کشور، 10 کیلومتر است. اثرات فروپاشی فاصله در پوشش فضایی بزرگتر [> 30 کیلومتر] کمی متفاوت است، در این مورد، P( rg) در ایالت با اندازه کوچکتر (یعنی ایلینوی) سریعتر از ایالت با اندازه بزرگ (یعنی کالیفرنیا) کاهش می یابد. به طور خاص، P( rg) بر فراز شهر شیکاگو را می توان با توابع مشابه نصب کرد. با این حال، از آنجایی که الگوهای تحرک سطح درون شهری را منعکس می کند، هیچ محدوده فاصله مشخصی برای نشان دادن پوشش فضایی زیاد وجود ندارد.
از سوی دیگر، از آنجایی که چارچوب ما می‌تواند مسیرهای کاربر توییتر را در محدوده‌های زمانی مختلف جمع‌آوری کند، توزیع احتمال جابجایی‌های انباشته شده را بیشتر در ژانویه، ژوئن و اکتبر (شکل 4 د) و شعاع چرخش‌ها در 4 چهارم در سال 2014 ( شکل 6به منظور بررسی اینکه آیا تغییرات زمانی در الگوهای تحرک وجود دارد یا خیر. در حالی که توزیع احتمال جابجایی های انباشته در آن سه ماه انتخاب شده تقریباً یکسان است، ما تغییراتی را در توزیع احتمال شعاع چرخش ها در فصل های مختلف سال می یابیم. نوسانات در دم توزیع ها نشان می دهد که شعاع چرخش های مسافت طولانی (یعنی بالای 30 کیلومتر) تغییرات فصلی بیشتری را در الگوی تحرک کاربر توییتر تجربه می کند، که به معنای افزایش یا کاهش فعالیت های حرکتی در مسافت طولانی در دوره زمانی مربوطه است. . با این حال، شایان ذکر است که روند کلی در الگوهای تحرک کاربران توییتر که توسط شعاع چرخش‌ها آشکار می‌شود، هنوز ثابت است.
به طور خلاصه، با مقایسه این نتایج از مقیاس‌های فضایی و محدوده‌های زمانی مختلف، محدوده‌های فاصله متفاوت برای توصیف الگوهای تحرک کاربر فضایی-زمانی توییتر شناسایی شدند. با این حال، شباهت و سازگاری کلی یافت شده در استفاده از ترکیبی از سه تابع برای تقریب توابع توزیع احتمال جابجایی ها و شعاع چرخش ها، به وضوح پشتیبانی هایی را برای استفاده از توییت های موقعیت جغرافیایی به عنوان پراکسی های مفید برای درک الگوهای تحرک انسان و انجام یافته های تکرارپذیر فراهم می کند. در مقیاس های چندگانه فضایی و محدوده زمانی.
تجزیه و تحلیل بالا از الگوهای تحرک کاربر توییتر عمدتاً بر جنبه های مکانی-زمانی متمرکز است. چارچوب ما انعطاف‌پذیری را برای جمع‌آوری و استخراج مسیرهای کاربر توییتر در مقیاس فضایی خاص و تولید مجدد تجزیه و تحلیل فراهم می‌کند. به طور خاص، همانطور که از تجزیه و تحلیل بالا مشهود است که الگوهای تحرک کاربران توییتر چند مقیاسی یا چندوجهی وجود دارد، این چارچوب می تواند به بررسی بیشتر الگوی تحرک در مورد نحوه حرکت کاربران توییتر در مقیاس های مکانی و محدوده های زمانی مختلف کمک کند. توسط جریان های حرکتی بین این واحدهای فضایی اندازه گیری می شود. جریانهای حرکتی با تجمیع حرکاتی که از واحدهای فضایی مربوطه در چارچوب زمانی داده شده شروع شده و به آنها ختم شده اند، به دست می آیند. در این مورد، ما الگوهای تحرک بین ایالتی را با استفاده از چارچوبی برای گرفتن جریان های حرکتی بین ایالات نشان می دهیم. توجه داشته باشید که جریان های حرکتی را می توان در تمام 10 لایه فضایی در چارچوب خلاصه کرد. ما توزیع کلی جریان‌های حرکت را (به شکل وزن‌دار درون‌درجه و خارج از یک نمودار، که در آن هر حالت به‌عنوان یک گره در نظر گرفته می‌شود) بین حالت‌های مختلف در سال 2014 آزمایش کردیم. دریافتیم که توزیع احتمال جریان حرکت کاربران توییتر برای بازدید از ایالت های مختلف از یک توزیع log-normal پیروی می کند: ) ∼1ایکس[ –− μ )22σ2]پ(ایکس)1ایکسهایکسپ[(لایکس)222]، که نشان می دهد شار حرکات کاربران توییتر در بین ایالت ها بسیار منحرف شده و تحت سلطه چند ایالت است ( شکل 7 ). این نشان می‌دهد که جمعیت توییتر متناسب با جریان حرکت بین ایالات نیست، که ممکن است بینش‌هایی را برای سایر محققان در مطالعه جنبه‌های اجتماعی-اقتصادی پویایی مهاجرت فراهم کند.

4.2. رابط نقشه برداری وب 3 بعدی مجازی مجازی

علاوه بر ارائه پشتیبانی برای درک الگوهای تحرک کاربر توییتر با تجزیه و تحلیل آماری، این چارچوب یک رابط کره مجازی سه بعدی را ادغام می‌کند تا کاربران را قادر می‌سازد تا تحلیل‌های اکتشافی جغرافیایی-بصری حرکات چند سطحی فضایی-زمانی کاربر توییتر را انجام دهند (http://sandbox.cigi) . .illinois.edu/home ). کره مجازی سه بعدی از کتابخانه سزیوم توسعه و گسترش یافته است ( http://cesiumjs.org) که یک موتور نقشه و کره مجازی WebGL منبع باز است. ما موتور نقشه را برای تطبیق مقیاس‌های فضایی مختلف، که با لایه‌های فضایی سلسله مراتبی مطابقت دارد، برای تجمیع حرکات در سطوح مختلف جزئیات سفارشی کردیم. رابط نقشه، تعاملات کاربر، مانند منطقه مورد علاقه، پنجره زمانی، و سطوح زوم و غیره را به عنوان پارامتر تفسیر می کند و به سرور تجسم اختصاصی در دروازه CyberGIS ارسال می کند، که محیط پیشرو cyberGIS آنلاین برای تعداد زیادی از کاربران برای انجام محاسبات و داده فشرده و حل مسائل مشترک جغرافیایی که توسط زیرساخت سایبری پیشرفته امکان پذیر شده است [ 46 ].
یک نمای کلی از رابط نقشه برداری وب سه بعدی در شکل 8 نشان داده شده است. رابط نقشه‌برداری، جریان‌های حرکتی مربوطه را در کره مجازی به تصویر می‌کشد، جایی که تعداد جریان‌های حرکت بر 20 صدک تقسیم می‌شود و با رنگ‌های نشان‌داده‌شده در افسانه طبقه‌بندی می‌شود. از نظر انجام تجزیه و تحلیل بصری اکتشافی الگوهای حرکت کاربر توییتر، کاربران می توانند پنجره زمانی را برای فعال کردن پرس و جو مشخص کنند. هنگامی که نتایج نشان داده شد، کاربران می‌توانند ماوس را روی هر یک از خطوط منفرد روی نقشه نگه دارند تا مقدار جریان حرکت را برای هر دو جهت داخل و خارج ببینند (با رنگ سبز برجسته شده است). اگر معیارهای انتخاب شده بدون تغییر باقی بمانند، هر زمان که کاربر بزرگنمایی/کوچک کردن، کج کردن یا چرخش کره زمین را انجام دهد، رابط نقشه برداری کره مجازی سه بعدی به طور خودکار سطح جزئیات مربوطه را در پرواز ارائه می دهد. به عنوان مثال، شکل 9 و شکل 10جریان حرکت را با سطوح مختلف جزئیات در اطراف شهر شیکاگو و بین فرودگاه بین المللی اوهار و مرکز شهر شیکاگو نشان داد، جایی که 20 درصد جریان های حرکتی برتر نشان داده شد. رابط نگاشت سه بعدی استفاده برای پرس و جو از حرکات چند مقیاسی کاربر توییتر با زمینه جغرافیایی و به روش تعاملی را تسهیل می کند. به عنوان مثال، کاربران می توانند به سادگی با چرخاندن کره زمین، مطالعات مقایسه ای از حرکات کاربران توییتر در شهرهای مختلف انجام دهند. مهمتر از آن، این رابط نقشه برداری را می توان به راحتی سفارشی کرد و گسترش داد تا مجموعه داده های توییتر در موقعیت جغرافیایی آینده با پوشش های فضایی بزرگتر را در خود جای دهد. کد منبع چارچوب بصری-تحلیلی در این مقاله در صورت درخواست در دسترس است.

5. نتیجه گیری ها

در این مطالعه، ما از حجم زیادی از توییت‌های موقعیت جغرافیایی برای مطالعه الگوهای تحرک کاربر توییتر در مقیاس‌های فضایی چند سطحی و محدوده زمانی در ایالات متحده در طول سال 2014 استفاده کرده‌ایم. برای رسیدگی به چالش‌های فشرده داده، ما توسعه داده‌ایم. یک چارچوب تجزیه و تحلیل بصری مقیاس‌پذیر که برای گنجاندن حجم زیادی از توییت‌های موقعیت جغرافیایی برای مطالعه الگوهای حرکتی کاربر توییتر فضایی-زمانی چند مقیاسی طراحی شده است. این چارچوب بر روی محیط محاسباتی توزیع شده با کارایی بالا با استفاده از Apache Hadoop پیاده سازی شده است. این کارایی را در فیلتر کردن حجم زیادی از توییت‌های موقعیت جغرافیایی، مدل‌سازی و استخراج حرکات کاربر توییتر، ایجاد مسیرهای کاربر فضا-زمان، و خلاصه‌سازی الگوهای حرکتی چندسطحی فضایی و زمانی کاربر ارائه می‌کند. مثلا،
با این چارچوب، ما الگوهای جالب تحرک کاربران توییتر را هم از نظر آماری و هم از نظر بصری پیدا کرده‌ایم. ما رفتار بازدید جمعی از کاربران توییتر را با توجه به دفعات بازدید کاربران توییتر از مکان‌های مختلف مورد مطالعه قرار دادیم که توسط یک تابع توزیع قانون قدرت دو لایه نصب شده بود. توزیع قانون قدرت دو لایه نشان می‌دهد که رفتارهای جمعی کاربر توییتر که از مکان‌های مختلف بازدید می‌کنند را می‌توان به خوبی با مدل Lévy Walk (کوتاه) تقریب زد، که همچنین در بسیاری از مطالعات تحرک انسانی با استفاده از داده‌های مختلف تحرک شناسایی شده است. شباهت‌های بین توزیع‌های تجمعی نشان می‌دهد که داده‌های تحرک جمع‌آوری‌شده از توییت‌های موقعیت جغرافیایی از نظر زمانی پایدار هستند، حداقل در بازه زمانی ماهانه،
ما اثرات فروپاشی فاصله را در حرکات جمعی کاربر توییتر که با توزیع احتمال جابه‌جایی و شعاع چرخش افراد اندازه‌گیری شده بود، مطالعه کردیم. همه این توزیع ها را می توان با ترکیبی از سه تابع تقریب زد: یک تابع نمایی، یک تابع نمایی کشیده و یک تابع قانون توان. به طور خاص، مرزهای فاصله بین توابع مختلف برازش در توزیع جابجایی، وجود الگوهای تحرک چند مقیاسی یا چندوجهی کاربران توییتر را نشان می‌دهد، در حالی که توزیع شعاع چرخش گروه‌های مختلف کاربران توییتر را با انواع مختلف پوشش‌های فضایی نشان می‌دهد. مقیاس های فضایی متعدد ما بیشتر این الگوهای تحرک را در محدوده‌های زمانی مختلف مطالعه کردیم تا تغییرات زمانی در الگوهای تحرک را بررسی کنیم.
در نهایت، شایان ذکر است که در مرحله کنونی داده های توئیتر موقعیت جغرافیایی قادر به تعمیم به کل جمعیت نیستند. از آنجایی که اطلاعات جمعیت شناختی کاربران توییتر را نمی توان به راحتی شناسایی کرد، نتایج به دست آمده در این مطالعه ممکن است تصویر واقعی واقعی از حرکات انسان را منعکس نکند، که باید در مطالعات آینده به دقت مورد توجه قرار گیرد. با این وجود، حرکات کاربر توییتر پشتیبانی روشنی را برای آشکار کردن تأثیرات فروپاشی فاصله در تحقیقات تحرک انسانی، که در مقیاس‌های مکانی و زمانی متعدد مشاهده می‌شود، فراهم می‌کند. با توجه به حجم نمونه بزرگ، تعمیم الگوی تحرک یافت شده در سطح ملی به کل جمعیت دشوار است، الگوی تحرک در سطح شهر ممکن است بینش بهتری برای بررسی پویایی تحرک ارائه دهد. مثلا، نتایج شعاع چرخش در شیکاگو الگوی مشابهی را نشان می‌دهد که در مقیاس فضایی بزرگ‌تر یافت می‌شود، و با ورودی‌های دیگر مجموعه داده‌های تحرک که اغلب در سطح شهر در دسترس هستند، مانند سوابق سفر تاکسی و داده‌های تماس تلفن همراه، پتانسیل ترکیب وجود دارد. این منابع مختلف اطلاعاتی هستند و بنابراین تصویر کامل تری برای درک الگوهای حرکتی انسان ارائه می دهند. از سوی دیگر، همانطور که در این مقاله بحث کردیم که داده‌های توئیتر با موقعیت جغرافیایی مزایایی را در مورد دسترسی آسان به داده‌ها، پوشش فضایی بزرگ و حجم نمونه گسترده نشان می‌دهند، رویکرد ما از چنین منبع داده‌ای برای درک الگوهای تحرک در سراسر جهان استفاده کرد. مقیاس های فضایی متعدد و محدوده زمانی. همچنین، رویکرد ما می‌تواند در شرایط کشورهای دیگر نیز اعمال شود،

منابع

  1. ژنگ، ی. لی، کیو. چن، ی. Xie، X. Ma, WY درک تحرک بر اساس داده های GPS. در مجموعه مقالات دهمین کنفرانس بین المللی محاسبات همه جا حاضر، سئول، کره جنوبی، 21 تا 24 سپتامبر 2008.
  2. جیانگ، بی. یین، جی. ژائو، اس. مشخص کردن الگوی تحرک انسان در یک شبکه خیابانی بزرگ. فیزیک Rev. E 2009 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  3. بلیک، وی. گیزل، تی. براکمن، دی. الگوهای حرکت طبیعی انسان و گسترش فضایی بیماری های عفونی. فیزیک Rev. X 2011 . [ Google Scholar ] [ CrossRef ]
  4. گرین‌وود، MJ مهاجرت انسانی: نظریه، مدل‌ها و مطالعات تجربی. J. Reg. علمی 1985 ، 25 ، 521-544. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  5. براکمن، دی. هافناگل، ال. Geisel, T. قوانین مقیاس پذیری سفر انسان. طبیعت 2006 ، 439 ، 462-465. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  6. گونزالس، ام سی؛ هیدالگو، کالیفرنیا؛ Barabasi, AL درک الگوهای حرکتی فردی انسان. طبیعت 2008 ، 453 ، 779-782. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  7. جوردک، ر. ژائو، ک. لیو، جی. ابوجاود، م. کامرون، ام. نیوث، دی. درک تحرک انسان از توییتر. PLoS ONE 2015 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  8. ری، آی. شین، م. هونگ، اس. تره فرنگی.؛ کیم، اس جی. Chong, S. در مورد ماهیت مالیاتی حرکت انسان. IEEE/ACM Trans. شبکه 2011 ، 19 ، 630-643. [ Google Scholar ] [ CrossRef ]
  9. سوتسوک، ا. Ratti, C. آیا تحرک شهری یک روال روزانه دارد؟ یادگیری از داده های کل شبکه های تلفن همراه. J. فناوری شهری. 2010 ، 17 ، 41-60. [ Google Scholar ] [ CrossRef ]
  10. کونگ، KS; گرکو، ک. سوبولفسکی، اس. Ratti, C. بررسی الگوهای جهانی در رفت و آمد انسان در خانه و کار از داده های تلفن همراه. PLoS ONE 2014 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  11. تاچر، جی. زندگی بر روی دود: ردپای دیجیتال، بخار داده ها، و محدودیت های داده های بزرگ فضایی. بین المللی J. Commun. 2014 ، 8 ، 1765-1783. [ Google Scholar ]
  12. هاولکا، بی. سیتکو، آی. بینات، ای. سوبولفسکی، اس. کازاکوپولوس، پ. Ratti, C. توئیتر را به عنوان نماینده الگوهای تحرک جهانی در موقعیت جغرافیایی قرار داد. کارتوگر. Geogr. Inf. علمی 2014 ، 41 ، 260-271. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  13. جیانوتی، اف. پدرشی، دی. تحرک، داده کاوی و حریم خصوصی: کشف دانش جغرافیایی . Springer Science & Business Media: برلین، آلمان، 2008. [ Google Scholar ]
  14. Crampton، JW همه چیز را جمع آوری کنید: امنیت ملی، داده های بزرگ و حکومت. GeoJournal 2014 ، 9 ، 1-13. [ Google Scholar ] [ CrossRef ]
  15. وو، ال. ژی، ی. سویی، ز. لیو، ی. تحرک انسانی درون شهری و انتقال فعالیت: شواهدی از داده های ورود به شبکه های اجتماعی. PLoS ONE 2014 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  16. حسن، س. ژان، ایکس. Ukkusuri، SV درک فعالیت‌های انسانی شهری و الگوهای تحرک با استفاده از داده‌های مبتنی بر مکان در مقیاس بزرگ از رسانه‌های اجتماعی آنلاین. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGKDD در محاسبات شهری، شیکاگو، IL، ایالات متحده آمریکا، 11-14 اوت 2013.
  17. چو، ای. مایرز، SA; Leskovec, J. دوستی و تحرک: حرکت کاربر در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات هفدهمین کنفرانس بین المللی ACM SIGKDD در مورد کشف دانش و داده کاوی، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 21 تا 24 اوت 2011.
  18. نولاس، ا. اسکلاتو، اس. لامبیوت، آر. پونتیل، ام. ماسکولو، سی. داستان بسیاری از شهرها: الگوهای جهانی در تحرک شهری انسان. PLoS ONE 2012 . [ Google Scholar ] [ CrossRef ]
  19. بالکان، دی. کولیزا، وی. گونسالوس، بی. متعجب.؛ راماسکو، جی جی. Vespignani، A. شبکه های تحرک چند مقیاسی و گسترش فضایی بیماری های عفونی. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2009 ، 106 ، 21484–21489. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  20. تامریوس، جی. نلسون، MI; ژو، اس.زی. ویبود، سی. میلر، MA; آلونسو، WJ جهانی آنفولانزای فصلی: تطبیق الگوها در مناطق معتدل و گرمسیری. محیط زیست چشم انداز سلامتی 2011 ، 119 ، 439-445. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  21. Tsou، MH پژوهش چالش ها و فرصت ها در نقشه برداری رسانه های اجتماعی و داده های بزرگ. کارتوگر. Geogr. Inf. علمی 2015 ، 42 ، 70-74. [ Google Scholar ] [ CrossRef ]
  22. ژنگ، ی. Xie، X. Ma، WY GeoLife: یک سرویس شبکه اجتماعی مشترک بین کاربر، مکان و مسیر. مهندسی (پایه) IEEE گاو نر 2010 ، 33 ، 32-39. [ Google Scholar ]
  23. بکر، آر. کاسرس، آر. هانسون، ک. ایزاکمن، اس. لوه، جی ام؛ مارتونوسی، م. رولند، جی. اوربانک، اس. ورشاوسکی، آ. وولینسکی، سی. توصیف تحرک انسان از داده های شبکه سلولی. اشتراک. ACM 2013 ، 56 ، 74-82. [ Google Scholar ] [ CrossRef ]
  24. سوبولفسکی، اس. شل، ام. کامپاری، آر. کورونه، تی. اسموردا، ز. Ratti, C. ترسیم مناطق جغرافیایی با شبکه های تعاملات انسانی در مجموعه گسترده ای از کشورها. PLoS ONE 2013 . [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
  25. Twitter Streaming API. در دسترس آنلاین: https://dev.twitter.com/streaming/overview (در 9 اکتبر 2016 قابل دسترسی است).
  26. کرنشاو، جی. شوارتز، آر. هنگ، جی. Sadeh, NM پروژه زندگی: استفاده از رسانه های اجتماعی برای درک پویایی یک شهر. در مجموعه مقالات ICWSM 2012، دوبلین، ایرلند، 4-8 ژوئن 2012.
  27. میچل، ال. فرانک، ام آر. هریس، KD; Dodds، PS; دانفورث، سی ام. PLoS ONE 2013 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  28. لانگلی، پی. عدنان، م. لانسلی، جی. جمعیت شناسی جغرافیایی استفاده از توییتر. محیط زیست طرح. A 2015 , 47 , 465-484. [ Google Scholar ] [ CrossRef ]
  29. هاگرستراند، تی. جغرافیای زمانی: تمرکز بر جسمانی بودن انسان، جامعه و محیط. در علم و پراکسیس پیچیدگی ; دانشگاه ملل متحد: مونپلیه، فرانسه، 1985; صص 193-216. [ Google Scholar ]
  30. کوان، نماینده مجلس؛ Lee, J. Geovisualization از الگوهای فعالیت انسانی با استفاده از 3D GIS: یک رویکرد زمان-جغرافیایی. در علوم اجتماعی یکپارچه فضایی: نمونه هایی در بهترین عمل . Michael, FG, Donald, GJ, Eds. انتشارات دانشگاه آکسفورد: Oxford, MI, USA, 2003; جلد 3، ص 27-51. [ Google Scholar ]
  31. آندرینکو، ن. آندرینکو، جی. طراحی روش‌های تحلیل بصری برای مجموعه‌های عظیم داده‌های حرکتی. کارتوگر. بین المللی جی. جئوگر. Inf. جئوویس. 2007 ، 42 ، 117-138. [ Google Scholar ] [ CrossRef ]
  32. MacEachren، AM; کراک، ام‌جی چالش‌های پژوهشی در تجسم جغرافیایی. کارتوگر. Geogr. Inf. علمی 2001 ، 28 ، 3-12. [ Google Scholar ] [ CrossRef ]
  33. MacEachren، AM نقشه‌ها چگونه کار می‌کنند: بازنمایی، تجسم و طراحی . Guilford Press: نیویورک، نیویورک، ایالات متحده آمریکا، 2004. [ Google Scholar ]
  34. آندرینکو، جی. آندرینکو، ن. Wrobel, S. ابزارهای تحلیل بصری برای تجزیه و تحلیل داده های حرکتی. ACM SIGKDD Explor. Newsl. 2007 ، 9 ، 38-46. [ Google Scholar ] [ CrossRef ]
  35. کائو، جی. وانگ، اس. هوانگ، م. پادمنابان، ع. ژانگ، ز. سلطانی، ک. چارچوبی مقیاس‌پذیر برای تحلیل مکانی-زمانی داده‌های رسانه‌های اجتماعی مبتنی بر مکان. محاسبه کنید. محیط زیست سیستم شهری 2015 ، 51 ، 70-82. [ Google Scholar ] [ CrossRef ]
  36. پادمنابان، ع. وانگ، اس. کائو، جی. هوانگ، م. ژانگ، ز. گائو، ی. سلطانی، ک. Liu, Y. FluMapper: یک نرم افزار cyberGIS برای تجزیه و تحلیل تعاملی رسانه های اجتماعی عظیم مبتنی بر مکان. موافق محاسبه کنید. تمرین کنید. انقضا 2014 . [ Google Scholar ] [ CrossRef ]
  37. سیاه، A. ماسکارو، سی. گالاگر، م. گوگینز، SP توییتر زامبی: معماری برای گرفتن، تبدیل اجتماعی و تجزیه و تحلیل حوزه توییتر. در مجموعه مقالات هفدهمین کنفرانس بین المللی ACM در مورد حمایت از کار گروهی، سیاتل، WA، ایالات متحده آمریکا، 9-13 نوامبر 2012.
  38. شواچکو، ک. کوانگ، اچ. رادیا، اس. Chansler, R. سیستم فایل توزیع شده هادوپ. سیستم ذخیره سازی انبوه تکنولوژی 2010 . [ Google Scholar ] [ CrossRef ]
  39. دین، جی. Ghemawat، S. MapReduce: پردازش داده های ساده در خوشه های بزرگ. اشتراک. ACM 2008 ، 51 ، 107-113. [ Google Scholar ] [ CrossRef ]
  40. گائو، اچ. تانگ، جی. لیو، اچ. بررسی روابط اجتماعی-تاریخی در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات ICWSM 2012، دوبلین، ایرلند، 4-8 ژوئن 2012.
  41. باتنفیلد، BP; مک مستر، RB تعمیم نقشه: ایجاد قوانین برای بازنمایی دانش . Longman Scientific & Technical: نیویورک، نیویورک، ایالات متحده آمریکا، 1991. [ Google Scholar ]
  42. سامت، اچ. چهار درخت و ساختارهای داده سلسله مراتبی مرتبط. کامپیوتر ACM. Surv. (CSUR) 1984 ، 16 ، 187-260. [ Google Scholar ] [ CrossRef ]
  43. کلاوزت، ا. شالیزی، CR; نیومن، ME توزیع قانون قدرت در داده های تجربی. SIAM Rev. 2009 , 51 , 661-703. [ Google Scholar ] [ CrossRef ]
  44. زمانی که پیاده‌روی‌های تصادفی همبسته الگوهای حرکتی مشاهده‌شده را در بر می‌گیرند، راه‌های رینولدز، ای. J. Royal Soc. بین المللی 2012 ، 9 ، 528-534. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  45. ژائو، ک. موصلی، م. هوی، پی. رائو، دبلیو. تارکوما، اس. توضیح توزیع قانون قدرت تحرک انسان از طریق تجزیه روش حمل و نقل. علمی جمهوری 2015 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
  46. لیو، ی. پادمنابان، ع. Wang، S. CyberGIS Gateway برای فعال کردن تحقیقات و آموزش مکانی غنی از داده ها. علمی دروازه. کارگاه های آموزشی 2013 2014 . [ Google Scholar ] [ CrossRef ]
شکل 1. معماری کلی سیستم چارچوب.
شکل 2. لایه های فضایی سلسله مراتبی برای تجمع حرکات در سطوح مختلف جزئیات.
شکل 3. توزیع قانون قدرت دو لایه رفتارهای جمعی بازدید کاربر توییتر.
شکل 4. ( الف ) توزیع احتمال جابجایی های جمعی کاربر توییتر P(d); ( ب ) فاصله بین [100 متر، 80 کیلومتر] با توابع قانون قدرت دوگانه تقریبی شده است. ( ج ) توزیع احتمال جابه‌جایی‌های انباشته شده تک تک کاربران توییتر P(d); ( د ) توزیع احتمال جابه‌جایی‌های انباشته کاربران توییتر در 3 ماه مختلف.
شکل 5. ( الف ) توزیع احتمال شعاع چرخش تک تک کاربران توییتر P( rg) در سطح ملی؛ ( ب ) فاصله بین [50 متر، 30 کیلومتر] توسط یک تابع قانون قدرت دوتایی تقریبی شده است. ( ج ) P( rg) در سطح ایالتی (ایلینوی و کالیفرنیا)؛ ( د ) P( rg) برای شهر شیکاگو.
شکل 6. توزیع احتمال شعاع چرخش تک تک کاربران توییتر در فصل های مختلف سال 2014.
شکل 7. توزیع جریان های حرکت کاربران توییتر در بین ایالت های مختلف در سال 2014 با درجات وزنی درون و برون اندازه گیری شده است.
شکل 8. نمای کلی از رابط نقشه برداری وب تعاملی سه بعدی.
شکل 9. حرکت 20 درصدی بالا در اطراف شهر شیکاگو جریان دارد.
شکل 10. حرکت 20 درصدی بالا بین فرودگاه بین المللی اوهار و مرکز شهر شیکاگو جریان دارد.

بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *