نقشه راه GIS

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

کاربرد جی ای اس

 

خلاصه

توییت های دارای برچسب جغرافیایی مفاهیم مفیدی را برای مطالعات جغرافیای انسانی، علوم شهری، خدمات مبتنی بر مکان، تبلیغات هدفمند و شبکه های اجتماعی ارائه می دهند. هدف این تحقیق کشف الگوها و تحرک کاربران توییتر با تجزیه و تحلیل پویایی مکانی و زمانی در توییت‌های آنهاست. توییت‌های دارای برچسب جغرافیایی در یک دوره شش ماهه برای چهار شهر کالج غرب میانه ایالات متحده جمع‌آوری می‌شوند: (1) West Lafayette, IN; (2) بلومینگتون، IN; (3) Ann Arbor، MI; (4) کلمبوس، اوه. روش‌های مختلف تحلیلی و آماری برای آشکار کردن الگوهای مکانی و زمانی توییت‌ها و رفتارهای توییت‌کردن کاربران توییتر استفاده می‌شود. مشخص شد که کاربران توییتر بین ساعت 9:00 شب تا 11:00 شب در شهرهای کوچکتر بیشترین فعالیت را دارند، توییت ها در دانشگاه ها و مجتمع های آپارتمانی جمع می شوند. در حالی که توییت ها در مناطق مسکونی شهرهای بزرگتر اکثر توییت ها را تشکیل می دهند. ما همچنین دریافتیم که اکثر کاربران توییتر دو تا چهار مکان بازدید مکرر دارند. میانگین محدوده تحرک کاربران مکرر توییتر به طور خطی با اندازه شهر، به طور خاص، حدود 40٪ شعاع شهر، همبستگی دارد. بنابراین این تحقیق امکان و آینده امیدوارکننده استفاده از خدمات میکروبلاگینگ با برچسب جغرافیایی مانند توییتر را برای درک الگوهای رفتاری انسان و انجام سایر مطالعات مرتبط با جغرافیای اجتماعی تأیید می کند.
کلید واژه ها: 

الگوهای فضایی ؛ الگوهای زمانی تحرک انسان ؛ پویایی انسان ; توییتر ؛ رسانه های اجتماعی

 

1. معرفی

توییتر محبوب ترین سرویس میکروبلاگینگ در جهان است. به گفته میلشتاین و همکاران. [ 1 ]، میلیون ها نفر از این شبکه اجتماعی آنلاین برای ارتباط اجتماعی با دوستان، اعضای خانواده و همکاران استفاده می کنند. آنها از آن برای اطلاع دادن به دیگران در مورد آنچه انجام می دهند، فکر می کنند یا آنچه در حال رخ دادن است استفاده می کنند. پیام به‌روزرسانی وضعیت «توئیت» نامیده می‌شود و یک توییت به 140 کاراکتر محدود می‌شود. همه کاربران (توئیتر) می توانند سایر کاربران را دنبال کنند و توییت هایی را که ارسال کرده اند بخوانند. کاربرانی که توسط دیگران فالو می شوند نیازی به دنبال کردن آنها ندارند. تعداد کاربران توییتر از زمان راه اندازی توییتر در سال 2006 به سرعت افزایش یافته است. از مارس 2016، توییتر [ 2 ] بیش از 310 میلیون کاربر فعال ماهانه دارد. سنگ [ 3] بیان کرد که 9.1 درصد از جمعیت ایالات متحده به نبض یک ارگانیسم خبری در سراسر سیاره تبدیل شده اند که میزبان گفتگو درباره همه چیز از بهار عربی تا مرگ افراد مشهور است. به طور مشابه، Lunden [ 4 ] و Leetaru و همکاران. [ 5 ] گزارش داد که در یک دوره هفت ساله بیش از 170 میلیارد توییت ارسال شد که در مجموع 133 ترابایت بود که بیش از 500 میلیون توییت در روز ارسال می شد. توییتر فرصتی بی سابقه برای مطالعه ارتباطات انسانی و شبکه های اجتماعی [ 6 ] ارائه می دهد و توجه دانشمندان علوم اجتماعی را به خود جلب کرده است. تعداد مقالات منتشر شده از 27 به 84 بین سال های 2009 و 2012 سه برابر شده است.]. علاوه بر این، توییتر دسترسی برنامه‌ای بلادرنگ به یک آرشیو عظیم هفت ساله از طریق APIها فراهم می‌کند، سهولت و در دسترس بودن استفاده از آن، توییتر را به یکی از منابع داده مورد علاقه دانشمندان علوم اجتماعی تبدیل کرده است [5 ] . طبق [ 7 ]، داده های توییتر در (1) تشخیص رویداد، از جمله مدیریت بلایا، مدیریت بیماری [ 8 ] و مدیریت ترافیک استفاده شده است. (2) استنتاج مکان [ 9 ]; (3) تجزیه و تحلیل شبکه های اجتماعی، ویژگی های کاربر و تحقیقات روابط اجتماعی آنها [ 10 ].
یکی از ویژگی‌های مهم توییتر در دسترس بودن آن بر روی گوشی‌های هوشمند است که ممکن است حسگرهای موقعیت مکانی مانند GPS را تعبیه کرده باشد که به کاربران اجازه می‌دهد پیام‌هایی را با مختصات جغرافیایی خود ارسال کنند [ 11 ]. علاوه بر این، از آگوست 2009، توییتر به کاربران اجازه داد تا مکان شهر یا محله خود را به صورت دستی نشان دهند [ 2 ]. به طور متوسط، 2٪ از تمام توییت ها شامل اطلاعات مکان [ 5 ] است که به حدود 10 میلیون توییت در روز ترجمه می شود. بنابراین، توییتر در حال تبدیل شدن به یک منبع کلیدی از داده های مکانی باز و رایگان است که توسط شهروندان تولید می شود [ 12 ]. برای مثال، توییت‌های دارای برچسب جغرافیایی عمدتاً در مدیریت بلایا استفاده شده‌اند [ 8 ، 13 ، 14]. با اطلاعات مکان دقیق، توییت ها از نظر مکانی و زمانی بسیار قابل اعتماد و در چنین برنامه هایی مفید هستند [ 7 ]. حجم بسیار زیاد و اطلاعات متنوع موجود در توییت‌ها، آنها را به مکمل یا جایگزین امیدوارکننده‌ای برای داده‌های نظرسنجی سنتی تبدیل کرده است که راه‌های جدیدی را برای کشف دانش جغرافیایی-اجتماعی و در عین حال چالش‌برانگیز برای رویکردهای جدید تحقیقاتی باز می‌کند.
توییت‌های دارای برچسب جغرافیایی و سایر اشکال داده‌های رسانه‌های اجتماعی با فوری بودن، پوشش جهانی و داوطلبانه مردم، در برنامه‌های مختلفی مانند مدیریت بحران یا اضطراری [15، 16]، تشخیص رویداد [ 17 ، 18 ، استفاده می‌شوند . 19 ، کشف دانش همراه با مدل‌سازی موضوعی و تحلیل معنایی [ 20 ، 21 ، 22 ]، پیش‌بینی مکان [ 9 ] و بهبود مدل شبکه شهری [ 23]]. داده های به اشتراک گذاشته شده در شبکه های اجتماعی مبتنی بر مکان مایکروسافت، مجموعه ای جامع از اطلاعات رفتارهای انسان در فضا و زمان را برای بررسی در دسترس قرار داده است [ 24 ]. به ویژه، الگوی مکانی-زمانی از اهمیت زیادی برای مطالعه رفتار انسان برخوردار است، که بینش هایی را در مورد تحرک انسان ترسیم می کند [ 24 ، 25 ، 26 ]. پتانسیل توئیت های دارای برچسب جغرافیایی و سایر داده های جغرافیایی رسانه های اجتماعی در تحقیقات جغرافیایی-اجتماعی ثابت شده است، که در نهایت هدف آن فعال کردن سیستم های جدید جغرافیایی- اجتماعی هوشمند است. اعتقاد بر این است که این مطالعات فوق‌الذکر در سال‌های آتی با افزایش علاقه‌مندی‌ها به محاسبات فضایی، پیشرفت بزرگی خواهند داشت [ 27 ].
از سوی دیگر، مطالعات بر روی مدل‌سازی تحرک انسان از زمینه‌های مختلف از جمله پیش‌بینی ترافیک [ 28 ] ، برنامه‌ریزی شهری [ 29 ]، سیستم‌های توصیه‌کننده [ 30 ، 31 ] و گسترش بیماری [ 32،33 ] مورد توجه قرار گرفته‌اند. علاوه بر این، مطالعات قبلی در سطح فردی بر روی مجموعه داده های GPS، مانند داده های تلفن همراه [ 34 ، 35 ]، تراکنش های کارت [ 36 ] و مسیرهای تاکسی [ 37] انجام شده است.]. اخیراً، محققان از داده های به دست آمده از شبکه های اجتماعی مبتنی بر مکان مانند توییت های جغرافیایی برای تجزیه و تحلیل الگوی تحرک استفاده کرده اند. ثابت کرده است که در استفاده از داده های توییتر در تحلیل الگوی فعالیت موفق است [ 38 ]. نتایج با یافته‌های قبلی از منابع داده دیگر، مانند داده‌های تلفن همراه [ 10 ]، یا با نتایج نظرسنجی موجود مانند داده‌های نظرسنجی جامعه آمریکا [ 39 ] مطابقت داشت. اگرچه مطالعات رفتار انسانی از توییت‌ها و سایر اشکال داده‌های رسانه‌های اجتماعی استفاده می‌کردند، اما آنها بر روی گروه خاصی از افراد، مانند گردشگرانی که از خدمات اشتراک‌گذاری عکس استفاده می‌کردند [ 40 ، 41 ، 42 ]، در عموم مردم در مقیاس منطقه‌ای تمرکز کردند [ 11 ]]، مقیاس کشوری [ 43 ] یا مقیاس جهانی [ 5 ]. کار محدودی برای کشف و مدل‌سازی الگوهای تحرک انسانی در مقیاس شهر یا شهرک انجام شده است [ 44 ].
هدف تحقیق گزارش شده در این مقاله پر کردن این شکاف است. علاوه بر این، با توجه به حجم زیاد و دسترسی عمومی به توییت‌ها، تمرکز این تحقیق استفاده از توییت‌های دارای برچسب جغرافیایی به جای مجموعه داده‌های سنتی GPS برای به تصویر کشیدن بهتر الگوهای تحرک انسان است. با توجه به ویژگی‌های داده‌های توییتر و پتانسیل آن در کشف دانش جغرافیایی-اجتماعی، اهداف این تحقیق به شرح زیر است. ما انتظار داریم که الگوهای مکانی و زمانی توئیت‌های دارای برچسب جغرافیایی را با روش‌های مختلف استخراج جغرافیایی بررسی کنیم. علاوه بر این، ما رفتارهای توییت و الگوهای حرکتی کاربران توییت را استنباط و درک خواهیم کرد. در نهایت، این مطالعه قصد دارد چارچوبی را برای داده کاوی رسانه های جغرافیایی اجتماعی و کشف دانش به نمایش بگذارد. به ویژه در زمینه رفتار انسان و تعامل آنها با محیط های شهر. انتظار می رود که از کاربردهای متنوعی بهره مند شود و الهام بخش جامعه شناسان، مردم شناسان، سیاست گذاران و جغرافیدانان باشد.
بقیه مقاله به شرح زیر سازماندهی شده است. بخش 2 داده های جغرافیایی جمعیتی و توییتر چهار شهر مورد استفاده در این مطالعه را شرح می دهد. الگوهای مکانی و زمانی برای کاربران توییتر در بخش 3 در مقیاس کامل بررسی و به تصویر کشیده شده است: از شهر به ساختمان، و از روز تا ساعت. علاوه بر داده‌های توییتر، داده‌های کاربری زمین نیز در تحلیل شرکت می‌کنند تا بتوان تنظیمات شهری را به مکان‌های توییت نسبت داد. بخش 4 با بررسی توزیع تعداد توییت‌ها، فرکانس‌ها و محدوده تحرک افراد، به رفتارهای خاصی از افراد می‌پردازد، که در مورد دومی یک مدل آزمایشی بر حسب اندازه شهر ایجاد می‌شود. یافته ها و اهمیت کار در بخش 5 خلاصه شده است.

2. مناطق مطالعه و داده ها

2.1. مناطق مطالعه

این کار با استفاده از توییت‌های برچسب‌گذاری‌شده جغرافیایی در چهار شهر/شهرک کالج غرب میانه در ایالات متحده انجام می‌شود، به عنوان مثال، غرب لافایت، IN (دانشگاه پردو)، بلومینگتون، IN (دانشگاه ایندیانا)، آن آربور، MI (دانشگاه میشیگان) و کلمبوس، OH (دانشگاه ایالتی اوهایو). جدول 1 جمعيت و اندازه چهار شهر را خلاصه مي كند، در حالي كه شكل 1 نقشه هاي آنها را ارائه مي دهد. حقایق جغرافیایی و جمعیتی در مورد این چهار شهر در زیر توضیح داده شده است که بیشتر بر اساس اطلاعات عمومی است، به عنوان مثال، ویکی پدیا.
وست لافایت ( شکل 1 ) پرجمعیت ترین شهر در ایندیانا و همچنین متنوع ترین شهر از نظر فرهنگی در غرب میانه است. میانگین سنی 22.8 سال است و 49.4 درصد از جمعیت بین 18 تا 24 سال سن دارند. تراکم جمعیت 1499.6/km2 است [ 45 ] . این شهر در مرکز شهرستان تیپکانو قرار دارد و به رودخانه واباش مشرف است ( شکل 1 ). دانشگاه پردو در وست لافایت واقع شده است و 39256 دانشجو دارد که 30147 نفر از آنها در ترم پاییز 2012 در مقطع کارشناسی دانشجو بودند [ 46 ]. این دانشگاه دارای 15 اقامتگاه است که تقریباً یک سوم دانشجویان مجرد در مقطع کارشناسی در آنها زندگی می کنند [ 45 ].
بلومینگتون ( شکل 1 ) مقر شهرستان شهرستان مونرو در جنوب ایندیانا است. این ششمین شهر بزرگ ایندیانا با تراکم جمعیت حدود 1340.4/km2 است . میانگین سنی در این شهر 3/23 سال است و 5/44 درصد بین 18 تا 24 سال سن دارند [ 47 ]. دانشگاه ایندیانا بلومینگتون در بلومینگتون واقع شده است و دارای 32532 دانشجوی کارشناسی از مجموع 42731 دانشجو بود [ 47 ]. پردیس دارای 12 مرکز اقامتی است که در سه محله جمع شده اند [ 48 ].
آن آربور ( شکل 1 ) ششمین شهر بزرگ در میشیگان با تراکم جمعیت 1580.7/km2 است . میانگین سنی جمعیت در شهر 28 سال است که 26.8 درصد آن بین 18 تا 24 سال و 31.2 درصد بین 25 تا 44 سال هستند [49 ] . این شهر خانه دانشگاه میشیگان است که شهر را شکل می‌دهد و شخصیت شهر کالج را به آن می‌بخشد [ 49 ]. این دانشگاه تا پاییز سال 2012 دارای 43246 دانشجو بود که از این میان 27979 دانشجو در مقطع کارشناسی بودند. دارای چهار پردیس اصلی (شمال، مرکزی، پزشکی و جنوبی). مسکن در محوطه دانشگاه در پردیس مرکزی، منطقه هیل و پردیس شمالی واقع شده است. و نزدیک به 40 درصد از دانشجویان مقطع کارشناسی در محوطه دانشگاه زندگی می کنند [ 50]. علاوه بر جمعیت بزرگ دانشجویی، دانشگاه همچنین حدود 30000 کارمند دارد که حدود 12000 نفر در مرکز پزشکی هستند [ 49 ]. علاوه بر دانشگاه میشیگان، آن آربور همچنین محل دانشگاه کنکوردیا آن آربور، پردیس دانشگاه فونیکس و دانشگاه کلیری است [ 49 ].
کلمبوس ( شکل 1 ) پایتخت ایالت اوهایو و بزرگترین شهر آن است. این پانزدهمین شهر بزرگ ایالات متحده و پرجمعیت ترین شهر در اوهایو با تراکم جمعیت 1399.2/km2 است . میانگین سنی جمعیت از سرشماری سال 2010 31.2 بود که 14 درصد آن بین 18 تا 24 سال و 32.3 درصد بین 25 تا 44 سال بودند. این شهر دارای اقتصاد متنوعی از جمله آموزش، بیمه، بانکداری، دولتی است. انرژی، مراقبت های بهداشتی، خرده فروشی، فناوری، غذا، پوشاک، تدارکات و مراقبت های بهداشتی. پنج دفتر مرکزی شرکت Fortune 500 ایالات متحده نیز در کلمبوس واقع شده است. دانشگاه ایالتی اوهایو، کالج جامعه ایالتی کلمبوس و بسیاری از موسسات خصوصی در کلمبوس واقع شده اند [ 51]. دانشگاه ایالتی اوهایو در مجموع 56867 دانشجو دارد که از این تعداد 42916 دانشجو در مقطع کارشناسی هستند. 31 سالن اقامت در محوطه دانشگاه وجود دارد که در پردیس جنوبی، شمالی و غربی قرار دارند [ 52 ].
هر چهار شهر در غرب میانه ایالات متحده واقع شده اند، از نظر اقتصادی، این منطقه بین صنعت سنگین و کشاورزی متعادل است و نسبت اشتغال به جمعیت بالایی دارد. همه آنها دارای دانشگاه های دولتی بزرگ با ده ها هزار دانشجو هستند. اگرچه آنها ویژگی های مشترک خاصی دارند، اما اندازه یا مقیاس آنها متفاوت است. وست لافایت، بلومینگتون، آن آربور اکثراً شهرهای کالج هستند، در حالی که کلمبوس نه تنها کالج های متعددی دارد، بلکه دارای صنایع بزرگی است که آن را به یک منطقه شهری تبدیل می کند. چنین انتخابی اجازه می دهد مطالعه ما بر روی مناطق جغرافیایی با ویژگی های مشترک اما در مقیاس های مختلف متمرکز شود. علاوه بر این، آنها منطقه زمانی یکسانی را به اشتراک می گذارند، که باعث می شود تجزیه و تحلیل و مقایسه معنادار شود. علاوه بر این، یکی از نویسندگان چندین بار از چهار شهر بازدید کرده است و تجربه دست اولی در مورد ساختار شهرها دارد. انتظار می رود که چنین دانش درجا، هرچند محدود، در تفسیر داده ها و الگوهای آن مفید باشد.

2.2. داده های توییتر

داده‌های توییتر مورد استفاده در این تجزیه و تحلیل با استفاده از رابط برنامه‌نویسی برنامه‌های پخش جریانی توییتر (API) دانلود شده‌اند که به توسعه‌دهندگان امکان دسترسی کم تاخیر به جریان جهانی داده‌های توییت را می‌دهد. سه نقطه پایانی جریان اصلی وجود دارد: (1) جریان‌های عمومی، که توسط آن‌ها می‌توان جریان‌های داده‌های عمومی را که از طریق توییتر جریان می‌یابند، تحت فشار قرار داد. (2) جریان‌های کاربر، که توسط آن‌ها می‌توان به جریان تک کاربره‌ای که تقریباً تمام داده‌های مربوط به دیدگاه کاربر را شامل می‌شود، دسترسی پیدا کرد. (3) جریان سایت، که یک نسخه چند کاربره از جریان های کاربر است [ 53 ]. از آنجایی که این کار با هدف آشکارسازی و درک الگوهای توییت‌های برچسب‌گذاری‌شده جغرافیایی در چهار منطقه مورد مطالعه انجام می‌شود، تنها توییت‌هایی در محدوده آن‌ها مورد نیاز است. روش جریان عمومی با دو کتابخانه پایتون، Tweepy [54 ] و Twitter-Streamer [ 55 ]. عبارات جستجوی مورد استفاده، مرزهای مختصات مناطق مورد مطالعه تعریف شده در جدول 1 بود که شامل محدوده شهرداری شهر است. تنها توییت‌هایی که شامل طول و عرض جغرافیایی می‌شدند، که معمولاً از گوشی‌های هوشمند توسط کاربرانی که صراحتاً تصمیم به انتشار مکان فعلی خود دارند، ایجاد می‌شوند. لازم به ذکر است که توییتر دسترسی عمومی را با اجازه دادن فقط تا 180 توییت در هر 15 دقیقه محدود می کند [ 56 ]. در نتیجه، آنچه در این مطالعه استفاده شد، توییت‌های کامل تولید شده توسط کاربران توییتر نبود، بلکه نمونه‌های تصادفی آنها بود. علاوه بر این، دقت موقعیت یابی گوشی های هوشمند در شرایط چند مسیری خوب 2 تا 3 متر گزارش شده است و در شرایط نامناسب چند مسیری می تواند به 10 متر یا بدتر کاهش یابد.57 ]. با این حال، چنین کیفیتی برای ما به اندازه کافی خوب است زیرا این مطالعه بیشتر به الگوهای فعالیت های توییت مربوط می شود. شایان ذکر است، در میان چهار منطقه مورد مطالعه، مشخص شد که حدود 70٪ تا 80٪ توییت ها از سیستم عامل های آیفون ارسال شده اند، و 10٪ تا 20٪ از سیستم عامل های Android ارسال شده اند. سایر پلتفرم ها کمتر از 10 درصد بودند.
مجموعه توییت ما از. 18 نوامبر 2013 تا 1 ژوئن 2014 و در جدول 2 خلاصه شده است . همانطور که در دو ردیف اول نشان داده شد، حدود 3.4 میلیون توییت دانلود شد که حدود 71 کیلو از وست لافایت، 348 کیلو از بلومینگتون، 295 کیلو از آن آربور، و بیش از 2.6 میلیون از کلمبوس دانلود شد. کلمبوس بیشترین کاربر توییتر را داشت، بیش از 52000، که بیشترین (بیش از 50) میانگین تعداد توییت به ازای هر کاربر را داشت. Ann Arbor کمترین توییت را داشت، کمتر از 20 توییت برای هر کاربر در یک دوره بیش از شش ماه.

2.3. داده های کاربری زمین

داده‌های کاربری محلی برای کمک به تفسیر الگوهای مکانی و زمانی توییت‌ها و ایجاد درک درستی از سبک زندگی مردم گنجانده شد. برای مقایسه الگوهای بین مناطق مختلف مورد مطالعه، انواع کاربری اراضی در هر شهر به دسته‌هایی دسته‌بندی شدند که تا حد امکان عمومی‌تر و در بین هر چهار شهر مشترک هستند. این یک گام ضروری است زیرا نقشه های منطقه بندی شهرهای مختلف از معناشناسی و هستی شناسی متفاوتی پیروی می کنند. گروه بندی مجدد کلاس ها، ارزیابی مقایسه ای را در شهرها ممکن می سازد. برای وست لافایت، داده‌های کاربری زمین بر اساس نقشه منطقه‌بندی ارائه‌شده توسط وب‌سایت Tippecanoe County GIS دیجیتالی شد. طبقات منطقه بندی اولیه مجدداً به پنج گروه تقسیم شدند: نهادی، مسکونی، تجاری، توسعه و غیره. داده های کاربری زمین بلومینگتون از وب سایت شهر بلومینگتون GIS دانلود شد. و طبقات کاربری زمین در پنج گروه سازمانی، مسکونی، تجاری، توسعه واحد برنامه ریزی شده (PUD) و غیره دسته بندی شدند. اطلاعات کاربری زمین Ann Arbor از وب سایت این شهر بازیابی شده است. طبقات به پنج گروه طبقه بندی شدند: سازمانی، مسکونی، تجاری، حمل و نقل و غیره. نقشه کاربری زمین کلمبوس از دفتر GIS شهر کلمبوس تهیه شده است. و طبقات منطقه بندی به پنج گروه سازمانی، مسکونی، تجاری، منطقه مرکزی شهر و تولیدی طبقه بندی شدند. اطلاعات کاربری زمین Ann Arbor از وب سایت این شهر بازیابی شده است. طبقات به پنج گروه طبقه بندی شدند: سازمانی، مسکونی، تجاری، حمل و نقل و غیره. نقشه کاربری زمین کلمبوس از دفتر GIS شهر کلمبوس تهیه شده است. و طبقات منطقه بندی به پنج گروه سازمانی، مسکونی، تجاری، منطقه مرکزی شهر و تولیدی طبقه بندی شدند. اطلاعات کاربری زمین Ann Arbor از وب سایت این شهر بازیابی شده است. طبقات به پنج گروه طبقه بندی شدند: سازمانی، مسکونی، تجاری، حمل و نقل و غیره. نقشه کاربری زمین کلمبوس از دفتر GIS شهر کلمبوس تهیه شده است. و طبقات منطقه بندی به پنج گروه سازمانی، مسکونی، تجاری، منطقه مرکزی شهر و تولیدی طبقه بندی شدند.

3. الگوهای مکانی و زمانی

3.1. الگوهای فضایی

دانستن مکان هایی که افراد معمولا توییت می کنند می تواند برای برنامه های مختلف مهم باشد. با این حال، به دلیل تجمیع نقاط ناشی از حجم زیاد داده ها، نمایش ساده تمام توییت ها روی نقشه برای آشکار کردن الگوهای مورد علاقه در این مطالعه مفید نخواهد بود. بنابراین، چگالی فضایی توییت‌ها، یعنی تعداد توییت‌ها در هر متر مربع در هر منطقه مورد مطالعه ایجاد و در نقشه‌های شکل 1 ترسیم شد . هنگام محاسبه چگالی، شعاع 0.25٪ از طول قطری منطقه مورد مطالعه انتخاب شد. اندازه سلول تقریباً به اندازه شعاع بود که برای چهار شهر به ترتیب 20، 30، 25 و 100 متر است.
همانطور که در شکل 1 نشان داده شده است ، در هر چهار شهر، بزرگترین گروه های توییت در محوطه دانشگاه و اطراف آن ظاهر می شوند. چند نمای نزدیکتر از نقاط داغ در چهار شهر در شکل 2 مشخص شده است . آنها در مجتمع های آپارتمانی، نواحی مرکز شهر و مراکز خرید بودند ( شکل 2 ). علاوه بر این، در مقایسه با وست لافایت، بلومینگتون، و آن آربور، جایی که بیشتر خوشه‌های توییت در اطراف دانشگاه ظاهر می‌شدند ( شکل 2 )، مکان‌های خوشه‌ها در کلمبوس در سراسر شهر پراکنده بودند و به طور یکنواخت‌تر توزیع شدند.

3.2. الگوهای زمانی

به نظر می رسد توییت ها در هر چهار منطقه مورد مطالعه الگوهای ساعتی مشابهی داشته باشند ( شکل 3). تعداد توییت ها و همچنین تعداد کاربران حدود ساعت 6 صبح زمانی که مردم بیدار می شدند و برای مدرسه یا محل کار آماده می شدند، افزایش یافت. رشد توییت‌ها در هر چهار شهر تا ساعت 12:00 بعد از ظهر ادامه داشت. برای لافایت غربی، این افزایش تا ساعت 13:00 ادامه داشت که به اوج خود رسید و سپس تا ساعت 16:00 بعد از ظهر شروع به کاهش کرد. در این بین، تعداد توییت‌ها کاهش یافت در سه شهر دیگر کاملاً پایدار باقی ماند. پس از ساعت 16:00، توییت ها دوباره شروع به افزایش کردند تا حدود ساعت 9:00 بعد از ظهر که به اوج رسیدند. این عصر احتمالاً زمانی بود که مردم از کار یا تحصیل، مراقبت از خانه یا استراحت برمی‌گشتند. برای West Lafayette، Bloomington و Ann Arbor، کل توییت‌ها در حدود ساعت 9:00 بعد از ظهر، زمان اوج، حدود 6٪ از تمام توییت‌ها را تشکیل می‌دهند. با این حال، برای کلمب، توییت‌ها در زمان اوج تقریباً 9٪ از کل توییت‌ها بودند. نشان می دهد که آنها ممکن است تغییرات بیشتری در برنامه های روزمره خود در مقایسه با دیگران داشته باشند. همچنین توجه شده است که در مقایسه با کلمبوس، تعداد کاربران در لافایت غربی در شب شروع به کاهش کرد. برعکس، تعداد کاربران در بلومینگتون ثابت ماند، که به این معنی است که مردم کلمبوس (شهر بزرگتر) در شب فعال تر از سایر شهرها هستند، که احتمالاً به دلیل اندازه کلمبوس و تنوع فعالیت های موجود در آنجا بود. پس از ساعت 9:00 شب، تعداد توییت‌ها دوباره کاهش یافت تا اینکه ساعت 12:00 صبح، زمانی که اکثر مردم احتمالاً برای خواب آماده می‌شدند. تعداد توییت‌ها تا حدود ساعت 4:00 تا 5:00 صبح کاهش یافت و به یک دره رسید. با توجه به آمارهای بالا، این نتیجه حاصل می شود که در این چهار شهر دو زمان اوج توئیت در طول روز وجود داشته است، یکی در ظهر و دیگری حوالی ساعت 21:00 شب. در شب تعداد توییت ها در طول روز در حدود ساعت 5 صبح و 17 بعد از ظهر به کمترین میزان خود می رسد و در نهایت باید توجه داشت که تعداد توییت ها و تعداد کاربران توییتر از یک الگوی ساعتی بسیار مشابه در طول روز پیروی می کنند.
تعداد کاربران در تعطیلات آخر هفته بیشتر از روزهای هفته بود. میانگین تعداد توییت‌ها در روز هفته کمتر از میانگین آخر هفته بود. علاوه بر این، گروه کاربری «روز هفته» و گروه کاربری «آخر هفته» تنها حدود 15 تا 20 درصد همپوشانی داشتند ( جدول 3 )، که به این معنی است که اکثر مردم فقط در روزهای هفته یا آخر هفته توییت می‌کنند، اما در هر دوی این‌ها نه. دلیل این امر ممکن است ترجیح کاربران برای ارسال توییت باشد، یا کاربرانی که آخر هفته‌ها شهر را ترک می‌کنند یا به شهر می‌آیند، که نشانه‌ای از تحرک و سبک زندگی افراد است.

3.3. الگوهای مکانی- زمانی

جدول 4 توئیت ها را از نظر کاربری زمین خلاصه می کند. توییت‌ها در مناطق سازمانی اکثر توییت‌ها را در لافایت غربی و بلومینگتون تشکیل می‌دهند، در حالی که توییت‌ها در آن آربور و کلمبوس در مناطق مسکونی بیشترین میزان را در میان کاربری‌های مختلف زمین به خود اختصاص داده‌اند (جدول 4) .). کمتر از 20 درصد از توییت‌ها در وست لافایت مربوط به مناطق مسکونی بود، در حالی که بیش از 72 درصد توییت‌ها مربوط به مدرسه یا اداره بودند، این واقعیت به وضوح ویژگی‌های معمول یک «شهرک دانشگاهی» را نشان می‌دهد، جایی که اکثر جمعیت‌ها از یک جهت با پوردو مرتبط هستند. یا دیگری بیش از 10 درصد از توییت‌ها مربوط به کاربری‌های تجاری در بلومینگتون و کلمبوس بود، جایی که مرزهای شهر و پردیس مشخصی وجود ندارد، که نشان‌دهنده ساختار شهری ترکیبی برای این دو منطقه شهر است. از سوی دیگر، West Lafayette و Ann Arbor درصد کمتری از توییت‌ها (1.4٪ – 6.3٪) از کاربری‌های تجاری زمین داشتند، که نشان می‌دهد فعالیت‌های تجاری و تجاری بیشتری برای رونق اقتصاد محلی در این دو حوزه مورد نظر است.
همانطور که در شکل 4 نشان داده شده است، توییت ها در کاربری های زمین با زمان در طول روز متفاوت هستند. در وست لافایت، بیشتر توییت‌ها از حوزه‌های سازمانی ارسال می‌شدند، که به طور ضمنی نشان می‌داد که اکثر کاربران توییتر احتمالاً دانشجویان دانشگاه هستند. کمی متفاوت از الگوی زمانی کلی همه توییت‌ها در شهر، اوج برای مناطق سازمانی حدود ساعت 12:00 تا 1:00 بعد از ظهر بود. پس از آن، تعداد توییت ها شروع به کاهش کرد تا حدود ساعت 7:00 بعد از ظهر، زمانی که در ساعت 10:00 شب به اوج خود رسید. کاربری زمینی که بیشترین تعداد توییت را داشت، مناطق مسکونی بود، جایی که تعداد توییت‌ها از ساعت 19:00 تا ساعت 10:00 شب به شدت افزایش یافت، که مربوط به دوره زمانی است که افراد از محل کار یا مدرسه خارج می‌شوند و به خانه بازمی‌گردند. توییت های بسیار کمی در سایر انواع کاربری زمین مانند صنعتی و تجاری یافت شد ( شکل 4 ).
مشابه وست لافایت، نوع کاربری زمین با بیشترین توئیت، مناطق سازمانی در بلومینگتون بود. الگوی زمانی نیز تقریباً یکسان بود با یک اوج در ساعت 12:00 بعد از آن کاهش تا ساعت 6:00 بعد از ظهر و سپس افزایش تا اوج در ~ 9:00 بعد از ظهر تا 10:00 بعد از ظهر، استنباط می شود که بسیاری از کاربران دانشجویان کالج هستند. . علاوه بر این، کاربری زمین با بیشترین تعداد توییت، مشابه وست لافایت، مناطق مسکونی بود. توییت‌ها در مناطق مسکونی نیز از ساعت 18:00 تا 21:00 شروع به افزایش کردند. با این حال، متفاوت از وست لافایت، که در آن تعداد کمی توییت از سایر مناطق کاربری زمین ارسال شده است، منطقه تجاری بلومینگتون تا 1٪ از کل را داشت که نشان می دهد کاربران در این مناطق فعال هستند.
متفاوت از وست لافایت و بلومینگتون، نوع کاربری زمین با بیشترین توئیت در آن آربور مناطق مسکونی بود، جایی که تعداد توییت‌ها از ساعت 6 صبح تا 10 صبح شروع به افزایش کرد، تا ساعت 6 بعد از ظهر ثابت ماند و سپس تا ساعت 9 شب افزایش یافت. انواع کاربری زمین با بیشترین تعداد توییت، مناطق سازمانی و حمل و نقل بودند. در حوزه‌های سازمانی، تعداد توییت‌ها از ساعت 2 بعدازظهر شروع به کاهش کرد و تا عصر دوباره افزایش نیافت، که با West Lafayette و Bloomington متفاوت است. این نشان می‌دهد که دانشجویان کمتری نسبت به وست لافایت و بلومینگتون در محوطه دانشگاه آن آربور حضور داشتند. انواع کاربری زمین در Ann Arbor شامل حمل و نقل است که عمدتاً از جاده ها و بزرگراه ها تشکیل شده است. و کشف اینکه تعداد زیادی از کاربران در جاده‌ها یا نزدیک به آن توییت می‌کردند، شگفت‌آور بود. هنگامی که تعداد توییت ها در مناطق مؤسسه کاهش یافت و در حوالی ساعت 16:00 تا 5:00 بعد از ظهر در مناطق حمل و نقل و مسکونی افزایش یافت، جریان جمعیتی از مناطق مؤسسه به مناطق حمل و نقل و مسکونی استنباط شد. در نهایت، با دانستن اینکه تعداد توییت ها در مناطق تجاری و تفریحی 0.2٪ تا 0.5٪ از کل توییت ها را تشکیل می دهد و توییت های نسبتاً بیشتری در طول روز انجام می شود، به این نتیجه رسیدیم که کاربران معمولاً در طول روز در آن مناطق فعال بودند. جریان جمعیتی از مناطق موسسه به مناطق حمل و نقل و مسکونی استنباط شد. در نهایت، با دانستن اینکه تعداد توییت ها در مناطق تجاری و تفریحی 0.2٪ تا 0.5٪ از کل توییت ها را تشکیل می دهد و توییت های نسبتاً بیشتری در طول روز انجام می شود، به این نتیجه رسیدیم که کاربران معمولاً در طول روز در آن مناطق فعال بودند. جریان جمعیتی از مناطق موسسه به مناطق حمل و نقل و مسکونی استنباط شد. در نهایت، با دانستن اینکه تعداد توییت ها در مناطق تجاری و تفریحی 0.2٪ تا 0.5٪ از کل توییت ها را تشکیل می دهد و توییت های نسبتاً بیشتری در طول روز انجام می شود، به این نتیجه رسیدیم که کاربران معمولاً در طول روز در آن مناطق فعال بودند.
در کلمبوس، اکثریت قریب به اتفاق توییت ها در مناطق مسکونی و به دنبال آن مناطق تجاری و سازمانی رخ داده است. توییت‌ها در حوزه‌های سازمانی الگوهایی شبیه به وست لافایت و بلومینگتون داشتند، با اوج‌گیری در حدود ساعت 12:00 بعد از ظهر و افزایش کمی در حدود 8:00 شب تا 9:00 شب. علاوه بر این، تعداد توییت‌ها در مناطق تجاری، با حداکثر رسیدن به 0.8٪ از همه توییت‌ها، تقریباً به اندازه تعداد توییت‌ها در مناطق سازمانی بود. از آنجایی که منطقه مرکز شهر، که دارای چندین کسب و کار تجاری، مراکز خرید و رستوران است، به یک نوع کاربری جداگانه، یعنی منطقه مرکز شهر تعلق دارد، تعداد توییت ها از منطقه تجاری باید بزرگتر از آنچه در اینجا نشان داده شده باشد. این درصد در بین هر چهار شهر بالاترین درصد بود.

4. رفتار و تحرک توییت کردن کاربر

4.1. تعداد توییت کاربران

این بخش خصوصیات تعداد توییت های ارسال شده توسط یک کاربر را بررسی می کند. شکل 5 تعداد توییت ها (به صورت لگاریتمی) همه کاربران توییت را به ترتیب نزولی نشان می دهد. یک پدیده دم بلند برای هر چهار شهر در توزیع تعداد توییت ها در مقابل تعداد کاربران آشکار شده است. این نشان می‌دهد که تعداد بسیار زیادی از کاربران در واقع تنها درصد بسیار کمی از توییت‌ها (دم بلند) را به اشتراک گذاشته‌اند، در حالی که تعداد نسبتا کمی از کاربران در واقع اکثر توییت‌ها را ارسال کرده‌اند (بخش سر کوتاه). برای مشخص بودن، همانطور که در جدول 2 نشان داده شده است5.3٪، 8.6٪، 3.7٪ و 5.1٪ از کل کاربرانی که بیش از 100 توییت ارسال کرده اند حتی می توانند به ترتیب 57.7٪، 71.3٪، 56.9٪ و 40.1٪ از کل توییت ها را برای چهار منطقه مورد مطالعه ایجاد کنند. از آنجایی که این درصد کاربران به میزان قابل توجهی بیشتر از سایر کاربران توییت ارسال کرده اند، به عنوان «کاربران مهم یا مکرر» در نظر گرفته می شوند. بنابراین، منطقی است که باور کنیم با تجزیه و تحلیل توییت های این کاربران مکرر می توان اطلاعات زیادی را به طور بالقوه کشف کرد. علاوه بر این، به دلیل تعداد زیاد توییت های ارسال شده از این کاربران، تعیین الگوهای حرکتی و مکان های مکرر آنها ممکن است امکان پذیر شود. از سوی دیگر، کاربران غیر قابل توجه، اغلب بیش از 95 درصد از کل کاربران، که در قسمت انتهایی منحنی ها زندگی می کنند، به عنوان یک گروه تنها کمی بیش از 30 درصد از کل توییت ها را تشکیل می دهند.

4.2. فرکانس توییت کاربران

این بخش ویژگی های تعداد دفعات ارسال توییت توسط کاربر را بررسی می کند. برای این منظور، فاصله زمانی، یعنی فرکانس بین دو توییت متوالی را برای هر کاربر محاسبه کردیم. سپس تعداد متناظر کاربران در برابر متوسط ​​فرکانس توییت آنها (بر حسب ساعت لگاریتمی) در شکل 6 خلاصه شده است.. توزیع‌های میانگین فرکانس توییت‌های کاربر همگی با یک دنباله بلند به سمت راست منحرف می‌شوند (با در نظر گرفتن اثر مقیاس لگاریتم زمانی که فرکانس بیش از 1 ساعت است) و از یک الگوی مشابه برای هر چهار شهر پیروی می‌کنند. باز هم، تنها درصد کمی از کاربران بیشتر با فرکانس چند ساعت توییت می‌کنند (0.2 در محور x مربوط به 1.6 ساعت)، در حالی که اکثر کاربران با فرکانس ده‌ها ساعت توییت می‌کنند (2 در x). -محور مربوط به 100 ساعت). حداکثر فرکانسی که در آن بیشترین درصد کاربران (حدود 4٪ تا 5٪) توییت می کنند، کمتر از 100 ساعت است، یعنی 4 روز. شکل 6همچنین نشان می دهد که تنها درصد کمی از کاربران با فرکانس کمتر از 1000 ساعت، یعنی بیش از یک ماه توییت کردند. جالب است بدانید که در بین کاربران توییتر در چهار شهر تفاوت معنی داری در فراوانی توییت مشاهده نمی شود. فرکانس حالت در همه شهرها حدود 2 تا 4 روز است.

4.3. تحرک کاربر

الگوریتم انتظار-بیشینه سازی (EM) [ 58 ] برای خوشه بندی فضایی توییت های تک تک کاربران استفاده شد. برای هر کاربر توییتر، الگوریتم EM در تمام مکان‌های توییت‌های این کاربر اعمال شد. تعداد خوشه ها برای یک کاربر در این تجزیه و تحلیل بیش از 5 عدد تعریف نشده است. EM یک روش تکراری دو مرحله ای برای یافتن راه حل های حداکثر احتمال است [ 59 ]. برای هر تکرار، مرحله اول، یعنی E-step (E-expectation)، احتمال هر نقطه متعلق به هر خوشه را ارزیابی می کند. سپس، مرحله دوم، مرحله M (M-Aximiation)، پارامترهای توزیع احتمال خوشه ها را تخمین می زند. الگوریتم تا زمانی اجرا می شود که پارامترهای توزیع همگرا شوند یا به حداکثر تعداد تکرار برسند [ 58]. الگوریتم EM اغلب برای خوشه بندی داده ها استفاده می شود و ثابت شده است که ساده، پایدار و مقاوم در برابر نویز است [ 60 ]. به طور خاص، از آن برای خوشه بندی فضایی استفاده شده است [ 61 ]. در این زیربخش، تنها کاربرانی با بیش از 100 توییت برای تجزیه و تحلیل تحرک مورد استفاده قرار گرفتند که 4 تا 8 درصد از کل کاربران را تشکیل می‌دهند و 70 تا 40 درصد از کل توییت‌ها را تشکیل می‌دهند (جدول 2 ) .
در جدول 5 درصد کاربرانی که تا پنج خوشه فضایی داشتند نشان داده شده است. وقتی یک خوشه توییت های بسیار کمی داشت، به عنوان مکان های پربازدید در نظر گرفته نمی شد. خوشه‌های توییت با کمتر از 5 درصد از کل توییت‌های فرد نیز حذف شدند. اکثر کاربران دو، سه یا چهار خوشه توییت داشتند، در حالی که تعداد کمی از آنها یک یا پنج خوشه داشتند. مشاهده می شود که اکثر کاربران توییت دارای سه خوشه بودند، در حالی که اغلب از آنها بازدید می کردند و توییت می کردند. این خوشه‌ها احتمالاً خانه‌ها، محل‌های کار یا مکان‌هایی بوده‌اند که کاربران به‌طور معمول از آنها بازدید کرده‌اند.
میانگین فاصله بین مراکز خوشه نشان داده شده در جدول 5 می تواند محدوده تحرک کاربر را تقریبی کند. برای هر کاربر توییتر، میانگین تمام فواصل بین هر دو مرکز به عنوان میانگین محدوده تحرک کاربر محاسبه شد. میانگین محدوده تحرک کاربران با شهر محل سکونت آنها متفاوت است. این تجزیه و تحلیل نشان داد که هر چه شهر بزرگتر باشد، فاصله سیار بیشتر است. همانطور که در جدول 5 نشان داده شده است، کاربران در وست لافایت کمترین میانگین و میانه محدوده میانگین تحرک کاربر را داشتند، در حالی که کاربران در کلمبوس بیشترین میزان را داشتند. برای چهار شهر، مقادیر میانگین بزرگتر از مقادیر میانه بود ( جدول 5، نشان می دهد که نیم یا بیشتر از فواصل کوچکتر از میانگین فاصله بوده است. شعاع شهر و محدوده تحرک میانه، و شعاع شهر و محدوده تحرک میانگین به صورت خطی در شکل 7 همبستگی پیدا کرده اند.. لازم به ذکر است که شعاع شهر در اینجا به عنوان اندازه گیری بعد یا اندازه شهر استفاده می شود. این بر این اساس است که اغلب مردم در کل شهر حمل و نقل نمی کنند و جابجایی مردم در همه جهات رخ می دهد. شعاع به صورت جذر مساحت شهر تقسیم بر π محاسبه شد. ضرایب دو مدل نشان می دهد که میانگین محدوده تحرک حدود 40 درصد شعاع شهر است. مقادیر مربع R این مدل‌های خطی حدود 0.99 است، که نشان می‌دهد آنها احتمالاً قادر به پیش‌بینی محدوده تحرک از ناحیه شهر هستند.
شکل 8 میانگین محدوده تحرک (فاصله) را برای همه کاربران مکرر نشان می دهد. توزیع به شدت به فواصل بزرگتر منحرف می شود، به این معنی که تعداد افرادی که دور از دانشگاه یا محل کار زندگی می کنند به طور قابل توجهی کاهش می یابد. در لافایت غربی، اکثر کاربران کمتر از 1 کیلومتر را با میانگین 1.34 کیلومتر و میانه 0.78 کیلومتر جابجا کردند ( جدول 5).)، استنباط می کند که ساکنان محلی با وسایل نقلیه کوتاهی به محل کار یا مدرسه می روند. در بلومینگتون، اکثریت میانگین برد حرکتی کاربران کمتر از 3 کیلومتر، با میانگین 1.65 کیلومتر و میانه 1.26 کیلومتر بود. میانگین محدوده تحرک کاربران در Ann Arbor از حدود 0.5 کیلومتر تا 4 کیلومتر با میانگین 1.89 کیلومتر و میانه 1.5 کیلومتر متغیر است. اگرچه محدوده میانگین و میانه تحرک برای بلومینگتون و آن آربور مشابه بود، مقادیر در اطراف میانه بلومینگتون جمع شدند، در حالی که مقادیر برای آن آربور به طور مساوی توزیع شدند. محدوده تحرک کاربران در کلمبوس بسیار بیشتر از شهرهای دیگر بود، با میانگین 5.76 کیلومتر و میانه 4.87 کیلومتر، احتمالاً به دلیل وسعت این کلان شهر.

5. نتیجه گیری ها

هدف از این تلاش، بررسی الگوهای مکانی و زمانی توئیت‌های دارای برچسب جغرافیایی از شهرها/شهرک‌های کالج غرب میانه و استنباط الگوهای تحرک انسانی کاربران توییتر است. ما انتظار داریم که چارچوبی برای داده کاوی جغرافیایی برای داده های رسانه های اجتماعی عمومی، به عنوان مثال، داده های توییتر ایجاد کنیم. ما از روش‌های تحلیلی و آماری مختلفی برای کشف زمان، مکان و رفتار توییت‌کردن کاربران توییتر استفاده کردیم و با چهار شهر کالج غرب میانه آزمایش کردیم. مشخص شد که اکثر توییت‌ها در واقع از سوی بخش کوچکی از کاربران توییتر ارسال می‌شوند. این چهار شهر الگوی مشابهی را در زمانی از روز توییت کاربران دارند که نشان می‌دهد زمان ارسال توییت ارتباط چندانی با اندازه یا ویژگی‌های شهر ندارد. بیشترین فعالیت کاربران توییتر در ساعت 9 شب در شب و ساعت 11 شب در روز است.
الگوی فضایی توزیع توییت ها با وسعت شهر متفاوت است. در شهرهای کوچکتر، توییت‌ها در مناطق سازمانی اکثر توییت‌ها را تشکیل می‌دهند. از سوی دیگر، توییت‌ها در مناطق مسکونی شهرهای بزرگ‌تر بیشترین سهم را دارند. تنها در شهرهای بزرگ، مجموعه‌های توییت در مراکز خرید یافت می‌شوند، در حالی که توییت‌ها معمولاً در محوطه‌های دانشگاهی و مجتمع‌های آپارتمانی در شهرهای کوچک جمع می‌شوند.
با اتخاذ یک دیدگاه کاربر محور، ما همچنین روشی را برای یافتن مکان‌هایی که مردم مرتباً از آن‌ها بازدید می‌کنند توسعه دادیم و فاصله تلفن همراه آنها را محاسبه کردیم. ما دریافتیم که اکثر کاربران توییتر دو تا چهار مکان بازدید مکرر دارند. علاوه بر این، متوسط ​​یا میانگین فاصله تلفن همراه همه کاربران در یک شهر با اندازه شهر همبستگی مثبت دارد. میانگین فاصله موبایل حدود 40 درصد شعاع شهر است.
با این حال، محدودیت‌هایی در استفاده از توییت‌ها در مطالعات علوم اجتماعی وجود دارد، زیرا داده‌ها ممکن است به دلایل مختلف مغرضانه باشند. به دلیل محدودیت‌های حریم خصوصی، اطلاعات کمی در مورد ساختار اجتماعی-اقتصادی کاربران توییتر وجود ندارد، اگرچه ما به طور منطقی معتقدیم که اکثر کاربران توییتر در وست لافایت، بلومینگتون و آن آربور با کالج‌های محلی مرتبط هستند. علاوه بر این، از آنجایی که توییتر از کاربران می‌خواهد که برای فعال کردن عملکرد برچسب جغرافیایی شرکت کنند، انگیزه انجام این کار با رفتارها و شخصیت‌های اجتماعی یا حتی پاداش‌های انجام این کار متفاوت است. بنابراین، کاربران توییتر ممکن است نماینده کامل مردم نباشند. علاوه بر این، داده‌های توییت مورد استفاده در این مطالعه تنها مواردی هستند که دارای برچسب جغرافیایی هستند. که بخش کوچکی از تمام توییت‌هایی است که Streaming API می‌تواند جمع‌آوری کند و حتی بخش کوچکی از کل مجموعه داده توییتر را تشکیل می‌دهد. به این ترتیب، دانش کشف شده ممکن است تنها منعکس کننده فعالیت های انسانی و الگوهای تحرک برای بخشی از کل جمعیت، به عنوان مثال، دانشجویان کالج باشد. یافته هایی که در اینجا در شهرهای دانشگاهی در غرب میانه ایالات متحده یافت می شود ممکن است برای مکان های دیگر با ساختارهای شهری و جمعیتی متفاوت به طور کامل مشاهده نشود.
ما پیش‌بینی می‌کنیم که یافته‌های این تحقیق می‌تواند برای آموزش تکنیک‌های یادگیری ماشینی پیشرفته برای استنباط الگوها و فعالیت‌های جمعیت بزرگ‌تری از کاربران توییتر، از جمله کسانی که از برچسب‌گذاری جغرافیایی منصرف می‌شوند، استفاده شود. در نتیجه، می‌توان انتظار داشت که روش ایجاد شده به مطالعه پویایی‌های انسانی عموم مردم بپردازد. علاوه بر این، با الهام از این تحقیق با استفاده از داده‌های توییتر، زمانی که رسانه‌های اجتماعی، تلفن همراه، تراکنش‌های کارت و سایر داده‌ها از جمعیت وسیع‌تری در دسترس باشد، می‌توانیم بینش عمیق‌تر و کامل‌تری در مورد الگوهای تحرک عموم مردم ایجاد کنیم. یکی دیگر از جهت‌گیری‌های احتمالی و ضروری آینده این نوع پژوهش، استفاده از محتوای توییت‌ها برای متن‌کاوی، مدل‌سازی موضوع و پردازش زبان طبیعی به‌منظور کشف دانش و الگوهای عمیق‌تر در مورد رفتار انسان و انسان است. این می‌تواند درک ماهیت فعالیت‌های کاربر و عملکرد مکان‌هایی را که توییت‌های مکرر در آنها اتفاق می‌افتد، تسهیل کند. همچنین می‌تواند به شناسایی خوشه‌های توییت فضا-زمان و استنتاج انواع گردهمایی‌ها یا رویدادها کمک کند. در نهایت، ممکن است امکان به کارگیری الگوهای مکانی و زمانی یافت شده در زمینه های وسیع تری مانند برنامه ریزی ترافیک، تحلیل بازار، توسعه شهری، سیاست و مطالعات علوم اجتماعی را بررسی کنیم.

منابع

  1. میلشتاین، اس. لوریکا، بی. ماگولاس، آر. هوچموث، جی. چاودری، ا. اوریلی، تی. توییتر و انقلاب پیام‌رسانی خرد: ارتباطات، اتصالات و بی‌درنگ – 140 کاراکتر در یک زمان . O’Reilly Media, Inc.: Sebastopol, CA, USA, 2008. [ Google Scholar ]
  2. توییتر. در دسترس آنلاین: http://en.wikipedia.org/wiki/Twitter (در 13 نوامبر 2016 قابل دسترسی است).
  3. استون، بی. توییتر، استارت آپی که نمی میرد. شکوفه. اتوبوس. هفته 2012 ، 1 ، 62-67. [ Google Scholar ]
  4. Lunden، I. تحلیلگر: توییتر در ژوئن 2012 از 500 میلیون کاربر عبور کرد که 140 میلیون نفر از آنها در ایالات متحده بودند. جاکارتا “بزرگترین توئیت” شهر. در دسترس آنلاین: https://techcrunch.com/2012/07/30/analyst-twitter-passed-500m-users-in-june-2012-140m-of-them-in-us-jakarta-biggest-tweeting-city / (دسترسی در 9 فوریه 2017).
  5. لیتارو، ک. وانگ، اس. کائو، جی. پادمنابهان، ع. Shook, E. نقشه برداری از ضربان قلب جهانی توییتر: جغرافیای توییتر. اولین دوشنبه 2013 18 . [ Google Scholar ] [ CrossRef ]
  6. میلر، جی. دانشمندان علوم اجتماعی وارد جریان توییت می شوند. Science 2011 ، 333 ، 1814-1815. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  7. استایگر، ای. آلبوکرک، JP; Zipf, A. An Advanced Systematic Literature Review on Spatio-Temperal Analyses of Twitter. ترانس. GIS 2015 ، 19 ، 809-834. [ Google Scholar ] [ CrossRef ]
  8. Goodchild، MF; Glennon، JA جمع سپاری اطلاعات جغرافیایی برای واکنش به بلایا: یک مرز تحقیقاتی. بین المللی جی دیجیت. زمین 2010 ، 3 ، 231-241. [ Google Scholar ] [ CrossRef ]
  9. یورگنس، دی. فینتی، تی. مک کوریستون، جی. Xu، YT; روث، دی. پیش بینی موقعیت جغرافیایی در توییتر با استفاده از شبکه های اجتماعی: تحلیل انتقادی و بررسی عملکرد فعلی. در مجموعه مقالات نهمین کنفرانس بین المللی AAAI در وب و رسانه های اجتماعی (ICWSM)، آکسفورد، انگلستان، 26-29 مه 2015.
  10. پرئوتیوک-پیترو، دی. Cohn، T. رفتارهای کاربر ماینینگ: مطالعه الگوهای ورود در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات پنجمین کنفرانس سالانه علوم وب ACM، پاریس، فرانسه، 2 تا 4 مه 2013. صص 306-315.
  11. فوجیساکا، تی. لی، آر. Sumiya, K. کشف الگوهای رفتار کاربر از میکرو وبلاگ‌های دارای برچسب جغرافیایی. در مجموعه مقالات چهارمین کنفرانس بین المللی مدیریت اطلاعات و ارتباطات همه جا حاضر، سوون، کره، 14 تا 15 ژانویه 2010.
  12. Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ]
  13. کارلی، KM; مالک، م. Landwehr، PM; پففر، جی. کوالچاک، ام. مدیریت بلایا منابع جمعی: ماهیت پیچیده استفاده از توییتر در پادانگ اندونزی. Saf. علمی 2016 ، 90 ، 48-61. [ Google Scholar ] [ CrossRef ]
  14. استیونسون، جی آر. امریش، سی تی. میچل، جی تی; کاتر، SL استفاده از مجوزهای ساختمانی برای نظارت بر بازیابی فاجعه: مطالعه موردی مکانی-زمانی ساحلی می سی سی پی پس از طوفان کاترینا. کارتوگر. Geogr. Inf. علمی 2010 ، 37 ، 57-68. [ Google Scholar ] [ CrossRef ]
  15. گرانل، سی. Ostermann، FO فراتر از جمع آوری داده ها: اهداف و روش های تحقیق با استفاده از VGI و رسانه های جغرافیایی اجتماعی برای مدیریت بلایا. محاسبه کنید. محیط زیست سیستم شهری 2016 ، 59 ، 231-243. [ Google Scholar ] [ CrossRef ]
  16. زوک، م. گراهام، ام. شلتون، تی. Gorman, S. داوطلبانه اطلاعات جغرافیایی و جمع سپاری امداد رسانی به بلایا: مطالعه موردی زلزله هائیتی. پزشکی جهانی سیاست سلامت 2010 ، 2 ، 7-33. [ Google Scholar ] [ CrossRef ]
  17. آرکائینی، پ. بوردوگنا، جی. ینکو، دی. Sterlacchini، S. کاوش مبتنی بر چگالی جغرافیایی-زمانی کاربر محور رویدادهای دوره ای و نه دوره ای گزارش شده در شبکه های اجتماعی. Inf. علمی 2016 ، 340 ، 122-143. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
  18. ناکاجی، ی. Yanai, K. تجسم رویدادهای دنیای واقعی با عکس‌های توییت دارای برچسب جغرافیایی. در مجموعه مقالات کنفرانس بین المللی IEEE در چند رسانه ای و کارگاه های نمایشگاهی (ICMEW)، ملبورن، استرالیا، 9 تا 13 ژوئیه 2012. صص 272-277.
  19. کرامپتون، جی دبلیو. گراهام، ام. پورتویس، ا. شلتون، تی. استفنز، ام. ویلسون، مگاوات؛ Zook, M. Beyond the geotag: Situating ‘big data’ و استفاده از پتانسیل geoweb. کارتوگر. Geogr. Inf. علمی 2013 ، 40 ، 130-139. [ Google Scholar ] [ CrossRef ]
  20. Tsou، MH; لایتنر، ام. تجسم رسانه های اجتماعی: دیدن سراب یا پیام؟ کارتوگر. Geogr. Inf. علمی 2013 ، 40 ، 55-60. [ Google Scholar ] [ CrossRef ]
  21. Tsou، MH; یانگ، جی. لوشر، دی. هان، اس. اسپیتزبرگ، بی. Gawron، JM; An, L. نقشه برداری از فعالیت ها و مفاهیم اجتماعی با رسانه های اجتماعی (تویتر) و موتورهای جستجوی وب (یاهو و بینگ): مطالعه موردی در انتخابات ریاست جمهوری ایالات متحده در سال 2012. کارتوگر. Geogr. Inf. علمی 2013 ، 40 ، 337-348. [ Google Scholar ] [ CrossRef ]
  22. قوش، د. گوها، آر. ما در مورد چاقی چه توییت می کنیم؟ نقشه برداری توییت ها با مدل سازی موضوع و سیستم اطلاعات جغرافیایی. کارتوگر. Geogr. Inf. علمی 2013 ، 40 ، 90-102. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  23. هولدرنس، تی. کندی واکر، آر. آلدرسون، دی. ایوانز، بی. ارزیابی مدل سازی شبکه فضایی برای کمک به برنامه ریزی بهداشتی در سکونتگاه های غیررسمی با استفاده از داده های جمع آوری شده. در مجموعه مقالات سمپوزیوم بین المللی برای زیرساخت های نسل بعدی، ولونگونگ، استرالیا، 1 تا 4 اکتبر 2013. ص 185-192.
  24. رویک، او. هوسر، اس. شبکه های اجتماعی مبتنی بر مکان – تعریف، وضعیت فعلی هنر و دستور کار تحقیقاتی. ترانس. GIS 2013 ، 17 ، 763-784. [ Google Scholar ] [ CrossRef ]
  25. گونزالس، ام سی؛ هیدالگو، کالیفرنیا؛ Barabasi, AL درک الگوهای حرکتی فردی انسان. طبیعت 2008 ، 453 ، 779-782. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  26. هاولکا، بی. سیتکو، آی. بینات، ای. سوبولفسکی، اس. کازاکوپولوس، پ. Ratti, C. توئیتر را به عنوان نماینده الگوهای تحرک جهانی در موقعیت جغرافیایی قرار داد. کارتوگر. Geogr. Inf. علمی 2014 ، 41 ، 260-271. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  27. کاورلی، جی. چنگ، ز. سویی، دی.زی. Kamath، KY به سوی هوش ژئو-اجتماعی: استخراج، تجزیه و تحلیل، و استفاده از ردپای جغرافیایی در رسانه های اجتماعی. IEEE Data Eng. گاو نر 2013 ، 36 ، 33-41. [ Google Scholar ]
  28. پنگ، سی. جین، ایکس. وونگ، ک. شی، م. Lio, P. الگوی تحرک جمعی انسان از سفرهای تاکسی در مناطق شهری. PLoS ONE 2012 ، 7 ، e34487. [ Google Scholar ]
  29. لیو، ی. وانگ، اف. شیائو، ی. گائو، جنوب، کاربری‌های زمین شهری و ترافیک «مناطق منبع غرق»: شواهدی از داده‌های تاکسی مجهز به GPS در شانگهای. Landsc. طرح شهری. 2012 ، 106 ، 73-87. [ Google Scholar ] [ CrossRef ]
  30. ژنگ، وی. ژنگ، ی. Xie، X. یانگ، Q. به سوی هوش تلفن همراه: یادگیری از داده های تاریخچه GPS برای توصیه های مشترک. آرتیف. هوشمند 2012 ، 184 ، 17-37. [ Google Scholar ] [ CrossRef ]
  31. چنگ، ز. کاورلی، جی. تره فرنگی.؛ Sui, D. کاوش میلیون‌ها ردپا در خدمات اشتراک‌گذاری مکان. در مجموعه مقالات پنجمین کنفرانس بین المللی AAAI در مورد وبلاگ ها و رسانه های اجتماعی، بارسلون، اسپانیا، 17-21 ژوئیه 2011. صص 81-88.
  32. لیانگ، ایکس. ژائو، جی. دونگ، ال. شو، ک. کشف منشأ قانون نمایی در تحرک انسان درون شهری. علمی Rep. 2013 , 3 , 2983. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  33. Bagrow، JP; لین، ی. ساختار مزوسکوپی و جنبه های اجتماعی تحرک انسان. PLoS ONE 2012 ، 7 ، e37676. [ Google Scholar ] [ CrossRef ] [ PubMed ]
  34. Bayir، MA; دمیرباس، م. Eagle, N. کشف پروفایل های تحرک مکانی و زمانی کاربران تلفن همراه. در مجموعه مقالات سمپوزیوم بین المللی IEEE در سال 2009 در مورد “دنیای شبکه ها و کارگاه های آموزشی بی سیم، موبایل و چند رسانه ای” (WoWMoM 2009)، کوس، یونان، 15-19 ژوئن 2009; صفحات 1-9.
  35. یانگ، ایکس. نیش، ز. خو، ی. شاو، اس ال. ژائو، ز. یین، ال. ژانگ، تی. Lin, Y. درک الگوهای مکانی و زمانی همگرایی و واگرایی انسانی با استفاده از داده های مکان تلفن همراه. ISPRS Int. J. Geo-Inf. 2016 ، 5 ، 177. [ Google Scholar ] [ CrossRef ]
  36. حسن، س. اشنایدر، سی ام. اوکوسوری، اس وی؛ گونزالس، MC الگوهای فضایی-زمانی تحرک انسان شهری. J. Stat. فیزیک 2013 ، 151 ، 304-318. [ Google Scholar ] [ CrossRef ]
  37. گونگ، ال. لیو، ایکس. وو، ال. لیو، ی. استنباط اهداف سفر و کشف الگوهای سفر از داده‌های مسیر تاکسی. کارتوگر. Geogr. Inf. علمی 2016 ، 43 ، 103-114. [ Google Scholar ] [ CrossRef ]
  38. هوانگ، Q. Wong، DW الگوهای فعالیت، وضعیت اجتماعی-اقتصادی و ساختار فضایی شهری: داده های رسانه های اجتماعی چه چیزی می توانند به ما بگویند؟ بین المللی جی. جئوگر. Inf. علمی 2016 ، 30 ، 1873-1898. [ Google Scholar ] [ CrossRef ]
  39. گائو، اس. یانگ، جی. یان، بی. هو، ی. یانوویچ، ک. مک‌کنزی، جی. تشخیص جریان‌های تحرک مبدا-مقصد از توییت‌های دارای برچسب جغرافیایی در منطقه بزرگ لس آنجلس. در مجموعه مقالات هشتمین کنفرانس بین المللی علم اطلاعات جغرافیایی (GIScience’14)، وین، اتریش، 24–26 سپتامبر 2014.
  40. ژیراردین، اف. کالابرس، اف. Fiore، FD; راتی، سی. Blat, J. Digital footprinting: کشف گردشگران با محتوای تولید شده توسط کاربر. محاسبات فراگیر IEEE 2008 ، 7 ، 36-43. [ Google Scholar ] [ CrossRef ]
  41. لئونگ، آر. Vu، HQ; رانگ، جی. Miao، Y. بازدید گردشگران و تجزیه و تحلیل رفتار به اشتراک گذاری عکس: مطالعه موردی معابد هنگ کنگ. در فناوری اطلاعات و ارتباطات در گردشگری 2016 ; انتشارات بین المللی اسپرینگر: چم، سوئیس، 2016; ص 197-209. [ Google Scholar ]
  42. پوپسکو، آ. گرفنستت، جی. اطلاعات گردشگری Moëllic، PA Mining از مجموعه های ارائه شده توسط کاربر. در مجموعه مقالات هجدهمین کنفرانس ACM در مدیریت اطلاعات و دانش، هنگ کنگ، چین، 2 تا 6 نوامبر 2009. صفحات 1713-1716.
  43. لی، ال. Goodchild، MF; Xu، B. الگوهای مکانی، زمانی و اجتماعی-اقتصادی در استفاده از توییتر و فلیکر. کارتوگر. Geogr. Inf. علمی 2013 ، 40 ، 61-77. [ Google Scholar ] [ CrossRef ]
  44. لی، ی. شان، جی. درک الگوی فضایی-زمانی توییت ها. فتوگرام مهندس Remote Sens. 2013 ، 79 ، 769-773. [ Google Scholar ]
  45. وست لافایت، ایندیانا در دسترس آنلاین: http://en.wikipedia.org/wiki/West_Lafayette,_Indiana (دسترسی در 5 نوامبر 2014).
  46. دانشگاه پوردو. در دسترس آنلاین: http://en.wikipedia.org/wiki/Purdue_University (در 1 اوت 2013 قابل دسترسی است).
  47. بلومینگتون، ایندیانا در دسترس آنلاین: http://en.wikipedia.org/wiki/Bloomington,_Indiana (دسترسی در 5 نوامبر 2014).
  48. مسکن. در دسترس آنلاین: http://www.iub.edu/student/housing.shtml (دسترسی در 5 نوامبر 2014).
  49. آن آربر، میشیگان در دسترس آنلاین: http://en.wikipedia.org/wiki/Ann_Arbor,_Michigan (دسترسی در 6 نوامبر 2014).
  50. گزینه های مسکن در دسترس آنلاین: http://housing.umich.edu/options (در 6 نوامبر 2014 قابل دسترسی است).
  51. کلمبوس، اوهایو در دسترس آنلاین: http://en.wikipedia.org/wiki/Columbus,_Ohio (دسترسی در 6 نوامبر 2014).
  52. دانشگاه ایالتی اوهایو در دسترس آنلاین: http://en.wikipedia.org/wiki/Ohio_State_University (در 6 نوامبر 2014 قابل دسترسی است).
  53. نمای کلی APIهای جریانی. در دسترس آنلاین: https://dev.twitter.com/streaming/overview (در 6 نوامبر 2014 قابل دسترسی است).
  54. توییپی در دسترس آنلاین: http://www.tweepy.org/ (دسترسی در 4 فوریه 2017).
  55. Twitter-Streamer. در دسترس آنلاین: https://github.com/inactivist/twitter-streamer (در 4 فوریه 2017 قابل دسترسی است).
  56. محدودیت نرخ API. در دسترس آنلاین: https://dev.twitter.com/rest/public/rate-limiting (در 4 فوریه 2017 قابل دسترسی است).
  57. پسینا، KM، جونیور؛ هیث، آر دبلیو، جونیور؛ هامفریس، موقعیت یابی سانتی متری TE با آنتن GNSS با کیفیت گوشی هوشمند. GPS World، 2 فوریه 2015. موجود به صورت آنلاین: http://gpsworld.com/accuracy-in-the-palm-of-your-hand/ (دسترسی در 10 ژانویه 2017).
  58. Dempster، AP; لرد، NM; Rubin، DB حداکثر احتمال داده های ناقص از طریق الگوریتم EM. JR Stat. اجتماعی 1977 ، 39 ، 1-38. [ Google Scholar ]
  59. آگاروال، سی سی; Reddy, CK Data Clustering: الگوریتم‌ها و برنامه‌ها . CRC Press: Boca Raton، FL، USA، 2013. [ Google Scholar ]
  60. دسته.؛ مک.؛ Wu, J. خوشه بندی داده ها: نظریه، الگوریتم ها و کاربردها . SIAM: Philadelphia, PA, USA, 2007; جلد 20. [ Google Scholar ]
  61. آمبرویز، سی. دانگ، م. Govaert، G. خوشه بندی داده های مکانی توسط الگوریتم EM. در geoENV I — زمین آمار برای کاربردهای زیست محیطی ; Springer Science+Business Media BV: Dordrecht، هلند، 1997; صص 493-504. [ Google Scholar ]
شکل 1. نقشه های مناطق مورد مطالعه چهار نفر و تراکم توییت آنها (شمارش توییت/متر مربع).
شکل 2. نماهای نزدیک تر از مکان های انتخاب شده توییت های متراکم در چهار شهر.
شکل 3. توزیع تعداد توییت های ساعتی ( سمت چپ ) و کاربران ( راست ) برای چهار شهر.
شکل 4. توزیع تعداد (به تعداد و درصد) توییت های ساعتی از نظر کاربری.
شکل 5. تعداد توییت ها (بر حسب لگاریتم) به ترتیب نزولی برای همه کاربران.
شکل 6. تعداد (بر حسب تعداد و درصد) کاربران در مقابل فرکانس توییت (بر حسب ساعت لگاریتم)
شکل 7. رابطه بین شعاع شهر و میانگین فاصله موبایل کاربران.
شکل 8. توزیع میانگین محدوده تحرک کاربران مکرر.
جدول 1. داده های ژئودموگرافیک چهار شهر مورد مطالعه.
جدول 2. تعداد توییت ها، کاربران و کاربران مکرر با بیش از 100 توییت.
جدول 3. تعداد کاربران متمایز در روزهای هفته و آخر هفته.
جدول 4. درصد توییت ها در کاربری های مختلف زمین.
جدول 5. درصد کاربران خوشه های فضایی مختلف و فواصل آنها.

بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *