ارزیابی مناطق تجاری با استفاده از داده های رسانه های اجتماعی با مدل هاف کالیبره شده

خلاصه

محدود کردن مناطق تجاری یک نگرانی عمده تجاری است. امروزه فناوری های ارتباطی سیار امکان استفاده از داده های رسانه های اجتماعی را برای این منظور فراهم می کند. با این حال، مطالعات کمی بر روش‌هایی برای استخراج نمونه‌های مناسب از داده‌های رسانه‌های اجتماعی برای تعیین حدود منطقه تجاری متمرکز شده‌اند. در مطالعه موردی خود، پکن را به سلول های شبکه منظم تقسیم کردیم و مراکز فعالیت را برای هر کاربر رسانه های اجتماعی استخراج کردیم. ده مجموعه نمونه با انتخاب کاربران بر اساس تجمع‌های خرده‌فروشی که بازدید کرده‌اند و تجمیع مراکز فعالیت کاربر در هر سلول شبکه به‌دست آمد. ما ویژگی‌های فاصله و فرکانس بازدید را برای هر کاربر و هر سلول شبکه محاسبه کردیم. مقدار فاصله یک سلول شبکه، میانگین فاصله مراکز فعالیت کاربر در این سلول شبکه تا یک تجمع خرده فروشی است. فرکانس بازدید از سلول شبکه به میانگین تعداد بازدید از تجمعات خرده فروشی توسط مراکز فعالیت کاربر برای یک سلول اشاره دارد. مقادیر مشخصه محاسبه شده از 10 مجموعه در مدل هاف وارد شده و مناطق تجاری محدود شده ارزیابی شدند. نتایج نشان می‌دهد که مجموعه‌های به‌دست‌آمده با تجمیع مراکز فعالیت کاربر، نسبت به مجموعه‌هایی که بدون تجمع به‌دست می‌آیند، تأثیر تعیین‌کننده بهتری دارند. تفاوت در توزیع و شدت مناطق تجاری نیز آشکار شد.

کلید واژه ها:

منطقه تجاری ؛ رسانه های اجتماعی ؛ انتخاب کاربر ؛ تجمع فضایی ; مدل هاف

1. معرفی

محدود کردن حوزه‌های تجاری می‌تواند به کسب‌وکارها کمک کند تا فرصت‌های بازار، توزیع مشتریان و ویژگی‌های مشتری را برای طراحی استراتژی‌های تجاری رقابتی‌تر درک کنند. بنابراین، تعیین حدود مناطق تجاری یکی از دغدغه های اصلی شرکت های خرده فروشی و خدماتی است [ 1 ]. به گفته هاف، یک منطقه تجاری “منطقه ای است که از نظر جغرافیایی مشخص شده است که شامل مشتریان بالقوه ای است که احتمال خرید آنها برای طبقه معینی از محصولات یا خدمات ارائه شده برای فروش توسط یک شرکت خاص یا توسط یک مجموعه خاص از شرکت ها بیشتر از صفر است.” [ 2]. بنابراین، یک درک تجربی از مناطق تجاری، پایه و اساس هوش تجاری استراتژیک و مقدمه ای است که در پس انتخاب مکان برای تسهیلات تجاری جدید یا خدمات پذیرایی قرار دارد.

منبع داده سنتی برای تعیین حدود مناطق تجاری اغلب اطلاعات مشتری است که از نظرسنجی ها به دست می آید. این اطلاعات می تواند شامل محل سکونت و دفعات بازدید از امکانات تجاری باشد. اطلاعات پاسخ‌دهندگان جمع‌آوری‌شده از پرسشنامه‌ها نسبتاً کامل است و هر پاسخ‌دهنده را می‌توان به عنوان یک نمونه در هنگام تعیین محدوده‌های تجاری در نظر گرفت. مدیران می توانند از این مناطق تجاری محدود شده برای مکان یابی سوپرمارکت های جدید با عدم اطمینان کمتر [ 3 ] و برای برآورد دقیق فروش فروشگاه های فردی استفاده کنند [ 4 ]. نظرسنجی ها متداول ترین روشی هستند که برای به دست آوردن اطلاعات مشتری مورد استفاده قرار می گیرند، اما کار فشرده و زمان بر هستند [ 5 ]. علاوه بر این، نرخ پاسخ و تعداد پاسخ دهندگان نسبتا پایین است [6 ]. بنابراین، داده‌های دیگر و روش‌های دیگری برای درک و تعیین حدود مناطق تجاری مورد نیاز است. رسانه های اجتماعی ممکن است راه حلی ارائه دهند.

داده‌های رسانه‌های اجتماعی فرصت‌های نویدبخشی را برای درک بهتر رفتارهای مصرف‌کننده و تعیین محدوده‌های تجاری باز می‌کنند. این داده‌ها راحت‌تر از داده‌های نظرسنجی به‌دست می‌آیند و منعکس‌کننده رفتار تعداد زیادی از کاربران در دوره‌های نسبتاً طولانی هستند تا رفتارهای نمونه کوچکی از مصرف‌کنندگان. به عنوان نماینده ای برای جمعیت بزرگتر خدمت می کند. با این حال، داده های رسانه های اجتماعی محدود هستند، زیرا نمی توانند فعالیت های تکمیل شده کاربر را در دنیای واقعی منعکس کنند. ما فقط می توانیم فعالیت هایی را مشاهده کنیم که یک فرد در رسانه های اجتماعی به اشتراک می گذارد [ 7 , 8 , 9 , 10]. در این مقاله، ما بر توسعه راه‌های جدید برای تعیین حدود مناطق تجاری با استفاده از رسانه‌های اجتماعی به روش‌هایی تمرکز می‌کنیم که بر کیفیت‌های جزئی و ناقص این منبع داده غنی غلبه کند.

تحقیقات فزاینده ای در مورد داده های رسانه های اجتماعی که برای تجزیه و تحلیل منطقه تجاری اعمال می شود، وجود دارد. هو و همکاران [ 11 ] آزمایشی را برای استخراج در منطقه تجاری با داده های ورود به سیستم به دست آمده از خدمات رسانه های اجتماعی طراحی کرد. مناطق تجاری استخراج شده به این روش ارتباط زیادی با برنامه ریزی شهری داشتند اما برای تعیین محدوده تجاری یک فروشگاه خاص یا تجمع خرده فروشی مناسب نبودند. کو و همکاران [ 12] هر کاربر فلیکر را به عنوان یک نمونه در نظر گرفت. بر اساس این داده ها، آنها مناطق تجاری را برای انواع مختلف تسهیلات تجاری، بدون ارزیابی تعیین کردند. از آنجایی که داده‌های رسانه‌های اجتماعی فعالیت‌های کامل را منعکس نمی‌کنند، مناسب نیست که هر کاربر فردی را به عنوان یک موضوع نمونه در هنگام تعیین محدوده‌های تجاری در نظر بگیریم. تا به امروز، هیچ مطالعه‌ای در مورد چگونگی استخراج نمونه‌هایی از داده‌های رسانه‌های اجتماعی که برای تعیین حدود مناطق تجاری مناسب هستند، تحقیق نکرده است. تحقیقات ما به این مشکل می پردازد و راه حلی عملی برای مشاغل به روشی مقرون به صرفه ارائه می دهد.

ما یک روش بهبود یافته را برای تعیین حدود مناطق تجاری با استفاده از داده های رسانه های اجتماعی پیشنهاد می کنیم. در رویکرد ما، خوشه‌بندی فضایی مبتنی بر چگالی برنامه‌های کاربردی با الگوریتم خوشه‌بندی نویز (DBSCAN) برای استخراج مرکز فعالیت برای هر کاربر Sina Weibo اعمال شد. سپس، 10 مجموعه نمونه با انتخاب کاربران بر اساس تعداد مناطق از پیش تعریف شده بازدید شده و تجمیع این مراکز فعالیت کاربر در هر سلول شبکه، گروه بندی شدند. ما ویژگی‌های فاصله و فرکانس بازدید را برای هر کاربر و هر سلول شبکه محاسبه کردیم. مقدار فاصله یک سلول شبکه، میانگین فاصله مراکز فعالیت کاربر در این سلول شبکه تا یک تجمع خرده فروشی است. تعداد بازدید از سلول شبکه به میانگین تعداد بازدید از تجمعات خرده فروشی توسط مراکز فعالیت کاربر برای این سلول اشاره دارد. ویژگی‌های فاصله و فرکانس بازدید 10 مجموعه نمونه در مدل هاف، یک روش سنتی تعیین حدود منطقه تجاری، وارد شد. ریشه میانگین مربعات خطا (RMSE) و ضریب تعیین (R2 ) برای ^{ارزیابی} مناطق تجاری محدود شده استفاده شد. نتایج ما نشان می‌دهد که استفاده از واحدهای فضایی برای جمع‌آوری کاربران رسانه‌های اجتماعی، تعیین حدود مناطق تجاری را بهبود می‌بخشد. این نتایج همچنین ویژگی های اندازه و شدت مناطق مختلف تجاری را نشان می دهد.

2. پس زمینه

2.1. روش تحدید محدوده تجاری

روش های مختلفی برای تعیین حدود و تجزیه و تحلیل مناطق تجاری وجود دارد. روش های اصلی شامل مدل رینگ، مدل ورونوی، مدل رگرسیون، روش آنالوگ و مدل هاف است. این روش ها از ساده مانند مدل حلقه تا پیچیده و پیچیده مانند مدل هاف را شامل می شود. همه روش ها به مقدار زیادی نمونه نیاز دارند، به جز مدل های Ring و Voronoi.

با تطبیق نظریه مکان مرکزی کریستالر [ 13 ]، یک مدل مورفولوژیکی متحدالمرکز توسط اپلبام و کوهن [ 14 ] برای تعیین محدوده تجاری فروشگاه با کشیدن حلقه‌هایی در اطراف محل فروشگاه، با فروشگاه به عنوان نقطه مرکزی، پیشنهاد شد . یک مشکل با این رویکرد این است که یک منطقه تجاری اغلب از توزیع های غیر همسانگرد مصرف کنندگان ساخته شده است که ممکن است الگوی منطقه تجاری را تحریف کند [ 15 ].

روش های Voronoi یک راه سریع و ساده برای تعریف مناطق تجاری بر اساس مفهوم ریاضی چندضلعی های Thiessen ارائه می دهند. چند ضلعی تیسن تقسیم بندی یک صفحه به مناطق بر اساس فاصله تا نقاط در زیر مجموعه خاصی از صفحه است [ 16 ]. نقطه ضعف این روش این فرض است که هیچ عامل مؤثری بر تحدید محدوده تجاری به جز فاصله اقلیدسی وجود ندارد.

روش رگرسیون به دنبال اندازه گیری یک پارامتر عملکرد با همبستگی آن با متغیرهای مختلف اجتماعی-اقتصادی، محیطی و بازاریابی است [ 17 ]. رگرسیون به طور گسترده ای برای تعیین حدود منطقه تجاری اعمال نمی شود زیرا به مشاهدات زیادی نیاز دارد و متغیرهای توضیحی بیشتری باید گنجانده شوند [ 18 ].

یک روش تجربی رایج بر اساس تجربه قبلی برای تعیین مرزهای مناطق تجاری، روش آنالوگ [ 19 ] است. این روش ابتدا محل سکونت را بر روی نقشه ترسیم می کند. سپس سطوح مختلف حوزه تجارت با توجه به تعداد مشتریان محدود تعریف می شود. نقطه ضعف روش آنالوگ این است که منطقه تجاری محدود نمی تواند روابط رقابتی بین امکانات تجاری مختلف را آشکار کند [ 20 ].

مدل هاف یکی از متداول‌ترین روش‌های مورد استفاده برای تعیین حدود منطقه تجاری است [ 15 ]. این مدل فرض می کند که منطقه تجاری توسط دو عامل تعیین می شود: (1) فاصله بین مشتریان و امکانات تجاری مختلف. (2) جذابیت هر یک از امکانات [ 2 ]. مدل هاف را می توان به صورت زیر در نظر گرفت:

پ من ج = آ α j D λ من ج / \sum n j = 1 ( آ α j D λ من ج / )

(1)

که در آن P _ij احتمال مشتریانی است که در منطقه من برای بازدید از تأسیسات تجاری یا خرده فروشی j می روم . A _j جذابیت تاسیسات یا مجتمع خرده فروشی j است . D _ij فاصله بین i و j است و α، λ به ترتیب پارامترهای حساس جذابیت و فاصله هستند. هاف ابتدا α و λ را به صورت پیش فرض 1 و 2 تعریف کرد. گاوتشی [ 21 ] و همچنین اپلی و شیلینگ [ 22]] نشان می دهد که پارامترهای حساس ممکن است در تحقیقات قبلی مدل هاف به طور قابل توجهی اغراق شده باشند. بر این اساس، کالیبراسیون پارامتر در طول اعمال مدل هاف برای تعیین حدود مناطق تجاری بسیار ضروری است. امکانات بازدید، فواصل و جذابیت ویژگی های ضروری هر موضوعی است که ورودی مدل هاف است.

در مقایسه با سایر روش‌های منطقه تجاری، عوامل تأثیرگذار در نظر گرفته شده توسط مدل هاف نسبتاً کامل هستند. یک مدل هاف می تواند یک منطقه تجاری را با دقت مشخص کند و رابطه رقابتی بین امکانات را با جزئیات نشان دهد. بنابراین، در این مقاله از مدل هاف برای تعیین حدود مناطق تجاری استفاده کردیم.

2.2. سینا ویبو

Sina Weibo که در سال 2009 تأسیس شد، یکی از بزرگترین خدمات رسانه های اجتماعی در چین است [ 23 ]. از دسامبر 2012، کاربران فعال می توانند روزانه 4.6 میلیون نفر با حدود 100 میلیون پیام ارسال شده در هر روز [ 24 ]. Sina Weibo به کاربران این امکان را می‌دهد تا محتوای مختصری به نام «میکروبلاگ» را در قالب جملات کوتاه، تصاویر جداگانه، لینک‌های صفحه وب یا پیوندهای ویدیویی به‌روزرسانی کنند. مشابه پیام‌های توییتر به نام «توییت»، کاربران Sina Weibo فقط می‌توانند پیام‌هایی را در محدوده 140 نویسه چینی ارسال کنند. توابع Sina Weibo بسیار شبیه به توییتر هستند، مانند retweets (RTs)، ذکر شده (@)، و هشتگ (#) [ 25 ].

Sina Weibo به کاربران این امکان را می دهد که در نقاط مورد علاقه (POI) چک کنند. این داده‌های ورود می‌توانند برای تعیین حدود مناطق تجاری در دنیای واقعی استفاده شوند [ 12 ]. داده های اعلام حضور با رفتار خرید مشتریان واقعی متفاوت است، اما راحت تر به دست می آیند و می توانند اطلاعات مفیدی در مورد فعالیت های مشتری ارائه دهند.

3. داده ها و منطقه مطالعه

3.1. جمع آوری داده ها و پیش پردازش

به منظور به دست آوردن داده‌های Sina Weibo مربوط به زندگی روزمره مردم، داده‌های رسانه‌های اجتماعی با برچسب جغرافیایی را با Sina API جمع‌آوری کردیم و نویز را فیلتر کردیم. ما از API با نام “place/nearby_timeline” ارائه شده توسط Sina Weibo برای جمع آوری داده های برچسب گذاری شده جغرافیایی در پکن استفاده کردیم. این API می‌تواند داده‌های Sina Weibo را که در دایره‌هایی با مراکز و شعاع‌های معین قرار دارند، بدست آورد. مرکز را می توان در هر مکانی قرار داد و شعاع را می توان روی هر مقداری از 2 تا 11 کیلومتر تنظیم کرد. مجموعه ای از دایره ها به شعاع 10 کیلومتر برای پوشش منطقه مرکزی پکن تنظیم شده بود. با فیلتر کردن موارد تکراری، در مجموع 16682330 پیام Weibo با برچسب جغرافیایی ارسال شده بین 1 ژانویه 2014 تا 28 فوریه 2015 جمع آوری کردیم. نمونه هایی از داده های Weibo در جدول 1 نشان داده شده است.. هر پیام Weibo دارای چندین ویژگی است: شناسه Weibo، شناسه کاربری، محل ثبت نام، زمان ارسال پست Weibo، متن Weibo، مختصات مکان ارسال، شناسه POI ورود، و نام. در میان این ویژگی ها، محل ثبت نام به شهر یا منطقه ای اطلاق می شود که کاربر در آن زندگی می کند اما محل دقیق سکونت او نیست. بنابراین محل سکونت کاربر باید از داده های Sina Weibo آنها استخراج شود.

نویز در داده های Sina Weibo در طول پیش پردازش فیلتر شد. بر اساس تجربیات یک مطالعه قبلی [ 25 ]، نویز عمدتاً تبلیغاتی بود که در Sina Weibo ارسال شده بود و بیشتر تبلیغات دارای نمادهای خاصی مانند “【】 بودند. پس از فرآیند فیلتر کردن، 16,676,720 پیام Weibo ارسال شده توسط 2,428,705 کاربر برای تجزیه و تحلیل بیشتر حفظ شد.

3.2. منطقه مطالعه

پکن پایتخت چین است و از نظر مساحت پس از شانگهای دومین کلان شهر بزرگ چین است. تجمعات خرده فروشی همگام با توسعه اقتصادی کلی این مناطق شهری شکل گرفتند. در تحقیقات خود، از پنج مجتمع خرده فروشی در پکن به عنوان موارد آزمایشی استفاده کردیم. مکان ها و توزیع این پنج مجتمع خرده فروشی پکن، که در یک بررسی میدانی جمع آوری شده اند، در شکل 1 نشان داده شده است.. مرزهای Zhongguancun (“Z”) خیابان Zhongguangcun، خیابان Suzhou، جاده غربی حلقه چهارم شمالی و جاده جنوبی Haidian است. Xidan (“X”) در جنوب Xirongxian Hutong و شمال Lingjing Hutong با خیابان شمالی Xidan به عنوان محور قرار دارد. Wangfujing (“W”) قدیمی ترین مجتمع خرده فروشی در پکن است. مجتمع خرده فروشی وانگ فوجینگ بر اساس خیابان وانگ فوجینگ، در جنوب خیابان چانگان، شمال دنگشی، شرق جینگیو هوتونگ و غرب خیابان دونگانمنگ قرار دارد. Chaowai (“C”) در غرب حلقه دوم شرقی، شرق جاده حلقه سوم شرقی، با خیابان Chaowai به عنوان محور است. گومائو (“G”) بزرگترین مجتمع خرده فروشی در پکن در حال حاضر است. در تقاطع رینگ سوم شرقی و خیابان جیانگومن واقع شده است. همه مجتمع‌های خرده‌فروشی در بخش شرقی-غربی پکن به جز Zhongguancun هستند.

4. روش ها

در این بخش، بر اساس مدل هاف، روش تور خود را برای استخراج نمونه هایی که می تواند برای تعیین محدوده تجاری از داده های رسانه های اجتماعی مناسب باشد، شرح می دهیم. چارچوب تور در شکل 2 نشان داده شده است . ابتدا، کاربران رسانه های اجتماعی را که توسط هر مجموعه خرده فروشی جذب شده اند، استخراج می کنیم. سپس، الگوریتم خوشه‌بندی DBSCAN برای استخراج مرکز فعالیت برای هر کاربر اعمال می‌شود. اصطلاح مرکز فعالیت به میانگین نقطه مرکزی منطقه جغرافیایی اشاره دارد که کاربر اغلب در آن ظاهر می شود [ 26]]. ما تعداد بازدید، مسافت سفر و جذابیت را برای هر مجموعه خرده فروشی محاسبه کردیم. مجموعه های مختلف نمونه با انتخاب کاربر و تجمع فضایی به دست آمد. در مرحله آخر، مناطق تجاری محدود شده را با مجموعه های نمونه مختلف ارزیابی کردیم.

4.1. استخراج کاربران جذب شده

امکانات بزرگ بیشترین سهم را در جذابیت یک مجتمع خرده فروشی دارد [ 27 ]. از آنجایی که اکثر مراکز تجاری از ساعت 9 صبح تا 10 شب باز هستند [ 28 ]، ما کاربرانی را که در این دوره زمانی در این مجتمع‌های خرده‌فروشی حضور داشتند را استخراج کردیم و آنها را به عنوان کاربران جذب‌شده تعیین کردیم. به طور کلی، 87215 کاربر جذب شده از مجموعه داده های ما استخراج شده اند و 3.6 درصد از کل کاربران را تشکیل می دهند.

4.2. استخراج مراکز فعالیت

در این بخش، نحوه استفاده از الگوریتم خوشه‌بندی DBSAN برای استخراج مراکز فعالیت از تورهای کاربران جذب شده به منظور جایگزینی محل سکونت در اطلاعات مشتریان سنتی مورد بحث قرار می‌گیرد.

علاوه بر محل سکونت، مکان‌های دیگری که کاربران اغلب در آنها حضور پیدا می‌کنند شامل کار، سوپرمارکت‌ها و کتابخانه‌ها می‌شود [ 29 ، 30 ]. اطلاعات Sina Weibo دارای برچسب جغرافیایی از کاربری که اعلام حضور خود را در Sina Weibo به اشتراک گذاشته است به عنوان مثال در شکل 3 نشان داده شده است.. سه منطقه با تراکم نقطه بالا وجود دارد. بیشتر نقاط ورود این کاربر در این مناطق یافت می شود. با تجزیه و تحلیل دستی متون Weibo در مناطق مختلف، اطلاعات معنایی غنی که معنای ذهنی عملی این حوزه های مختلف را به کاربر منتقل می کند می تواند استنباط شود: (1) نقاط زیادی در یک مکان در ناحیه حاوی نقطه A همپوشانی دارند. متن یک Weibo در مکان A “狂追猛跑追上一辆公交车…之后早到单位十分钟！” است (پس از عجله برای گرفتن اتوبوس، 10 دقیقه زودتر به محل کار رسیدم). این نشان می دهد که این منطقه ممکن است یک محل کار باشد. (2) متن در مکان B این است “袜子未免太好看了吧！买了15双…” (جوراب ها خیلی خوش قیافه هستند! من 15 جفت آورده ام…). بنابراین، منطقه حاوی نقطه B ممکن است محل خرید و تفریح کاربر باشد. (3) ناحیه حاوی نقطه C بزرگترین با بیشترین چگالی نقطه است. متن در محل C “6点15出家门上班，9点半终于到家了，晚安。” است (ساعت 6:15 صبح برای کار از خانه خارج شوید و در نهایت ساعت 9:30 شب بخیر به خانه برگردید). . این نشان می دهد که این منطقه ممکن است خانه کاربر باشد.

مطالعات سنتی اغلب از محل سکونت برای تعیین حدود یک منطقه تجاری استفاده می کنند. از طرف دیگر، یک منطقه تجاری مبتنی بر مناطقی که اغلب مشتریان از آنها بازدید می کنند، اغلب برای حمایت از تصمیم گیری توسط آژانس های تجاری و برنامه ریزی شهری استفاده می شود [ 12 ]. مناطق پربازدید استخراج شده برای هر کاربر ممکن است به درک بهتری از رفتارهای مصرف کننده کمک کند و در نتیجه به کسب و کارها کمک کند تا زمانی که در نزدیکی هر یک از مناطق پربازدید قرار دارند، استراتژی هایی برای جذب مشتریان ایجاد کنند.

تحقیقات قبلی از الگوریتم DBSCAN برای شناسایی خوشه‌های چگالی و استخراج مراکز فعالیت برای افراد از داده‌های رسانه‌های اجتماعی برچسب‌گذاری شده جغرافیایی استفاده کرده است [ 26 ، 31 ]. بر اساس این تحقیق، ما از DBSCAN برای به دست آوردن مناطق پربازدید هر کاربر استفاده کردیم. برای کاربرانی با کمتر از سه ناحیه، مرکز نقطه تمام مناطق به عنوان مرکز فعالیت در نظر گرفته شد. برای کاربران با بیش از سه ناحیه، مرکز سه ناحیه فعال برتر به عنوان مرکز فعالیت استخراج شد. DBSCAN یک الگوریتم خوشه بندی فضایی است که بر اساس چگالی پیشنهاد شده توسط استر در سال 1996 [ 32]]. Eps (شعاع جستجو) و MinPts (حداقل تعداد نقاط مورد نیاز برای تشکیل یک ناحیه متراکم) دو پارامتر مهم در این الگوریتم هستند. DBSCAN نسبت به بسیاری از الگوریتم های خوشه بندی دیگر مانند K-means دو مزیت دارد: (1) به تعیین تعداد خوشه ها در داده ها از قبل نیاز ندارد، (2) و می تواند خوشه هایی با شکل دلخواه پیدا کند. به دلیل این مزایا، DBSCAN برای استخراج مناطق پربازدید مناسب تر است. ماژول “sklearn.cluster” در بسته Python “scikit-learn” برای نقاط چک در خوشه اعمال شد. بر اساس کار قبلی استفاده از DBSCAN برای خوشه‌بندی داده‌های رسانه‌های اجتماعی [ 12]، Eps را به طور جداگانه روی یک کیلومتر و MinPts را روی 10 تنظیم کردیم، و دریافتیم که 61.17٪ از کاربران هیچ خوشه ای ندارند. این به این دلیل است که بسیاری از کاربران در یک دوره 14 ماهه نقاط ورود بسیار کمی داشتند و این نقاط یک خوشه تشکیل نمی دادند. کاربران با بیش از یک خوشه 15.36 درصد از کاربرانی را تشکیل می دهند که خوشه داشتند. این نشان می دهد که تعداد زیادی از کاربران بیش از یک منطقه پربازدید داشتند. بر اساس این نتایج خوشه‌بندی، مراکز فعالیت استخراج شدند.

4.3. محاسبه احتمال بازدید مشاهده شده، مسافت سفر، و جذابیت تراکم خرده فروشی

احتمال بازدید مشاهده شده، مسافت سفر و جذابیت مقادیر ورودی لازم هنگام اعمال مدل هاف هستند. در این بخش به روش های بدست آوردن این سه مقدار می پردازیم. همه مقادیر با استفاده از پایتون محاسبه شدند و سپس برای اجرای مدل هاف در Mathlab بارگذاری شدند.

تعداد نقاط ورود در یک تجمع برای هر کاربر به عنوان دفعات بازدید کاربر توسط تجمع در نظر گرفته شد. احتمال بازدید مشاهده شده P _ij کاربر i که به تراکم j می رود به صورت زیر محاسبه شد:

پ من ج = آ من ج \sum n j = 1 آ من ج j \in {C ، X ، دبلیو ، جی ، ز}

(2)

که در آن A _ij فرکانس بازدید کاربر i از تراکم j و n تعداد تجمعات است. برخی از کاربران ممکن است در طی یک بازدید از یک مجتمع بارها بررسی کنند. برای مقابله با نفوذ ورودهای تهاجمی بیش از حد، اعلام حضورهای تکراری را در یک مجموعه در همان روز حذف کردیم.

بر اساس مرکز فعالیت و شبکه جاده‌ای به‌دست‌آمده در پکن، ما از الگوریتم Dijkstra برای محاسبه کوتاه‌ترین فاصله شبکه بین کاربران و مراکز تجمعات خرده‌فروشی به عنوان مسافت سفر استفاده کردیم. الگوریتم Dijkstra الگوریتمی برای یافتن کوتاه ترین مسیرها بین گره ها در یک گراف است [ 33 ]. در دنیای واقعی، مردم فعالیت های اجتماعی و اقتصادی خود را در شبکه های خیابانی واقعی می کنند [ 20 ]. بنابراین، بر خلاف فاصله سنتی اقلیدسی، فاصله شبکه همانطور که با الگوریتم Dijkstra محاسبه می شود، می تواند مسافت واقعی را که افراد هنگام رفتن به یک مکان یا منطقه هدف طی می کنند، منعکس کند [20 ] .

در هر مجتمع خرده فروشی، اکثر مشتریان توسط امکانات تجاری بزرگی که در یک منطقه خرده فروشی مستقر هستند، جذب می شوند. بنابراین، حوزه های تجاری این تسهیلات بزرگ را می توان به عنوان معیاری برای سنجش جذابیت یک مجتمع خرده فروشی به طور کلی در نظر گرفت [ 27 ]. مجموع مساحت تاسیسات با 10000 متر مربع بیشتر بر اساس بررسی میدانی تعیین شد. این مقدار مساحت به عنوان شاخصی از جذابیت پنج مجتمع خرده فروشی استفاده شد. مساحت کل هر توده در جدول 2 نشان داده شده است .

4.4. به دست آوردن مجموعه های مختلف تحدید محدوده تجاری

4.4.1. انتخاب کاربر

مطالعه قبلی نشان داد که افراد مختلف الگوهای رفتاری متفاوتی دارند [ 34 ]. برای آشکار کردن تفاوت‌ها در رفتار مصرف‌کننده بین کاربران رسانه‌های اجتماعی با اسناد متفاوت، کاربران را بر اساس تعداد تجمع‌های خرده‌فروشی که بازدید کرده‌اند انتخاب کردیم. برای هر کاربر، تعداد تجمع‌های بازدید شده، مهم‌ترین انتساب او است. هرچه یک کاربر از تجمعات خرده فروشی کمتر بازدید کند، احتمال بیشتری دارد که این کاربر تجمعات فردی خاص را ترجیح دهد. تعداد تجمعاتی را که آنها بازدید کردند را شمردیم. کاربرانی که از تجمعات 1، 2، 3 و 4 بازدید می کردند، فیلتر شدند. مقادیر ترکیبی برای تجمعات بازدید شده توسط هر کاربر در شکل 4 نشان داده شده است. اکثر کاربران فقط از یک تجمع بازدید کردند. با افزایش تعداد تجمعات بازدید شده، تعداد کاربران کاهش یافت. هر کاربر جذب شده به عنوان یک موضوع نمونه در نظر گرفته شد و همه کاربران به عنوان مجموعه نمونه 1 در نظر گرفته شدند. ما کاربرانی را که از بیش از 1، 2، 3، و 4 تجمع بازدید می کردند، به ترتیب به عنوان مجموعه های 2، 3، 4، و 5 انتخاب کردیم.

4.4.2. تجمع فضایی

ما منطقه مورد مطالعه را به واحدهای فضایی منظم و مراکز فعالیت کاربر را به هر یک از این واحدهای فضایی تقسیم کردیم. احتمال بازدید و مسافت سفر هر واحد فضایی برای کاربرانی که مراکز فعالیتشان در یک واحد است به طور میانگین محاسبه شد. این مقادیر تجمیع شده به عنوان ویژگی های هر واحد [ 35 ] گنجانده شد . نقاط ورود هر کاربر ناقص است. این ناقصی می تواند بر تعیین حدود مناطق تجاری تأثیر بگذارد. مطالعات قبلی بر اساس نظرسنجی‌های سنتی نشان می‌دهد که پاسخ‌دهندگان پرسشنامه‌ها احتمال مشخصی نسبت به احتمالات بازدید تصادفی دارند (مشکل تعداد کم) و علاوه بر این، این احتمالات بر تعیین حدود مناطق تجاری تأثیر دارد [35 ]]. تجمیع فضایی می تواند تأثیر احتمالات تصادفی و فعالیت های ناقص را بر تحدید حدود منطقه تجاری بهبود بخشد.

در این مطالعه، برای جلوگیری از سوگیری ناشی از تقسیم‌بندی‌های اداری، از سلول‌های شبکه‌ای منظم 400 × 400 متر برای تقسیم پکن به 18492 واحد به دنبال کار یو یانگ [28] استفاده کردیم . در بسیاری از این واحدها، تعداد کل بازدید از هر مجتمع خرده فروشی نسبتاً کم بود. هرچه تعداد دفعات بازدید از یک واحد کمتر باشد، احتمال بیشتری وجود دارد که این واحد تحت تأثیر احتمالات بازدید تصادفی باشد [ 36]]. بنابراین، سلول‌های شبکه‌ای را با فرکانس کل بازدید کمتر از 30 فیلتر کردیم و 1827 سلول شبکه را برای تجزیه و تحلیل بیشتر حفظ کردیم. این سلول های شبکه ای مناطق اصلی و فعال ترین مناطق در پکن را پوشش می دهند. هر سلول شبکه به عنوان یک نمونه در نظر گرفته شد. با تجمیع تمام مراکز فعالیت کاربر در هر سلول شبکه، مجموعه‌ای را به‌دست آوردیم که به‌عنوان مجموعه نمونه 6 رفتار می‌شود. مراکز فعالیت کاربرانی را که از بیش از 1، 2، 3، 4 تجمع بازدید می‌کردند جمع‌آوری کردیم تا مجموعه‌هایی تولید کنیم که به عنوان مجموعه‌های 7، 8 در نظر گرفته شدند. ، به ترتیب 9، 10.

4.5. روش ارزشیابی و شاخص ها

بر اساس الگوریتم Levenberg-Marquard در Mathlab، پارامتر حساس به فاصله (λ) و پارامتر حساس به جذابیت (α) را ارزیابی کردیم. الگوریتم لونبرگ-مارکوارد یک روش تکراری برای حل مسائل شبیه سازی مدل است [ 37 ]. ریشه میانگین مربعات خطا (RMSE) و ضریب تعیین ( R2 ) برای آشکار کردن تفاوت‌های ^بین مناطق تجاری تعیین‌شده با استفاده از مجموعه‌های نمونه مختلف استفاده شد. RMSE واریانس بین مقادیر برآورد شده و مشاهده شده را برای ارزیابی مدل ها اندازه گیری می کند. RMSE به صورت زیر محاسبه می شود:

R M اس E = 1 ن \sum i = 1 ن (y من - ایکس من) 2 - - - - - - - - - - - - - - - -  ⎷  

(3)

که در آن y _i و x _i احتمال بازدید مشاهده شده و شبیه سازی شده برای هر تجمع هستند، N تعداد افراد نمونه است.

ضریب تعیین R2 مقدار تغییرات متغیر وابسته را توصیف می کند که می تواند با ارتباط آن با متغیر مستقل توضیح داده شود ^.R ² به صورت زیر محاسبه می شود:

آر 2 = (1 ن \sum i = 1 ن ( y من - y ¯ ) ( ایکس من - ایکس ¯ ) σ ایکس σ y) 2

(4)

که در آن y _i و x _i احتمال بازدید مشاهده شده و شبیه سازی شده برای هر تجمع هستند. N تعداد افراد نمونه است. $\bar{y}$ و $\bar{x}$ به ترتیب میانگین های مقدار مشاهده شده و شبیه سازی شده را نشان می دهد. و σ _y و σ _x به ترتیب خطاهای استاندارد مقدار مشاهده شده و شبیه سازی شده هستند. مقدار قابل قبول ^R2می تواند بسته به نوع مقایسه های انجام شده متفاوت باشد، اما در حالت ایده آل، ^R2باید بزرگتر از 0.5 باشد [ 38 ].

5. نتایج و بحث

5.1. مقایسه اثرات مجموعه های مختلف

با مقایسه اثرات مجموعه‌های مختلف، متوجه شدیم که مجموعه نمونه به‌دست‌آمده با استفاده از نمایش تمام مراکز فعالیت کاربر تجمیع شده در واحدهای فضایی، مناطق تجاری را بهتر از سایر مجموعه‌های آزمایش‌شده محدود می‌کند. علاوه بر این، نتایج مقایسه‌ای ما نشان می‌دهد که اثرات مجموعه‌های مختلف بر تحدید حدود منطقه تجاری به‌طور مشهودی با یکدیگر متفاوت است. اثرات مجموعه های نمونه مختلف در جدول 3 نشان داده شده است . کاربرانی که از بیش از 1، 2، 3، 4 تجمع خرده فروشی بازدید می کردند، به ترتیب به عنوان gt1، 2، 3، 4 در نظر گرفته شدند.

مجموعه‌های بدون مراکز فعالیت کاربر انبوه برای تعیین حدود منطقه تجاری بی‌اثر بودند. همانطور که در جدول 3 نشان داده شده است ، از مجموعه 1 تا مجموعه 5، بالاترین مقدار R ² تنها 0.25 است. این ممکن است به این دلیل باشد که در داده های رسانه های اجتماعی، نقاط ورود کاربر نشان دهنده فعالیت های کامل در دنیای واقعی نیست. با فیلتر کردن مراکز فعالیت کاربر به صورت گام به گام، R2 ، RMSE، پارامتر حساس به فاصله (λ) و پارامتر حساس به جذابیت (α) کاهش یافتند ^.این نتیجه نشان می دهد که هرچه کاربران بیشتر از تجمعات بازدید کنند، توجه کمتری به مسافت سفر یا جذابیت یک تجمع می کنند.

در مقایسه با مجموعه‌های بدون تجمیع، مجموعه‌های به‌دست‌آمده با تجمیع مراکز فعالیت کاربر برای تعیین حدود مناطق تجاری مؤثرتر بودند. همانطور که در جدول 3 نشان داده شده است ، مجموعه نمونه (مجموعه 6) که همه کاربران را جمع می کند دارای بالاترین مقدار R ² (0.64) است. با فیلتر کردن کاربرانی که از مجتمع های خرده فروشی 1، 2، 3، 4 بازدید می کنند به صورت گام به گام، R 2 ^کاهش و RMSE افزایش یافت. این نشان می‌دهد که با حذف کاربرانی که اولویت‌های انتخاب نسبتاً قوی دارند، نمی‌توان اثر تعیین‌کننده را بهبود بخشید. مشابه مجموعه های نمونه بدون تجمع، پارامترهای حساس نیز از مجموعه 6 به مجموعه 10 کاهش یافتند.

پارامترهای حساسیت کالیبره‌شده برای این 10 مجموعه نمونه با پارامترهای پیش‌فرض (α = 1، λ = 2) که در مطالعات قبلی استفاده شده‌اند، متفاوت است. اثر مجموعه 6 بهترین بود، زیرا R ² مجموعه 6 بالاترین و RMSE کمترین بود. α و λ کالیبره شده توسط این مجموعه نمونه به ترتیب 1.84 و 1.44 بود. برخلاف پارامترهای پیش‌فرض مورد استفاده در مطالعات قبلی، پارامتر حساس به جذابیت ما نسبتاً بالاتر و پارامتر فاصله کمتر بود. این ممکن است نشان دهد که بهبود شرایط ترافیک شهری باعث شده است مشتریان نسبت به گذشته نسبت به جذابیت و مسافت کمتر حساس باشند.

5.2. تجزیه و تحلیل منطقه تجاری

ما از پارامترهای مدل هاف کالیبره شده توسط مجموعه 6 برای تعیین محدوده تجاری استفاده کردیم. تفاوت های شدیدی در توزیع و شدت مناطق تجاری برای مجتمع های خرده فروشی مختلف مورد مطالعه وجود دارد. وسعت و جهت منطقه تجارت برای هر مجتمع خرده فروشی در شکل 5 نشان داده شده است در حالی که همپوشانی این مناطق تجاری در شکل 6 نشان داده شده است.. در میان تمام تجمعات، منطقه تجاری برای G بزرگترین است. منطقه تجاری G به سمت شرق در امتداد یک جاده اصلی گسترش می یابد و سمت غربی منطقه تجاری با سایر مناطق تجاری همپوشانی دارد. این نشان می دهد که G فقط با دیگر تجمعات در غرب رقابت می کند. منطقه تجاری Z از دیگر تجمعات دور است، اما بخش جنوب شرقی منطقه تجاری Z با مناطق دیگر همپوشانی دارد. منطقه تجارت C کوچکترین است. این به این دلیل است که جذابیت C نسبتاً کم است و C نزدیک به سایر تجمعات با جذابیت بالاتر است.

6. نتیجه گیری

توسعه فن آوری ارتباطات سیار فرصت های جدیدی را برای بررسی مشکلات در دنیای واقعی از طریق داده های رسانه های اجتماعی فراهم می کند [ 39 , 40 , 41 , 42 , 43]. بر اساس یک مدل هاف، مجموعه‌های نمونه متفاوتی را برای تعیین حدود مناطق تجاری از داده‌های رسانه‌های اجتماعی به‌دست آوردیم. نتایج ما نشان می‌دهد که مجموعه‌های به‌دست‌آمده از تجمیع فضایی تمام مراکز فعالیت کاربر برای تعیین محدوده‌های تجاری مناسب‌تر هستند و تأثیر بهتری نسبت به مجموعه‌های بدون تجمع دارند. نتایج همچنین تفاوت‌ها را در توزیع و شدت مناطق تجاری برای مجتمع‌های خرده‌فروشی مختلف نشان می‌دهد. یافته های ما پیامدهای اجتماعی و اقتصادی بسیار مهمی دارد. بر اساس منطقه تجاری محدود شده، برنامه ریزان شهری می توانند محل تجمع های خرده فروشی جدید را به طور موثرتری مکان یابی کنند. علاوه بر این، کسب‌وکارها می‌توانند از این رویکرد برای تجزیه و تحلیل توزیع مشتریان خود و پیش‌بینی دقیق‌تر عملکرد تجاری استفاده کنند.

اگرچه مطالعه اولیه ما یک روش عملی را برای استفاده از داده های رسانه های اجتماعی برای تعیین حدود منطقه تجاری به طور موثر پیشنهاد می کند، ما باید به نحوه استفاده از رسانه های اجتماعی برای تجزیه و تحلیل بیشتر توزیع مناطق تجاری و رفتارهای مشتریان جذب شده توجه بیشتری داشته باشیم. در مطالعات آتی، چالش ها و مشکلات خاص رسانه های اجتماعی مورد توجه قرار خواهند گرفت، مانند:

(1): ساختار سنی کاربران شبکه های اجتماعی؛ اکثر کاربران رسانه های اجتماعی جوانان هستند و ساختار سنی کاربران با دنیای واقعی متفاوت است [ 24 ]. تیم تحقیقاتی ما تأثیر ساختار سنی را بر تعیین حدود منطقه تجاری بررسی خواهد کرد.
(2): مسئله واحد منطقه قابل تغییر (MAUP)؛ ما از سلول های شبکه ای 400 متر × 400 متر برای تجمع استفاده کردیم. اندازه های مختلف واحدهای فضایی ممکن است به نتایج متفاوتی منجر شود. در کارهای آینده، هدف ما این است که با آزمایش اندازه ها و اشکال مختلف واحدهای فضایی، بهترین واحد فضایی را به دست آوریم.
(3): انتخاب کاربر شبکه های اجتماعی؛ کاربران رسانه‌های اجتماعی ویژگی‌های زیادی دارند، مانند جنسیت، محل ثبت نام خانواده، سطوح تحصیلی و تعداد طرفداران Weibo. در تجزیه و تحلیل منطقه تجاری، کاربران را بر اساس این ویژگی های شخصی که ممکن است بر تعیین حدود منطقه تجاری تأثیر بگذارد، دسته بندی می کنیم.
(4): جذابیت تراکم خرده فروشی؛ حوزه کسب و کار مهمترین عامل تأثیرگذار برای جذابیت است. عوامل دیگری مانند پارکینگ، تاریخچه و سطح قیمت نیز ممکن است بر جذابیت تأثیر بگذارند. به منظور بررسی تأثیر این عوامل دیگر، ما اطلاعات آماری بیشتری را در رابطه با هر تراکم جمع آوری خواهیم کرد.
(5): اطلاعات متنی؛ داده های رسانه های اجتماعی حاوی مقدار زیادی اطلاعات متنی است. این اطلاعات منعکس کننده افکار عمومی در مورد تأسیسات تجاری و تجمعات است. مطالعات آینده برای کشف این اطلاعات غنی، متنی و معنایی برای درک بهتر تفکر و الگوهای رفتاری مشتری مورد نیاز است.

منابع

روزنبلوم، بی. ترکیب حوزه تجارت و ترکیب خرده فروشی: یک ماتریس استراتژی خرده فروشی. جی. مارک. 1976 ، 40 ، 58-66. [ Google Scholar ] [ CrossRef ]
Huff, DL تعریف و تخمین منطقه تجاری. جی. مارک. 1964 ، 28 ، 34-38. [ Google Scholar ] [ CrossRef ]
سوارز، وی آر؛ Gutiérrez-Acuña، JL; Rodríguez، DM تعیین محل یک سوپرمارکت با استفاده از مدل هاف کالیبره شده محلی. بین المللی جی. جئوگر. Inf. علمی 2015 ، 29 ، 217-233. [ Google Scholar ] [ CrossRef ]
لی، ی. لیو، ال. ارزیابی تأثیر مکان خرده‌فروشی بر عملکرد فروشگاه: مقایسه فروشگاه‌های Wal-Mart و Kmart در سینسیناتی. Appl. Geogr. 2012 ، 32 ، 591-600. [ Google Scholar ] [ CrossRef ]
O’Kelly، ME مدل‌های منطقه تجاری و نمونه‌های مبتنی بر انتخاب: روش‌ها. محیط زیست طرح. A 1999 , 31 , 613-627. [ Google Scholar ] [ CrossRef ]
لین، ام. لوکاس، اچ سی; Shmueli، G. تفسیر تحقیق – خیلی بزرگ برای شکست: نمونه‌های بزرگ و مشکل p -value. Inf. سیستم Res. 2013 ، 24 ، 906-917. [ Google Scholar ] [ CrossRef ]
عدنان، م. لیک، ا. Longley, P. تحلیل جغرافیایی محاسباتی فعالیت توییتر در شهرهای مختلف جهان. ژئو اسپات. Inf. علمی 2014 ، 17 ، 145-152. [ Google Scholar ] [ CrossRef ]
Sun، Y. بررسی “محل” تعاملات فضایی درون شهری در شهر نیویورک با استفاده از داده های چهار مربعی. ISPRS Int. J. Geo-Inf. 2016 . [ Google Scholar ] [ CrossRef ]
لیلوی، ف. رجبی فرد، ع. کلانتری، م. رویکرد چند عنصری به استنتاج مکان توییتر: موردی برای واکنش اضطراری. ISPRS Int. J. Geo-Inf. 2016 . [ Google Scholar ] [ CrossRef ]
گرانل، سی. Ostermann، FO فراتر از جمع آوری داده ها: اهداف و روش های تحقیق با استفاده از VGI و رسانه های جغرافیایی اجتماعی برای مدیریت بلایا. محاسبه کنید. محیط زیست سیستم شهری 2016 ، در دست چاپ. [ Google Scholar ] [ CrossRef ]
هو، کیو. وانگ، ام. لی، کیو. نقطه کانونی شهری و اکتشاف منطقه تجاری با داده‌های ورود. Acta Geod. کارتوگر. گناه 2014 ، 43 ، 314-321. [ Google Scholar ]
Qu، Y. Zhang، J. تجزیه و تحلیل منطقه تجاری با استفاده از داده های موقعیت مکانی تلفن همراه ایجاد شده توسط کاربر. در مجموعه مقالات بیست و دومین کنفرانس بین المللی وب جهانی، نیویورک، نیویورک، ایالات متحده آمریکا، 13 تا 17 مه 2013; صص 1053-1064.
Christaller, W. Central Places در جنوب آلمان Prentice-Hall: Englewood، NJ، USA، 1966. [ Google Scholar ]
اپلبام، دبلیو. کوهن، SB پویایی مناطق تجاری فروشگاه و تعادل بازار 1. Ann. دانشیار صبح. Geogr. 1961 ، 51 ، 73-101. [ Google Scholar ] [ CrossRef ]
بارای، جی. Cliquet, G. تعیین مناطق تجاری فروشگاه از طریق تجزیه و تحلیل مورفولوژیکی. یورو جی. اوپر. Res. 2007 ، 182 ، 886-898. [ Google Scholar ] [ CrossRef ]
نمودارهای Aurenhammer، F. Voronoi – بررسی یک ساختار داده هندسی اساسی. کامپیوتر ACM. Surv. (CSUR) 1991 ، 23 ، 345-405. [ Google Scholar ] [ CrossRef ]
قوش، ع. راشتون، جی. مدل‌های تحلیل فضایی و مکان-تخصیص . شرکت Van Nostrand Reinhold: نیویورک، نیویورک، ایالات متحده آمریکا، 1987. [ Google Scholar ]
مندز، AB; ارزیابی موقعیت مکانی سایت خرده فروشی Themido، IH Multi-outlet. بین المللی ترانس. اپراتور Res. 2004 ، 11 ، 1-18. [ Google Scholar ] [ CrossRef ]
Applebaum, W. روش‌هایی برای تعیین مناطق تجاری فروشگاه، نفوذ بازار و فروش بالقوه. جی. مارک. Res. 1966 ، 3 ، 127-141. [ Google Scholar ] [ CrossRef ]
کوی، سی. وانگ، جی. Pu، Y. ما، جی. چن، جی. روش مبتنی بر GIS برای تعیین حدود منطقه تجاری برای زنجیره های خرده فروشی. بین المللی جی. جئوگر. Inf. علمی 2012 ، 26 ، 1863-1879. [ Google Scholar ] [ CrossRef ]
Gautschi, DA مشخصات مدل های حمایتی برای انتخاب مرکز خرده فروشی. جی. مارک. Res. 1981 ، 18 ، 162-174. [ Google Scholar ] [ CrossRef ]
مارک، ای. جیمز، اس. یک مکان خوب برای یک مرکز خرید منطقه ای چقدر حیاتی است؟ J. Real Estate Res. 1996 ، 12 ، 459-468. [ Google Scholar ]
چن، اس. ژانگ، اچ. لین، ام. Lv, S. مقایسه سرویس میکروبلاگینگ بین Sina Weibo و Twitter. در مجموعه مقالات کنفرانس بین المللی علوم کامپیوتر و فناوری شبکه در سال 2011 (ICCSNT)، گوانگژو، چین، 24 تا 26 دسامبر 2011. صص 2259–2263.
ثبت نام سینا ویبو به 500 میلیون رسیده است. در دسترس آنلاین: http://tech.sina.com.cn/i/2013-02-25/09348086534.shtml (در تاریخ 20 مه 2016 در دسترس است).
جیانگ، دبلیو. وانگ، ی. Tsou، MH; Fu، X. استفاده از رسانه های اجتماعی برای تشخیص آلودگی هوای بیرون و نظارت بر شاخص کیفیت هوا (aqi): چارچوب تجزیه و تحلیل مکانی-زمانی جغرافیایی هدفمند با Sina Weibo (توئیتر چینی). PLoS ONE 2015 ، 10 ، e0141185. [ Google Scholar ] [ CrossRef ] [ PubMed ]
ژو، سی. فرانکوفسکی، دی. لودفورد، پی. شکر، س. تروین، ال. کشف مکان‌های معنادار شخصی: رویکرد خوشه‌بندی تعاملی. ACM Trans. Inf. سیستم (TOIS) 2007 ، 25 ، 1-31. [ Google Scholar ] [ CrossRef ]
پان، اچ. لی، ی. Dang، A. کاربرد مدل هاف شبکه برای برنامه ریزی شبکه تجاری در منطقه حومه شهر Wujin، Changzhou به عنوان یک مورد. ان GIS 2013 ، 19 ، 131-141. [ Google Scholar ] [ CrossRef ]
یو، ی. وانگ، اچ. هو، بی. لی، کیو. لی، ی. بله، AG کالیبراسیون اکتشافی یک مدل تعامل فضایی با استفاده از مسیرهای GPS تاکسی. محاسبه کنید. محیط زیست سیستم شهری 2012 ، 36 ، 140-153. [ Google Scholar ] [ CrossRef ]
گونزالس، ام سی؛ هیدالگو، کالیفرنیا؛ Barabasi, AL درک الگوهای حرکتی فردی انسان. طبیعت 2008 ، 453 ، 779-782. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Lv، M. چن، ال. چن، جی. کشف مکان‌های معنایی شخصی از مسیرهای GPS. در مجموعه مقالات بیست و یکمین کنفرانس بین المللی ACM در مدیریت اطلاعات و دانش، نیویورک، نیویورک، ایالات متحده آمریکا، 29 اکتبر تا 2 نوامبر 2012. صفحات 1552-1556.
کامپایا، ام. فلوریس، آر. ماسا، ص. نقش اطلاعات جغرافیایی رسانه های اجتماعی (SMGI) در برنامه ریزی فضایی. در سیستم های پشتیبانی برنامه ریزی و شهرهای هوشمند؛ نکات سخنرانی در اطلاعات جغرافیایی و کارتوگرافی ; Geertman, S., Ed. Springer International Publishing: بازل، سوئیس، 2015; صص 41-60. [ Google Scholar ]
استر، ام. کریگل، اچ پی؛ ساندر، جی. Xu, X. یک الگوریتم مبتنی بر چگالی برای کشف خوشه ها در پایگاه داده های فضایی بزرگ با نویز. در مجموعه مقالات دومین کنفرانس بین المللی کشف دانش و داده کاوی، پورتلند، OR، ایالات متحده آمریکا، 2 تا 4 اوت 1996. ص 226-231.
Dijkstra، EW یادداشتی در مورد دو مشکل در ارتباط با نمودارها. عدد. ریاضی. 1959 ، 1 ، 269-271. [ Google Scholar ] [ CrossRef ]
ژائو، ز. شاو، اس ال. خو، ی. لو، اف. چن، جی. یین، ال. درک سوگیری سوابق جزئیات تماس در تحقیقات تحرک انسانی. بین المللی جی. جئوگر. Inf. علمی 2016 ، 30 ، 1738-1762. [ Google Scholar ] [ CrossRef ]
مارکهام، اف. دوران، بی. یانگ، ام. تخمین حوضه های محل برگزاری قمار برای ارزیابی تأثیر با استفاده از یک مدل گرانش کالیبره شده. بین المللی جی. جئوگر. Inf. علمی 2014 ، 28 ، 326-342. [ Google Scholar ] [ CrossRef ]
باتی، م. Sikdar، P. تجمع فضایی در مدل های گرانشی: 4. تعمیم ها و کاربردهای در مقیاس بزرگ. محیط زیست طرح. A 1982 , 14 , 795-822. [ Google Scholar ] [ CrossRef ] [ PubMed ]
Marquardt, DW الگوریتمی برای برآورد حداقل مربعات پارامترهای غیرخطی. J. Soc. Ind. Appl. ریاضی. 1963 ، 11 ، 431-441. [ Google Scholar ] [ CrossRef ]
خطیب، ز. چانگ، KT; Ou, Y. تأثیر ساختارهای منطقه تجزیه و تحلیل بر ترافیک مدل‌سازی شده در سراسر ایالت. J. Trans. مهندس 2001 ، 127 ، 31-38. [ Google Scholar ] [ CrossRef ]
وانگ، ی. وانگ، تی. بله، X. ژو، جی. لی، جی. استفاده از رسانه های اجتماعی برای واکنش اضطراری و پایداری شهری: مطالعه موردی طوفان باران پکن در سال 2012. پایداری 2016 ، 8 ، 142-153. [ Google Scholar ] [ CrossRef ]
وانگ، ز. بله، X. Tsou، M. تجزیه و تحلیل فضایی، زمانی و محتوای توییتر برای خطرات آتش سوزی. نات خطرات 2016 ، 83 ، 523-540. [ Google Scholar ] [ CrossRef ]
لی، اس. بله، X. لی، جی. گونگ، جی. Qin, C. تحلیل فضایی و زمانی قیمت مسکن در چین: چشم انداز کلان داده. Appl. تف کردن مقعدی سیاست 2016 . [ Google Scholar ] [ CrossRef ]
شاو، اس. تسو، م. بله، X. پویایی انسان در عصر موبایل و کلان داده. بین المللی جی. جئوگر. Inf. علمی 2016 ، 30 ، 1687-1693. [ Google Scholar ] [ CrossRef ]
یانگ، ایکس. بله، X. Sui, DZ ما می دانیم که کجا هستید: در فضا و مکان غنی سازی بافت جغرافیایی از طریق رسانه های اجتماعی. بین المللی J. Appl. ژئوسپات. Res. 2016 ، 7 ، 61-75. [ Google Scholar ] [ CrossRef ]

شکل 1. توزیع هر مجتمع خرده فروشی.

شکل 2. چارچوب برای به دست آوردن نمونه های مناسب برای تعیین حدود مناطق تجاری از داده های رسانه های اجتماعی.

شکل 3. مناطق با تراکم نقطه بالا.

شکل 4. تجمعات بازدید شده برای 87215 کاربر Sina Weibo.

شکل 5. منطقه تجاری هر تراکم خرده فروشی: ( الف ) منطقه تجاری تراکم خرده فروشی G. ( ب ) منطقه تجاری تجمع خرده فروشی Z. ( ج ) منطقه تجاری X تجمع خرده فروشی. ( د ) منطقه تجاری تجمع خرده فروشی W. ( ه ) منطقه تجاری تجمع خرده فروشی C.

شکل 6. همپوشانی مناطق مختلف تجاری.

جدول 1. نمونه داده های Sina Weibo.

جدول 2. مساحت کل هر توده.

جدول 3. اثرات مجموعه های نمونه مختلف.

© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب