توصیه موقعیت مکانی آگاه از زمینه با استفاده از عکس های دارای برچسب جغرافیایی در رسانه های اجتماعی

خلاصه

اخیراً افزایش دسترسی به دوربین های دیجیتال و پیشرفت های سریع در رسانه های اجتماعی منجر به تجمع تعداد زیادی عکس دارای برچسب جغرافیایی شده است که ممکن است منعکس کننده تجربیات سفر افراد در شهرهای مختلف باشد و می تواند برای ایجاد توصیه های مکان برای گردشگران استفاده شود. تحقیقات در مورد این جنبه عمدتاً بر ارائه توصیه‌های شخصی‌شده منطبق با ترجیحات سفر یک گردشگر متمرکز بود، در حالی که زمینه بازدید (به عنوان مثال، آب و هوا، فصل و زمان روز) را که به طور بالقوه بر رفتار سفر او تأثیر می‌گذارد نادیده می‌گرفت. این مقاله روش‌های آگاه از زمینه را برای ارائه توصیه‌های مکان منطبق با ترجیحات سفر گردشگران و زمینه بازدید بررسی می‌کند. به طور خاص، ما روش‌های خوشه‌بندی را برای شناسایی مکان‌های گردشگری و استخراج تاریخچه سفر از عکس‌های دارای برچسب جغرافیایی در فلیکر اعمال می‌کنیم. سپس یک معیار تشابه زمینه جدید را برای تعیین کمیت شباهت بین هر دو زمینه و توسعه سه روش فیلتر مشارکتی آگاه از زمینه، به عنوان مثال، پیش فیلتر زمینه، پس از فیلتر کردن و مدل سازی پیشنهاد می کنیم. با این روش‌ها، توصیه‌های مکان مانند «در زمینه‌های مشابه، سایر گردشگران مشابه شما اغلب بازدید می‌کردند…» را می‌توان به کاربر فعلی ارائه کرد. نتایج ارزیابی با مجموعه عکس‌های فلیکر در دسترس عموم نشان می‌دهد که این روش‌ها می‌توانند به گردشگر توصیه‌های مکان مطابق با اولویت‌های سفر و زمینه بازدید او ارائه دهند. مهمتر از همه، در مقایسه با سایر روش‌های پیشرفته، روش‌های پیشنهادی که از معیار تشابه بافتی معرفی‌شده استفاده می‌کنند، می‌توانند توصیه‌های بهتری را به گردشگران ارائه دهند. در حالی که از داده های فلیکر در این مطالعه استفاده شده است،

کلید واژه ها:

عکس دارای برچسب جغرافیایی ؛ توصیه مکان ؛ توصیه آگاه از زمینه ؛ فیلتر مشارکتی

1. معرفی

هنگام بازدید از یک شهر جدید، گردشگران اغلب به کمک نیاز دارند تا مکان‌های شخصی جالب را از میان مجموعه‌ای از انتخاب‌های بالقوه بسیار زیاد شناسایی کنند. برنامه ریزی سفر یک کار وقت گیر است. این کار به دلیل محیط فیزیکی پیچیده تر می شود، زیرا مکان های توریستی شخصی جالب ممکن است در سراسر یک شهر پراکنده باشند. از سوی دیگر، با پیشرفت های سریع در رسانه های اجتماعی دارای برچسب جغرافیایی، سال های اخیر شاهد بوده ایم که بسیاری از افراد اطلاعات و تجربیات سفر خود را از طریق رسانه های اجتماعی مانند چک-این های چهار ضلعی و عکس های فلیکر منتشر می کنند. تحقیقات نشان داده است که تجربیات کاربران گذشته در زمینه های مشابه می تواند به کاربران فعلی کمک کند تا مشکلات خود را به طور موثر حل کنند [ 1 ، 2]]، به عنوان مثال، انتخاب محل بازدید. بنابراین، جمع‌آوری داده‌های رسانه‌های اجتماعی دارای برچسب جغرافیایی پتانسیل بالایی برای کمک به گردشگران در شناسایی مکان‌های مورد علاقه هنگام بازدید از یک شهر جدید دارد.

اخیرا، تجزیه و تحلیل داده های رسانه های اجتماعی با برچسب جغرافیایی توجه قابل توجهی را به خود جلب کرده است. تحقیقات در مورد این جنبه، به عنوان مثال، بر روی کشف نقطه عطف و نقطه مهم [ 3 ، 4 ] استخراج معناشناسی مکان [ 5 ، 6 ]، مدل سازی رفتار [ 7 ، 8 ] و طبقه بندی جامعه (مثلا، [ 9 ]) متمرکز شد. همچنین تحقیقی با استفاده از داده‌های رسانه‌های اجتماعی برچسب‌گذاری‌شده جغرافیایی برای مکان و توصیه برنامه سفر انجام شد [ 10 ، 11 ، 12 ، 13 ، 14]. این مطالعات مکان‌ها یا برنامه‌های سفری را توصیه می‌کنند که با ترجیحات سفر گردشگران و زمان در دسترس مطابقت داشته باشند، در حالی که زمینه بازدید، مانند آب و هوا و فصل را نادیده می‌گیرند. با این حال، ترجیحات گردشگران با توجه به بازدید از یک مکان اغلب تحت تأثیر زمینه ای است که در آن قرار دارند [ 2 ]. به عنوان مثال، ممکن است ترجیح دهیم در یک روز آفتابی از یک پارک دیدن کنیم، در حالی که وقتی بارانی است از موزه بازدید می کنیم. بنابراین، عدم توجه به این نوع اطلاعات زمینه منجر به توصیه های نامربوط و نامناسب می شود.

هدف این مقاله بررسی روش‌های آگاه از زمینه برای ارائه توصیه‌های مکان منطبق با علایق سفر گردشگران و زمینه بازدید (به عنوان مثال، آب و هوا، فصل و زمان روز) بر اساس عکس‌های دارای برچسب جغرافیایی است. به طور خاص، ما تاریخچه سفر هر گردشگر را از عکس های فلیکر استخراج می کنیم که ترجیحات سفر او را نشان می دهد. سپس یک معیار تشابه بافت جدید را برای تعیین کمیت شباهت بین هر دو زمینه و توسعه سه روش فیلتر مشارکتی آگاه از زمینه (CaCF) برای تولید توصیه‌های مکان، به عنوان مثال، پیش فیلتر زمینه، پس از فیلتر کردن و مدل‌سازی پیشنهاد می‌کنیم. با استفاده از مجموعه داده‌های فلیکر در دسترس عموم، روش‌های پیشنهادی در مقایسه با سایر روش‌های پیشرفته ارزیابی می‌شوند تا مزایایی را که با در نظر گرفتن اطلاعات زمینه در فرآیند توصیه به دست می‌آیند، نشان دهند.

بقیه مقاله به شرح زیر سازماندهی شده است. بخش 2 تحقیقات مرتبط را ارائه می کند. در بخش 3 ، روش شناسی را به تفصیل شرح می دهیم. بخش 4 در مورد ارزیابی گزارش می دهد و نتایج را مورد بحث قرار می دهد. ما نتیجه گیری می کنیم و کارهای آینده را در بخش 5 ارائه می کنیم .

2. کارهای مرتبط

2.1. تکنیک های توصیه و آگاهی از زمینه

سیستم های توصیه یک لیست شخصی از آیتم ها (به عنوان مثال، فیلم ها، آهنگ ها و محصولات) را به کاربر ارائه می دهند که علایق و نیازهای او را برآورده می کند. آنها اغلب در دسته‌های زیر طبقه‌بندی می‌شوند: فیلترهای مشارکتی (توصیه مواردی که افراد دیگر با ترجیحات مشابه در گذشته دوست داشتند)، توصیه مبتنی بر محتوا (ارائه مواردی مشابه مواردی که قبلاً به کاربر ترجیح می‌داد) و رویکردهای ترکیبی. در میان آنها، فیلتر مشارکتی (CF) محبوب ترین روش توصیه است [ 15 ]. توصیه هایی را بر اساس نظرات کاربران (به عنوان مثال، رتبه بندی) در مورد موارد مختلف ارائه می دهد. رتبه یک تاپل است

(u s e r, i t e m, r a t i n g)

. رتبه‌بندی‌ها را می‌توان به صراحت توسط کاربران بیان کرد یا به طور ضمنی استنباط کرد، به عنوان مثال، از تاریخچه خرید یا مسیرهای سفر. به دلیل سادگی و شهودی بودن آن، CF مبتنی بر کاربر (UCF) اغلب استفاده می شود. با توجه به رتبه‌بندی ناشناخته (از یک مورد توسط کاربر فعلی) که باید تخمین زده شود، UCF ابتدا شباهت‌های کاربر فعلی و سایر کاربران را اندازه‌گیری می‌کند. سپس رتبه‌بندی مجهول با جمع‌آوری رتبه‌بندی‌های شناخته شده مورد توسط کاربران مشابه پیش‌بینی می‌شود.

اخیراً، محققان شروع به بررسی چگونگی بهبود CF با در نظر گرفتن اطلاعات زمینه، به عنوان مثال، اهداف خرید و فصل‌ها کرده‌اند [ 16 ، 17 ، 18 ]. Adomavicius و Tuzhilin (2011) [ 19 ] برای طبقه‌بندی رویکردهای CF آگاه از زمینه (CaCF) به شرح زیر پیشنهاد کردند: (1) پیش فیلتر کردن متنی از اطلاعات زمینه برای فیلتر کردن رتبه‌بندی‌های نامربوط استفاده می‌کند و سپس از CF کلاسیک برای تولید توصیه‌ها استفاده می‌کند. (2) پس فیلترینگ متنی از CF کلاسیک برای تولید توصیه‌ها استفاده می‌کند و سپس نتایج را بر اساس اطلاعات زمینه فیلتر یا رتبه‌بندی مجدد می‌کند. (3) مدل‌سازی زمینه‌ای از اطلاعات زمینه مستقیماً در فرآیند CF برای تولید توصیه‌ها استفاده می‌کند.

توجه داشته باشید که بیشتر روش‌های CF و CaCF فوق برای حوزه فیلم، موسیقی و محصول طراحی شده‌اند و از رتبه‌بندی صریح استفاده می‌کنند. همچنین مطالعاتی در مورد اعمال CF برای توصیه رستوران [ 20 ]، توصیه فروشگاه [ 21 ]، توصیه رویداد [ 22 ] توصیه نمایشگاه در موزه ها [ 23 ] و توصیه مکان با استفاده از مسیرهای GPS [ 24 ] وجود داشت. با این حال، بسیاری از آنها از کاربران خواستند که علایق خود را به صراحت بیان کنند یا رتبه بندی ارائه کنند، به عنوان مثال، Horozov و همکاران. (2006) [ 20 ] و لی و همکاران. (2009) [ 22]. برای دیگرانی که از رفتار کاربران یاد می‌گیرند، توصیه‌ها اغلب فقط با علایق کاربران تطبیق داده می‌شوند، در حالی که بسیاری از عوامل زمینه‌ای، مانند آب و هوا و فصل، که ممکن است برای ایجاد توصیه‌ها نیز مرتبط باشند، نادیده گرفته می‌شوند.

این مقاله سه روش CaCF را پیشنهاد می‌کند تا توصیه‌های مکانی شخصی‌شده و آگاه از زمینه را از داده‌های رسانه‌های اجتماعی دارای برچسب جغرافیایی در دسترس، به‌ویژه عکس‌های فلیکر، استخراج کند. کار ما از دو جنبه با تکنیک های ذکر شده در بالا متفاوت است. در مرحله اول، ما توصیه های مکان را بر اساس تاریخچه ضمنی سفر در دنیای واقعی کاربران، همانطور که از عکس های Flickr استنباط می شود، استخراج می کنیم. ثانیا، ما یک معیار تشابه را برای تعیین کمیت شباهت بین هر دو زمینه و توسعه سه روش توصیه آگاه از زمینه (به عنوان مثال، پیش فیلتر کردن، پس از فیلتر کردن و مدل سازی) پیشنهاد می کنیم.

2.2. تجزیه و تحلیل داده های رسانه های اجتماعی دارای برچسب جغرافیایی

اخیرا، افزایش دسترسی به رسانه های اجتماعی آنلاین (به عنوان مثال، Foursquare و Flickr) منجر به انباشت حجم عظیمی از داده های رسانه های اجتماعی شده است. این داده ها، به ویژه آنهایی که با موقعیت جغرافیایی برچسب گذاری شده اند (به عنوان مثال، طول و عرض جغرافیایی)، حاوی اطلاعات زیادی در مورد سفر، فعالیت ها و رفتار افراد در محیط های مختلف است. در سال های اخیر، استخراج داده های رسانه های اجتماعی با برچسب جغرافیایی توجه قابل توجهی را به خود جلب کرده است.

تحقیقاتی در مورد شناسایی نقاط دیدنی و نقاط توریستی (به عنوان مثال، مکان‌های با عکس‌برداری بالا) از داده‌های رسانه‌های اجتماعی دارای برچسب جغرافیایی [ 3 ، 4 ، 25 ، 26 ] انجام شد. روش‌های خوشه‌بندی مختلفی مانند K-means، خوشه‌بندی میانگین تغییر، خوشه‌بندی مبتنی بر چگالی (به عنوان مثال، DBSCAN (خوشه‌بندی فضایی مبتنی بر چگالی برنامه‌های کاربردی با نویز) و انواع آن) و خوشه‌بندی طیفی استفاده شده‌اند. این مطالعات اغلب برای خلاصه کردن مجموعه‌های عکس دارای برچسب جغرافیایی و استخراج برچسب‌ها یا عکس‌ها و معناشناسی برای مکان‌های خاص گسترش می‌یابد [ 5 ، 6 ، 27 ].

علاوه بر شناسایی نقطه عطف و استخراج معنایی مکان، مطالعاتی نیز با تمرکز بر مدل‌سازی رفتار سفر افراد با استفاده از داده‌های رسانه‌های اجتماعی برچسب‌گذاری‌شده جغرافیایی انجام شد [ 7 ، 8 ، 28 ]. این رویکردها اغلب یک پایگاه داده از مسیرهای سفر و تکنیک های داده کاوی را برای شناسایی مکان های جاذبه و توالی سفرهای مکرر ایجاد می کنند. در حالی که مطالعات فوق از عکس‌های دارای برچسب جغرافیایی استفاده می‌کردند، توجه پژوهشی به سایر داده‌های رسانه‌های اجتماعی (به عنوان مثال، توییت‌ها) نیز معطوف شده است [ 29 ، 30 ]. این رویکردها برای کاربردهای دیگر، مانند تعیین کاربری های زمین [ 31 ] و درک پویایی شهر [ 30 ] گسترش یافته اند.

2.3. توصیه مکان با استفاده از داده های رسانه اجتماعی دارای برچسب جغرافیایی

در سال‌های اخیر، روش‌های زیادی برای استخراج توصیه‌های مکان و سفر بر اساس داده‌های رسانه‌های اجتماعی (مثلاً عکس‌های فلیکر و چک‌های چهار ضلعی) پیشنهاد شده‌اند [ 32 ، 33 ]. برای مثال، De Choudhury و همکاران. (2010) [ 34 ] عکس های فلیکر گردشگران را استخراج کرد، آنها را در یک نمودار مکان جمع کرد و با در نظر گرفتن زمان در دسترس کاربران، برنامه های سفر را ساخت. به طور مشابه، سان و همکاران. (2015) [ 14 ] یک سیستم توصیه برای ارائه محبوب ترین نقاط عطف به کاربران و همچنین بهترین مسیری که آنها را به هم متصل می کند، ساخته است. این روش‌ها عمدتاً محبوبیت مکان را در نظر می‌گرفت و ترجیحات سفر گردشگر را نادیده می‌گرفت و بنابراین توصیه‌های غیرشخصی به او ارائه می‌کرد.

بسیاری از مطالعات دیگر با تمرکز بر توصیه های شخصی وجود دارد. برای مثال، چنگ و همکاران. (2011) [ 11 ] یک الگوریتم توصیه سفر شخصی را با در نظر گرفتن نمایه های کاربر خاص (به عنوان مثال، جنسیت، سن) که از عکس های فلیکر شناسایی شدند، پیشنهاد کرد. بر اساس CF، کلمنتز و همکاران. (2010) [ 10 ] مکان های مورد علاقه کاربر را با استفاده از عکس های Flickr پیش بینی کرد. آنها شباهت بین کاربر فعلی و سایر کاربران را با مقایسه تاریخچه سفر آنها اندازه گیری کردند و از مقادیر شباهت برای رتبه بندی مکان ها استفاده کردند. به طور مشابه، یین و همکاران. (2014) [ 13 ] و گائو و همکاران. (2015) [ 35] روش‌های توصیه شخصی مبتنی بر CF را توسعه داد و عمدتاً به مشکل شروع سرد (یعنی «کاربر جدید» و «مورد جدید») پرداخت. شی و همکاران (2013) [ 12 ] یک روش شخصی سازی شده را برای توصیه نشانه های غیر ضروری که مکان های معمولی نیستند و یافتن آنها در راهنمای سفر دشوار است، پیشنهاد کرد. جیانگ و همکاران (2016) [ 36 ] روشی را برای توصیه توالی سفر شخصی (سفر) بر اساس داده های رسانه های اجتماعی بزرگ چند منبعی ایجاد کرد. ژانگ و همکاران (2016) [ 37] توصیه های شخصی سفر را با توجه به در دسترس بودن POI، تنوع و عدم قطعیت زمان سفر ارائه کرد. توجه داشته باشید که روش‌های فوق بر توصیه مکان‌ها یا سفرهایی که با علایق و محدودیت‌های گردشگران مطابقت دارند، تمرکز می‌کنند، در حالی که زمینه بازدید را نادیده می‌گیرند، به عنوان مثال، آب و هوا و فصل، که ممکن است به طور بالقوه برای ایجاد توصیه‌ها مرتبط باشند.

برخلاف روش‌های فوق که توصیه‌های غیرمتن‌آگاهی را ارائه می‌کردند، این مقاله روش‌های فیلتر مشارکتی آگاه از زمینه را برای ارائه توصیه‌های مکان مطابق با علایق سفر گردشگر و همچنین زمینه بازدید او بر اساس عکس‌های دارای برچسب جغرافیایی بررسی می‌کند. ما نه تنها محبوبیت مکان‌ها و علایق سفر یک گردشگر را که از تاریخچه سفر او به دست می‌آید، در نظر می‌گیریم، بلکه همچنین زمینه بازدید از او را نیز در نظر می‌گیریم (به عنوان مثال، آب و هوا، فصل و زمان روز). کار تحقیقی مشابهی توسط مجید و همکاران ارائه شده است. (2013) [ 38]، که در آن یک روش پیش فیلترسازی متنی پیشنهاد شد. آنها ابتدا زمینه بازدید محبوب هر مکان را شناسایی کردند و مکان هایی را که زمینه محبوب آنها با زمینه فعلی متفاوت است فیلتر کردند. یک تطابق دقیق به کار گرفته شد: برای مثال، اگر زمینه بازدید کنونی «روز هفته-صبح و گرم-آفتاب» باشد، فقط مکان‌هایی که بافت محبوب «صبح روز هفته و گرم-آفتابی» را دارند حفظ می‌شوند. سپس CF برای رتبه‌بندی مجموعه‌های فیلتر شده مکان‌ها اعمال شد و توصیه‌های مکان آگاه از زمینه ارائه شد. به طور خلاصه، روش آنها را می توان به عنوان یک روش CF پیش فیلترسازی متنی با “تطابق دقیق” در نظر گرفت. کار ما با مجید و همکاران فرق دارد. (2013) [ 38] از دو جنبه. اولا، به جای استفاده از “تطابق دقیق”، ما یک معیار شباهت را برای کمی کردن شباهت بین هر دو زمینه پیشنهاد می کنیم. در مرحله دوم، بر اساس اندازه گیری شباهت، ما سه روش CaCF (یعنی پیش فیلتر کردن، پس از فیلتر کردن و مدل سازی) را توسعه می دهیم. نتایج ارزیابی نشان می‌دهد که روش‌های پیشنهادی به طور قابل‌توجهی بهتر از روش‌های پیشرفته هستند. به عبارت دیگر، در مقایسه با “تطابق دقیق”، استفاده از معیار تشابه زمینه پیشنهادی به طور قابل توجهی عملکرد توصیه را بهبود می بخشد.

3. روش شناسی

3.1. تعریف مسئله و بررسی اجمالی روش

تعریف 1

(عکس دارای برچسب جغرافیایی). یک عکس دارای برچسب جغرافیایی

p

به عنوان یک تاپل تعریف شده است

(i d, u, l o c, t)

، حاوی یک شناسه عکس

i d

، شناسه کاربر کمک کننده

u

، مکان عکس گرفته شده است

l o c

(به عنوان یک جفت طول و عرض جغرافیایی نشان داده می شود) و زمان صرف شده است

t

ما استفاده می کنیم

P^{u}

برای نشان دادن مجموعه ای از عکس های ارائه شده توسط کاربر

u

U

به عنوان مجموعه همه کاربران و

P

به عنوان مجموعه ای از عکس های ارائه شده توسط همه کاربران.

تعریف 2

(موقعیت گردشگری). یک مکان توریستی

l

یک منطقه جغرافیایی در یک شهر، مانند یک میدان، یک پارک یا یک موزه است که گردشگران زیادی را برای بازدید و گرفتن عکس جذب می کند.

ما استفاده می کنیم

L

برای نشان دادن مجموعه ای از همه مکان ها و

L^{u}

به عنوان زیر مجموعه مکان های بازدید شده توسط کاربر

u

تعریف 3

(مدل زمینه بازدیدها). مدل زمینه بازدیدها

C M

شامل فهرستی منظم از پارامترهای زمینه (ابعاد) مربوطه است. بدین ترتیب،

C M = (C P_{1}, C P_{2}, \dots, C P_{n})

، کجا

n

تعداد پارامترهای زمینه مربوطه است. هر پارامتر

C P_{i}

یک تاپل است

(n a m e, r a n g e)

، جایی که

C P_{i} . n a m e

یک برچسب منحصر به فرد برای نشان دادن نام پارامتر است (به عنوان مثال، “آب و هوا”) و

C P_{i} . r a n g e

مجموعه مقادیر معتبری است که می توان به آن نسبت داد (به عنوان مثال، تمام شرایط آب و هوایی موجود، “آفتابی” و “بارانی”).

\hat{C M}

فضای مدل زمینه را نشان می دهد و مجموعه ای از تمام موقعیت های ممکن است که تحت آن یک بازدید می تواند رخ دهد.

نمونه ای از

C M

است (“آب و هوا: آفتابی، بارانی”، “فصل: بهار، تابستان، پاییز، زمستان”) ، که در آن “آب و هوا” و “فصل” پارامترهای زمینه مرتبط هستند. یک عنصر نمونه از

\hat{C M}

می تواند (“آفتابی”، “پاییز”) باشد .

تعریف 4

(زمینه بازدید). زمینه بازدید

c x \in \hat{C M}

نمونه ای از

C M

c x = (c p v_{1}, c p v_{2}, \dots, c p v_{i}, \dots, c p v_{n})

، کجا

c p v_{i} \in C P_{i} . r a n g e

. به عنوان مثال، (“آفتابی”، “بهار”) زمینه نمونه ای از بازدید است.

وظیفه توصیه را می توان به صورت زیر تعریف کرد: مجموعه ای از عکس های دارای برچسب جغرافیایی

P

، یک کاربر خاص

u

و زمینه بازدید او

c x

، مجموعه ای از مکان ها را پیدا کنید

L^{R} \subseteq L - L^{u}

که

u

به احتمال زیاد بازدید می شود.

ما با جمع‌آوری تاریخچه سفر سایر گردشگران (که از عکس‌های دارای برچسب جغرافیایی استخراج می‌شود) مشکل را برطرف می‌کنیم تا کاربر فعلی را ارائه دهیم.

u

با توصیه های مکان مطابق با ترجیحات سفر و زمینه بازدید. به ویژه، CF، که مواردی را به کاربر توصیه می‌کند که سایر کاربران با اولویت‌های مشابه قبلاً استفاده می‌کردند یا از آنها بازدید می‌کردند.

شکل 1 یک نمای کلی از روش شناسی را نشان می دهد. بر اساس مجموعه عکس های بازیابی شده از فلیکر، ابتدا مکان های گردشگری را با استفاده از روش های خوشه بندی مبتنی بر تراکم شناسایی می کنیم ( بخش 3.2 ). با مکان‌های کشف‌شده، مکان‌های بازدید شده هر گردشگر در هر شهر استخراج و با بافت بازدید غنی‌سازی می‌شوند ( بخش 3.2 ). ما اطلاعات «تاریخ گرفته‌شده» عکس‌ها را برای استخراج بافت زمانی (یعنی زمان روز و فصل) تجزیه و تحلیل می‌کنیم و از Weather Underground API [ 39 ] برای بازیابی شرایط آب و هوایی استفاده می‌کنیم. ما از این تاریخچه سفر برای مدل سازی ترجیحات گردشگران استفاده می کنیم. سپس از آنها برای تخمین شباهت های بین گردشگران و شباهت های بین زمینه ها استفاده می شود ( بخش 3.3). برای ایجاد توصیه‌های مکان، ما سه روش آگاه از زمینه را توسعه می‌دهیم، یعنی پیش فیلتر کردن متنی، پس فیلتر کردن و مدل‌سازی ( بخش 3.4 ). این روش ها در نحوه و زمان استفاده از اطلاعات زمینه متفاوت هستند.

3.2. شناسایی موقعیت مکانی توریستی و استخراج تاریخچه سفر

3.2.1. تشخیص موقعیت مکانی توریستی

قبل از شناسایی مکان های گردشگری از مجموعه عکس های دارای برچسب جغرافیایی، باید عکس های ارائه شده توسط ساکنان محلی را فیلتر کنیم. به دلیل فقدان اطلاعات خانه در پروفایل بسیاری از کاربران فلیکر، چندین الگوریتم اکتشافی برای تمایز بین ساکنان محلی و گردشگران پیشنهاد شده است [ 14 ، 34 ، 40 ]. به دلیل سادگی و شهودی بودن آن، قاعده اکتشافی به کار رفته در De Choudhury و همکارانش. (2010) [ 34 ] و Kadar and Gede (2013) [ 40] استفاده می شود. فرض بر این است که در حالی که بیشتر گردشگران بازدیدهای خود را در یک بازه زمانی کوتاه چند روزه متمرکز می کنند، ساکنان محلی یک شهر تمایل دارند از شهر در مدت زمان بسیار طولانی تری عکس بگیرند. بنابراین، گردشگران و ساکنان محلی را می توان با بررسی بازه زمان گرفته شده بین اولین و آخرین عکس آنها متمایز کرد. به دنبال Kadar و Gede (2013) [ 40 ]، آستانه بازه زمانی را 5 روز تعیین کردیم.

پس از فیلتر کردن عکس‌های ارائه‌شده توسط ساکنان محلی، می‌توانیم مکان‌های گردشگری را از عکس‌های باقی‌مانده شناسایی کنیم. یافتن مکان‌های توریستی از مجموعه عکس‌های دارای برچسب جغرافیایی را می‌توان به عنوان یک مشکل خوشه‌بندی در شناسایی مکان‌های با عکس‌برداری بالا در نظر گرفت. همانطور که قبلا ذکر شد، الگوریتم‌های خوشه‌بندی مختلفی مانند K-means، خوشه‌بندی طیفی و خوشه‌بندی مبتنی بر چگالی (به عنوان مثال، DBSCAN) پیشنهاد شده‌اند. با توجه به توانایی آن در کشف خوشه هایی با اشکال دلخواه و عدم حساسیت به نویز، DBSCAN برای شناسایی مکان های بسیار عکاسی شده (یعنی مکان های توریستی) برای هر شهر استفاده می شود. این به دو پارامتر نیاز دارد: شعاع (Eps) و حداقل تعداد نقاط در یک خوشه (MinPts). خروجی DBSCAN مجموعه ای از خوشه های عکس (مکان ها) است.

L_{c} = {l_{1}, l_{2}, \dots, l_{n}}

برای هر شهر هر عنصر

l = (i d, P^{l})

یک مکان توریستی است، که در آن

P^{l}

گروه عکس های درون خوشه است.

P^{l}

می توان برای محاسبه مرز جغرافیایی خوشه (موقعیت گردشگری)، و همچنین برای شناسایی معنایی (به عنوان مثال، دسته بندی ها) یا نام این مکان توریستی استفاده کرد، که هر دو از حوصله این مقاله خارج هستند. در این مقاله، ما به سادگی هر مکان گردشگری را به عنوان یک برچسب منحصر به فرد (مثلاً مکان A) نشان می دهیم.

3.2.2. استخراج تاریخچه سفر

هنگامی که مکان های گردشگری برای هر شهر شناسایی شد، می توانیم مکان های بازدید شده توسط هر گردشگر را استخراج کنیم.

تعریف 5

(بازدید). یک دیدار

v

به عنوان یک تاپل تعریف شده است

(u, l, t, c x)

، جایی که

u

کاربری است که بازدید کرده است

v

به مکان

l

در زمان

t

و در چارچوب

c x

برای استخراج بازدیدهای هر گردشگر، ابتدا عکس های او را بر اساس زمان گرفته شده مرتب می کنیم. اگر یک عکس

p = (i d, u, l o c, t)

در یک خوشه عکس خاص موجود است

l

(یعنی مکان توریستی)، بازدیدی که توسط

u

به مکان

l

در زمان

t

تشخیص داده می شود. توجه داشته باشید که یک توریست

u

ممکن است در بازدید از یک مکان بیش از یک عکس بگیرد. بنابراین، اگر مجموعه‌ای از عکس‌های متوالی گرفته‌شده توسط یک کاربر در یک خوشه عکس وجود داشته باشد و اختلاف زمانی بین اولین و آخرین عکس در مجموعه کمتر از آستانه مدت زمان باشد.

δ_{d u r}

، این مجموعه عکس ها را متعلق به همان بازدید می دانیم و از میانگین زمان گرفته شده از این عکس ها به عنوان زمان بازدید استفاده می کنیم.

t

برای شناسایی زمینه بازدید

cx

برای هر بازدید شناسایی شده

v

، ما عمدتا از مکان استفاده می کنیم

l

و زمان

t

. در این مقاله به دلیل در دسترس بودن آنها، بر ابعاد (پارامترهای) زیر تمرکز می کنیم: «فصل»، «زمان روز» و «آب و هوا». ما استفاده می کنیم

t

برای استخراج دو بعد اول مشابه لی و همکاران. (2010) [ 41 ]، انتزاع از مهر زمانی خام اعمال می شود: (1) “فصل”: بهار (مارس-مه)، تابستان (ژوئن تا آگوست)، پاییز (سپتامبر-نوامبر) و زمستان (دسامبر-فوریه) ) (2) “زمان روز”: صبح (6:00-12:00)، بعد از ظهر (12:00-18:00)، شب (18:00-6:00). برای استخراج وضعیت آب و هوا، اطلاعات آب و هوا را برای مکان بازیابی می کنیم

l

در زمان

t

با استفاده از Weather Underground API و طبقه بندی اطلاعات خام آب و هوا در سه حالت زیر: “بارانی_یا_برفی”، “روشن” (به عنوان مثال، آفتابی) و “ابری”. به عبارت دیگر،

C M

= («فصل: بهار، تابستان، پاییز، زمستان»، «زمان روز: صبح، بعد از ظهر، شب»، «آب و هوا: بارانی_یا_برفی، صاف، ابری»).

با اینها، مکان های بازدید شده توسط هر گردشگر به همراه زمینه های بازدید از مجموعه عکس قابل شناسایی است. این مجموعه از بازدیدها را می توان به عنوان مشخصات گردشگر در نظر گرفت و ترجیحات و علایق سفر او را منعکس می کند.

3.3. شباهت کاربر و کاوش شباهت زمینه

3.3.1. شباهت کاربر

برای شناسایی سایر گردشگرانی که از «تجربه‌های سفر» آنها می‌توان برای ایجاد توصیه‌هایی برای کاربر فعلی (گردشگر) استفاده کرد، یک معیار شباهت کاربر (بر اساس ضریب سورنسن-دایس) با مقایسه مکان‌های بازدید شده توسط گردشگران ایجاد می‌شود.

U اس i m (a, b) = 2 \times ∣ ∣ L آ \cap L ب ∣ ∣ | L آ | + | L ب |

(1)

$| L^{a} |$ و $| L^{b} |$ تعداد مکان های بازدید شده توسط گردشگران است $a$ و $b$ ، و $| L^{a} \cap L^{b} |$ تعداد مکان هایی است که معمولاً توسط آنها بازدید می شود.

بدیهی است که دو گردشگر که مجموعه‌ای از مکان‌های بازدید شده توسط چند نفر را به اشتراک می‌گذارند ممکن است نسبت به دیگرانی که مجموعه‌ای از مکان‌های بازدید شده توسط افراد زیادی را به اشتراک گذاشته‌اند، همبستگی بیشتری داشته باشند [ 24 ]. به عنوان مثال، بسیاری از مردم از بیگ بن و پل تاور، دو مکان دیدنی معروف لندن دیدن کرده‌اند. شاید اینطور نباشد که همه این افراد شبیه یکدیگر باشند. با این حال، اگر دو کاربر از مکانی بازدید کنند که چندان محبوب نیست، ممکن است در واقع ترجیحات سفر مشابهی داشته باشند. بنابراین، محبوبیت مکان هنگام اندازه گیری شباهت کاربر در نظر گرفته می شود. به دلیل سادگی، فرکانس معکوس سند (IDF)، که اغلب در بازیابی اطلاعات برای سنجش اینکه یک اصطلاح (مثلاً کلمه) رایج است یا نادر در همه اسناد استفاده می شود [42 ]]، برای اندازه گیری محبوبیت یک مکان استفاده می شود

l

من D اف ل = log N / ن ل

(2)

$N$ تعداد تمام گردشگران است و $N_{l}$ تعداد گردشگرانی است که بازدید کردند $l$ . ارزش های $I D F$ محدوده 0-1. بزرگتر $I D F$ ، هر چه یک مکان محبوبیت کمتری داشته باشد. بنابراین، معادله (1) به صورت زیر بسط می‌یابد:

U اس i m (a, b) = 2 \times \sum l ϵ L آ \cap L ب ( من D اف ل ) \sum l ϵ L آ ( من D اف ل ) + \sum l ϵ L ب ( من D اف ل )

(3)

مقادیر شباهت از 0 تا 1 متغیر است. صفر به این معنی است که هر دو گردشگر تاریخچه مکان مشترکی نداشتند و 1 به این معنی است که آنها از یک مجموعه مکان بازدید کرده اند. با اعمال اندازه گیری، می توانیم یک ماتریس شباهت کاربر USim_M _UU بسازیم . هر عنصر در آن نشان دهنده شباهت بین دو کاربر است.

3.3.2. شباهت زمینه

به طور کلی، «تجربه‌هایی» (یعنی بازدیدهای موجود در این مقاله) که در زمینه‌های مشابه با شرایط فعلی اتفاق می‌افتند، برای ایجاد توصیه‌های مکان مفیدتر از تجربیاتی هستند که در زمینه‌های غیرمشابه اتفاق می‌افتند. بنابراین، ما یک رویکرد مبتنی بر اکتشافی برای اندازه‌گیری شباهت بین هر دو زمینه پیشنهاد می‌کنیم.

ما فرض می کنیم که اگر بازدیدهایی که در یک زمینه (موقعیت) اتفاق می افتد مشابه بازدیدهایی باشد که در زمینه دیگری اتفاق می افتد، این دو زمینه (موقعیت) را می توان مشابه در نظر گرفت. توجه داشته باشید که برای “بازدید”، منظور ما هر بازدید جداگانه نیست، بلکه مجموعه ای از تمام بازدیدهایی است که در زمینه اتفاق می افتد. بر اساس این فرض، شباهت بین هر دو زمینه را با دو مرحله زیر اندازه گیری می کنیم:

نمایه هر زمینه (موقعیت) به عنوان یک بردار نشان داده می شود $X^{A} = 〈 w_{1}^{A}, w_{2}^{A}, \dots, w_{l}^{A}, \dots, w_{n}^{A} 〉$ ، جایی که $A$ نشان دهنده زمینه، و $A \in \hat{C M}$ (به تعاریف 3 و 4 مراجعه کنید). هر یک از اعضای بردار $w_{l}^{A}$ مربوط به استفاده از یک مکان در این شرایط است $A$ ، و بنابراین، $n$ برابر است با تعداد مکان ها در سناریوی برنامه (مثلاً در یک شهر معین). ما از اصطلاح اندازه گیری فرکانس سند معکوس فرکانس (TF-IDF) برای محاسبه مقدار هر یک استفاده می کنیم $w_{l}^{A}$ . TF-IDF در زمینه بازیابی اطلاعات برای اندازه گیری اهمیت یک کلمه برای یک سند در یک مجموعه یا مجموعه استفاده می شود. متناسب با تعداد دفعاتی که یک کلمه در سند ظاهر می شود، افزایش می یابد، اما با فراوانی کلمه در مجموعه جبران می شود [ 42 ]. بخش دوم این واقعیت را کنترل می کند که برخی از کلمات به طور کلی رایج تر از دیگران هستند. از این رو، $w_{l}^{A}$ به صورت زیر محاسبه می شود:

$w آ ل = تی اف ل \times من D اف ل = ن الف ، ل ن الف ،. _\times l o g ن . ، . ن . ، ل$

(4)

$N_{A, l}$ تعداد بازدیدها در زمینه است $A$ که مکان بازدید شده است $l$ ; $N_{A, .}$ تعداد بازدیدها را نشان می دهد $A$ ; $N_{., l}$ نشان دهنده تعداد بازدیدها در تمام زمینه هایی است که بازدید شده است $l$ ; و $N_{., .}$ تعداد کل بازدیدها در همه زمینه ها است. بخش اول معادله (4) تعداد دفعات را نشان می دهد $l$ در بازدید شد $A$ ، در حالی که بخش دوم اندازه گیری می کند که آیا $l$ معمولاً یا به ندرت در همه زمینه ها بازدید می شد.

نمایه یک بافت را می توان به عنوان یک نمای تلفیقی از استفاده از مکان های مختلف در این زمینه (موقعیت) در نظر گرفت که می تواند برای توصیف بافت مورد استفاده قرار گیرد.
سپس شباهت بین دو زمینه با استفاده از معیار تشابه کسینوس محاسبه می شود. این عمدتا به این دلیل است که شباهت کسینوس اغلب برای اندازه گیری شباهت بین اشیایی که به عنوان بردار نشان داده می شوند استفاده می شود و کسینوس زاویه بین این دو بردار را اندازه گیری می کند [43 ] . بنابراین، شباهت بین دو زمینه (که با A و B مشخص می شود ) را می توان به عنوان شباهت کسینوس بین بردارهای نمایه متناظر آنها اندازه گیری کرد.

$سی اس i m (A, B) = cos (θ) = ایکس آ \cdot ایکس ب ∥ ایکس آ ∥ ∥ ایکس ب ∥ = \sum n i = 1 w آ من \times w ب من \sum n i = 1 ( w آ من ) 2 - - - - - - - - - \sqrt \times \sum n i = 1 ( w ب من ) 2 - - - - - - - - - - \sqrt$

(5)

مقادیر شباهت از 0 تا 1 متغیر است. لطفاً توجه داشته باشید که اندازه گیری بر اساس رفتار بازدید گردشگران محاسبه می شود که برای کار توصیه مکان مناسب است. ممکن است مستقیماً در سناریوهای برنامه دیگر استفاده نشود. با این حال، ما استدلال می کنیم که ایده های کلیدی پشت آن هنوز قابل اجرا هستند.

در ارزیابی ( بخش 4 )، با توجه به ویژگی های متنوع شهرهای مختلف (که به طور بالقوه بر رفتار بازدید گردشگران در زمینه های مختلف تأثیر می گذارد)، فرض می کنیم که شباهت بافت وابسته به شهر است. بنابراین، ما یک ماتریس شباهت زمینه CSim_M _CC برای هر شهر می سازیم. هر عنصر در CSim_M _CC نشان دهنده شباهت بین دو زمینه در شهر است.

3.4. توصیه موقعیت مکانی آگاه از زمینه

همانطور که قبلا ذکر شد، Adomavicius و Tuzhilin (2011) [ 19 ] پیشنهاد کردند که اطلاعات زمینه را می توان با پیش فیلتر کردن متنی، پس از فیلتر کردن و مدل سازی در CF گنجاند. با این حال، این طبقه بندی برای توصیه های مکان در حوزه گردشگری اعمال نشده است. در این بخش، ما این طبقه‌بندی را اعمال می‌کنیم و سه روش را برای استخراج توصیه‌های مکان شخصی‌شده و آگاه از زمینه ایجاد می‌کنیم.

3.4.1. پیش فیلتر کردن متنی

ایده اصلی پیش فیلتر کردن متنی فیلتر کردن مکان های نامربوط قبل از استفاده از CF کلاسیک (یعنی CF غیر متنی) است. بنابراین، ما رویکرد پیش‌فیلترسازی متنی زیر را توسعه می‌دهیم (CaCF_Pre):

مکان‌هایی را که نمایه متنی آن‌ها مشابه بافت فعلی نیست، فیلتر کنید. همچنین مکان‌هایی را فیلتر می‌کنیم که توسط کاربر فعلی که درخواست توصیه می‌کند از آنها بازدید کرده است. ما نمایه متنی یک مکان را نشان می دهیم $l$ به عنوان یک بردار $C P^{l} = 〈 S_{1}^{l}, S_{2}^{l}, ..., S_{i}^{l}, \dots, S_{m}^{l} 〉$ . $m = | \hat{C M} |$ تعداد تمام زمینه‌ها (موقعیت‌های) ممکنی است که بازدیدها می‌توانند در آنها اتفاق بیفتند. هر یک از اعضای بردار $S_{i}^{l}$ مربوط به درصد بازدید در زمینه (موقعیت) است $i$ و به صورت زیر محاسبه می شود:

$اس ل من = ن من ، ل / ن . ، ل$

(6)

$N_{i, l}$ تعداد بازدیدها در زمینه است $i$ که مکان بازدید شده است $l$ ، و $N_{., l}$ نشان دهنده تعداد بازدیدها در تمام زمینه هایی است که بازدید شده است $l$ . نمایه متنی یک مکان را می توان به عنوان نمای انبوهی از توزیع بازدید در تمام زمینه ها (موقعیت ها) در نظر گرفت. سپس از معیار زیر برای تعیین کمیت مناسب بودن مکان بازدید استفاده می کنیم $l$ در متن $c x$ :

$a p r (l, c x) = \sum من \in سی م ˆ (اس ل من \times سی اس من (c x, i))_$

(7)

توجه داشته باشید که $\hat{C M}$ مجموعه ای از تمام زمینه های ممکن است. اگر $a p r (l, c u r r e n t_c x)$ از یک آستانه فراتر نمی رود $δ$ ، ما آن را در نظر می گیریم $l$ برای شرایط فعلی مناسب نیست $c u r r e n t_c x$ و بنابراین، آن را فیلتر کنید. نتایج این مرحله مجموعه ای از مکان های کاندید است که برای بازدید در شرایط فعلی مناسب است.
CF کلاسیک را برای رتبه‌بندی مکان‌های نامزد به‌دست‌آمده از مرحله 1 اعمال کنید. به یاد بیاورید که CF مواردی را به کاربر توصیه می‌کند که افراد دیگر با اولویت‌های مشابه در گذشته «پسندیده‌اند». بنابراین، مکان‌های بازدید شده توسط سایر گردشگران را جمع‌آوری می‌کنیم (با ارزش شباهت آنها با کاربر فعلی u که می‌توان از USim_M _UU به دست آورد ) تا مکان‌های نامزد را سفارش دهیم. به طور خاص، اولویت پیش بینی شده کاربر فعلی $u$ به محل نامزدی $l$ به صورت زیر محاسبه می شود:

$پr e d_ Va l u e _ Co n x _ Pr e ( u ، l ) = ∑v ∈ U − { u }( v i s i t _ o r _ n o t ( v , l ) × Uاسمن ( v , u ) ) _∑v ∈ U − { u }Uاسمن ( v , u ) _پ�هد_�آلتوه_سی��ایکس_پ�ه (تو،ل)=∑�∈U–{تو}(�منسمنتی_��_��تی(�،ل)×�اسمنمتر(�،تو))∑�∈U–{تو}�اسمنمتر(�،تو)$

(8)

جایی که $v i s i t_o r_n o t (v, l) = 1$ اگر کاربر $v$ مکان بازدید شده $l$ . در غیر این صورت، $v i s i t_o r_n o t (v, l) = 0$ . $U - {u}$ مجموعه همه کاربران دیگر است (به استثنای کاربر فعلی $u$ ).

بر اساس معادله (8)، مکان های کاندید می توانند مجدداً رتبه بندی شوند و k عدد بالای این مکان ها را می توان به عنوان نتایج توصیه به کاربر فعلی برگرداند.

3.4.2. پس-فیلترسازی متنی

متفاوت از پیش فیلتر متنی، پس فیلترینگ متنی (CaCF_Post) ابتدا از CF کلاسیک استفاده می کند و سپس نتایج را بر اساس اطلاعات زمینه تنظیم می کند.

CF کلاسیک را برای رتبه بندی همه مکان ها اعمال کنید. به طور خاص، مکان‌های بازدید شده توسط سایر گردشگران را جمع آوری کنید (بر اساس مقادیر شباهت آنها با کاربر فعلی u که می‌تواند از USim_M _UU بدست آید ؛ معادله (8) را ببینید). نتایج این مرحله مجموعه‌ای از مکان‌های کاندید و مقادیر پیش‌بینی‌شده مربوط به آن‌ها است.
برای هر مکان نامزد، احتمال بازدید آن را در شرایط فعلی محاسبه کنید $c u r r e n t_c x$ . احتمال بازدید از یک مکان $l$ به عنوان کسری از همسایگان (یعنی همه گردشگران دیگر) که بازدید کرده اند محاسبه می شود $l$ در زمینه های مشابه، به عنوان مثال، زمینه هایی که شباهت آنها با $c u r r e n t_c x$ بزرگتر از یک آستانه است $δ$ .

$Vمن هستم _ پ _ _r o b ( l ) = | { o | o ϵ n e i g h b o r s ∧ v i s i t ( o , l , c x ) ∧ CSim ( c x , c u r r e n t _ c x ) > δ} || n e i gh b o r s |�منسمنتی_پ��ب (ل)=|{�|�� همن�ساعتب��س ∧ �منسمنتی (�،ل،جایکس) ∧ CSim(جایکس،جتو��ه�تی_جایکس)>�}||�همن�ساعتب��س|$

(9)

مخرج تعداد همسایگان را نشان می‌دهد و صورت‌گر تعداد همسایگانی را نشان می‌دهد که از مکان بازدید کرده‌اند. $l$ در زمینه های مشابه
مقدار نهایی پیش بینی شده برای هر مکان نامزد $l$ به صورت زیر محاسبه می شود:

$پ r e d_V a l u e_C o n x (l) = p r e d_v (l) \times V من هستم_پ__r o b (l)$

(10)

جایی که $p r e d_v (l)$ مقدار پیش بینی شده از مرحله 1 محاسبه شده است.

با اینها، می‌توانیم مکان‌های نامزد را مجدداً رتبه‌بندی کنیم و k تعداد مکان‌های برتر را به عنوان نتایج توصیه‌ها به کاربر فعلی برگردانیم.

3.4.3. مدلسازی متنی

در مقایسه با رویکردهای فوق، مدل‌سازی زمینه‌ای از اطلاعات زمینه مستقیماً در فرآیند CF استفاده می‌کند. توجه داشته باشید که فرآیند CF را می توان به عنوان “شناسایی نظرات مفید” و “تجمیع نظرات” در نظر گرفت. بنابراین، ما رویکرد مدل‌سازی زمینه‌ای زیر (CaCF_Mdl) را طراحی می‌کنیم.

برای بازدید هر یک از گردشگران دیگر $v$ ، ابزار توصیه آن را به کاربر فعلی محاسبه کنید $u$ در شرایط فعلی $c u r r e n t_c x$ .

$U تو من____(v, u) = U اس i m (v . u, u) \times C اس i m (v . c x, c u r r e n t_c x)$

(11)

ابزار توصیه یک بازدید $v$ را می توان اینگونه در نظر گرفت که «چقدر می توانیم از بازدید مفید استفاده کنیم $v$ برای ایجاد توصیه هایی برای کاربر فعلی $u$ در شرایط فعلی $c u r r e n t_c x$ “.
برای هر مکان $l$ که توسط آن بازدید نشده است $u$ ، پیش بینی $u$ رتبه بندی ترجیحی برای $l$ ، که با در نظر گرفتن ابزار پیشنهادی هر بازدید موجود محاسبه می شود $v$ به محل $l$ . بنابراین، اولویت پیش بینی شده کاربر فعلی $u$ برای یک مکان $l$ را می توان به صورت زیر محاسبه کرد:

$پr e d_ v a l u e ( u , l ) =∑v ∈ { o | o ϵ V∧ o _ l = l }Uتو من _ _ _ _( v , u )پ�هد_�آلتوه(تو،ل)=∑�∈{�|��∧�.ل=ل}�تیمنلمنتی�(�،تو)$

(12)

$V$ مجموعه همه بازدیدها را نشان می دهد و ${o | o ϵ V \land o . l = l}$ مجموعه بازدید از مکان است $l$ .
مکان‌ها را بر اساس مقادیر پیش‌بینی‌شده رتبه‌بندی کنید و به‌عنوان نتایج توصیه، k عدد بالای مکان‌ها را به کاربر فعلی برگردانید.

4. ارزیابی و بحث

این بخش روش‌های CaCF پیشنهادی را در برابر برخی روش‌های معیار ارزیابی می‌کند. ارزیابی با استفاده از Python و PostgreSQL اجرا شد. بخش 4.1 مجموعه داده را توصیف می کند. بخش 4.2 نحوه پردازش مجموعه داده ها را برای شناسایی مکان های گردشگری و استخراج تاریخچه سفر هر گردشگر ارائه می دهد. ما تنظیمات آزمایشی را در بخش 4.3 توضیح می دهیم . نتایج در بخش 4.4 ارائه و مورد بحث قرار گرفته است .

4.1. مجموعه داده

ما از API عمومی Flickr (به ویژه flickr.photos.search) برای بازیابی عکس های دارای برچسب جغرافیایی برای شش شهر در اروپا بین 1 ژانویه 2008 تا 31 دسامبر 2013 استفاده کردیم. فقط ابرداده های هر عکس نگهداری می شد که حاوی “photoid”، “مالک” بود. ، “عنوان”، “تاریخ آپلود”، “تاریخ گرفته شده”، “برچسب ها”، “لات”، “lon” و غیره. در مجموع، ما 2,627,139 عکس دارای برچسب جغرافیایی از 79,951 کاربر جمع آوری کردیم ( جدول 1 ).

ما ابتدا ابرداده عکس‌هایی را حذف کردیم که زمان بارگذاری آن‌ها (“تاریخ آپلود”) با زمان گرفته شده (“تاریخ گرفته شده”) یکسان است. برای پاکسازی بیشتر مجموعه داده ها، عکس ها را بر اساس شهرهایی که در آن گرفته شده اند جدا کردیم. برای عکس‌های هر شهر، عکس‌های ارائه‌شده توسط ساکنان محلی آن شهر را با استفاده از قانون اکتشافی معرفی‌شده در بخش 3.2.1 فیلتر کردیم . شکل 2 توزیع فضایی عکس های باقی مانده را در شهرهای مختلف نشان می دهد.

4.2. شناسایی موقعیت مکانی توریستی و استخراج تاریخچه سفر

همانطور که در بخش 3.2 معرفی شد ، ما از DBSCAN برای خوشه‌بندی عکس‌ها و شناسایی مکان‌های توریستی استفاده کردیم. DBSCAN دارای دو پارامتر MinPts و Eps است. ما تجزیه و تحلیل حساسیت این دو پارامتر را انجام دادیم. شکل 3 نشان می دهد که چگونه تعداد خوشه های شناسایی شده در MinPts و Eps مختلف تغییر می کند. به غیر از منحنی برای MinPts = 60، منحنی های دیگر به طور مشابه تغییر می کنند. هنگامی که مقدار Eps حدود 30 متر است، تعداد خوشه ها به حداکثر مقدار می رسد. تعداد خوشه‌های شناسایی‌شده همیشه با افزایش MinPt کاهش می‌یابد، و زمانی که MinPts بیش از 100 باشد، کاهش آهسته می‌شود. شکل 4 مکان های گردشگری شناسایی شده در شهرهای مختلف را نشان می دهد.

بر اساس فهرست مکان‌های گردشگری، تاریخچه سفر هر گردشگر را استخراج کردیم. برای شناسایی بازدیدها از عکس‌ها، آستانه مدت بازدید را تنظیم می‌کنیم

δ_{d u r}

به عنوان هشت ساعت، که با مدت زمان افتتاح بسیاری از مکان های دیدنی در اروپا قابل مقایسه است. برای هر بازدید، از مهر زمانی آن برای استخراج «فصل» و «زمان روز» استفاده کردیم و از Weather Underground API برای بازیابی «آب و هوا» استفاده کردیم. در مجموع 21541 بازدید از 1257 گردشگر استخراج کردیم. جدول 2 تعداد گردشگران و توزیع آن در تعداد مکان های بازدید شده در هر شهر را خلاصه می کند.

4.3. راه اندازی آزمایشی

اهداف: برای ارزیابی تجربی، ما عمدتاً علاقه مند به مقایسه روش‌های CaCF پیشنهادی با روش CF کلاسیک (یعنی CF غیر متنی) و سایر روش‌های مدرن آگاه از زمینه بودیم. ما می خواهیم به سؤالات زیر پاسخ دهیم: (1) آیا در نظر گرفتن اطلاعات زمینه در CF عملکرد توصیه را بهبود می بخشد؟ (2) آیا روش‌های آگاه از زمینه پیشنهادی بهتر از روش‌های پیشرفته عمل می‌کنند؟ آیا استفاده از معیار تشابه زمینه پیشنهادی عملکرد توصیه را بهبود می بخشد؟

روش های محک زنی: به منظور رفع اهداف فوق، روش های محک گذاری زیر را اجرا کردیم:

CF کلاسیک (“nonCaCF”): این یک CF غیر متنی است که مکان هایی را به کاربر توصیه می کند که سایر کاربران با ترجیحات مشابه در گذشته از آنها بازدید کرده اند. تنها با استفاده از مرحله دوم CaCF_Pre می توان آن را پیاده سازی کرد (به بخش 3.4.1 مراجعه کنید ).
پیش فیلتر متنی با “تطابق دقیق” (“CaCF_Pre_EM”): این یک روش پیشرفته است که در مجید و همکاران ارائه شده است. (2013) [ 38 ]. برای اجرای آن، هر مکان را شناسایی کردیم $l$ زمینه بازدید محبوب (یعنی زمینه ای که بیشترین بازدیدها در آن است $l$ اتفاق افتاد) و سپس مکان‌هایی را فیلتر کرد که زمینه بازدید محبوب آنها با بافت فعلی متفاوت است با استفاده از تطابق دقیق ( برای جزئیات بیشتر به بخش 2.3 مراجعه کنید ). سپس CF کلاسیک برای رتبه‌بندی مجدد مجموعه فیلتر شده مکان‌ها توسعه یافت.

چارچوب ارزیابی: برای ارزیابی، تنها گردشگرانی انتخاب شدند که حداقل از دو شهر بازدید کرده باشند. برای هر توریست

u

، از یکی از شهرهای بازدید شده وی به عنوان شهر آزمایش استفاده کردیم

C_{u}^{t}

و سایر شهرها به عنوان شهرهای آموزشی

C_{u}^{o}

. به عبارت دیگر، ما مکان‌هایی را که واقعاً بازدید شده‌اند پیش‌بینی کردیم

u

در شهر

C_{u}^{t}

، بر اساس سابقه سفر او در

C_{u}^{o}

. بازدیدهای انجام شده توسط

u

در شهر

C_{u}^{t}

برای به دست آوردن: تعداد (که با k نشان داده می شود ) مکان هایی که واقعاً توسط آنها بازدید شده است استفاده شد

u

و مجموعه زمینه های مرتبط با بازدید از این مکان ها. این مجموعه از زمینه ها به عنوان ورودی برای الگوریتم های توصیه زمینه آگاه (CaCF) استفاده شد. برای هر الگوریتم، k مکان را برای کاربر آزمایشی توصیه کردیم

u

برای بازدید در شهر

C_{u}^{t}

برای اندازه‌گیری عملکرد روش‌های پیشنهادی و روش‌های معیار، ما لیست توصیه‌ها را با فهرست واقعی مکان‌های بازدید شده توسط

u

در شهر

C_{u}^{t}

. دقت و یادآوری محبوب ترین معیارها برای ارزیابی سیستم های بازیابی اطلاعات هستند [ 44 ]. هرلوکر و همکاران (2004) [ 45 ] استدلال کردند که یادآوری برای ارزیابی کیفیت توصیه غیرعملی است. بنابراین، در این مطالعه از دقت برای ارزیابی کیفیت توصیه استفاده شد و به عنوان کسری از مکان‌های پیشنهادی که واقعاً توسط آنها بازدید شده بود، تعریف شد.

u

. علاوه بر این، ما از میانگین دقت متوسط (MAP) نیز استفاده کردیم، که نشان داده شده است که تمایز و ثبات خوبی برای اندازه‌گیری اثربخشی رتبه‌بندی دارد [ 44 ]. به‌عنوان میانگین مقادیر میانگین دقت (AP) همه پرس‌و‌جوها محاسبه شد، و AP هر پرس‌وجو به‌عنوان میانگین مقادیر دقت در هر توصیه درست محاسبه می‌شود (یعنی مکان پیشنهادی در واقع توسط کاربر تست

u

4.4. نتایج ارزیابی و بحث

4.4.1. تجزیه و تحلیل میزان حساسیت

قبل از مقایسه روش‌ها، ما یک تحلیل حساسیت را برای مطالعه تأثیر آستانه تشابه زمینه اجرا کردیم.

δ

در CaCF_Pre و CaCF_Post. ما آزمایش هایی را با تغییر مقادیر آستانه انجام دادیم. نتایج در شکل 5 نشان داده شده است .

شکل 5 نشان می دهد که آستانه بر کیفیت توصیه CaCF_Pre و CaCF_Post تاثیر می گذارد. در مقایسه با CaCF_Post، آستانه تأثیر بیشتری بر نتایج توصیه‌های CaCF_Pre دارد. این را می‌توان با روش‌هایی که آنها اطلاعات زمینه را ترکیب می‌کنند توضیح داد: CaCF_Pre مکان‌هایی را فیلتر می‌کند که برای بازدید در شرایط فعلی مناسب نیستند. CaCF_Post مجموعه ای از مکان های نامزد را با استفاده از CF غیر متنی ایجاد می کند و نتایج را بر اساس اطلاعات زمینه تنظیم می کند.

عملکرد توصیه هر دو روش با کاهش آستانه افزایش می یابد. با این حال، کیفیت پس از یک نقطه خاص بدتر می شود، یعنی

δ

= 0.3 برای CaCF_Pre و

δ

= 0.5 برای CaCF_Post. برای آزمایش‌های زیر تنظیم کردیم

δ

= 0.3 برای CaCF_Pre و

δ

= 0.5 برای CaCF_Post.

4.4.2. مقایسه الگوریتم

در ادامه، عملکرد پیشنهادی روش‌های CaCF پیشنهادی و روش‌های محک‌گذاری را با هم مقایسه می‌کنیم. شکل 6 نتایج را نشان می دهد.

CF غیر متنی (nonCaCF) در مقابل CF آگاه از زمینه (CaCF): از نظر عملکرد توصیه، همه روش‌های CaCF پیشنهادی (به عنوان مثال، CaCF_Pre، CaCF_Post، CaCF_Mdl) به نتایج قابل‌توجهی بهتر از nonCaCF (با همه p <0.001) دست می‌یابند . با پیشرفت های 7.65%، 7.72% و 9.47% برای دقت و با پیشرفت های 7.58%، 7.75% و 9.81% برای MAP. این با آنچه ما انتظار داشتیم مطابقت دارد: از آنجایی که روش‌های CaCF پیشنهادی از زمینه‌ای که کاربر در آن قرار دارد آگاه هستند، ممکن است توصیه‌هایی ایجاد کنند که برای بازدید مناسب‌تر هستند.

CaCF_Pre_EM در مقابل CF آگاه از متن (CaCF_Pre، CaCF_Post، CaCF_Mdl): از نظر عملکرد توصیه، همه روش‌های CaCF پیشنهادی به نتایج قابل‌توجهی بهتر از CaCF_Pre_EM (یعنی پیش‌فیلترسازی متنی با تطبیق دقیق) می‌رسند (با همه p < 0.0 ) با بهبودهای 7.45%، 7.53% و 9.27% برای دقت و با بهبودهای 4.48%، 4.64% و 6.64% برای MAP. CaCF_Pre_EM حتی کمی بهتر از nonCaCF عمل می کند. دلیل عملکرد ضعیف آن این است که از تطابق دقیق برای فیلتر کردن مکان‌هایی استفاده می‌کند که زمینه بازدید محبوب آنها با بافت فعلی یکسان نیست، که واقعاً بسیاری از مکان‌های مرتبط را فیلتر می‌کند.

CaCF_Pre در مقابل CaCF_Post در مقابل CaCF_Mdl : در بین همه روش ها، CaCF_Mdl بهترین عملکرد را دارد، سپس CaCF_Post و در نهایت CaCF_Pre. تفاوت بین CaCF_Mdl و دو مورد دیگر قابل توجه است (با همه p <0.001). CaCF_Pre و CaCF_Post به طور مشابه عمل می کنند و تفاوت معنی داری از مقایسه ها به دست نمی آید (دقت: p = 0.76؛ MAP: p= 0.39). عملکرد متنوع این روش‌ها را می‌توان با روش‌هایی که آنها اطلاعات زمینه را ترکیب می‌کنند توضیح داد: CaCF_Pre مکان‌هایی را فیلتر می‌کند که برای بازدید در شرایط فعلی مناسب نیستند. CaCF_Post مجموعه ای از مکان های نامزد را با استفاده از CF غیر متنی ایجاد می کند و نتایج را بر اساس اطلاعات زمینه تنظیم می کند. CaCF_Mdl از شباهت زمینه و شباهت کاربر برای اندازه گیری ابزار توصیه هر بازدید به کاربر فعلی استفاده می کند و سپس همه بازدیدها را با در نظر گرفتن مقادیر مفید آنها برای ایجاد توصیه های مکان جمع می کند.

4.4.3. توصیه هایی با تعداد مکان های آموزشی متفاوت

تعداد مکان‌های آموزشی (یعنی مکان‌هایی که یک توریست قبل از درخواست توصیه‌ها بازدید کرده است) میزان اطلاعات (به عنوان مثال، تاریخچه سفر) موجود در مورد یک گردشگر را منعکس می‌کند. در ادامه، چگونگی تغییر عملکرد هنگام ایجاد توصیه‌ها برای گردشگران با تعداد مکان‌های آموزشی متفاوت را بررسی می‌کنیم ( شکل 7 ).

شکل 7 یک روند صعودی را برای عملکرد توصیه برای همه روش های توصیه نشان می دهد که تعداد مکان های آموزشی افزایش می یابد. این با انتظارات ما مطابقت دارد: با افزایش تعداد مکان های آموزشی، اطلاعات بیشتری در مورد یک گردشگر برای روش های توصیه در دسترس است و بنابراین، عملکرد توصیه بهبود می یابد.

4.4.4. خلاصه نتایج و بحث ها

به طور خلاصه، یافته های اصلی آزمایش ها به شرح زیر است:

همه روش های CaCF پیشنهادی به طور قابل توجهی بهتر از CF کلاسیک (یعنی CF غیر متنی، nonCaCF) عمل می کنند.
روش‌های پیشنهادی (به عنوان مثال، CaCF_Pre، CaCF_Post و CaCF_Mdl) به طور قابل‌توجهی بهتر از روش توصیه مکان آگاه از زمینه‌های پیشرفته (یعنی CaCF_Pre_EM) عمل می‌کنند.
در میان همه روش‌های پیشنهادی پیشنهادی موقعیت مکانی آگاه از زمینه، CaCF_Mdl بهترین عملکرد را دارد، سپس CaCF_Post و در نهایت CaCF_Pre.
با افزایش تعداد مکان های آموزشی، عملکرد پیشنهادی همه روش های پیشنهادی بهبود می یابد.

به طور کلی، این یافته ها با آنچه ما انتظار داشتیم مطابقت دارد.

نتایج آزمایش نشان می‌دهد که با جمع‌آوری تاریخچه سفر سایر گردشگران (به عنوان مثال، همانطور که از عکس‌های دارای برچسب جغرافیایی استخراج می‌شود)، می‌توانیم توصیه‌های مکان مطابق با اولویت‌های سفر و زمینه بازدید را به کاربر فعلی ارائه کنیم. نتایج، یافته های Wexelblat (1999) [ 1 ] و ژنگ و همکاران را تایید می کند. (2011) [ 24 ] و پیشنهاد می کند که تجربیات کاربران گذشته (به ویژه آن دسته از کاربرانی که مشابه کاربر فعلی هستند) می تواند به کاربر فعلی کمک کند تا مشکلات خود را به طور موثر حل کند، به عنوان مثال، انتخاب مکان بعدی برای بازدید.
ما انتظار داریم که از آنجایی که روش‌های پیشنهادی (یعنی CaCF_Pre، CaCF_Post و CaCF_Mdl) از زمینه‌ای که کاربر در آن قرار دارد آگاه هستند، ممکن است توصیه‌هایی برای مکان ایجاد کنند که برای بازدید مناسب‌تر هستند. این آزمایش‌ها این انتظار را تأیید می‌کنند و نشان می‌دهند که گنجاندن اطلاعات زمینه در فرآیند توصیه می‌تواند به بهبود کیفیت توصیه کمک کند.
همانطور که از شکل 6 و شکل 7 مشاهده می شود ، روش های پیشنهادی به طور قابل توجهی بهتر از روش های پیشرفته زمینه آگاه عمل می کنند. این نشان می دهد که روشی که اطلاعات زمینه در CF ادغام می شود تا حد زیادی بر عملکرد توصیه تأثیر می گذارد. به طور خاص، آزمایش‌ها نشان می‌دهند که در مقایسه با «تطابق دقیق»، استفاده از معیار تشابه زمینه پیشنهادی به طور قابل‌توجهی عملکرد توصیه را بهبود می‌بخشد.
نتایج بالا نشان می‌دهد که در بین تمام روش‌های CaCF پیشنهادی، روش مدل‌سازی زمینه‌ای (CaCF_Mdl) ممکن است برای ایجاد توصیه‌های مکان مطابق با ترجیحات سفر کاربر و زمینه بازدید مناسب‌تر باشد. از آنجایی که هر دو روش پیش فیلتر متنی (CaCF_Pre) و پس فیلترینگ متنی (CaCF_Post) یک پارامتر برای کالیبره کردن دارند (یعنی آستانه تشابه زمینه $δ$ ، بنابراین توصیه می شود از CaCF_Mdl برای توصیه های مکان آگاه از متن استفاده کنید.

همچنین باید به چند محدودیت اصلی این کار اشاره کرد. در مرحله اول، این تحقیق از DBSCAN برای شناسایی مکان های توریستی استفاده می کند و از CF برای ارائه توصیه ها استفاده می کند. برای ارزیابی، از مجموعه داده‌های چندین شهر بزرگ در اروپا استفاده می‌کنیم که هر کدام حاوی عکس‌های دارای برچسب جغرافیایی بسیاری از کاربران مختلف است. از آنجایی که هم DBSCAN و هم CF با مجموعه داده های بزرگ (مانند مجموعه داده های مورد استفاده در این مقاله) به خوبی کار می کنند، روش های پیشنهادی ممکن است هنگام استفاده از مجموعه داده های کوچک با تعداد کم کاربر، به عنوان مثال، مجموعه داده های عکس دارای برچسب جغرافیایی از شهرهای کوچک و مناطق روستایی، عملکرد خوبی نداشته باشند. برای ارائه توصیه هایی بر اساس این مجموعه داده های کوچک، روش های CaCF پیشنهادی را می توان با رویکردهای مبتنی بر محتوا یا مبتنی بر دانش ترکیب کرد. ثانیا، این کار مقادیر هر پارامتر زمینه را به عنوان مجموعه ای از مقوله ها نشان می دهد (به عنوان مثال، پارامتر زمینه “زمان روز” مقادیری مانند “صبح”، “بعد از ظهر” و “شب” دارد). در حالی که مقادیر طبقه بندی شده ممکن است پیچیدگی مدل را ساده کند، گاهی اوقات ممکن است انتقال داده های زمینه خام به دسته های مربوطه آسان نباشد. منطق فازی یا مقیاس های تدریجی (به عنوان مثال، [46]) ممکن است برای رفع این مشکل به کار گرفته شود. ثالثاً، این مقاله نشان می دهد که در نظر گرفتن اطلاعات زمینه (یعنی مجموعه “فصل”، “زمان روز” و “آب و هوا” در این مقاله) می تواند به طور قابل توجهی عملکرد توصیه را بهبود بخشد. این تحقیق را می توان با بررسی اینکه چگونه هر پارامتر زمینه به بهبود عملکرد کمک می کند، افزایش داد. ما این را به عنوان یک کار آینده در نظر می‌گیریم و می‌خواهیم آن را بیشتر گسترش دهیم تا یک روش محاسباتی برای شناسایی پارامترهای زمینه مرتبط حتی قبل از اعمال روش‌های پیشنهادی پیشنهادی آگاه از زمینه ایجاد کنیم. در نهایت، در تحقیق حاضر، مجموعه داده‌ها را به داده‌های آموزشی و آزمایشی برای ارزیابی روش‌های پیشنهادی تقسیم می‌کنیم. در حالی که این رویکرد ارزیابی به مقایسه عملکرد توصیه ها کمک می کند، می توان آن را با استفاده از آزمایشات با شرکت کنندگان انسانی (مثلاً گردشگران) بهبود بخشید. برای مثال، می‌توانیم از هر شرکت‌کننده بخواهیم در مورد نتایج توصیه‌های تولید شده توسط روش‌های پیشنهادی اظهار نظر کند. این نوع آزمایشات انسانی همچنین به بررسی بیشتر اینکه آیا بهبود عملکرد قابل توجه هنگام در نظر گرفتن اطلاعات زمینه (همانطور که در این مقاله نشان داده شده است) واقعاً نتایج توصیه های بسیار بهتری را برای گردشگران به ارمغان می آورد کمک خواهد کرد. ما انتظار داریم که نتایج ارزیابی مشابهی را بتوان در این آزمایش ها به دست آورد.

5. نتیجه گیری و کار آینده

این مقاله بررسی می‌کند که چگونه عکس‌های دارای برچسب جغرافیایی در رسانه‌های اجتماعی را می‌توان جمع‌آوری کرد تا توصیه‌های مکان مطابق با اولویت‌های سفر گردشگران و زمینه بازدید (مانند آب و هوا، فصل و زمان روز) را استخراج کند. به طور خاص، ما روش‌های خوشه‌بندی را برای شناسایی مکان‌های گردشگری به کار بردیم و تاریخچه سفر را از عکس‌های فلیکر دارای برچسب جغرافیایی استخراج کردیم. سپس یک معیار شباهت جدید را برای تعیین کمیت شباهت بین هر دو زمینه پیشنهاد کردیم و سه روش فیلتر مشارکتی آگاه از زمینه (CaCF) را توسعه دادیم، به عنوان مثال، پیش فیلتر زمینه، پس از فیلتر کردن و مدل‌سازی. این روش‌ها می‌توانند «توصیه‌های اجتماعی» را برای انتخاب مکان بازدید به گردشگران ارائه دهند، به عنوان مثال، توصیه‌های مکان مانند «در زمینه‌های مشابه، سایر گردشگران مشابه شما اغلب بازدید می‌کردند…»

ما روش‌های پیشنهادی را در مقابل سایر روش‌های پیشرفته پیشنهاد مکان با استفاده از یک مجموعه عکس فلیکر در دسترس عموم، که حاوی عکس‌های دارای برچسب جغرافیایی در شش شهر اروپایی بود، ارزیابی کردیم. نتایج ارزیابی نشان می‌دهد که: (1) روش‌های پیشنهادی می‌توانند به یک گردشگر توصیه‌های مکان منطبق با ترجیحات او و زمینه بازدید فعلی ارائه کنند. (2) مهمتر از همه، در مقایسه با سایر روش‌های پیشرفته، روش‌های پیشنهادی، که از معیار تشابه زمینه استفاده می‌کنند، می‌توانند به طور قابل توجهی توصیه‌های مکان یابی بهتری را در اختیار گردشگران قرار دهند. به عبارت دیگر، در مقایسه با تطبیق دقیق، استفاده از معیار تشابه زمینه پیشنهادی به طور قابل توجهی عملکرد توصیه را بهبود می بخشد.

در نتیجه، با جمع‌آوری تاریخچه سفر سایر گردشگران (به عنوان مثال، همانطور که از عکس‌های دارای برچسب جغرافیایی استخراج می‌شود)، می‌توان توصیه‌های مکانی شخصی و آگاه از زمینه را برای کاربر فعلی ارائه کرد. در حالی که داده‌های فلیکر در این مطالعه استفاده شده‌اند، روش‌های CaCF پیشنهادی را می‌توان برای انواع دیگر تاریخچه‌های موقعیت مکانی، مانند مسیرهای GPS و بررسی چهار ضلعی، برای ارائه توصیه‌های آگاه از زمینه گسترش داد. این روش‌ها همچنین می‌توانند برای در نظر گرفتن اطلاعات زمینه بیشتر، مانند اهداف بازدید و همراه (با چه کسی) استفاده شوند.

به عنوان گام بعدی، به مسائل کیفی (مثلاً نمایندگی، ناقص بودن، خطاهای برچسب‌گذاری و سوگیری) داده‌های رسانه‌های اجتماعی خواهیم پرداخت و روش‌هایی را برای پاکسازی آن‌ها توسعه خواهیم داد. در عین حال، ما می خواهیم الگوریتم های پیشنهادی را از توصیه مکان به توصیه های توالی و برنامه سفر گسترش دهیم (به عنوان مثال، توصیه به دنباله ای از مکان ها برای بازدید). توصیه دنباله باید نه تنها مسافت سفر، بلکه تنوع اقلام، اثرات متقابل همزمان موارد و سایر محدودیت ها را نیز در نظر بگیرد. ما همچنین علاقه مند به توسعه روش های CaCF جامع تر، با استفاده از تعاریف فازی و مقیاس های تدریجی در مدل زمینه هستیم. علاوه بر این، تحقیق فعلی از CF برای استخراج توصیه‌های مکان از عکس‌های دارای برچسب جغرافیایی استفاده کرد. در حالی که CF یک تکنیک توصیه موثر است که به دانش کمی از دامنه نیاز دارد، از مشکل “شروع سرد” (“کاربر جدید” و “مورد جدید”) رنج می برد. ما با ادغام سایر تکنیک‌های توصیه، به عنوان مثال، توصیه‌های مبتنی بر محتوا یا مبتنی بر دانش، به این مسائل خواهیم پرداخت. ما انتظار داریم که تکنیک های ترکیبی عملکرد توصیه را بیشتر بهبود بخشد. ما همچنین می‌خواهیم یک آزمایش انسانی برای بررسی بیشتر مزایای در نظر گرفتن اطلاعات زمینه در توصیه مکان برای گردشگران طراحی کنیم. علاوه بر این، ما همچنین علاقه مند به گسترش روش های خود هستیم تا نه تنها توصیه های مکان، بلکه توضیحاتی در مورد اینکه چرا این مکان ها توصیه می شوند نیز ایجاد کنیم. ما با ادغام سایر تکنیک‌های توصیه، به عنوان مثال، توصیه‌های مبتنی بر محتوا یا مبتنی بر دانش، به این مسائل خواهیم پرداخت. ما انتظار داریم که تکنیک های ترکیبی عملکرد توصیه را بیشتر بهبود بخشد. ما همچنین می‌خواهیم یک آزمایش انسانی برای بررسی بیشتر مزایای در نظر گرفتن اطلاعات زمینه در توصیه مکان برای گردشگران طراحی کنیم. علاوه بر این، ما همچنین علاقه مند به گسترش روش های خود هستیم تا نه تنها توصیه های مکان، بلکه توضیحاتی در مورد اینکه چرا این مکان ها توصیه می شوند نیز ایجاد کنیم. ما با ادغام سایر تکنیک‌های توصیه، به عنوان مثال، توصیه‌های مبتنی بر محتوا یا مبتنی بر دانش، به این مسائل خواهیم پرداخت. ما انتظار داریم که تکنیک های ترکیبی عملکرد توصیه را بیشتر بهبود بخشد. ما همچنین می‌خواهیم یک آزمایش انسانی برای بررسی بیشتر مزایای در نظر گرفتن اطلاعات زمینه در توصیه مکان برای گردشگران طراحی کنیم. علاوه بر این، ما همچنین علاقه مند به گسترش روش های خود هستیم تا نه تنها توصیه های مکان، بلکه توضیحاتی در مورد اینکه چرا این مکان ها توصیه می شوند نیز ایجاد کنیم. ما همچنین می‌خواهیم یک آزمایش انسانی برای بررسی بیشتر مزایای در نظر گرفتن اطلاعات زمینه در توصیه مکان برای گردشگران طراحی کنیم. علاوه بر این، ما همچنین علاقه مند به گسترش روش های خود هستیم تا نه تنها توصیه های مکان، بلکه توضیحاتی در مورد اینکه چرا این مکان ها توصیه می شوند نیز ایجاد کنیم. ما همچنین می‌خواهیم یک آزمایش انسانی برای بررسی بیشتر مزایای در نظر گرفتن اطلاعات زمینه در توصیه مکان برای گردشگران طراحی کنیم. علاوه بر این، ما همچنین علاقه مند به گسترش روش های خود هستیم تا نه تنها توصیه های مکان، بلکه توضیحاتی در مورد اینکه چرا این مکان ها توصیه می شوند نیز ایجاد کنیم.

منابع

Wexelblat، AD Footprints: تاریخچه تعامل برای اشیاء دیجیتال. دکتری پایان نامه، موسسه فناوری ماساچوست، کمبریج، MA، ایالات متحده آمریکا، 1999. [ Google Scholar ]
Huang, H. یادگیری از تاریخچه مکان برای توصیه های مکان در LBS. دکتری پایان نامه، دانشگاه صنعتی وین، وین، اتریش، 2013. [ Google Scholar ]
کیسیلویچ، اس. منزمن، اف. Keim, D. P-DBSCAN: الگوریتم خوشه‌بندی مبتنی بر چگالی برای اکتشاف و تجزیه و تحلیل مناطق جذاب با استفاده از مجموعه عکس‌های دارای برچسب جغرافیایی در مجموعه مقالات اولین کنفرانس و نمایشگاه بین المللی محاسبات برای تحقیقات و کاربردهای جغرافیایی، نیویورک، نیویورک، ایالات متحده آمریکا، 21 تا 23 ژوئن 2010.
یانگ، ی. گونگ، ز. Hou, L. شناسایی نقاط مورد علاقه با خوشه بندی خود تنظیم. در مجموعه مقالات ACM SIGIR 2011، پکن، چین، 17-20 آوریل 2011.
جاف، ا. نعمان، م. تاسا، تی. دیویس، ام. ایجاد خلاصه و تجسم برای مجموعه‌های بزرگ عکس‌های ارجاع‌شده جغرافیایی. در مجموعه مقالات MIR’06، نیویورک، نیویورک، ایالات متحده آمریکا، 26-27 اکتبر 2006.
راتنبری، تی. Naaman, M. روش‌های استخراج معناشناسی مکان از تگ‌های فلیکر. ACM Trans. وب 2009 ، 3 ، 1-30. [ Google Scholar ] [ CrossRef ]
یانکوفسکی، پ. آندرینکو، ن. آندرینکو، جی. کیسیلویچ، اس. کشف اولویت‌های شاخص و الگوهای حرکتی از پست‌های عکس. ترانس. GIS 2010 ، 14 ، 833-852. [ Google Scholar ] [ CrossRef ]
ژنگ، YT; ژا، زجی؛ الگوهای سفر معدن Chua، TS از عکس های دارای برچسب جغرافیایی. ACM Trans. هوشمند سیستم تکنولوژی 2012 ، 3 ، 1-18. [ Google Scholar ] [ CrossRef ]
متعجب.؛ ون، ی. چوا، تی. هوانگ، جی. زو، دبلیو. Li, X. تکثیر محتوای مشترک و مسیریابی درخواست برای توزیع ویدیوی اجتماعی روی CDN ابری: یک روش خوشه‌بندی جامعه. IEEE Trans. سیستم مدار. فناوری ویدئو 2016 ، 26 ، 1320-1333. [ Google Scholar ] [ CrossRef ]
کلمنتز، ام. سردیوکوف، پ. De Vries، AP; Reinders، MJT استفاده از برچسب‌های جغرافیایی فلیکر برای پیش‌بینی رفتار سفر کاربر. در مجموعه مقالات ACM SIGIR 2010، ژنو، سوئیس، 19 تا 23 ژوئیه 2010.
چنگ، ای جی؛ چن، YY; هوانگ، YT; Hsu، WH; Liao، HYM با استخراج ویژگی‌های افراد از عکس‌های ارائه‌شده توسط جامعه، توصیه سفر شخصی‌سازی شده است. در مجموعه مقالات ACM Multimedia 2011، Firenze، ایتالیا، 28 نوامبر تا 1 دسامبر 2011.
شی، ی. سردیوکوف، پ. هانجالیچ، ع. لارسون، ام. توصیه شاخص غیر ضروری با استفاده از عکس‌های دارای برچسب جغرافیایی. ACM Trans. هوشمند سیستم تکنولوژی 2013 ، 4 ، 1-27. [ Google Scholar ] [ CrossRef ]
یین، اچ. کوی، بی. سان، ی. هو، ز. Chen, L. LCARS: یک سیستم توصیه کننده اقلام فضایی. ACM Trans. Inf. سیستم 2014 ، 32 ، 1-37. [ Google Scholar ] [ CrossRef ]
سان، ی. فن، اچ. باکی‌الله، م. Zipf، A. توصیه سفر مبتنی بر جاده با استفاده از تصاویر دارای برچسب جغرافیایی. محاسبه کنید. محیط زیست سیستم شهری 2015 ، 53 ، 110-122. [ Google Scholar ] [ CrossRef ]
ریچی، اف. روکاچ، ال. Shapira, B. Introduction to Recommender Systems Manual. در Recommender Systems Handbook ; Ricci, F., Rokach, L., Shapira, B., Kantor, PB, Eds. Springer: برلین/هایدلبرگ، آلمان، 2011; صص 1-35. [ Google Scholar ]
آدوماویسیوس، جی. سانکارانارایانان، ر. سن، اس. Tuzhilin، A. ترکیب اطلاعات زمینه ای در سیستم های توصیه گر با استفاده از یک رویکرد چند بعدی. ACM Trans. Inf. سیستم 2005 ، 23 ، 103-145. [ Google Scholar ] [ CrossRef ]
کاراتزوگلو، ع. آماترین، ایکس. بالتروناس، ال. توصیه Oliver، N. Multiverse: فاکتورسازی تانسور N بعدی برای فیلتر مشارکتی آگاه از زمینه. در مجموعه مقالات ACM RecSys 2010، بارسلون، اسپانیا، 26 تا 30 سپتامبر 2010.
Panniello، U. Gorgoglione، M. ترکیب زمینه در سیستم های توصیه گر: مقایسه تجربی رویکردهای مبتنی بر زمینه. الکترون. بازرگانی Res. 2012 ، 12 ، 1-30. [ Google Scholar ] [ CrossRef ]
آدوماویسیوس، جی. Tuzhilin، A. سیستم های توصیه گر زمینه آگاه. در Recommender Systems Handbook ; Ricci, F., Rokach, L., Shapira, B., Kantor, PB, Eds. Springer: برلین/هایدلبرگ، آلمان، 2011; ص 217-253. [ Google Scholar ]
هوروزوف، تی. نراسیمهان، ن. Vasudevan، V. استفاده از موقعیت مکانی برای توصیه های POI شخصی شده در محیط های تلفن همراه. در مجموعه مقالات SAINT ’06، فینیکس، AZ، ایالات متحده آمریکا، 23-27 ژانویه 2006.
تاکوچی، ی. Sugimoto، M. CityVoyager: یک سیستم توصیه در فضای باز بر اساس تاریخچه مکان کاربر. در هوش و محاسبات همه جا حاضر ؛ Ma, J., Jin, H., Yang, LT, Tsai, JJP, Eds. Springer: برلین/هایدلبرگ، آلمان، 2006; صص 625-636. [ Google Scholar ]
لی، LH; لی، اف ام؛ چن، YC; Cheng, CY یک رویکرد فیلتر مشترک چند مرحله ای برای توصیه تلفن همراه. در مجموعه مقالات ICUIMC ’09، سوون، کره جنوبی، 15-16 ژانویه 2009.
Bohnert, F. مدلسازی کاربر غیر مزاحم و پیش بینی رفتار در موزه ها. دکتری پایان نامه، دانشگاه موناش، ملبورن، اتریش، 2010. [ Google Scholar ]
ژنگ، ی. ژانگ، ال. ما، ز. Xie، X. Ma, WY توصیه به دوستان و مکان ها بر اساس تاریخچه موقعیت مکانی فردی. ACM Trans. وب 2011 ، 5 ، 1-44. [ Google Scholar ] [ CrossRef ]
کندی، LS; Naaman, M. ایجاد نتایج جستجوی تصویری متنوع و معرف برای مکان‌های دیدنی. در مجموعه مقالات WWW ’08، پکن، چین، 21-25 آوریل 2008.
کراندال، دی جی; بکستروم، ال. هاتنلوچر، دی. کلینبرگ، جی. نقشه برداری از عکس های جهان. در مجموعه مقالات WWW ’09، مادرید، اسپانیا، 20-24 آوریل 2009.
چن، WC; باتستینی، آ. گلفاند، ن. Setlur, V. خلاصه‌های بصری مکان‌های دیدنی محبوب از مجموعه‌های عکس جامعه. در مجموعه مقالات چند رسانه ای ACM 2009، پکن، چین، 19 تا 23 اکتبر 2009.
آراسه، ی. Xie، X. هارا، ت. Nishio, S. سفرهای افراد معدن از عکس‌های دارای برچسب جغرافیایی در مقیاس بزرگ. در مجموعه مقالات ACM Multimedia 2010، Firenze، ایتالیا، 25-29 اکتبر 2010.
چنگ، ز. کاورلی، جی. تره فرنگی.؛ Sui, DZ در حال کاوش میلیون‌ها ردپا در خدمات اشتراک‌گذاری مکان. در مجموعه مقالات ICWSM 2011، بارسلون، اسپانیا، 17-21 ژوئیه 2011.
نولاس، ا. اسکلاتو، اس. ماسکولو، سی. پونتیل، ام. بهره برداری از حاشیه نویسی های معنایی برای خوشه بندی مناطق جغرافیایی و کاربران در شبکه های اجتماعی مبتنی بر مکان. در مجموعه مقالات ICWSM 2011، بارسلون، اسپانیا، 17-21 ژوئیه 2011.
فریاس مارتینز، وی. سوتو، وی. هوهوالد، اچ. Frias-Martinez، E. مشخص کردن مناظر شهری با استفاده از توییت‌های جغرافیایی. در مجموعه مقالات SocialCom/PASSAT ’12، آمستردام، هلند، 3 تا 5 سپتامبر 2012.
بائو، جی. ژنگ، ی. ویلکی، دی. Mokbel، MF A Survey در مورد توصیه‌ها در شبکه‌های اجتماعی مبتنی بر مکان. ACM Trans. Inf. سیستم 2015 ، 19 ، 525-565. [ Google Scholar ] [ CrossRef ]
کفالاس، پ. سیمئونیدیس، پ. Manolopoulos، Y. طبقه بندی مبتنی بر نمودار از الگوریتم ها و سیستم های توصیه در LBSNs. IEEE Trans. بدانید. مهندسی داده 2016 ، 28 ، 604-622. [ Google Scholar ] [ CrossRef ]
دی چودوری، ام. فلدمن، ام. عامر یحیی، س. گلبندی، ن. لمپل، آر. Yu, C. ساخت خودکار برنامه های سفر با استفاده از خرده نان اجتماعی. در مجموعه مقالات HT2010، آیندهوون، هلند، 6 تا 9 ژوئن 2010.
گائو، اچ. تانگ، جی. لیو، اچ. پرداختن به مشکل شروع سرد در توصیه مکان با استفاده از همبستگی های جغرافیایی-اجتماعی. حداقل داده بدانید. دیس 2015 ، 29 ، 299-323. [ Google Scholar ] [ CrossRef ]
جیانگ، اس. کیان، ایکس. می، تی. Fu, Y. توصیه توالی سفر شخصی شده در رسانه های اجتماعی بزرگ چند منبعی. IEEE Trans. کلان داده 2016 ، 2 ، 43-56. [ Google Scholar ] [ CrossRef ]
ژانگ، سی. لیانگ، اچ. توصیه Wang, K. Trip با محدودیت‌های دنیای واقعی مطابقت دارد: در دسترس بودن POI، تنوع، و عدم قطعیت زمان سفر. ACM Trans. Inf. سیستم 2016 . [ Google Scholar ] [ CrossRef ]
مجید، ع. چن، ال. چن، جی. میرزا، ح.ت. حسین، من. Woodward, J. یک سیستم توصیه مسافرتی شخصی‌شده آگاه از زمینه مبتنی بر داده‌کاوی رسانه‌های اجتماعی دارای برچسب جغرافیایی. بین المللی جی. جئوگر. Inf. علمی 2013 ، 27 ، 662-684. [ Google Scholar ] [ CrossRef ]
API | آب و هوا زیرزمینی در دسترس آنلاین: http://www.wunderground.com/weather/api/ (در 25 اکتبر 2016 قابل دسترسی است).
کادار، بی. Gede, M. گردشگران کجا می روند: تجسم و تجزیه و تحلیل توزیع فضایی عکاسی دارای برچسب جغرافیایی. کارتوگر. بین المللی جی. جئوگر. Inf. جئوویس. 2013 ، 48 ، 78-88. [ Google Scholar ] [ CrossRef ]
لی، دی. پارک، SE; کهنگ، م. لی، اس. لی، اس. بهره برداری از اطلاعات متنی از گزارش رویدادها برای توصیه شخصی. در علوم کامپیوتر و اطلاعات 2010 ; لی، آر.، اد. Springer: برلین/هایدلبرگ، آلمان، 2010; صص 121-139. [ Google Scholar ]
سالتون، جی. McGill، MJ مقدمه ای بر بازیابی اطلاعات مدرن . McGraw-Hill: نیویورک، نیویورک، ایالات متحده آمریکا، 1986. [ Google Scholar ]
Singhal, A. بازیابی اطلاعات مدرن: مروری کوتاه. گاو نر محاسبات IEEE. Soc. فنی مرتکب شدن. مهندسی داده 2001 ، 24 ، 35-42. [ Google Scholar ]
منینگ، سی. رغوان، پ. Schütze, H. Introduction to Information Retrieval ; انتشارات دانشگاه کمبریج: کمبریج، انگلستان، 2008. [ Google Scholar ]
هرلوکر، جی ال. کنستان، ج.ا. تروین، ال جی؛ Riedl, JT ارزیابی سیستم های توصیه کننده فیلتر مشترک. ACM Trans. Inf. سیستم 2004 ، 22 ، 5-53. [ Google Scholar ] [ CrossRef ]
لی، ام. ساگل، جی. امبورو، ال. Fan, H. یک مدل متنی و شخصی برای پیش بینی علاقه کاربر با استفاده از شبکه های اجتماعی مبتنی بر مکان. محاسبه کنید. محیط زیست سیستم شهری 2016 ، 58 ، 97-106. [ Google Scholar ] [ CrossRef ]

شکل 1. مروری بر روش. CF، فیلتر مشترک؛ بخش، بخش

شکل 3. تعداد خوشه ها (مکان های گردشگری) شناسایی شده با مقادیر مختلف پارامترها. MinPts، حداقل امتیاز؛ Eps، شعاع.

شکل 5. تأثیر آستانه تشابه زمینه بر کیفیت توصیه.

شکل 6. مقایسه روش‌های CaCF پیشنهادی با روش‌های معیار (نوارهای خطای عمودی در نمودار سمت چپ نشان‌دهنده فاصله اطمینان 95٪ است). MAP، میانگین دقت متوسط؛ EM، تطبیق دقیق؛ Mdl، مدل سازی.

شکل 7. مقایسه عملکرد روش‌های پیشنهادی با تعداد مکان‌های آموزشی متفاوت (نوارهای خطای عمودی در نمودار سمت چپ نشان‌دهنده 95% فواصل اطمینان است).

جدول 1. جزئیات مجموعه داده.

جدول 2. خلاصه ای از گردشگران و پراکندگی آنها در شهرهای مختلف. Num.loc تعداد مکان ها را نشان می دهد

© 2016 توسط نویسنده; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

خلاصه

1. معرفی

2. کارهای مرتبط

2.1. تکنیک های توصیه و آگاهی از زمینه

2.2. تجزیه و تحلیل داده های رسانه های اجتماعی دارای برچسب جغرافیایی

2.3. توصیه مکان با استفاده از داده های رسانه اجتماعی دارای برچسب جغرافیایی

3. روش شناسی

3.1. تعریف مسئله و بررسی اجمالی روش

3.2. شناسایی موقعیت مکانی توریستی و استخراج تاریخچه سفر

3.2.1. تشخیص موقعیت مکانی توریستی

3.2.2. استخراج تاریخچه سفر

3.3. شباهت کاربر و کاوش شباهت زمینه

3.3.1. شباهت کاربر

3.3.2. شباهت زمینه

3.4. توصیه موقعیت مکانی آگاه از زمینه

3.4.1. پیش فیلتر کردن متنی

3.4.2. پس-فیلترسازی متنی

3.4.3. مدلسازی متنی

4. ارزیابی و بحث

4.1. مجموعه داده

4.2. شناسایی موقعیت مکانی توریستی و استخراج تاریخچه سفر

4.3. راه اندازی آزمایشی

4.4. نتایج ارزیابی و بحث

4.4.1. تجزیه و تحلیل میزان حساسیت

4.4.2. مقایسه الگوریتم

4.4.3. توصیه هایی با تعداد مکان های آموزشی متفاوت

4.4.4. خلاصه نتایج و بحث ها

5. نتیجه گیری و کار آینده

منابع

قبلیتحلیل فضایی و زمانی رشد شهری با استفاده از GIS و سنجش از دور: مطالعه موردی منطقه شهری کلمبو، سریلانکا

بعدینتایج اولیه تعیین مدار دقیق برای ماهواره های نسل جدید BeiDou (BeiDou-3) بر اساس شبکه iGMAS

بدون نظر

دیدگاهتان را بنویسید لغو پاسخ