خلاصه
با گسترش سریع دستگاههای تلفن همراه، سوابق جزئیات تماس (CDR) از تلفنهای همراه فرصتهای بیشتری برای ترکیب جنبههای پویای تحرک انسان در پرداختن به مسائل اجتماعی فراهم میکند. با این حال، به طور فزاینده ای مشاهده شده است که داده های CDR همیشه نماینده جمعیت مورد مطالعه نیستند، زیرا فقط شامل کاربران دستگاه می شود. برای درک اختلاف بین جمعیت جذب شده توسط CDRها و جمعیت عمومی، با تجزیه و تحلیل روالها بر اساس زمان صرف شده در مکانهای کلیدی، جمعیتهای اصلی CDRها را مشخص میکنیم و این دادهها را با دادههای جمعیت عمومی مقایسه میکنیم. ما از یک مدل موضوعی برای تخمین روال معمول کاربران تلفن همراه با استفاده از CDR به عنوان موضوع استفاده میکنیم. روالها از دادههای نظرسنجی میدانی استخراج شده و بین جمعیت عمومی و کاربران تلفن همراه مقایسه میشوند. ما دریافتیم که دو گروه عمده جمعیتی از کاربران تلفن همراه در داکا وجود دارد: مردانی که در مکانی خاص به غیر از خانه درگیر فعالیتهای درآمدزا هستند و زنانی که کارهای خانگی را انجام میدهند و بیشتر وقت خود را در خانه میگذرانند. ما تعیین میکنیم که CDRها تمایل دارند دانشآموزانی را که جزء مهمی از جمعیت داکا هستند حذف کنند.
کلید واژه ها:
کلان داده ؛ تلفن همراه ؛ سوابق جزئیات تماس (CDR) ؛ ساختار جمعیتی
1. معرفی
1.1. زمینه
حجم زیادی از دادههای مکانی-زمانی جمعآوریشده از دستگاههای فراگیر، درک رفتار حرکتی انسان را ارتقا داده است. این درک، سیاست گذاران و دولت ها را قادر می سازد تا جنبه های پویای تحرک انسانی را در سیاست های عمومی و برنامه ریزی شهری بگنجانند. بر اساس این فرض که این دستگاه ها گسترده هستند، داده های مکانی-زمانی را می توان نماینده جمعیت عمومی در نظر گرفت. با این حال، این ممکن است به دلیل ویژگی های داده رکوردهای جزئیات تماس (CDR) درست نباشد. به ویژه، سوگیری های مالکیت دستگاه باید در کشورهای در حال توسعه در نظر گرفته شود زیرا مالکیت در گروه های مختلف جمعیتی متفاوت است [ 1 ]. سوگیری ها در مالکیت کاربر تلفن همراه از نظر جنسیت و گروه سنی مشاهده می شود [ 2]. استفاده از دادههای مکانی – زمانی برای مسائل اجتماعی برای نیاز به دانش انواع جمعیتهایی که توسط دادهها نشان داده میشوند، پیشنهاد میشود [ 1 ، 3 ]. بدون دانستن اینکه داده ها کدام بخش از جامعه را نشان می دهند، تفسیر نتایج تجزیه و تحلیل داده ها ممکن است گمراه کننده باشد. علاوه بر این، توزیع مکان مشاهده شده در CDR ها از نظر مکانی و زمانی مغرضانه است. از آنجایی که CDR ها تنها زمانی که از تلفن همراه استفاده می شود به روز می شوند، سوابق به شدت تحت تأثیر رفتار تماس کاربران قرار می گیرند [ 4 ، 5 ]. این ماهیت CDR ها منجر به داده های به طور کلی پراکنده می شود که نمای جزئی از مسیرهای واقعی را ارائه می دهد [ 6 ].
در این مطالعه، ما اختلاف بین اجزای اصلی جمعیت CDRها و جمعیت عمومی را با مقایسه روالهای معمول بررسی کردیم. ابتدا، روال معمولی اجزای اصلی جمعیت را برای کاربران تلفن همراه با مقایسه روالهای استخراجشده از CDR و دادههای نظرسنجی دفترچه خاطرات کاربران تلفن همراه نمایه میکنیم. CDR ها ذاتاً پراکنده هستند. از این رو، ما CDR ها را بر اساس روال های برآورد شده با استفاده از مدل موضوع درون یابی می کنیم. این به ما این امکان را داد که CDR ها را که در اصل فقط شامل اطلاعات مربوط به بازه های زمانی با سوابق تماس هستند، به روال کاربران تلفن همراه به صورت مداوم تبدیل کنیم. سپس، نتایج بهدستآمده با روتین اجزای اصلی جمعیت عمومی در داکا مقایسه شد. بدین ترتیب،
مشارکت های مطالعه ما به شرح زیر است:
-
اجزای اصلی جمعیت کاربران تلفن همراه با مقایسه روتین های استخراج شده از CDR ها و موارد به دست آمده از داده های بررسی میدانی مشخص می شوند. CDR های پراکنده بر اساس روال های پیش بینی شده درون یابی شدند و به عنوان فعالیت های متوالی تفسیر شدند. سوگیری مالکیت در میان کاربران تلفن همراه روشن شده است.
-
یک رویکرد جدید برای شناسایی سوگیری دامنه خاص دستگاه برای دادههای مکانی-زمانی در مقیاس بزرگ پیشنهاد شده است. پتانسیل گسترش رویکرد ما به مناطق دیگر با استفاده از داده های دیگر مورد بحث قرار گرفته است.
1.2. کار مرتبط
تعداد فزاینده ای از مطالعات الگوهای رفتاری افراد را از طریق تجزیه و تحلیل داده های مکانی-زمانی در مقیاس بزرگ بررسی می کنند. از آنجایی که تعداد کاربران تلفن همراه بسیار زیاد است، CDR ها پایگاه داده های مکانی-زمانی در مقیاس بزرگ را تشکیل می دهند. با اطلاعات متوالی زمان و مکان افراد، داده ها ما را قادر می سازند تا پویایی تحرک انسان را درک کنیم. دادههای تلفن همراه میتوانند جنبههای کمی تحرک انسان، مانند حجم و الگوهای آماری تحرک را به تصویر بکشند [ 7 ، 8 ، 9 ]. در سالهای اخیر، افزایش دسترسی به دادههای مکانی-زمانی، تحقیقات در مورد الگوهای تحرک و کاربرد آنها در بخشهایی مانند حملونقل را ارتقا داده است [ 5 ، 10 ، 11] .]، بهداشت عمومی [ 12 ، 13 ] و برنامه ریزی شهری [ 14 ]. ویژگی های تحرک انسان با ترکیب مدولاسیون دوره ای تحرک انسان به شیوه ای بهتر نشان داده می شود. منابع [ 7 و 9 ] با کمی کردن تعامل بین منظم بودن و تصادفی بودن در پویایی تحرک انسان، به توصیف تحرک انسان کمک کردند. با استخراج مکان های معنادار از نظر معنایی، مانند خانه و محل کار، در CDR های ناشناس، مرجع [ 15] مشخص کرد که چند مکان محدود که مردم بیشتر وقت خود را در آنجا می گذرانند وسیله ای برای درک تحرک انسان و الگوهای اجتماعی هستند. علاوه بر این، بین الگوی فعالیت روزانه و نوع مناطق، که به عنوان محل کار در نظر گرفته می شوند، همبستگی یافت می شود [ 16 ]. بخشی از تحرک انسان با در نظر گرفتن الگوهای فعالیت روزانه سفر به خوبی توضیح داده می شود زیرا تحرک انسان به دلیل تقاضا برای شرکت در فعالیت ها در نظر گرفته می شود. فعالیت در ترکیب با جمعیت شناسی اجتماعی، الگوهای تحرک انسانی را بیشتر روشن می کند [ 17 ]. مشخص شد که ویژگیهای اجتماعی-دموگرافیک به طور قابل توجهی بر تخصیص زمان برای فعالیتهای داخل خانه و فعالیتهای خارج از خانه تأثیر میگذارد. مرجع [ 18] پیشنهاد کرد که رفتار فعالیت-سفر انسان را میتوان با رفتار فضایی فردی توصیف کرد، که میتوان آن را با تغییر ماهانه و فصلی در فعالیت توصیف کرد. در این زمینه، استخراج الگوهای رفتاری معمولی با استفاده از چند مکان کلیدی میتواند به درک اجزای اصلی جمعیت انبوه کمک کند.
مرجع [ 19 ] ساختار پنهان در رفتارهای انسانی را با تجزیه و تحلیل داده های جمع آوری شده از 95 کاربر تلفن همراه تشریح کرد. این مطالعه رفتار مشخصه آنها را با استخراج مؤلفههای اصلی که به آنها رفتارهای ویژه میگویند، ارائه میکند. این رفتار هشتگانه فردی را تجزیه و تحلیل می کند و همچنین وابستگی های اجتماعی جمعیت ها را توصیف می کند. در حالی که این مطالعه ویژگی های رفتاری جزئی را به عنوان مؤلفه های اصلی ارائه می دهد، مرجع [ 20 ] الگوهای رفتاری را به عنوان انتقال های زمانی منظم بین حالت های معمولی، مانند خانه و محل کار، مشخص می کند. مدل موضوعی تخصیص دیریکله پنهان (LDA) برای استخراج روال های مکان محور استفاده می شود. مرجع [ 21] رویکرد مدل موضوعی را برای ارزیابی شباهتها و تفاوتهای رفتار در میان کاربران متعدد با خوشهبندی ساختار زیربنایی الگوهای رفتاری فردی گسترش داد. مراجع [ 22 ، 23 ] کارهای جالبی را در مورد کاربرد مدل LDA در داده های مکان جغرافیایی در مقیاس بزرگ برای شناسایی الگوهای فعالیت پنهان ارائه کردند.
در حالی که به نظر می رسد استفاده از CDR ها وسیله ای برجسته برای پرداختن به مسائل اجتماعی است، برخی مشکلات در داده های CDR وجود دارد. یکی از مشکلات مهم بازنمایی است زیرا نتایج تجزیه و تحلیل دادههای تحرک ممکن است با توجه به مجموعههای داده متفاوت باشد، که جمعیتهای مختلف [ 1 ، 24 ] و فرآیندهای متحرک متفاوت [ 25 ] را جذب میکند. به عنوان مثال، دادههای کارت Oyster (یک سیستم فروش بلیت الکتریکی برای مسافران حملونقل عمومی در لندن بزرگ) تحرک کاربران حملونقل را به تنهایی نشان میدهد [ 26 ]. CDR ها به تنهایی شامل کاربران تلفن همراه می شوند. مرجع [ 27] شکاف هایی را در وضعیت اجتماعی-اقتصادی بین کاربران و غیرکاربران تلفن همراه یافت. اگر بین جمعیتی که توسط دادههای تحرک نشان داده میشود و جمعیت مورد مطالعه اختلاف وجود داشته باشد، استفاده از نتایج تجزیه و تحلیل برای مسائل اجتماعی ممکن است مشکلاتی ایجاد کند.
ساختار باقی مانده این مقاله به شرح زیر است: داده های مورد استفاده در این مطالعه در بخش 2 توضیح داده شده است . در بخش 3 ، ویژگی های کاربران معمولی تلفن همراه شرح داده شده و روال معمول آنها با تجزیه و تحلیل داده های نظرسنجی میدانی از کاربران تلفن همراه ارائه شده است. در بخش 4 ، روال معمول کاربران تلفن همراه را که از CDR ها استخراج می شوند، بررسی کردیم. داده های پیمایش روزانه جمعیت عمومی در بخش 5 تجزیه و تحلیل شده است . نتیجه گیری ما در بخش 6 ارائه شده است .
2. داده ها
2.1. داده های تلفن همراه
ما از CDRهای آگوست 2013 از یکی از اپراتورهای پیشرو شبکه تلفن همراه در بنگلادش (که از این پس “MNO” نامیده می شود) استفاده می کنیم. داده ها شامل زمان، مکان آنتن و مدت تماس است. ما به طور تصادفی از سوابق تماس 5000 شناسه منحصر به فرد نمونه برداری کردیم. ما از کل مجموعه داده استفاده نکردیم زیرا 5000 نمونه را برای استخراج الگوهای معمول معمولی در نظر می گیریم. نمونه های انتخاب شده به طور مساوی از نظر جغرافیایی در محل مطالعه توزیع شده اند. داده ها شامل سوابق تمام آنتن های واقع در داکای بزرگ در بنگلادش است.
2.2. داده های نظرسنجی دفترچه خاطرات کاربران تلفن همراه
برای درک ویژگیها و فعالیتهای شخصی کاربران تلفن همراه که از خدمات MNO استفاده میکنند، یک نظرسنجی از این کاربران به عنوان بخشی از یک نظرسنجی میدانی انجام دادیم – بررسی الگوهای فعالیت برای کاوشهای جامع کاربران تلفن همراه در داکا ( فضا) [ 28]. این نظرسنجی از نوامبر 2013 تا ژانویه 2014 انجام شد و مناطق منتخب داکای بزرگ را پوشش می دهد. SPACE از دو بخش تشکیل شده است، یعنی سوابق خاطرات یک روزه از کاربران تلفن همراه و ویژگی ها و فعالیت های شخصی آنها. بخش اول زمان صرف شده برای فعالیت های روز را به همراه سوابق تماس های همان روز جمع آوری می کند. بخش دوم سن، جنسیت، شغل و فعالیت اصلی آنها را جمع آوری می کند. ما از نمونه گیری طبقه ای دو مرحله ای با توجه به کاربری زمین و سطح درآمد خانوار استفاده کردیم. مناطق تحت پوشش CDR ها به 161 منطقه اداری تقسیم می شوند که بر اساس نوع کاربری غالب آنها به سه گروه تقسیم می شوند: مسکونی، تجاری یا صنعتی. از این تعداد، 15 منطقه که شامل 10 منطقه مسکونی، دو منطقه تجاری و سه منطقه صنعتی است. به طور تصادفی متناسب با سهم جمعیت خود در کل جمعیت انتخاب می شوند. از هر منطقه، 18 خانوار که هر کدام حداقل یک کاربر تلفن همراه MNO را به عنوان عضو خانواده داشتند، از هر گروه درآمدی انتخاب شدند: بالا، متوسط و پایین. اگر جمعیت محله های فقیر نشین در یک منطقه بیشتر از 25 درصد باشد، آن جمعیت را به عنوان بخشی از گروه کم درآمد انتخاب کردیم. در نتیجه، ما با 922 کاربر تلفن همراه از 810 خانوار مصاحبه کردیم. داده های SPACE کاربران تلفن همراه را که از خدمات MNO استفاده می کنند، نشان نمی دهد. این داده ها نشان دهنده کاربران تلفن همراه مربوط به هر گروه درآمدی در نظر گرفته می شوند. ما نظرسنجی را در روزهای هفته و آخر هفته برنامه ریزی کردیم تا سوگیری را کاهش دهیم. علاوه بر این، با توجه به در دسترس بودن اعضای خانواده در صبح، بعد از ظهر، از خانواده بازدید کردیم.
2.3. داده های پیمایش روزانه جمعیت عمومی
ما از مجموعه دیگری از دادههای پیمایش روزانه، دادههای سفر شخص (PT) برای درک ویژگیهای شخصی و فعالیت جمعیت عمومی در داکای بزرگ استفاده کردیم. داده ها شامل زمان، مبدا-مقصد، وسیله حمل و نقل و هدف سفرها برای یک روز است که یک روز معمولی است، و ساختار داده تقریباً مشابه با بخش بررسی دفترچه خاطرات داده های SPACE است. علاوه بر این، ویژگی های جمعیت شناختی مانند سن، جنسیت و شغل توسط آژانس همکاری بین المللی ژاپن (جایکا) با مصاحبه با 75000 نفر ساکن در داکای بزرگ در سال 2009 جمع آوری شد. این نظرسنجی مبتنی بر خانواده بود و روش نمونه گیری به این صورت انتخاب شد. که نتایجی را به دست آورد که معرف جمعیت عمومی باشد. در نمونه، تعداد مردان کمی بیشتر از زنان بود (54٪).در مقابل 46 درصد. جدول 1 سه گروه کلیدی جمعیت را بر اساس فعالیت های آنها نشان می دهد: پاسخ دهندگان درگیر در فعالیت های درآمدزا (38٪)، کارهای خانگی (25٪)، و آموزش (32٪). علاوه بر این، ما متذکر می شویم که پاسخ دهندگان مرد اکثریت گروه درآمد زا را تشکیل می دهند در حالی که زنان در گروه وظایف خانه اکثریت را تشکیل می دهند. علاوه بر این، ما دریافتیم که کسانی که آموزش را به عنوان فعالیت اصلی خود دریافت می کنند، تقریباً یک سوم از کل جمعیت در داکای بزرگ را تشکیل می دهند. از این رو، ما تجزیه و تحلیل خود را بر روی گروههای جمعیتی کلیدی زیر متمرکز میکنیم: مردان شاغل ، زنان خانهدار ، و دانشآموزان ، و بقیه جمعیت را به عنوان دیگران برچسبگذاری میکنیم.
3. الگوهای رفتاری معمول کاربران تلفن همراه برگرفته از داده های SPACE
3.1. ترکیب جمعیتی کاربران تلفن همراه
برای درک جمعیت اصلی کاربران تلفن همراه، دادههای SPACE را بررسی کردیم که دادههای نظرسنجی روزانه 922 کاربر تلفن همراه است. جدول 2 نسبت کاربران مرد و متاهل تلفن همراه را بر اساس سطح درآمد تشریح می کند. نسبت کلی مردان بیشتر از زنان است. علاوه بر این، بیش از 85 درصد از کاربران متاهل هستند. بنگلادش دارای هنجارهای اجتماعی نسبتاً قوی بر اساس جنسیت است. در میان زنان، نرخ مشارکت نیروی کار در مناطق شهری 35 درصد و در مردان 80 درصد است [ 29].]. با فرض اینکه نسبت جنسیتی تقریباً 1 باشد، می توان تقریباً تخمین زد که نرخ جمعیت مردان شاغل تقریباً 40٪ و زنان شاغل کمتر از 20٪ است. وقتی نسبت بزرگی از جمعیت متاهل را در میان کاربران تلفن همراه در نظر می گیریم، انتظار داریم الگوهای رفتاری جنسیتی در داده های SPACE غالب باشد. به این معنا که مردان متاهل عموماً به یک فعالیت درآمدزا برای حمایت از خانواده خود مشغول هستند. زنان تمایل دارند در خانه بمانند و در حین مراقبت از کودکان و سایر اعضای خانواده، کارهای خانگی را انجام دهند.
در ادامه، فعالیت اولیه کاربران تلفن همراه مورد تجزیه و تحلیل قرار گرفت. با فرض روندهای خاص جنسیتی که در بالا ذکر شد، نوع فعالیت بر اساس جنسیت (مرد و زن) و فعالیت اقتصادی (فعالیت درآمد زا و فعالیت غیر درآمد زا) طبقه بندی شد. فعالیت درآمدزا هر فعالیتی است که درآمد پولی را به عنوان بازده ایجاد کند. به عنوان مثال، حقوق بگیران، کارگران پاره وقت و افراد خوداشتغال به عنوان افرادی که در یک فعالیت درآمدزا فعالیت می کنند طبقه بندی می شوند. افراد باقیمانده به فعالیت غیر درآمدزا می پردازند، یعنی هر فعالیتی که درآمد پولی به عنوان بازده ایجاد نمی کند. جدول 3توزیع نوع فعالیت را بر اساس جنسیت نشان می دهد. نشان داده شده است که تعداد بیشتری از مردان در یک فعالیت درآمدزا درگیر هستند در حالی که اکثر زنان در یک فعالیت غیر درآمدزا، به ویژه کارهای خانگی مشغول هستند. این نشان میدهد که اکثر کاربران تلفن همراه مشترک MNO کسانی هستند که نقشهای مسئول در خانواده را انجام میدهند، یعنی پول در دسترس دارند. تعرفه تلفن همراه برای این MNO در مقایسه با سایر شرکتها در بنگلادش نسبتاً گران است و این عاملی بر روند کاربران در نظر گرفته شد.
جدول 4 نسبت افرادی را نشان می دهد که در یک فعالیت معمولی متناسب با جنسیت خود مشغول هستند. مقادیر داخل پرانتز نشان دهنده نسبت کاربران متاهل است. روند بر اساس جنسیت برای مردان و زنان در تمام سطوح درآمد مشابه مشاهده شد. بنابراین، نتیجه می گیریم که، صرف نظر از سطح درآمد، دو نوع کاربر معمولی تلفن همراه وجود دارد: مرد متاهل که در یک فعالیت درآمدزا فعالیت می کند و زن متاهل که عمدتاً کارهای خانگی را انجام می دهد. بر اساس نتایج، دو کاربر معمولی تلفن همراه را مردان شاغل و خانه دار می نامند .
3.2. محل فعالیت اصلی
با در نظر گرفتن مردان شاغل و زنان خانه دار به عنوان کاربران معمولی تلفن همراه، نوع محل فعالیت اصلی آنها با تعیین خانه یا خارج از خانه طبقه بندی شد. فعالیت افراد باید به انواع مکان ها مرتبط باشد زیرا الگوهای رفتاری استخراج شده از CDR ها بر اساس توزیع احتمال انواع مکان ها در بخش بعدی توضیح داده خواهد شد. جدول 5 توزیع انواع مکان را برای فعالیت های اصلی مردان شاغل و زنان خانه دار نشان می دهد . در مورد مردان شاغل، 72 درصد از مکان های فعالیت اصلی آنها یک مکان خاص در خارج از خانه است. این نشان میدهد که بیش از نیمی از کاربران مرد معمولی مکان خاصی در خارج از خانه برای فعالیت اصلی خود دارند. در مورد خانمهای خانهدار ، 94 درصد از محلهای فعالیت اصلی آنها خانه است. با توجه به تفاوت متمایز در محل فعالیت اصلی برای دو گروه اصلی جمعیت، تفسیر الگوهای رفتاری معمولی استخراج شده از CDR ها بر اساس نتایج تجزیه و تحلیل این بخش قابل قبول است.
3.3. الگوهای رفتاری معمول کاربران تلفن همراه
در قسمت قبل، نوع مکان را به عنوان خانه و خارج از خانه طبقه بندی کردیم. برای هر کاربر، مکانی که به عنوان خانه گزارش شده است به عنوان خانه برچسب گذاری می شود . در میان مکانهای خارج از خانه، مکانی که بهعنوان محل کار گزارش میشود با عنوان Work برچسبگذاری میشود . برای کسانی که محل کار ندارند، آنها فقط مکان های خانه و خارج از خانه را دارند، جایی که بیشترین مکان گزارش شده در بین مکان بیرونی خانه انتخاب شده و به عنوان کار برچسب گذاری شده است . بنابراین، هر کاربر دارای مکانهایی است که به عنوان خانه و محل کار برچسبگذاری شدهاند . با استفاده از این سه نوع مکان، یعنی خانه ، محل کار ، و دیگر، الگوهای رفتار مبتنی بر مکان کاربران معمولی تلفن همراه را بر اساس داده های SPACE بدست می آوریم. برای خانم های خانه دار و دانش آموزان محل اولیه خارج از منزل را محل کارشان در نظر گرفتیم یعنی زمان صرف شده برای تحصیل دانش آموزان را کار در نظر گرفتیم . علاوه بر مردان شاغل و زنان خانه دار ، الگوی رفتاری دانش آموزان را که سومین قشر بزرگ کاربران تلفن همراه را تشکیل می دهند، بررسی کردیم، اگرچه نسبت مطلق این بخش بسیار کمتر از دو بخش دیگر است. کاربران تلفن همراه که به عنوان دانشجو طبقه بندی می شوند ، بیشتر دانشجویان دانشگاه هستند.شکل 1 a,b به ترتیب توزیع ساعتی احتمال حضور در خانه و محل کار را نشان می دهد . ما میتوانیم یک روند متمایز را برای زنان خانهدار مشاهده کنیم : احتمال حضور آنها در خانه تقریباً 100٪ در طول روز است. مردان شاغل و دانشآموزان دارای توزیع احتمال نسبتاً مشابهی برای حضور در محل کار هستند ، اما این احتمال برای مردان شاغل بسیار بیشتر است.. این احتمال بالاتر را می توان به تفاوت بین ساعات اداری (مثلاً از 9 صبح تا 5 بعد از ظهر) و ساعات مدرسه در داکا نسبت داد. روز هفته و آخر هفته تفاوتی با هم نداشتند زیرا نوع روز برای نظرسنجی دفترچه خاطرات، که یکی از مجموعه داده های مورد استفاده برای مقایسه است، دقیقاً به عنوان یک روز معمولی برای مصاحبه شوندگان مشخص شده بود.
4. الگوهای رفتار معمولی استخراج شده از CDR ها
4.1. روش شناسی
ما قیاسی بین کشف یک الگوی روال روزانه از CDRها و کشف یک موضوع پنهان از اسناد ترسیم می کنیم. CDR های هر کاربر به عنوان یک سند در نظر گرفته می شود و هر نقطه داده که با مهر زمانی و موقعیت جغرافیایی توصیف می شود، به عنوان کلمات در سند در نظر گرفته می شود. واژگان در مدل ما توزیع زمانی و توزیع جغرافیایی را توصیف می کند. در این مطالعه، ما مدل کلاسیک LDA را با ترسیم مهر زمان و همچنین مکان از تخصیص پنهان موضوع برای هر رکورد گسترش میدهیم و فرض میکنیم که افراد روال روزانه مشابهی دارند اما مکانهای اصلی متفاوتی دارند (مانند خانه، محل کار). از این رو، همانطور که در شکل 2 نشان داده شده است، متغیرهای پنهان الگوهای زمانی را در خارج از صفحه کاربری مدل و متغیرهای پنهان مکان را در داخل صفحه کاربری قرار می دهیم. نمادهای استفاده شده در شکل 2 در جدول 6 توضیح داده شده است . برای استنباط متغیرهای پنهان، یک استنتاج نمونه گیری گیبس [ 30 ] همانطور که در الگوریتم 1 نشان داده شده است اعمال می شود.
| الگوریتم 1 کشف الگوی رفتار مبتنی بر نمونه گیری گیبس |
| ورودی: { ( u , d , t , l ) }{(تو، د،تی،ل)}مجموعه داده های CDR; ککتعداد از پیش تعریف شده شماره موضوع |
| خروجی: {zتو ، د، تی ، ل}{�تو،د،تی،ل}تکلیف موضوع؛ {ϕکتو}{�توک}توزیع موضوع در مکان برای هر کاربر؛ {ψکد}{�دک}توزیع موضوع در طول روز؛ {ψکτ}{��ک}توزیع موضوع در طول زمان؛ |
| nu ، k= 0�تو،ک=0; nد، ک= 0�د،ک=0; nτ، ک= 0��،ک=0; nu ، l ، k= 1�تو،ل،ک=1 |
| // مقداردهی اولیه تصادفی |
| برای هر رکورد ( تو ، د , τ، ل ) :(تو، د،�،ل): |
| k =zتو ، د, τ، ل= R a n dمنn t ( K)ک=�تو،د،�،ل=آرآ�دمن�تی(ک) |
| nu ، k=nu ، k+ 1�تو،ک=�تو،ک+1 |
| nد، ک=nد، ک+ 1�د،ک=�د،ک+1 |
| nτ، ک=nτ، ک+ 1��،ک=��،ک+1 |
| nu ، l ، k=nu ، l ، k+ 1�تو،ل،ک=�تو،ل،ک+1 |
| // استنتاج تکراری |
| برای i = 1 تا MAX_ITERATION |
| برای هر ( تو ، د , τ، ل ) :(تو، د،�،ل): |
| کo l d=zتو ، د, τ، لک�لد=�تو،د،�،ل |
| nتو _کo l d=nتو _کo l d– 1�تو،ک�لد=�تو،ک�لد–1 |
| nد،کo l d=nد،کo l d– 1�د،ک�لد=�د،ک�لد–1 |
| nτ،کo l d=nτ،کo l d– 1��،ک�لد=��،ک�لد–1 |
| nتو ، من ،کo l d=nتو ، من ،کo l d– 1�تو،ل،ک�لد=�تو،ل،ک�لد–1 |
| نمونه تکلیف موضوع جدید ککاز توزیع p ( k ) =nu ، k+ α∑کnu ، k+ کα⋅nد، ک+ γ∑Dnد، ک+ D γ⋅nτ، ک+ γ∑تیnτ، ک+ تیγ⋅nu ، l ، k+ β∑Lnu ، l ، k+ L βپ(ک)=�تو،ک+�∑ک�تو،ک+ک�·�د،ک+�∑��د،ک+��·��،ک+�∑تی��،ک+تی�·�تو،ل،ک+�∑��تو،ل،ک+�� |
| zتو ، د، تی ، ل= k�تو،د،تی،ل=ک |
| nu ، k=nu ، k+ 1�تو،ک=�تو،ک+1 |
| nد، ک=nد، ک+ 1�د،ک=�د،ک+1 |
| nτ، ک=nτ، ک+ 1��،ک=��،ک+1 |
| nu ، l ، k=nu ، l ، k+ 1�تو،ل،ک=�تو،ل،ک+1 |
| // مقادیری که باید برگردانده شوند را محاسبه کنید |
| ϕکتو=nu ، l ، k+ β∑Lnu ، l ، k+ L β، ψکد=nد، ک+ γ∑Dnد، ک+ D γ، ψکτ=nτ، ک+ γ∑تیnτ، ک+ تیγ�توک=�تو،ل،ک+�∑��تو،ل،ک+��، �دک=�د،ک+�∑��د،ک+��، ��ک=��،ک+�∑تی��،ک+تی� |
| برگشت {zتو ، د, τ، ل}{�تو،د،�،ل}، {ϕکتو}{�توک}، {ψکد}{�دک}، {ψکτ}{��ک} |
4.2. استخراج رفتارهای فراخوانی فضایی-زمانی معمولی بر اساس سوابق تماس
ما مدل توسعهیافته LDA خود را با استفاده از الگوریتم ارائهشده در ابتدای این بخش بر روی CDRهای 5000 شناسه منحصربهفرد از کاربران تلفن همراه اعمال کردیم. الگوی زمانی که ما کشف کردیم در شکل 3 نشان داده شده است . ما سه موضوع اصلی را به عنوان سه الگوی تماس معمولی کاربران تلفن همراه استخراج کردیم. شکل 3 نسبت موضوع را در هر زمان نشان می دهد و موضوعات 1 و 3 رفتار فراخوانی را با نسبت بالای موضوع غالب در ساعات صبح و در طول روز به ترتیب نشان می دهد. علاوه بر این، موضوع 2 رفتار تماس ترجیحی تماس در شب را نسبت به روز نشان می دهد. موضوع با توزیع موضوع مکانی/زمانی تعیین می شود. بنابراین، الگوهای شکل 3بر اساس الگوی تماس ها در رابطه با الگوی بازدید دوره ای آنها از همان مکان خوشه بندی می شوند. همانطور که قبلاً بحث شد، مکان هایی که به طور مکرر بازدید می شوند، مانند خانه و محل کار، می توانند الگوهای رفتاری افراد را توضیح دهند. بنابراین، نتیجه میگیریم که تا حدی الگوهای استخراجشده توسط مدل LDA ما میتواند با مکانهای مهمی برای کاربران تلفن همراه مرتبط باشد.
با در نظر گرفتن سبک زندگی مردم در داکا که اکثر دفاتر، مغازهها و مکانهای تفریحی در شب بسته هستند، فرض میکنیم مکانی که بیشترین احتمال را بعد از نیمهشب دارد با مکان خانه مرتبط است، زیرا اکثر مردم به احتمال زیاد در آن اقامت میکنند. خانه یا در مجاورت خانه اواخر شب. جمعیتهای دستهبندی شده در مبحث 3 بیشترین احتمال ماندن در خانه را برای طولانیترین ساعت بعد از ساعت 12 صبح تا 12 بعد از ظهر نشان میدهند، این شبیه الگوی زنان خانهدار است که در بخش قبل استخراج شد. جمعیت های دسته بندی شده در مبحث 2 تفاوت واضحی در احتمال حضور در خانه بین شب و روز نشان می دهند. ما فرض میکنیم که این گروه جمعیتی معمولاً در خارج از خانه فعالیتی مشابه الگوی مردان شاغل دارند. که در قسمت قبل نیز استخراج شد. به همین ترتیب، جمعیت مبحث 1 و 2 زمان زیادی را در خارج از خانه سپری می کنند. موضوع 1 دو اوج را نشان می دهد: اولی تقریباً در ساعت 8 صبح و دومی در ساعت 7 بعد از ظهر است. و ساعت 12 بعد از ظهر) و حدود ساعت 5 بعد از ظهر احتمالاً به این دلیل است که جمعیت های خوشه بندی شده در این گروه نه تنها شامل دانش آموزان می شود، بلکه جمعیت های دیگری را نیز در بر می گیرد که نمی توان آنها را در مباحث 2 و 3 دسته بندی کرد. با مقایسه نتایج تجزیه و تحلیل با بخش های قبلی، مشاهده می کنیم که مدل LDA می تواند دو گروه جمعیتی غالب را تشخیص دهد:مردان شاغل ; و (2) مبحث 3 نمایانگر افرادی است که در یک فعالیت مرتبط با خانه مشغول هستند و این افراد به احتمال زیاد خانه دار هستند.
5. اختلاف بین جمعیت در CDRها و جمعیت عمومی
5.1. الگوهای رفتاری معمولی گروه های جمعیتی اصلی در داکا
در این بخش، یافتههای خود را در رابطه با الگوهای رفتاری معمولی در سه گروه اصلی جمعیت بهدستآمده از دادهها گزارش میکنیم. نتایج در شکل 4 a,b خلاصه شده است. همانطور که در بخش های قبلی بحث شد، تحقیقات قبلی نشان داده است که الگوهای رفتاری افراد را می توان با تمرکز بر مکان های مهمی مانند خانه و محل کار توضیح داد . بنابراین، ما توزیع گروه های کلیدی جمعیت را با در نظر گرفتن تنها (الف) خانه و (ب) محل کار ارائه می کنیم . نتایج الگوهای واضح و مشهود را نشان می دهد. احتمال حضور در خانه برای زنان خانه دار بالاترین استدر میان سه گروه اصلی جمعیت ما شباهت بیشتری را در احتمال حضور در محل کار بین مردان شاغل و دانشجویان برای جمعیت عمومی در مقایسه با کاربران تلفن همراه پیدا کردیم. با وجود تفاوت جزئی در نتیجه، نتیجه می گیریم که الگوهای رفتاری استخراج شده از دو منبع داده به طور کلی مشابه هستند.
5.2. تعصب مالکیت
در نهایت، سوگیری مالکیت کاربران تلفن همراه را با مقایسه گروههای جمعیتی اصلی جمعیت عمومی و کاربران تلفن همراه مورد بحث قرار میدهیم. جدول 7 تخمین تقریبی نسبت سه گروه اصلی جمعیت را برای جمعیت عمومی و کاربران تلفن همراه نشان می دهد. علامت “+” در تخمین برای کاربران تلفن همراه، حداقل تخمین ممکن را نشان می دهد. این نشان می دهد که نسبت ها به عنوان حداقل ارائه شده است زیرا این نسبت ها برای هر سطح درآمد به دست آمده است اما اطلاعاتی در مورد سهم جمعیت ندارند. به عنوان مثال، نسبت زنان خانه دار در میان کاربران تلفن همراه برای سطوح بالا، متوسط، پایین و زاغه به ترتیب 30، 29، 27 درصد و 26 درصد است. نسبت کلی زنان خانه داردر میان کاربران تلفن همراه می تواند حداقل 26٪ باشد. در جمعیت عمومی، جمعیت قابل توجهی از دانش آموزان وجود دارد که آموزش به عنوان فعالیت اصلی آنها است. با این حال، نسبت مربوط به دانشجویان در میان کاربران تلفن همراه بسیار کم است. علاوه بر این، نسبت کارگران مرد و زنان خانه دار در جمعیت عمومی و در میان کاربران تلفن همراه قابل توجه است. با توجه به اینکه هرم جمعیت بنگلادش در پایه گسترده است [ 31 ] و دانشآموزان عموماً به گروههای جمعیتی نسبتاً جوانتر تعلق دارند، نتیجه میگیریم که CDRها مغرضانه هستند زیرا دادهها به ندرت شامل دانشآموزانی میشوند که بخش قابل توجهی از جمعیت عمومی در داکا را تشکیل میدهند.
6. نتیجه گیری
در این مطالعه، ما یک رویکرد جدید برای روشن کردن اختلاف در ترکیب جمعیت اصلی بین جمعیت عمومی و کاربران تلفن همراه با مقایسه الگوهای رفتاری معمولی آنها پیشنهاد کردیم. ما جمعیت اصلی کاربران تلفن همراه را از طریق دادههای نظرسنجی SPACE و دفترچه خاطرات کاربران تلفن همراه مشخص کردیم. ما دریافتیم که مردان شاغل و زنان خانه دار دو جزء جمعیتی غالب کاربران تلفن همراه MNO هستند. ما همچنین موفق به استخراج الگوهای رفتاری آنها از CDRها با استفاده از یک مدل موضوعی شدیم. نتایج تجزیه و تحلیل دو الگوی رفتاری معمولی را ارائه کرد، یعنی افرادی که بیشتر روز را درگیر کارهای روزمره خارج از خانه میکنند و کسانی که بیشتر وقت خود را در خانه میگذرانند. این یافته ها با الگوهای رفتاری استخراج شده از داده های نظرسنجی دفترچه خاطرات کاربران تلفن همراه سازگار بود.
با مقایسه جمعیت اصلی کاربران تلفن همراه و جمعیت عمومی، دریافتیم که دانشآموزان جزء اصلی جمعیت عمومی را تشکیل میدهند اما در میان کاربران تلفن همراه قابل توجه نیستند. نتایج تجزیه و تحلیل نشان داد که CDR ها الگوهای رفتاری مردان شاغل و زنان خانه دار را نشان می دهند. بنابراین، ما پیشنهاد میکنیم که کاربرد CDRها، بهویژه نسل جوان را هدف قرار دهد، این سوگیری را در نظر بگیرد زیرا دادهها لزوماً این گروه جمعیت را نشان نمیدهند. ما معتقدیم که یافته های ما برای استفاده از CDR ها در کشورهای در حال توسعه که منابع محدودی دارند مفید خواهد بود. خرید CDR هزینه اضافی ندارد. داده ها عموماً برای مقاصد صورتحساب توسط MNOها جمع آوری می شوند و بنابراین تا زمانی که یک شبکه تلفن همراه وجود دارد در دسترس هستند. مطالعه ما نشان میدهد که پتانسیل درک سوگیریهای خاص دامنه، که میتواند محدودیتهای عمدهای در استفاده از دادههای خاص دامنه در مقیاس بزرگ مانند CDR ایجاد کند، از طریق تجزیه و تحلیل CDRs در ترکیب با دادههای ثانویه وجود دارد. با این حال، الگوهای فعالیت افراد در این مورد چندان پیچیده نیست زیرا سبک زندگی افراد تحت تأثیر هنجارهای اجتماعی قوی است. کاربردهای این مطالعه در سایر حوزهها نیازمند تحلیل بیشتر در مورد رابطه بین ویژگیهای گروههای اصلی جمعیت و روال روزانه آنها است. علاوه بر این، انجام یک بررسی میدانی در مقیاس بزرگ گران است. برای مطالعات بیشتر، ما در نظر داریم از دادههای سرشماری استفاده کنیم زیرا مالکیت تلفن همراه به عنوان یک موضوع اصلی برای سرشماری نفوس و مسکن با مرجع توصیه میشود [32 ]. سرشماری هر پنج سال یکبار توصیه می شود و در بیش از 200 کشور در دور سرشماری از سال 2005 تا 2014 انجام شده است [ 33 ]. ما استفاده از چنین دادههایی را برای کاهش هزینههای جمعآوری دادهها برای کاربرد در سایر حوزههای مطالعه در نظر میگیریم.
منابع
- وسولوفسکی، آ. عقاب، ن. نور، AM; برف، RW; Buckee, CO تاثیر سوگیری ها در مالکیت تلفن همراه بر برآورد تحرک انسان. JR Soc. رابط 2013 , 10 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
- فریاس مارتینز، وی. Virseda, J. در رابطه بین عوامل اجتماعی-اقتصادی و استفاده از تلفن همراه. در مجموعه مقالات پنجمین کنفرانس بین المللی فناوری اطلاعات و ارتباطات و توسعه، آتلانتا، GA، ایالات متحده آمریکا، 12 تا 15 مارس 2012. صص 76-84.
- بلومن استاک، جی. Eagle, N. Mobile divides: جنسیت، وضعیت اجتماعی-اقتصادی و استفاده از تلفن همراه در رواندا. در مجموعه مقالات چهارمین کنفرانس بین المللی فناوری اطلاعات و ارتباطات و توسعه، لندن، انگلستان، 13 تا 16 دسامبر 2010.
- کانگ، سی. سوبولفسکی، اس. لیو، ی. Ratti, C. کاوش حرکات انسان در سنگاپور: تحلیل مقایسه ای بر اساس استفاده از تلفن همراه و تاکسی. در مجموعه مقالات دومین کارگاه بین المللی ACM SIGKDD در محاسبات شهری، شیکاگو، IL، ایالات متحده آمریکا، 11-14 اوت 2013.
- Demissie, MG; de Almeida Correia، GH; Bento، C. سیستم تشخیص وضعیت ترافیک جاده ای هوشمند از طریق اطلاعات تحویل شبکه های سلولی: یک مطالعه اکتشافی. ترانسپ Res. قسمت ج: ظهور. تکنولوژی 2013 ، 32 ، 76-88. [ Google Scholar ] [ CrossRef ]
- کاندیا، جی. گونزالس، ام سی؛ وانگ، پی. شونهارل، تی. مدی، جی. Barabási، AL کشف پویایی فردی و جمعی انسان از سوابق تلفن همراه. J. Phys. ج: ریاضی نظریه. 2008 , 41 . [ Google Scholar ] [ CrossRef ]
- گونزالس، ام سی؛ هیدالگو، کالیفرنیا؛ Barabási، AL درک الگوهای تحرک فردی انسان. طبیعت 2008 ، 453 ، 779-782. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- Barabási، AL شبکه های بدون مقیاس: یک دهه و فراتر از آن. Science 2009 , 325 , 412-413. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- آهنگ، سی. کورن، TK; وانگ، پی. Barabási، AL مدل سازی خواص مقیاس پذیری تحرک انسان. نات. فیزیک 2010 ، 6 ، 818-823. [ Google Scholar ] [ CrossRef ]
- اقبال، ام اس; Choudhury، CF; وانگ، پی. González، MC توسعه ماتریس های مبدا-مقصد با استفاده از داده های تماس تلفن همراه. ترانسپ Res. قسمت ج: ظهور. تکنولوژی 2014 ، 40 ، 63-74. [ Google Scholar ] [ CrossRef ]
- وانگ، اچ. کالابرس، اف. دی لورنزو، جی. راتی، سی. استنتاج حالت حمل و نقل از سوابق جزئیات تماس تلفن همراه ناشناس و انباشته شده. در مجموعه مقالات سیزدهمین کنفرانس بین المللی IEEE در مورد سیستم های حمل و نقل هوشمند، جزیره مادیرا، پرتغال، 19 تا 22 سپتامبر 2010.
- بالکان، دی. کولیزا، وی. گونسالوس، بی. متعجب.؛ راماسکو، جی جی. Vespignani، A. شبکه های تحرک چند مقیاسی و گسترش فضایی بیماری های عفونی. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2009 ، 106 ، 21484–21489. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- باکی، CO؛ وسولوفسکی، آ. ایگل، NN; هانسن، ای. برف، تلفن های همراه RW و مالاریا: مدل سازی سفر انسان و انگل Travel Med. آلوده کردن دیس 2013 ، 11 ، 15-22. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- بکر، RA; کاسرس، آر. هانسون، ک. لوه، جی ام؛ اوربانک، اس. ورشاوسکی، آ. وولینسکی، سی. داستان یک شهر: استفاده از داده های شبکه سلولی برای برنامه ریزی شهری. محاسبات فراگیر IEEE 2011 ، 10 ، 18-26. [ Google Scholar ] [ CrossRef ]
- ایزاکمن، اس. بکر، آر. کاسرس، آر. کوبوروف، اس. مارتونوسی، ام جی; رولند، جی. Varshavsky، A. شناسایی مکان های مهم در زندگی مردم از داده های شبکه سلولی. در محاسبات فراگیر ; لیونز، ک.، های تاور، جی.، هوانگ، EM، ویرایش. Springer Berlin Heidelberg: برلین، آلمان، 2011; صص 133-151. [ Google Scholar ]
- Phithakkitnukoon، S. هورانونت، تی. دی لورنزو، جی. شیباساکی، آر. Ratti, C. Activity-Aware map: شناسایی الگوی فعالیت روزانه انسان با استفاده از داده های تلفن همراه. در درک رفتار انسان ; Salah, AA, Ruiz-del-Solar, J., Meriçli, C., Oudeyer, P.-Y., Eds.; Springer Berlin Heidelberg: برلین، آلمان، 2010; ص 14-25. [ Google Scholar ]
- جرو، او. آحاس، ر. Witlox، F. درک تنوع ماهانه در فضاهای فعالیت انسانی: یک مطالعه دوازده ماهه با استفاده از سوابق جزئیات تماس تلفن همراه. ترانسپ Res. قسمت ج: ظهور. تکنولوژی 2014 ، 38 ، 122-135. [ Google Scholar ] [ CrossRef ]
- لو، ایکس. پاس، EI اجتماعی-دموگرافیک، مشارکت در فعالیت و رفتار سفر. ترانسپ Res. قسمت A 1998 ، 33 ، 1-18. [ Google Scholar ] [ CrossRef ]
- عقاب، ن. پنتلند، AS شناسایی ساختار در روال. رفتار Ecol. Sociobiol. 2009 ، 63 ، 1057-1066. [ Google Scholar ] [ CrossRef ][ نسخه سبز ]
- فرهی، ک. Gatica-Perez, D. کشف روال ها از مکان های انسانی در مقیاس بزرگ با استفاده از مدل های موضوع احتمالی. ACM Trans. هوشمند سیستم تکنولوژی 2011 ، 2 . [ Google Scholar ] [ CrossRef ]
- زنگ، جی. Ni, LM یک چارچوب بدون نظارت برای سنجش الگوهای رفتار فردی و خوشه ای از داده های تلفن همراه انسان. در مجموعه مقالات کنفرانس ACM 2012 در محاسبات همه جا حاضر، پیتسبورگ، PA، ایالات متحده آمریکا، 5-8 سپتامبر 2012.
- حسن، س. Ukkusuri، SV طبقهبندی الگوی فعالیت شهری با استفاده از مدلهای موضوعی از دادههای موقعیت جغرافیایی آنلاین. ترانسپ Res. قسمت ج: ظهور. تکنولوژی 2014 ، 44 ، 363-381. [ Google Scholar ] [ CrossRef ]
- حسن، س. Ukkusuri، SV زمینههای مکان ورود کاربر برای مدلسازی الگوهای سبک زندگی جغرافیایی شهری. PLoS ONE 2015 . [ Google Scholar ] [ CrossRef ] [ PubMed ]
- آرایی، ع. ویتایانگ کورن، آ. هورانونت، تی. شائو، ایکس. Shibasaki، R. درک جمعیت غیر قابل مشاهده در سوابق جزئیات تماس از طریق تجزیه و تحلیل رفتار تماس کاربر تلفن همراه: مطالعه موردی داکای بزرگ در بنگلادش. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد محاسبات و ارتباطات فراگیر، سنت لوئیس، MO، ایالات متحده آمریکا، 23 تا 27 مارس 2015. ص 207-214.
- شل، ام. سیناترا، آر. پتری، جی. ترنر، اس. Latora, V. درک تحرک در یک پتری دیش اجتماعی. علمی Rep. 2012 , 2 , 1-6. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- راث، سی. کانگ، اس ام. باتی، م. Barthélemy, M. ساختار جنبش های شهری: فعالیت چند مرکزی و جریان های سلسله مراتبی درهم تنیده. PLoS ONE 2011 ، 6 ، e15923. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- برنج، RE; Katz، JE مقایسه استفاده از اینترنت و تلفن همراه: شکاف دیجیتالی استفاده، پذیرش، و ترک تحصیل. مخابرات سیاست 2003 ، 27 ، 597-623. [ Google Scholar ] [ CrossRef ]
- آرایی، ع. ویتایانگ کورن، آ. کاناسوجی، اچ. هورانونت، تی. شائو، ایکس. Shibasaki, R. درک ویژگی های کاربر از رفتار فراخوانی: کاوش سوابق جزئیات تماس از طریق مشاهدات میدانی. در مجموعه مقالات دوازدهمین کنفرانس بین المللی پیشرفت در محاسبات موبایلی و چند رسانه ای، کائوسیونگ، تایوان، 8 تا 10 دسامبر 2014. صص 95-104.
- رحمان، ری. اسلام، R. مشارکت نیروی کار زن در بنگلادش: روندها، محرک ها و موانع . ILO: ژنو، سوئیس، 2013. [ Google Scholar ]
- گریفیث، TL; استیورز، ام. یافتن موضوعات علمی. Proc. Natl. آکادمی علمی ایالات متحده آمریکا 2004 ، 5228-5235. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- سازمان ملل. برنامه سرشماری نفوس و مسکن جهان 2010. در دسترس آنلاین: http://unstats.un.org/unsd/demographic/sources/census/2010_PHC/censusclockmore.htm (دسترسی در 9 فوریه 2015).
- سازمان ملل. اصول و توصیه های سرشماری نفوس و مسکن: بازنگری 2 ; مقالات آماری سری M شماره 67/Rev.2; سازمان ملل: نیویورک، نیویورک، ایالات متحده آمریکا، 2008. [ Google Scholar ]
- سازمان ملل. پیری جمعیت جهان: 1950–2050 ; سازمان ملل: نیویورک، نیویورک، ایالات متحده آمریکا، 2001. [ Google Scholar ]

شکل 1. توزیع احتمال ساعتی بودن در ( الف ) خانه و ( ب ) محل کار برای سه گروه اصلی جمعیت.

شکل 2. مدل نموداری مدل توسعه یافته LDA ما. گره های سایه دار و بدون سایه به ترتیب متغیرهای مشاهده شده و پنهان را نشان می دهند.

شکل 3. الگوهای زمانی سه موضوع اصلی استخراج شده از CDR ها.

شکل 4. توزیع احتمال ساعتی بودن در ( الف ) خانه و ( ب ) محل کار برای سه گروه اصلی جمعیت.

جدول 1. توزیع درصد پاسخ دهندگان نظرسنجی و وضعیت درآمد آنها بر اساس جنسیت.

جدول 2. نسبت کاربران مرد و متاهل.

جدول 3. توزیع فعالیت اصلی بر اساس جنسیت.

جدول 4. نسبت افراد درگیر در فعالیت های معمولی، طبقه بندی شده بر اساس جنسیت و سطح درآمد.

جدول 5. توزیع مکان برای فعالیت اصلی.

جدول 6. توضیح نمادهای استفاده شده در شکل 2 .

جدول 7. نسبت سه گروه اصلی جمعیت.
© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر