روشی برای قضاوت خوشه بندی تراکم ترافیک بر اساس تحلیل رابطه ای خاکستری

خلاصه

قضاوت خوشه بندی تراکم ترافیک یک مشکل اساسی در مطالعه هشدار ترافیک است. با این حال، قضاوت درجات تراکم ترافیک تنها با استفاده از سرعت وسیله نقلیه رضایت بخش نیست. در این مقاله، اطلاعات جریان ترافیک را با سه ویژگی (سرعت جریان ترافیک، تراکم جریان ترافیک و حجم ترافیک) جاده‌های تنه شهری جمع‌آوری می‌کنیم که برای قضاوت در مورد میزان تراکم ترافیک استفاده می‌شود. ما ابتدا یک مدل خوشه‌بندی رابطه‌ای خاکستری را با استفاده از تحلیل رابطه خاکستری و تئوری مجموعه‌های خشن برای استخراج روابط اطلاعات ویژگی‌های چند بعدی تعریف می‌کنیم. سپس، ما یک الگوریتم خوشه‌بندی رتبه درجه عضویت رابطه خاکستری (GMRC) را برای اولویت خوشه‌بندی متمایز پیشنهاد می‌کنیم و درجه تراکم ترافیک شهری را بیشتر تحلیل می‌کنیم. نتایج تجربی ما نشان می‌دهد که میانگین دقت الگوریتم GMRC 24.9٪ بیشتر از الگوریتم K-means و 30.8٪ بیشتر از الگوریتم فازی C-Means (FCM) است. علاوه بر این، متوجه شدیم که روش ما می تواند برای هشدارهای ترافیکی پویا مفیدتر باشد.

کلید واژه ها:

ترافیک شهری ; درجه عضویت رابطه خاکستری ; قضاوت تراکم ترافیک

1. معرفی

با توسعه سریع ترافیک شهری، موج وسایل نقلیه شهری و فشار بر ظرفیت های ترافیکی به شدت افزایش می یابد. بنابراین، مشکلات ترافیکی جدی می شود و توسعه یک شهر را محدود می کند. در چین، شرایط جاده ها و وسایل نقلیه کاملاً نامناسب است و ازدحام ترافیک باعث ایجاد مشکلات اجتماعی و اقتصادی قابل توجهی شده است. در این حالت، ترافیک نه تنها باعث اتلاف وقت، تاخیر در کار و کاهش راندمان می شود، بلکه باعث اتلاف قابل توجه سوخت، افزایش احتمال تصادفات و تشدید مشکلات جدی پیش روی کنترل و مدیریت ترافیک می شود. از دهه 1980 سیستم های حمل و نقل هوشمند (ITS) متشکل از فناوری کامپیوتری یکپارچه، فناوری کنترل خودکار، فناوری ارتباطات و فناوری پردازش اطلاعات به نتایج قابل توجهی در سراسر جهان دست یافته است. علاوه بر این، بسیاری از جنبه های ITS بر اساس اطلاعات ترافیکی است. علاوه بر این، پردازش اطلاعات ترافیک به یک جنبه مهم از ITS تبدیل شده است.1 ]. عملکرد حیاتی یک ITS مدیریت و کنترل جریان ترافیک و جلوگیری از ایجاد ترافیک است. هنگامی که ترافیک رخ می دهد، چنین سیستم هایی باید راه حل های به موقع و موثر ارائه دهند و فشار ترافیک را کاهش دهند. بنابراین، خوشه بندی و ارزیابی تراکم ترافیک شهری از اهمیت بالایی برخوردار است و بنابراین پیش نیازی برای بازرسی صحیح ازدحام ترافیکی است. برای تعیین میزان تراکم جاده، تعاریف مختلفی از تراکم ترافیک ارائه شده است. روتنبرگ رتبه تراکم ترافیک را به عنوان تعداد وسایل نقلیه در جاده بیش از ظرفیت حمل در سطح خدمات جاده ای قابل قبول عمومی تعریف کرد [ 2]]. تحت چنین تعریفی، مقامات ایالات متحده سطح خدمات (LOS) را بر اساس نسبت جریان واقعی وسیله نقلیه (حجم) و ظرفیت جاده به شش سطح از A تا F تقسیم می کنند : V / C. در ویرجینیا، زمانی که V / Cکمتر از 0.77 است، LOS در سطح D است و وضعیت ترافیک به عنوان یک جریان ترافیک با تراکم بالا اما پایدار در نظر گرفته می شود. وقتی LOS در سطح E است، ترافیک شروع به بدتر شدن می کند و منجر به ترافیک جدی می شود. یک روش برای ارزیابی سطح تراکم ترافیک (رتبه) با مقایسه یک پارامتر ترافیکی خاص با یک آستانه است. هنگامی که پارامتر از یک آستانه معین بیشتر باشد، ترافیک ایجاد شده در نظر گرفته می شود. به طور خاص، این روش می تواند تشخیص دهد که آیا تراکم ترافیک رخ می دهد یا خیر، اما نمی تواند یک روش ارزیابی اطلاعات جامع برای تراکم ترافیک را نشان دهد. در حال حاضر، ما اطلاعات جریان ترافیک را بر اساس سه ویژگی برای جاده‌های تنه شهری نانجینگ جمع‌آوری می‌کنیم تا به طور جامع سطح تراکم ترافیک را در همان دوره زمانی بسنجیم. علاوه بر این، ما قضاوت می‌کنیم که کدام جاده اجازه می‌دهد ترافیک روان باشد،شکل 1 ناحیه شبکه حمل و نقل نانجینگ را در بافت جغرافیایی آن نشان می دهد. با استفاده از اطلاعات فوق می توانیم مقادیر مرجع برای مدیریت ترافیک ارائه کنیم.

در حال حاضر، روش قضاوت ازدحام ترافیک را می توان به سه دسته تقسیم کرد: (1) روش تشخیص مستقیم، مانند روش تشخیص ویدیویی. این روش نیاز به نصب دوربین های زیادی دارد و هزینه آن بیشتر است. (2) روش تشخیص غیرمستقیم، که عمدتاً بر اساس تأثیر رویدادها بر جریان ترافیک است، برای تشخیص وجود رویداد استفاده می شود. این روش دارای هزینه کم، ساده و آسان برای کار است، اما دارای نرخ تشخیص پایین تر و نرخ هشدار نادرست بالا است. (3) بر اساس مدل تئوری، الگوریتم طراحی برای قضاوت ازدحام ترافیک. این روش در حال استفاده است و برخی از نظریه های بالغ مانند تحلیل خوشه ای، نظریه سیستم خاکستری و نظریه مجموعه های ناهموار به کار گرفته شده است. کار ما بر خوشه‌بندی اطلاعات جریان ترافیک بر اساس تجزیه و تحلیل رابطه خاکستری برای قضاوت در موقعیت‌های تراکم ترافیک تمرکز دارد [ 3].

مقاله بصورت زیر مرتب شده است. ابتدا، خلاصه‌ای از کارهای مرتبط قبلی در بخش 2 ارائه می‌کنیم . سپس، نحوه ساخت مدل خوشه‌بندی رابطه‌ای خاکستری را در بخش 3 معرفی می‌کنیم . در بخش 4 ، الگوریتم خوشه‌بندی درجه عضویت رابطه خاکستری (GMRC) توضیح داده شده است. سپس، نتایج تجربی را در بخش 5 نشان می‌دهیم . در نهایت، مقاله را در بخش 6 به پایان می‌رسانیم .

2. کارهای مرتبط

2.1. نظریه های مرتبط

کار ما به ویژه شامل نظریه سیستم خاکستری است. تئوری سیستم خاکستری توسط پروفسور جولونگ دنگ در سال 1982 ارائه شد و شامل جنبه های بسیاری مانند نسل خاکستری، تجزیه و تحلیل خاکستری، مدل سازی خاکستری و پیش بینی خاکستری می شود [ 4] .]. این تئوری به طور گسترده در پردازش تصویر، امنیت شبکه و مدیریت لجستیک استفاده شده است. علاوه بر این، تجزیه و تحلیل رابطه خاکستری نه تنها یک جنبه مهم از نظریه خاکستری است، بلکه یک نوع روش اندازه گیری برای مطالعه شباهت داده ها است. این تحلیل همچنین هیچ الزام دقیقی در مورد اندازه نمونه ندارد و معمولاً برای تجزیه و تحلیل و مقایسه اشکال هندسی منحنی ها که توسط چندین نقطه در فضا توصیف می شود استفاده می شود. هرچه به آرایه استاندارد ارجاع شده نزدیکتر باشد، درجه رابطه بین استاندارد مرجع بالاتر و رتبه آن بالاتر است. در ادامه، به طور خلاصه به معرفی نظریه مجموعه‌های خشن می‌پردازیم، که یک روش تئوری ریاضی است که برای پرداختن به اطلاعات نامشخص، غیر دقیق و مبهم استفاده می‌شود. این نظریه در یادگیری ماشین، داده کاوی، تجزیه و تحلیل تصمیم گیری و غیره کاربرد دارد. علاوه بر این، نظریه مجموعه های خشن شاخه مهمی از محاسبات عدم قطعیت است که شامل نظریه های دیگری مانند مجموعه های فازی، شبکه های عصبی و نظریه شواهد می شود. در این مقاله، ما اطلاعات ترافیک جاده‌ای شهری را با استفاده از خوشه‌بندی رابطه‌ای خاکستری تجزیه و تحلیل می‌کنیم و نتایج را با نظریه مجموعه‌های خشن برای ایجاد یک سیستم جدول تصمیم ترکیب می‌کنیم. در نهایت میزان تراکم ترافیک شهری را قضاوت می کنیم.

2.2. تکنیک های خوشه بندی

تجزیه و تحلیل خوشه بندی موضوع تحقیقات فعال در چندین زمینه مانند آمار، تشخیص الگو، یادگیری ماشین و داده کاوی است. هدف آن تقسیم تعداد زیادی از داده ها به زیر مجموعه ها یا گروه های مختلف است تا الزامات همگنی و ناهمگنی برآورده شود. همگنی مستلزم آن است که داده ها در یک خوشه باید تا حد امکان مشابه باشند و ناهمگنی به این معنی است که داده ها در خوشه های مختلف باید تا حد امکان متفاوت باشند.

در حال حاضر، تعدادی از روش‌های خوشه‌ای به طور گسترده مورد استفاده قرار گرفته‌اند، که در میان آنها یک الگوریتم تطبیقی وزن‌دار مبتنی بر رویکرد تعادل پیشنهاد شده است که در آن روش خاکستری به یک الگوریتم خوشه‌بندی طیفی [5] برای اندازه‌گیری شباهت بین داده‌ها معرفی می‌شود . نتایج تجربی نشان می‌دهد که الگوریتم پیشنهادی می‌تواند به طور موثر بر کاستی‌های خوشه‌بندی طیفی در مورد حساسیت پارامترها غلبه کند. الگوریتم خوشه بندی دیگری بر اساس آنتروپی که می تواند به طور خودکار تعداد خوشه ها را بر اساس ویژگی های توزیع نمونه داده تعیین کند و مشارکت کاربر را کاهش دهد در [ 6] پیشنهاد شد.]. نتیجه عینی تر است و الگوریتم می تواند خوشه های بزرگ و کوچک را با هر شکلی پیدا کند. از معایب الگوریتم می توان به انتخاب نقاط اولیه و اثرات نویز و نقاط پرت اشاره کرد. با این حال، این کاستی ها را می توان با غربالگری و پرداختن به نویز و نقاط پرت داده اصلی، حذف داده های نادرست و بهبود قابلیت اطمینان و جداسازی داده ها برای به حداقل رساندن تأثیر نویز و نقاط پرت برطرف کرد. این دو روش الهام بخش کار ما هستند به طوری که ما استفاده از رویکردی را برای ارزیابی جامع داده ها در نظر می گیریم. بنابراین، ما از نظریه رابطه خاکستری استفاده می کنیم، که می تواند به طور موثر داده های ویژگی چند بعدی را پردازش کند. با این حال، آن الگوریتم‌های سنتی عمدتاً یک خوشه‌بندی ساده از داده‌های مشابه هستند و در نظر نمی‌گیرند که چه ویژگی‌های داده‌ای چه ویژگی‌های شاخصی دارند. علاوه بر این،

2.3. الگوریتم K-Means و الگوریتم FCM

در حال حاضر، الگوریتم K-means و الگوریتم فازی C-Means (FCM) معمولاً برای خوشه بندی داده ها استفاده می شوند. ما این دو الگوریتم را در مقایسه با الگوریتم پیشنهادی خود در کار خود در نظر می گیریم. ابتدا، کار ما معرفی مختصری از الگوریتم K-means را ارائه خواهد کرد. الگوریتم K-means یک الگوریتم کلاسیک خوشه بندی است که به طور گسترده در زمینه های موضوعی مختلف استفاده می شود. علاوه بر این، الگوریتم های مختلف بهبود یافته بر اساس الگوریتم K-means تکامل یافته اند. با این حال، الگوریتم K-means یک مسئله بهینه سازی NP-hard است (به طور کلی، مسائلی که برای حل آنها زمان چند جمله ای هزینه دارد و پرداختن به آنها آسان است معمولاً به عنوان مسائل P در نظر گرفته می شوند. مسائل دشوار و به عنوان مسائل NP-hard شناخته می شوند.7 ]. فاصله اقلیدسی معمولاً به عنوان تابع معیار الگوریتم K-means استفاده می شود، جایی که گاهی اوقات فاصله بین دو نقطه داده با واحدهای مختلف محاسبه می شود. فاصله اقلیدسی فاصله واقعی بین دو نقطه در فضای m-بعدی است و عمدتاً توسط عناصر با نوسان شدید تعیین می شود. عناصر کمی نوسان اغلب نادیده گرفته می شوند و این پدیده با افزایش نسبت تفاوت بین عناصر متناظر آشکارتر می شود.

الگوریتم FCM نوعی الگوریتم خوشه بندی فازی بر اساس تابع هدف است. ابتدا مفهوم فازی را معرفی می کنیم: فازی عدم قطعیت است. علاوه بر این، معمولاً می گوییم یک شی همان چیزی است که مسلم است. با این حال، عدم قطعیت شباهت بین دو شی را نشان می دهد [ 8 ، 9]. برای مثال، ما بیست سالگی را معیاری برای قضاوت در مورد جوان بودن یا نبودن یک فرد می‌دانیم. بنابراین، یک فرد 21 ساله بر اساس این تقسیم یقین، جوان نیست; با این حال، 21 سالگی به نظر ما بسیار جوان است. بنابراین، در این لحظه، ما می‌توانیم به طور مبهم به این احتمال فکر کنیم که یک فرد 21 ساله متعلق به 90٪ جوان و متعلق به غیر جوان به عنوان 10٪ است. در اینجا 90% و 10% احتمال نیستند. بلکه درجه تشابه هستند. اگرچه الگوریتم FCM می تواند به طور موثر خوشه بندی را انجام دهد، اما رتبه ای را که خوشه بندی به آن تعلق دارد متمایز نمی کند.

با توجه به مشکلات فوق، ما روابط اطلاعات جریان ترافیک را با ویژگی‌های مختلف از طریق خوشه‌بندی رابطه‌ای خاکستری استخراج می‌کنیم. علاوه بر این، ما الگوریتم GMRC را برای قضاوت در مورد اولویت خوشه‌بندی پیشنهاد می‌کنیم. به طور همزمان، ما الگوریتم های K-means و FCM خوشه بندی را ترکیب می کنیم و نتایج را با نتایج الگوریتم GMRC برای ارزیابی عملکرد الگوریتم خود مقایسه می کنیم.

3. مدل خوشه بندی رابطه ای خاکستری

در این مقاله، فرض می‌کنیم که وضعیت تراکم ترافیک جاده‌ها به چهار رتبه (نه چهار خوشه) تقسیم می‌شود، یعنی هموار، گیر سبک، گیر و جم سنگین، که پیش‌شرط ما است، جایی که صاف بهترین حالت را نشان می‌دهد، متعلق به رتبه اول، و مربا سنگین مشخصه بدترین وضعیت، متعلق به رتبه چهارم است. با توجه به توصیف تعاریف مختلف ازدحام ترافیک، تراکم ترافیک تنها به پارامترهای خاصی مربوط نمی شود [ 10]] (مانند حجم ترافیک و سرعت ترافیک) اما شامل عوامل بسیاری نیز می شود. بنابراین، تنها یک پارامتر مورد استفاده برای توصیف وضعیت‌های تراکم ترافیک کافی نیست: وقتی سرعت وسیله نقلیه صفر است، ممکن است توسط وسایل نقلیه زیادی در جاده مسدود شود که نمی‌توانند حرکت کنند یا ممکن است صاف باشد و هیچ وسیله نقلیه‌ای در جاده رانندگی نمی‌کند. بنابراین، یک جریان ترافیکی سبک می‌تواند با دو حالت مطابقت داشته باشد: ترافیک سنگین و روان. علاوه بر این، تراکم کم ممکن است ترافیکی را مشخص کند که روان است و همچنین ممکن است کامیون های بیشتری و سایر وسایل نقلیه بزرگ در جاده را شامل شود. با این حال، تجزیه و تحلیل جامع از سه متغیر جریان ترافیک (سرعت جریان ترافیک، تراکم جریان ترافیک و حجم ترافیک) می‌تواند وضعیت واقعی ترافیک را منعکس کند. هدف ما ارزیابی میزان ترافیک جاده های مختلف بر اساس شاخص چند ویژگی است. بدین ترتیب، ما سه متغیر جریان ترافیک را برای ارزیابی میزان ترافیک معرفی می کنیم. با این حال، برای رسیدگی به داده‌های ویژگی‌های ترکیبی چند بعدی و به‌دست آوردن سطوح خوشه‌بندی داده‌ها، از نظریه تحلیل رابطه خاکستری استفاده می‌کنیم.

جریان های ترافیکی با سه ویژگی [ 11 ] مشخص می شوند: سرعت جریان ترافیک، تراکم جریان ترافیک و حجم ترافیک. سرعت جریان ترافیک میانگین سرعت وسایل نقلیه در جاده را بر حسب کیلومتر در ساعت نشان می دهد. تراکم جریان ترافیک، یعنی تراکم وسایل نقلیه، تعداد وسایل نقلیه در واحد طول جاده را نشان می دهد. حجم ترافیک به عنوان تعداد وسایل نقلیه ای که از یک بخش جاده خاص در واحد زمان حرکت می کنند تعریف می شود. این مقاله از این سه ویژگی جریان ترافیک برای قضاوت در مورد وضعیت تراکم ترافیک استفاده می کند.

تعریف 1.

مجموعه داده های حوزه تحلیل را فرض کنید

X = {X_{i} | X_{i} = (X_{i 1}, X_{i 2}, X_{i 3})} i \in N

به عنوان مجموعه شی مقایسه ای، جایی که

X_{i}

ith شی داده را نشان می دهد که هر کدام دارای سه ویژگی است: سرعت جریان ترافیک، تراکم جریان ترافیک و حجم ترافیک.

تعریف 2.

فرض کنید یک آرایه استاندارد مرجع به صورت تنظیم شده است

Y = {Y_{i} | Y_{i} = (Y_{i 1}, Y_{i 2}, Y_{i 3})} (i = 1, 2, \dots, p)

(مجموعه اشیاء مرجع). ما اطلاعات جریان ترافیک (زمانی که جاده در حالت صاف است یا وسایل نقلیه با سرعت جریان آزاد حرکت می کنند) را به عنوان یک مجموعه آرایه استاندارد مرجع در نظر می گیریم.

هر گروه از یک دنباله مرجع می تواند یک نتیجه خوشه بندی را زمانی که با یک شی مقایسه ای با روش خوشه بندی رابطه ای خاکستری ترکیب می شود به دست آورد. بنابراین، گروه‌های p از آرایه‌های مرجع، نتایج خوشه‌بندی p را تولید خواهند کرد . علاوه بر این، گروه استانداردهای مرجع استخراج‌شده از داده‌ها برای خوشه‌بندی زمانی که با مجموعه‌های شی مقایسه‌ای ترکیب می‌شود، استفاده می‌شود که می‌تواند یک نتیجه خوشه‌بندی ایجاد کند. بنابراین، در کل فرآیند، می توانیم نتایج خوشه بندی p + 1 را به دست آوریم.

تعریف 3.

اطلاعات ارزیابی M به عنوان اطلاعات خروجی سیستم خوشه بندی رابطه خاکستری S در نظر گرفته می شود و F به عنوان تابع ارزیابی تعریف می شود. سپس، رابطه بین S و M به صورت نشان داده می شود

{S = ((X, Y), G) F : X \times Y \to M

(1)

که در آن G نشان دهنده ماتریس مشابه رابطه خاکستری است. تابع ارزیابی F مدل فوق از سیستم جدول تصمیم تئوری مجموعه‌های خشن برای سنجش میزان مشارکت اعضای خوشه در نتایج خوشه‌بندی استفاده می‌کند. F را تابع عضویت رابطه ای خاکستری نیز می نامند که ورودی های آن X و Y و خروجی M است که شباهت بین عناصر داخل یک کلاس و شباهت بین کلاس ها را منعکس می کند.

در این مقاله، ما الگوریتم GMRC را جهت داده‌های ویژگی چند بعدی برای قضاوت در اولویت رتبه‌بندی خوشه‌بندی پیشنهاد می‌کنیم. روش این روش شامل پیش پردازش داده ها، تبدیل داده ها به فرم ماتریس، تنظیم آستانه، و فیلتر کردن و حذف اشیاء داده غیرعادی است. سپس، اشیاء داده حوزه تحلیل را از طریق تجزیه و تحلیل خوشه‌بندی رابطه‌ای خاکستری خوشه‌بندی می‌کنیم و سپس تحلیل تصمیم‌گیری وزنی را از نظریه مجموعه‌های خشن اعمال می‌کنیم. در نهایت، نتایج خوشه بندی با استفاده از نظریه احتمال محاسبه می شود.

4. الگوریتم GMRC

معماری الگوریتم GMRC از مراحل زیر تشکیل شده است ( شکل 2 ):

با توجه به ویژگی شاخص سه ویژگی داده های جریان ترافیک، استاندارد مرجع بهینه از مجموعه داده های حوزه تحلیل استخراج می شود. سپس، استاندارد مرجع بهینه و مجموعه آرایه مرجع برای محاسبه درجه رابطه خاکستری در ترکیب با مجموعه داده حوزه تحلیل استفاده می شود. پس از آن، ماتریس رابطه خاکستری را می توان به دست آورد، و اعضای خوشه را می توان محاسبه کرد. در مرحله بعد، از نظریه مجموعه‌های خشن استفاده می‌کنیم، جایی که اعضای خوشه اعمال می‌شوند، و جدول اطلاعات تصمیم را برای تکمیل ترکیب وزن اعضای خوشه می‌سازیم، که بر اساس آن باید رتبه هر شی داده را با استفاده از نظریه احتمال محاسبه کنیم. ما دسته اول را بالاترین اولویت می دانیم،

4.1. مراحل خوشه بندی رابطه ای خاکستری

4.1.1. استخراج استاندارد مرجع بهینه با توجه به ویژگی های داده های جریان ترافیک

از آنجایی که مشکل تجزیه و تحلیل خوشه بندی بر اساس یک سیستم شاخص معین حل می شود، انتخاب شاخص مناسب برای دستیابی به خوشه بندی معقول و مناسب بسیار مهم است. برای هر کدام سه ملک وجود دارد

X_{i}

از یک منبع داده، و بر اساس ویژگی شاخص شی داده، استاندارد مرجع بهینه

X_{0}

می توان از منبع داده استخراج کرد. دستورالعمل های خاص به شرح زیر است.

ما می دانیم که سه واحد ویژگی متفاوت است. بنابراین، ابتدا باید داده ها را به همان فرمت تبدیل کنیم. “↑” نشان می دهد که ارزش دارایی بیشتر و در نتیجه بهتر است. “↓” نشان دهنده مخالفت است. (a ، b )، که در آن a و b اعداد هستند، نشان می دهد که اگر مقدار ویژگی یک شی داده در این بازه باشد، مقدار بهتر خواهد بود.

استاندارد مرجع بهینه را استخراج کنید

X_{0}

با توجه به ویژگی های سه گانه، و بیان آن است

X_{0} = {X_{01}, X_{02}, X_{03}}

، که به شرح زیر است:

با در نظر گرفتن مشخصه سرعت جریان ترافیک به صورت “↑”، استفاده می کنیم

X 0 j = max X i j (i \in N, j = 1)

(2)

با در نظر گرفتن مشخصه تراکم جریان ترافیک به صورت “↓”، استفاده می کنیم

ایکس 0 j = دقیقه ایکس من ج (من \in N j = 2)_

(3)

با در نظر گرفتن مشخصه حجم جریان ترافیک به صورت “↓”، استفاده می کنیم

ایکس0 j= {ایکسمن ج| دقیقه∣∣∣ایکسمن ج–( a + b )2∣∣∣ ( من ∈ Nj = 3 ) } _�0�={���|min|���−(�+�)2| (�∈�,�=3)}

(4)

4.1.2. پردازش عادی سازی داده ها

از آنجایی که داده ها انواع مختلفی دارند، واحدها نیز متفاوت هستند. با توجه به ویژگی‌های ویژگی‌ها، داده‌های حوزه تحلیل با معیارهای مختلف پردازش می‌شوند و داده‌ها به (۰، ۱) فشرده می‌شوند. پردازش به شرح زیر است:

برای سرعت جریان ترافیک کل مجموعه داده، استفاده می کنیم

ایکس من (j) = ∣ ∣ ∣ ایکس من ج - ایکس j m i n ایکس j m a x - ایکس j m i n ∣ ∣ ∣ (i = 0, 1, \dots, n, j = 1)

(5)

برای چگالی جریان ترافیک کل داده ها، ما استفاده می کنیم

ایکس من (j) = ∣ ∣ ∣ ایکس من ج - ایکس j m a x ایکس j m a x - ایکس j m i n ∣ ∣ ∣ (i = 0, 1, \dots, n, j = 2)

(6)

برای حجم ترافیک کل مجموعه داده، استفاده می کنیم

ایکسمن( j ) =⎧⎩⎨⎪⎪1- _∣∣ایکسمن ج–ایکس0 jایکس0 j∣∣،  ∣∣ایکسمن ج–ایکس0 jایکس0 j∣∣≤ 1 a n d  i = 0 ، 1 ، … ، n ، j = 30 ,  ∣∣ایکسمن ج–ایکس0 jایکس0 j∣∣> 1 روز _ _  i = 0 ، 1 ، … ، n ، j = 3ایکسمن(�)={1–|ایکسمن�–ایکس0�ایکس0�|،  |ایکسمن�–ایکس0�ایکس0�|≤1 آ�د من=0،1،…،�،�=30،  |ایکسمن�–ایکس0�ایکس0�|>1 آ�د من=0،1،…،�،�=3

(7)

X_{i j}

عنصر ماتریس اصلی در معادلات (5)-(7) بالا است و به نرمال می شود

X_{i} (j)

، جایی که

X_{j m a x}

نشان دهنده حداکثر ستون j ام و

X_{j m i n}

حداقل ستون j را نشان می دهد و هر چیزی در داخل مهاربندها شرط محدود کننده است. پس از نرمال سازی، ماتریس های ( p + 1) را به دست می آوریم ، یعنی:

A_{0}, A_{1}, \dots, A_{p}

جایی که

A_{0}

می توان با عادی سازی استاندارد مرجع بهینه به دست آورد

X_{0}

و مجموعه شی مقایسه ای. در همین حال،

A_{1}, A_{2}, \dots, A_{p}

را می توان با عادی سازی مجموعه آرایه ارجاع شده و مجموعه شی مقایسه ای، که در آن به دست آورد

A_{0}

A_{p}

به عنوان تعریف می شوند

A 0 = ⎡⎣⎢⎢⎢⎢⎢⎢⎢ X 1 (1) X 2 (1) \dots X 1 (2) X 2 (2) \dots X 1 (3) X 2 (3) \dots X n (1) X 0 (1) X n (2) X 0 (2) X n (3) X 0 (3) ⎤⎦⎥⎥⎥⎥⎥⎥⎥ A p = ⎡⎣⎢⎢⎢⎢⎢⎢⎢ X 1 (1) X 2 (1) \dots X 1 (2) X 2 (2) \dots X 1 (3) X 2 (3) \dots X n (1) Y p (1) X n (2) Y p (2) X n (3) Y p (3) ⎤⎦⎥⎥⎥⎥⎥⎥⎥

(8)

آخرین ردیف ماتریس

A_{0}

به دنباله استاندارد مرجع بهینه و آخرین ردیف ماتریس نرمال می شود

A_{p}

آرایه استاندارد مرجع نرمال شده pth است .

4.1.3. محاسبه درجه رابطه خاکستری و تولید ماتریس مشابه رابطه خاکستری

(1) درجه رابطه خاکستری نشان دهنده درجه بالای بین دو شیء مقایسه است. به عنوان مثال، ما بر محاسبه درجه رابطه خاکستری ماتریس تمرکز می کنیم

A_{0}

. فرمول ها به شرح زیر است (معادلات (9) و (10)):

γ 0 i (k) = min i min k | X 0 ( k ) - X i ( k ) | + σ max i max k | X 0 ( k ) - X i ( k ) | | X 0 ( k ) - X i ( k ) | + σ max i max k | X 0 ( k ) - X i ( k ) | (k = 1, 2, 3)

(9)

γ 0 i = 1 m \sum k = 1 m γ 0 i (k)

(10)

جایی که $σ$ ضریب تفکیک است که محدوده ای از 0 تا 1 دارد. به طور کلی، ما آن را فرض می کنیم $σ$ 0.5 است. $γ_{o i} (k)$ ضریب همبستگی بین $X_{i}$ و $X_{0}$ در نقطه kth درجه رابطه خاکستری با بیان می شود $γ_{o i} (k)$ ، جایی که $X_{0}$ به عنوان دنباله مرجع و $X_{i}$ به عنوان دنباله مقایسه ای در نظر گرفته می شود. به طور مشابه، ما می توانیم به دست آوریم $γ_{i j}$ چه زمانی $X_{i}$ به عنوان دنباله مرجع و $X_{j}$ به عنوان دنباله مقایسه ای در نظر گرفته می شود. سپس، $X_{1}, X_{2}, \dots, X_{n}, X_{0}$ به عنوان دنباله مرجع در نظر گرفته می شوند. در همین حال، دنباله های ( n + 1) به عنوان دنباله های مقایسه ای در نظر گرفته می شوند (دنباله های ( n + 1) نه تنها دنباله های مرجع هستند، بلکه دنباله های مقایسه ای نیز هستند). در نهایت، ماتریس درجه رابطه خاکستری را محاسبه می کنیم $Γ_{(n + 1) \times (n + 1)}^{0}$ با توجه به تجزیه و تحلیل رابطه خاکستری، که در آن $Γ_{(n + 1) \times (n + 1)}^{0}$ بر اساس A ₀ به دست می آید و از هر یک تشکیل می شود $γ_{i j}$ $(i = 1, 2, \dots, n, n + 1, j = 1, 2, 3)$ . به طور مشابه، ما می توانیم ماتریس های درجه رابطه خاکستری را محاسبه کنیم $Γ^{1}, Γ^{2}, \dots, Γ^{p}$ بر اساس $A_{0}, A_{1}, \dots, A_{p}$ .

(2) ماتریس G مشابه رابطه ای خاکستری را محاسبه کنید

ما عناصر تشابه را محاسبه می کنیم

g_{i j} = (γ_{i j} + γ_{j i}) / 2

در جی . به عنوان مثال، G ₀ ماتریس مشابه خاکستری رابطه ای است که زمانی به دست می آید

X_{0}

به عنوان دنباله ارجاع شده در نظر گرفته می شود، و عناصر شباهت رابطه ای خاکستری ( n + 1) ردیف G ₀ زمانی محاسبه می شود که

X_{0}

به عنوان دنباله مرجع بهینه در نظر گرفته می شود. به طور مشابه، ما می توانیم ماتریس های مشابه رابطه ای p + 1 خاکستری را بدست آوریم:

G_{0}, G_{1}, \dots, G_{p}

4.1.4. تجزیه و تحلیل خوشه بندی درجه رابطه ای خاکستری

بر اساس G ، یعنی ماتریس مشابه رابطه ای خاکستری، درخت رابطه ای حداکثری را می سازیم که از مقادیر آخرین عناصر ردیف در G تشکیل شده است . این در شکل 3 نشان داده شده است .

بر اساس G ₀ می توانیم بدست آوریم

g_{i j}

که به آن درجه نزدیکی بین نیز می گویند

X_{i}

X_{j}

. بزرگتر

g_{i j}

است، نزدیک تر است

X_{i}

X_{j}

هستند؛ متقابلا،

X_{i}

X_{j}

برای کاهش دورتر هستند

g_{i j}

. بر اساس شکل 3 ، درخت رابطه ای حداکثر با درجه نزدیکی تولید می شود، همانطور که در شکل 4 نشان داده شده است ، جایی که

a_{i}

نشان دهنده درجه نزدیکی بین

X_{i}

X_{j}

بر اساس شکل 4 ، ضریب نقطه ایزوله را تنظیم می کنیم

λ

، که در بازه (0، 1) است. درخت را زمانی قطع می کنیم که درجه نزدیکی کمتر از

λ

و هنگامی که شاخه های مجاور تفاوت های اساسی را نشان می دهند. بنابراین، درخت قطع شده برای اینکه شاخه‌های متصل آن k سطح از خوشه‌ها را در امتداد افقی تشکیل دهند، استفاده می‌شود . ما نزدیکترین شاخه را به عنوان اولین سطح و شل ترین شاخه را به عنوان سطح k در نظر می گیریم (اگر k ≥ 4 باشد، شاخه پنجم، شاخه ششم، شاخه هفتم و حتی شاخه k ام را نیز به عنوان رتبه چهارم طبقه بندی می کنیم. بگوییم صاف مربوط به رتبه اول و مربا سنگین مربوط به رتبه چهارم است). بنابراین، به این ترتیب، می توانیم عضو خوشه ای از G را به دست آوریم . بنابراین، استفاده می کنیم

Γ^{0}, Γ^{1}, \dots, Γ^{p}

برای محاسبه p + 1 ماتریس شباهت رابطه ای خاکستری

G_{0}, G_{1}, \dots, G_{p}

، که از آن می توانیم رابطه نزدیکی بین هر شی را پیدا کنیم. بنابراین، می توانیم نتایج خوشه بندی p + 1، یعنی اعضای خوشه را به دست آوریم.

4.2. ایجاد تابع ارزیابی برای سیستم خوشه‌بندی رابطه‌ای خاکستری

با توجه به نتایج خوشه‌بندی اولیه بالا، ما از نظریه مجموعه‌های خشن برای ایجاد سیستم جدول تصمیم استفاده می‌کنیم که برای وزن دادن سهم اعضای خوشه به نتایج خوشه‌بندی و وزن دادن به اعضای خوشه اعمال می‌شود.

4.2.1. تشریح نحوه ایجاد سیستم جدول تصمیم

ابتدا استاندارد مرجع بهینه و مجموعه استاندارد مرجع با مجموعه شی مقایسه ای از طریق روش خوشه بندی رابطه خاکستری ترکیب می شوند تا سیستم جدول تصمیم را بسازند.

F = 〈 U, C, D, V, f 〉

،جایی که

U = {X_{1}, X_{2}, \dots, X_{n}}

داده های حوزه تجزیه و تحلیل را نشان می دهد.

C = {c_{1}, c_{2}, \dots, c_{p}}

ویژگی های شرطی هستند و اعضای خوشه ای هستند که توسط مجموعه استاندارد مرجع تشکیل شده اند.

D = {d}

به عنوان ویژگی تصمیم گیری، عضو خوشه ای است که با استفاده از استاندارد مرجع بهینه به دست می آید.

V = V_{C} \cup ​ V_{D}, V_{C} = \cup ​ V_{c_{h}}, c \in C

محدوده مجموعه ای از ویژگی های جریان ترافیک هستند که در آن

V_{c_{h}}

نشان دهنده سطح در عضو خوشه است

c_{h}

(h = 1, 2, …, p) ; f نشان دهنده تابع ارزیابی است،

f : U \times (C \cup^{​} D) \to V

; و

f (X_{i}, c_{h}) \in V_{c_{h}}

نشان دهنده سطح است

X_{i}

در عضو خوشه

c_{h}

4.2.2. محاسبه آنتروپی اطلاعات

در سیستم جدول تصمیم، وزن آنتروپی اطلاعات

I (c_{h}, D)

نشان می دهد که عضو خوشه چقدر مهم است

c_{h}

(اطلاعات مشروط) برای نتیجه D (اطلاعات تصمیم گیری) زمانی است که استاندارد مرجع بهینه برای محاسبه عضو خوشه انتخاب شود. با توجه به آنتروپی اطلاعات نظریه مجموعه های خشن،

I (c_{h}, D)

به شرح زیر است:

من (ج ، د) = H (D) - H (D | {c})

(11)

H (c) = - \sum i = 1 k P (R C i) l o g (P (R C i))

(12)

H (D | {c}) = - \sum i = 1 k P (R D i | R C i) l o g (P (R D i | R C i))

(13)

پ (ر سی من) = | آر سی من | | ایکس |

(14)

پ (ر D من | آر سی من) = ∣ ∣ آر D من \cap را آر سی من ∣ ∣ | آر سی من |

(15)

جایی که $i = 1, 2, \dots, k$ ( k تعداد خوشه ها است) $R C_{i}$ نشان دهنده امین خوشه تقسیم شده عضو خوشه c است ، $| R C_{i} |$ تعداد عناصر در خوشه i را نشان می دهد و $| X | = n$ . یک ویژگی شرطی بزرگتر c برای اطلاعات تصمیمی D مهمتر است . علاوه بر این، $H (c)$ و $H (D | {c})$ توسط آنتروپی اطلاعات شرطی نظریه مجموعه های خشن تعیین می شوند. بنابراین، وزن نسبی هر یک از اعضای خوشه را می توان تعیین کرد، و یک عضو خوشه مهم تر با وزن بیشتر مطابقت دارد.

4.3. محاسبه سطح عضویت خوشه بندی اشیاء داده

مرحله 1: اهمیت آنتروپی اطلاعات ویژگی را محاسبه کنید

E_{h} = I (c_{h}, D)

برای هر عضو خوشه

c_{h}

در سیستم تصمیم گیری، جایی که

h = 1, 2, \dots, p

مرحله 2: وزن نسبی هر یک از اعضای خوشه را تنظیم کنید:

ω ساعت = E ساعت / \sum h = 1 پ E ساعت

(16)

مرحله 3: از نظریه احتمال برای محاسبه احتمال ظهور هر شی داده در هر خوشه بندی بر اساس وزن های نسبی استفاده کنید تا سطحی را انتخاب کنید که در آن احتمال به حداکثر می رسد. علاوه بر این، نتایج خوشه بندی نهایی را به دست آورید. علاوه بر این، شی داده

X_{i}

متعلق به سطح j

(j = 1, 2, \dots, k)

به عنوان … تعریف شده است

پ (ایکس j من) = \sum h = 1 م من ک = j پ w ساعت

(17)

جایی که $M_{i k}$ سطح شی داده را نشان می دهد $X_{i}$ در عضو خوشه $c_{h}$ ، که در خوشه بندی رابطه ای خاکستری محاسبه شده است. بنابراین، سطح درجه عضویت رابطه خاکستری از $X_{i}$ را می توان به صورت زیر بیان کرد:

L e v e l (ایکس من) = {j | m a x j = 1 \to k (P (X j i))}

(18)

نتیجه نهایی این است

C = {C^{1}, C^{2}, \dots, C^{k}}

، جایی که

C^{k}

شامل تمام اشیاء داده‌ای است که سطح درجه عضویت رابطه‌ای خاکستری آن سطح k ام است :

C k = {X i | L e v e l (X i) = k, X i \in X}

(19)

4.4. توضیحات الگوریتم GMRC

در این مقاله، ما مشکل خوشه‌بندی اطلاعات چند بعدی را برای جریان ترافیک مطالعه کرده و الگوریتم GMRC را پیشنهاد می‌کنیم. ابتدا مجموعه داده را به شکل ماتریسی تبدیل می کنیم، استاندارد مرجع بهینه را از مجموعه داده استخراج می کنیم و سپس پردازش نرمال شده را برای حذف اثرات واحدهای مختلف انجام می دهیم. علاوه بر این، نتایج خوشه‌بندی اولیه را با توجه به تحلیل نظریه رابطه خاکستری به دست می‌آوریم. در نهایت، یک سیستم جدول تصمیم برای محاسبه وزن نسبی برای هر عضو خوشه ایجاد می کنیم. الگوریتم به شرح زیر است.

ورودی:: مجموعه داده های دامنه تجزیه و تحلیل $X = {X_{i} | X_{i} = (X_{i 1}, X_{i 2}, X_{i 3})} i \in N$ ،

مجموعه آرایه مرجع $Y = {Y_{i} | Y_{i} = (Y_{i 1}, Y_{i 2}, Y_{i 3})} (i = 1, 2, \dots, p)$ .
خروجی:: مجموعه سطح (رتبه) اشیاء داده حوزه تجزیه و تحلیل

الگوریتم 1: GMRC (X,Y)

1: سطح = پوچ; وزن = صفر عضو = null; آنتروپی = پوچ.

// مقداردهی اولیه مجموعه ها Level, Weight; عضو ماتریس، آنتروپی
2: Data_ Preprocessing (X,Y); // پیش پردازش داده ها
3: X ₀ = ExtractOptimal (X); // استاندارد مرجع بهینه را استخراج کنید
4: S = عادی سازی (X,Y); // پردازش عادی سازی
5: T = MaxRelTrees (S) // حداکثر درخت های رابطه ای را بسازید
6: T’ = ClosenessTrees (T) // حداکثر درخت رابطه ای را با درجه نزدیکی بسازید
7: عضو ₀ = GrayCluster (X,X ₀ )؛ // X ₀ را به عنوان استاندارد مرجع برای محاسبه عضو خوشه در نظر بگیرید
8: Foreach (Y _i در Y)
9: عضو _i = خوشه خاکستری (X,Y _i ); // Y _{i را} به عنوان استاندارد مرجع برای محاسبه عضو خوشه در نظر بگیرید
10: پایان
11: F = DecisionSystem (اعضا)؛ // سیستم جدول تصمیم F را ایجاد کنید
12: آنتروپی = CalculateEntropy (F); // محاسبه آنتروپی اطلاعات برای هر عضو خوشه
13: وزن = محاسبه وزن (آنتروپی)؛ // محاسبه وزن نسبی برای هر عضو خوشه
14: CalculateLevel (X)؛ // سطح درجه عضویت X _i در X را محاسبه کنید

مراحل بالا از الگوریتم به شرح زیر است:

مرحله 1: پارامترها را راه اندازی کنید، داده های جریان ترافیک را از قبل پردازش کنید، آستانه را برای فیلتر کردن و حذف اشیاء داده غیرعادی تنظیم کنید (خطوط 1 و 2).

مرحله 2: با توجه به ویژگی های سه ویژگی داده های جریان ترافیک، استاندارد مرجع بهینه را از داده های حوزه تحلیل استخراج کنید (خط 3).

مرحله 3: مجموعه داده های حوزه تحلیل را در ترکیب با توالی های استاندارد مرجع (خط 4) عادی کنید.

مرحله 4: درجه رابطه خاکستری ماتریس مربوطه را محاسبه کنید. علاوه بر این، ماتریس‌های شباهت رابطه‌ای خاکستری را تعیین کنید و سپس حداکثر درخت‌های رابطه‌ای را بر اساس عناصر ردیف (n + 1) آن ماتریس‌ها بسازید ( خط 5 ).

مرحله 5: بر اساس مرحله 4، حداکثر درخت رابطه ای را با درجه نزدیکی بسازید (خط 6).

مرحله 6: درجه نزدیکی را بین اشیاء داده مقایسه کنید، وقتی درجه نزدیکی کمتر از آن است درخت را قطع کنید

λ

و شاخه های مجاور تفاوت های زیادی را نشان می دهند و سپس k سطح نتایج خوشه بندی را به دست می آورند. به طور مشابه، در مجموع اعضای خوشه p + 1 را از آرایه های ارجاع شده p + 1 به دست می آوریم (خطوط 7-10).

مرحله 7: سیستم جدول تصمیم را بر اساس اعضای خوشه p به عنوان ویژگی های شرطی به دست آمده از مجموعه آرایه استاندارد مرجع ایجاد کنید. علاوه بر این، تنها عضو خوشه به دست آمده از استاندارد مرجع بهینه (خط 11) به عنوان ویژگی تصمیم گیری در نظر گرفته می شود.

مرحله 8: محاسبه آنتروپی اطلاعات اعضای خوشه برای تصمیم گیری، که برای سنجش سهم هر یک از اعضای خوشه در نتایج خوشه بندی استفاده می شود (خط 12).

مرحله 9: وزن هر یک از اعضای خوشه را محاسبه کنید (خط 13).

مرحله 10: احتمال ظهور هر شی داده در هر خوشه بندی را محاسبه کنید. سپس، سطحی را انتخاب کنید که احتمال به حداکثر برسد. علاوه بر این، نتایج خوشه بندی نهایی را به دست آورید (خط 14).

4.5. تابع عضویت رابطه خاکستری

عملکرد نتایج خوشه بندی سنتی به فاصله بین عناصر داخل کلاس ها و فاصله بین کلاس ها بستگی دارد. فاصله‌های کوتاه‌تر بین عناصر داخل یک کلاس نشان‌دهنده کلاس‌های بهتر است. در مقابل، فاصله های طولانی تر بین کلاس ها نشان دهنده کلاس های بهتر است [ 12 ]. هدف ما از خوشه بندی به دست آوردن رتبه درجه عضویت کلاس ها و قضاوت در مورد رتبه اشیاء داده است. بنابراین، ما یک تابع عضویت می سازیم که شباهت بین عناصر داخل یک کلاس و شباهت بین کلاس ها را بر اساس درجه شباهت رابطه خاکستری منعکس می کند. فرض کن که

γ_{X, Y}

به عنوان درجه شباهت رابطه خاکستری بین شی نشان داده می شود

X

و اعتراض

Y

، و

C = {C^{1}, C^{2}, \dots, C^{k}}

نشان دهنده خوشه های تقسیم شده است.

S_{C}

، که برای وزن کردن تقسیم استفاده می شود

C

، به عنوان … تعریف شده است

S c = 1 k \sum i = 1 k 1 | C i | \times | C i | \sum X, Y \in C i γ X Y + 1 k ( k - 1 ) \sum i = 1 k (\sum i = 1, l \neq i k 1 | C i | \times | C l | \sum X \in C i, Y \in C l γ X Y)

(20)

5. نتایج تجربی و تجزیه و تحلیل

در این مقاله، ما داده‌های ترافیکی را برای جاده‌های اصلی نانجینگ جمع‌آوری کردیم، که مناطق تجاری اصلی را به هم متصل می‌کند و شامل حجم ترافیک بالا و مناطق مسکونی با تراکم بالا است. این جاده ها باید قبل از ایجاد ترافیک به موقع پاکسازی شوند. به طور کلی، روال روزانه افراد بسیار منظم است [ 13]: صبح به سر کار بروید و هنگام غروب به خانه بروید. با این حال، این می تواند به سرعت منجر به ازدحام ترافیک در ساعات شلوغی شود. یک مطالعه قبلی اشاره کرد که یک پارامتر واحد، مانند سرعت، که برای توصیف وضعیت‌های تراکم ترافیک استفاده می‌شود، کافی نیست. برای به دست آوردن دانش دقیق برای قضاوت تراکم ترافیک، تجزیه و تحلیل جامع از سه متغیر جریان ترافیک برای تعیین وضعیت جریان ترافیک می تواند برای انعکاس شرایط واقعی جاده برای پیش بینی ترافیک [14] استفاده شود .]. برای آزمایش الگوریتم خود، به طور تجربی داده‌های جریان ترافیک را از 50 نقطه نظارتی در امتداد جاده‌های اصلی نانجینگ در بازه‌های زمانی تقریباً 7:00 تا 9:30 صبح و 4:30 تا 7:00 بعد از ظهر، که مطابق با ساعات شلوغی است، جمع‌آوری کردیم. علاوه بر این، ما 30 راننده با بیش از پنج سال تجربه رانندگی را به عنوان آزمایش‌کننده انتخاب کردیم و فیلم‌های رانندگی وسیله نقلیه آنها را تماشا کردیم تا ارزیابی آن‌ها را از چهار حالت جریان ترافیک (هموار، گیر کردن سبک، گیر کردن و گیر کردن سنگین) بدست آوریم [15 ] . سپس، ما نتایج خوشه‌بندی را ارزیابی کردیم تا دقت الگوریتم خود را در مقایسه با سایر روش‌های خوشه‌بندی مانند الگوریتم K-means و الگوریتم FCM تأیید کنیم.

در این آزمایش ما ضریب تفکیک را فرض کردیم

σ

از آنجایی که الگوریتم ماهیت تصادفی دارد، میانگین نتایج 20 آزمون برای هر الگوریتم در هر مجموعه داده به عنوان نتایج تجربی استفاده می شود. جدول 1 آنتروپی اطلاعات مربوط به چهار عضو خوشه را نشان می دهد که توسط نمونه داده های خوشه بندی اولیه به دست آمده است، یعنی وزن نسبی اعضای خوشه. برای تأیید عملکرد الگوریتم ما، شش نقطه نمونه به طور تصادفی از مجموعه داده انتخاب شدند، همانطور که در جدول 2 نشان داده شده است . در جدول 2، متوجه شدیم که خوشه بندی وضعیت ترافیک بیشترین ارتباط را با سرعت جریان ترافیک دارد. با این حال، سرعت نمی تواند به طور کامل وضعیت ترافیک را تعیین کند. به عنوان مثال، سرعت جریان ترافیک در گروه 459 40.3 کیلومتر در ساعت است و حالت ترافیک سبک است. با این حال، سرعت جریان ترافیک در گروه 812 45.5 کیلومتر در ساعت است که بیشتر از 40.3 کیلومتر در ساعت است، اما حالت حالت گیر کرده است. این پدیده عمدتاً به این دلیل رخ می دهد که حجم ترافیک دومی بیشتر از اولی است. سه ویژگی جریان ترافیک باید به طور جامع در نظر گرفته شود نه فقط سرعت.

5.1. تحلیل پیچیدگی

فرض می کنیم k سطح، n شی داده، m ابعاد و p توالی استاندارد ارجاع داده شده است. پیچیدگی الگوریتم GMRC در ادامه توضیح داده شده است.

5.1.1. تحلیل پیچیدگی زمانی

زمان ساخت ماتریس اولیه است

O (m \times n)

. استخراج استاندارد مرجع بهینه مستلزم دسترسی به تمام عناصر در ماتریس اولیه است و پیچیدگی زمانی نیز وجود دارد.

O (m \times n)

. پیچیدگی زمانی نرمال سازی ماتریس است

O (p \times n \times m)

. محاسبه درجه رابطه خاکستری نیاز به دسترسی به تمام عناصر موجود در n ماتریس درجه تشابه رابطه خاکستری دارد. بنابراین پیچیدگی زمانی آن تقریباً است

O (n \times m \times p \times n)

. پیچیدگی زمانی مرتب‌سازی عناصر درجه رابطه خاکستری ردیف ( n + 1) برای ماتریس‌های درجه تشابه رابطه خاکستری p است.

O (p \times n^{2})

. محاسبه آنتروپی اطلاعات برای نیازهای اعضای خوشه

O (p \times k)

. زمان مورد نیاز برای محاسبه داده های حوزه تحلیل درجه عضویت خوشه بندی می باشد

O (n \times p \times k)

. با توجه به تحلیل فوق، میانگین پیچیدگی زمانی الگوریتم GMRC است

O (k \times m \times p \times n^{2})

5.1.2. تحلیل پیچیدگی فضا

پیچیدگی تجزیه و تحلیل ماتریس اولیه دامنه است

O (m \times n)

در فضا، و پیچیدگی تحلیل ماتریس درجه تشابه با پیچیدگی فضا است

O (p \times n^{2})

. علاوه بر این، پیچیدگی فضایی تعیین درجه عضویت رابطه خاکستری در الگوریتم GMRC است.

O (k \times p)

. بنابراین، پیچیدگی فضای کل الگوریتم است

O (k \times p \times n^{2})

5.2. تاثیر ضریب نقطه ایزوله λ بر نتایج خوشه بندی

از شکل 5 ، می توان دریافت که بر اساس تعداد مختلف نمونه داده، مقدار تابع عضویت رابطه خاکستری به تدریج با افزایش افزایش می یابد.

λ

. زیرا با افزایش

λ

، درجه شباهت رابطه خاکستری بین عناصر داخل کلاس ها افزایش می یابد و این موقعیت غالب را به حساب می آورد. واضح است، چه زمانی

λ

بین 0.84 و 0.87 است، مقدار تابع حداکثر شده است. سپس، به عنوان

λ

به تدریج افزایش می یابد، مقدار تابع کاهش می یابد. این به این دلیل است که درجه شباهت رابطه خاکستری بین کلاس ها موقعیت غالب را اشغال می کند. از منظر درجه تشابه رابطه خاکستری بین اشیاء داده، درجه نزدیکی را در داخل کلاس ها و در بین کلاس ها تجزیه و تحلیل می کنیم و به طور کامل از ویژگی اطلاعات چند بعدی و تغییر کلی در سه ویژگی برای توصیف بهتر درجه نزدیکی بین اشیاء داده استفاده می کنیم. بنابراین، در آزمایش بعدی، محدوده از

λ

به عنوان (0.84، 0.87) تنظیم شده است.

5.3. مقایسه با سایر الگوریتم ها

شکل 6 میزان دقت الگوریتم های خوشه بندی GMRC، K-means و FCM را در هر کلاس نشان می دهد. ما متوجه شدیم که دقت GMRC در هر کلاس و در زیر متفاوت است

λ

بالاتر از الگوریتم های K-means و Fuzzy است. این به این دلیل است که الگوریتم GMRC از ویژگی شاخص ویژگی داده برای محاسبه درجه شباهت رابطه خاکستری استفاده می کند و کیفیت اعضای خوشه را در نظر می گیرد. بنابراین، الگوریتم به طور موثر شباهت کلاس داخلی را برای دستیابی به خوشه بندی رتبه بندی شده بهبود می بخشد.

شکل 7 میانگین دقت الگوریتم GMRC ما را در موارد مختلف نشان می دهد

λ

و الگوریتم های K-means و FCM. از شکل 6 و شکل 7 ، می توان نتیجه گرفت که میانگین دقت الگوریتم GMRC بیشتر از الگوریتم های K-means و FCM است. علاوه بر این، میانگین دقت الگوریتم GMRC 24.9 درصد بیشتر از الگوریتم K-means و 30.8 درصد بیشتر از الگوریتم FCM است. علاوه بر این، الگوریتم جدید ما پایداری بهتری را نشان می‌دهد. از آنجا که الگوریتم ما نیازی به انتخاب تصادفی نقطه مرکزی اولیه ندارد، همانطور که در الگوریتم K-means، پایداری الگوریتم تحت تأثیر ماهیت تصادفی الگوریتم قرار نمی گیرد.

6. نتیجه گیری

قضاوت در مورد وضعیت‌های ازدحام ترافیک، پیش‌فرض و مبنایی برای هشدار تراکم ترافیک پویا، راهنمایی‌های ترافیکی، اجتناب فعالانه از تراکم ترافیک و تضمین جاده‌های هموار است. با این حال، ترافیک معمولا با تجربه قضاوت می شود. این مقاله داده‌های جریان ترافیک را جمع‌آوری می‌کند و روش قضاوت مؤثرتری ارائه می‌دهد. ما هر دو تجزیه و تحلیل رابطه خاکستری و نظریه مجموعه خشن را به الگوریتم GMRC معرفی می کنیم و درجه عضویت در خوشه بندی اشیاء داده را با استفاده از اطلاعات جامع در مورد داده ها می سنجیم. در این فرآیند، ما حداکثر درخت رابطه ای را با درجه نزدیکی می سازیم و درجه نزدیکی را بین اشیاء داده مقایسه می کنیم. زمانی درخت را قطع می کنیم که درجه نزدیکی کمتر از

λ

و زمانی که شاخه های مجاور تفاوت های زیادی از خود نشان می دهند. در نتیجه، p را بدست می آوریم+ 1 عضو خوشه. در مرحله بعد، ما یک سیستم جدول تصمیم را بر اساس اعضای خوشه p به عنوان ویژگی های شرطی به دست آمده از مجموعه های آرایه استاندارد مرجع ایجاد می کنیم. سپس، احتمال ظهور هر شی داده در هر خوشه بندی را محاسبه می کنیم، زمانی که احتمال به حداکثر می رسد، رتبه را انتخاب می کنیم و در نهایت نتایج خوشه بندی نهایی را به دست می آوریم. بنابراین، الگوریتم ما شکاف های موجود در ادبیات را پر می کند که به موجب آن الگوریتم های K-means و FCM نمی توانند متمایز کنند که یک خوشه بندی به کدام رتبه تعلق دارد. نتایج تجربی نشان می‌دهد که الگوریتم پیشنهادی که ویژگی‌های شی داده‌های چند بعدی را در نظر می‌گیرد، یک الگوریتم برتر است. در مرحله بعد، ما قصد داریم شباهت رابطه خاکستری را به دیگر الگوریتم ها اعمال کنیم و پیچیدگی محاسباتی الگوریتم را کاهش دهیم.

منابع

کورتنی، RL دیدگاهی گسترده از استانداردهای آن در ایالات متحده در مجموعه مقالات کنفرانس IEEE در مورد سیستم های حمل و نقل هوشمند، بوستون، MA، ایالات متحده، 9-12 نوامبر 1997. صص 529-536.
ازدحام آرنولد، ED، جونیور در بزرگراه های شهری ویرجینیا. در دسترس آنلاین: http://ntl.bts.gov/DOCS/arnold.html (در 17 آوریل 1998 قابل دسترسی است).
Mok، PY; هوانگ، مقر; Kwok، YL; Au, JS یک روش تحلیل خوشه‌بندی تطبیقی قوی برای شناسایی خودکار خوشه‌ها. تشخیص الگو 2012 ، 45 ، 3017-3033. [ Google Scholar ] [ CrossRef ]
یو، بی. ژو، ز. Xie, M. مدل درجه همبستگی جامع خاکستری جدید و کاربرد آن. تکنولوژی اقتصاد 2013 ، 32 ، 108-114. [ Google Scholar ]
هو، اف. Xia، G.-S. وانگ، ز. هوانگ، ایکس. ژانگ، ال. Sun، H. یادگیری ویژگی های بدون نظارت از طریق خوشه بندی طیفی تکه های چند بعدی برای طبقه بندی صحنه های سنجش از راه دور. IEEE J. Sel. بالا. Appl. زمین Obs. Remote Sens. 2015 ، 8 ، 2015–2030. [ Google Scholar ]
لی، ک. خوشه بندی فازی Li، P. با آنتروپی تعمیم یافته بر اساس شبکه عصبی. در یکسان سازی مهندسی برق و مهندسی الکترونیک ; Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2014; ص 2085–2091. [ Google Scholar ]
ژانگ اچ، آر. Zhang، F. تحقیق و بهبود الگوریتم خوشه بندی سنتی K-means. J. Xianyang هنجار. دانشگاه 2010 ، 25 ، 138-144. [ Google Scholar ]
ژنگ، ی. جئون، بی. خو، دی. وو، QMJ؛ ژانگ، اچ. تقسیم‌بندی تصویر با الگوریتم C-means فازی سلسله مراتبی. جی. اینتل. سیستم فازی 2015 ، 28 ، 961-973. [ Google Scholar ]
لی، ک. Cui, L. یک الگوریتم خوشه‌بندی فازی هسته با آنتروپی تعمیم یافته بر اساس نمونه وزنی. بین المللی J. Adv. محاسبه کنید. Res. 2014 ، 4 ، 596-600. [ Google Scholar ]
ون، اچ. سان، ج. ژانگ، ایکس. مطالعه در مورد الگوهای تراکم ترافیک شهرهای بزرگ در چین، پکن را به عنوان مثال. Procedia-Soc. رفتار علمی 2014 ، 138 ، 482-491. [ Google Scholar ] [ CrossRef ]
استفانلو، اف. بوریول، LS; هیرش، ام جی; پردالوس، PM; کوئریدو، تی. Resende، MGC; Ritt, M. در مورد به حداقل رساندن تراکم ترافیک در شبکه های جاده ای با عوارض. ان اپراتور Res. 2015 . [ Google Scholar ] [ CrossRef ]
گوان، ایکس. سان ایکس، دبلیو. او، Y. یک الگوریتم جدید ارتباط ویژگی مبتنی بر درجه همبستگی خاکستری و اندازه گیری فاصله. رادار Sci. تکنولوژی 2013 ، 4 ، 363-367، 374. [ Google Scholar ]
او، اچ. تانگ، کیو. لیو، زی. رویکرد پیش‌بینی تصحیح تطبیقی برای جریان ترافیک شهری براساس خوشه‌بندی C-Mean فازی و شبکه عصبی پیشرفته. J. Appl. ریاضی. 2013 ، 2013 ، 633-654. [ Google Scholar ]
لو، ایکس. آهنگ، ز. خو، ز. Sun، W. تشخیص تراکم ترافیک شهری بر اساس تجزیه و تحلیل خوشه‌بندی داده‌های ترافیک در زمان واقعی. J. Geo-Inf. علمی 2012 ، 14 ، 775-780. [ Google Scholar ] [ CrossRef ]
الفتریادو، ال. سرینیواسان، س. Steiner, RL; تایس، کامپیوتر; لیم، ک. معیارهای عملکرد حمل و نقل گسترده برای تکمیل سطح خدمات (LOS) برای مدیریت رشد و تجزیه و تحلیل تأثیر حمل و نقل. ازدحام. مدیریت سیستم 2012 ، 19 ، 977-991. [ Google Scholar ]

شکل 1. منطقه شبکه حمل و نقل نانجینگ در بافت جغرافیایی آن.

شکل 2. معماری الگوریتم خوشه بندی درجه عضویت رابطه ای خاکستری (GMRC).

شکل 3. درخت رابطه ای حداکثر.

شکل 4. درخت رابطه ای حداکثر با درجات نزدیکی.

شکل 5. تابع عضویت رابطه ای خاکستری به عنوان تابعی از λ .

شکل 6. مقایسه میزان دقت هر کلاس در بین الگوریتم های GMRC، K-means و FCM.

شکل 7. مقایسه میانگین نرخ دقت در بین الگوریتم GMRC با λ و الگوریتم‌های K-means و FCM.

جدول 1. وزن نسبی اعضای خوشه.

جدول 2. نمونه های تصادفی.

© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب