خلاصه
:
با استقرار گسترده منابع حسگر زمین، هوا و فضا (اینترنت اشیا یا اینترنت اشیا، شبکههای اجتماعی، شبکههای حسگر)، کاربردهای یکپارچه دادههای مکانی بیدرنگ از حسگرهای همهجا، به ویژه در حوزه امنیت عمومی و شهر هوشمند، در حال تبدیل شدن به مسائل چالش برانگیز سیستم اطلاعات جغرافیایی سنتی (GIS) عمدتاً داده های مکانی گسسته زمانی را با استفاده از سیستم مدیریت پایگاه داده زبان پرس و جو ساختاریافته (SQL) مدیریت می کند و بر پرس و جو و بازیابی داده های جغرافیایی تاریخی عظیم روی دیسک تأکید می کند. این قابلیت آن را برای دسترسی در حین پرواز به داده های مکانی هم زمان برای تجزیه و تحلیل آنلاین در زمان واقعی محدود می کند. این مقاله یک رویکرد سازماندهی و مدیریت پایگاه داده ترکیبی با پایگاه داده های رابطه ای SQL (RDB) و نه تنها پایگاه های داده SQL (NoSQL) (شامل پایگاه داده حافظه اصلی، MMDB، و سیستم فایل های توزیع شده، DFS) پیشنهاد می کند. این رویکرد ترکیبی از مزایای NoSQL و SQL DBMS برای دسترسی بلادرنگ به دادههای ورودی و نتایج تجزیه و تحلیل ساختیافته در جریان استفاده کامل میکند که میتواند الزامات افزایش تحلیل پیوند دادههای بزرگ مکانی-زمانی را برآورده کند. MMDB دسترسی بلادرنگ به آخرین دادههای ورودی مانند وب حسگر و اینترنت اشیا را تسهیل میکند و از پرس و جوی بلادرنگ برای تجزیه و تحلیل جغرافیایی آنلاین پشتیبانی میکند. RDB اطلاعات تغییر مانند ویژگی های چند وجهی و رویدادهای غیرعادی استخراج شده از داده های ورودی بلادرنگ را ذخیره می کند. DFS روی دیسک، داده های عظیم مکانی را مدیریت می کند، و معماری ذخیرهسازی قابل توسعه و زمانبندی توزیعشده یک پایگاه داده NoSQL، الزامات عملکرد ذخیرهسازی افزایشی و دسترسی همزمان چند کاربره را برآورده میکند. مطالعه موردی نظارت تصویری جغرافیایی (GeoVideo) بر امنیت عمومی برای اثبات امکانسنجی این سازماندهی و رویکرد مدیریت ترکیبی ارائه شده است.
کلید واژه ها:
داده های مکانی در زمان واقعی ؛ NoSQL ; RDBMS ; مدیریت داده ها ؛ امنیت عمومی ؛ پایگاه داده های ترکیبی ; GeoVideo
1. معرفی
با استقرار گسترده منابع حسگر زمین، هوا و فضا (اینترنت اشیا یا اینترنت اشیا، شبکههای اجتماعی و شبکههای حسگر)، کاربردهای یکپارچه دادههای مکانی بیدرنگ از حسگرهای همهجا به مسائل چالش برانگیز تبدیل شدهاند، به ویژه در مورد عمومی. مدیریت امنیت و مدیریت تسهیلات شهر هوشمند و ویژگیهای موجود دستههای 4 ولت (حجم، سرعت، تنوع و ارزش) [ 1 ، 2]. با توجه به پیشرفت سریع ابزارهای جمعآوری دادهها و تکنیکهای اینترنتی، نسل جدیدی به نام «عصر دادههای بزرگ» ظاهر شده و تأثیر قابلتوجهی بر تحقیقات علوم فضایی گذاشته است. چالشهای بزرگ در بایگانی، بازیابی و استخراج دادههای حسگر بدون ساختار و مجموعه دادههای تولید شده توسط کاربر به طور موثر برای درک و درک آنی باقی میماند [ 3 ، 4 ].
سیستم اطلاعات جغرافیایی سنتی (GIS) با استفاده از تداوم دادههای جغرافیایی و به دنبال آن توسعه و ادغام بیشتر در پایگاههای اطلاعاتی رابطهای تجاری (RDBs) مانند Oracle و MySQL، «عکس فوری» از جهان جغرافیایی را در یک لحظه در قالبی ساختاریافته نقشهبرداری میکند. توابع کاربردی درخواستی بر روی سوابق پایگاه داده “منسوخ” [ 5 ] عمل می کنند. به دلیل تنگنای ورودی/خروجی (I/O) و تأخیر بالا برای حفظ ثبات در RDB، عکس فوری «جاری» در پایگاههای اطلاعاتی GIS همچنان با دادههای ورودی بلادرنگ از دنیایی که دائماً در حال تغییر است، هماهنگ نیست. [ 6 ، 7]. این توانایی آن را برای دسترسی به اطلاعات مکانی بیدرنگ برای تحلیل آنلاین در زمان واقعی محدود میکند. در همین حال، RDB به سختی میتواند قابلیت ذخیرهسازی کافی را در مدیریت دادههای مکانی بزرگ با رشد سریع فراهم کند، زیرا طرح گسترش سیستم «مقیاسسازی» است، که نیازمند ارتقاء مکرر دستگاههای ذخیرهسازی است [8 ] . علاوه بر این، حالت «اول ذخیره، سپس محاسبه» ورودی بدون ساختار افزایشی دادههای بزرگ را به صورت چند تایی با مقدار زیادی دادههای نامعتبر یا تکراری ذخیره میکند، که نه تنها فشار قابلتوجهی بر ذخیرهسازی افزایشی و زمانبندی کارآمد وارد میکند، بلکه نمیتواند الزامات را برآورده کند. افزایش تحلیل پیوند دادههای بزرگ مکانی-زمانی در مطالعات GIS مبتنی بر دادههای بزرگ [ 9 ، 10]. بنابراین، روشهای سنتی سازماندهی و مدیریت دادههای مکانی با استفاده از پایگاههای اطلاعاتی GIS مبتنی بر RDB نمیتوانند از تحلیل آنلاین در زمان واقعی پشتیبانی کنند.
برای رسیدگی به مسائل فوق، نه تنها سیستم های مدیریت پایگاه داده SQL (NoSQL) (DBMS) به عنوان یک راه حل جدید در حال ظهور هستند. پایگاه داده های اصلی NoSQL را می توان از نظر مدل ذخیره سازی داده به چهار دسته طبقه بندی کرد: ذخیره کلید-مقدار، ذخیره اسناد، ذخیره ستون و ذخیره گراف. ظهور NoSQL DBMS با تقاضای فوری برای مدیریت تولید مداوم، حجم زیاد و فرمتهای بدون ساختار دادههای بلادرنگ، با ویژگیهای اصلی دسترسی کم تأخیر، توسعهپذیری و هزینه کم سختافزار/نرمافزار/کار همراه بود [ 11 , 12 ، 13]. برای مثال، هائو و همکاران. از سیستم فایل Hadoop (HDFS) برای ذخیره داده های جریان چندحسگر در زمان واقعی از اینترنت اشیا برای ردیابی اشیاء، مانند ردیابی افراد در فضاهای داخلی با استفاده از شناسایی فرکانس رادیویی (RFID) استفاده کرد [14 ] . کانگ و همکاران یک مدل مخزن داده یکپارچه با حسگر را با استفاده از MongoDB برای ادغام منابع داده ناهمگن اینترنت اشیا مانند RFID، حسگر و سیستم های موقعیت یابی جهانی (GPS) و بهینه سازی یک کلید خرد برای به حداکثر رساندن سرعت پرس و جو و توزیع یکنواخت داده بر روی سرورهای داده پیشنهاد کرد [15 ] . وان و همکاران عملکرد خواندن/نوشتن دادههای حسگر را بین Cassandra و MongoDB مقایسه کرد و به این نتیجه رسید که Cassandra برای مقادیر نسبتاً بزرگتری از دادههای حسگر انتخاب خوبی است، در حالی که MongoDB برای مقادیر کمتری از دادههای حسگر خوب است [16] .]. کیم و همکاران از Redis برای حل ترافیک بالای خدمات وب در دسترسی همزمان استفاده کرد [ 17 ]. اگرچه این DBMS های NoSQL مزایای نوشتن/پرس و جوی با کارایی بالا را برای داده های ورودی زمان واقعی حجم زیاد ارائه می دهند، یک رویکرد جدید برای سازماندهی داده های مکانی بلادرنگ برای مقابله با داده های ورودی بلادرنگ و در حال رشد سریع مورد نیاز است. نتایج تجزیه و تحلیل پرواز برای پردازش جغرافیایی بلادرنگ.
در مقایسه با دادههای ورودی بلادرنگ، که مشکلات مربوطه عمدتاً بر تأخیر کم نوشتن و جستجوی دادهها با حجم زیاد و همچنین ذخیرهسازی سریع در حال رشد متمرکز است، مشکلاتی که باید برای رسیدگی به تجزیه و تحلیل در حین پرواز حل شوند. نتایج عمدتاً به توانایی پرس و جوهای انعطاف پذیر و پردازش تراکنش مربوط می شود. اگرچه RDB برای ذخیره سازی داده های ساخت یافته و پردازش تراکنش برجسته هستند، اما به سختی می توانند عملکرد کافی را در مدیریت داده های بزرگ با رشد سریع به دلیل طرح گسترش سیستم “مقیاس سازی” ارائه دهند [15] .]. پایگاههای داده NoSQL به عنوان مکمل RDB مجموعهای از ویژگیهایی را ارائه میکنند که RDB نمیتواند ارائه کند، مانند مقیاسپذیری افقی، حافظه و نمایه توزیعشده، اصلاح دینامیکی طرحواره داده، و غیره. آنها میتوانند دادههای بدون ساختار را بهطور کارآمد ذخیره کنند، زیرا قابلیت تغییر طرحواره دادهها آسان است. به دلیل طرح “scale-out” به هزینه گسترش سرور کمتری نسبت به RDB نیاز دارند. با این حال، پایگاه داده NoSQL فاقد محدودیت اتمی کامل، سازگاری، جداسازی و دوام (ACID) و پشتیبانی از پرس و جوهای پیچیده، پردازش تراکنش و عملیات پیوستن است [18 ] . بنابراین، امکان استفاده مصنوعی از ویژگیهای پایگاههای داده NoSQL و SQL برای پشتیبانی از ذخیرهسازی، پرس و جو و محاسبات بیدرنگ برای دادههای مکانی بلادرنگ وجود دارد.
برای ایجاد پایههای تحلیل آنلاین GIS در زمان واقعی، این دستنوشته یک رویکرد سازماندهی و مدیریت پایگاه داده ترکیبی از پایگاههای داده RDB و NoSQL پایگاه داده SQL (شامل پایگاه داده حافظه اصلی، MMDB، و سیستمهای فایل توزیع شده، DFS) ارائه میکند. این رویکرد ترکیبی از مزایای NoSQL و SQL DBMS برای دسترسی بلادرنگ به دادههای ورودی و نتایج تجزیه و تحلیل ساختیافته در جریان استفاده کامل میکند. MMDB دسترسی بلادرنگ به آخرین دادههای ورودی مانند وب حسگر و اینترنت اشیا را تسهیل میکند و از پرس و جوی بلادرنگ برای تجزیه و تحلیل جغرافیایی آنلاین پشتیبانی میکند. RDB اطلاعات تغییر مانند ویژگی های چند وجهی و رویدادهای غیرعادی استخراج شده از داده های ورودی بلادرنگ را ذخیره می کند. DFS روی دیسک، داده های عظیم مکانی را مدیریت می کند، و معماری ذخیرهسازی قابل توسعه و زمانبندی توزیعشده یک پایگاه داده NoSQL، الزامات عملکرد ذخیرهسازی افزایشی و دسترسی همزمان چند کاربره را برآورده میکند. رویکرد پیشنهادی قابلیت مدیریت دادههای مکانی با حجم بالا را ارائه میدهد و الزامات افزایش تحلیل پیوند دادههای بزرگ مکانی-زمانی را برآورده میکند. این تحقیق به جامعه تحقیقاتی کمک می کند تا مطالعات GIS مبتنی بر داده های بزرگ را به روشی کارآمدتر و سازنده تر انجام دهند. تجزیه و تحلیل موردی نظارت تصویری جغرافیایی (GeoVideo) از امنیت عمومی برای اثبات امکانسنجی این سازماندهی و رویکرد مدیریت ترکیبی ارائه شده است. رویکرد پیشنهادی قابلیت مدیریت دادههای مکانی با حجم بالا را ارائه میدهد و الزامات افزایش تحلیل پیوند دادههای بزرگ مکانی-زمانی را برآورده میکند. این تحقیق به جامعه تحقیقاتی کمک می کند تا مطالعات GIS مبتنی بر داده های بزرگ را به روشی کارآمدتر و سازنده تر انجام دهند. تجزیه و تحلیل موردی نظارت تصویری جغرافیایی (GeoVideo) از امنیت عمومی برای اثبات امکانسنجی این سازماندهی و رویکرد مدیریت ترکیبی ارائه شده است. رویکرد پیشنهادی قابلیت مدیریت دادههای مکانی با حجم بالا را ارائه میدهد و الزامات افزایش تحلیل پیوند دادههای بزرگ مکانی-زمانی را برآورده میکند. این تحقیق به جامعه تحقیقاتی کمک می کند تا مطالعات GIS مبتنی بر داده های بزرگ را به روشی کارآمدتر و سازنده تر انجام دهند. تجزیه و تحلیل موردی نظارت تصویری جغرافیایی (GeoVideo) از امنیت عمومی برای اثبات امکانسنجی این سازماندهی و رویکرد مدیریت ترکیبی ارائه شده است.
ادامه مقاله به شرح زیر تدوین شده است. بخش 2 رویکرد سازماندهی و مدیریت ترکیبی NoSQL-SQL را تشریح می کند. بخش 3 داده های GeoVideo را در زمان واقعی به عنوان یک مطالعه موردی برای نشان دادن جریان داده و الگوریتم های کلیدی در رویکرد پیشنهادی می گیرد. بخش 4 چندین مجموعه آزمایش مقایسه ای را گزارش می کند که برای نشان دادن مزایای رویکرد پیشنهادی انجام شده است. بخش 5 نتیجه گیری مطالعه و کاربردهای این تحقیق را تشریح می کند.
2. رویکرد سازماندهی و مدیریت ترکیبی NoSQL–SQL برای دادههای مکانی بیدرنگ
2.1. NoSQL–SQL DBMS Hybrid Storage Architecture
این بخش معماری ذخیرهسازی رویکرد پیشنهادی را توصیف میکند که از مزایای NoSQL و SQL DBMS برای دسترسی بلادرنگ به دادههای ورودی و نتایج تحلیل ساختیافته در جریان استفاده کامل میکند. مفهوم نوآورانه اصلی رویکرد پیشنهادی، مدیریت جریان داده اطلاعات تغییرات مکانی-زمانی است و از عنصر تغییر برای اتصال سه پایگاه داده استفاده میکند. شکل 1 چارچوب سه نوع NoSQL-SQL DBMS را نشان می دهد. سه زیرساخت نقش های متفاوتی به شرح زیر انجام می دهند:
- (1)
-
MMDB ساختاری برای دسترسی است. این برنامه از نوشتن بلادرنگ و پرس و جو از آخرین داده های ورودی پشتیبانی می کند و داده های تاریخی را پس از پیش پردازش به صورت دسته ای در DFS همگام می کند.
- (2)
-
RDB بخش ثانویه است. نتایج تجزیه و تحلیل ساختیافته و تغییر اطلاعات استخراجشده از دادههای ورودی را ذخیره میکند، از مکانیزم ماشهای برای شناسایی رویدادهای غیرعادی در زمان واقعی استفاده میکند، و بهطور آنی رویدادها را به اشیاء و ماژولهای جغرافیایی مرتبط با مکانیسم پیام «اشتراک/انتشار» تحویل میدهد. برای پردازش جغرافیایی پویا
- (3)
-
DFS بخش اصلی است. این داده های مکانی تاریخی با حجم زیاد افزایشی را با توزیع یکنواخت و یک محیط ذخیره سازی مقیاس پذیر ذخیره می کند.
2.1.1. MMDB برای دسترسی در زمان واقعی
با انباشته شدن دادههای مکانی عظیم بلادرنگ، کارایی دسترسی برای پردازش جغرافیایی بلادرنگ به دلیل تنگناهای ورودی/خروجی و مصرف زیاد برای نگهداری شاخص مکانی-زمانی به شدت کاهش مییابد. علاوه بر این، دادههای مکانی-زمانی اصلی دارای یک مقدار داده توزیعشده ناهموار با مقدار زیادی دادههای نامعتبر یا تکراری هستند که نیاز به پیش پردازش دارند، به عنوان مثال استخراج اطلاعات، پاکسازی دادهها و حذف موارد تکراری. به عبارت دیگر، فقط دادههای مکانی-زمانی معتبر بیدرنگ تکرار نشده ارزش سریالسازی را دارند. حالت سنتی «ابتدا ذخیره، سپس محاسبه» در SQL DBMS مقیم دیسک، دادههای بزرگ ورودی اصلی را ابتدا به صورت چند تایی ذخیره میکند، سپس دادههای فعلی را برای اجرای پیشپردازش و در نهایت بهروزرسانی دادههای از پیش پردازش شده، جستجو میکند، که نه تنها فشار زیادی بر توان عملیاتی دیسک وارد میکند. ،
سرعت خواندن/نوشتن حافظه به طور قابل توجهی سریعتر از دیسک است، بنابراین حافظه اصلی انتخاب خوبی برای مدیریت داده های ورودی بلادرنگ برای پرس و جو و پیش پردازش در یک محدودیت زمانی خاص است. به دلیل منابع محدود حافظه و یک جریان داده بی نهایت، ذخیره کل جریان داده در فضای حافظه محدود غیرممکن است. بنابراین، یک پنجره کشویی برای ذخیره جدیدترین داده های توالی و همگام سازی داده های از پیش پردازش شده در ذخیره سازی دائمی در دسته باز می شود. در مقایسه با حافظه نهان، MMDB دارای مزایای پایداری قوی، همزمانی بالا و مقیاس پذیری است. با این حال، MMDB موجود (مانند Redis و Cassandra) به پایگاه داده NoSQL تعلق دارد که با ثبات ضعیف مشخص می شود، به این معنی که فقط می تواند داده های اخیر را جستجو کند، نه درج داده ها در زمان واقعی. در مجموع، می توانیم از یک طول ثابت استفاده کنیم،
2.1.2. DFS برای داده های تاریخی افزایشی
حجم وسیعی از داده های مکانی-زمانی “منسوخ” باید روی دیسک ذخیره شود تا از داده کاوی بیشتر در آینده پشتیبانی شود. با تجمع دادههای افزایشی، محیطهای ذخیرهسازی متمرکز سنتی RDB مشکلات تنگناهای ورودی/خروجی و مقیاسپذیری غیرمقیاس را دارند که برای ذخیرهسازی در مقیاس بزرگ دادههای مکانی-زمانی مناسب نیستند. به عنوان یک نوع معمولی از پایگاههای داده NoSQL، DFS پرکاربرد (مانند سیستم فایل Hadoop، HDFS و MongoDB) دارای معماری سیستم مقیاسپذیر متشکل از چندین سرور ذخیرهسازی است که میتواند فشار بار ذخیرهسازی و زمانبندی دادههای مکانی-زمانی عظیم را متعادل کند. بسیاری از آزمایشها ثابت کردهاند که DFS مزایای عملکردی بیشتری نسبت به RDB دارد.
کلید خرد عامل اساسی برای تعیین توزیع یکنواخت ذخیره سازی داده بین چندین سرور ذخیره سازی در DFS است. با در نظر گرفتن Mongos خوشه MongoDB، انتخاب کلید خرده مناسب با محدوده اعداد بزرگ مانند مهر زمانی می تواند توانایی توزیع بهتری را ارائه دهد. ایجاد یک شاخص صعودی بر روی مهر زمانی میتواند آخرین دادهها را در حافظه پنهان نگه دارد و کارایی پرس و جو دادههای بلادرنگ را بهبود بخشد. علاوه بر این، تجمیع دادههای مکانی مرتبط با زمانی- مکانی در یک منطقه در همان سرور ذخیرهسازی میتواند کارایی پیشزمانبندی پرسوجوهای مکانی نزدیکترین همسایه را بهبود بخشد. انتخاب کلید ترکیبی متشکل از کلید صعودی (مانند مهر زمانی) و کلید جستجو (مانند هویت شبکه فضایی، ID) می تواند داده های محدوده مکانی-زمانی خاصی را در همان سرور ذخیره سازی جمع کند و آخرین داده ها را در حافظه پنهان نگه دارد. بنابراین، استفاده از DFS با یک کلید شارد ترکیبی بزرگ میتواند فشار عملیات خواندن/نوشتن و هزینه نگهداری فهرست را با استفاده از ذخیرهسازی توزیع شده و شاخص توزیعشده متعادل کند.
2.1.3. RDB برای داده های استخراج شده در پرواز
برای دادههای مکانی، استخراج اطلاعات خاص از قبل قبل از سریالسازی ضروری است. اطلاعات خاص شامل ارزش بهره، مقدار تغییر غیرعادی و ارزش هضم است. این سه نوع مقادیر سبک وزن هستند و ارزش داده های ورودی ناهمگن چند منبعی را استخراج می کنند، میزان ذخیره سازی را در یک رکورد کاهش می دهند و سرعت جستجوها را افزایش می دهند.
- (آ)
-
ارزش بهره مهم ترین اطلاعات داده های مکانی به صورت عدد و کاراکتر است. به عنوان مثال، ما معمولاً به برخی از اطلاعات کلیدی که در دادههای حسگر نهفته است، توجه میکنیم، مانند موقعیت فردی در ویدیوی نظارتی که به منطقه هشدار محصور نفوذ میکند.
- (ب)
-
مقدار تغییر غیرعادی مقدار بهره خاص خارج از محدوده است. این اطلاعات تغییر اغلب شامل «فیوز انفجاری» برای هدایت فرآیند تکامل محیط جغرافیایی و آنچه مردم بیشتر به آن اهمیت میدهند، میشود. به عنوان مثال، مقدار بهره ممکن است وضعیت یک خودرو را ثبت کند، اما تنها زمانی که خودرو در حال سرعت زیاد، توقف طولانی مدت، یا دور شدن از یک مسیر از پیش تعریف شده است، مقدار تغییر غیرعادی می تواند پلتفرم GIS ترافیک را به حرکت درآورد. اجرای دفع اضطراری
- (ج)
-
مقدار هضم روشی یکسان برای توصیف مختصر دادههای چندرسانهای مانند فیلمها، تصاویر، صداها و سیگنالها است که برای حذف و بازیابی مفید است [ 19 ]. به عنوان مثال، اگر دو فریم ویدیو یکسان باشند، مقادیر خلاصه تولید شده توسط الگوریتم Message Digest 5 (MD5) یکسان خواهد بود. بنابراین، هنگام بازیابی یک جریان ویدئو، فقط باید مقادیر خلاصه را با هم مقایسه کنیم و آن فریم های ویدئویی تکراری را نادیده بگیریم، که می تواند فشار زمان بندی را تا حد زیادی کاهش دهد.
همانطور که می دانیم، اطلاعات خاص استخراج شده از داده های ورودی بلادرنگ دارای ویژگی های چندوجهی، ساختار از پیش تعریف شده و الزامات پرس و جوی انعطاف پذیر است که برای ذخیره سازی چند تایی در RDB مناسب است. تشخیص تغییرات غیرعادی بلادرنگ برای پیاده سازی توسط تابع محاسباتی جاسازی شده “مکانیسم ماشه” در RDB بدون عملیات ورودی/خروجی خارجی مناسب است، و ما می توانیم مکانیسم پیام “اشتراک/انتشار” را در تریگر ادغام کنیم تا به طور فعال تغییر غیرعادی شناسایی شده را ارسال کنیم. اطلاعات به ماژول همبستگی برای پردازش بیشتر در زمان واقعی. با هدف ویژگیهای چند مدلی مقدار هضم، میتوانیم یک شاخص معکوس ایجاد کنیم که شامل یک شاخص هش بر روی تمام عناصر معنایی ویژگی استخراج شده از دادههای مکانی است تا از پرسوجوهای معنایی در حافظه با پیچیدگی زمانی O(1) پشتیبانی کند.
2.2. روش سازماندهی چند دانه بندی
روشهای سازمانی موجود عمدتاً بر ثبت وضعیت موجودیتها یا پدیدههای جغرافیایی بدون در نظر گرفتن ارتباط بین دادههای ورودی گسستهشده با زمان تمرکز میکنند. این امر به طور قابل ملاحظه ای ارزش داده ها و در دسترس بودن تجزیه و تحلیل GIS آنلاین بر اساس این داده ها را کاهش می دهد. با توجه به تئوری GIS بلادرنگ [ 20 ، 21 ]، ما سه نوع عنصر جغرافیایی را تعریف کردیم: اشیاء جغرافیایی، رویدادها و فرآیندها. هنگامی که مقدار بهره یک شی، محاسبه شده از دادههای مکانی بیدرنگ، از آستانه از پیش تعریفشده فراتر میرود، یک رویداد تولید و به اشیاء جغرافیایی مرتبط ارسال میشود تا ماژولها را برای دسترسی و تحلیل دادههای فرآیند بعدی فراخوانی کند.
- (آ)
-
شی جغرافیایی نشان دهنده نهاد نظارتی است، مانند شخص، وسیله نقلیه، منطقه یا شی مجازی. به عنوان مثال، داده های GPS در یک زمان معین منعکس کننده موقعیت یک تاکسی است. قاب ویدیوی نظارتی وضعیت امنیت عمومی یک جامعه را نشان می دهد. شیء جغرافیایی را می توان با ساختار شناسه شی، نام، نوع، طول عمر و توضیحات نمونه سازی کرد.
- (ب)
-
رویداد جغرافیایی نشان دهنده تغییر حالت غیرعادی یک شی جغرافیایی در یک لحظه خاص است. به عنوان مثال، اگر ماشین “A” بیش از حد مجاز در زمان “t1” رانندگی کند. ما می توانیم رویداد “OverSpeed” را که توسط نقطه مسیر با پارامتر سرعت در زمان “t1” برای شی “A” تجسم شده است ایجاد کنیم. یک رویداد جغرافیایی را میتوان با ساختار شناسه رویداد، نام، نوع، مهر زمانی، شناسه شی و اشارهگر به دادههای ورودی غیرعادی تغییر یافته نمونهسازی کرد.
- (ج)
-
فرآیند جغرافیایی نشاندهنده فعالیت یک شی جغرافیایی است که توسط رویداد ایجاد میشود، که با خوشهبندی توالی دادهها در طول یک یا چند دوره زمانی حول یک موضوع، تحقق مییابد. به عنوان مثال، مسیر یک تاکسی را می توان به چندین بخش فرآیندی تقسیم کرد که با معنای “حرکت” و “توقف” توصیف شده است. جریان داده سنسور سیل را می توان حداقل به سه دسته فرآیند «زیر سطح نرمال»، «سطح نرمال» و «بیش از حد نرمال» تقسیم کرد. فرآیند جغرافیایی را می توان با ساختار شناسه فرآیند، نام، نوع، دوره زمانی، شناسه شی، شناسه رویداد و یک اشاره گر به بخش داده، نمونه برداری کرد.
2.3. برنامه ریزی یکپارچه با طراحی ساختار شناسه یکنواخت
تقسیم بندی عناصر جغرافیایی ارتباط بین یکدیگر را جدا می کند. هنگام طراحی ساختار ID، ارائه ضمنی رابطه آن و حفظ منطقی یکپارچگی آن برای پشتیبانی از برنامه ریزی یکپارچه بین محیط های ذخیره سازی ترکیبی دشوار است. ساختار ID معمولی در پایگاه داده NoSQL MongoDB یکی از این نمونه ها است. کد شناسایی منحصر به فرد MongoDB شامل 12 بایت است که از ذخیره سازی توزیع شده پشتیبانی می کند. در میان آنها، 0-3 بایت مرجع زمانی را ذخیره می کند، تعداد مطلق ثانیه ها از 1 ژانویه 1970 00:00:00 UTC. 4-6 بایت شناسه سرور را ذخیره می کند که معمولاً یک مقدار هش نام دستگاه است. 7-8 بایت شناسه فرآیند نمونه MongoDB را ذخیره می کند. 9 تا 11 بایت عدد افزایشی را ذخیره می کند. اگرچه ساختار ID MongoDB منحصر به فرد بودن هر شناسه شی را تضمین می کند، دو مشکل وجود دارد که باید حل شود: (1) شناسه شی جغرافیایی، شناسه رویداد و شناسه فرآیند به طور جداگانه تولید می شوند و هیچ ارتباطی ندارند. بنابراین، رابطه نقشه برداری باید به طور کامل حفظ شود. (2) تکرار شناسه قابل شناسایی نیست. اگرچه ساختار ID تا حد زیادی منحصربهفرد بودن تولید را حفظ میکند، به دلیل نقص الگوریتم هش، ناگزیر احتمال تکرار کم وجود دارد. چنین طراحی ساختار شناسه باید تمام شناسه های شی را برای بررسی تکراری بودن طی کند. بنابراین، ساختار ID وقت گیر و ناکارآمد است. اگرچه ساختار ID تا حد زیادی منحصربهفرد بودن تولید را حفظ میکند، به دلیل نقص الگوریتم هش، ناگزیر احتمال تکرار کم وجود دارد. چنین طراحی ساختار شناسه باید تمام شناسه های شی را برای بررسی تکراری بودن طی کند. بنابراین، ساختار ID وقت گیر و ناکارآمد است. اگرچه ساختار ID تا حد زیادی منحصربهفرد بودن تولید را حفظ میکند، به دلیل نقص الگوریتم هش، ناگزیر احتمال تکرار کم وجود دارد. چنین طراحی ساختار شناسه باید تمام شناسه های شی را برای بررسی تکراری بودن طی کند. بنابراین، ساختار ID وقت گیر و ناکارآمد است.
بر اساس تجزیه و تحلیل بالا، این بخش یک ساختار ID جدید را همانطور که در شکل 2 نشان داده شده است، تعریف می کند.که عناصر جغرافیایی چند دانه بندی را به هم مرتبط می کند. مزیت این ساختار ID جدید، تشخیص سریع تکرار و پشتیبانی از تولید توزیع شده است. این ساختار ID 12 بایت را اشغال می کند و مقیاس پذیر است. در میان آنها، بایت 0 انواع فرآیند جغرافیایی، شی و رویداد را ذخیره می کند. اولین بایت بایت مدیریتی است که موقعیت ذخیره سازی این سه عنصر و نوع عنصر را متمایز می کند. بایت های 2-5 رابطه نگاشت بین سه عنصر را ذخیره می کنند. به عنوان مثال، بایت های 2-3 شناسه فرآیند جغرافیایی تعداد اشیاء جغرافیایی مرتبط را ذخیره می کند، بایت های 4-5 تعداد رویدادهای جغرافیایی مرتبط را ذخیره می کند. اگر مقدار این ناحیه “i” باشد، به این معنی است که این فرآیند حاوی عناصر جغرافیایی “i” است. تغییر مقدار این 2 بایت به محدوده [0, i – 1]، شناسه فرآیند جغرافیایی به شناسه منطقی عنصر جغرافیایی مربوطه تغییر می کند. سپس از یک جدول نگاشت برای تبدیل شناسه منطقی به شناسه عنصر جغرافیایی واقعی استفاده کنید. بایت های 6-7 یک عدد افزایشی را ذخیره می کنند و فضای کاری توزیع شده را شناسایی می کنند. فضای کاری حداقل واحد اداری برای مدیریت فرآیندها، اشیاء و رویدادهای جغرافیایی است. هر فضای کاری دارای شناسه های مختلفی در این سه بایت است، اما فرآیندها، اشیاء و رویدادها در همان فضای کاری دارای شناسه یکسان در آن بایت ها هستند. بررسی تکراری بودن بر اساس فضای کاری و پشتیبانی از تولید توزیع شده آسانتر است. بایت های 8 تا 11 عدد افزایشی را ذخیره می کنند. هر شناسه در هر نوع دارای مقدار متفاوتی در آن 4 بایت است. به طور کلی،
3. مطالعه موردی دادههای ژئوویدئوی بلادرنگ در DBMS هیبریدی NoSQL–SQL
GeoVideo دادههای مکانی معمولی بلادرنگ است که فریمهای ویدیو را در یک فضای جغرافیایی نگاشت میکند. در این بخش، نظارت تصویری امنیت عمومی را به عنوان مثال برای نشان دادن جریان داده های عظیم داده های GeoVideo بین پایگاه های داده معمولی NoSQL (MMDB Redis و DFS MongoDB) و پایگاه داده SQL (RDB MySQL) در نظر می گیریم.
3.1. جریان داده در پایگاه های داده ترکیبی
تشخیص حرکت در زمان واقعی و استخراج پیشزمینه رویههای حیاتی برای نظارت GeoVideo امنیت عمومی است که فریمهای ویدئوی اصلی را به عناصر جغرافیایی از جمله وسایل نقلیه مرجع جغرافیایی، بدن انسان و پسزمینه ثابت برای پردازش بصری سطح بالاتر و تجزیه و تحلیل GIS تبدیل میکند [22] . , 23 , 24 ]. بنابراین، پیوند ذخیره سازی و محاسبات جریان GeoVideo بلادرنگ راه موثری برای کاهش زمان پاسخ در مواقع اضطراری است. شکل 3 جریان داده های داده های GeoVideo را بین Redis، MySQL و MongoDB نشان می دهد.
مرحله 1: به استریم GeoVideo دسترسی پیدا کنید و جریان ویدئو را با توجه به نرخ فریم به فریم های ویدئویی تبدیل کنید. میدان دید (FOV) را بر اساس زاویه نگرش و فاصله کانونی دوربین محاسبه کنید.
مرحله 2: توالی فریمهای GeoVideo در Redis ذخیره میشود و هر کانال ویدیویی مربوط به فهرست Redis است که از پرسشهای مربوط به دوره اخیر دادههای ویدیویی پشتیبانی میکند. سیستم تجزیه و تحلیل ویدیو، آخرین فریمهای ویدیویی را از سر فهرست برای تشخیص منطقه حرکت و استخراج پیشزمینه در زمان واقعی به دست میآورد و طول لیست را با الگوریتم جایگزینی اول در اول (FIFO) ثابت نگه میدارد.
مرحله 3: ویژگی تغییر استخراج شده توسط تجزیه و تحلیل مقایسه ای فریم های ویدئویی را در جدول حافظه به نام Change_Attribute_Table MySQL ذخیره کنید و یک ماشه درج برای انجام نظارت بر زمان واقعی تغییرات غیرعادی ایجاد کنید. اگر مقدار تغییر از مقادیر آستانه از پیش تعریف شده بیشتر شود، ماشه یک رویداد مربوطه را با توجه به محدوده تغییر ایجاد می کند و رویداد را در جدول حافظه به نام Event_Table MySQL وارد می کند.
مرحله 4: یک تریگر درج در Event_Table ایجاد کنید و از سیستم زمانبندی توزیع شده Gearman برای همگام سازی رویداد در Redis به عنوان یک کش استفاده کنید. تاپل رویداد در MySQL به ساختار داده هش در Redis نگاشت می شود و شناسه رویداد منحصر به فرد جهانی را به عنوان کلید هش می گیرد.
مرحله 5: از مکانیسم پیام «اشتراک/انتشار» Redis برای انتقال فعال رویدادها به اشیاء جغرافیایی مربوطه استفاده کنید. دسته رویداد را به عنوان “کانال” برای اجرای عملیات فشار رویداد در نظر بگیرید.
مرحله 6: اشیاء جغرافیایی رویدادهای مشترک را دریافت میکنند، ویژگیهای رویدادها را تجزیه و تحلیل میکنند، و بهطور خودکار دادههای GeoVideo مربوط به مکانی-زمانی را با استفاده از الگوهای رویداد از پیش تعریفشده بارگیری میکنند.
مرحله 7: فریم های ویدئویی از پیش پردازش شده در Redis را با معنای فرآیند جغرافیایی گروه بندی کنید و در خوشه MongoDB Mongos بنویسید. کلید ترکیبی – “day+cameraID” را انتخاب کنید و برای پشتیبانی از ذخیره سازی توزیع شده داده های GeoVideo عظیم، شاخص ترکیبی را روی این دو ویژگی ایجاد کنید.
مرحله 8: FOV فریم های ویدئویی را در Redis به عنوان مسیر حرکت دوربین گروه بندی کنید. حداقل مستطیل مرز سه بعدی این FOV ها را محاسبه کنید و در حین همگام سازی فریم های ویدئویی از Redis به MongoDB، شاخص فضایی-زمانی را به روز کنید.
3.2. ساختار و الگوریتم قابلیت همکاری
3.2.1. تشخیص تغییر و ماشه رویداد
مقدار تغییر غیرعادی استخراج شده از جریان GeoVideo در Redis، محرک اجرای تجزیه و تحلیل ویدیو است. استفاده از “مکانیسم ماشه” در RDB برای پیوند ذخیره سازی و محاسبات داده های GeoVideo می تواند به طور فعال تغییرات غیرعادی را شناسایی کند و رویدادها را در زمان واقعی بدون عملیات I/O خارجی ایجاد کند. در نظارت تصویری یک موزه، فاصله بین بازدیدکننده و نمایشگاه، مدت اقامت در سالن نمایشگاه، حرکت نمایشگاه و خطر آتش سوزی همه عوامل مهم در تعیین ایمنی نمایشگاه هستند. برای مثال، در نظارت بر فاصله بین بازدیدکننده و نمایشگاه، فاصلههای متفاوت سطوح مختلفی از رویدادهای امنیتی را آغاز میکند. میز 1ساختار جدول Safe_Distance را توصیف می کند که فاصله بین یک نمایشگاه و بازدیدکننده استخراج شده از یک قاب ویدئو را ثبت می کند. جدول 2 ساختار جدول Event_Safe_Distance را شرح می دهد که رویدادهای شناسایی شده از جدول Safe_Distance را با بررسی مقدار فاصله بین یک نمایشگاه و بازدیدکننده ثبت می کند. ماشه Trigger_Safe_Distance (الگوریتم 1) فواصل غیرعادی را در جدول Safe_Distance بررسی می کند و رویدادها را در جدول Event_Safe_Distance وارد می کند. جدول Safe_Distance، جدول Event_Safe_Distance، و Trigger_Safe_Distance در MySQL یک فرآیند یکپارچه برای تشخیص تغییرات بلادرنگ و راهانداز رویداد را تشکیل میدهند.
| الگوریتم 1: Trigger_SafeDistance (Tuple DistanceValue) |
1. Trigger_Safe_Distance را ایجاد کنید 2. پس از درج در جدول Safe_Distance 3. برای هر ردیف جدید 4. شروع 5. اگر newTuple.distance < safe_distance_level1 سپس 6. در مقادیر Event_Safe_Distance (event_type1، newTuple.attributes) وارد کنید . 7. elseif newTuple.distance < safe_distance_level2 then 8. در مقادیر Event_Safe_Distance (ویژگی های event_type2، newTuple.) وارد کنید . 9. elseif newTuple.distance < safe_distance_level3 then 10. در مقادیر Event_Safe_Distance (ویژگی های event_type3، newTuple.) وارد کنید . 11. Other 12. درج در Event_Safe_Distance مقادیر (event_type4, newTuple. ویژگی ها) 13. end if-then 14. end-begin 15. end-foreach |
3.2.2. اشتراک و انتشار رویداد
استفاده از مکانیسم پیام “اشتراک/انتشار” می تواند به طور فعال رویدادها را در اولین بار به اشیاء جغرافیایی مرتبط ارسال کند. ما تریگر درج Dispatch_Event (الگوریتم 2) را در جدول Event_Safe_Distance MySQL تعریف می کنیم. در رویه ذخیره شده تریگر Dispatch_Event، ما از سیستم زمانبندی توزیع شده Gearman برای همگام سازی رویدادها از MySQL به Redis، با ویرایش Gearman Worker به نام «SyncAndDispatchEvent» (الگوریتم 3) و استفاده از مکانیسم پیام تعبیه شده «اشتراک/انتشار مجدد برای» استفاده می کنیم. رویدادهای تولید شده در زمان واقعی را به اشیاء جغرافیایی مرتبط فشار دهید. در برنامه نظارت تصویری، ما هر دسته رویداد را به عنوان یک کانال جدا می کنیم و بخش های مختلف ایمنی در انواع مختلف رویدادها مشترک می شوند. به عنوان مثال، یک بخش ایمنی موزه تمام سطوح حوادث امنیتی را دریافت می کند، اما ایستگاه پلیس محلی فقط افرادی را در سطوح بالاتر دریافت می کند. از طریق انتشار بیدرنگ رویدادهای امنیتی، مشترکین اعلانهای رویداد را دریافت میکنند و دادههای GeoVideo واقعی و تاریخی مربوط به رویداد را از Redis و MongoDB برای تجزیه و تحلیل جامع جستجو میکنند.
| الگوریتم 2: Trigger_DispatchEvent (Tuple SafeDistanceEvent) |
1. ایجاد ماشه Dispatch_Event 2. پس از درج در جدول Event_Safe_Distance 3. برای هر ردیف جدید 4. شروع 5. تنظیم @ret= gman_do_background ( GearmanWorker 'SyncAndDispatchEvent', 6. json_object (newTupleInMySQL.attributes به عنوان newKeyValuePairInRedis.attributes)) 7. پایان-شروع 8. پایان-فروچ |
| الگوریتم 3: GearmanWorker_SyncAndDispatchEvent (Tuple SafeDistanceEvent) |
1. $worker = new GearmanWorker() 2. $worker->addFunction('SyncAndDispatchEvent') 3. $redis = new Redis() 4. $redis->connect(IP، پورت) 5. while($worker->work()) 6. شروع 7. تابع SyncAndDispatchEvent (Tuple $job) 8. جهانی $redis 9. $workString = $job->workload() 10. $work = json_decode ($workString) 11. $redis-> hmset ( کلید : "attributeName"، مقدار : $work-> ویژگی) 12. $redis-> انتشار ( کانال : $work->event_type، $work->eid) 13. کارکرد پایانی 14. پایان-شروع |
4. مطالعه تجربی
در این بخش، آزمایشهایی را با استفاده از رویکرد سازماندهی و مدیریتی که در بالا توضیح داده شد ارائه کردیم و نتایج عملکرد را از نظر دسترسی به دادههای GeoVideo در زمان واقعی، تشخیص و ارسال رویدادهای غیرعادی و ذخیرهسازی گسترده دادههای تاریخی تجزیه و تحلیل کردیم. در بخش 4.1 ، محیط نرمافزار و سختافزار، مجموعه دادهها و سایر آمادهسازیهای درگیر در آزمایشها را شرح میدهیم. آزمایش های مفصل در بخش 4.2 ارائه شد .
4.1. تنظیمات آزمایشی
تمام آزمایش ها روی دو ایستگاه کاری Dell OPTIPLEX 9020 انجام شد که هر کدام سه ماشین مجازی را به عنوان گره های کاری ایجاد کردند. هر نود دارای یک پردازنده 4 هسته ای Intel I7-4790M با فرکانس 3.60 گیگاهرتز با هشت رشته سخت افزاری و 4 گیگابایت رم بود. این دو ایستگاه کاری از طریق یک شبکه گیگابیتی با هم ارتباط داشتند. هر شش گره از یک سیستم عامل لینوکس 64 بیتی (سرور CentOS Enterprise) استفاده می کردند. یک MongoDB 64 بیتی، Redis 64 بیتی، MySQL 64 بیتی، سیستم توزیع وظیفه Gearman و 64 بیتی OpenCV برای پیاده سازی روش سازماندهی ترکیبی شرح داده شده در بالا بر روی دو گره کاری برای داده های GeoVideo بلادرنگ استفاده شد.
در آزمایشها، ما 58 دوربین را که به طور تصادفی توزیع شده بودند، در داخل و خارج ساختمان اداری انتخاب کردیم. هر یک از دوربین ها 48 ساعت را با سرعت نمونه برداری 25 فریم در ثانیه، با یک فریم ارجاع جغرافیایی در ثانیه به دلیل سرعت نمونه برداری از GPS و قطب نما (قطب نما دیجیتال می تواند 30 یا 40 خواندن در ثانیه انجام دهد، اما GPS) ضبط کردند. فقط می توان یک نمونه در ثانیه دریافت کرد). اینها پارامترهای کلیدی برای محاسبه اطلاعات مکانی GeoVideo، مانند FOV و موقعیت شی نظارت بودند. بنابراین، ما یک مجموعه داده با حدود 250 میلیون فریم ویدئو و 10 میلیون فریم کلیدی مرجع جغرافیایی داشتیم. اندازه هر فریم حدود 100 K است. تشخیص تغییر فریم های ویدئویی، از جمله تشخیص ناحیه حرکتی و استخراج پیش زمینه توسط یک کتابخانه الگوریتم استخراج ویژگی منبع باز OpenCV اجرا شد.
به منظور اعتبارسنجی روش پیشنهادی، ما یک سری آزمایش را با استفاده از یک مجموعه داده نمونه GeoVideo انجام دادیم. آزمایش اول بهروزرسانی و عملکرد پرسوجو را بین مخزن مبتنی بر Redis-MongoDB، مخزن مبتنی بر MongoDB و مخزن مبتنی بر MySQL مقایسه کرد تا بررسی کند که آیا روش ترکیبی از RDB و DFS مستقل عملکرد بهتری در دسترسی بلادرنگ دارد یا خیر. آزمایش دوم تشخیص رویداد غیرعادی و عملکرد ارسال فعال تشخیص-فشار و اسکن منظم را به منظور اعتبارسنجی پیوند ذخیره سازی و محاسبات با بازدید نزدیک مقایسه کرد و زمان پاسخ را به میزان زیادی کاهش داد.
4.2. نتایج تجربی
4.2.1. دسترسی به زمان واقعی
این آزمایش عملکرد دسترسی بلادرنگ مخزن پیشنهادی مبتنی بر Redis-MongoDB را با یک مخزن مستقل مبتنی بر MongoDB و مخزن مبتنی بر MySQL مقایسه کرد. برای این آزمایش، ما یک مخزن مبتنی بر MongoDB را پیکربندی کردیم که دارای یک سرور پیکربندی، سه سرور shard و یک روتر mongs، و یک مخزن مبتنی بر Redis و یک مخزن مبتنی بر MySQL در یک گره واحد است. ما از سه نسبت به روز رسانی/پرس و جو (75% به روز رسانی و 25% پرس و جو، 50% به روز رسانی و 50% پرس و جو و 25% به روز رسانی و 75% پرس و جو) استفاده کردیم و مقدار متوسط را برای اندازه گیری توان عملیاتی به روز رسانی/پرس و جو و تاخیر پاسخ پرس و جو دریافت کردیم. آخرین داده ها به همین روش
از شکل 4a-c، میتوان نتیجه گرفت که کارایی دسترسی و تأخیر برای جستجوی آخرین دادههای مخزن مبتنی بر Redis-MongoDB به طور قابل توجهی بهتر از دو مورد دیگر بود. مخزن مبتنی بر Redis-MongoDB از مخزن مبتنی بر MongoDB عملکرد بهتری داشت، در حالی که مخزن مبتنی بر MongoDB از مخزن مبتنی بر MySQL عملکرد بهتری داشت، زیرا Redis مشکلات تنگنای ورودی/خروجی و مصرف بالا را برای نگهداری شاخص جهانی حل کرد و MongoDB کار را ساده کرد. عملیات پیچیده برای حفظ ثبات قوی برای به روز رسانی در زمان واقعی با حفظ ثبات نهایی. به طور کلی، ظرفیت دسترسی سه مخزن در ابتدا ثابت بود و سپس با افزایش مقدار داده های ذخیره شده در پایگاه داده به تدریج کاهش یافت. تعداد حجم داده های GeoVideo تأثیر کمی بر مخزن مبتنی بر Redis-MongoDB و تأثیر زیادی بر مخزن مبتنی بر MySQL داشت. بنابراین، جداسازی دادههای ویدیویی بیدرنگ و تاریخی، استفاده از MMDB برای مدیریت دادههای بیدرنگ و استفاده از DFS برای مدیریت دادههای تاریخی عظیم، راهی کارآمد برای برآوردن نیازهای دسترسی بلادرنگ بود.
4.2.2. شناسایی و ارسال رویداد
برای نشان دادن عملکرد تشخیص تغییرات غیرعادی در زمان واقعی و ارسال رویداد، یک آزمایش مقایسه ای از هزینه زمانی تشخیص و ارسال رویداد در چهار حالت به شرح زیر طراحی شد. حالت 1: استفاده از مکانیسم ماشه MySQL در جدول حافظه Safe_Distance برای تشخیص تغییرات غیرعادی، و استفاده از یک Gearman worker تعبیه شده در ماشه جدول حافظه Event_Safe_Distance برای انتقال رویدادها به اشیاء جغرافیایی مرتبط با مکانیسم پیام “اشتراک/انتشار” بدون مکانیسم پیام عملیات ورودی/خروجی خارجی حالت 2: استفاده از مکانیسم ماشه MySQL برای تشخیص تغییرات غیرعادی و استفاده از Gearman worker تعبیه شده برای فشار دادن رویدادها به اشیاء جغرافیایی مرتبط، با این حال جدول Safe_Distance و جدول Event_Safe_Distance روی دیسک ذخیره شدند. حالت 3: استفاده از مکانیسم ماشه MySQL برای تشخیص تغییرات غیرعادی در جداول حافظه Safe_Distance و ذخیره انواع مختلف رویدادها در جداول حافظه مختلف. سپس، برنامهها بهطور دورهای (500 میلیثانیه) جداول رویداد را اسکن کردند تا آخرین رویدادها را دریافت کنند. حالت 4: استفاده از توابع رویه MySQL برای شناسایی دوره ای (500 میلی ثانیه) تغییرات غیرعادی و ذخیره رویدادهای محاسبه شده در جدول حافظه Event_Safe_Distance. سپس، ماشه در جدول حافظه Event_Safe_Distance رویدادها را به اشیاء و ماژولهای جغرافیایی مرتبط با استفاده از کارگر Gearman جاسازی شده ارسال کرد. استفاده از توابع رویه MySQL برای شناسایی دوره ای (500 میلی ثانیه) تغییرات غیرعادی و ذخیره رویدادهای محاسبه شده در جدول حافظه Event_Safe_Distance. سپس، ماشه در جدول حافظه Event_Safe_Distance رویدادها را به اشیاء و ماژولهای جغرافیایی مرتبط با استفاده از کارگر Gearman جاسازی شده ارسال کرد. استفاده از توابع رویه MySQL برای شناسایی دوره ای (500 میلی ثانیه) تغییرات غیرعادی و ذخیره رویدادهای محاسبه شده در جدول حافظه Event_Safe_Distance. سپس، ماشه در جدول حافظه Event_Safe_Distance رویدادها را به اشیاء و ماژولهای جغرافیایی مرتبط با استفاده از کارگر Gearman جاسازی شده ارسال کرد.
از شکل 5 الف، می توان نتیجه گرفت که بازده تشخیص و اعزام رویداد حالت 1 به طور قابل توجهی بیشتر از سه حالت دیگر بود. مقایسه بین حالت 1 و 2 نشان داد که جداول حافظه می توانند هزینه زمانی راه اندازی رویداد و تحویل رویداد را تا حد زیادی کاهش دهند. مقایسه بین حالت 1 و 3 و همچنین حالت 1 و حالت 4 نشان داد که عملیات فعال تشخیص رویداد و ارسال رویداد کارآمدتر بود. شکل 5 b,c نشان می دهد که حالت 1 کمترین منابع MySQL را مصرف می کند و در مقایسه با سه حالت دیگر تأثیر کمی بر عملکرد دسترسی MySQL دارد.
4.2.3. توزیع داده های تاریخی
هدف از این آزمایش تأیید این بود که آیا خوشه MongoDB Mongos توزیع یکنواخت دادههای GeoVideo، عملکرد جستجوی بهتر و ذخیرهسازی مقیاسپذیر را تضمین میکند یا خیر. ما یک Mongos خوشه MongoDB را پیکربندی کردیم که دارای یک سرور پیکربندی، سه سرور خرد، یک روتر mongs و یک سرور جایگزین قابل توسعه بود. مقایسه بین سه کلید خرد شده: کلید ترکیبی “day+cameraID”، کلید هش “cameraID” و کلید افزایشی “day” انجام شد.
شکل 6 a,b نشان داد که کلید شارد مرکب در مقایسه با دو نوع دیگر کلید خرده عملکرد دسترسی بهتری دارد. اگرچه کلید هش توزیع یکنواخت و کارایی بهروزرسانی دادههای GeoVideo را داشت، اما به دلیل توزیع تصادفی دادههای GeoVideo بدون خوشهبندی و شاخص توزیع نامعتبر، برای پرسوجوها تنگنا داشت. کلید افزایشی باعث شد که عملیات بهروزرسانی روی یک سرور خردهای متمرکز شود که آخرین دادهها را ثبت میکرد، که منجر به گلوگاه بهروزرسانی شد که اجازه نمیداد فضای ذخیرهسازی مقیاسپذیر به طور کامل وارد بازی شود. شکل 6c نشان داد که افزایش تعداد خردهها عملکرد بهروزرسانی را بهبود میبخشد، به این معنی که MongoDB توانایی قوی برای کاهش مقیاس دارد. عدد شارد بهبود عملکرد کمی در کلید افزایشی و بهبود عملکرد عالی در کلید ترکیبی و کلید هش داشت.
5. نتیجه گیری ها
ساختارهای پیچیده سیستم های مکانی نیاز مبرمی به مدیریت مناسب دارند [ 25 ، 26 ]. پیشرفتهای اخیر در فناوری اطلاعات که معمولاً به عنوان «دادههای بزرگ» نامیده میشود، همراه با زمینههای مرتبط با علم داده و تجزیه و تحلیل برای پردازش، تجزیه و تحلیل و تعیین ارزش حجم عظیم دادههای مکانی مورد نیاز است [3، 27 ] .]. روشهای تحلیل جغرافیایی موجود عمدتاً در زمینه دادههای کوچک توسعه یافتهاند. با این حال، تمام فرآیندهای مورد علاقه عموم مردم و تصمیم گیرندگان در زمان واقعی و زمینه ناهمگون عمل می کنند. عدم تعادل بین محصولات داده غنی و استفاده ضعیف از داده، توجه را به تکنیک های دسترسی و مدیریت داده های بلادرنگ جلب می کند. رویکرد ترکیبی سازماندهی و مدیریت NoSQL-SQL داده های مکانی بلادرنگ از مزایای عملیات دسترسی بلادرنگ NoSQL MMDB برای داده های ورودی ناهمگن مختلف، پرس و جوهای انعطاف پذیر و پردازش تراکنش های SQL RDBMS برای پشتیبانی از دسترسی استفاده می کند. نتایج تجزیه و تحلیل در حال پرواز، و توانایی مقیاس پذیر NoSQL DFS برای داده های عظیم. این رویکرد برای پشتیبانی از ذخیره سازی بلادرنگ، پرس و جو و محاسبات در GIS بلادرنگ موثر در نظر گرفته می شود. این مقاله با هدف مشکلات در ارتباط بین ذخیرهسازی و محاسبات در تجزیه و تحلیل آنلاین GIS، یک استراتژی ذخیرهسازی مشترک داخلی و خارجی را با مدیریت جداگانه دادههای جغرافیایی زمان واقعی و تاریخی ارائه میکند، و یک گردش کار را طراحی میکند که شناسایی تغییرات در زمان واقعی و تحویل رویداد فعال را ادغام میکند. برای هدایت تکامل فرآیند جغرافیایی یک ساختار ID جدید نیز برای مرتبط کردن عناصر جغرافیایی چند دانه بندی برای زمان بندی یکپارچه در ترکیبی NoSQL-SQL DBMS طراحی شده است. علاوه بر این، با استفاده از مکانیسم پیام اشتراک/انتشار برای ترسیم روابط بین اشیاء، رویدادها و فرآیندهای جغرافیایی، این روش میتواند تأخیر زمانبندی مشترک دادههای مکانی-زمانی بلادرنگ و تاریخی را به طور موثر کاهش دهد. نتایج تجربی از کاربرد بتن GeoVideo بر اساس Redis،
این رویکرد سازماندهی ترکیبی NoSQL-SQL یک پایه مهم در پلت فرم GIS بلادرنگ برای نظارت بر محیط است. این سیستم با موفقیت برای نظارت GeoVideo و ردیابی مسیر اعمال شده است و پشتیبانی تصمیم گیری امنیت عمومی را برای بخش امنیتی فراهم می کند ( شکل 7 را ببینید ). رویکرد مدیریت داده، دسترسی بلادرنگ و تشخیص تغییرات غیرعادی دادههای بزرگ GeoVideo را تسهیل کرده است. رویکرد سازمانی و مدیریتی توسعهیافته دادههای مکانی بلادرنگ با کمک به محققان در مقابله با چالشهای ناشی از دادههای بزرگ، پیشرفتها را در طیف گستردهای از کاربردها ممکن میسازد.
منابع
- کوان، نماینده مجلس؛ لی، جی. پاسخ اضطراری پس از 11 سپتامبر: پتانسیل GIS سه بعدی بلادرنگ برای واکنش سریع اضطراری در محیطهای ریز فضایی. محاسبه کنید. محیط زیست شهری 2005 ، 29 ، 93-113. [ Google Scholar ] [ CrossRef ]
- زرگر، ا. اسمیت، DI موانع استفاده از GIS برای پشتیبانی تصمیم گیری بلادرنگ در زمان واقعی. محاسبه کنید. محیط زیست Urban 2003 , 27 , 123-141. [ Google Scholar ] [ CrossRef ]
- ژانگ، اف. ژنگ، ی. خو، دی. دو، ز. وانگ، ی. لیو، آر. Ye, X. پرس و جوهای مکانی در زمان واقعی برای اجسام متحرک با استفاده از توپولوژی طوفان. ISPRS Int. J. Geo-Inf. 2016 ، 5 . [ Google Scholar ] [ CrossRef ]
- نگاه به آینده: پنج تفکر در مورد آینده GIS. در دسترس آنلاین: http://www.esri.com/news/arcwatch/0211/future-of-gis.html (در 7 آگوست 2016 قابل دسترسی است).
- خو، دبلیو. زو، س. ژانگ، ی. دینگ، ی. Hu, M. Real-Time GIS و کاربرد آن در فاجعه آتش سوزی داخلی. طاق ISPRS. 2013 ، XL-2/W2 ، 121-127. [ Google Scholar ] [ CrossRef ]
- پلکیس، ن. تئودولیدیس، بی. کوپاناکیس، آی. تئودوریدیس، ی. بررسی ادبیات مدل های پایگاه داده مکانی-زمانی. دانستن مهندس Rev. 2004 , 19 , 235-274. [ Google Scholar ] [ CrossRef ]
- برونیگ، ام. تورکر، سی. Böhlen، MH; دیکر، اس. گوتینگ، RH; جنسن، CS; رلی، ال. ریگو، پی. Schek، HJ; Scholl, M. معماری و پیاده سازی سیستم های مدیریت پایگاه داده مکانی-زمانی. در پایگاههای داده مکانی-زمانی: رویکرد CHOROCHRONOS ، ویرایش اول. Frank, AU, Sellis, T., Koubarakis, M., Eds. Springer: برلین، آلمان، 2003; صص 264-314. [ Google Scholar ]
- شواچکو، ک. کوانگ، اچ. رادیا، اس. Chansler, R. سیستم فایل توزیع شده هادوپ. در مجموعه مقالات بیست و ششمین سمپوزیوم IEEE در سال 2010 در مورد سیستم ها و فناوری های ذخیره سازی انبوه، واشنگتن، دی سی، ایالات متحده آمریکا، 3 تا 7 مه 2010.
- آبادی، دی جی; احمد، ی. بالازینسکا، م. چتینتمل، U. چرنیاک، م. هوانگ، جی اچ. لیندنر، دبلیو. ماسکی، ع. راسین، ع. ریوکینا، ای. و همکاران طراحی موتور پردازش جریان Borealis. در مجموعه مقالات کنفرانس CIDR 2005، آسیلومار، کالیفرنیا، ایالات متحده آمریکا، 4 تا 7 ژانویه 2005.
- آراسو، ع. بابو، س. Widom, J. زبان پرس و جو پیوسته CQL: مبانی معنایی و اجرای پرس و جو. VLDB J. 2006 ، 15 ، 121-142. [ Google Scholar ] [ CrossRef ]
- گیلستروم، دی. وو، ای. Chae، HJ; دیائو، ی. استالبرگ، پی. Anderson، G. SASE: پردازش رویداد پیچیده از طریق جریان. در مجموعه مقالات سومین کنفرانس دوسالانه تحقیقات سیستم های داده نوآورانه، آسیلومار، کالیفرنیا، ایالات متحده آمریکا، 7 تا 10 ژانویه 2007.
- Demers، AJ; گرکه، ج. پاندا، بی. ریدوالد، ام. شارما، وی. White, WM Cayuga: یک سیستم نظارت بر رویداد با هدف عمومی. در مجموعه مقالات سومین کنفرانس دوسالانه تحقیقات سیستم های داده نوآورانه، آسیلومار، کالیفرنیا، ایالات متحده آمریکا، 7 تا 10 ژانویه 2007.
- گدیک، بی. آندراد، اچ. وو، KL; یو، PS; Doo, M. SPADE: موتور پردازش جریان اعلانی سیستم. در مجموعه مقالات کنفرانس بین المللی ACM SIGMOD 2008 در مدیریت داده ها، ونکوور، BC، کانادا، 9 تا 12 ژوئن 2008.
- هائو، ایکس. جین، پی. Yue, L. ذخیره سازی کارآمد داده های ردیابی شی چند سنسوری. IEEE Trans. موازی. منطقه 2015 ، 27 ، 2881-2894. [ Google Scholar ] [ CrossRef ]
- کانگ، ی. پارک، آی. ری، جی. لی، Y. طراحی مخزن مبتنی بر MongoDB برای داده های بزرگ RFID/سنسور تولید شده توسط اینترنت اشیا. IEEE Sens J. 2015 ، 16 ، 485-497. [ Google Scholar ] [ CrossRef ]
- Sipke، VDVJ؛ برام، VDW; عملکرد ذخیره سازی داده های سنسور Meijer، RJ: SQL یا NoSQL، فیزیکی یا مجازی. در مجموعه مقالات پنجمین کنفرانس بین المللی IEEE 2012 در محاسبات ابری، هونولولو، HI، ایالات متحده آمریکا، 24 تا 29 ژوئن 2012.
- کیم، سیچ. پارک، KW; بهبود عملکرد خدمات وب Choi، YL با Redis. J. Korea Inst. Inf. اشتراک. مهندس 2015 ، 19 ، 2064–2072. [ Google Scholar ] [ CrossRef ]
- جیانگ، ال. Xu, LD; کای، اچ. Jiang, Z. چارچوب ذخیره سازی داده مبتنی بر اینترنت اشیا در پلت فرم رایانش ابری. IEEE Trans. Ind. اطلاع رسانی. 2014 ، 10 ، 1443-1451. [ Google Scholar ] [ CrossRef ]
- لی، تی. لیو، ی. تیان، ی. شن، اس. Mao, W. یک راه حل ذخیره سازی برای داده های عظیم اینترنت اشیاء مبتنی بر NoSQL. در مجموعه مقالات کنفرانس بین المللی IEEE 2012 در محاسبات و ارتباطات سبز، Besancon، فرانسه، 20-23 نوامبر 2012.
- گونگ، جی. لی، ایکس. Wu, H. مدل داده های مکانی-زمانی برای GIS بلادرنگ. AGCS 2014 ، 43 ، 226-232. [ Google Scholar ]
- لی، ایکس. یانگ، جی. گوان، ایکس. Wu, H. یک مدل داده مکانی-زمانی رویداد محور (e-st) که از بیان پویا و شبیهسازی فرآیندهای جغرافیایی پشتیبانی میکند. ترانس. GIS 2014 ، 18 ، 76-96. [ Google Scholar ] [ CrossRef ]
- لو، ی. شهابی، ج. Kim, SH نمایه سازی و بازیابی کارآمد پایگاه داده های ویدئویی دارای برچسب جغرافیایی در مقیاس بزرگ. Geoinformatica 2016 ، 20 ، 829-857. [ Google Scholar ] [ CrossRef ]
- میلوساولیویچ، آ. رانچیچ، دی. دیمیتریویچ، آ. پردیچ، بی. Mihajlović، V. یکپارچه سازی GIS و نظارت تصویری. بین المللی جی. جئوگر. Inf. علمی 2016 ، 30 ، 2089-2107. [ Google Scholar ] [ CrossRef ]
- لوئیس، پی. فاثرینگهام، اس. Winstanley، A. فضایی ویدئو و GIS. بین المللی جی. جئوگر. Inf. علمی 2011 ، 25 ، 697-716. [ Google Scholar ] [ CrossRef ]
- الدهوکی، س. کامو، اف. ژائو، ی. مک.؛ وو، ی. یانگ، جی. بله، X. وانگ، اف. لی، ایکس. Chen, W. SemanticTraj: رویکردی جدید برای تعامل با مسیرهای عظیم تاکسی. IEEE Trans. Vis. محاسبه کنید. نمودار. 2017 ، 23 ، 11-20. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- هوانگ، ایکس. ژائو، ی. یانگ، جی. ژانگ، سی. مک.؛ Ye, X. TrajGraph: یک رویکرد تحلیل بصری مبتنی بر نمودار برای مطالعه محورهای شبکه شهری با استفاده از داده های مسیر تاکسی. IEEE Trans. Vis. محاسبه کنید. نمودار. 2016 ، 22 ، 160-169. [ Google Scholar ] [ CrossRef ] [ PubMed ]
- بله، X. هوانگ، Q. لی، دبلیو. یکپارچه سازی داده های اجتماعی بزرگ، محاسبات و مدل سازی برای علوم اجتماعی فضایی. کارتوگر. Geogr. Inf. علمی 2016 . [ Google Scholar ] [ CrossRef ]

شکل 1. چارچوب معماری ذخیره سازی ترکیبی.

شکل 2. طراحی ساختار هویت عنصر جغرافیایی (ID) یکسان برای زمانبندی یکپارچه.

شکل 3. جریان داده های ویدئوی جغرافیایی (GeoVideo) در محیط ذخیره سازی ترکیبی.

شکل 4. عملکرد دسترسی بیدرنگ بین مخازن مبتنی بر Redis-MongoDB، MongoDB و مبتنی بر MySQL. ( الف ) به روز رسانی توان عملیاتی سه مخزن. ( ب ) عملیات پرس و جو از سه مخزن. ( ج ) تأخیر برای دریافت آخرین داده های سه مخزن.

شکل 5. مقایسه بین چهار حالت تشخیص تغییرات غیرعادی و ارسال رویداد. ( الف ) هزینه زمانی تشخیص رویداد و تحویل چهار حالت. ( ب ) به روز رسانی توان عملیاتی MySQL تحت اجرای تشخیص رویداد و تحویل چهار حالت. ( ج ) توان عملیاتی پرس و جو MySQL تحت اجرای تشخیص رویداد و تحویل چهار حالت.

شکل 6. دسترسی به عملکرد تحت یک کلید شارد متفاوت. ( الف ) به روز رسانی توان عملیاتی MongoDB با استفاده از یک کلید دیگر. ( ب ) خروجی پرس و جو از MongoDB با استفاده از یک کلید خرده متفاوت. ( ج ) بهبود عملکرد با یک عدد شارد متفاوت.

شکل 7. رابط پلت فرم نظارت بر سیستم اطلاعات جغرافیایی بلادرنگ (GIS)، که تصویری از داده های ویدئویی ارجاع داده شده در زمان واقعی را نشان می دهد که میدان دید آن (FOV) را به صحنه 3 بعدی برای مدیریت ویدئوی عظیم ترسیم می کند. داده ها از منظر فضایی ( الف ) انتخاب داده های GeoVideo بلادرنگ که لابی در طبقه اول را پوشش می دهد. ( ب ) تشخیص در زمان واقعی اجسام متحرک و مسیر ردیابی.

جدول 1. شرح جدول Safe_Distance.

جدول 2. شرح جدول Event_Safe_Distance.
© 2017 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر