ردیابی ویدئو به کمک GPS

خلاصه

ردیابی اجسام متحرک برای بسیاری از کاربردها چالش برانگیز و مهم است. فناوری‌های مختلف مبتنی بر سیستم موقعیت‌یابی جهانی (GPS) و داده‌های ویدئویی یا رادیویی برای به‌دست آوردن مسیر اجسام مشاهده‌شده استفاده می‌شوند. با این حال، در برخی موارد استفاده، آنها قادر به ارائه داده های به اندازه کافی دقیق، کامل و همزمان نیستند. در این کار ما یک رویکرد برای ترکیب ردیابی مبتنی بر GPS و ویدئو به منظور بهره‌برداری از مزایای فردی آنها ارائه می‌کنیم. در این روش، هدف ما ترکیب قابلیت اطمینان ردیابی GPS با دقت هندسی بالای تشخیص دوربین است. برای ادغام داده‌های حرکتی ارائه شده توسط دستگاه‌های مختلف، از فرمول‌بندی مدل پنهان مارکوف (HMM) و الگوریتم ویتربی برای استخراج محتمل‌ترین مسیرها استفاده می‌کنیم. در سه آزمایش، ما نشان می دهیم که رویکرد ما قادر به مقابله با موقعیت های چالش برانگیز مانند انسداد یا اشیایی است که به طور موقت خارج از منطقه تحت نظارت هستند. نتایج نشان دهنده افزایش مطلوب از نظر دقت، کامل بودن و صحت است.

کلید واژه ها:

ردیابی شی ; الگوریتم ; تجزیه و تحلیل مسیر، سنسور و ترکیب داده ها

چکیده گرافیکی

1. معرفی

در بسیاری از زمینه ها و کاربردهای تحقیقاتی، ردیابی اجسام متحرک نقش مهمی ایفا می کند. این امر به ویژه در شرایطی که موقعیت ها و حرکات اشیا برای ارزیابی یا کسب دانش در مورد رفتار آنها تجزیه و تحلیل می شود، صادق است. سناریوهای کاربردی معمولی مشاهده افراد در حال حرکت در یک شهر، یک مکان یا یک ساختمان یا حیوانات در محیط خود هستند. گیرنده های سیستم ماهواره ای ناوبری جهانی (GNSS) و همچنین سیستم های ردیابی مبتنی بر ویدئو یا رادیو فناوری هایی هستند که معمولاً برای این منظور استفاده می شوند. این مشاهدات می توانند برای دوره های زمانی طولانی، اغلب برای چندین ماه، ادامه داشته باشند و بنابراین مجموعه داده های بزرگی را ارائه می دهند که منعکس کننده حرکات اجسام هستند. اغلب، تجزیه و تحلیل در زمان واقعی مورد نیاز است و تلاش برای تجزیه و تحلیل داده های حاصل آنقدر گسترده است که نمی توان آن را به صورت دستی انجام داد. از این رو،

یک برنامه مهم استفاده از سیستم های ردیابی در حوزه ورزش است، به عنوان مثال، فناوری های خط دروازه در فوتبال یا “Hawk-Eye” [ 1 ]] در تنیس که قادر است نقطه تماس توپ را با زمین تعیین کند و در شرایط نامشخص توسط بازیکن یا داور مشورت شود. در این برنامه ها موقعیت های شی در محدوده چند سانتی متر برای هر نقطه از زمان مورد نیاز است. به عبارت دیگر: اگر در حین مشاهده، تصمیماتی اتخاذ شود که نیاز به دقت در مقیاس سانتی متری داشته باشد، نه داده های از دست رفته و نه داده هایی با دقت کمتر قابل قبول نیستند. مثال های دیگر، تصمیم آفساید در فوتبال یا هر تصمیم دیگری است که به این سوال می پردازد که آیا توپ از خط عبور کرده است یا خیر. علاوه بر موقعیت توپ، موقعیت دقیق همه بازیکنان برای تجزیه و تحلیل تاکتیکی موقعیت های بازی اهمیت فزاینده ای دارد.

نه سیستم موقعیت یابی جهانی (GPS) و نه ردیابی ویدیویی که رایج ترین فناوری ها هستند، به عنوان راه حل های مستقل مناسب نیستند، که در مطالعات مرتبط توضیح داده شده است. تحقیقات متعددی در مورد اعتبار و پایایی اندازه‌گیری‌های GPS در ورزش وجود دارد [ 2 ، 3 ، 4 ، 5 ، 6]. اکثر آنها دستگاه های مختلف را بر اساس دقت آنها ارزیابی می کنند و مقادیر عملکرد اندازه گیری شده را با داده های صحت زمین مقایسه می کنند. آنها نتیجه می گیرند که دستگاه ها دقت نسبی قابل قبولی را ارائه می دهند، به عنوان مثال، از نظر مسافت تحت پوشش. با این حال، اگر دقت مطلق بالا مورد نیاز باشد، دقت معمول GPS غیر دیفرانسیل تنها 3 متر در بهترین حالت کافی نیست. برعکس، در ردیابی مبتنی بر ویدئو، دقت هندسی بالا است و بین 0.5 تا چند سانتی‌متر متغیر است [ 1 ]. بررسی گسترده ای از تحلیل حرکت مبتنی بر بینایی توسط باریس و باتن [ 7 ] ارائه شده است]. آنها بر حوزه ورزش تمرکز می کنند و محدودیت ها و قابلیت اطمینان سیستم های ردیابی مختلف را مورد بحث قرار می دهند. اغلب، آهنگ های ویدئویی به صورت دستی یا نیمه خودکار ارزیابی می شوند. وقتی صحبت از سیستم های خودکار می شود، باریس و باتن به مشکلات ردیابی اشیاء در محیط های پویا و شلوغ اشاره می کنند که منجر به مسیرهای ناقص می شود.

به طور خلاصه، ردیابی GPS به طور کلی فاقد دقت مطلق لازم است، و ردیابی مبتنی بر ویدئو اغلب از کامل بودن کمتری ناشی از مشکلات تشخیص و ردیابی که عمدتاً ناشی از انسداد اشیا است، رنج می‌برد.

رویکردهای مختلفی برای مقابله با این مشکل وجود دارد. اغلب، از دوربین های متعدد برای دریافت دیدگاه های مختلف در مورد اشیا استفاده می شود [ 1 ، 8 ، 9 ، 10 ]. با این حال، چنین راه‌حل‌هایی به مکان‌های نصب مناسب برای دوربین‌ها، تلاش برای راه‌اندازی مربوطه نیاز دارند و معمولاً گران هستند. به عنوان مثال، سیستم های ردیابی دوربین حرفه ای به 6 تا 8 دوربین سطح بالا نیاز دارند. سایر کارهای مرتبط یا بر استفاده از هیستوگرام مولفه های رنگی RGB یا HSV تشخیص اشیاء [ 11 ]، الگوهای حرکتی [ 12 ] یا ویژگی های مستطیل علاوه بر هیستوگرام های جهت یاب [ 13 ] تمرکز دارند.] برای ردیابی و تمایز بین چندین شی.

پرداختن به این مشکل با استفاده از گیرنده‌های جی‌پی‌اس دیفرانسیل که می‌توانند با دقت بسیار بالایی (تا 1 سانتی‌متر) بومی‌سازی شوند، منجر به این می‌شود که هر یک از اجسام مشاهده شده باید به چنین دستگاهی مجهز شوند. این امر به خصوص در حوزه ورزش عملی نیست.

رویکرد ما ترکیب هر دو فناوری و در نتیجه بهره برداری از نقاط قوت نسبی آنها و کاهش نقاط ضعف آنهاست. به این معنی که ردیابی GPS مسیرهای پیوسته اجسام منفرد را فراهم می کند، اما معمولاً دقت موقعیتی پایینی دارند. از سوی دیگر، دوربین‌ها دقت هندسی بالاتری ارائه می‌دهند، اما مستعد انسداد اجسام هستند که منجر به قطع یا ناقص مسیرها می‌شود. در مورد ما، ما مسیرهای GPS را با استفاده از موقعیت‌های دقیق دریافتی از ردیابی ویدیو بهبود می‌بخشیم. برای انجام این کار، باید داده های هر دو منبع را ترکیب کنیم. این نوع مشکل را می توان به راحتی به عنوان یک شبکه بیز پویا مدل کرد، که در آن حالت در مراحل زمانی گسسته پیشرفت می کند، مشاهدات اندازه گیری موقعیت هستند. و تکالیف ناشناخته بین GPS و مشاهدات ویدیویی حالت های پنهانی هستند که باید تخمین زده شوند. از آنجایی که این شکل از یک مدل پنهان مارکوف (HMM) [14 ] یک شبکه خطی بدون چرخه است، که امکان حل دقیق و کارآمد محتمل‌ترین تخصیص شیء را با استفاده از الگوریتم معروف Viterbi [ 15 ] فراهم می‌کند. مناسب بودن آن نیز در کاربردهای مشابه نشان داده شده است [ 16 ، 17 ]. مزیت استفاده از این الگوریتم در رویکرد ما این است که اگر ردیابی ما به دلیل اشیاء مسدود شده یا گم شده با شکست مواجه شود، می تواند اشیاء را پس از روشن شدن وضعیت “بازیابی” کند و بر خلاف آنچه کاملاً محتمل است مسیر آنها را ردیابی کند. روش های مبتنی بر ویدئو

ساختار باقی مانده این مقاله به شرح زیر است. در بخش بعدی، این رویکرد شامل روش‌های جمع‌آوری و پردازش داده‌ها به تفصیل شرح داده می‌شود. پس از آن، یک آزمایش ارائه می شود و پس از ارائه و بحث در مورد نتایج. مقاله با یک نتیجه گیری و چشم انداز بسته شده است.

2. روش های اکتساب و پردازش داده ها

2.1. رویکرد

با توجه به یک سناریوی فوتبال، تنظیمات برای وظیفه ردیابی به شرح زیر است: ما یک دوربین برای مشاهده کل صحنه داریم. در مرحله بعد، هر فرد مشاهده شده را به یک واحد GPS مجهز می کنیم. بسته به سخت افزار مورد استفاده، رویکرد ما می تواند به صورت متمرکز یا غیرمتمرکز طراحی شود [ 18 ]. مورد دوم به حسگرهایی نیاز دارد که قادر به انجام محاسبات و همچنین انتقال نتایج جمع شده خود باشند. از طرف دیگر، اگر حسگرها قادر به برقراری ارتباط نباشند، داده‌های ثبت شده می‌توانند پس از آن منتقل و پردازش شوند. از آنجایی که دستگاه‌های GPS ما فقط می‌توانند داده‌ها را ثبت کنند، همه داده‌ها (از GPS و دوربین) را در یک پردازنده مرکزی پردازش می‌کنیم. همانطور که در شکل 1 نشان داده شده است ، حسگرها داده ها را در قالب نقاط ردیابی ( tp، شناسه واحد GPS) و تشخیص های دوربین (d _i ، دوربین)، که مجموعه های اطلاعاتی هستند که حداقل موقعیت شی و مهر زمانی را در بر می گیرند. مورد دوم در مواردی که هیچ هماهنگی زمانی بین دوربین و دستگاه های GPS وجود ندارد ضروری است.

بخش‌های زیر فرآیندهای متوالی را طبق طرح شکل 1 ، از داده‌های ورودی تا مسیرهای نهایی توصیف می‌کنند.

شکل 1. ساختار کلی رویکرد ما.

2.2. داده های ورودی از سنسورها

داده های GPS: دستگاه های GPS مورد استفاده بسته به مشخصات آنها داده های موقعیت سه بعدی را با نرخ 1 تا 10 هرتز ارائه می دهند. در موارد حرکات کاملاً سریع با چرخش‌های مکرر، همانطور که در حوزه ورزش اتفاق می‌افتد، وضوح‌های زمانی با نرخ به‌روزرسانی ۱ هرتز یا کمتر می‌تواند برای ثبت حرکات با جزئیات کامل بسیار کم باشد [ 2 ، 3 ]. به منظور استفاده معقول از داده ها برای رویکرد ما، نرخ حداقل 5 هرتز مورد نیاز است. یک نقطه ردیابی (tp)، از یکی از دستگاه ها در یک مرحله زمانی به شکل tp _i = ( موقعیت، مهر زمان، اعتراض ) _i است.

داده های دوربین: در آزمایش های خود، وضعیت را با استفاده از GPS و داده های دوربین به طور همزمان به روز می کنیم. بنابراین، ما فقط باید داده های موقعیت را از دوربین با همان نرخ نمونه برداری GPS دریافت کنیم. موقعیت‌های شیء از طریق جریان ویدئو با استفاده از الگوریتم‌های پردازش تصویر، که بر فریم‌های متوالی ضبط‌شده توسط دوربین اعمال می‌شوند، تعیین می‌شوند. برای این منظور چندین روش برای تشخیص اشیاء در تصاویر وجود دارد. در [ 19 ] یک مرور کلی داده شده است. از آنجایی که ما از تنظیمات دوربین ثابت بدون هیچ حرکت یا زوم دوربین استفاده می‌کنیم، می‌توانیم از الگوریتم تفریق پس‌زمینه [ 20 ] برای تشخیص تغییرات (نگاه کنید به شکل 2 ب) در مقابل یک پس‌زمینه به‌طور مداوم استفاده کنیم ( شکل 2 را ببینید).آ). نتایج با استفاده از عملیات مورفولوژیکی، و همچنین محدودیت‌های هندسی و مکانی برای حذف بیشتر سیگنال‌های نادرست فیلتر می‌شوند. متعاقباً، تغییرات پردازش می‌شوند تا به اشیاء بالقوه در هر فریم زمانی منجر شوند، که عمدتاً جعبه‌هایی را با اطلاعات اضافی محدود می‌کنند، که در ادامه این مقاله آن‌ها را «تشخیص» می‌نامیم.

یک شی فرضی (در اینجا یک شخص) با یک جعبه محدود نشان داده می شود. موقعیت جسم توسط مرکز پایین جعبه مرزی تعیین می شود ( شکل 2 ج). برخلاف نقاط ردیابی GPS که دارای شناسه‌های منحصر به فرد شی هستند، تشخیص دوربین به اشیا اختصاص داده نمی‌شود. برای فرآیند همجوشی در مرحله بعد، ما یک بردار ویژگی را به مشاهدات خود اضافه می کنیم که برای هر منطقه شناسایی شده در تصویر دوربین محاسبه می شود. ما از یک هیستوگرام استفاده کردیم که توزیع مقادیر رنگ را در داخل شکل تشخیص ثبت می کند. بنابراین، اطلاعات دریافتی از دوربین در یک مرحله زمانی، تشخیص های D = { d ₁ , d ₂ , …, d _m } با d _i = (موقعیت، مهر زمانی، هیستوگرام ) _i . این پیش‌فرض می‌گیرد که تشخیص‌ها اشیاء منفرد را نشان می‌دهند، اما وقتی افراد نزدیک به یکدیگر هستند، می‌توان آنها را نقض کرد.

شکل 2. ( الف ) تصویر پس زمینه صحنه مشاهده شده. ( ب ) تغییرات شناسایی شده. ( ج ) ردیابی اشیاء به دست آمده توسط کادرهای مرزبندی قرمز قاب شده است.

2.3. پیش پردازش داده ها

با توجه به این واقعیت که ما قصد داریم داده های منابع داده های مختلف را با سیستم های مختصات مختلف (داده های GPS و دوربین) ادغام کنیم، باید آنها را از نظر زمانی و “مکانی” همگام سازی کنیم. برای این منظور، هر دو را با استفاده از یک هموگرافی از پیش محاسبه‌شده برای داده‌های دوربین، به یک سیستم مختصات محلی مشترک تبدیل می‌کنیم. همگام سازی زمانی با کمک مهرهای زمانی انجام می شود. داده های ادغام شده ورودی روش فیوزینگ هستند ( شکل 1 را ببینید ).

2.4. همجوشی داده ها

ادغام نقاط ردیابی ورودی دوربین با مسیرهای GPS بر اساس HMM و الگوریتم Viterbi است که محتمل ترین مسیرهای اجسام مشاهده شده را تعیین می کند. همانطور که به صورت شماتیک در شکل 3 نشان داده شده است، چالش شناسایی نقاط داده مربوطه بین تشخیص دوربین از یک سو و مسیرهای GPS از سوی دیگر است.

شکل 3. وظیفه تخصیص داده ها: تنظیم اولیه شامل دو مسیر GPS پیوسته (نقاط قرمز و زرد متصل) و تشخیص های دوربین تعیین نشده (جعبه های آبی جدا شده)، هر دو در سیستم مختصات محلی مشترک است. پیشرفت زمانی در زیر نشان داده شده است.

2.4.1. مدل های پنهان مارکوف

از آنجایی که توضیحات و آموزش های متعددی در مورد HMM ها وجود دارد [ 14 ، 21 ، 22 ]، ما فقط آنها را به اختصار معرفی می کنیم و بر روی سازگاری های خود تمرکز می کنیم. HMM ها به صورت پنج گانه تعریف می شوند

λ = (S; V; A; B; π)

، جایی که

S = {S_{1}, S_{2}, \dots, S_{m},}

ایالت ها هستند و

V = {V_{1}, V_{2}, \dots, V_{n},}

مشاهدات علاوه بر این،

A = { a _ij }، a _ij = P ( S _j ( t + 1)| S _i ( t ))

(1)

احتمالات انتقال حالت هستند که t مرحله زمانی است،

B = { b _jk }، b _jk = P ( V _k ( t )| S _j ( t ))

(2)

احتمالات اندازه گیری تحت شرایطی هستند که حالت واقعی S _j و است

π = {π من} π من = پ (اس من (t = 0))

(3)

احتمالات حالت اولیه هستند.

در مورد ما، ما قصد داریم موقعیت‌های GPS اشیاء را با استفاده از موقعیت‌های دقیق‌تر به‌دست‌آمده از طریق ردیابی ویدیویی بهبود دهیم. بنابراین، نمایش در قالب HMM به شرح زیر است. حالت فعلی (پنهان) S شامل موقعیت تخمینی، انتساب به یک منطقه شناسایی شده در تصویر دوربین و هیستوگرام رنگ است. مشاهدات Vبا موقعیت های اندازه گیری شده توسط دوربین و سنسور GPS داده می شود. ما تغییرات زیادی در این مدل ایجاد کرده ایم. اول، از آنجایی که انحرافات استاندارد اندازه گیری موقعیت دوربین بسیار کوچکتر از اندازه گیری های GPS است، بهترین تخمین موقعیت تقریباً مستقل از موقعیت GPS خواهد بود. همچنین، ما تا کنون یک مدل سینماتیکی (به عنوان مثال، شتاب، سرعت، پارامترهای عنوان) را به حالت و انتقال حالت وارد نکرده‌ایم. این دو اصلاح منجر به یک نمایش ساده می‌شود که در آن مولفه موقعیت حالت بر روی اندازه‌گیری موقعیت دوربین به دست آمده از ناحیه تصویر اختصاص‌یافته تنظیم می‌شود. بنابراین، با توجه به یک حالت، احتمال اندازه گیری Bفقط به فاصله بین مؤلفه موقعیت وضعیت و موقعیت GPS بستگی دارد که به نوبه خود فاصله بین دوربین و اندازه گیری موقعیت GPS است.

احتمالات انتقال حالت B با مقایسه بردارهای ویژگی حالت های متوالی محاسبه می شود. در مورد ما، از شباهت های هیستوگرام و محدودیت های مدل حرکتی استفاده می کنیم. به عنوان اندازه گیری شباهت هیستوگرام، از تقاطع هیستوگرام استفاده می کنیم، که مقادیری را در محدوده بین 0 (بدون شباهت) و 1 (برابر) ارائه می دهد و به صورت تعریف می شود.

p (اچ 1 ، اچ 2) = \sum من دقیقه [اچ 1 (من) ، اچ 2 (من)]

(4)

جایی که من تمام مقادیر رنگ را ایندکس می کنم. مجدداً، ما مدل را از این نظر ساده می کنیم که هیستوگرام رنگ را در وضعیت فعلی فیلتر نمی کنیم. بنابراین، پس از تخصیص یک منطقه تصویر، هیستوگرام رنگ در وضعیت با هیستوگرام رنگ به دست آمده از ناحیه تصویر جایگزین می شود (و به روز نمی شود).

جزء دوم احتمالات انتقال یک تابع نشانگر است که اگر موقعیت بعدی در دسترس موقعیت قبلی باشد، 1 است. یعنی ما نیاز داریم که سرعت v اجسام کمتر یا برابر با حداکثر سرعت باشد

v ≤ v _حداکثر

(5)

که در آن v _max بسته به سناریو انتخاب می شود.

یکی دیگر از اصلاحات اساسی مربوط به محاسبه همزمان چند مسیر است. تا اینجا، ما HMM را برای حالتی توصیف کرده‌ایم که از یک موقعیت، تخصیص و هیستوگرام رنگ تشکیل شده است. با این حال، ما علاقه مند هستیم که چندین مسیر را به طور همزمان اختصاص دهیم، زیرا یکی از اهداف اصلی کشف تخصیص صحیح برای چندین مسیر است، به خصوص اگر آنها نزدیک به یکدیگر باشند. یعنی ما به تخصیص منحصر به فرد موقعیت های GPS به مناطق تصویر علاقه مند هستیم. مشابه [ 23 ]، ما حالات خود را به گونه‌ای تعریف می‌کنیم که به جای تخصیص‌های منفرد، چندین تکالیف را شامل شود. این تاپل ها تغییرات مجموعه فعلی تشخیص ها هستند. به عنوان مثال، با توجه به مجموعه l = 3 تشخیص { F ، G، H } همانطور که در مرحله 2 زمانی رخ می دهد ( شکل 3 ) و مشاهده k = 2 شی، وجود دارد

m = \frac{l!}{(l - k)!} = 6

تکالیف ممکن بدون تکرار، یعنی {( F , G ), ( F , H ), ( G , F ), ( G , H ), ( H , F , ( H , G ) } . بنابراین، هر توالی حالت، دنباله ای از تاپل های انتساب را تعریف می کند.

علاوه بر این، ما باید مشکل اشیاء کشف نشده را که یا مسدود شده اند یا میدان دید را ترک کرده اند، حل کنیم. برای این منظور، تخصیص های ساختگی را اضافه می کنیم که نشان دهنده وضعیت “تشخیص نشده” است. از آنجایی که این «تشخیص‌های مجازی» نشان‌دهنده اندازه‌گیری‌های گمشده هستند، تأثیر آنها این است که موقعیت قبلی و هیستوگرام رنگ (در حالت) بدون تغییر باقی می‌مانند. در مثال قبلی، مجموعه تشخیص‌ها به { F ، G ، H ، Ø } تغییر می‌کند که Ø تشخیص ساختگی است. مجموعه تخصیص به m = 12 + 1 = 13 عنصر افزایش می یابد. توجه داشته باشید که یک تکلیف اضافی وجود دارد ( Ø ، Ø) برای حالتی که هر دو شی شناسایی نمی شوند. در شکل 4 HMM برای مثال داده شده در شکل 3 نشان داده شده است.

شکل 4. HMM برای چندین مسیر. در بالا، شبکه پویا بیز توسط توالی حالت ها (به رنگ سفید) تشکیل شده است. گره های رنگی زیر مقادیر حالت ممکن (تعددهای انتساب) برای توالی حالت S1 تا S6 هستند. رنگ ها تعداد تکالیف ساختگی را رمزگذاری می کنند (سبز: فقط واقعی؛ زرد: حداقل یک ساختگی؛ قرمز: فقط تکالیف ساختگی). لبه های خاکستری نمادی از احتمالات انتقال بین حالت های مربوطه است (برای انتقال بین t ₀ و t ₁ نشان داده شده است ).

حالت های اولیه مدل ما با احتمالات توزیع شده یکنواخت مقداردهی اولیه می شوند:

π من = 1 متر

(6)

به طور موثر، این بدان معنی است که ما از یک پیشین غیر اطلاعاتی استفاده می کنیم، به عنوان مثال ، محتمل ترین مسیرها به حالت اولیه بستگی ندارند.

از آنجایی که حالت اکنون شامل تاپل های انتساب است، باید بر این اساس، انتقال حالت و احتمالات اندازه گیری را اصلاح کنیم. در مورد انتقال حالت، ما شباهت های هیستوگرام را به عنوان احتمالات متغیرهای تصادفی مستقل در نظر می گیریم به طوری که احتمال مشترک آنها توسط حاصل ضرب احتمالات حاشیه ای آنها به دست می آید. بنابراین، اگر تاپل‌های S ₁ و S ₂ با K تعداد اجسام و H _{1، i} و H _{2 داده شوند، i} به ترتیب هیستوگرام i ام تاپل اول و دوم است.

p (اس 1 ، اس 2) = \prod i = 1 ، \dots ، K p (اچ 1 ، i ، اچ 2 ، i) = \prod i = 1 ، \dots ، K \sum من دقیقه [اچ 1 ، i (من) ، اچ 2 ، i (من)]

(7)

شباهت کلی است، و از آنجایی که علاوه بر این یک محدودیت حداکثر سرعت را اعمال می کنیم، احتمالات انتقال حالت زیر را به دست می آوریم:

آ من ج = {p (اس من ، اس j) ، v \leq v m a x 0, o t h e r w i s e

(8)

در مورد اندازه‌گیری‌ها، ما مشاهدات GPS را مستقل و به طور یکسان نرمال توزیع می‌کنیم. بنابراین، احتمالات آنها را با توجه به حاصل ضرب چگالی آنها مدل می کنیم

ب j k = \prod من 1 2 π - - \sqrt σ جی پی اس ه - 1 2 ∙ د 2 من σ 2 جی پی اس = 1 2 π - - \sqrt σ جی پی اس ک ه - 1 2 Σ من د 2 من σ 2 جی پی اس

(9)

جایی که d _i فواصل اقلیدسی زوجی بین موقعیت‌های حالت S و موقعیت‌های مشاهدات اختصاص داده شده (GPS) V است. عدم دقت GPS با استفاده از انحراف استاندارد σ _GPS مدل‌سازی می‌شود .

2.4.2. الگوریتم ویتربی

ما به مشکل تعیین توالی حالت محتمل می پردازیم

S_{V} = (S_{1}, \dots, S_{T}) \in S

، با توجه به توالی مشاهدات

O = (o_{1}, \dots, o_{T}) \in V

با اعمال الگوریتم ویتربی [ 15 ]. به صورت بازگشتی کار می کند و به طور موثر با استفاده از برنامه نویسی پویا پیاده سازی می شود. الگوریتم را می توان با مراحل زیر خلاصه کرد. در حالی که

S_{V_{t}}^{*}

محتمل ترین سلف حالت را در مرحله زمانی t دارد، P _t احتمال محتمل ترین توالی حالت است.

مقداردهی اولیه

پ t = 0 (اس من) = π من ∙ ب 0 ، i, 1 \leq i \leq m

(10)

بازگشت

پ تی (اس من) = ب t ، i \cdot حداکثر 1 \leq j \leq m (آ j i \cdot پ t - 1 (اس j)) 1 \leq i \leq m, 1 \leq t \leq T

(11)

اس * V ، تی (اس من) = a r g m a x 1 \leq j \leq m (آ j i \cdot پ t - 1 (اس j)) 1 \leq i \leq m, 1 \leq t \leq T

(12)

عقب نشینی

اس V ، تی = اس * V ، t + 1 (اس V ، t + 1)

(13)

در شکل 5 ، فرآیند و محتمل ترین مسیر (که مسیر ویتربی نیز نامیده می شود) برای مثال ارائه شده در شکل 3 به تصویر کشیده شده است. گره‌های محاصره‌شده آبی مسیر Viterbi را تشکیل می‌دهند که نشان‌دهنده توالی تخصیص‌ها و موقعیت‌ها برای هر دو مسیر جسم است.

2.5. مسیرهای خروجی

با محاسبه مسیر Viterbi، می‌توانیم مسیرهای هر شی را ایجاد کنیم. برای این منظور ما مسیر را دنبال می کنیم و به سادگی موقعیت ها را در حالت (که در مورد ما با موقعیت های تشخیص تصویر اختصاص داده شده مطابقت دارد) همراه با مهرهای زمانی آنها (نگاه کنید به شکل 6 ) خروجی می دهیم.

شکل 5. مسیر Viterbi حاصل (آبی) برای مثال داده شده.

شکل 6. مسیرها (قرمز، نارنجی) از تاپل های تخصیص موجود در گره های مسیر Viterbi تولید می شوند. برخی از تشخیص ها دور ریخته شده اند (جعبه های خاکستری جدا شده).

2.6. عملکرد الگوریتم

عملکرد الگوریتم ما به تعداد اشیاء مشاهده شده و تشخیص دوربین در هر مرحله زمانی بستگی دارد که تعداد حالت های ممکن m را تعیین می کند . سپس پیچیدگی الگوریتم ویتربی ^O( m2 t ) است که t تعداد مراحل زمانی است. بنابراین، استفاده از یک الگوریتم کارآمد تشخیص اشیا، که تعداد تشخیص های نادرست را به حداقل می رساند، مهم است.

3. بخش تجربی

3.1. آزمایش

از آنجایی که ما قصد داریم یک راه حل ردیابی ایجاد کنیم که مسیرهای دقیق، کامل و صحیح شی را ارائه دهد، سه آزمایش طراحی کرده ایم. در این آزمایش‌ها، داده‌هایی تولید می‌شوند که از آنها برای تجزیه و تحلیل عملکرد الگوریتم خود استفاده می‌کنیم. در آزمایش اول ما دقت محلی سازی ردیابی GPS و ردیابی مبتنی بر دوربین را تجزیه و تحلیل می کنیم. در آزمایش دوم ما بر کیفیت ردیابی، به ویژه کامل بودن و درستی مسیرهای حاصل تمرکز می کنیم. از طریق آن آزمایش، ما می‌خواستیم ثابت کنیم که رویکرد ما قادر به مدیریت موقعیت‌هایی است که در آن اشیا برای مدتی دور از دید هستند. در آخرین آزمایش ما می‌خواستیم توانایی ردیابی چندین شی را نشان دهیم، حتی اگر آنها بسیار شبیه و گاهی مسدود شده باشند.

در همه آزمایش‌ها، ما سعی می‌کنیم نتایج رویکردمان را با نتایج یک نسخه ویدیویی از رویکردمان و ردیابی‌های GPS مقایسه کنیم. برای به دست آوردن نتایج یک روش کاملاً مبتنی بر ویدیو، الگوریتم خود را برای بار دوم بدون استفاده از اطلاعات GPS اجرا کردیم. سپس تخصیص منحصراً بر اساس هیستوگرام های رنگی اشیا و محدودیت های مدل حرکت است.

3.2. راه اندازی آزمایشی

3.2.1. آزمایش 1 – دقت

در آزمایش اول، افراد مشاهده شده را به ثبت‌کننده‌های GPS مجهز کردیم که از ثبت 5 هرتز پشتیبانی می‌کنند. سازنده دقت موقعیت آنها را با 3.0 متر 2D-RMS بدون کمک مشخص می کند. یک دوربین گوشی هوشمند با وضوح فول اچ دی (1920 × 1080 پیکسل) با قابلیت فوکوس خودکار غیرفعال استفاده شد. برای اینکه زاویه دید بهتری در صحنه داشته باشد، در مکان بالاتری قرار گرفت. نقشه طرح در شکل 7 تنظیمات را در نمای بالا نشان می دهد.

برای تعیین دقت، یک فرد چندین دور را روی یک مسیر مستطیلی از پیش تعریف شده حرکت می دهد ( شکل 7 را ببینید ). علاوه بر این، به فرد دستور داده می‌شود که برای هر دور، راه رفتن، دویدن و دویدن با سرعت بیشتری حرکت کند. به عنوان داده های حقیقت زمین، اتصالات خطی بین چهار نقطه گوشه را فرض می کنیم که مختصات آن مشخص است.

شکل 7. نمای کلی تنظیمات آزمایش اول و دوم: نقاط بین چهار نقطه لبه برای آزمایش اول با رنگ قرمز مشخص شده اند. ردهای خاکستری محل تشخیص دوربین هستند.

3.2.2. آزمایش 2 – کامل بودن و درستی

در آزمایش دوم از همان تنظیمات فنی و نصبی آزمایش قبلی استفاده می کنیم. ما دو نفر را به مدت حدود 4 دقیقه (نرخ نمونه برداری 5 هرتز از واحدهای دوربین و GPS) مشاهده می کنیم که به طور تصادفی در صحنه حرکت می کنند، با نزدیک شدن به یکدیگر باعث انسداد می شوند و حتی میدان دید را ترک می کنند. این بار، داده های حقیقت زمینی با تخصیص دستی تشخیص دوربین به افراد تولید می شود. ما هیچ خط سیر حقیقت زمینی را به عنوان مرجعی برای مقایسه نداریم، زیرا این آزمایش به منظور ارزیابی تکالیف است. از آنجایی که ما از تجهیزات فنی و نصب یکسانی استفاده می کنیم، دقت را همانند آزمایش اول فرض می کنیم. با این حال، با کمک داده های حقیقت زمینی موجود می توانیم صحت انتساب ها را ارزیابی کنیم. که در واقع هدف این آزمایش است. ما از تنظیمات پارامتر زیر استفاده کردیم: σ_GPS = 12 m , v _max = 8 m / s .

3.2.3. آزمایش 3 – ردیابی چند شی

آخرین آزمایش شامل ردیابی 4 بازیکن از 16 بازیکن در طول یک بازی فوتبال است. برای این آزمایش ما از یک مجموعه داده فوتبال منتشر شده توسط Fraunhofer ISS در ارتباط با چالش داده ACM DEBS 2013 استفاده می کنیم [ 24 ]]. این شامل یک ویدیو (1920 × 1080 پیکسل) و همچنین مسیر حرکت 16 بازیکن، یک داور و توپ های استفاده شده است. مسیرها توسط سیستم ردیابی مبتنی بر رادیویی خود با دقت بالای چند سانتی متری ثبت شده است. از آنجایی که این کمی بهتر از چیزی است که ما از ما انتظار داریم، از آنها به عنوان مسیرهای مرجع استفاده می کنیم. از آنجایی که هیچ اطلاعات GPS در این مجموعه داده وجود ندارد، ما آن را با اضافه کردن نویز به مسیرهای مرجع بسیار دقیق تولید کرده‌ایم. برای تقلید از عدم دقت GPS، ما از یک تغییر سیستماتیک کل مسیر در جهت تصادفی و نویز توزیع شده نرمال با انحراف استاندارد 5 متر استفاده کردیم. در ادامه لازم به ذکر است که بازیکنان هر تیم دارای لباس های مشابه هستند. به همین دلیل تشخیص ها نیز هیستوگرام های رنگی مشابهی خواهند داشت. این مهم است، زیرا رویکرد ما از هیستوگرام برای تمایز بین اشیا استفاده می کند. بنابراین در این آزمایش می‌خواهیم نشان دهیم که رویکرد ما قادر به مقابله با چندین اشیاء رنگی مشابه است. تنظیم پارامتر این است: σ_GPS = 12 m , v _max = 8 m / s .

4. نتایج

4.1. آزمایش 1 – دقت

در شکل 8، نتایج آزمایش اول تجسم می شود. همانطور که انتظار می رفت، دوربین به طور قابل توجهی دقیق تر از اندازه گیری GPS مستقل است. خطای مسیر دوربین عمدتاً به الگوریتم تشخیص شی مورد استفاده بستگی دارد. در مورد ما، الگوریتم تفریق پس‌زمینه تشخیص‌هایی را با انحراف استاندارد حدود 0.25 متر نسبت به مسیر حقیقت زمین ارائه می‌کند. لطفا توجه داشته باشید که این خطا توسط شخص ردیابی شده نیز ایجاد می شود که دقیقاً در مسیر تعریف شده حرکت نمی کند. ما مسیر GPS را با استفاده از مسیر به‌دست‌آمده از مشاهدات دوربین به‌عنوان حقیقت زمین ارزیابی کردیم و انحراف معیار تقریباً 10 متر را به‌دست آوردیم. ما روش‌های صرفا مبتنی بر ویدیو را با رویکرد ترکیبی خود از نظر دقت مقایسه نمی‌کنیم، زیرا هر دو از تشخیص‌های دوربین یکسانی استفاده می‌کنند و بنابراین دقت یکسانی را به دست می‌دهند.

شکل 8. مسیرهای حاصل از آزمایش دقت: GPS (سیاه) و نتیجه رویکرد ما (قرمز). نقطه ها موقعیت فعلی شی هستند که توسط GPS (سیاه) و رویکرد ما (قرمز) تعیین می شود. چند ضلعی حقیقت زمین با یک خط آبی چین مشخص شده است.

حداقل دو موضوع دیگر وجود دارد که بر بومی سازی دقیق افراد با رویکرد فعلی ما تأثیر می گذارد. اول، به شدت به نحوه شناسایی موقعیت بستگی دارد. به عنوان مثال، ما تشخیص را به عنوان یک جعبه مرزی نشان می‌دهیم و از مرکز پایین این کادر برای تعیین موقعیت فرد استفاده می‌کنیم، با این فرض که این یک نمایش به اندازه کافی دقیق از مرکز بدن (ساختی) است که به زمین می‌تابد. با این حال، اگر شخصی دست یا پای خود را دراز کند، این نقطه دیگر نشان دهنده درستی از مرکز بدن نخواهد بود. دوم، خطای محلی سازی مربوط به فاصله جسم تا دوربین است. با توجه به پرسپکتیو تصویر، خطا در ناحیه مشاهده شده همگن نیست، بلکه با افزایش فاصله افزایش می یابد. در شکل 9b (منطقه C)، این اثر را می توان به وضوح در قسمت پایین سمت چپ زمین فوتبال مشاهده کرد، جایی که به نظر می رسد مسیرها به شدت ناهموار هستند.

4.2. آزمایش 2 – درستی تکالیف

نتایج آزمایش دوم ما با دو نفر در شکل 9 a,b نشان داده شده است. با توجه به این واقعیت که ردیابی GPS نمی تواند منجر به تخصیص اشتباه شود، ما فقط راه حل ترکیبی خود را با داده های حقیقت زمینی تولید شده مقایسه می کنیم. برای انجام این کار، مطابق جدول 1 ، تعداد تخصیص صحیح و نادرست را محاسبه کردیم. ما نسبت فراخوانی 94.2% و 5.8% خطاها را برای تعداد کل 2238 شناسایی به دست آوردیم. لطفاً توجه داشته باشید که تشخیص‌های حاوی مناطق تصویر ادغام شده از هر دو نفر، ناشی از انسداد جزئی، در داده‌های حقیقت زمینی اشتباه علامت‌گذاری شده‌اند، زیرا نتوانستیم آنها را به‌طور واضح برچسب‌گذاری کنیم. بنابراین، اگر مدیریت حباب‌های ادغام‌شده را بهبود ببخشیم، نسبت فراخوانی بهتر و تعداد تشخیص‌های نادرست کمتری را انتظار داریم. همچنین خطاهایی در تشخیص‌ها همچنان شامل می‌شوند، مانند تشخیص اشتباه ناشی از حرکت اجسام در پس‌زمینه. بنابراین نرخ خطای حدود 10% را می توان با تنظیم الگوریتم تشخیص، به عنوان مثال، با مشخص کردن منطقه مورد نظر، کاهش داد. در شکل 9c مسیرها نشان داده می شوند که در صورت عدم استفاده از اطلاعات GPS نتیجه می گیرند. در این تنظیمات، که در آن افراد لباس مشابهی ندارند، مسیرها نیز خوب به نظر می رسند، به جز برخی از تکالیف نادرست، که می توانند به عنوان پرش در ردیابی (خطوط مستقیم طولانی) شناسایی شوند. بر این اساس مقادیر عملکرد کمتر است.

جدول 1. عملکرد الگوریتم ردیابی ما.

علاوه بر این، ما نگاه دقیق‌تری به موقعیت‌هایی داشتیم که به نظر می‌رسد در بسیاری از راه‌حل‌های ردیابی مبتنی بر ویدیو مشکل‌ساز هستند. این رویکرد همچنین قادر به رسیدگی به موقعیت هایی است که یک شی از صحنه خارج شده و دوباره وارد صحنه می شود. به عنوان مثال، در ناحیه A از شکل 9 ب، مسیر قرمز رنگ از مرز سمت راست تصویر خارج می شود و دوباره در زمان بعدی ظاهر می شود ( شکل 10 را ببینید ). علاوه بر این، چندین فریم وجود دارد که در آن شخص توسط شخص دیگری یا توسط مانعی مانند میله پرچم در سمت چپ مسدود می شود. به عنوان مثال، یکی از آنهایی را که به ترتیب در ناحیه B شکل 9 b و در شکل 11 قرار دارند نشان می دهیم. در این موارد، الگوریتم موفق می شود تا زمان روشن شدن وضعیت، تخصیص صحیح را حفظ کند.

شکل 9. نتایج آزمایش دوم: ( الف ) صحنه ای که هم اشیاء ردیابی شده و هم مسیر آنها را در بر می گیرد. ( ب ) نمای بالای مجموعه داده کامل شامل مسیرهای تولید شده توسط GPS (هر دو به رنگ سیاه) و رویکرد ما (قرمز، سبز). علاوه بر این، سه منطقه A، B و C (آبی) مشخص شده‌اند که شامل موقعیت‌هایی است که در متن به آنها اشاره شده است. ( ج ) نتیجه زمانی که از اطلاعات GPS استفاده نمی شود.

شکل 10. وضعیتی که در آن فرد میدان دید را برای حدود 8 ثانیه ترک می کند. الگوریتم موفق می شود تخصیص صحیح را حفظ کند (توالی از بالا سمت چپ به پایین سمت راست).

شکل 11. موقعیت دیگری که در آن فرد با علامت سبز برای حدود 1.5 ثانیه (8 فریم) مسدود شده است. پس از روشن شدن وضعیت، تکلیف به درستی ادامه می یابد.

در صورتی که یک تخصیص ناموفق باشد، الگوریتم Viterbi این توانایی را دارد که تخصیص ها را به صورت ماسبق تغییر دهد، برخلاف سایر الگوریتم های ردیابی که فقط قادر به تصمیم گیری برای مرحله زمانی فعلی هستند. این به دلیل این واقعیت است که الگوریتم Viterbi از همه مشاهدات برای محاسبه محتمل ترین مسیر استفاده می کند، در حالی که الگوریتم های ردیابی متوالی با توجه به همه مشاهدات قبلی، محتمل ترین حالت (جاری) را محاسبه می کنند. در شکل 12 مثالی برای چنین تصحیح انتساب به ماسبق نشان داده شده است. در حالی که در شکل 12 a آخرین قسمت های مسیرها با هم عوض شده اند (تخصیص صحیح فرد آبی پوش به مسیر قرمز است)، تخصیص ها در شکل 12 تصحیح شده اند.ب، چند قدم بعد. البته، این اصلاحات انتساب در صورت نیاز به تحلیل حرکت بلادرنگ مناسب نخواهد بود (مگر اینکه تاخیر زمانی قابل تحمل باشد).

4.3. آزمایش 3 – ردیابی چند شی

در شکل 13 و شکل 14 نتایج آزمایش سوم ما آورده شده است. این آزمایش نشان می‌دهد که رویکرد ما می‌تواند چندین اشیاء را که اغلب مسدود شده‌اند و لباس‌های مشابهی دارند، ردیابی کند. هنگام مقایسه مسیرهای حاصل با ردهای مرجع آنها (سیاه) در شکل 14 (سمت چپ) دقت کمتری را مشاهده می کنیم (که عمدتاً مشکل الگوریتم تشخیص اشیاء است) اما همچنین متوجه انتساب صحیح بازیکن می شویم. این را می توان با شکل بسیار مشابه مسیرهای مربوطه تشخیص داد. با این حال، گاهی اوقات بازیکنان به درستی ردیابی نمی شوند، اما زمانی که وضعیت روشن شد با موفقیت بازیابی می شوند. همانطور که در مثال نشان داده شده است، پخش کننده سبز با بازیکن دیگری در شکل 13 ادغام شده است(1) و به طور کامل در (2) گم شده است (نماد یک جعبه مرزی خاکستری رنگ است)، در (3) بازیابی شده و تا (4) با موفقیت ردیابی شده است. وقتی به بازیکن قرمز نگاه می کنیم که با بازیکن دیگری در (3) اشتباه گرفته شده و در (4) بهبود یافته است، وضعیت مشابه است. این اساساً می تواند به ادغام اطلاعات GPS برگردد. اگر از مکان های GPS استفاده نکنیم، نتیجه مانند شکل 14 (سمت راست) به نظر می رسد. این تعجب آور نیست، زیرا بازیکنانی که لباس یکسانی دارند را نمی توان بر اساس هیستوگرام رنگی تشخیص داد. در این مورد افزودن و/یا جایگزین کردن ویژگی‌ها (مانند موارد پیشنهادی در [ 11 ] یا [ 12 ]) قابلیت تمایز اشیاء را بهبود می‌بخشد.

شکل 12. مثالی برای تصحیح تخصیص “عطف به ماسبق”: ( الف ) آخرین قسمت های مسیر (جعبه زرد) به اشتباه اختصاص داده شده اند. ( ب ) تکلیف چند مرحله بعد تصحیح شده است.

مقادیر عملکرد تعیین‌شده در آزمایش‌های قبلی و توانایی توصیف‌شده برای رسیدگی به مسائل دشوار ردیابی نشان می‌دهد که ما اساساً به هدف خود برای به دست آوردن دقت اندازه‌گیری دوربین همراه با قابلیت اطمینان برچسب‌گذاری GPS دست یافتیم.

شکل 13. مسیرهای حاصل از رویکرد ما که توانایی مقابله با انسداد را نشان می دهد.

شکل 14. مسیرهای رنگی تولید شده بازیکنان ردیابی شده نزدیک به ردهای مرجع آنها (سیاه) است ( سمت چپ ). نقاط رنگی نشان دهنده موقعیت های فعلی بازیکن است که توسط رویکرد ما تعیین می شود. خاکستری ها موقعیت های مرجع هستند. مسیرهای به‌دست‌آمده از نسخه فقط ویدیویی رویکرد ما ( سمت راست ). به طور قابل توجهی، بازیکنان قرمز و سبز اغلب با بازیکنان دیگر مخلوط می شوند.

5. نتیجه گیری و چشم انداز

در این کار ما روشی برای ردیابی اشیا با ادغام دو فناوری ردیابی مختلف ارائه کرده‌ایم. با استفاده از یک مدل HMM و الگوریتم Viterbi، ما توانستیم داده‌های دستگاه‌های مختلف را ترکیب کنیم و مسیر اجسام را محاسبه کنیم. نتایج ارزیابی نشان می‌دهد که رویکرد ما قادر است تخصیص صحیح ردیابی GPS را با دقت هندسی ردیابی مبتنی بر ویدیو ترکیب کند.

الزامات کلی رویکرد ارائه شده به شرح زیر است: اول از همه، اشیاء مشاهده شده باید به سنسورهای GPS مجهز شوند که باید اطلاعات مکان خود را ارائه دهند. علاوه بر این، اجسام نیز باید توسط دوربین قابل تشخیص باشند، یعنی در بیشتر مواقع باید در میدان دید دوربین قرار گیرند. برای آزمایش‌های خود، از یک سیستم کم‌هزینه استفاده کردیم که شامل یک گوشی هوشمند و گیرنده‌های GPS ارزان‌قیمت است. موقعیت های GPS ثبت شد و همجوشی مسیر در پس پردازش بر روی رایانه شخصی محاسبه شد.

اگر حسگرهای GPS بتوانند مکان فعلی را به یک پردازشگر داده در زمان واقعی انتقال دهند (اگر دوربین هوشمند است، این می تواند خود دوربین باشد)، ردیابی شی آنلاین امکان پذیر است، به عنوان مثال ، یک راه حل بلادرنگ. این به دلیل پیچیدگی الگوریتمی O (m ²) برای هر فریم است که در آن mتعداد حالت های ممکن است که عمدتاً با تعداد شناسایی ها تعیین می شود. اگرچه نشان داده‌ایم که این رویکرد به خوبی کار می‌کند، اما چندین موضوع باز برای کار آینده وجود دارد. ابتدا، رویکرد ارائه شده را می توان پالایش و گسترش داد. به عنوان مثال، ما می‌توانیم یک مدل حرکت سینماتیکی برای اجسام و همچنین مدل‌سازی دقیق‌تری از مشاهدات را ادغام کنیم که اساساً منجر به یک مرحله فیلتر کالمن کامل برای متغیرهای حالت پیوسته می‌شود. این امر ادغام انواع دیگر مشاهدات را در فرکانس‌های اندازه‌گیری مختلف، به‌عنوان مثال، GPS و ردیابی رادیویی، ردیابی دوربین و رادیو یا ردیابی دوربین چندگانه، آسان‌تر می‌کند. با توجه به رویکرد پردازش تصویر ما، چندین پیشرفت ممکن وجود دارد. اگر اطلاعات قبلی در مورد موقعیت مورد انتظار در دسترس بود، تشخیص تصویر می‌تواند قوی‌تر شود. مانند موقعیت پیش بینی شده توسط یک مدل حرکت سینماتیکی. شباهت‌های ویژگی محاسبه‌شده، تا کنون شباهت‌های هیستوگرام‌های رنگی، می‌تواند با روش‌های همبستگی تصویر یا ردیابی گسترش یابد، که انتظار می‌رود اگر افراد لباس‌های رنگی مشابه بپوشند، بهتر عمل می‌کنند. همچنین ویژگی های حاصل از مشاهدات تصویر باید بخشی از حالت باشند تا در هر مرحله زمانی به جای جایگزینی به روز شوند.

علاوه بر این، این رویکرد را می توان به موارد استفاده دیگر خارج از حوزه ورزشی منتقل کرد. یک مثال نظارت بر سناریوهای ترافیکی است، مانند مشاهده مناطق عبوری یا مکان های شلوغ که می تواند توسط عابران پیاده و همچنین سایر کاربران جاده استفاده شود. این قطعاً می‌تواند توسط GPS یا ردیابی دوربین مستقل نیز انجام شود، اما در مواردی که دقت بالاتری مانند پیش‌بینی حرکت و تشخیص برخورد یا قابلیت اطمینان بالاتر مانند ردیابی اشیا در صحنه‌های شلوغ مورد نیاز است، این رویکرد می‌تواند مفید باشد برای مثال، داده‌های موقعیت مکانی مشترک تلفن‌های هوشمند یا داده‌های GPS خودرو که توسط سیستم‌های ناوبری ارائه می‌شوند را می‌توان با توالی‌های ویدئویی از دوربین‌های ترافیک موجود ترکیب کرد تا مسیرهای بسیار دقیق خودرو را به دست آورد.

منابع

صفحه اصلی: چشم شاهین. در دسترس آنلاین: http://www.hawkeyeinnovations.co.uk/?page_id=1011 (در 9 ژانویه 2015 قابل دسترسی است).
Coutts، AJ; دافیلد، آر. اعتبار و قابلیت اطمینان دستگاه‌های GPS برای اندازه‌گیری نیازهای حرکتی ورزش‌های تیمی. J. Sci. پزشکی ورزش 2010 ، 13 ، 133-135. [ Google Scholar ] [ CrossRef ] [ PubMed ]
گری، ای جی؛ جنکینز، دی. اندروز، MH; Taaffe, DR; Glover، ML اعتبار و قابلیت اطمینان GPS برای اندازه گیری مسافت طی شده در ورزش های تیمی مبتنی بر میدان. J. Sports Sci. 2010 ، 28 ، 1319-1325. [ Google Scholar ] [ CrossRef ] [ PubMed ]
جانستون، RJ; واتسفورد، ام ال. کلی، اس جی. Pine, MJ; Spurrs, RW اعتبار و قابلیت اطمینان واحدهای GPS 10 هرتز و 15 هرتز برای ارزیابی نیازهای حرکتی ورزشکاران. J. وضعیت قدرت. Res. 2013. [ CrossRef ] [ PubMed ]
راندرز، مگابایت؛ موجیکا، آی. هویت، ا. سانتیستبان، جی. بیشوف، آر. سولانو، آر. زوبیلاگا، ا. پلتولا، ای. کروستروپ، پی. Mohr, M. کاربرد چهار سیستم مختلف تجزیه و تحلیل مسابقات فوتبال: یک مطالعه تطبیقی. J. Sports Sci. 2010 ، 28 ، 171-182. [ Google Scholar ] [ CrossRef ] [ PubMed ]
وارلی، ام سی؛ Fairweather, IH; Aughey، RJ اعتبار و قابلیت اطمینان GPS برای اندازه گیری سرعت لحظه ای در حین شتاب، کاهش سرعت و حرکت ثابت. J. Sports Sci. 2012 ، 30 ، 121-127. [ Google Scholar ] [ CrossRef ] [ PubMed ]
باریس، اس. Button, C. مروری بر تحلیل حرکت مبتنی بر بینایی در ورزش. پزشکی ورزشی 2008 ، 38 ، 1025-1043. [ Google Scholar ] [ CrossRef ] [ PubMed ]
زینگ، جی. آی، اچ. لیو، ال. لائو، اس. ردیابی چند بازیکن در ویدیوی ورزشی: یک رویکرد استنتاج بیزی دو طرفه دو حالته با مدل‌سازی مشاهده پیشرونده. IEEE Trans. فرآیند تصویر 2011 ، 20 ، 1652-1667. [ Google Scholar ] [ CrossRef ] [ PubMed ]
ایواسه، اس. Saito, H. ردیابی موازی همه بازیکنان فوتبال با ادغام موقعیت های شناسایی شده در تصاویر چندگانه. در مجموعه مقالات هفدهمین کنفرانس بین المللی تشخیص الگو، کمبریج، انگلستان، 26 اوت 2004.
باروس، RML؛ میسوتا، ام اس; Menezes, RP; فیگوئروآ، پی جی. مورا، FA; Cunha، SA; آنیدو، ر. Leite، NJ تجزیه و تحلیل مسافت های طی شده توسط بازیکنان دسته اول فوتبال برزیل به دست آمده با روش ردیابی خودکار. J. Sports Sci. پزشکی 2007 ، 6 ، 233-242. [ Google Scholar ] [ PubMed ]
یانگ، تی. پان، Q. لی، جی. Li, SZ ردیابی اشیاء متعدد در زمان واقعی با کنترل انسداد در صحنه های پویا. در مجموعه مقالات کنفرانس انجمن رایانه ای IEEE در مورد دید رایانه و تشخیص الگو، سن دیگو، کالیفرنیا، ایالات متحده آمریکا، 20-26 ژوئن 2005.
سوگیمورا، دی. کیتانی، ک.م. اوکابه، تی. ساتو، ی. Sugimoto، A. استفاده از فردیت برای ردیابی افراد: خوشه بندی مسیرهای فردی در جمعیت با استفاده از ظاهر محلی و صفت فرکانس. در مجموعه مقالات دوازدهمین کنفرانس بین المللی IEEE در بینایی کامپیوتر، کیوتو، ژاپن، 27 سپتامبر تا 4 اکتبر 2009.
یانگ، سی. دورایسوامی، ر. دیویس، ال. ردیابی سریع چند شیء از طریق فیلتر ذرات سلسله مراتبی. در مجموعه مقالات دهمین کنفرانس بین المللی IEEE در بینایی کامپیوتر، پکن، چین، 17-21 اکتبر 2005.
رابینر، ال. Juang, BH مقدمه ای بر مدل های پنهان مارکوف. IEEE ASSP Mag. 1986 ، 3 ، 4-16. [ Google Scholar ] [ CrossRef ]
Forney، JGD الگوریتم ویتربی. IEEE Proc. 1973 ، 61 ، 268-278. [ Google Scholar ] [ CrossRef ]
مارتینری، اف. ترکیب داده ها و ردیابی با استفاده از HMM در یک شبکه حسگر توزیع شده. IEEE Trans. هوانوردی الکترون. سیستم 1997 ، 33 ، 11-28. [ Google Scholar ] [ CrossRef ]
ذن، اچ. توکودا، ک. Kitamura, T. الگوریتم Viterbi برای یک مدل مسیر برگرفته از HMM با رابطه صریح بین ویژگی‌های استاتیک و پویا. در مجموعه مقالات کنفرانس بین المللی IEEE در مورد آکوستیک، گفتار و پردازش سیگنال، مونترال، QC، کانادا، 17-21 مه 2004.
داکهام، ام. محاسبات فضایی غیرمتمرکز: مبانی شبکه‌های حسگر زمین . Springer: برلین، آلمان، 2012. [ Google Scholar ]
یلماز، ع. جاوید، او. شاه، م. ردیابی شی: بررسی. کامپیوتر ACM. Surv. 2006 ، 38 ، 1-45. [ Google Scholar ] [ CrossRef ]
Zivkovic، Z. بهبود مدل مخلوط گاوسی تطبیقی برای تفریق پس‌زمینه. در مجموعه مقالات هفدهمین کنفرانس بین المللی تشخیص الگو، کمبریج، انگلستان، 23 تا 26 اوت 2004.
Rabiner, L. آموزش مدل های پنهان مارکوف و برنامه های کاربردی منتخب در تشخیص گفتار. IEEE Proc. 1989 ، 77 ، 257-286. [ Google Scholar ] [ CrossRef ]
دوگاد، ر. Desai, UB A Tutorial on Hidden Markov Models ; آزمایشگاه پردازش سیگنال و شبکه های عصبی مصنوعی گروه مهندسی برق موسسه فناوری هند: بمبئی، هند، 1996. [ Google Scholar ]
Xie، X. ایوانز، آر. ردیابی چندین هدف با استفاده از مدل‌های پنهان مارکوف. در مجموعه مقالات گزارش کنفرانس بین المللی رادار IEEE 1990، آرلینگتون، VA، ایالات متحده آمریکا، 7 تا 10 می 1990.
DEBS 2013. در دسترس آنلاین: http://www.orgs.ttu.edu/debs2013/index.php?goto=cfchallengedetails (در 4 ژوئیه 2015 قابل دسترسی است).

© 2015 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب