هدف گذاری: رگرسیون لجستیک، موارد خاص و توسعه

خلاصه

:رگرسیون لجستیک یک مدل خطی کلاسیک برای احتمالات شرطی تبدیل شده با لاجیت متغیر هدف باینری است. اگر توزیع مشترک پیش‌بینی‌کننده‌ها و هدف به شکل لگ خطی باشد، احتمالات شرطی واقعی را بازیابی می‌کند. وزن شواهد یک رگرسیون لجستیک معمولی با پارامترهای برابر با تفاوت وزن شواهد است در صورتی که همه متغیرهای پیش بینی با توجه به متغیر هدف گسسته و به طور مشروط مستقل باشند. فرضیه استقلال شرطی را می توان از نظر مدل های لگ خطی آزمایش کرد. اگر فرض استقلال مشروط نقض شود، اعمال اوزان شواهد نه تنها احتمالات شرطی پیش بینی شده را خراب می کند، بلکه تبدیل رتبه آنها را نیز خراب می کند. مدل‌های رگرسیون لجستیک، از جمله شرایط تعامل، می تواند دلیل عدم استقلال مشروط باشد، شرایط تعامل مناسب دقیقاً برای نقض استقلال مشروط جبران می کند. شبکه‌های عصبی مصنوعی چندلایه ممکن است به‌عنوان مدل‌های رگرسیون مانند تودرتو، با برخی عملکرد فعال‌سازی سیگموئیدی دیده شوند. اغلب، تابع لجستیک به عنوان تابع فعال سازی استفاده می شود. اگر توپولوژی خالص،به عنوان مثال ، کنترل آن به اندازه کافی همه کاره است تا از اصطلاحات تعامل تقلید کند، شبکه های عصبی مصنوعی می توانند نقض استقلال شرطی را محاسبه کنند و نتایج بسیار مشابهی به دست آورند. وزن شواهد نمی تواند به طور منطقی شامل شرایط تعامل باشد. اصلاحات بعدی اوزان، همانطور که اغلب پیشنهاد می‌شود، نمی‌تواند اثر شرایط تعامل را تقلید کند.

کلید واژه ها:

مدل سازی آینده نگر ; مدل سازی بالقوه استقلال مشروط مدل بیز ساده لوح ; عوامل بیز ؛ وزن شواهد شبکه های عصبی مصنوعی ; مجموعه داده های نامتعادل ؛ متعادل کردن

1. معرفی

هدف از مدل‌سازی یا هدف‌گیری بالقوه [ 1 ] شناسایی مکان‌هایی است، به عنوان مثال ، پیکسل‌ها یا وکسل‌ها، که احتمال وقوع یک رویداد به این شکل به‌طور مکانی ارجاع داده می‌شود، به عنوان مثال ، یک نوع کاملاً تعریف شده از کانی‌سازی سنگ معدن، نسبتاً حداکثر است. ، بزرگتر از پیکسل ها یا وکسل های همسایه است. پیش نیاز اصلی چنین پیش‌بینی‌هایی، درک کافی از علل هدفی است که باید پیش‌بینی شود. مدل های مفهومی ذخایر سنگ معدن توسط [ 2 ] گردآوری شده است]. آنها ممکن است به عنوان مدل های عاملی خوانده شوند (در مفهوم آمار ریاضی)، و یک مدل عامل مناسب ممکن است به یک مدل از نوع رگرسیون تبدیل شود در هنگام استفاده از عوامل به عنوان پیش بینی کننده های مرجع فضایی، که برای رویداد هدف مطلوب یا منع می کنند. . بنابراین، ما می‌توانیم وابستگی‌های لازم یا کافی را بین هدف باینری T( x ) که نشان‌دهنده وجود یا عدم حضور هدف در یک مکان منطقه‌ای یا حجمی است ^، تشخیص دهیم. پیش بینی کننده ها (B ₀ ( x )، B ₁ ( x )، …، B _m ( x )) ^T = B (x ) که ممکن است باینری، گسسته یا پیوسته باشد. سپس، مدل‌های ریاضی و تحقق عددی آن‌ها برای تبدیل مدل‌های توصیفی به مدل‌های سازنده، یعنی به مدل‌های پیش‌بینی کمی، مورد نیاز است. به طور کلی، یک مدل پیش‌بینی‌کننده B ( x ) را با B ₀ ( x ) ≡ 1 برای تمام x ⊂ D در نظر می‌گیرد و یک پارامتر ( θ ₀ ,…, θ _m ) ^T = θ را به آن‌ها اختصاص می‌دهد که با ابزار کمیت می‌کند. از یک تابع پیوند $Unknown node type: font$ ، میزان وابستگی احتمال شرطی P (T( x ) = 1| B ( x )) به پیش بینی کننده ها، به عنوان مثال ،

نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت

از آنجایی که هدف T(x)، و همچنین پیش‌بینی‌کننده B (x) به مکان‌های مساحتی یا حجمی x ⊂ D اشاره دارد، ممکن است به یک تصویر نقشه دیجیتالی دو بعدی از پیکسل‌ها یا یک ژئومدل دیجیتال سه‌بعدی از وکسل‌ها فکر کنیم. پیکسل ها یا وکسل ها در ابتدا پشتیبانی فیزیکی پیش بینی کننده ها و هدف را فراهم می کنند و سپس به ترتیب احتمال شرطی پیش بینی شده و خطاهای تخمین مربوطه را به آنها اختصاص می دهند. سپس، نتایج عددی هدف‌گیری به اندازه اشیا، پیکسل‌ها یا وکسل‌ها، یعنی به وضوح فضایی آنها بستگی دارد. اگر مرجع مکانی واقعی هدف (یا پیش بینی کننده ها) نسبتاً نقطه ای باشد، به عنوان مثال، اگر پشتیبانی فیزیکی آنها نسبتاً صفر باشد، وابستگی به وضوح فضایی را نباید نادیده گرفت، زیرا قبلاً برآورد $\overset{Unknown node type: font}{Unknown node type: font} Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font \overset{Unknown node type: font}{Unknown node type: font} Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font \overset{Unknown node type: font}{Unknown node type: font} Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font Unknown node type: font$ شانس بی قید و شرط تا حد زیادی تحت تأثیر قرار می گیرد، زیرا تعداد کل پیکسل ها یا وکسل ها به وضوح فضایی بستگی دارد، در حالی که تعداد کل رخدادهای نقطه ای ثابت است. اگر وضوح فضایی ارائه شده توسط پیکسل ها یا وکسل ها نسبت به مساحت یا حجم پشتیبانی فیزیکی واقعی پیش بینی کننده ها یا هدف ضعیف باشد، نتایج عددی هر نوع روش ریاضی هدف گیری بیشتر مصنوع از فضای نامناسب است. وضوح.

برای تخمین پارامترهای مدل θ ، داده‌های درون یک منطقه آموزشی مورد نیاز است. فرض مدلسازی ریاضی مرتبط با مجموعه داده آموزشی دانش کامل است، به عنوان مثال ، به طور خاص، ما فرض می‌کنیم که همه رخدادهای متغیر هدف T = 1 را می‌دانیم. با این حال، بر خلاف آمارهای زمین‌آمار [ 3 ]، مدل‌سازی بالقوه از نظر فضایی در نظر گرفته نمی‌شود. وابستگی های القا شده بین پیش بینی کننده ها و هدف. در واقع، مدل‌سازی پتانسیل از فرض متغیرهای تصادفی به طور یکسان توزیع شده استفاده می‌کند. توزیع آنها به مکان بستگی ندارد. بنابراین، هر مرجع مکانی را می توان حذف کرد، و مدل های فرم:

پ (تی نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت

در نظر گرفته می شوند، تنها.

2. مدل های ریاضی

2.1. فرض مدلسازی استقلال مشروط

متغیرهای تصادفی B1 ،…، Bm _با_توجه به متغیر هدف تصادفی T به صورت شرطی مستقل هستند، اگر احتمال مشروط مشترک در احتمالات شرطی منفرد فاکتور شود:

نوع گره ناشناخته: فونت نوع گره ناشناخته: فونت متر ℓ = 1 ب ℓ | تی = \otimes ℓ = 1 متر پ ب ℓ | تی

به طور معادل، اما آموزنده تر از نظر بی ربط بودن، متغیرهای تصادفی B1 ،…، Bm _با_توجه به متغیر تصادفی T مشروط مستقل هستند، اگر دانستن T همه Bj های دیگر را _به جز B _{i برای پیش بینی B}_i نامربوط کند ، به عنوان مثال ،

پ ب من | \otimes ℓ \neq من ب ℓ \otimes تی = پ ب من | تی

از نظر احتمالات مشروط

تاکید می شود که استقلال به معنای استقلال مشروط نیست و بالعکس. همبستگی معنی دار متغیرهای پیش بینی کننده به معنای مستقل نبودن آنها به صورت شرطی نیست. برعکس، متغیرهای B ₁ و B ₂ ممکن است با توجه به متغیر T به طور قابل توجهی همبستگی و به طور مشروط مستقل باشند، به ویژه زمانی که T را بتوان به عنوان یک علت مشترک برای B1 و B2 تفسیر کرد ، _رجوع کنید _به. مثال گویا [ 4]. به این ترتیب، استقلال شرطی یک رویکرد احتمالی به علیت است، در حالی که همبستگی چنین نیست. برای کاهش این فرض محدود کننده که همه متغیرهای پیش بینی مستقل هستند با توجه به متغیر هدف، فرض استقلال شرطی زیرمجموعه های متغیرهای پیش بینی، که به عنوان شبکه باور بیزی نامیده می شود، مدل های میانی را ارائه می دهد که کمتر محدود کننده هستند، اما قابل حمل تر از مدل های عمومی هستند. [ 5 ]. یک انتخاب مناسب از زیرمجموعه‌ها، دسته‌های مدل گرافیکی [ 6 ] هستند که متغیرها و روابط استقلال شرطی آنها را نشان می‌دهند که منجر به شرایط تعامل در مدل‌های رگرسیون لجستیک می‌شود [ 7 ].

2.2. رگرسیون لجستیک

یک گزارش مدرن از رگرسیون لجستیک توسط [ 8 ] ارائه شده است. انتظار شرطی از یک متغیر هدف تصادفی شاخص T با توجه به متغیر پیش بینی تصادفی متغیر ( m + 1) برابر با احتمال شرطی آن است، یعنی برای B = (B ₀ , B ₁ ,…, B _m ) ^T با B ₀≡ 1

E (T | B) = P (T = 1 | B)

با حذف عبارت خطای توزیع شده دو جمله ای ([ 8 ])، همانطور که اغلب انجام می شود، مدل رگرسیون لجستیک معمولی بدون شرایط تعامل برای احتمال شرطی قابل پیش بینی می تواند به صورت [ 8 ] نوشته شود:

از نظر یک لاجیت:

$آن را ثبت کنید P (T = 1 | B) = β تی B = β 0 + \sum ℓ β ℓ ب ℓ$
از نظر احتمال:

$پ (T = 1 | B) = Λ (β تی ب) = Λ (β 0 + \sum ℓ β ℓ ب ℓ)$

(1)
با تابع لجستیک:

$Λ (z) = 1 1 - exp ( - z )$

مدل رگرسیون لجستیک معمولی بهینه است، یعنی با احتمال شرطی واقعی مطابقت دارد، اگر متغیرهای پیش بینی با توجه به متغیر هدف گسسته و به طور مشروط مستقل باشند [ 7 ]. در اینجا، متغیرهای پیش‌بینی‌کننده گسسته فرض می‌شوند تا اطمینان حاصل شود که احتمال مشترک B و T نمایشی به‌عنوان یک مدل لگ خطی دارد، که سپس طبق قضیه همرسلی-کلیفورد [ 7 ] مشمول عامل‌سازی می‌شود.

مدل رگرسیون لجستیک را می توان تعمیم داد تا هر گونه شرایط تعاملی فرم را شامل شود $B_{ℓ_{i}} * \dots * B_{ℓ_{j}}$ ، به عنوان مثال ، هر شرایط محصول پیش بینی کننده ها:

پ (T = 1 | B) = Λ (β 0 + \sum ℓ β ℓ ب ℓ + \sum ℓ من, \dots, ℓ j β ℓ من, \dots, ℓ j ب ℓ من \otimes \dots \otimes ب ℓ j)

عدم استقلال شرطی را می توان دقیقاً با شرایط تعامل متناظر موجود در مدل رگرسیون لجستیک جبران کرد و مدل رگرسیون لجستیک حاصل با شرایط تعامل برای متغیرهای پیش بینی پیوسته بهینه است اگر توزیع مشترک متغیر هدف و متغیرهای پیش بینی یک لاگ باشد. -فرم خطی اگر متغیرهای پیش بینی گسسته باشند، یک فرم ورود به سیستم خطی تضمین می شود. بنابراین، برای متغیرهای پیش بینی گسسته، مدل رگرسیون لجستیک، از جمله شرایط تعامل مناسب، بهینه است [ 7 ].

با توجه به m ≥ 2 متغیر پیش بینی $B_{ℓ} \equiv 1$ , ℓ = 1,…, m , مجموع وجود دارد $\sum_{ℓ = 2}^{m} (\begin{matrix} m \\ ℓ \end{matrix}) = 2^{m} - (m + 1)$ شرایط تعامل احتمالی برای اینکه یک مدل عملی باشد، تعداد کل 2 ^متر از تمام اصطلاحات ممکن باید به طور معقولی کوچکتر از اندازه نمونه n باشد. با این حال، اصطلاح تعامل $B_{ℓ}_{_{1}} \otimes \dots \otimes B_{ℓ}_{_{k}}$ ، k ≤ m ، در واقع مورد نیاز است اگر $B_{ℓ}_{_{1}}, \dots, B_{ℓ_{k}}$ با توجه به T به طور مشروط مستقل نیستند.

پارامترهای رگرسیون لجستیک را می توان با توجه به لجیت ها به طور مشابه به پارامترهای مدل رگرسیون خطی تفسیر کرد، به عنوان مثال، β _ℓ نشان دهنده افزایش لاجیت P (T = 1| B ) است اگر B _ℓℓ یک واحد افزایش یابد [ 8 ]. تفاسیر درگیر بیشتری در آینده وجود دارد، ر.ک. ضمیمه B.

با توجه به نمونه bℓ _,i , t _i , i = 1,…, n, ℓ = 1,…, m , پارامترهای مدل رگرسیون لجستیک با روش حداکثر درستنمایی که به صورت عددی در الگوریتم امتیاز دهی فیشر تحقق یافته است (فرمی) تخمین زده می شود. نیوتن-رافسون، یک مورد خاص از یک الگوریتم حداقل مربعات با وزن مجدد تکراری) و در هر بسته نرم افزاری آماری اصلی کدگذاری شده است.

2.3. اوزان شواهد

مدل وزن شواهد مورد خاص یک مدل رگرسیون لجستیک بدون شرایط تعامل است، اگر همه متغیرهای پیش بینی با توجه به متغیر هدف باینری و به صورت شرطی مستقل باشند [ 9 ]. به عنوان مثال، بر حسب احتمال مشروط قابل پیش‌بینی می‌خواند:

پ (تی = 1 | ب) = Λ (β تی ب) Λ (β 0 + \sum ℓ : ب ℓ = 1 β ℓ)

(2)

جایی که:

β 0 = ثبت آن P (تی = 1) + دبلیو (0) ، β ℓ = سی ℓ ، ℓ = 1 ، \dots ، m

(3)

با کنتراست های C _ℓ که به صورت زیر تعریف می شوند:

سی ℓ = دبلیو (1) ℓ - دبلیو (0) ℓ ، ℓ = 1 ، \dots ، m

با اوزان شواهد:

دبلیو (1) ℓ = ln پ ( ب ℓ = 1 | T = 1 ) پ ( ب ℓ = 1 | T = 0 ) ، دبلیو (0) ℓ = ln پ ( ب ℓ = 0 | T = 1 ) پ ( ب ℓ = 0 | T = 0 )

(4)

و با:

دبلیو (0) = \sum ℓ = 1 متر دبلیو (0) ℓ

به شرطی که:

پ (ب ℓ = من | T = j) \neq 0 ، من_j = 0 ، 1 ، ℓ = 1 ، \dots ، m

(5)

از آنجایی که مدل وزن شواهد [ 10-14 ] بر اساس رویکرد بیزی ساده لوح [ 5 ، 14-17 ] با فرض استقلال شرطی B با توجه به T است، می توان آن را به صورت ابتدایی از قضیه بیز برای تصادفی شاخص استخراج کرد . متغیرهای B ₀ , B ₁ , …, B _m :

O (T = 1 | B) = O (T = 1) \prod متر ℓ = 1 پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 1 ) \prod متر ℓ = 1 پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 0 ) = O (T = 1) \prod ℓ = 1 متر اف ℓ

با:

اف ℓ = پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 1 ) پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 0 ), ℓ = 1, \dots, m

(6)

که در آن شانس (شرطی) O یک رویداد به عنوان نسبت احتمالات (شرطی) یک رویداد و مکمل آن تعریف می شود. حال، فرض ساده بیز مبنی بر استقلال شرطی همه متغیرهای پیش بینی کننده B با توجه به متغیر هدف T منجر به کارآمدترین ساده سازی می شود:

اف ℓ = پ ( ب ℓ | T = 1 ) پ ( ب ℓ | T = 0 ), ℓ = 1, \dots, m

و به نوبه خود به وزن شواهد بر حسب شانس:

O (T = 1 | B) = O (T = 1) \prod ℓ = 1 متر پ ( ب ℓ | T = 1 ) پ ( ب ℓ | T = 0 )

به‌عنوان مثال ، به‌روزرسانی شانس «قبلی» غیرشرطی O(T = 1) با ضرب متوالی با «ضریب بیز» P (B _ℓ | T = 1) / P (B _ℓ | T = 0) تا به «پسین» شرطی نهایی منجر شود. شانس O(T = 1 | B ) [ 13 ]; برای استنتاج کامل به پیوست 1 مراجعه کنید .

با توجه به فرض ساده‌کننده استقلال شرطی و برخلاف رگرسیون لجستیک عمومی، نسبت‌های احتمالات مشروط درگیر در تعریف وزن شواهد، معادله (4) را می‌توان با شمارش صرف تخمین زد. علاوه بر این، وزن شواهد را می توان به راحتی به متغیرهای تصادفی گسسته تعمیم داد، زیرا یک متغیر گسسته با حالت های مختلف می تواند به ( s -1) متغیرهای تصادفی باینری مختلف تقسیم شود تا در مدل های رگرسیونی استفاده شود.

2.4. تست استقلال مشروط

یک آزمون مستقیم استقلال مشروط از رابطه وزن شواهد و مدل‌های لاگ خطی استفاده می‌کند. اگر متغیرهای پیش بینی با توجه به متغیر هدف گسسته و به طور مشروط مستقل باشند، پس به موجب قضیه همرسلی-کلیفورد، یک مدل لاگ خطی ساده فاکتوریزه شده بدون عبارات برهمکنش به اندازه کافی بزرگ است که توزیع مشترک را نشان دهد [ 7 ، 9 ]. بنابراین، اگر آزمون نسبت احتمال این فرضیه صفر با توجه به یک مدل لاگ خطی مناسب منجر به رد منطقی آن شود، فرض استقلال شرطی را نیز می توان رد کرد. این آزمون بر هیچ فرضی که شامل توزیع نرمال باشد، تکیه نمی کند، همانطور که آزمون های omnibus [ 18 ، 19 ] انجام می دهند.

این تست‌های omnibus از انحرافات یک ویژگی یک مدل برازش شده استفاده می‌کنند $F (\tilde{θ} | b_{i}, t_{i}, i = 1, \dots, n)$ از ویژگی های مدل ریاضی $ℱ$ ( θ | B ) از احتمالات و آمار ریاضی برای تداخل در اعتبار فرض مدلسازی استقلال شرطی شناخته شده است. آزمون‌های omnibus میانگین احتمالات مشروط را روی همه اشیا، به عنوان مثال ، پیکسل‌ها یا وکسل‌ها، در مجموعه داده آموزشی با اندازه نمونه n به عنوان مشخصه می‌گیرند .

1 n \sum i = 1 n پ (T = 1 | B = ب من) = پ (T = 1)

(7)

بنابراین، برای یک مدل مناسب (“درست”)، میانگین از $\hat{P} (T = 1 | B = b_{i}),$ i = 1,…, n , (تقریباً) برابر است $\hat{P} (T = 1)$ ، با فراوانی نسبی T = 1 در مجموعه داده آموزشی تخمین زده می شود. انحراف از میانگین از $\hat{P} (T = 1)$ نشان می دهد که مدل ممکن است درست نباشد. برای یک مدل وزن شواهد، انحرافات می تواند ناشی از عدم استقلال مشروط باشد، در حالی که برای یک مدل رگرسیون لجستیک، $\frac{1}{n} \sum_{i = 1}^{n} \hat{P} (T = 1 | B = b_{i}) = \hat{P} (T = 1)$ همیشه راضی است (تا دقت عددی). بر اساس معادله (7) ، [ 19 ] آزمون omnibus و [ 18 ] آزمون omnibus جدید را توسعه داد.

یک آزمون آماری پیچیده‌تر برای متغیرهای پیش‌بینی‌کننده واقعی اخیراً توسط [ 20 ] پیشنهاد شده است.

2.5. وزن شواهد در مقابل رگرسیون لجستیک

پارامترهای رگرسیون لجستیک معمولی برابر با کنتراست اوزان است، در صورتی که همه متغیرهای پیش بینی کننده شاخص و به طور مشروط مستقل با توجه به متغیر هدف باشند. بنابراین، وزن شواهد مورد خاص رگرسیون لجستیک معمولی است اگر پیش‌بینی‌کننده‌های B متغیرهای شاخص و مستقل از شرط T باشند. برعکس، رگرسیون لجستیک تعمیم متعارف وزن‌های شواهد است [ 14 ، 17 ] . توجه داشته باشید که مدل وزن شواهد را نمی توان بزرگ کرد تا شامل اصطلاحات تعامل باشد.

به طور کلی، به عنوان مثال ، بدون فرض استقلال مشروط، رابطه پارامترهای رگرسیون لجستیک معمولی و تضاد وزن شواهد به وضوح غیر خطی است [ 21 ، 22 ]. برای اشتقاق صریح به پیوست 2 مراجعه کنید .

چه زمانی $\hat{P} (T = 1 | B = b_{i})$ , i = 1, …, n , با حداکثر احتمال اعمال شده برای مدل رگرسیون لجستیک معمولی تخمین زده می شود، معادله (7) همیشه برقرار است، زیرا بخشی از سیستم های حداکثر درستنمایی معادلات است. با تشخیص وزن شواهد به عنوان یک مورد خاص از رگرسیون لجستیک، زمانی که پیش بینی کننده ها متغیرهای شاخص هستند و با توجه به متغیر هدف به طور مشروط مستقل هستند، مقایسه فوق اکنون ممکن است به عنوان بررسی آمار مدل های مختلف دیده شود. به طور مشابه، تضادهای برآورد شده ${\hat{C}}_{ℓ}$ وزن شواهد را می توان با ضرایب رگرسیون لجستیک برآورد شده مقایسه کرد ${\hat{β}}_{ℓ}$ _.سپس، هرگونه انحراف بین آنها نشان دهنده نقض فرض مدلسازی استقلال مشروط است.

2.6. وزن شواهد در مقابل مدل τ- یا ν

فرض مدلسازی با توجه به عوامل معادله (6) مدل τ [ 23-25 ] عبارت است از:

اف ℓ = (پ ( ب ℓ | T = 1 ) پ ( ب ℓ | T = 0 )) τ ℓ, ℓ = 1, \dots, m

سپس وزن های اصلاح شده به صورت زیر تعریف می شوند:

دبلیو ˜ (1) ℓ = τ (1) ℓ دبلیو (1) ℓ ، دبلیو ˜ (0) ℓ = τ (0) ℓ دبلیو (0) ℓ ، سی ˜ ℓ = دبلیو ˜ (1) ℓ - دبلیو ˜ (0) ℓ ، ℓ = 1 ، \dots ، m

و:

آن را ثبت کنید P (T = 1 | B) = آن را وارد کنید P (T = 1) + دبلیو ˜ (0) + \sum ℓ = 1 متر سی ˜ ℓ ب ℓ پ (T = 1 | B) = Λ ( آن را وارد کنید P (T = 1) + دبلیو ˜ (0) + \sum ℓ = 1 متر سی ˜ ℓ ب ℓ)

با ${\tilde{W}}^{(0)} = \sum_{ℓ = 1}^{m} τ_{ℓ}^{(0)} W_{ℓ}^{(0)}$ .

فرض مدل‌سازی با توجه به عوامل معادله (6) مدل ν [ 26 ، 27 ] است:

اف ℓ = ν ℓ (پ ( ب ℓ | T = 1 ) پ ( ب ℓ | T = 0 )), ℓ = 1, \dots, m

سپس وزن های اصلاح شده به صورت زیر تعریف می شوند:

دبلیو ˜ ˜ (1) ℓ = ln ν (1) ℓ + دبلیو (1) ℓ ، دبلیو ˜ ˜ (0) ℓ = ln ν (0) ℓ + دبلیو (0) ℓ ، سی ˜ ˜ ℓ = دبلیو ˜ ˜ (1) ℓ - دبلیو ˜ ˜ (0) ℓ ، ℓ = 1 ، \dots ، m

و:

آن را ثبت کنید P (T = 1 | B) = آن را وارد کنید P (T = 1) + دبلیو ˜ ˜ (0) + \sum ℓ = 1 متر سی ˜ ˜ ℓ ب ℓ پ (T = 1 | B) = Λ ( آن را وارد کنید P (T = 1) + دبلیو ˜ ˜ (0) + \sum ℓ = 1 متر سی ˜ ˜ ℓ ب ℓ)

با ${\tilde{\tilde{W}}}^{(0)} = \sum_{ℓ = 1}^{m} (\ln ν_{ℓ}^{(0)} + W_{ℓ}^{(0)})$ .

با این نکته، ممکن است نتیجه بگیریم که هیچ راهی برای تقلید اثر شرایط تعامل مدل های رگرسیون لجستیک با دستکاری وزن شواهد یا تضاد آنها وجود ندارد.

2.7. شبکه های عصبی مصنوعی

مدل های رگرسیون عمومی را می توان با رویکردهای مختلف یادگیری آماری، از جمله شبکه های عصبی مصنوعی [ 15 ] مقابله کرد. با توجه به شبکه های عصبی مصنوعی و یادگیری آماری [ 5 ، 15 ، 16 ، 28 ]، مدل رگرسیون لجستیک، معادله (1) ،

π 1 (ب من) = پ (T = 1 | B = ب من)) = Λ (β 0 + \sum ℓ = 1 متر β ℓ ب ℓ ، i), i = 1, \dots, n

شبکه عصبی مصنوعی پرسپترون تک لایه یا شبکه عصبی مصنوعی تک لایه نامیده می شود. به حداقل رساندن مجموع مجذور باقیمانده به عنوان آموزش نامیده می شود. روش‌های گرادیان برای حل پارامترهای مدل به عنوان قانون آموزش پرسپترون خطی نامیده می‌شوند. اندازه گام در امتداد گرادیان منفی را نرخ یادگیری و غیره می گویند.به نظر نمی رسد مفهوم متغیرهای تصادفی، استقلال شرطی، تخمین و خطای تخمین و اهمیت پارامترهای مدل در قلمرو شبکه های عصبی مصنوعی، حتی تحت برچسب های جدید وجود داشته باشد. با این وجود، شبکه‌های عصبی مصنوعی ممکن است به عنوان یک تعمیم برای بزرگ‌تر کردن مدل رگرسیون لجستیک از طریق تودرتو کردن مدل‌های رگرسیون لجستیک با یا بدون عبارات تعاملی دیده شوند. یک تعمیم اضافی جزئی جایگزینی تابع لجستیک Λ با توابع سیگموئیدی دیگر و مدل کردن احتمال شرطی یک متغیر مقوله ای T (بیش از دو دسته) با توجه به متغیرهای پیش بینی کننده B است.

مدل اصلی شبکه عصبی چند لایه را می توان به عنوان دنباله ای از تبدیل های عملکردی [ 15 ، 29-31 ] توصیف کرد، که اغلب به عنوان یک نمودار نشان داده می شود:

ورودی: متغیرهای پیش بینی کننده B ;
لایه اول: ترکیبات خطی $A_{j}^{(1)}$ j = 1، …، J ، از متغیرهای پیش‌بینی‌کننده B ، که به عنوان واحدهای ورودی یا فعال‌سازی نامیده می‌شوند:

$آ (1) j = \sum ℓ = 0 متر β (1) j ℓ ب ℓ j = 1, \dots, J_$

(8)

یا:

$آ (1) j = \sum ℓ = 0 متر β (1) j ℓ ب ℓ + \sum ℓ من, \dots, ℓ من “ β (1) j (ℓ من, \dots, ℓ من “) ب ℓ من \otimes \dots \otimes ب ℓ من j = 1, \dots, J_$

(9)

برای تقلید از اصطلاحات تعامل:
لایه پنهان: هر یک از آنها با اعمال یک تابع فعال سازی غیرخطی متمایزپذیر h معمولاً به شکل سیگموئیدی که به عنوان واحدهای پنهان شناخته می شود، تحت یک تبدیل قرار می گیرند:

$ز j = ساعت (آ (1) j), j = 1, \dots, J$
لایه دوم: ترکیبات خطی $A_{j}^{(2)}$ ، k = 1، …، K از واحدهای پنهان، به عنوان فعال سازی واحد خروجی نامیده می شود:

$آ (2) ک = \sum j = 0 جی β (2) k j ز j, k = 1, \dots, K$
خروجی: هر یک از فعال سازی های واحد خروجی تابع یک تابع فعال سازی S است، به عنوان مثال، تابع لجستیک:

$π ک = S (آ (2) ک) ، k = 1 ، \dots ، K$

سپس:

$π ک (B) = P (T = تی ک | ب)) = S ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ \sum j = 0 جی β (2) k j ساعت (\sum ℓ = 0 متر β (1) j ℓ ب ℓ)    لایه پنهان ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟, k = 1, \dots, K$

(10)

اگر K = 1 و S = Λ، h = id، J = 0، آنگاه به رگرسیون لجستیک معمولی، معادله (1) برمی گردیم . از سوی دیگر، در معادله (10) ، ترکیب خطی پیش‌بینی‌کننده‌ها، همانطور که در رابطه (8) به دست می‌آید ، می‌تواند به راحتی با ترکیب بزرگ‌شده، از جمله عبارت‌های تعامل، که در رابطه (9) ارائه شده است، جایگزین شود.، جایی که در نظر گرفتن اصطلاحات برهمکنش ها به توپولوژی خالص همه کاره تری نیاز دارد. فقدان مفهوم پارامترهای قابل توجه و به نوبه خود، مدل های قابل توجه، مانع از ساخت متوالی مدل های مناسب است. در عوض، همه متغیرها و یک توپولوژی خالص به اندازه کافی همه کاره وصل شده اند و ضرایب برای همه متغیرها به صورت عددی با روش گرادیان تعیین می شود. به نظر می رسد این روش با ایده مدل های صرفه جویی مطابقت ندارد.

2.8. متعادل کردن

اگر شانس O(T=1) خیلی کوچک باشد، روش‌های یادگیری آماری مستعد شکست هستند. [ 32-37 ] . _ متعادل‌سازی ساده نمونه‌برداری ترجیحی را تقلید می‌کند، به عنوان مثال ، یک مجموعه داده متعادل جدید با وزن دادن به همه اشیا با T = 1 با وزن 1 < μ∈ ℝ ساخته می‌شود. این نوع تعادل بلافاصله منجر به موارد زیر می شود:

ای (تی بال = 1) = μ O (T = 1), O (تی بال = 1 | ب بال) = μ O (T = 1 | B)

و سپس در:

لاجیت پی (تی بال = 1) = ln μ + logit P (T = 1) لاجیت پی (تی بال = 1 | ب بال) = ln μ + logit P (T = 1 | B)

علاوه بر این، اگر:

آن را ثبت کنید P (تی بال = 1 | ب بال) = F (θ | ب بال)

یک مدل مناسب (“درست”) برای نمونه متعادل است، سپس:

اف (θ | B) = F (θ | ب بال) - ln μ

(11)

یک مدل مناسب از لاجیت P (T = 1| B ) با توجه به نمونه اولیه است و:

اف (θ ˆ | ب) = F (θ ˆ | ب بال) - ln μ

مدل های مناسب هر چه باشد به عنوان مثال، اگر رگرسیون لجستیک معمولی بدون شرایط تعامل، به عنوان مثال ، با فرض استقلال مشروط،

آن را ثبت کنید P (تی بال = 1 | ب بال) = ثبت کنید P (تی بال = 1) + دبلیو (0) + \sum ℓ = 1 متر β ℓ ب ℓ

یک مدل مناسب برای نمونه متعادل است، پس:

آن را ثبت کنید P (T = 1 | B) = β 0 + \sum ℓ = 1 متر β ℓ ب ℓ = ثبت آن P (تی بال = 1) = ln μ + دبلیو (0) + \sum ℓ = 1 متر β ℓ ب ℓ = ثبت آن P (T = 1) + دبلیو (0) + \sum ℓ = 1 متر β ℓ ب ℓ

یک مدل مناسب برای نمونه اولیه است. بنابراین، تعادل با وزن دادن به اشیا، پیکسل ها یا وکسل ها، پشتیبانی از T = 1 با μ > 1، دقیقاً همان کاری را انجام می دهد که برای آن طراحی شده است: شانس O(T = 1) را با ضریب μ افزایش می دهد و مدل های مناسب را حفظ می کند، به عنوان مثال ، پارامترهای آنها، در غیر این صورت.

تاکید می شود که معادله (11) برای مدل های ریاضی در صورت مناسب بودن صادق است. سپس، معادله (11) را می توان به عنوان تبدیل معکوس تعادل با وزن دادن به اجسام با T = 1 با وزن μ خواند . ممکن است برای مدل های برازش مناسب نباشد، به عنوان مثال ، تخمین پارامترهای یک مدل ضعیف ممکن است معادله را خراب کند. سپس، $ℱ (\hat{θ} | B) \neq ℱ (\hat{θ} | B^{bal}) - \ln μ$ . توجه داشته باشید که وزن شواهد همه تحت تأثیر این نوع تعادل قرار نمی گیرند.

2.9. پیچیدگی عددی رگرسیون لجستیک

مدل‌سازی بالقوه با رگرسیون لجستیک با استفاده از مجموعه داده‌های آموزشی سه‌بعدی از n وکسل و ( m + 1) متغیرهای پیش‌بینی‌کننده برای برازش پارامترهای رگرسیون نیاز به حل یک سیستم معادلات غیر خطی ( m + 1) دارد. معمولاً تعداد کل متغیرهای پیش بینی بسیار کمتر از تعداد کل وکسل ها است. روش عددی انتخابی آماردانان حداقل مربعات وزن‌گذاری مجدد تکراری است. پیچیدگی عددی یک مرحله تکرار از مرتبه 2 n ( m + 1) ^{2 است.}فلاپ; به طور کلی نمی توان تعداد کل تکرارها را تخمین زد. در نظر گرفتن اندازه مسئله برای ژئومدل‌های سه بعدی با وضوح فضایی مناسب به وضوح نشان می‌دهد که راه‌حل عددی آن نیازمند مدیریت داده بسیار کارآمد ژئومدل‌های سه بعدی در حالت وکسل و اعداد بسیار سریع بر اساس پردازش موازی انبوه است.

3. مثال ها

هر دو مجموعه داده برای خدمت به اهداف خاصی ساخته شده اند. فرض ریاضی مرتبط با مجموعه داده آموزشی دانش کامل است، به عنوان مثالبه طور خاص، ما فرض می کنیم که همه رخدادهای متغیر هدف T = 1 را می دانیم. در غیر این صورت، حتی شانس یا لجیت T = 1 را نمی توان به درستی تخمین زد. بنابراین، رخدادهای ناشناخته قبلی یا احتمالات آنها را نمی توان با توجه به مجموعه داده آموزشی پیش بینی کرد. مقایسه احتمالات شرطی تخمین زده شده با فرکانس های مشروط شمارش شده، بررسی مناسب بودن مدل اعمال شده را فراهم می کند. یک بررسی قوی تر، استفاده از تنها بخشی از داده های خارج از مجموعه داده آموزشی برای تخمین پارامترهای یک مدل و سپس اعتبارسنجی مدل با داده های باقی مانده است که قبلاً استفاده نشده اند. تمامی محاسبات با نرم افزار آماری رایگان، R [ 38 ] انجام شد.

3.1. مجموعه داده RANKIT بازبینی شد

اولین ارائه و بحث از رتبه بندی مجموعه داده ها ( شکل 1 ) در [ 9 ] ارائه شده است. مجموعه _دادهرتبه‌بندی شامل دو متغیر پیش‌بینی‌کننده B1 ، B2 و _یک متغیر هدف T است که به پیکسل‌های یک تصویر نقشه دیجیتال اشاره دارد. متغیرهای پیش‌بینی‌کننده B1 ، _B2_با توجه به متغیر هدف T، همبستگی ندارند و به صورت شرطی مستقل نیستند.

در اینجا، مثال با در نظر گرفتن یک مجموعه داده‌های رتبه‌بندی به‌طور تصادفی بازآرایی شده تکمیل می‌شود ( شکل 1 )، که از رتبه‌بندی مجموعه داده‌ها با مرتب‌سازی مجدد مراجع پیکسلی ( _i, j ) از سه‌قلوها ₍bk1 , _bk2 , tk ) _نشات_{می‌گیرد} . = 1، …، n ، تحقق B ₁ ، B ₂ و T در مجموعه داده به صورت تصادفی. واریوگرام های تک جهتی شکل 1 به وضوح نشان می دهد که دو مجموعه داده در آمار فضایی متفاوت هستند.

با این حال، مجموعه‌های داده رتبه‌بندی و rankitmix دارای آمارهای معمولی یکسانی مانند جداول احتمالی، جداول 1 و 2 ، یا یک ماتریس همبستگی، جدول 3 ، مشترک هستند.

متغیرهای پیش‌بینی‌کننده شاخص _B1 و _B2 به نظر همبستگی ندارند، در حالی که B1 و T، و _{B2 و T، به}_ترتیب ، به‌ترتیب برای تمام سطوح معنی‌داری α > 0.002213 و α > 0.02101 همبستگی دارند. رجوع کنید به جدول 3 .

بنابراین، برای هر دو مجموعه داده rankit و rankitmix ، به ترتیب، مدل‌های وزن شواهد، رگرسیون لجستیک معمولی بدون عبارت تعامل و رگرسیون لجستیک بزرگ با عبارت تعامل به صراحت خوانده می‌شوند:

WofE : logReg : logRegwI : پ ˆ (T = 1 | ب 1 ب 2) = Λ (- 2.726 + 1.725 ب 1 + 1.349 ب 2) پ ˆ (T = 1 | ب 1 ب 2) = Λ (- 2.831 + 1.874 ب 1 + 1.535 ب 2) پ ˆ (T = 1 | ب 1 ب 2) = Λ (- 3.434 + 2.923 ب 1 + 2.646 ب 2 - 3.233 ب 1 ب 2)

از آنجایی که فرض مدل‌سازی ریاضی استقلال شرطی نقض می‌شود، تنها رگرسیون لجستیک با شرایط تعامل یک مدل مناسب را به دست می‌دهد و احتمالات شرطی را تقریباً دقیقاً پیش‌بینی می‌کند.

نتایج وزن شواهد، رگرسیون لجستیک با یا بدون عبارات تعامل و شبکه عصبی مصنوعی اعمال شده به رتبه بندی مجموعه داده های ساخته شده و مجموعه داده های rankitmix ، به ترتیب در جدول 4 خلاصه شده است. شکل 2 نتایج رتبه بندی مجموعه داده ها را نشان می دهد و شکل 3 نتایج رتبه بندی مجموعه داده ها را نشان می دهد .

بدیهی است که تصاویر نقشه دیجیتال شکل‌های 2 و 3 با بازآرایی مشابهی با رتبه‌بندی مجموعه داده‌ها و ترکیب رتبه‌بندی ردیف بالای شکل 1 به یکدیگر مرتبط هستند . این رابطه را می توان مانند یک نمودار جابجایی ( شکل 4 ) نشان داد، به عنوان مثال با توجه به رگرسیون لجستیک، از جمله شرایط تعامل.

برای بیان صریح آن، هر یک از روش‌های هدف‌یابی که در اینجا در نظر گرفته می‌شود، با هر گونه بازآرایی تصادفی که به طور همزمان بر روی تمام تصاویر نقشه دیجیتال درگیر یا ناشی از هدف‌گیری اعمال می‌شود، جابجا می‌شود. بنابراین، هدف گذاری و مدل سازی بالقوه، به عبارت دیگر، روش های فضایی نیستند. آنها از وابستگی های ناشی از فضایی استفاده نمی کنند، که با نگاه کردن به نیمه متغیرهای مجموعه داده ها نشان داده شده است که متفاوت هستند. شکل 1 .

پس از تعادل با m = 10، مدل های وزن شواهد و رگرسیون لجستیک بزرگ شده با شرایط تعامل به صراحت می خوانند:

WofE : logRegwI : پ ˆ (تی بال = 1 | ب بال 1 ب بال 2) = Λ (- 0.423 + 1.725 ب بال 1 + 1.349 ب بال 2) پ ˆ (تی بال = 1 | ب بال 1 ب بال 2) = Λ (- 1.132 + 2.923 ب بال 1 + 2.646 ب بال 2 - 3.233 ب بال 1 ب بال 2)

به ترتیب با – 0.423 – ln(10) = – 0.423 – 2.302 = – 2.726 و – 1.132 – 2.302 = – 3.434، بنابراین معادله (11) را تأیید می کند. با این حال، مدل رگرسیون لجستیک معمولی بدون شرایط تعامل می گوید:

logReg : پ ˆ (تی بال = 1 | ب بال 1 ب بال 2) = Λ (- 0.960 + 2.468 ب بال 1 + 2.201 ب بال 2)

با – 0.960 – 2.302 = – 3.263 ≠ – 2.831 و پارامترهای مختلف $β_{1}^{bal}$ و $β_{2}^{bal}$ از آنجایی که مدل رگرسیون لجستیک معمولی به دلیل نقض فرض مدلسازی استقلال شرطی، مدل مناسبی نیست.

3.2. مجموعه داده DFQR

مجموعه داده DFQR به عنوان یک تصویر نقشه دیجیتال در شکل 5 تجسم شده است .

موارد احتمالی در جداول 5 و 6 آورده شده است.

ماتریس همبستگی ( جدول 7 ₎ نشان می‌دهد که B1 و B2 همبستگی ندارند، و به طور قابل‌توجهی با T برای تمام سطوح معنی‌داری α > 0.001652 همبستگی دارند _.

آزمون استقلال شرطی با اشاره به مدل‌های log-linear ( جدول 8 ) نشان می‌دهد که فرضیه صفر استقلال شرطی B1 و B2 _با_توجه به T را نمی‌توان به طور منطقی رد کرد.

فرکانس‌های نسبی مشروط مربوطه تقریباً دقیقاً فاکتور می‌شوند، به عنوان مثال ،

پ (ب 1 = 1 ، ب 2 = 1 | T = 1) = P (ب 1 = 1 | T = 1) P (ب 2 = 1 | T = 1) = 0.25

ولی:

پ (ب 1 = 1 ، ب 2 = 1 | T = 0) = 0.02380952

و:

پ (ب 1 = 1 | T = 0) P (ب 2 = 1 | T = 0) = 0.02395125

با $\hat{O} (T = 1) = 0.1904, \log it \hat{P} (T = 1) = - 1.6582$ ، مدل وزن شواهد به صراحت می گوید:

پ ˆ (T = 1 | ب 1 ب 2) = Λ (- 2.7082 + 1.6977 ب 1 + 1.6977 ب 2)

مدل رگرسیون لجستیک معمولی بدون شرایط تعامل به صراحت می گوید:

پ ˆ (T = 1 | ب 1 ب 2) = Λ (- 2.7094 + 1.6994 ب 1 + 1.6994 ب 2)

جایی که:

β ₀ برای همه α > 1.12 e – 08 معنی دار است و
β1 ، _β2 برای همه α > 0.00651 _{معنی دار}هستند .

این دو مدل تقریباً یکسان هستند. انحرافات کوچک پارامترهای آنها ناشی از نقض کوچک استقلال مشروط است. در حالی که آزمون با p = 0.999950 نشان می دهد که فرضیه صفر استقلال شرطی را نمی توان معقولانه رد کرد، فرکانس های نسبی شرطی به طور کامل فاکتورسازی نمی شوند، بلکه فقط تقریباً می شوند. احتمالات مشروط برآورد شده با وزن شواهد یا رگرسیون لجستیک معمولی تقریباً دقیقاً احتمالات مشروط تخمین زده شده را با شمارش فرکانس های شرطی برای مجموعه داده آموزشی DFQR بازیابی می کند. رجوع کنید به جدول 9 .

مدل رگرسیون لجستیک با اصطلاحات تعاملی به صراحت می گوید:

پ ˆ (T = 1 | ب 1 ب 2) = Λ (- 2.7080 + 1.6964 ب 1 + 1.6964 ب 2 + 0.0082 ب 1 ب 2)

جایی که:

β ₀ برای همه α > 1.57 e -07 معنی دار است،
β1 ، _β2 برای همه α > 0.0295 _{معنی دار}هستند و
β ₁₂ به هیچ وجه معنی دار نیست به عنوان p = 0.9949.

احتمالات مشروط تخمین زده شده با رگرسیون لجستیک، از جمله شرایط تعامل، دقیقاً احتمالات شرطی تخمین زده شده اولیه را با شمارش فرکانس های شرطی برای مجموعه داده آموزشی DFQR بازیابی می کنند، که فقط تأیید عددی است، که مدل لاگ خطی با شرایط تعامل یک مدل کامل است. برای مجموعه داده آموزشی DFQR؛ رجوع کنید به جدول 9 و شکل 6 .

پس از تعادل با m = 10، مدل های مجموعه داده متعادل عبارتند از:

WofE : logReg : logRegwI : پ ˆ (تی بال = 1 | ب بال 1 ب بال 2) = Λ (- 0.4056 + 1.697 ب بال 1 + 1.697 ب بال 2) پ ˆ (تی بال = 1 | ب بال 1 ب بال 2) = Λ (- 0.4059 + 1.698 ب بال 1 + 1.698 ب بال 2) پ ˆ (تی بال = 1 | ب بال 1 ب بال 2) = Λ (- 0.4054 + 1.696 ب بال 1 + 1.696 ب بال 2 + 0.008299 ب بال 1 ب بال 2)

تائید معادله (11) ، زیرا فرض استقلال مشروط رد نشد.

4. نتیجه گیری

مدل‌سازی هدف یا بالقوه از مدل‌های رگرسیون یا رگرسیون مانند برای تخمین احتمال شرطی یک متغیر هدف با توجه به متغیرهای پیش‌بینی‌کننده استفاده می‌کند. تمام مدل های در نظر گرفته شده در اینجا:

به ترتیب متغیرهای پیش‌بینی‌کننده تصادفی توزیع‌شده و متغیرهای هدف به‌طور مستقل یکسان را فرض کنید ، به‌عنوان مثال ، همه مدل‌ها غیرمکانی هستند و وابستگی‌های ناشی از فضای مکانی را در نظر نمی‌گیرند، به‌عنوان مثال، زمین‌آمار. بنابراین، تنظیم مجدد مجموعه داده به صورت تصادفی منجر به تصاویر نقشه تصادفی یا مدل‌های جغرافیایی می‌شود، اما مدل‌های برازش را تغییر نمی‌دهد.
نکته ای نیستند؛ آنها شامل متغیرهای تصادفی هستند که به مکان های داده شده از نظر پیکسل های منطقه ای تصاویر نقشه دیجیتال دو بعدی یا وکسل های حجمی ژئومدل های سه بعدی اشاره می کنند. بنابراین، نتایج آنها به ترتیب به وضوح فضایی تصویر نقشه یا ژئومدل بستگی دارد.
نیاز به یک منطقه آموزشی برای تناسب با پارامترهای مدل. به این معنا که فرض مدلسازی ریاضی مرتبط با منطقه آموزشی این است که “حقیقت زمینی” را ارائه می دهد.

سپس، مدل‌ها را می‌توان در یک سلسله مراتب قرار داد، که با مدل بیزی ساده‌لوح وزن شواهد بسته به فرض مدل‌سازی استقلال شرطی همه متغیرهای پیش‌بین با توجه به متغیر هدف شروع می‌شود. اگر متغیرهای پیش بینی کننده (i) متغیرهای تصادفی شاخص یا گسسته باشند و (ii) با توجه به متغیر هدف، به صورت شرطی مستقل باشند، مورد خاص مدل رگرسیون لجستیک است. در این مورد، تضادهای وزن شواهد با ضرایب رگرسیون لجستیک یکسان است. در غیر این صورت، هیچ رابطه خطی بین وزن شواهد و پارامترهای رگرسیون لجستیک وجود ندارد.

تعمیم متعارف مدل بیزی ساده لوح که دارای وزن شواهد در مورد عدم استقلال شرطی است، رگرسیون لجستیک، از جمله شرایط تعامل است. اگر عبارات تعاملی برای مطابقت با نقض استقلال مشروط انتخاب شوند، اگر متغیرهای پیش‌بین گسسته باشند، دقیقاً این تخلفات را جبران می‌کنند. برای متغیرهای پیش‌بینی‌کننده پیوسته، آن‌ها دقیقاً فقط در صورتی جبران می‌کنند که احتمال مشترک لگ خطی باشد. در غیر این صورت، آنها ممکن است تقریبا جبران کنند. بنابراین، در مورد متغیرهای پیش بینی گسسته، مدل رگرسیون لجستیک بهینه است.

اعمال وزن شواهد با وجود نداشتن استقلال شرطی، هم احتمالات شرطی پیش‌بینی‌شده و هم تغییر رتبه‌شان را خراب می‌کند. آنها راهی برای تقلید اثر اصطلاحات تعاملی با “اصلاح” وزن شواهد متعاقباً، به عنوان مثال، با توان یا ضرب در برخی ضرایب τ – یا ν – نیستند.

برای بزرگ‌نمایی بیشتر مدل‌ها، تودرتو کردن مدل‌های رگرسیون‌مانند لجستیک یک گزینه است. صرف نظر از واژگان، لانه سازی که باعث ایجاد “لایه های پنهان” می شود، هسته سخت شبکه های عصبی مصنوعی است. اگر پیکربندی توپولوژی شبکه به اندازه کافی همه کاره باشد، مدل‌های شبکه عصبی مصنوعی می‌توانند فقدان استقلال شرطی را جبران کنند، دقیقاً مانند مدل‌های رگرسیون لجستیک، از جمله شرایط تعامل. هنگامی که شانس هدف خیلی کوچک است، ممکن است مقداری “تعادل” مورد نیاز باشد. یک روش متعادل سازی ساده نشان داده شد تا پارامترهای مدل را بدون تغییر باقی بگذارد، اگر خود مدل مناسب باشد.

امکان گنجاندن اصطلاحات تعاملی در مدل‌های رگرسیون لجستیک یا سایر مدل‌های منشأ یادگیری آماری، مسیر امیدوارکننده‌ای را به سوی وسیله‌ای مؤثر برای کنار گذاشتن فرضیه مدل‌سازی شدید استقلال شرطی و مقابله با فقدان استقلال شرطی در عمل باز می‌کند.

چشم انداز آینده امیدوارکننده، حسابداری رگرسیون برای وابستگی های فضایی برای خلاص شدن از (i) منطقه آموزشی تقسیم بندی شده در پیکسل یا وکسل و وابستگی به وضوح فضایی است که آنها ارائه می کنند. و (ب) فرض مدلسازی متغیرهای تصادفی توزیع شده مستقل و یکسان.

الف. ضمیمه

الف.1. اشتقاق اوزان شواهد در اصطلاحات ابتدایی

اگر T، B متغیرهای تصادفی شاخص با P (T = j ) > 0، P (B = i ) > 0، i، j = 0، 1 باشند، آنگاه قضیه بیز بیان می کند:

پ (T = j | B = i) = پ ( T = j , B = i ) پ ( B = i ) = پ ( T = j ) پ ( B = i ) پ ( T = j , B = i ) پ ( T = j ) = پ (T = j) پ ( B = i | T = j ) پ ( B = i )

سپس، نسبت احتمالات شرطی T = 1 و T = 0، به ترتیب، با توجه به B، به عنوان شکل لگ خطی قضیه بیز نامیده می شود،

O (T = 1 | B) = پ ( T = 1 | B ) پ ( T = 0 | B ) = پ ( T = 1 ) پ ( T = 0 ) پ ( B | T = 1 ) پ ( B | T = 0 )

مستقل از احتمال شرط B است. قضیه بیز برای چندین متغیر تصادفی شاخص B ₀ , B ₁ , …, B _m به:

O (T = 1 | B) = O (T = 1) \prod متر ℓ = 1 پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 1 ) \prod متر ℓ = 1 پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 0 ) = O (T = 1) \prod ℓ = 1 متر اف ℓ

با:

اف ℓ = پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 1 ) پ ( ب ℓ | ب 0 , \dots , ب ℓ - 1 , T = 0 ), ℓ = 1, \dots, m

حال، فرض ساده بیز مبنی بر استقلال شرطی همه متغیرهای پیش بینی کننده B با توجه به متغیر هدف T منجر به کارآمدترین ساده سازی می شود:

اف ℓ = پ ( ب ℓ | T = 1 ) پ ( ب ℓ | T = 0 ), ℓ = 1, \dots, m

و به وزن شواهد بر حسب شانس منجر می شود:

O (T = 1 | B) = O (T = 1) \prod ℓ = 1 متر پ ( ب ℓ | T = 1 ) پ ( ب ℓ | T = 0 ) = O (T = 1) \prod ℓ : ب ℓ = 1 پ ( ب ℓ = 1 | T = 1 ) پ ( ب ℓ = 1 | T = 0 ) \prod ℓ : ب ℓ = 0 پ ( ب ℓ = 0 | T = 1 ) پ ( ب ℓ = 0 | T = 0 ) = O (T = 1) \prod ℓ : ب ℓ = 1 اس ℓ \prod ℓ : ب ℓ = 0 ن ℓ

(12)

با:

اس ℓ = پ ( ب ℓ = 1 | T = 1 ) پ ( ب ℓ = 1 | T = 0 ) ، ن ℓ = پ ( ب ℓ = 0 | T = 1 ) پ ( ب ℓ = 0 | T = 0 ), ℓ = 1, \dots, m

به شرطی که P (B _ℓ = i | T = j ) ≠ 0, i, j = 0, 1 برقرار باشد. سپس، مدل وزن‌های شواهد چنین می‌خواند:

از نظر یک لاجیت (“شکل خطی ورود به فرمول بیز”):

$لاجیت پی (T = 1 | B) = logit P (T = 1) + \sum ℓ : ب ℓ = 1 دبلیو (1) ℓ + \sum ℓ : ب ℓ = 0 دبلیو (0) ℓ$

(13)

و:
از نظر احتمال:

$پ (T = 1 | B) = Λ (logit P (T = 1) + \sum ℓ : ب ℓ = 1 دبلیو (1) ℓ + \sum ℓ : ب ℓ = 0 دبلیو (0) ℓ)$

با $W_{ℓ}^{(1)} = \ln S_{ℓ}$ ، $W_{ℓ}^{(0)} = \ln N_{ℓ}$ ، اگر معادله (5) برقرار باشد. سپس، مدل وزن شواهد بر حسب تضاد، معادله (2) از نمایش اولیه آن بر حسب وزن به صورت زیر مشتق شده است:

$پ (T = 1 | B) = Λ (logit P (T = 1) + \sum ℓ : ب ℓ = 1 دبلیو (1) ℓ + \sum ℓ : ب ℓ = 0 دبلیو (0) ℓ) = Λ (logit P (T = 1) + \sum ℓ = 1 متر (دبلیو (1) ℓ ب ℓ + دبلیو (0) ℓ (1-_ب ℓ)))) = Λ (logit P (T = 1) + دبلیو (0) + \sum ℓ = 1 متر سی ℓ ب ℓ) = Λ (logit P (T = 1) + دبلیو (0) + \sum ℓ : ب ℓ = 1 سی ℓ)$

برای اجتناب از شرایط محدود کننده، معادله (5) مدل وزن شواهد بر حسب شانس، معادله (12) به صورت زیر بازنویسی شده است:

O (T = 1 | B) = O (T = 1) \prod ℓ = 1 متر (اس ℓ ب ℓ + ن ℓ (1-_ب ℓ))

برای تشخیص موارد مختلف، تنظیم می کنیم $ℳ$ = {1،…، m }، m ∈ ℕ، و سپس:

D = {ℓ \in M | اس ℓ \neq 0 \land ن ℓ \neq 0} اس = {ℓ \in M | اس ℓ \neq 0 \land ن ℓ \neq 0} ن = {ℓ \in M | ن ℓ \neq 0 \land اس ℓ \neq 0}

(14)

منجر به:

O (T = 1 | B) = O (T = 1) \prod ℓ \in D (اس ℓ ب ℓ + ن ℓ (1-_ب ℓ)) \prod ℓ \in اس اس ℓ ب ℓ \prod ℓ \in N ن ℓ (1-_ب ℓ)

و پس از گرفتن لگاریتم به:

ln O (T = 1 | B) = ln O (T = 1) + + \sum ℓ \in D ln (اس ℓ ب ℓ + ن ℓ (1_ب ℓ)) + \sum ℓ \in D لوگاریتم (اس ℓ ب ℓ) \sum ℓ \in N ln (ن ℓ (1_ب ℓ))

در نهایت، مدل بیز ساده لوح از نظر لجیت چنین می گوید:

لوجیت پی (T = 1 | B) = logit P (T = 1) + \sum ℓ \in D دبلیو (0) ℓ + \sum ℓ \in D سی ℓ ب ℓ + \sum ب ℓ = 1 ℓ \in اس دبلیو (1) ℓ + \sum ب ℓ = 1 ℓ \in N دبلیو (0) ℓ = logit P (T = 1) + \sum ℓ \in اس دبلیو (1) ℓ ب ℓ + \sum ℓ \in N دبلیو (0) ℓ (1-_ب ℓ) + \sum ℓ \in D دبلیو (0) ℓ + \sum ℓ \in D سی ℓ ب ℓ

(15)

بنابراین، برای معادله (15) کمی عمومیتر از معادله (13) ، معادله مطابقت اولیه (3) کمی بیشتر درگیر می شود، به عنوان مثال ، با نماد معادله (14) :

β 0 = logit P (T = 1) + \sum ℓ \in D دبلیو (0) ℓ β ℓ = سی ℓ ، ℓ \in D β ℓ = دبلیو (1) ℓ ، ℓ \in S β ℓ = دبلیو (0) ℓ ، ℓ \in N

الف.2. اشتقاق صریح رابطه عموما غیر خطی ضرایب رگرسیون لجستیک و وزن شواهد

برای متغیرهای پیش بینی کننده شاخص (B ₀ ,… B _m ) ^T = B با تحقق ( b ₀ ,…, b _m ) ^T = b با b ₀ =1, b _ℓ = 0, 1, برای ℓ = 1,…, m ، مدل رگرسیون لجستیک معمولی به صراحت می گوید:

لاجیت پی (T = 1 | B = b) = ln پ ( T = 1 | B = b ) پ ( T = 0 | B = b ) = β 0 + \sum ℓ : ب ℓ = 1 β ℓ = logit π (ب)

(16)

با:

π (ب) ص (تی = 1 | B = b)

2 ^متر تحقق متفاوت وجود دارد. از این رو، 2 ^متر لجیت مختلف وجود دارد. حال، ثابت نگه داشتن تمام _Bj = b _j ، به جز B _ℓ ، معادله (16) نشان می دهد که نسبت شانس لگاریتمی:

لوگاریتم ( پ ( T = 1 | ب 0 = 1 ، ب 1 = ب 1 ، \dots ، ب ℓ = 1 ، \dots ، ب متر = ب متر ) پ ( T = 0 | ب 0 = 1 ، ب 1 = ب 1 ، \dots ، ب ℓ = 1 ، \dots ، ب متر = ب متر ) ) ( پ ( T = 1 | ب 0 = 1 ، ب 1 = ب 1 ، \dots ، ب ℓ = 0 ، \dots ، ب متر = ب متر ) پ ( T = 0 | ب 0 = 1 ، ب 1 = ب 1 ، \dots ، ب ℓ = 0 ، \dots ، ب متر = ب متر ) ) = β ℓ, ℓ = 1, \dots, m

(17)

برای همه B _j ، j = 1، …، m، j ≠ ℓ ، ثابت، ر.ک. [ 8 ]. با استفاده از فرمول بیز و فرض استقلال شرطی B با توجه به T، سمت چپ معادله (17) به کنتراست C _ℓ وزن‌های $W_{ℓ}^{(1)}$ و $W_{ℓ}^{(0)}$ . به این ترتیب معادله (17) تفسیر مشترکی از پارامترهای رگرسیون لجستیک معمولی و وزن شواهد و تضادهای مرتبط با آنها در مورد استقلال شرطی ارائه می‌کند.

با توجه به مدل رگرسیون لجستیک معمولی، شانس _{لگاریتم} حاشیه 2 متری cℓk توسط:

ج ℓ من = لاجیت (P (دی = 1 | ب ℓ = من)) = لاجیت ⎛ ⎝ \sum ب ℓ = من (π (ب) ص (B = b)) / \sum ب “ ℓ = من پ (B = ب “) ⎞ ⎠ = لاجیت \sum ب ℓ = من ( Λ ( β 0 + \sum k : ب ک = 1 β ک ) پ ( B = b ) ) \sum ب “ ℓ = من پ ( B = ب “ )

برای ℓ = 1، …، m و i = 0، 1 و جایی که b′ یک کپی از b است. مجموع همه b با b _ℓ = 1 گرفته می شود. سپس، متضادهای m عبارتند از:

سی ℓ = ج ℓ 1 - ج ℓ 0, ℓ = 1, \dots, m

(18)

معادله (18) رابطه غیر خطی کنتراست ها و پارامترهای رگرسیون را ایجاد می کند. مورد بی اهمیت m = 1 بلافاصله به C ₁ = β ₁ منتهی می شود . برای m = 2، معادله (18) به صورت زیر ساده می شود:

ج 11 = لاجیت Λ ( β 0 + β 1 + β 2 ) پ ( ب 1 = 1 ، ب 2 = 1 ) + Λ ( β 0 + β 1 ) پ ( ب 1 = 1 ، ب 2 = 0 ) پ ( ب 1 = 1 ، ب 2 = 1 ) + P ( ب 1 = 1 ، ب 2 = 0 ) ج 10 = لاجیت Λ ( β 0 + β 2 ) پ ( ب 1 = 0 ، ب 2 = 1 ) + Λ ( β 0 ) پ ( ب 1 = 0 ، ب 2 = 0 ) پ ( ب 1 = 0 ، ب 2 = 1 ) + P ( ب 1 = 0 ، ب 2 = 0 ) ج 21 = لاجیت Λ ( β 0 + β 1 + β 2 ) پ ( ب 1 = 1 ، ب 2 = 1 ) + Λ ( β 0 + β 2 ) پ ( ب 1 = 0 ، ب 2 = 1 ) پ ( ب 1 = 1 ، ب 2 = 1 ) + P ( ب 1 = 0 ، ب 2 = 1 ) ج 20 = لاجیت Λ ( β 0 + β 1 ) پ ( ب 1 = 1 ، ب 2 = 0 ) + Λ ( β 0 ) پ ( ب 1 = 0 ، ب 2 = 0 ) پ ( ب 1 = 1 ، ب 2 = 0 ) + P ( ب 1 = 0 ، ب 2 = 0 )

اشتباه گرفتن تبدیل لاجیت به عنوان خطی منجر به رابطه خطی اشتباه کنتراست ها و پارامترهای رگرسیون لجستیک می شود که توسط دنگ (2009) ارائه شده است. رجوع کنید به [ 22 ].

منابع

هرونسکی، JMA; Groves، DI Science of targeting: تعریف، استراتژی ها، هدف گیری و اندازه گیری عملکرد. اوست J. Earth Sci. 2008 ، 55 ، 3-12. [ Google Scholar ]
کاکس، DP; Singer, DA Mineral Deposit Models ; بولتن سازمان زمین شناسی ایالات متحده 1693; دفتر چاپ دولت ایالات متحده: واشنگتن، دی سی، ایالات متحده آمریکا، 1986. [ Google Scholar ]
Chilès، J.-P. دلفینر، ص. زمین آمار- مدلسازی عدم قطعیت فضایی ، ویرایش دوم. جان وایلی و پسران: هوبوکن، نیوجرسی، ایالات متحده آمریکا، 2012. [ Google Scholar ]
Independence and Conditional Independence ، در دسترس آنلاین: http://www.eecs.qmul.ac.uk/norman/BBNs/Independence_and_conditional_independence.htm در 10 اکتبر 2014 قابل دسترسی است.
میچل، TM یادگیری ماشین ; McGraw-Hill: نیویورک، نیویورک، ایالات متحده آمریکا، 1997. [ Google Scholar ]
هویسگارد، اس. ادواردز، دی. Lauritzen, S. Graphical Models with R. Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2012. [ Google Scholar ]
Schaeben, H. دیدگاهی ریاضی از وزن شواهد، استقلال شرطی، و رگرسیون لجستیک از نظر میدان‌های تصادفی مارکوف. ریاضی. Geosci. 2014 ، 46 ، 691-709. [ Google Scholar ]
Hosmer، DW; Lemeshow, S. Applied Logistic Regression , 2nd ed.; Wiley: نیویورک، نیویورک، ایالات متحده آمریکا، 2000. [ Google Scholar ]
شایبن، اچ. مدل‌سازی بالقوه: استقلال شرطی اهمیت دارد. بین المللی J. Geomath. 2014 ، 5 ، 99-116. [ Google Scholar ]
آگتربرگ، FP; بونهام-کارتر، GF; رایت، DF ادغام الگوی آماری برای اکتشاف مواد معدنی. در برنامه های کامپیوتری در برآورد منابع پیش بینی و ارزیابی برای فلزات و نفت ; Gaal, G., Merriam, DF, Eds.; چاپ پرگامون: آکسفورد، نیویورک، ایالات متحده آمریکا، 1990; ص 1-21. [ Google Scholar ]
بونهام-کارتر، GF; آگتربرگ، FP کاربرد یک سیستم اطلاعات جغرافیایی مبتنی بر میکرو کامپیوتر برای نقشه برداری پتانسیل معدنی. در برنامه های کاربردی مبتنی بر میکرو کامپیوتر در زمین شناسی II، نفت ; Hanley, JT, Merriam, DF, Eds. چاپ پرگامون: نیویورک، نیویورک، ایالات متحده آمریکا، 1990; صص 49-74. [ Google Scholar ]
خوب، احتمال IJ و وزن شواهد ؛ گریفین: لندن، بریتانیا، 1950. [ Google Scholar ]
خوب، IJ برآورد احتمالات: مقاله ای در مورد روش های مدرن بیزی . رساله پژوهشی شماره 30; انتشارات MIT: کمبریج، MA، ایالات متحده آمریکا، 1968. [ Google Scholar ]
دست، دی جی; یو، کی. احمق – بالاخره خیلی احمقانه نیست؟ بین المللی آمار Rev. 2001 , 69 , 385-398. [ Google Scholar ]
هستی، تی. طبشیرانی، ر. فریدمن، جی . عناصر یادگیری آماری . Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2001. [ Google Scholar ]
اسمولا، ای جی; Vishwanathan، SVN مقدمه ای بر یادگیری ماشینی ؛ انتشارات دانشگاه کمبریج: کمبریج، انگلستان، 2008. [ Google Scholar ]
ساتن، سی. McCallum، A. مقدمه ای بر زمینه های تصادفی شرطی برای یادگیری رابطه ای. در مقدمه ای بر یادگیری رابطه ای آماری ; Getoor, L., Taskar, B., Eds. انتشارات MIT: لندن، انگلستان، 2007; صص 93-127. [ Google Scholar ]
آگتربرگ، FP; چنگ، Q. آزمون استقلال شرطی برای مدل‌سازی وزن شواهد. نات. منبع. Res. 2002 ، 11 ، 249-255. [ Google Scholar ]
بونهام-کارتر، سیستم های اطلاعات جغرافیایی GF برای دانشمندان زمین شناسی ؛ چاپ پرگامون: آکسفورد، نیویورک، ایالات متحده آمریکا، 1994. [ Google Scholar ]
ژانگ، ک. پیترز، جی. جانزینگ، دی. Schölkopf، B. آزمون استقلال شرطی مبتنی بر هسته و کاربرد در کشف علی، مجموعه مقالات بیست و هفتمین کنفرانس عدم قطعیت در هوش مصنوعی (UAI 2011)، بارسلونا، اسپانیا، 14-17 ژوئیه 2011. Cozman, FG, Pfeffer, A., Eds. AUAI Press: Corvallis, OR, USA, 2011; صص 804-813.
Schaeben, H. مقایسه روش های ریاضی مدل سازی پتانسیل. ریاضی. Geosci. 2012 ، 44 ، 101-129. [ Google Scholar ]
شایبن، اچ. ون دن بوگارت، KG نظر در مورد “یک وابستگی شرطی وزن های مدل شواهد تنظیم شده” توسط Minfeng Deng در تحقیقات منابع طبیعی 18 (2009)، 249-258. نات. منبع. Res. 2011 ، 29 ، 401-406. [ Google Scholar ]
Journel، AG ترکیب دانش از منابع مختلف: جایگزینی برای فرضیه‌های سنتی استقلال داده‌ها. ریاضی. جئول 2002 ، 34 ، 573-596. [ Google Scholar ]
کریشنان، اس. بوچر، ا. Journel, AG ارزیابی افزونگی اطلاعات از طریق مدل τ . در Geostatistics Banff 2004 ; Leuangthong, O., Deutsch, CV, Eds.; Springer: Dordrecht، هلند، 2005; صص 1037–1046. [ Google Scholar ]
کریشنان، اس. مدل τ برای افزونگی داده ها و ترکیب اطلاعات در علوم زمین: نظریه و کاربرد. ریاضی. Geosci. 2008 ، 40 ، 705-727. [ Google Scholar ]
پولیاکوا، EI؛ Journel, AG مدل ν برای ادغام داده های احتمالی، IAMG’2006، مجموعه مقالات کنگره بین المللی XI انجمن بین المللی زمین شناسی ریاضی: زمین شناسی کمی از منابع متعدد، لیژ، بلژیک، 3-8 سپتامبر 2006.
پولیاکوا، EI؛ Journel, AG بیان ν برای ادغام داده های احتمالی. ریاضی. جئول 2007 ، 39 ، 715-733. [ Google Scholar ]
Vapnik، VN ماهیت نظریه یادگیری آماری ، ویرایش دوم. Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2000. [ Google Scholar ]
Bishop، CM Pattern Recognition and Machine Learning ; Springer: نیویورک، نیویورک، ایالات متحده آمریکا، 2006. [ Google Scholar ]
راسل، اس. Norvig, P. Artificial Intelligence, A Modern Approach , 2nd ed.; Prentice Hall: Upper Saddle River، نیوجرسی، ایالات متحده آمریکا، 2003. [ Google Scholar ]
Skabar, A. مدل سازی توزیع فضایی ذخایر معدنی با استفاده از شبکه های عصبی. نات. منبع. مدل. 2007 ، 20 ، 435-450. [ Google Scholar ]
آدم، ا. ابراهیم، ز. شاپیایی، MI; جویدن، LC; Jau، LW; خالد، م. Watada، J. یک شبکه عصبی مصنوعی یادگیری با نظارت دو stwp برای مشکلات مجموعه داده نامتعادل. بین المللی J. Innov. محاسبه کنید. Inf. کنترل. 2012 ، 8 ، 3163-3172. [ Google Scholar ]
آدم، ا. شاپیایی، MI; ابراهیم، ز. خالد، م. Jau، LW توسعه یک شبکه عصبی مصنوعی ترکیبی – طبقه‌بندی کننده ساده و بی تکلف برای مشکل طبقه‌بندی باینری مجموعه داده‌های نامتعادل. ICIC Express Lett. 2011 ، 5 ، 3171-3175. [ Google Scholar ]
باتیستا، GEAPA؛ پراتی، آرسی Monard، MC مطالعه رفتار چندین روش برای متعادل کردن داده‌های آموزش یادگیری ماشین. SIGKDD کاوش. مشخصات Issue Learn. مجموعه داده های نامتعادل 2004 ، 6 ، 20-29. [ Google Scholar ]
Chawla، NV; بویر، KW; هال، لو. Kegelmeyer, WP Smote: روش نمونه برداری بیش از حد اقلیت مصنوعی. جی آرتیف. هوشمند Res. 2002 ، 16 ، 321-357. [ Google Scholar ]
کوتسیانتیس، س. کانلوپولوس، دی. Pintelas، P. مدیریت مجموعه داده های نامتعادل: یک بررسی. GESTS Int. ترانس. محاسبه کنید. علمی مهندس 2006 ، 30 ، 25-36. [ Google Scholar ]
ژائو، Z.-Q. یک شبکه عصبی مدولار جدید برای مسائل طبقه بندی نامتعادل تشخیص الگو Lett. 2008 ، 30 ، 783-788. [ Google Scholar ]
تیم اصلی توسعه R. R-A زبان و محیط برای محاسبات آماری ; R Foundation for Statistical Computing: وین، اتریش، 2013. موجود به صورت آنلاین: http://www.R-project.org/ قابل دسترسی در 10 اکتبر 2014.

شکل 1. توزیع فضایی دو متغیر پیش‌بینی‌کننده شاخص B1 _، B2 و متغیر هدف شاخص T از مجموعه داده RANKIT و دو نیمه متغیر _یک جهته ( سمت چپ ). و توزیع فضایی دو متغیر پیش‌بینی‌کننده شاخص B1 _، B2 و متغیر هدف شاخص T از مجموعه داده RANKITMIX و دو نیمه متغیر _یک جهته ( راست )، که توزیع‌های فضایی متفاوت و ویژگی‌های زمین‌آماری متفاوتی را نسبت به رتبه‌بندی نشان می‌دهد . خطوط قرمز مقادیر واریانس نمونه کلاسیک را نشان می دهد.

شکل 2. توزیع فضایی احتمالات شرطی پیش بینی شده

\hat{P} (T = 1 | B_{1} B_{2})

برای رتبه بندی مجموعه داده آموزشی بر اساس: تخمین ابتدایی ( بالا سمت چپ )؛ رگرسیون لجستیک با عبارت تعامل ( مرکز بالا )؛ آنگا شبکه عصبی مصنوعی R ( بالا سمت راست )؛ وزن شواهد ( پایین سمت چپ )؛ رگرسیون لجستیک بدون تعامل (پایین سمت راست).

شکل 3. توزیع فضایی احتمالات شرطی پیش بینی شده

\hat{P} (T = 1 | B_{1} B_{2})

برای مجموعه داده آموزشی rankitmix بر اساس: تخمین ابتدایی ( بالا سمت چپ )؛ رگرسیون لجستیک با عبارت تعامل ( مرکز بالا )؛ آنگا شبکه عصبی مصنوعی R ( بالا سمت راست )؛ وزن شواهد ( پایین سمت چپ )؛ رگرسیون لجستیک بدون تعامل ( پایین سمت راست ).

شکل 4. جابجایی هدف گیری و بازآرایی تصادفی همزمان تمام تصاویر نقشه دیجیتال.

شکل 5. توزیع فضایی دو متغیر پیش بینی کننده شاخص B1 _،_B2 و متغیر هدف شاخص T مجموعه داده DFQR.

شکل 6. توزیع فضایی احتمالات شرطی پیش بینی شده

\hat{P} (T = 1 | B_{1} B_{2})

برای مجموعه داده آموزشی DFQR با توجه به: تخمین ابتدایی (بالا سمت چپ). وزن مدارک ( مرکز بالا )؛ شبکه عصبی مصنوعی ANNGA R ( بالا سمت راست )، رگرسیون لجستیک معمولی ( پایین سمت چپ )، رگرسیون لجستیک با عبارت تعامل ( پایین سمت راست ).

جدول 1. جدول اقتضایی غیرشرطی B1 و B2، و جداول اقتضایی شرطی B1 و B2 به _ترتیب_با توجه به T از مجموعه داده‌های رتبه‌بندی و rankitmix .

جدول 2. جداول اقتضایی T و B ₁ و B ₂ به ترتیب رتبه بندی و rankitmix مجموعه داده ها .

جدول 3. ماتریس همبستگی rankit و rankitmix مجموعه داده ها ، به ترتیب.

جدول 4. مقایسه احتمالات شرطی پیش بینی شده با شمارش ابتدایی، وزن شواهد (WofE)، رگرسیون لجستیک معمولی بدون شرایط تعامل (oLogReg)، رگرسیون لجستیک شامل شرایط تعامل (LogRegwI)، و شبکه های عصبی مصنوعی با استفاده از الگوریتم ژنتیک (ANNGA) [ 38 ]) برای رتبه بندی مجموعه داده آموزشی اعمال شد.

جدول 5. جدول اقتضایی غیرشرطی B ₁ و B ₂ و جداول احتمالی شرطی B ₁ و B ₂ با توجه به T مجموعه داده DFQR.

جدول 6. جداول احتمالی T و B ₁ و B ₂ به ترتیب از مجموعه داده DFQR.

جدول 7. ماتریس همبستگی مجموعه داده مجموعه داده DFQR.

جدول 8. آزمون اهمیت فرضیه صفر استقلال شرطی، با اشاره به مدل خطی ورود به سیستم برای مجموعه داده DFQR.

جدول 9. مقایسه احتمالات شرطی پیش بینی شده با شمارش ابتدایی، وزن شواهد (WofE)، رگرسیون لجستیک معمولی بدون شرایط تعامل (oLogReg)، رگرسیون لجستیک شامل شرایط تعامل (LogRegwI) و شبکه های عصبی مصنوعی با استفاده از الگوریتم ژنتیک (ANNGA) [ 38 ]) به مجموعه داده آموزشی DFQR اعمال شد.

© 2014 توسط نویسندگان; دارنده مجوز MDPI، بازل، سوئیس این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons Attribution (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.

;کاربردهای GIS مقالات

درخواست مشاوره

09120049370

8 صبح تا 12 شب

09120049370

خلاصه

1. معرفی

2. مدل های ریاضی

2.1. فرض مدلسازی استقلال مشروط

2.2. رگرسیون لجستیک

2.3. اوزان شواهد

2.4. تست استقلال مشروط

2.5. وزن شواهد در مقابل رگرسیون لجستیک

2.6. وزن شواهد در مقابل مدل τ- یا ν

2.7. شبکه های عصبی مصنوعی

2.8. متعادل کردن

2.9. پیچیدگی عددی رگرسیون لجستیک

3. مثال ها

3.1. مجموعه داده RANKIT بازبینی شد

3.2. مجموعه داده DFQR

4. نتیجه گیری

الف. ضمیمه

الف.1. اشتقاق اوزان شواهد در اصطلاحات ابتدایی

الف.2. اشتقاق صریح رابطه عموما غیر خطی ضرایب رگرسیون لجستیک و وزن شواهد

منابع

قبلیتجزیه و تحلیل تغییر مورفولوژیکی شهری شهر داکا، بنگلادش، با استفاده از نحو فضایی

بعدیاستفاده از سیستم داده جیووانی ناسا برای تحقیقات بهداشت عمومی جغرافیایی: نمونه ای از اتصال آب و هوا-آنفولانزا

بدون نظر

دیدگاهتان را بنویسید لغو پاسخ