خلاصه
نابرابری مشارکت به طور گسترده در OpenStreetMap (OSM) وجود دارد، به این معنی که بیشتر داده ها از اقلیتی از مشارکت کنندگان می آیند، در حالی که اکثریت تنها درصد کمی از داده ها را تشکیل می دهند. این پدیده برای درک اینکه داده ها از کجا می آیند و چگونه پروژه تکامل می یابد از اهمیت بالایی برخوردار است. بررسی در این مقاله به پاسخ به سؤالات زیر اختصاص دارد: چگونه نابرابری سهم در طول زمان در OSM تغییر می کند؟ کدام گروه از مشارکتکنندگان نقش مهمتری در تأثیرگذاری بر روند نابرابری مشارکت دارند: «اقلیت صوتی» یا «اکثریت خاموش»؟ برای پاسخ به سوال اول، اندازه گیری های کلی برای نابرابری سهم با استفاده از منحنی لورنز و ضریب جینی ارائه می کنیم. برای پاسخ به سوال دوم، ما از استراتژی طبقهبندی چندک برای تحلیل تغییرات ساختاری در جامعه استفاده میکنیم و از آزمون من ویتنی ویلکاکسون برای تحلیل تغییرات بهرهوری استفاده میکنیم. مطالعه موردی ما نشان میدهد که در کشورهایی که واردات قابل توجهی ندارند، مشارکتها در طول زمان نابرابرتر میشوند. این روند با گسترش سریع اکثریت ساکت سازگار است، حتی اگر طبقات دیگر مشارکت کنندگان نیز با سرعت کمتری رشد کنند. از سوی دیگر، نابرابری سهم در کشورهایی که واردات زیادی دارند، نوسان زیادی دارد و به خوبی با تغییرات بهرهوری در اقلیت صوتی موافق است. این روند با گسترش سریع اکثریت ساکت سازگار است، حتی اگر طبقات دیگر مشارکت کنندگان نیز با سرعت کمتری رشد کنند. از سوی دیگر، نابرابری سهم در کشورهایی که واردات زیادی دارند، نوسان زیادی دارد و به خوبی با تغییرات بهرهوری در اقلیت صوتی موافق است. این روند با گسترش سریع اکثریت ساکت سازگار است، حتی اگر طبقات دیگر مشارکت کنندگان نیز با سرعت کمتری رشد کنند. از سوی دیگر، نابرابری سهم در کشورهایی که واردات زیادی دارند، نوسان زیادی دارد و به خوبی با تغییرات بهرهوری در اقلیت صوتی موافق است.
کلید واژه ها:
اطلاعات جغرافیایی داوطلبانه OpenStreetMap ; نابرابری
1. معرفی
ظهور اطلاعات جغرافیایی داوطلبانه (VGI) امکان جدیدی را برای تولید داده های جغرافیایی باز ارائه می دهد [ 1 ]. OpenStreetMap (OSM)، به عنوان یکی از موفقترین پروژههای VGI، میلیونها مشارکتکننده را برای تولید یک پوشش جهانی از دادههای مکانی جذب کرده است، که قدرت جمعسپاری در تولید دادههای جغرافیایی را اثبات میکند [2 ] . تحقیقات قبلی نشان میدهد که دادههای OSM در برخی مناطق، به عنوان مثال، بریتانیا یا آلمان، کیفیت مناسبی دارند، حتی در برخی جنبهها از دادههای اختصاصی فراتر میروند [ 3 ، 4 ]. پروژههای بیشتری از دادههای OSM برای جایگزینی دادههای اختصاصی استفاده میکنند تا از باز بودن و سرعت تکامل آن بهره ببرند [ 5 ].
مشارکت کنندگان چه کسانی هستند و چگونه داده ها انباشته می شوند، تفاوت اساسی بین VGI و داده های جغرافیایی سنتی ایجاد می کند. تحقیقات زیادی در حین تلاش برای شناسایی انگیزه ها [ 6 ]، الگوهای مشارکت کننده مکانی-زمانی [ 3 ] و ساختار اجتماعی جوامع مشارکت کننده [ 7 ] انجام شده است . پدیده ای که اغلب گزارش شده است، نابرابری مشارکت است، به این معنی که اقلیتی از همه کاربران تقریباً همه مشارکت ها را انجام می دهند، شبیه بسیاری از جوامع آنلاین دیگر. برای مثال، حتی در سالهای اولیه تاریخ OSM، 3.5 درصد از کاربران ثبتشده برتر، 98 درصد از کل دادههای OSM را تشکیل میدهند [ 3]]، نشان دهنده نابرابری سهم بسیار بالایی است، حتی در مقایسه با سایر پروژه های جمع سپاری. بر اساس نظریههای مرتبط مانند «علم شهروندی» [ 1 ]، وسوسهانگیز است که دادههای جمعسپاری شده را محصولات کل «جمعیت» بدانیم. با این حال، پدیده نابرابری مشارکت به کسی هشدار میدهد که اگرچه تعداد زیادی از مشارکتکنندگان در پروژه شرکت میکنند، به اصطلاح «اقلیت صوتی» [ 8 ] تقریباً همه دادهها را به حساب میآورند، در حالی که بیشتر جامعه فقط یک «ساکت هستند». اکثریت”.
پدیده نابرابری مشارکت در ماهیت VGI به عنوان یک تلاش علمی جمع سپاری ریشه دارد [ 9 ]. شکاف های دانشی بین مشارکت کنندگان وجود دارد، از متخصصان جغرافیایی تا آماتور [ 10]]. کارشناسان میتوانند بسیار سازندهتر از آماتورها باشند، اما جمعیت آنها نمیتواند بهخوبی مقیاسپذیر باشد، زیرا پروژه گسترش مییابد. بنابراین «اقلیت صوتی» و «اکثریت خاموش» ظهور میکنند و نابرابری سهم شکل میگیرد. نابرابری مشارکت تأثیرات اساسی و پیچیده ای بر کیفیت داده ها و پیشرفت پروژه دارد. از یک طرف، مشارکتکنندگان فعال معمولاً به لطف تخصص خود در ابزارها و تجربیات غنی، دادههایی با کیفیت بهتر تولید میکنند. مشارکتهای نابرابر به این معنی است که دادههای بیشتری از مشارکتکنندگان فعال میآیند، که ممکن است به کیفیت داده بالاتر منجر شود. از سوی دیگر، نابرابری سهم بیشتر، ناهمگونی را کاهش می دهد و پروژه را به خطر می اندازد، زیرا مشکلات تنها چند مشارکت کننده می تواند تأثیر زیادی بر پروژه داشته باشد.
بسیاری از کارهای قبلی به نابرابری مشارکت در OSM اشاره میکنند و حتی برخی از آنها عمداً درباره آن بحث میکنند. Heipke اهمیت قاعده 90-9-1 [ 11 ] را در توسعه پروژههای جمعسپاری جغرافیایی [ 12 ] مورد بحث قرار میدهد. هاکلی و وبر پیشنهاد می کنند که OSM نابرابری مشابه سایر جوامع آنلاین را نشان می دهد [ 2 ]. Mooney و Corcoran هنگام تجزیه و تحلیل الگوهای مشارکت مشارکتی ماهیت “دم بلند” را مشاهده می کنند [ 7 ]. Neis و Zipf خلاصهای جامع از نابرابری مشارکتهای گره، راه و روابط ارائه میکنند و رفتارهای کاربر را بین چهار گروه مشارکتکننده با فعالیتهای مختلف مقایسه میکنند [ 13 ]. در کارهای بعدی، نیس و همکاران. همچنین توزیع نقشهبرداران غیر تکراری، جوان و ارشد را بین شهرهای مختلف در سراسر جهان مقایسه کنید [ 14 ]. بوداتوکی و هیتورنثویت از پرسشنامهها برای یافتن انگیزههای پشت سر مشارکتکنندگان OSM استفاده میکنند و گزارش میدهند که تفاوتهای قابلتوجهی در انگیزهها بین مشارکتکنندگان معمولی و فعال وجود دارد [ 6 ]. این کاوشها درک ما را در مورد نابرابری مشارکت از جنبههای مختلف بهبود میبخشد، اما تحلیل زمانی و تحقیقات عمیق در مورد این موضوع هنوز دیده نشده است.
در این مقاله، ابتدا یک معیار کمی از نابرابری مشارکت ارائه میکنیم، و سپس به سؤال کلی پاسخ میدهیم که «X درصد بالای همه مشارکتکنندگان، Y درصد همه مشارکتها را تشکیل میدهند»، با توجه به هر X و Y برای یک دوره دلخواه. سپس روند نابرابری سهم مورد بحث قرار خواهد گرفت. تغییرات در “اکثریت خاموش” و “اقلیت صوتی” می تواند بر روند نابرابری سهم تاثیر بگذارد. اکثریت خاموش می تواند به طور قابل توجهی از نظر اندازه افزایش یابد به طوری که اقلیت از نظر جمعیت حتی حاشیه ای تر شوند. اقلیت آوازی می تواند حتی سازنده تر شود که شکاف بین دو انتهای جامعه را بیشتر می کند. هر دو مورد می تواند منجر به مشارکت های نابرابر بیشتر شود. در این مقاله بررسی خواهیم کرد که کدام یک مهمتر است و ببینیم آیا نتایج در کشورهای مختلف متفاوت است یا خیر.15 ]. ما مطالعات موردی مقایسه ای را در آلمان، فرانسه، ایالات متحده و هلند انجام می دهیم. این چهار کشور بر اساس اینکه آیا واردات در بین همه مشارکتها در دوره تحقیق قابل توجه است یا خیر، به دو گروه تقسیم میشوند. ساختار بخشهای باقیمانده به صورت زیر است: بخش 2 روشهای ما را شرح میدهد، از جمله نحوه اندازهگیری نابرابری مشارکت، و روششناسی برای بررسی تغییرات در اکثریت صوتی و همچنین اقلیت خاموش. بخش 3 این روش ها را برای تغییر مجموعه داده ها در چهار کشور اعمال می کند و نتایج را مورد بحث قرار می دهد. بخش 4 این مقاله را به پایان می رساند و کار احتمالی آینده را پیشنهاد می کند.
2. روش ها
در این بخش، روشهای خود را برای تحلیل نابرابری سهم در OSM ارائه میکنیم. برای اندازه گیری نابرابری، منحنی لورنز و ضریب جینی را با استفاده از تغییرات OSM محاسبه می کنیم. اکثریت خاموش جمعیت زیادی دارند و میزان مشارکت های فردی متفاوت است. بنابراین، بررسی می کنیم که چگونه ساختار جامعه در طول زمان تغییر می کند. برعکس، اقلیت صدادار جمعیت کمی دارند و مشارکتهای فردی آنها میتواند بسیار نامنظم باشد. بنابراین، ما آنها را کشف می کنیم و چگونگی تغییر بهره وری آنها را تجزیه و تحلیل می کنیم. ما به ترتیب از طبقه بندی های مبتنی بر چندت و آزمون های دو نمونه ای Mann-Whitney-Wilcoxon به عنوان ابزار اصلی خود استفاده می کنیم. مشارکت های OSM از توزیع های سنگین پیروی می کنند [ 16]، که ممکن است روش های آماری مختلف، به عنوان مثال، آمار مبتنی بر لحظه یا آزمون t Student را نامناسب کند. در این مقاله، ما فقط از روش های آماری قوی استفاده می کنیم.
2.1. تنظیمات OSM
ما از داده های تغییرات OSM به عنوان منبع اصلی داده استفاده می کنیم. مجموعه تغییرات شامل حجم زیادی از ویرایشها و برخی فراداده برای توصیف این ویرایشها است. مفهوم تغییرات به طور رسمی در سال 2009 معرفی شد [ 17 ]، اما امکان تولید دادههای تغییرات قبل از سال 2009 با استخراج تفاوتها از تاریخچه ویرایش کامل OSM وجود دارد. داده های تولید شده فاقد برخی اطلاعات متا هستند اما همچنان اطلاعات مفیدی مانند تاریخ و زمان مشارکت ها و شناسه کاربر را ارائه می دهند. یک مزیت مهم تغییرات مجموعه این است که آنها کاملاً با کاربران فردی مرتبط هستند که برای محاسبه مشارکت بهتر از کار مستقیم روی مجموعه داده OSM هستند. داده های Changeset را می توان از Planet OSM [ 18] به دست آورد]. فراداده یک مجموعه تغییرات شامل شناسه تغییرات جهانی، نام و شناسه مشارکتکننده، زمانهای باز و بسته شدن، کادر محدود همه ویرایشها، تعداد تغییرات در این مجموعه تغییرات، و برچسبها است. برچسبها ابردادههای انعطافپذیری هستند که توسط مشارکتکنندگان ارائه میشوند یا توسط ابزارهای ویرایش تولید میشوند، که میتوانند به درک منابع داده، ابزارها، هدف و بسیاری از جنبههای دیگر در مورد مشارکتهای حاوی کمک کنند. به عنوان مثال، برچسب “منبع” با مقادیری مانند “دانش”، “بررسی” یا “NHD” (مجموعه دادههای هیدروگرافی ملی) نشان میدهد که دادهها از کجا آمدهاند. برچسب “نظر” حاوی اطلاعات آزادانه است، به عنوان مثال، “تراز کردن قبرستان و پارک با تصاویر هوایی یاهو”، که توضیح میدهد که چه کمکهایی هستند و چگونه انجام میشوند.
2.2. نابرابری
ما از منحنی لورنز و ضریب جینی برای به تصویر کشیدن یک اندازه گیری کمی از نابرابری سهم استفاده می کنیم. منحنی لورنز و ضریب جینی دو روش نزدیک به هم هستند. آنها معمولاً در اقتصاد برای اندازه گیری نابرابری درآمد ملی استفاده می شوند. علاوه بر این، آنها برای توصیف نابرابری ها در زمینه های دیگر، مانند آموزش [ 19 ] و مشارکت های ویکی پدیا [ 20 ] تعمیم داده شده اند. در ادبیات اخیر، آنها همچنین برای تجزیه و تحلیل فعالیتهای ویرایش ویکی OSM استفاده میشوند [ 21]. در زمینه ما، با فرض اینکه مشارکت کنندگان بر اساس مشارکت هایشان به صورت صعودی مرتب شده اند، سهم تجمعی مشارکت کنندگان را به عنوان X و سهم تجمعی مشارکت ها را به عنوان Y انتخاب می کنیم و منحنی لورنز را برای مشارکت های OSM دریافت می کنیم. اگر مشارکت همه افراد کاملاً برابر باشد، منحنی لورنز به یک خط مستقیم به نام خط برابری تبدیل می شود، همانطور که در شکل 1 نشان داده شده است . سپس ضریب جینی را می توان با تقسیم ناحیه A بر مساحت B محاسبه کرد. ضریب جینی از 0 (کاملاً مساوی) تا 1 (کاملاً نابرابر) متغیر است و مقدار بزرگتر نشان دهنده سطح بالاتری از نابرابری است. از منحنی لورنز، میتوانیم به راحتی به این سؤال کلی پاسخ دهیم: «X٪ از همه مشارکتکنندگان Y٪ از همه مشارکتها را تشکیل میدهند.” به عنوان مثال، داده شده است Y= 70 ٪�=70%، ما گرفتیم ایکس= 90 ٪ایکس=90%در شکل 1 ، به این معنی که 1- 90 % = 10 %90%=10%مشارکت کنندگان می سازند 70 درصد70%مشارکت ها ما می توانیم هر Y را برای بدست آوردن X مربوطه ارائه کنیم . منحنی های لورنز و ضریب جینی را می توان بین مجموعه های نمونه با اندازه های مختلف مقایسه کرد. این ویژگی برای تجزیه و تحلیل زمانی بسیار مهم است، زیرا تعداد مشارکت کنندگان هر سال مدام در حال تغییر است.
یکی از مشکلات ضریب جینی این است که هیچ اشاره ای به ساختار جمعیتی زیربنایی ارائه نمی دهد. تحلیل ما در مورد اکثریت و اقلیت می تواند مکمل خوبی برای آن باشد.
2.3. تغییرات ساختاری در جامعه
ما همه مشارکت کنندگان را به چندین کلاس طبقه بندی می کنیم و بررسی می کنیم که چگونه اندازه هر کلاس در طول زمان تغییر می کند. کارهای قبلی معمولاً مشارکت کنندگان را بر اساس وقفه های انتخابی دستی طبقه بندی می کند. به عنوان مثال، Neis و Zipf مشارکتکنندگانی را که بیش از 1000 گره ایجاد کردهاند بهعنوان «نقشهگذاران ارشد»، که بیش از 10 گره ایجاد کردهاند اما کمتر از 1000 گره را بهعنوان «نقشهگذاران جوان» و کمتر از 10 گره را بهعنوان «غیر تکرارشونده» طبقهبندی میکنند. نقشه برداران» [ 13 ]. اگر بخواهیم تعداد دلخواه کلاسها را داشته باشیم، تصمیمگیری در مورد همه شکستها به این روش به سرعت غیرعملی میشود. علاوه بر این، سطل های انتخابی خودسرانه در توزیع های دم سنگین ممکن است منجر به تخمین های نادرست شود [ 22]]. در این مقاله، شکست ها را بر اساس چندک ها تعیین می کنیم که در برابر توزیع های دم سنگین مقاوم هستند. روش به شرح زیر است: (1) یک سال مرجع را انتخاب کنید، و N-quantile را برای آن سال محاسبه کنید، که منجر به شکست N-1 می شود. (2) برای هر سال، از وقفه های N-1 برای طبقه بندی مشارکت کنندگان فعال در آن سال به کلاس های N استفاده کنید. تغییرات ساختاری در جامعه را می توان با مقایسه طبقات مربوطه بین سال ها به راحتی مشاهده کرد.

شکل 1. مفهوم منحنی لورنز و ضریب جینی.

شکل 2. انتخاب های مختلف N هنگام محاسبه تغییرات ساختاری. ( الف ) N = 3; ( ب ) N = 5; ( ج ) N = 10.
مقدار N نیاز به بحث هایی دارد. کلاسهای بیشتر ممکن است جزئیات ساختاری بیشتری را نشان دهند، اما نویز را نیز معرفی میکنند که ممکن است اطلاعات مهم را سرکوب کند. اگر از کلاسهای زیاد استفاده کنیم، پیوندهای چندک نیز ممکن است پیچیدگی بیشتری ایجاد کند. در این مقاله به صورت تجربی N=5 را انتخاب می کنیم. برای یافتن مناسب ترین مقدار N، سهک ها (N = 3)، پنجک ها (N = 5) و دهک ها (N = 10) را برای داده ها در آلمان آزمایش می کنیم و می بینیم که کدام یک اطلاعات بیشتری را نشان می دهد. همانطور که در شکل 2 نشان داده شده است ، کلاس های مبتنی بر پنجک ها ( شکل 2 ب) اطلاعات بیشتری نسبت به کلاس های مبتنی بر یک سوم ارائه می دهند ( شکل 2)الف) با فاش کردن اینکه مشارکت کنندگانی که 75 تا 576 مشارکت می کنند نسبت ثابتی در جامعه دارند. با این حال، اطلاعاتی مانند این دوباره در مورد دهک ها نامشخص می شود ( شکل 2 ج). نتایج مشابهی برای سه کشور دیگر اعمال میشود، بنابراین ما از طبقهبندیهای مبتنی بر پنجک استفاده میکنیم.
2.4. تغییرات بهره وری در اقلیت
در این مقاله، «اقلیت صوتی» را به عنوان مشارکتکنندگان برتر تعریف میکنیم که 95 درصد از کل مشارکتها را انجام میدهند. این تعریف ساده است، زیرا انجام 95٪ از همه مشارکت ها به این معنی است که مشارکت کنندگان نقش های اصلی را در پروژه بازی می کنند. بهرهوری مشارکتکنندگان «اقلیت صوتی» در هر سال بین سالهای همسایه با استفاده از آزمون دو نمونهای Mann-Whitney-Wilcoxon (MWW) مقایسه میشود. آزمون MWW یک آزمون ناپارامتری است که هدف آن بررسی این است که آیا دو مجموعه نمونه از توزیعهای مختلف [ 23 ] گرفته شدهاند یا اینکه آیا یک مجموعه نمونه از نظر آماری بزرگتر/کوچکتر از دیگری است. ما از نسخه یک طرفه استفاده می کنیم تا بفهمیم که مشارکت کنندگان بازدهی بیشتری دارند یا کمتر. با توجه به مجموعه مشارکت کنندگان منتخب در منتی ساعتمنتیساعتسال به عنوان اسمناسمنو اینکه در سال آینده به عنوان اسمن + 1اسمن+1، فرضیه صفر اچ0اچ0آزمون ما این است:
H 0 :
اسمناسمنو اسمن + 1اسمن+1به همان میزان مشارکت کنید.
فرضیه جایگزین اچ1اچ1می تواند:
H 1 :
مشارکت کنندگان در اسمناسمنتمایل به تولید بیشتر از اسمن + 1اسمن+1، یعنی مشارکت های فردی اسمناسمناز نظر آماری بیشتر از اسمن + 1اسمن+1.
یا در طرف مقابل،
H 1 :
مشارکت کنندگان در اسمناسمنتمایل به تولید کمتر از اسمن + 1اسمن+1، یعنی مشارکت های فردی اسمناسمناز نظر آماری کوچکتر از آنها هستند اسمن + 1اسمن+1.
اچ0اچ0ممکن است رد شود تا بهره وری قطعاً افزایش یا کاهش یابد یا نتیجه قطعی نباشد. آزمون MWW دارای برخی ویژگیها است که برای مطالعه ما ایدهآل هستند. بر خلاف برخی آزمونهای دیگر، مانند آزمون t Student ، آزمون MWW نرمال بودن دادهها را فرض نمیکند، که آن را به روشی قوی برای توزیعهای سنگین مشارکتهای OSM تبدیل میکند [ 24 ]. علاوه بر این، آزمایش MWW نیازی به اندازه یکسان مجموعههای نمونه ندارد، که این امر ضروری است زیرا مشارکتکنندگان انتخاب شده در جمعیت بین سالهای مختلف متفاوت هستند.
جدا از اینکه بدانیم آیا بهره وری افزایش می یابد یا کاهش می یابد، ما همچنین علاقه مندیم که تغییرات چقدر بزرگ است. علاوه بر این، برای مورد بی نتیجه، می خواهیم بررسی کنیم که آیا اچ0اچ0احتمالا درست است تخمین تغییرات همراه با فواصل اطمینان با نرخ اطمینان 90 درصد برای ارزیابی عدم قطعیت آنها محاسبه می شود. ما در اینجا از 90٪ استفاده می کنیم تا خطای نوع I در هر دو طرف را به 5٪ محدود کنیم.
3. آزمایش ها و نتایج
چهار کشور (آلمان، فرانسه، ایالات متحده و هلند) به عنوان مناطق مطالعاتی انتخاب شده اند. این کشورها به دو گروه تقسیم می شوند: کشورهایی که واردات آن ها ناچیز است، از جمله آلمان و فرانسه، و کشورهایی که واردات آن ها قابل توجه است، از جمله ایالات متحده و هلند. در این بخش ابتدا به برخی از انتخابها برای آزمایشها میپردازیم. پس از آن، ما بر اندازه گیری نابرابری سهم تمرکز می کنیم و چگونگی تغییر آن در طول زمان را نشان می دهیم. تغییرات در اکثریت و اقلیت در آزمایش های بعدی بررسی می شود. در بخش آخر، ما نابرابری سهم را با این دو نوع مشارکتکننده ترکیب میکنیم و به سؤالات زیر پاسخ میدهیم: آیا مشارکتهای OSM نابرابرتر میشوند؟ کدام نوع مشارکت کننده تأثیر بیشتری بر روند نابرابری سهم دارد، اکثریت خاموش یا اقلیت صدادار؟ کشورهای دارای واردات و بدون واردات چه تفاوت هایی دارند؟
3.1. تنظیمات آزمایش
کشورهای تحقیق با دو نگرانی انتخاب شده اند. اولاً، جمعیت، تعداد مشارکتکنندگان و تعداد مشارکتها باید به اندازهای باشد که از نظر آماری صحیح باشد. ثانیا، OSM در این کشورها باید از ابتدا تکامل یابد تا یک جامعه OSM بالغ را تشکیل دهد، به طوری که داده ها بتوانند مراحل مختلف پروژه را پوشش دهند. شناخته شده است که ایالات متحده واردات زیادی به OSM، به ویژه TIGER دارد. هلند واردات بسیار کمتری نسبت به ایالات متحده دارد، اما هنوز هم واردات قابل توجهی وجود دارد، به عنوان مثال، داده های ناوبری خودرو (AND). در مقابل، آلمان و فرانسه در زمان تحقیق ما واردات قابل توجهی ندارند. این دانش را می توان با کاتالوگ رسمی واردات OSM تایید کرد [ 25]. ما چهار کشور را انتخاب می کنیم تا بتوانیم مقایسه درون گروهی و بین گروهی را انجام دهیم. در مورد دانه بندی زمانی، ما سال را به عنوان واحد زمانی پایه انتخاب می کنیم، به جای دوره های سه ماهه، ماه یا کوتاهتر، به منظور حفظ حجم نمونه قابل قبول و جلوگیری از تأثیرات فصلی [5 ] . ما فقط از 2007 تا 2014 از تغییرات استفاده میکنیم، زیرا دادههای سالهای 2005 و 2015 ناقص هستند و تنها 127 مشارکتکننده در سال 2006 وجود دارد که میتواند از نظر آماری بسیار کم باشد.
اینکه شامل همه کاربران ثبت نام شده باشد یا فقط مشارکت کنندگان [ 13 ] قابل بحث است . پیشنهاد میکنیم برای تحقیق در مورد مشارکتهای OSM، کاربران ثبتشدهای که هرگز مشارکت نمیکنند تفاوت معناداری با کاربران ثبتنشده ندارند. علاوه بر این، هنگام پرداختن به یک حوزه خاص، نمیتوان در آمار افرادی را که هرگز مشارکت نمیکنند از کسانی که در این زمینه مشارکت میکنند، تشخیص داد. در این مقاله، ما فقط مشارکت کنندگان را تجزیه و تحلیل می کنیم. بنابراین «اکثریت خاموش» واقعاً «ساکت» نیستند. با این حال، مشارکت آنها در مقایسه با مشارکت کنندگان فعال بسیار ناچیز است.
معیارهای زیادی برای مشارکت OSM وجود دارد: تعداد تغییرات، تعداد ویژگیها، تعداد گرهها یا جمعبندی انواع تغییرات. یافتن یک معیار جهانی ذاتاً سخت است، زیرا مفهوم “مشارکت” کاملاً مبهم است. در این مقاله به سه دلیل زیر جمع بندی انواع تغییرات را انتخاب می کنیم. اولاً، خلاصههای درشتی مانند تعداد ویژگیها یا تعداد مجموعههای تغییرات معیارهای خوبی در رابطه با محتوای بسیار ناهمگن آنها نیستند. به عنوان مثال، یک رودخانه با هزاران گره باید به عنوان سهم بزرگتر از یک ساختمان ساده با تنها چهار گره در نظر گرفته شود. ثانیا، خلاصه های همگن مانند تعداد گره ها و ویرایش های برچسب نمی توانند همه مشارکت ها را پوشش دهند. آخرین اما نه کم اهمیت، جمع بندی همه تغییرات قبلاً در داده های تغییرات از PlanetOSM ارائه شده است. این اقدام از این عیب رنج میبرد که انواع مختلف مشارکت را تشخیص نمیدهد. با این حال، هنوز هم بهترین معیار برای هدف ما ارائه یک نمای کلی از همه مشارکتها است.
3.2. نتایج بررسی نابرابری
منحنی های لورنز سهم OSM در چهار کشور در شکل 3 نشان داده شده است . منحنی ها از خط برابری فاصله زیادی دارند، که نشان می دهد مشارکت های OSM در هر چهار کشور در سال 2014 بسیار نابرابر است.

شکل 3. منحنی های لورنز در سال 2014. ( الف ) آلمان; ( ب ) فرانسه؛ ( ج ) ایالات متحده؛ ( د ) هلند.
نمودار 4 نشان می دهد که از سال 2007 تا 2014، نابرابری سهم هر چهار کشور بسیار بالا است. در سال 2014، ضرایب جینی همه کشورها از 0.95 تجاوز می کند که حتی به طور قابل توجهی بالاتر از مشارکت های ویکی پدیا (0.84) است [ 20]]. گرایش ها، با این حال، تقسیم شده است. در آلمان و فرانسه، نابرابری سهم تقریباً یکنواخت افزایش می یابد، از کمتر از 0.90 به نزدیک به 0.95. با این حال، در ایالات متحده و هلند، تغییرات تصادفی به نظر می رسد. توجه داشته باشید که ضریب جینی یک مقدار ترتیبی است، بنابراین تغییرات آن چندان آموزنده نیست. ما فقط به ترتیب نسبی این مقادیر علاقه مندیم. مشارکت در ایالات متحده و هلند نسبت به آلمان و فرانسه در سال های اولیه نابرابرتر است، در حالی که در سال های اخیر، این چهار کشور به سطوح مشابهی از نابرابری مشارکت رسیده اند. ما همچنین درصدهای سهم های برتر را محاسبه می کنیم که 95، 90، 80 درصد و 50 درصد کل مشارکت ها را تشکیل می دهند. شکل 5 اطلاعات بصری بیشتری را به عنوان مکمل شکل 4 ارائه می دهد. با در نظر گرفتن آلمان به عنوان مثال، 30 درصد از مشارکت کنندگان 95 درصد از مشارکت ها را در سال 2007 انجام می دهند، در حالی که تنها 8 درصد از مشارکت کنندگان، 95 درصد مشارکت ها را در سال 2014 انجام می دهند. در فرانسه، درصد مشارکت کنندگانی که 95 درصد مشارکت ها را انجام می دهند از بیش از 25 کاهش می یابد. درصد تا کمتر از 5 درصد. باز هم هیچ روند مشخصی برای ایالات متحده و هلند وجود ندارد.

شکل 4. ضرایب جینی.

شکل 5. درصد مشارکت کنندگان برای مشارکت در درصد معین. الف ) آلمان؛ ( ب ) فرانسه؛ ج ) ایالات متحده؛ ( د ) هلند.
3.3. تغییرات در اکثریت خاموش
شکل 6 تعداد مشارکت کنندگان را نشان می دهد. برای هر سال، فقط کاربرانی که در آن سال مشارکت داشته باشند، حساب میشوند. نتایج نشان میدهد که برای همه کشورها، تعداد مشارکتکنندگان تنها با استثناهای بسیار جزئی در حال افزایش است. ما پنجکهایی از مشارکتهای فردی را در سال 2014 محاسبه میکنیم و سپس از آنها به عنوان وقفه برای طبقهبندی مشارکتکنندگان در هر سال به پنج کلاس استفاده میکنیم. درصد تغییرات پنج کلاس در شکل 7 نشان داده شده است، که عرض هر نوار نشان دهنده اندازه کلاس مربوطه است. بدیهی است که طبقات پایین به سرعت گسترش می یابند و بالاترین طبقات را فشار می دهند تا نسبت های کوچکتری داشته باشند. در آلمان، حدود 7 درصد از مشارکت کنندگان وجود دارند که در سال 2007 تنها کمتر از سه تغییر ایجاد می کنند، و این تعداد در سال 2014 به 20 درصد افزایش می یابد. در مقابل، بالاترین طبقه از 45 درصد به 20 درصد کاهش می یابد. در هر کشوری، پایین ترین طبقه با سریع ترین سرعت گسترش می یابد. کلاس دوم و سوم با نرخ کمتری افزایش می یابد یا در هلند افزایش نمی یابد. طبقه چهارم در طول زمان ثابت می ماند و فعال ترین طبقه کوچک می شود.

شکل 6. تعداد مشارکت کنندگان در سال.

شکل 7. درصد مشارکت کنندگان برای مشارکت در درصد معین. الف ) آلمان؛ ( ب ) فرانسه؛ ج ) ایالات متحده؛ ( د ) هلند.
یک سوال بعدی این است که چگونه هر کلاس در اندازه مطلق تغییر می کند. برای بررسی آن، ما تغییرات اندازه مطلق را برای هر کلاس بین سالهای همسایه محاسبه میکنیم، همانطور که در شکل 8 نشان داده شده است . در این شکل قرمز نشان دهنده کاهش، سبز نشان دهنده افزایش و تاریکی نشان دهنده درجه تغییرات است. میتوانیم ببینیم که اندازههای مطلق همه کلاسها با تنها چند استثنا در بیشترین زمان افزایش مییابند.

شکل 8. تفاوت بین اندازه کلاس مطلق در سال های همسایه. الف ) آلمان؛ ( ب ) فرانسه؛ ج ) ایالات متحده؛ ( د ) هلند.
نتایج فوق نشان میدهد که مشارکتکنندگانی که تنها چند ویرایش دارند، با سرعت بسیار بیشتری گسترش مییابند. اگرچه تعداد مطلق فعال ترین مشارکت کنندگان در بیشتر موارد کاهش نمی یابد، آنها درصد کمتری از جامعه را به خود اختصاص می دهند. این یافته با درک متعارف در مورد توسعه پروژه OSM مطابقت دارد. در ابتدا، این پروژه ابزارها و منابع محدودی را ارائه میدهد، بنابراین بیشتر مشارکتکنندگان ممکن است پیشینهای در جغرافیا با اشتیاق و تخصص کافی برای مشارکت از ابتدا داشته باشند. همانطور که پروژه تکامل می یابد، برای عموم مردم شناخته می شود و ابزارهای در دسترس تری مانند iD را جمع آوری می کند که بر مشارکت کنندگان فعال تأثیر چندانی نمی گذارد، اما شرکت آماتورها را بسیار آسان تر می کند. نتیجه این است که «اکثریت خاموش» در مقیاس بزرگتر و در مورد مشارکتهای فردی بیاهمیتتر میشود. این تغییر مشارکت ها را به سمت پایان نابرابرتر سوق می دهد، که با روند نابرابری سهم در فرانسه و آلمان سازگار است، اما با نوسانات تصادفی در موارد ایالات متحده و هلند مطابقت ندارد.
3.4. تغییرات در اقلیت آوازی
اقلیت آواز هر سال برای هر کشور انتخاب می شوند. آزمایشهای MWW نشان میدهد که بهرهوری این مشارکتکنندگان به طور قابلتوجهی در سطح اطمینان 95 درصد برای اکثر سالها تغییر میکند، همانطور که در جدول 1 نشان داده شده است . تخمین تغییرات، و فواصل اطمینان مربوطه در سطح اطمینان 90 درصد، در شکل 9 نشان داده شده است . با توجه به تغییر برآورد شده در منتی ساعتمنتیساعتسال به عنوان همنهمن، می کشیم همن/ ( m e dمن یکnمن+ m e dمن یکnمن – 1)همن/(مترهدمنآ�من+مترهدمنآ�من–1)به عنوان Y تا نرخ تغییر بین سال ها و کشورها قابل مقایسه باشد. خط قرمز بالا نشان دهنده افزایش 50٪ و خط قرمز پایین نشان دهنده کاهش 50٪ است. همانطور که در شکل 9 نشان داده شده است، بهره وری مشارکت کنندگان منتخب در ایالات متحده و هلند بیشتر از آلمان و فرانسه در نوسان است. همه تغییرات در آلمان و فرانسه در محدوده ± 50٪ است، به استثنای فرانسه در سال 2009 و 2010، زمانی که چندین واردات در سراسر کشور از Corine Land Cover و Geodesic وجود دارد [25 ]]. در نیمی از اوقات، اقلیت در آلمان کمتر از 10 درصد بهره وری را افزایش یا کاهش می دهند، در حالی که در ایالات متحده هرگز چنین نیست. درک این نتایج با در نظر گرفتن دو ماهیت واردات آسان است. اولاً، واردات به شدت تحت تأثیر شرایط خارجی قرار دارد، بنابراین آنها می توانند خود بسیار غیر قطعی باشند. ثانیاً، حجم واردات می تواند بسیار زیاد باشد. با در نظر گرفتن هلند به عنوان مثال، واردات از دادههای BAG در سال 2014، میانگین اقلیت صوتی در آن سال را 529 برابر در سال 2013 میکند. همه 10 مشارکتکننده برتر، واردکننده دادههای BAG هستند و در مجموع 55,372,740 تغییر را پوشش میدهند که 53.4 مورد را پوشش میدهد. ٪ از کل مشارکت در آن سال.

جدول 1. مقادیر p آزمون من ویتنی ویلکاکسون (MWW). الف ) آلمان؛ ( ب ) فرانسه؛ ج ) ایالات متحده؛ ( د ) هلند.

شکل 9. برآورد آزمون MWW و فواصل اطمینان.
نتایج به خودی خود چندان جالب نیستند، زیرا روندها در یک کشور از قوانین واضحی پیروی نمی کنند. با این حال، شکل 10 نشان می دهد که در ایالات متحده و هلند، روندهای بهره وری و روند نابرابری سهم ارتباط نزدیکی با هم دارند. تمایل به افزایش یا کاهش از دو نتیجه بسیار خوب است، با تنها یک استثنا در سال 2013 در هلند. در مقابل، به نظر می رسد تغییرات در بهره وری اقلیت آواز با سهم نابرابری در آلمان و فرانسه ارتباطی ندارد.
3.5. بحث ها
ما دریافتیم که مشارکت های OSM در تمام زمینه های تحقیقاتی بسیار نابرابر است. برای کشورهایی که واردات در آنها قابل توجه نیست، نابرابری سهم در طول زمان بیشتر می شود. برخی از واقعیت ها این است که در آلمان در سال 2007، 20 درصد مشارکت کنندگان 95 درصد مشارکت ها را انجام می دهند، در حالی که در سال 2014، تنها 5 درصد از مشارکت کنندگان 95 درصد مشارکت ها را انجام می دهند. برعکس، نابرابری سهم در کشورهایی که واردات قابل توجهی دارند، به طور کلی بالاتر است، اما بدون قوانین مشخص به شدت در نوسان است.

شکل 10. جهت تغییرات بهره وری و ضرایب جینی. الف ) آلمان؛ ( ب ) فرانسه؛ ج ) ایالات متحده؛ ( د ) هلند.
جریان اصلی جامعه به سمت هدف کمتر فعال تغییر می کند. یعنی اکثریت خاموش درصد بیشتری از جامعه را به خود اختصاص داده اند. این پدیده به خوبی می تواند موارد آلمان و فرانسه را توضیح دهد و نشان می دهد که در کشورهایی که واردات کمتر قابل توجه است، گسترش سریع اکثریت خاموش به طور مداوم نابرابری سهم را افزایش می دهد. بهره وری اقلیت آوازی معمولاً در طول سالها به طور قابل توجهی تغییر می کند. علاوه بر این، در کشورهایی که واردات زیادی دارند، تغییرات اغلب اساسیتر است. گرایش تغییرات به خوبی با روند نابرابری سهم در ایالات متحده و هلند مطابقت دارد، که نشان میدهد برای کشورهایی که واردات قابل توجهی دارند، تغییرات بهرهوری اقلیت صوتی به شدت بر روند نابرابری سهم تأثیر میگذارد.
4. نتیجه گیری
در این مقاله، ما از روشهایی از جمله منحنی لورنز و ضریب جینی، طبقهبندیهای مبتنی بر کمیت و آزمون MWW برای تحلیل نابرابری سهم OSM استفاده میکنیم. علاوه بر بحث در مورد روند نابرابری سهم، ما همچنین تغییرات “اکثریت خاموش” و “اقلیت صوتی” و همچنین روابط آنها را با روند نابرابری مشارکت بررسی می کنیم. آزمایشات ما بر دو گروه از دو کشور متمرکز است: کشورهایی با رفتارهای وارداتی قابل توجه مانند ایالات متحده و هلند، و کشورهای بدون رفتارهای وارداتی قابل توجه مانند آلمان و فرانسه. تحقیقات ما نشان میدهد که کمکها در چهار کشور بسیار نابرابر است. سطح نابرابری سهم در کشورهای بدون واردات هنگفت افزایش می یابد. که با این واقعیت سازگار است که اکثریت خاموش به سرعت در جامعه گسترش می یابد. روند نابرابری سهم در کشورهای دارای واردات زیاد تصادفی به نظر می رسد، اما در واقع به خوبی با تغییرات بهره وری اقلیت صوتی موافق است، بنابراین تصادفی بودن احتمالاً ممکن است ناشی از عوامل خارجی باشد که بر واردات تأثیر می گذارد. نتایج ما روشن میکند که دادههای جمعسپاری واقعاً از کجا میآیند و چگونه وضعیت با تکامل مداوم OSM تغییر میکند. تضاد بین کشورهای با و بدون واردات، و همچنین نقشهای متفاوتی که اکثریت خاموش و اقلیت صدادار ایفا میکنند، مکانیسمهای متمایز زیربنای توسعه پروژه OSM را در مناطق مختلف نشان میدهد. دانستن اینکه کدام بخش از مشارکت کنندگان مسئول روند نابرابری مشارکت هستند می تواند به برنامه ریزی آینده بهتر OSM کمک کند. روشهایی که ما استفاده میکنیم و نحوه تنظیم آنها برای نتیجهگیری کاملاً کلی هستند و میتوانند به راحتی در کشورهای دیگر اعمال شوند. برخلاف تحقیق قبلی، ما تحقیقات کمی انجام دادیم که میتوان آنها را به عنوان شاخصهای اساسی در تحقیقات دیگر ادغام کرد. این روشها حتی ممکن است برای سایر پروژههای VGI و و جمعسپاری مفید باشند.
مرحله بعدی کار ما مقایسه معیارهای مختلف مشارکت است. جالبترین بخش این است که بررسی کنیم آیا نتیجهگیریهای ما برای انواع خاصی از مشارکتها مانند برچسبها، گرهها و غیره صادق است یا خیر . یک بسط دیگر این است که عمیق تر شوید و بپرسید که چرا در وهله اول تعادل بین اکثریت خاموش و اقلیت صوتی تغییر می کند. یک سوال احتمالی این است: دلیل اصلی جذب بیشتر نقشهبرداران غیر تکراری کدام است: بهبود ابزارها، شهرت پروژه یا افزایش قابلیت استفاده از پروژه؟ سپس میتوانیم به درک جامعتری درباره روند نابرابری مشارکت، تنش بین اکثریت و اقلیت در جامعه OSM، و معنای این پدیدهها برای آینده پروژه OSM بپردازیم.
منابع
- Goodchild، MF Citizens به عنوان حسگر: دنیای جغرافیای داوطلبانه. ژئوژورنال 2007 ، 69 ، 211-221. [ Google Scholar ] [ CrossRef ]
- هاکلی، م. Weber, P. OpenStreetMap: نقشه های خیابانی تولید شده توسط کاربر. محاسبات فراگیر IEEE 2008 ، 7 ، 12-18. [ Google Scholar ] [ CrossRef ]
- نیس، پ. زیلسترا، دی. Zipf، A. تکامل شبکه خیابانی نقشههای crowdsourced: OpenStreetMap در آلمان 2007-2011. اینترنت آینده 2011 ، 4 ، 1-21. [ Google Scholar ] [ CrossRef ]
- هاکلی، م.م. بسیوکا، اس. آنتونیو، وی. Ather، A. برای نقشه برداری خوب یک منطقه به چند داوطلب نیاز است؟ اعتبار قانون لینوس برای اطلاعات جغرافیایی داوطلبانه کارتوگر. J. 2010 , 47 , 315-322. [ Google Scholar ] [ CrossRef ]
- نیس، پ. Zielstra، D. تحولات اخیر و روندهای آینده در تحقیقات داوطلبانه اطلاعات جغرافیایی: مورد OpenStreetMap. اینترنت آینده 2014 ، 6 ، 76-106. [ Google Scholar ] [ CrossRef ]
- بوداتوکی، NR; Haythornthwaite، C. انگیزه برای همکاری باز جمعیت و مدل های جامعه و مورد OpenStreetMap. صبح. رفتار علمی 2013 ، 57 ، 548-575. [ Google Scholar ] [ CrossRef ]
- مونی، پی. Corcoran, P. OpenStreetMap چقدر اجتماعی است؟ در مجموعه مقالات پانزدهمین کنفرانس بین المللی انجمن آزمایشگاه های اطلاعات جغرافیایی برای اروپا در زمینه علوم اطلاعات جغرافیایی، آوینیون، فرانسه، 24-27 آوریل 2012. صص 282-287.
- مصطفیرج، ا. فین، اس. ویتلاک، سی. متاکساس، PT اقلیت آوازی در مقابل اکثریت خاموش: کشف عقاید دم بلند. در مجموعه مقالات سومین کنفرانس بین المللی IEEE 2011 در خصوص حریم خصوصی، امنیت، ریسک و اعتماد (PASSAT) و محاسبات اجتماعی (SocialCom)، 9 تا 11 اکتبر 2011. صص 103-110.
- هاکلی، ام. دانش شهروندی و اطلاعات جغرافیایی داوطلبانه: بررسی اجمالی و گونهشناسی مشارکت. در جمع سپاری دانش جغرافیایی ; Sui, D., Elwood, S., Goodchild, M., Eds. Springer: برلین، آلمان، 2013; صص 105-122. [ Google Scholar ]
- ایروین، الف. علوم شهروندی: مطالعه افراد، تخصص و توسعه پایدار . Routledge: لندن، انگلستان، 2002. [ Google Scholar ]
- نیلسن، جی. نابرابری مشارکت: قانون 90-9-1 برای ویژگی های اجتماعی. در دسترس آنلاین: https://www.nngroup.com/articles/participation-inequality/ (دسترسی در 30 نوامبر 2015).
- هیپک، سی. دادههای جغرافیایی جمعسپاری. ISPRS J. Photogramm. Remote Sens. 2010 , 65 , 550-557. [ Google Scholar ] [ CrossRef ]
- نیس، پ. Zipf، A. تجزیه و تحلیل فعالیت مشارکت کننده یک پروژه داوطلبانه اطلاعات جغرافیایی – مورد OpenStreetMap. ISPRS Int. J. Geo-Inf. 2012 ، 1 ، 146-165. [ Google Scholar ] [ CrossRef ]
- نیس، پ. زیلسترا، دی. Zipf، A. مقایسه مشارکت داوطلبانه اطلاعات جغرافیایی و توسعه جامعه برای مناطق منتخب جهان. اینترنت آینده 2013 ، 5 ، 282-300. [ Google Scholar ] [ CrossRef ]
- زیلسترا، دی. Hochmair، HH; Neis، P. ارزیابی تأثیر واردات داده بر کامل بودن نقشه خیابان باز – مطالعه موردی ایالات متحده. ترانس. GIS 2013 ، 17 ، 315-334. [ Google Scholar ] [ CrossRef ]
- ما، دی. سندبرگ، ام. Jiang, B. مشخص کردن ناهمگونی داده ها و جامعه OpenStreetMap. ISPRS Int. J. Geo-Inf. 2015 ، 4 ، 535-550. [ Google Scholar ] [ CrossRef ]
- تغییر مجموعه. در دسترس آنلاین: http://wiki.openstreetmap.org/wiki/Changeset (در 28 مه 2015 قابل دسترسی است).
- سیاره OSM. در دسترس آنلاین: http://planet.osm.org/ (در 28 مه 2015 قابل دسترسی است).
- هافمن، دبلیو. Leydesdorff, L. آیا نابرابری در بین دانشگاه ها در حال افزایش است؟ ضرایب جینی و ظهور گریزان دانشگاه های نخبه. مینروا 2010 ، 48 ، 55-72. [ Google Scholar ] [ CrossRef ] [ PubMed ][ نسخه سبز ]
- اورتگا، اف. گونزالس-باراهونا، جی. Robles, G. در مورد نابرابری مشارکت در ویکی پدیا. در مجموعه مقالات چهل و یکمین کنفرانس بین المللی سالانه هاوایی در علوم سیستم، Waikoloa، HI، ایالات متحده آمریکا، 7-10 ژانویه 2008. صص 304-304.
- بالاتوره، آ. مونی، پی. مفهوم سازی جهان جغرافیایی: ابعاد مذاکره در نقشه برداری جمع سپاری. بین المللی جی. جئوگر. Inf. علمی 2015 ، 29 ، 2310-2327. [ Google Scholar ] [ CrossRef ]
- کلاوزت، ا. شالیزی، CR; نیومن، ME توزیع قانون قدرت در داده های تجربی. SIAM Rev. 2009 , 51 , 661-703. [ Google Scholar ] [ CrossRef ]
- Hettmansperger، TP; McKean، JW روش های آماری ناپارامتریک قوی ; CRC Press: Boca Raton، FL، USA، 2010. [ Google Scholar ]
- Conover، آمار ناپارامتریک عملی WJ ; CRC Press: Boca Raton، FL، USA، 2006. [ Google Scholar ]
- واردات / کاتالوگ. در دسترس آنلاین: http://wiki.openstreetmap.org/wiki/Import/Catalogue (در 30 نوامبر 2015 قابل دسترسی است).
© 2016 توسط نویسندگان؛ دارنده مجوز MDPI، بازل، سوئیس. این مقاله یک مقاله با دسترسی آزاد است که تحت شرایط و ضوابط مجوز Creative Commons by Attribution (CC-BY) (http://creativecommons.org/licenses/by/4.0/) توزیع شده است.


بدون نظر