آیا اینترنت شما را بهتر از خودتان می شناسد؟ کاملاً درست است! به گفته استفان داویدس، که در کتاب خود یک مورد سرگرم‌کننده برای این موضوع عنوان کرده است: «همه دروغ می‌گویند: کلان‌داده‌ها، داده‌های جدید و آن‌چه اینترنت می‌تواند درباره‌ی آن‌چه واقعاً هستیم به ما بگوید.» اینترنت می‌داند که شما  چه فیلمی تماشا می‌کنید، از گرایش و علایق جنسی شما باخبر است و حتی این‌که آیا کتابی را که می‌خوانید، به فصل آخر می‌رسانید یا خیر!

تحلیل‌گر داده‌ها

ست استیونز داویدوویتس، تحلیل‌گر سابق داده‌های گوگل و دکترای اقتصاد از دانشگاه هاروارد، استدلال می‌کند که کلان‌داده‌ها، بینشی بی‌سابقه از وضعیت انسان را تصویر می‌کنند. او با این شیوه از ادعای خود پشتیبانی و ما را با مطالعات موردی بمباران می‌کند؛ استفاده از تثلیث مقدس داده‌های اینترنت: گوگل، فیس‌بوک و پورن‌هاب. این افشاگری‌ها هریک در نوبه‌ی خود آرامش‌بخش، ناراحت‌کننده و خنده‌دار است. برخی از آن‌ها مورد انتظار هستند، مانند این واقعیت که مردم در مورد میزان رابطه جنسی خود اغراق می کنند، برخی کمتر، مانند تعداد دفعات جستجوی گوگل مربوط به زنای با محارم و نزدیکان. ابتدا بیایید یک قدم به عقب برویم. کلان‌داده چیست؟ کلان‌داده اصطلاحی‌ست که برای توصیف حجم گسترده، تنوع و کیفیت داده‌هایی که فناوری مدرن به ما امکان می‌دهد به‌دست آوریم، استفاده می‌شود. داویدوویتس این مسئله را بررسی می‌کند که چه کاری می‌توانیم با این داده‌ها انجام دهیم. وی آن‌چه را «چهار رکن اصلی کلان‌داده» می‌داند و انقلابی در علم داده ایجاد می‌کند، ارائه می‌دهد: داده‌ها اطلاعاتی مورد اطمینان، بدیع، مکفی و شایسته هستند.

بزرگ‌ترین تغییردهنده‌ی بازی، داده‌های مورد اطمینان است. ست استیونز داویدوویتس در تازه‌ترین قسمت کتابش بیان می‌کند که برخلاف پایگاه‌های اطلاعاتی متداول که خودبه‌خود گزارش می‌دهند، مانند نظرسنجی‌ها، منابع جدید داده مانند جستجوهای گوگل انگیزه‌ای برای افشای حقیقت دارند. گوگل ممکن است تنها منبع قابل‌اعتماد برای برخی از اطلاعات، مانند تعداد دفعات سقط خود‌به‌خودی باشد. استیون داویدوویتس از داده‌های جستجوی گوگل برای از بین بردن خرافات میان مردم استفاده می‌کند، و تصورات کلیشه‌ای را رد می‌کند. در مطلب

همه دروغ می‌گویند

همه دروغ می‌گویند

ناشر : گمان

حقایق مجازی

درست قبل از انتخاب مجدد اوباما در سال ۲۰۱۲، گزارش‌های مبتنی بر نظرسنجی‌ها حاکی از آن بود که به‌طور کلی، نژادگرایی بر رای‌گیری آمریکایی‌ها تأثیرگذار نبود. با این حال، یک مطالعه‌ی انجام‌شده توسط نویسنده، نشان داد که رابطه‌ی قابل‌توجهی بین مناطق دارای میزان بالای جستجوی نژادپرستانه در گوگل، و مناطقی که اوباما در انتخابات عملکرد کمتری داشته است، مقدار زیادی است که با عوامل دیگر قابل توضیح نیست. همین الگو برای عملکرد ترامپ در انتخابات مقدماتی جمهوری‌خواهان در سال ۲۰۱۶ بهتر از آن‌چه انتظار می رفت، یافت شد. اثبات شد که تحقیقات نژادپرستانه، عامل اصلی‌ترین ارتباط با محبوبیت وی است. این یک اطلاعات کاملاً مهم است که در بحث پیرامون روابط نژادی در ایالات متحده از دست رفته است. گوگل نه‌تنها منبع داده‌های صادقانه است، بلکه تنها مکانی است که برخی اعترافات در آن مانند روز روشن است.

در حالی که استیون داویدوویتس آرزو دارد از داده‌های بزرگ برای ارضای کنجکاوی فکری و بهبود جامعه استفاده شود، وی خاطرنشان می‌کند که سودآوران از این منبع جدید با بهره‌گیری از داده‌های جدید به منظور دستکاری در مصرف کنندگان، سرمایه‌گذاری می‌کنند. چگونه آن‌ها داده‌هایی را که برای آن‌ها مفید است می یابند؟ از طریق استفاده بی‌وقفه از آزمون‌های آنلاین A / B – آزمایشاتی که در آن دو گروه تصادفی از مشتری در معرض دو گزینه مختلف (A یا B) قرار دارند، به شرکت اجازه می‌دهد گزینه ای را، که بهترین پاسخ را ارائه می‌دهد، شناسایی کند. چرا یک شرکت رسانه‌های اجتماعی از کاربران خود می‌پرسد کدام‌یک از ویژگی‌های جدید را ترجیح می‌دهند؛ و آن‌ها را به خطر می اندازد گزینه ای را که کمتر استفاده می کنند-هنگامی که یک آزمون A / B نشان می‌دهد کدام یک جذاب تر و در نتیجه سودآور است؟ این آزمون‌ها تقریباً در هر حضور آنلاین گسترده‌ای که فکر می‌کنید، از نت‌فلیکس گرفته تا همه‌ی رسانه‌ها، به‌کار گرفته می‌شوند. همه‌ی ما خواه‌ناخواه در این کار شرکت می‌کنیم.

آزمون‌های A / B در حقیقت نسخه‌های آنلاین و گسترده‌ای از آزمایشات کنترل‌شده‌ی تصادفی‌ست که هر روز توسط محققان علمی انجام می‌شود. آزمایشات تصادفی کنترل‌شده نوعی آزمایش است که در آن تعدادی از افراد به‌طور تصادفی در یکی از دو گروه قرار می‌گیرند. یک گروه در معرض «مداخله» است -این می تواند یک دارو‌، یک ورزش یا هر چیزی باشد که فرض می‌شود تأثیر قابل اندازه‌گیری بر روی شرکت‌کنندگان دارد- و گروه دیگر چنین نیست. در تحقیقات پزشکی‌، این آزمایشات استاندارد طلایی برای اثبات موفقیت یک درمان هستند زیرا می‌توانند ارتباط علیّتی بین درمان و نتیجه بیمار نشان دهند. با استفاده از داده‌های بزرگ، قدرت استنتاج علّت و معلولیّت از همبستگی ارزان‌تر و آسان‌تر از گذشته است. در مطلب «جملاتی از کتاب همه دروغ می‌گویند» می‌توانید نقل قول‌های برتر کتاب همه‌ دروغ‌ می‌گویند را مطالعه نمایید.

آمار جرم و جنایت

انواع جدید داده‌ها و حجم عظیمی از داده‌ها -ارائه دانه‌بندی کافی برای «بزرگ‌نمایی» در زیر مجموعه‌های جمعیت -چهار قدرت را کامل می‌کنند. باهم، آن‌ها به ما اجازه می‌دهند تا به انواع سوالات قدیمی و جدید پاسخ دهیم. برای نشان دادن این موضوع، داویدوویتس یک مطالعه‌ی عالی درباره رابطه‌ی بین جرم خشن و خشونت در رسانه‌ها را بازگو می‌کند، که از مقادیر فراوان داده‌های گیشه و جرم استفاده می‌کند. برخلاف نتایج حاصل از آزمایشات آزمایشگاهی، که میزان پرخاش‌گری را پس از قرارگرفتن در معرض فیلم‌های خشونت‌آمیز اندازه‌گیری می‌کند، این نتیجه اثر معکوس را نشان می‌دهد: کاهش جرم و جنایت در آخر هفته‌ها که یک فیلم محبوب خشونت‌آمیز در سینماها افتتاح شد. داده‌های دنیای واقعی تحت‌تأثیر عواملی هستند که آزمایشگاه‌ها هرگز نمی‌توانند حساب کنند. از نظر جامعه، این مطالعه احتمالاً نتیجه‌ی معتبر زیست‌محیطی دارد.

شاید مهم‌ترین قطعه‌ی باقی‌مانده در اثر انفجار کلان‌داده‌ها، توانایی استفاده از هم‌بستگی‌ها برای پیش‌بینی رفتار و وضعیت افراد با افزایش دقت و صحت باشد. تاریخچه‌ی جستجوی Google در مورد افرادی را که مبتلا به سرطان لوزالمعده تشخیص داده شده‌اند، جمع کنید و شما یک ابزار جدید برای تشخیص خود دارید. داویدوویتس معتقد است که ‌جمع‌آوری داده‌های غنی درمورد مشکلات جهان اولین قدم برای رفع آن‌هاست»، و کمپین حقوق بشر و آژانس‌های خدمات محافظت از کودکان از قبل مشتاق کمک گرفتن از او هستند. با انگیزه خطرات مختلف این قدرت پیش‌بینی‌کننده‌ی تازه‌ کشف‌شده، این کتاب با این هشدار به پایان می‌رسد: با کلان‌داده‌ها مسئولیت بزرگی به وجود می‌آید. یافتن همبستگی‌ها آسان است. با این حال، این همبستگی به معنای علیّت نیست و هرچه بیشتر به نظر برسید احتمال تصادف با یک همبستگی اتفاقی که دو متغیر کاملاً مستقل را به‌هم پیوند می‌زند، بیشتر می‌شود. در مطلب «نگاهی به کتاب همه دروغ می‌گویند نوشته‌ی ست استیونز دیویدُویتس» می‌توانید بررسی خلاصه‌ای از این کتاب را در وبلاگ کتابچی مطالعه نمایید.

لطفاً خودکشی نکنید!

خطرات مرتبط با تصمیم‌گیری حتی بر اساس معتبرترین پیش‌بینی‌کننده‌های رفتار هستند. درحالی که اکثر مردم از انتخاب Google برای نمایش خط کمک سامری‌ها به افرادی که عبارت «افکار خودکشی» را جستجو می‌کنند حمایت می‌کنند، من شک دارم که سیاست دست‌گیری مجرمان پیش‌بینی‌شده قبل از این‌که قانون را نقض کنند مورد توجه بسیاری قرار گیرد. مسئله‌ی دیگر سخت‌گیری یا فقدان آن در علم داده‌های بزرگ است. به‌نظر می‌رسد داویدوویتس داد‌های جستجوی Google را کم و بیش به ارزش اسمی آن‌ها می‌رساند. او اذعان می‌کند که Google می‌تواند جنبه‌ی دیگری از مردم را به نمایش بگذارد. که «کج به سمت ممنوعیت» را جستجو می‌کند. اما آیا می‌توان این اثر را کمی کرد؟ به‌عنوان مثال، من احساس بسیار مشکوکی را در جعبه جستجو ابراز کرده‌ام، که توسط عبارتی ظالمانه پیشنهاد شده توسط تکمیل خودکار وسوسه می‌شوم، و اغلب از Google به عنوان خروجی کنجکاوی بیمارگونه‌ی خود استفاده می‌کنم. با این وجود، نویسنده به‌طور متقاعدکننده‌ای درمورد کاربردهای بالقوه و احتمالاً فراگیر شدن علم داده‌های بزرگ در آینده بحث می‌کند.

به‌شخصه،  این فراگیر بودن -«کلان‌داده» است- به‌عنوان بزرگ‌ترین نگرانی، داویدوویتس به‌عنوان بزرگ‌ترین نگرانی آن را لمس می‌کند و قبول می‌کند که «کلان‌داده‌ها نیازی به سایر راه‌های توسعه‌ی بشر در طی هزاره‌ها برای درک جهان را از بین نمی‌برد.» او چند نمونه خاص از مواردی که می‌تواند داده‌های بزرگ خراب شود را می‌دهد. اما در مورد پیامدهای بلندمدت چه می‌توان گفت؟ همان‌طور که افراد بیشتری شروع به درک پاداش‌های قابل جمع آوری از داده‌های بزرگ می‌کنند، خطر کاهش تقریباً همه جنبه‌های زندگی به یک علم داده وجود دارد. از این گذشته، ما به‌عنوان یک گونه دانشمند اطلاعات بدوی هستیم. غریزه رفتن به کنار بیماران برای مراقبت از آن‌ها به گونه‌های ما برای زنده‌ماندن هزاره‌ها کمک کرد. بعد از مشاهده و تجزیه و تحلیل بسیاری از شیوع بیماری‌های مسری، ایده جداسازی برخی از بیماران بعداً مطرح شد. در این صورت ما غریزه‌ای را که به نفع خود است بیش از حد سوار شده‌ایم. در زمینه‌های دیگر، این می‌تواند منجر به انکار کمک به افرادی شود که به دلیل نتایج پیش‌بینی‌شده، فشار برای کاهش حریم خصوصی و تأکید کمتر بر درک عمیق، به آن نیاز دارند.

در مورد جامعه‌ای که شرکت ها می‌توانند به طور مداوم رفتار افراد را کنترل‌نشده کنترل کنند، چه می‌کنید؟ مجموعه‌ای از قوانین متمایز برای جلوگیری از این امر و بسیاری از آن‌ها تلاش می‌کنند انگشت خود را دقیقا روی دلیل ناراحتی آن‌ها قرار دهند. این کنترل صریح نیست، بلکه یک شکل ظریف‌تر، با عواقبی از جمله اعتیاد به شبکه‌های اجتماعی است. من می‌ترسم از قبل شاهد اثرات آن باشیم. ما هرگز شاهد تکامل گونه‌ای با این قدرت در اختیار آن نبوده‌ایم. اکنون، بیش از هر زمان دیگر، ممکن است لازم باشد که تفکر انتقادی خود و ارزش‌هایی را که به‌عنوان یک جامعه آرزو می‌کنیم‌، زیر نظر داشته باشیم. در عین حال، علم داده‌های بزرگ، فرصت‌های منحصربه‌فردی را در اختیار ما قرار می‌دهد. برای گسترش دانش و بهبود کیفیت زندگی، خارج از حوزه‌ی علوم سنتی. علاوه بر ارائه‌ی برخی از امیدهای موقت به آینده، مقاله «همه دروغ می‌گویند» مقاله بسیار خوبی‌ست که اگر آدم کنجکاوی هستید یا به علم داده، و روان‌شناسی رفتاری علاقه‌مند هستید، خواندن این مقاله به شما توصیه می‌شود. این مقاله توسط آنا هنشل و کریستن وولکوت ویرایش شده است.

منبع: the-gist.org

دسته بندی شده در: