میکروسکوپی به نام کلان‌داده

آیا می‌دانید موتور جستجوگر مشهور و محبوب گوگل و ابزارهای جانبی آن مثل گوگل‌ترندز، از جمله روان‌شناس‌ها و جامعه‌شناس‌های امروزی به‌حساب می‌آیند. و می‌توانند حتی بهتر از خود ما، ما را تحلیل کنند؟ نتایج پژوهش‌های مختلف نشان می‌دهند. که درصد بالایی از…

صبر کنید! اگر میانه‌تان با متن‌های پر از عدد و رقم خوب نیست. و مثل من از هر چیز مربوط به ریاضی و آمار فراری هستید. یک پیشنهاد جذاب برایتان دارم. که به‌قول پدرخوانده، نمی‌توانید ردش کنید. چون از همان صفحه‌ی اول، قرار است شما را در دام خودش گیر بیندازد. البته درواقع منظورم از صفحه‌ی اول، جایی بعد از مقدمه و پیشگفتار کتاب است. چون معمولاً مقدمه‌‌ها آن‌قدر توضیح اضافی و پیش‌داوری داخلشان دارند. که ممکن است خواننده را برعکس دل‌زده کنند. تا مشتاق خواندن.

کتاب «همه دروغ می‌گویند» با عنوان فرعی «اینترنت چه چیزهایی درباره‌ی خود واقعی‌مان به ما می‌گوید؟» نوشته‌ی «ست استیونز دیویدویتس» که از سری کتاب‌های «خرد و حکمت زندگی»‌ است که نشر «گمان» منتشر کرده، یک روایت جذاب در هشت فصل (بدون احتساب مقدمه و موخره‌ی بسیار جذاب آن) است. که به ترتیب «شم خراب»، «آیا فروید حق داشت؟»، «تعبیری نوین از داده»، «اکسیر حقیقت دیجیتال»، «نمای نزدیک»، «کل جهان یک آزمایشگاه است»، «کلان‌داده، کدام کلان‌داده» و «هرچه داده بیش، دردسرش بیشتر» نام دارند. این کتاب را «ریحانه عبدی» با وفاداری حداکثری به متن اصلی و شیوه‌ی نگارش آن، ترجمه کرده. و در اختیار مخاطب فارسی زبان قرار داده است.

کلان‌داده‌ای به نام مادربزرگ

این تیترهای جذاب را در بالا نوشتم تا ماهیت آماری کتاب باعث نشود از خواندنش دست بکشید. و یک پیش‌زمینه‌ی کلی از این‌که قرار است توی این کتاب سبزآبی کوچک چه اتفاق‌هایی بیفتد، داشته باشید. در طی این هشت فصل، نویسنده می‌آید. و مفهومی به اسم کلان‌داده را به‌عنوان ابزاری برای تحلیل رفتارهای مختلف انسان‌ها معرفی می‌کند. برای درک بهتر مفهوم کلان‌داده، از مثالی که خود استیونز در ابتدای کتاب می‌آورد استفاده می‌کنم.

در مثالی خانوادگی، او نظرات خانواده‌اش را درباره‌ی این‌‌که همسر آینده‌اش باید چه ویژگی‌هایی داشته باشد، می‌نویسد. و سپس به نظر جامع‌تر و کامل‌ مادربزرگش اشاره می‌کند. که نسبت به بقیه، سنجیده‌تر به‌نظر می‌آید. او مادربزرگش را یک کلان‌داده می‌داند. چون از لحاظ سن و تجربه‌ی زیسته نسبت به بقیه در سطح بالاتری قرار می‌گیرد. و مثل منبعی است دنیادیده. پر از خاطره درباره‌ی ازدواج‌های موفق و ناموفقی که مشاهده کرده. البته بماند که استیونز بعدتر صحت و سقم ارزش‌یابی مادربزرگ را هم به‌نوعی زیرسوال می‌برد. اما فعلاً این مثال مادربزرگ به مثابه‌ی کلان‌داده را به ذهن بپسرید تا بعد. اصلاً بهتر است جملات خود استیو را بیاورم. تا با متن کتاب و چیستی کلان‌داده و کاربرد آن، ارتباط بهتری بگیرید:

شما هم یک متخصص داده هستید. وقتی بچه بودید فهمیدید اگر گریه کنید مادرتان به شما توجه می‌کند. این یک علم داده است. با رسیدن به بزرگسالی متوجه شدید اگر زیادی شکایت کنید و غر بزنید، مردم کمتر با شما معاشرت می‌کنند. این هم یک علم داده است. بعدتر دریافتید وقتی مردم کمتر با شما معاشرت کنند، کمتر احساس خوشحالی می‌کنید. وقتی کمتر خوشحال باشید، کمتر دوستانه رفتار می‌کنید. وقتی کمتر دوستانه رفتار کنید، مردم حتی کمتر از قبل با شما معاشرت خواهند کرد. این‌ها همه علم داده‌اند.

 گوگل به‌عنوان سنگ صبور!

اما داده‌ها از کجا پیدا می‌شوند؟ آن‌ها درواقع از طریق ردپایی که آدم‌ها ناخواسته در فضای دیجیتال از خودشان‌ به‌جا می‌گذارند، به‌دست می‌آیند. مثلاً فرض کنید هرکدام از ما ممکن است جلوی سایر مردم هیچوقت به غم و غصه و خشم مخفی خودمان اعتراف نکنیم. هیچوقت نگوییم چه تمایلات جنسی، سیاسی یا مذهبی‌ای داریم. یا اینکه کمبود اعتماد به‌نفس چقدر آزارمان می‌دهد. یا این‌که یک بیماری سخت داریم. یا شاید جرات نکنیم به مردم بگوییم تحت خشونت خانگی هستیم و کمک لازم داریم. اما آیا در افشای درونیات پنهانی‌مان، با گوگل هم همین‌قدر غریبه ایم. و خودمان را از او مخفی می‌کنیم؟

واقعیت این است که گوگل تقریباً برای بسیاری از ما حکم محرم‌ اسرار و سنگ صبوری واقعی‌تر از تمام آدم‌های دوروبرمان را دارد. و پیش او احتمالاً بیشتر از هرکسی، خود واقعی‌ و بدون سانسورمان بوده‌ایم. احتمالاً همین الان از ذهن خود شما خصوصی‌ترین جستجویی که تاکنون در گوگل انجام داده‌اید تا کمکتان کند، رد شد. و به این فکر کردید که شاید اگر قرار بود آن حرف خاص را حتی جلوی آینه برای خودتان به زبان بیاورید. از اعتراف به آن طفره می‌رفتید.

حالا در یک مثال گسترده‌تر که بیشتر یک اجتماع را هدف می‌گیرد تا یک فرد، یک جامعه‌ی آرام و آرمانی که به‌ظاهر هیچ رگه‌ای از نژادپرستی در آن وجود ندارد، میزان جستجوهای افراد درباره‌ی جوک‌ها و اهانت‌های نژادپرستانه، به حدی است که با وضعیت آرام و صلح‌طلب جامعه جور درنمی‌آید. اینجاست که کلان‌داده به‌عنوان یک دستگاه دروغ‌سنج مخفی عمل می‌کند. ردپاهای نامرئی انسان‌ها را کشف کرده، تصویر واقعی یک جامعه را از زیر پوست آن بیرون کشیده و به ما نشان می‌دهد‌. به مثالی که درباره‌ی نژادپرستی زدم، مسائلی مثل تمایلات پنهانی به روابط جنسی مختلف، میزان مطالعه، گرایش سیاسی، وضعیت مذهبی یک جامعه، تفاوت‌های فرهنگی مختلف در برخورد با مسائل یکسانی مثل سقط جنین، روابط خارج از ازدواج و مثال‌های مشابه را هم اضافه کنید.

بیایید نویسنده را حذف کنیم!

از نظر نوع و شیوه‌ی روایت، اگر حضور خود نویسنده به‌عنوان راوی قضایا را از کتاب حذف کنیم، می‌شود گفت باوجود جذاب بودن مثال‌ها و تحلیل‌های مختلف، با حذف راوی از درون آن کتاب تبدیل به یک رساله‌ و پژوهش آماری تکراری می‌شود. که احتمالاً به‌جز علاقمندان واقعی کسی حوصله ندارد سراغش برود. اما استیونز با نثر جذاب و طنزگونه‌اش و حضور مداومش در کتاب و لحن خاصی که دارد -و تلاش ستودنی ریحانه عبدی برای بازگردانی‌اش- این کتاب را از قالب یک رساله‌ی آماری خشک و خالی بیرون می‌آورد. و تبدیل به اثری جذاب می‌کند. البته من در یک نظر شخصی، ترجیح می‌دهم مستندی با مضمون کلان داده و کاربرد مخفی ابزارهای دیجیتال ببینم. چون موضوعات آماری در کل سلیقه‌ام نیستند. و همراه شدنشان با تصویر برایم جذاب‌تر است. اما به‌هرحال نمی‌توانم لذت بردنم از این کتاب را هم انکار کنم.

استیونز سی‌و‌هشت‌ساله –که ممکن است نام و فامیلی طولانی اش روی جلد کتاب ابتدا این تصور را به شما بدهد که نویسندگان دو نفرند!- دکترای اقتصاد دارد. کارشناس داده است. دانش‌آموخته‌ی فلسفه نیز هست. او برای انجام این پژوهش مدتی در شرکت گوگل به‌عنوان کارشناس داده مشغول به‌کار بوده. و «همه دروغ می‌گویند» اولین کتاب اوست که برایش شهرتی جهانی را فراهم آورده است.

یک گلایه‌ی کوچک!

در این بین قبل از آن‌که سراغ ادامه‌ی یادداشت درباره‌ی کلان‌داده‌ها بروم، از فرصت استفاده می‌کنم. و یک گله‌ی کوچک از نشر عزیز گمان داشته دارم. این کتاب در قطع پالتویی و حجمی تقریباً سیصدصفحه‌ای –با احتساب پانویس‌ها و نمایه‌ها- در ظاهر یک کتاب کوچک و خوش‌خوان به‌نظر می‌آید. درباره‌ی خوش‌خوان بودنش حتی برای مخاطبی که آمار دوست ندارد که بحثی نیست. اما آیا فقط باید به این نکته توجه کرد که اگر قطع یک کتاب را کوچک درنظر گرفته و ریزترین فونت ممکن را برایش انتخاب کنیم و از قطور شدنش جلوگیری کرده و ظاهری فانتزی و صمیمانه و جذاب برایش می‌سازیم. و در نتیجه خوانندگان جذبش می‌شوند؟ من می‌گویم ظاهر کتاب و جا دادن آن حجم از مطلب –به زور- با فونتی ریز در سیصد صفحه نباید اولویت ناشران گرامی باشد و باید موقع طراحی و تصمیم‌گیری، به چشم‌های بیچاره‌ی خوانندگان هم فکر کنند!

 غارنشینانی با ردپاهای نامرئی دیجیتال

برگردیم به موضوع کتاب. ارائه‌ی انواع جدید داده، فراهم آوردن داده‌های صادقانه و امکان تمرکز کردن روی زیرمجموعه‌هایی کوچک از مردم، از قدرت‌هایی است که به کلان داده نسبت داده‌اند. این ویژگی‌ها باعث می‌شود نویسنده ادعا کند کلان‌داده و الگوهای ترسیم شده در کتاب می‌توانند در زمینه‌های مختلف تحول و انقلاب ایجاد کند. اما اگر این ردپای دیجیتال، واقعاً این‌همه اثر پیشگویانه داشته باشد. و بتواند کمک کند طرحی واقعی‌تر از جامعه‌ای که در آن زندگی می‌کنیم داشته باشیم، آیا این قضیه ترسناک نخواهد بود؟ البته منظورم از ترس و وحشت، این نیست که باید مراقب باشیم چه چیزهایی جست‌وجو می‌کنیم. و نباید به ابزارهای دیجیتال اعتماد کنیم. بیشترین چیزی که مرا می‌ترساند تصویر هولناکی است. که کلان‌داده‌ها می‌توانند از جامعه و آدم‌هایش ارائه بدهند.

بعد از خواندن کتاب علاوه بر این‌که به خودسانسوری‌ای که همه‌ کمابیش درگیرش هستیم فکر می‌کنیم. و این‌که چه اندازه از خود واقعی‌مان را بروز می‌دهیم. به واقعیت‌های هولناکی فکر خواهیم کرد که زیر پوست جامعه در جریانند. آگاهی از میزان واقعی افسردگی افراد یک جامعه، یا درصد دقیق‌تری از اقدامات به کودک‌آزاری، تعداد تمایلات به خودکشی یا قتل و دزدی و موارد مشابه، وحشتناک است. و باعث می‌شود از تصویر خوشحال و صلح‌طلب جوامع، بترسیم یا شک کنیم. که اولین لبخندی که یک غریبه به رویمان می‌زند، می‌تواند معنایی جز مهربانی و دوستی داشته باشد. و شاید نفرت پشتش مخفی شده باشد. اگر اینطور به ماجرا نگاه کنیم، نثر طنازانه و شوخ‌طبعی استیو را هم می‌توان نوعی طنز سیاه دانست. که در سراسر متن کتاب جریان دارد. و در یک فضای گروتسکی، ما را از اعدادی که هستیم، می‌ترساند. و همزمان به ترس و خنده‌ی تلخ وامی‌دارد.

«همه دروغ می‌گویند» اگرچه قرار نیست از ما متخصص داده بسازد. یا ریاضی‌مان را قوی کند. اما کمکمان می‌کند چهره‌ی بی‌نقابی از جامعه و آدم‌هایش را متصور شویم. و به روزهایی فکر کنیم. که آیندگان دیگر دنبال ردپا و آثار ما به‌عنوان پیشینیانشان روی در و دیوار غارها و… نمی‌گردند. بلکه ردپاهای مخفی‌مان توی جهان دیجیتال را دنبال می‌کنند. و با کنار هم چیدن آن‌ها، تصویری بدون سانسور از آنچه بوده‌ایم، برای خودشان می‌سازند. با همه‌ی غم‌ها و شادی‌ها و لایه‌های مخفی وجودمان.

همه دروغ می‌گویند

همه دروغ می‌گویند

ناشر : گمان

مچ‌گیری به روش استیونز

و در پایان، اگر قرار است کتاب را تا نصفه بخوانید. و بعد رهایش کنید؛ اما همه‌جا بگویید که آن را کامل خوانده‌اید. و تبدیل به بخشی از آمار دروغینی بشوید که کتاب از آن صحبت می‌کند، لازم است بدانید که استیونز جایی در بخش‌های پایانی –که نمی‌گویم کجا!- برایتان یک تله گذاشته، تله‌ای که در راستای حفظ فُرم کتاب هم هست. و درواقع کلان‌داده را تا انتها در متن می‌کشاند. استیو با تبدیل خود شما خواننده‌ی عزیز به یک مثال، مچتان را خواهد گرفت:

النبرگ، ریاضی‌دانی از دانشگاه ویسکانسن، کنجکاو بود بداند چه تعداد از مردم واقعاً یک کتاب را تا آخر می‌خوانند. او به راه حل هوشمندانه‌ای فکر کرد که این پرسش را با استفاده از کلان‌داده‌ها به آزمون بگذارد. وبسایت آمازون نشان می‌دهد چه تعداد از مردم از جملات مختلف کتاب‌ها نقل‌قول می‌آورند. النبرگ متوجه شد می‌تواند فراوانی نقل قول‌های آورده شده از اوایل کتاب را با نقل‌قول‌های آورده شده از اواخر کتاب مقایسه کند. این کار می‌تواند برآوردی حدسی از رغبت خوانندگان به تمام کردن کتاب در اختیارمان بگذارد…

دسته بندی شده در: