آکادمی داده کاوی

فیلم از ۵ میلیون کتاب چه میدانیم ؟

متن سخنرانی از ۵ میلیون کتاب چه میدانیم ؟

01:14
02:18

وقتی گوگل کتاب را اسکن می کند آنرا به فرمت جالبی در می آورد. علاوه بر اطلاعات اصلی، اطلاعات جنبی را هم داریم. ما اطلاعاتی راجع به اینکه مثلا کجا این کتاب منتشر شده است، نویسنده کتاب کی بوده و چه وقت نوشته شده داریم. و کاری که ما باید بکنیم این است که همه این رکوردها را مرور کنیم و هر چیزی که ارزش مناسب اطلاعاتی ندارد نادیده بگیریم. چیزی که برای ما باقی ماند مجموعه ای از پنج میلیون کتاب است، 500 میلیارد کلمه، رشته کاراکترهایی هزاران برابر بزرگتر از ژنوم انسان– متنی که اگر نوشته بشود، 10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد. 10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد. پاره حقیقتی از ژنوم فرهنگی ما. البته ما وقتی با چنین حجم بی نهایت بزرگی مواجه شدیم… (خنده حضار) کاری کردیم که هر محقق قابل احترامی انجام می داد.صفحه ای از XKCD خارج کردیم و گفتیم، “کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم.” گفتیم، “کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم.”

05:46
06:20

الا: می توانید مفاهیم انتزاعی زیبایی با اینگونه چیزها بدست آورید. برای نمونه بذارید براتون تاریخ سال 1950 را بگم. اکثر عمده تاریخ،کسی به 1950 توجهی نمی کند. در سال 1700، در 1800 در 1900، هیچکس اهمیت نداد. از دهه 30 و 40، هیچکس اهمیت نداد.ناگهان در اواسط دهه 40، یه صدایی شروع شد. مردم متوجه شدند که سال 1950 داره میرسه، و این می تونه اتفاق خیلی بزرگی باشه.(خنده حضار) اما هیچی چیز 1950 برای مردم جذاب نبود همانند سال 1950. (خنده حضار) مردم با وسواس به این طرف و آنطرف می رفتند. نمی تونستند جلوی صحبت کردنشان را بگیرند درباره کارهایی که در سال 1950 انجام داده بودند، و چیزهایی که قصد داشتند در سال 1950 انجام دهند، تمام ارزوهایی که می خواستند در سال 1950 برآورده کنند. در حقیقت، سال 1950 چنان جذاب بود که سالها بعد از آن،مردم فقط به صحبت در مورد تمام اتفاقاتی که افتاده بود صحبت کردند، در 51، 52، 53. و در سرانجام در 1954، یکی فهمید که سال 1950 تمام شده. (خنده حضار) و اینگونه، حباب ترکید.

08:09

جی ام: اکنون کمی نصیحت شغلی. آنهایی که به دنبال شهرت هستند، می توانیم از 25 شخصیت مشهور سیاسی یادبگیریم، نویسندگان، هنرپیشه ها و غیره. اگر می خواهید خیلی زود مشهور بشید باید هنرپیشه شوید، چون شهرت از پایان دهه 20 شما شروع می شود– هنوز جوان هستید و این خیلی عالیه. اگر کمی صبر داشته باشید باید نویسنده شوید، چون به جاهای بالایی خواهید رسید، مانند مارک تواین بسیار مشهور. اما اگر می خواهید به جای بالا برسید، باید لذت را به تاخیر بیاندازید و البته سیاستمدار شوید. و اینجاست که تا پایان دهه 50 زندگی خود مشهور می شوید، و بعد از آن بسیار بسیار مشهور خواهید شد. دانشمندان هم وقتی مسن تر شدن مشهور می شوند. مانند بیولوژیست ها و فیزیکدانها تقریبا به اندازه هنرپیشه ها مشهورند. نباید اشتباه کنید و ریاضی دان شوید. (خنده حضار) اگر اینکار را کنید، ممکن است فکر کنید “عالیه، من وقتی 20 سالم شد بهترین کارم را ارائه می کنم” اما می توانید حدس بزنید، هیچکسی توجهی نخواهد کرد.

10:56

الا: کالترومیکس اسمی است که ما روی این متد گذاشته ایم. نوعی ژن شناسی است. فرقشان این است که لنز ژنومیکس روی بیولوژی استاز پنجره ترتیب ژنوم انسانی. کالترومیکس شبیه آن است. برنامه تحلیل اطلاعات در مقیاس عظیم است برای مطالعه فرهنگ انسان. اینجا، بجای نگاه از عدسی ژنوم، از لنزهای قطعات دیجیتالی شده ثبت تاریخی دیده می شود. نکته بزرگ در مورد کالترومیکس این است که هر کسی می تواند آنرا انجام دهد. چرا هر کسی می تواند انجام دهد؟ هر کسی می تواند انجام دهد چون سه نفر جان اوروانت، مت گری و بیل بروکمن در گوگل، نمونه ای از بیینده انگرم را دیدند، و گفتند، ” بسیار جالب است. باید این را در دسترس مردم قرار دهیم.” در عرض دو هفته – دو هفته قبل از اینکه مقاله ما منتشر شود — نسخه ای از بیننده انگرم را برای استفاده عمومی کدگذاری کردند. و شما می توانید هر کلمه یا عبارتی که دوست دارید را تایپ کنید و ان-گرم آن را سریع پیدا کنید– همچنین نمونه هایی از کتاب های مختلف را مرور کنید در ان-گرم شما که ظاهر می شود.

13:44

[/vc_column_text][/vc_column][/vc_row]

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مطالب مرتبط با این نوشته

لینک کوتاه این مقاله