معرفی DeepMind استارتاپ هوش مصنوعی
DeepMind: شرکت هوش مصنوعی که بر روی توسعه هوش مصنوعی عمومی کار میکند
Google DeepMind
Google DeepMind Technologies Limited is یک آزمایشگاه تحقیقاتی هوش مصنوعی بریتانیایی-آمریکایی است که به عنوان یکی از زیرمجموعههای گوگل فعالیت میکند. این شرکت در سال ۲۰۱۰ در بریتانیا تأسیس شد و در سال ۲۰۱۴ توسط گوگل خریداری شد و در آوریل ۲۰۲۳ با بخش Google Brain از Google AI ادغام شد تا Google DeepMind تشکیل شود. این شرکت در لندن مستقر است و مراکز تحقیقاتی در کانادا، فرانسه، آلمان و ایالات متحده دارد.
DeepMind دستگاههای تورینگ عصبی را معرفی کرده است (شبکههای عصبی که میتوانند به حافظه خارجی مانند یک ماشین تورینگ متعارف دسترسی داشته باشند) که منجر به ایجاد یک کامپیوتر شد که به طور سست به حافظه کوتاهمدت در مغز انسان شباهت دارد.
Google DeepMind مدلهای شبکه عصبی برای بازیهای ویدئویی و تختهای ایجاد کرده است. این شرکت در سال ۲۰۱۶ پس از اینکه برنامه AlphaGo آن یک بازیکن حرفهای انسان به نام لی سدول را در بازی گو، یک قهرمان جهانی، در یک مسابقه پنج بازی شکست داد، خبرساز شد که این مسابقه موضوع یک فیلم مستند بود. یک برنامه عمومیتر به نام AlphaZero نیز پس از چند روز بازی در برابر خود، قدرتمندترین برنامهها را در بازیهای گو، شطرنج و شوگی (شطرنج ژاپنی) شکست داد.
در سال ۲۰۲۰، DeepMind پیشرفتهای قابل توجهی در مسئله تا خوردن پروتئین با استفاده از AlphaFold به دست آورد. در ژوئیه ۲۰۲۲، اعلام شد که بیش از ۲۰۰ میلیون ساختار پروتئینی پیشبینی شده، که نمایانگر تقریباً تمام پروتئینهای شناخته شده هستند، در پایگاه داده AlphaFold منتشر خواهد شد. پایگاه داده پیشبینیهای AlphaFold رکوردهای پیشرفتهای را در تستهای معیار برای الگوریتمهای تا خوردن پروتئین به دست آورد، هرچند که هر پیشبینی فردی همچنان نیاز به تأیید توسط آزمایشهای تجربی دارد.
AlphaFold3 در ماه مه ۲۰۲۴ منتشر شد و پیشبینیهای ساختاری برای تعامل پروتئینها با مولکولهای مختلف انجام داد. این نسخه جدید استانداردهای جدیدی را در معیارهای مختلف به دست آورد و دقتهای پیشرفته را از ۲۸ و ۵۲ درصد به ۶۵ و ۷۶ درصد افزایش داد.
تاریخچه
استارتاپ DeepMind توسط دمیس هسابیس، شین لگ و مصطفی سلیمان در سپتامبر ۲۰۱۰ تأسیس شد. هسابیس و لگ اولین بار در واحد علوم اعصاب محاسباتی گتسبی در دانشگاه کالج لندن (UCL) با یکدیگر آشنا شدند.
دمیس هسابیس گفته است که این استارتاپ کار خود را بر روی فناوری هوش مصنوعی با آموزش بازیهای قدیمی از دهههای هفتاد و هشتاد میلادی آغاز کرد که در مقایسه با بازیهای امروزی نسبتاً ابتدایی هستند. برخی از این بازیها شامل Breakout، Pong و Space Invaders بودند. هوش مصنوعی بدون داشتن هیچ دانش قبلی از قوانین بازی، ابتدا با یک بازی آشنا میشد و پس از مدتی تمرین، به یک کارشناس در آن بازی تبدیل میشد.
“فرآیندهای شناختی که هوش مصنوعی از آنها عبور میکند، بسیار شبیه به فرآیندهای انسانی است که تا به حال آن بازی را ندیده است و سعی دارد آن را بفهمد و در آن مهارت پیدا کند.” هدف بنیانگذاران، ایجاد یک هوش مصنوعی چندمنظوره است که میتواند در تقریباً هر کاری مفید و موثر باشد.
شرکتهای بزرگ سرمایهگذاری مانند Horizons Ventures و Founders Fund در این شرکت سرمایهگذاری کردند، همچنین کارآفرینانی مانند اسکات بنستر، پیتر تیل و ایلان ماسک. جان تالین یکی از سرمایهگذاران اولیه و مشاور این شرکت بود.
در ۲۶ ژانویه ۲۰۱۴، گوگل تأیید کرد که DeepMind را با قیمتی که بین ۴۰۰ میلیون تا ۶۵۰ میلیون دلار گزارش شده بود، خریداری کرده است و با تصاحب شرکت DeepMind Technologies موافقت کرده است. فروش به گوگل پس از آن صورت گرفت که فیسبوک مذاکرات خود را با DeepMind Technologies در سال ۲۰۱۳ به پایان رساند. پس از آن، شرکت به نام Google DeepMind تغییر نام داد و حدود دو سال این نام را حفظ کرد.
در سال ۲۰۱۴، دیپمایند جایزه “شرکت سال” را از آزمایشگاه کامپیوتر کمبریج دریافت کرد.
**لوگو از ۲۰۱۵–۲۰۱۶**
**لوگو از ۲۰۱۶–۲۰۱۹**
در سپتامبر ۲۰۱۵، دیپمایند و Royal Free NHS Trust اولین توافقنامه اشتراکگذاری اطلاعات خود را برای توسعه یک اپ مدیریت وظایف بالینی به نام Streams امضا کردند.
پس از تصاحب گوگل، شرکت یک هیئت اخلاقی برای هوش مصنوعی ایجاد کرد. هیئت اخلاقی برای تحقیقات هوش مصنوعی همچنان به عنوان یک معما باقی مانده است و هر دو شرکت گوگل و دیپمایند از افشای اعضای این هیئت خودداری کردهاند. دیپمایند یک واحد جدید به نام DeepMind Ethics and Society افتتاح کرده است که بر سوالات اخلاقی و اجتماعی ناشی از هوش مصنوعی تمرکز دارد و فیلسوف برجسته نیک بوستروم به عنوان مشاور در آن حضور دارد. در اکتبر ۲۰۱۷، دیپمایند یک تیم تحقیقاتی جدید برای بررسی اخلاق هوش مصنوعی راهاندازی کرد.
در دسامبر ۲۰۱۹، یکی از بنیانگذاران، سلیمان اعلام کرد که دیپمایند را ترک خواهد کرد و به گوگل میپیوندد تا در یک نقش سیاستگذاری فعالیت کند.
در آوریل ۲۰۲۳، دیپمایند با بخش Google Brain گوگل ادغام شد تا Google DeepMind را تشکیل دهد، به عنوان بخشی از تلاشهای مستمر شرکت برای تسریع کار بر روی هوش مصنوعی در پاسخ به ChatGPT از OpenAI. این رویداد پایان یک مبارزه چند ساله از سوی مدیران دیپمایند برای به دست آوردن استقلال بیشتر از گوگل را نشان داد.
محصولات و فناوری ها
در سال ۲۰۱۶، گوگل ریسرچ مقالهای درباره امنیت هوش مصنوعی و جلوگیری از رفتارهای نامطلوب در طی فرایند یادگیری هوش مصنوعی منتشر کرد. در سال ۲۰۱۷، دیپمایند GridWorld را معرفی کرد، یک بستر آزمایشی متنباز برای ارزیابی اینکه آیا یک الگوریتم یاد میگیرد کلید کشتن خود را غیرفعال کند یا رفتارهای نامطلوب دیگری را از خود نشان دهد.
در جولای ۲۰۱۸، محققان دیپمایند یکی از سیستمهای خود را برای بازی کردن بازی کامپیوتری Quake III Arena آموزش دادند.
تا سال ۲۰۲۰، دیپمایند بیش از هزار مقاله منتشر کرده است که شامل سیزده مقالهای است که توسط مجلات Nature یا Science پذیرفته شدهاند. دیپمایند در دوران AlphaGo توجه رسانهها را به خود جلب کرد؛ طبق جستجوی LexisNexis، ۱۸۴۲ خبر منتشر شده در سال ۲۰۱۶ به دیپمایند اشاره داشتند، که این تعداد در سال ۲۰۱۹ به ۱۳۶۳ کاهش یافت.
بازیها
برخلاف هوش مصنوعیهای قبلی مثل Deep Blue یا Watson که برای اهداف مشخصی توسعه داده شده بودن و فقط در همون حوزهها کار میکردن، الگوریتمهای اولیه دیپمایند برای استفاده عمومی طراحی شده بودن. اونها از یادگیری تقویتی استفاده میکردن، یه الگوریتم که از تجربه یاد میگیره و فقط از پیکسلهای خام به عنوان ورودی داده استفاده میکنه. روش اولیهشون از یادگیری Q عمیق با یه شبکه عصبی پیچشی استفاده میکرد.
دیپمایند سیستم خودشون رو روی بازیهای ویدئویی، بهخصوص بازیهای آرکید قدیمی مثل Space Invaders و Breakout تست کردن. بدون تغییر کد، همون هوش مصنوعی میتونست بعضی از بازیها رو بهتر از هر انسانی بازی کنه.
در سال 2013، دیپمایند تحقیقی منتشر کرد درباره یه سیستم هوش مصنوعی که تو بازیهایی مثل Pong، Breakout و Enduro از تواناییهای انسان فراتر رفته بود، در حالی که تو بازیهایی مثل Seaquest، Beamrider و Q*bert هم عملکرد بهتری نسبت به پیشرفتهترین سیستمهای اون زمان داشت. این کارشون ظاهراً باعث شد که گوگل اونا رو بخره. در ابتدا، هوش مصنوعی دیپمایند روی بازیهای ویدئویی از دهههای 1970 و 1980 تمرکز داشت، و کار روی بازیهای سهبعدی پیچیدهتر مثل Quake که در دهه 1990 معرفی شد، ادامه داشت.
در سال 2020، دیپمایند Agent57 رو معرفی کرد، یه عامل هوش مصنوعی که تو همه 57 بازی مجموعه Atari 2600 از سطح انسانی بهتر عمل میکرد. در ژوئیه 2022، دیپمایند توسعه DeepNash رو اعلام کرد، یه سیستم یادگیری تقویتی چند عامله بدون مدل که میتونست بازی تختهای Stratego رو در سطح یه کارشناس انسانی بازی کنه.
AlphaGo و جانشینان
### مقالههای اصلی: AlphaGo، AlphaGo Zero، AlphaZero، و MuZero
در اکتبر ۲۰۱۵، یه برنامه کامپیوتری به نام AlphaGo که توسط دیپمایند توسعه داده شده بود، تونست فن هویی، قهرمان گو اروپا رو که یه بازیکن حرفهای ۲ دان (از ۹ دان ممکن) بود، پنج به صفر شکست بده. این اولین باری بود که یه هوش مصنوعی تونست یه بازیکن حرفهای گو رو شکست بده. قبلاً کامپیوترها فقط در سطح آماتور بازی میکردن. بازی گو خیلی سختتر از شطرنج و بازیهای دیگه برای کامپیوترهاست، به خاطر تعداد خیلی زیادی از حالات ممکن که روشهای سنتی هوش مصنوعی مثل جستجوی همهجانبه رو خیلی سخت میکنه.
در مارس ۲۰۱۶، AlphaGo تونست لی سدول، یکی از بالاترین رتبههای بازیکنان جهان، رو با امتیاز ۴ به ۱ در یه مسابقه پنجبازی شکست بده. در اجلاس آینده گو ۲۰۱۷، AlphaGo تونست یه مسابقه سهگانه رو با که جی، که دو سال رتبه اول جهان رو داشت، برنده بشه. در ۲۰۱۷، نسخه بهبود یافتهای به نام AlphaGo Zero، تونست AlphaGo رو در صد بازی از صد بازی شکست بده.
بعداً همون سال، نسخه اصلاح شدهای به نام AlphaZero، تونست به قابلیتهای فوقانسانی در شطرنج و شوگی دست پیدا کنه. در ۲۰۱۹، دیپمایند یه مدل جدید به نام MuZero رو معرفی کرد که بدون دادههای انسانی، دانش حوزه یا قوانین شناختهشده، تونست بازیهای گو، شطرنج، شوگی و بازیهای آتاری ۲۶۰۰ رو یاد بگیره و مسلط بشه.
فناوری AlphaGo بر اساس یادگیری تقویتی عمیق توسعه داده شد، که اون رو از فناوریهای هوش مصنوعی دیگه که در بازار بودن متفاوت میکرد. دادههای وارد شده به الگوریتم AlphaGo شامل حرکات مختلفی از دادههای تاریخی مسابقات بود. تعداد حرکات به تدریج زیاد شد تا اینکه بیش از ۳۰ میلیون حرکت پردازش شد. هدف این بود که سیستم رفتار بازیکن انسانی رو که توسط دادههای ورودی نمایانده میشه، تقلید کنه و در نهایت بهتر بشه. این سیستم با خودش بازی میکرد و از نتایج یاد میگرفت؛ بنابراین، یاد گرفت که خودش رو به مرور زمان بهبود بده و نرخ برد خودش رو افزایش بده.
AlphaGo از دو شبکه عصبی عمیق استفاده میکرد: یه شبکه سیاست برای ارزیابی احتمال حرکات و یه شبکه ارزش برای ارزیابی موقعیتها. شبکه سیاست از طریق یادگیری نظارتشده آموزش داده شد و سپس با یادگیری تقویتی مبتنی بر گرادیان سیاست اصلاح شد. شبکه ارزش یاد گرفت که برندههای بازیهایی رو که توسط شبکه سیاست در برابر خودش بازی میکرد، پیشبینی کنه. بعد از آموزش، این شبکهها از جستجوی درختی مونت کارلو با نگاه به جلو استفاده میکردن، به این صورت که شبکه سیاست حرکات با احتمال بالا رو شناسایی میکرد و شبکه ارزش (به همراه پیمایشهای مونت کارلو با استفاده از سیاست پیمایش سریع) موقعیتهای درخت رو ارزیابی میکرد.
مقایسه با AlphaGo Zero
در مقابل، AlphaGo Zero بدون استفاده از دادههای بازیهای انجام شده توسط انسان آموزش داده شد. به جای اون، خودش دادههای لازم رو تولید کرد و میلیونها بازی در برابر خودش انجام داد. این سیستم از یک شبکه عصبی استفاده میکرد، نه دو شبکه سیاست و ارزش جداگانه. جستجوی درختی سادهشده اون بر اساس همین شبکه عصبی برای ارزیابی موقعیتها و نمونهبرداری از حرکات متکی بود. یه الگوریتم یادگیری تقویتی جدید جستجوی پیشنگر رو درون حلقه آموزش گنجاند. AlphaGo Zero از حدود ۱۵ نفر و میلیونها واحد منابع محاسباتی استفاده کرد.
در نهایت، نیاز به قدرت محاسباتی کمتری نسبت به AlphaGo داشت و به جای ۴۸ پردازنده تخصصی هوش مصنوعی (TPUهای گوگل)، با چهار واحد TPU کار میکرد. همچنین زمان آموزش کمتری نیاز داشت و بعد از فقط سه روز تونست نسخه قبلی خودش رو شکست بده، در حالی که AlphaGo اصلی ماهها زمان نیاز داشت. به همین ترتیب، AlphaZero هم از طریق بازی با خودش یاد گرفت.
کاربرد MuZero در فشردهسازی ویدئو
پژوهشگران MuZero رو برای حل چالش واقعی فشردهسازی ویدئو با تعداد بیتهای مشخص در رابطه با ترافیک اینترنت در سایتهایی مثل یوتیوب، توییچ و گوگل میت به کار بردن. هدف MuZero این بود که ویدئو رو به صورت بهینه فشرده کنه تا کیفیت ویدئو حفظ بشه و در عین حال میزان داده کاهش پیدا کنه. نتیجه نهایی استفاده از MuZero کاهش میانگین ۶.۲۸ درصدی در نرخ بیت بود.
AlphaStar
AlphaStar (نرمافزار)
در سال 2016، هسابیس به بازی StarCraft به عنوان چالشی برای آینده اشاره کرد، زیرا این بازی نیاز به تفکر استراتژیک و مدیریت اطلاعات ناقص دارد.
در ژانویه 2019، دیپمایند برنامهای به نام AlphaStar معرفی کرد که بازی استراتژی زمان واقعی StarCraft II را بازی میکرد. AlphaStar از یادگیری تقویتی بر اساس بازپخشهای بازیکنان انسانی استفاده کرد و سپس برای بهبود مهارتهای خود در مقابل خودش بازی کرد. در زمان ارائه، AlphaStar دارای دانشی معادل 200 سال زمان بازی بود. این برنامه توانست در 10 مسابقه متوالی دو بازیکن حرفهای را شکست دهد، اگرچه این مزیت ناعادلانهای داشت که قادر بود کل میدان بازی را ببیند، در حالی که بازیکن انسانی باید دوربین را به صورت دستی حرکت دهد. نسخه ابتدایی که در آن این مزیت اصلاح شده بود، در مسابقه بعدی شکست خورد.
در ژوئیه 2019، AlphaStar شروع به بازی کردن در برابر انسانهای تصادفی در نردبان چندنفره 1v1 اروپا کرد. برخلاف نسخه اول AlphaStar که فقط به عنوان نژاد Protoss بازی میکرد، این نسخه به عنوان تمامی نژادهای بازی بازی میکرد و مزیتهای ناعادلانهای که قبلاً داشت، اصلاح شده بود. تا اکتبر 2019، AlphaStar به سطح Grandmaster در نردبان StarCraft II برای هر سه نژاد StarCraft رسید و تبدیل به اولین AI شد که بدون هیچ محدودیت بازی به لیگ برتر یک ورزش الکترونیک محبوب دست یافت.
ترکیب پروتئینها
مقاله اصلی: الفافولد
در سال 2016، دیپمایند هوش مصنوعی خود را به ترکیب پروتئینها، یک مشکل معمول در زیستشناسی مولکولی، معطوف کرد. در دسامبر 2018، الفافولد دیپمایند، با پیشبینی دقیقترین ساختار برای ۲۵ از ۴۳ پروتئین، برنده چهاردهمین ارزیابی حیاتی تکنیکهای پیشبینی ساختار پروتئین (CASP) شد.
“این یک پروژه مهم است، اولین سرمایهگذاری اصلی ما از نظر افراد و منابع در یک مسئله اساسی، بسیار مهم و واقعی در دنیای واقعی علمی است”، هسابیس به گاردین گفت. در سال 2020، در CASP چهاردهم، پیشبینیهای الفافولد یک امتیاز دقتی کسب کرد که با تکنیکهای آزمایشگاهی قابل مقایسه است. دکتر اندری کریشتافویچ، یکی از اعضای هیئت داوران علمی، این دستاورد را “بسیار قابل توجه” توصیف کرد و گفت که مسئله پیشبینی چگونگی ترکیب پروتئینها به طور “بزرگی حل شده است”.
در ژوئیه 2021، RoseTTAFold و الفافولد۲ به صورت منبع باز منتشر شدند تا به دانشمندان اجازه دهند نسخههای خود از ابزارها را اجرا کنند. یک هفته پس از آن، دیپمایند اعلام کرد که الفافولد پیشبینی تقریباً همه پروتئینهای انسان و همچنین کل پروتئومهای ۲۰ ارگانیسم مورد مطالعه گستردهٔ دیگر را به پایان رسانده است. ساختارها در پایگاه داده ساختار پروتئین الفافولد منتشر شدند. در ژوئیه 2022، اعلام شد که پیشبینیهای بیش از ۲۰۰ میلیون پروتئین، که تقریباً تمام پروتئینهای شناخته شده را نمایندگی میکنند، در پایگاه داده الفافولد منتشر خواهد شد.
آخرین بهروزرسانی، الفافولد۳، در مه 2024 منتشر شد و پیشبینی تعامل پروتئینها با DNA، RNA و مولکولهای مختلف را انجام داد. در یک آزمایش مقایسهای خاص درباره مسئله تعامل DNA، دقت الفافولد۳ به ۶۵٪ رسید،
مدلهای زبانی
در سال ۲۰۱۶، دیپمایند سیستم متن به گفتار WaveNet را معرفی کرد. در ابتدا برای استفاده در محصولات مصرفکننده، بسیار محاسباتی بود، اما در اواخر سال ۲۰۱۷ آماده استفاده در برنامههای مصرفکننده مانند Google Assistant شد. در سال ۲۰۱۸، گوگل محصول تبدیل متن به گفتار تجاری Cloud Text-to-Speech را بر اساس WaveNet معرفی کرد. در سال ۲۰۱۸، دیپمایند مدلی موثرتر به نام WaveRNN را معرفی کرد که به همراه Google AI توسعه یافت. در سال ۲۰۲۰، WaveNetEQ، یک روش پنهانسازی از دست دادن بستهها بر اساس معماری WaveRNN، معرفی شد. در سال ۲۰۱۹، گوگل شروع به ارائه WaveRNN با WavenetEQ به کاربران Google Duo کرد.
در مه ۲۰۲۲، Gato مدل چندمنظوره چندرسانهای منتشر شد. این مدل بر روی ۶۰۴ وظیفه، مانند توصیف تصویر، گفتگو یا ساخت بلوکها، آموزش دید. بر روی ۴۵۰ از این وظایف، Gato حداقل نیمی از زمان بهتر از کارشناسان انسانی عمل کرد، به گفته دیپمایند. بر خلاف مدلهایی مانند MuZero، Gato نیاز به دوباره آموزش برای تغییر از یک وظیفه به دیگری ندارد.
Sparrow یک چتبات قدرتمند هوش مصنوعی است که توسط دیپمایند توسعه یافته است تا با استفاده از ترکیب بازخورد انسانی و پیشنهادات جستجوی گوگل، سیستمهای یادگیری ماشین ایمنتری ایجاد کند.
Chinchilla یک مدل زبانی است که توسط دیپمایند توسعه یافته است.
دیپمایند در تاریخ ۲۸ آوریل ۲۰۲۲ یک مطلب درباره یک مدل زبانی تصویری تک، به نام Flamingo منتشر کرد که توانایی توصیف دقیق یک تصویر را با تنها چند تصویر آموزشی دارد.
AlphaCode
در سال ۲۰۲۲، دیپمایند موتور کدزنی قدرتمندی به نام AlphaCode را معرفی کرد، که برنامههای کامپیوتری را با سرعتی مقایسهپذیر با یک برنامهنویس معمولی ایجاد میکند. شرکت این سیستم را در برابر چالشهای کدنویسی ایجاد شده توسط Codeforces که در رقابتهای کدنویسی انسانی مورد استفاده قرار میگیرد، تست کرد. پس از آموزش بر روی دادههای GitHub و مسائل و راهحلهای Codeforce، AlphaCode در Codeforces موفق به کسب رتبهای معادل ۵۴٪ از امتیاز میانی شد. این برنامه موظف بود تا راهحل منحصربهفردی ارائه دهد و از تکرار جوابها جلوگیری شود.
Gemini
مقاله اصلی: جمینی (مدل زبان)
جمینی یک مدل زبان بزرگ چندحالته است که در ۶ دسامبر ۲۰۲۳ منتشر شد. (منبع۹۴) این مدل جانشین مدلهای زبانی LaMDA و PaLM 2 شرکت گوگل بود و هدف از ارائه آن، رقابت با مدل GPT-4 شرکت OpenAI بود. (منبع۹۵) جمینی در سه اندازه Nano، Pro و Ultra عرضه شده است. (منبع۹۶) همچنین جمینی نام چتباتی است که از جمینی استفاده میکند (و که قبلاً به نام بارد نامیده میشد).
Gemma
مقاله اصلی: گما (مدل زبان)
گما یک خانواده از مدلهای زبان بزرگ، منبع باز و سبک است که در ۲۱ فوریه ۲۰۲۴ منتشر شد. این مدل در دو اندازه متمایز موجود است: یک مدل ۷ میلیارد پارامتری که برای استفاده از GPU و TPU بهینه شده است، و یک مدل ۲ میلیارد پارامتری که برای استفاده از CPU و برنامههای روی دستگاه طراحی شده است. مدلهای گما با استفاده از معماریها، مجموعه دادهها و روشهای آموزش مشابه با خانواده مدل جمینی آموزش داده شدهاند.
SIMA
در مارس ۲۰۲۴، دیپمایند عامل چندکلمهای قابل دستور دادن مقیاسپذیر یا SIMA را معرفی کرد، یک عامل هوش مصنوعی که قادر به درک و پیروی از دستورات زبان طبیعی برای انجام وظایف در محیطهای مجازی ۳ بعدی مختلف است. با آموزش دیدگاه از نه بازی ویدیویی از هشت استودیو و چهار محیط تحقیقاتی، SIMA قابلیت سازگاری با وظایف و تنظیمات جدید را بدون نیاز به دسترسی به کد منبع بازی یا رابطهای برنامهنویسی (APIs) نشان داد.
این عامل شامل مدلهای پیشآموزش دیدگاه و زبان است که بر روی دادههای بازی بهینهسازی شدهاند، با زبان مهم برای درک و انجام وظایف دادهشده به عنوان دستور العمل. هدف تحقیقات دیپمایند از توسعه عوامل هوش مصنوعی مفیدتر با ترجمه قابلیتهای پیشرفته هوش مصنوعی به اعمال واقعی در جهان واقعی از طریق یک رابط زبانی است.
رباتیک
در ژوئن ۲۰۲۳، روبوکت یک مدل هوش مصنوعی است که میتواند دستهای رباتیک را کنترل کند. این مدل قادر است به مدلهای جدیدی از دستهای رباتیک و به انواع جدیدی از وظایف سازگار شود.
ورزش
محققان دیپمایند مدلهای یادگیری ماشین را به ورزش فوتبال اعمال کردهاند، که در آمریکای شمالی به عنوان فوتبال شناخته میشود، با مدلسازی رفتار بازیکنان فوتبال، از جمله دروازهبان، دفاعکنندگان و مهاجمان در شرایط مختلفی مانند پنالتیها. محققان از نقشههای حرارتی و تجزیه و تحلیل خوشهای استفاده کردهاند تا بازیکنان را بر اساس میل آنها به رفتار خاصی در طول بازی در مواجهه با تصمیمی درباره چگونگی گلزنی یا جلوگیری از امتیاز تیم حریف، سازماندهی کنند.
محققان اشاره میکنند که مدلهای یادگیری ماشین میتوانند برای دموکراتیزه کردن صنعت فوتبال استفاده شوند، با انتخاب خودکار فیلمهای جذاب بازی که به عنوان نقاط قوت خدمات میکند. این امکان از طریق جستجوی ویدیوها برای رویدادهای خاص ممکن است، که این امکان به دلیل تجزیه و تحلیل ویدیو یک زمینه مستقل از یادگیری ماشین است. این همچنین امکان پذیر است به دلیل تجزیه و تحلیل ورزشی گسترده بر اساس دادههای از جمله گذرها یا شوتهای حاوی اطلاعات، سنسورهایی که دادههای مربوط به حرکات بازیکنان را در طول یک بازی چندین بار ثبت میکنند و مدلهای تئوری بازی.
باستانشناسی
گوگل یک برنامه جدید باستانشناسی را معرفی کرده است که Ithaca نامیده شده و به نام جزیرهای یونانی در ادیسه هومر اشاره دارد. این شبکه عصبی عمیق به محققان کمک میکند تا متنهای یونانی آسیبدیده را بازسازی کنند و تاریخ و منشأ جغرافیایی آنها را شناسایی کنند. این کار بر پایه شبکه تحلیل متن دیگری است که دیپمایند در سال 2019 با نام Pythia منتشر کرد.
Ithaca در بازسازی متون آسیبدیده به دقت ۶۲٪ و در شناسایی مکانی با دقت ۷۱٪ موفق بوده و دقت تاریخگذاری آن ۳۰ سال است. نویسندگان ادعا کردند که استفاده از Ithaca توسط “تاریخنگاران ماهر” دقت کار خود را از ۲۵٪ به ۷۲٪ افزایش داده است. با این حال، الینور دیکی توجه کرد که این آزمون در واقع فقط از دانشجویان تشکیل شده بود و گفت که واضح نیست که Ithaca به “ویراستاران واقعیاً واجد شایستگی” چقدر کمک میکند.
تیم در حال کار بر روی گسترش مدل به زبانهای باستانی دیگر است، از جمله دموتیک، آکادیایی، عبری و مایایی.
علوم مواد
در نوامبر ۲۰۲۳، گوگل دیپمایند اعلام کرد یک شبکه گراف متنباز برای اکتشاف مواد (GNoME) را معرفی کرده است. این ابزار میلیونها ماده قبلاً ناشناخته برای شیمی پیشنهاد میدهد، از جمله چند صد هزار ساختار بلوری پایدار، از جمله ۷۳۶ ساختار که تا زمان انتشار توسط موسسه فناوری ماساچوست پردازش شدهاند. با این حال، طبق اظهارات آنتونی چیتام، GNoME “یک مشارکت مفید و عملی برای دانشمندان تجربی مواد نساخته است.” یک مقاله بررسی اثر گذار توسط چیتام و رام سشادری نتوانست هیچ ماده “به شدت جدید” را که توسط GNoME پیدا شدهباشد، شناسایی کند، با بیشتری از آنها به عنوان تغییرات کوچک از موادی که قبلاً شناخته شدهاند، معرفی شدند.
ریاضیات
آلفاتنزورAlphaTensor
در اکتبر ۲۰۲۲، دیپمایند آلفاتنزور را منتشر کرد، که از تکنیکهای یادگیری تقویتی مشابه آنهایی که در آلفاگو استفاده میشود، برای پیدا کردن الگوریتمهای نوآورانه برای ضرب ماتریس استفاده میکند. در مورد خاص ضرب دو ماتریس ۴×۴ با مقادیر عددی، جایی که فقط زوج یا فرد بودن مقادیر ثبت میشود، آلفاتنزور الگوریتمی را پیدا کرد که فقط ۴۷ ضرب نوعی متمایز را نیاز داشت؛ به عبارت دیگر، بهینه قبلی که از سال ۱۹۶۹ معروف بود، الگوریتم کلی Strassen با استفاده از ۴۹ ضرب بود.
دانشمند رایانه جاش المن آلفاتنزور را “یک اثبات مفهوم برای چیزی که میتواند شکستی شود” توصیف کرد، در حالی که واسیلوسکا ویلیامز آن را “یک کم بیش از اندازه” توصیف کرد، با وجود اینکه به عنوان “چیزی کاملاً متفاوت” از روشهای قبلی تقویت یادگیری تأکید کرد.
آلفاجیومتری
مقاله اصلی: آلفاجیومتری
آلفاجیومتری یک هوش مصنوعی نورو-نمادین است که توانست ۲۵ از ۳۰ مسئله هندسی المپیاد ریاضی بینالمللی را حل کند، کارایی قابل مقایسهای با دارنده مدال طلایی دارد.
برنامههای هندسه سنتی موتورهای نمادین هستند که کاملاً بر روی قوانین انسانی کد شده برای تولید اثباتهای دقیق تکیه دارند، که باعث میشود در شرایط غیرمعمول از انعطاف کمی برخوردار باشند. آلفاجیومتری چنین موتوری نمادین را با یک مدل زبان بزرگ ویژه که بر روی دادههای سنتی اثباتهای هندسی آموزش دیده است، ترکیب میکند.
زمانی که موتور نمادین نتواند به تنهایی اثباتی رسمی و دقیق پیدا کند، به مدل زبان بزرگ مراجعه میکند که یک ساختار هندسی را برای پیشروی پیشنهاد میدهد. با این حال، نامشخص است که این روش چقدر قابل اجرا در دامنههای دیگری از ریاضی یا استدلال است، زیرا موتورهای نمادین بر روی قوانین خاص حوزه و همچنین نیاز به دادههای مصنوعی وابستهاست.
Google اعلام کرده که الگوریتمهای DeepMind به طور چشمگیری کارایی سردخانههای داده خود را افزایش دادهاند، با تعادل خودکار هزینههای خرابیهای سختافزاری با هزینههای خنک کردن. همچنین، DeepMind (همراه با محققان هوش مصنوعی دیگر Alphabet) در پیشنهادهای شخصیسازی برنامههای Google Play کمک میکند.
DeepMind همچنین با تیم اندروید در گوگل برای ایجاد دو ویژگی جدید که برای افرادی با دستگاههایی که سیستم عامل موبایلی گوگل را اجرا میکنند، یعنی Android Pie، نصب شدند، همکاری کرده است. این ویژگیها، باتری تطبیقی و روشنایی تطبیقی نامیده میشوند، که از یادگیری ماشین برای صرفهجویی در انرژی و استفاده آسانتر از دستگاههایی که سیستم عامل را اجرا میکنند، استفاده میکنند. این اولین بار است که DeepMind از این تکنیکها در اندازههای آنچنانی استفاده میکند، که برنامههای یادگیری ماشین معمولاً نیازمند تواناییهای محاسباتی به مراتب بیشتری هستند.
DeepMind Health
در ژوئیه ۲۰۱۶، همکاری بین DeepMind و بیمارستان چشمپزشکی مورفیلدز برای توسعه برنامههای هوش مصنوعی در حوزه بهداشت اعلام شد. DeepMind به تجزیه و تحلیل اسکنهای چشم ناشناس برای جستجوی نشانههای زودهنگام بیماریهایی که منجر به نابینایی میشوند، اعمال میشد.
در اوت ۲۰۱۶، برنامه تحقیقاتی با بیمارستان دانشگاه کالج لندن اعلام شد با هدف توسعه الگوریتمی که بتواند به طور خودکار بین بافتهای سالم و سرطانی در مناطق سر و گردن تفاوت قائل شود.
همچنین پروژههایی با بنیاد موسسان بیمارستان لندن و بنیاد موسسان دانشگاه امپریال لندن برای توسعه برنامههای جدید موبایل بالینی مرتبط با سوابق بیمار الکترونیکی در حال انجام است. کارکنان بیمارستان Royal Free گزارش دادهاند که در دسامبر ۲۰۱۷ دسترسی به دادههای بیمار از طریق برنامه به صرفه زمان زیادی را صرفه جویی کرده و تاثیر فوقالعادهای بر مدیریت بیماران با آسیب کلیه ناشی از حادت شده است. دادههای نتیجه آزمایش به تلفنهای همراه کارکنان ارسال میشود و آنها را به تغییرات در وضعیت بیمار هشدار میدهد. همچنین به کارکنان اجازه میدهد ببینند که آیا کسی دیگر پاسخ داده است و به بیماران نتایج خود را به صورت تصویری نشان دهند.
در نوامبر ۲۰۱۷، DeepMind اعلام کرد که با مرکز تحقیقات سرطان UK در کالج امپریال لندن همکاری تحقیقاتی دارد با هدف بهبود تشخیص سرطان پستان با استفاده از یادگیری ماشین در ماموگرافی. علاوه بر این، در فوریه ۲۰۱۸، DeepMind اعلام کرد که با وزارت امور امور وترانس آمریکا در تلاش است برای استفاده از یادگیری ماشین برای پیشبینی شروع کلیه حاد در بیماران، و همچنین به طور کلی تدهور بیماران در طول بستری در بیمارستان تا دکتران و پرستاران بتوانند به سرعت بیماران نیازمند را درمان کنند.
DeepMind توسعه داد یک برنامه به نام Streams که هشدارها را به پزشکان در مورد بیماران در خطر ابتلا به آسیب کلیه حاد ارسال میکند. در ۱۳ نوامبر ۲۰۱۸، DeepMind اعلام کرد که بخش بهداشت و برنامه Streams آن به Google Health جذب خواهد شد.
فعالان حفاظت از حریم خصوصی گفتند که این اعلام خیانت به اعتماد بیماران است و به نظر میرسد با اظهارات قبلی DeepMind که دادههای بیماران به حسابها یا خدمات گوگل متصل نخواهند شد، مغایرت داشته باشد. یک سخنگوی DeepMind گفت که دادههای بیماران همچنان جدا از خدمات یا پروژههای گوگل نگه داشته میشود.
NHS data-sharing controversy
در آوریل ۲۰۱۶، New Scientist یک نسخه از توافقنامه به اشتراک گذاری داده بین DeepMind و بنیاد Royal Free London NHS را دریافت کرد. این بنیاد سه بیمارستان در لندن را اداره میکند که سالانه حدود ۱.۶ میلیون بیمار در آنها درمان میشوند. این توافقنامه نشان میدهد که DeepMind Health به دادههای ورودی، خروجی و انتقال، بخش اورژانس، پاتولوژی و رادیولوژی و مراقبتهای ویژه در این بیمارستانها دسترسی داشته است. این شامل جزئیات شخصی مانند اینکه آیا بیماران با اچآیوی تشخیص داده شدهاند، از افسردگی رنج میبرند یا تاکنون عمل سقط جنین انجام دادهاند بود تا برای انجام تحقیقاتی جهت بهبود نتایج مختلف شرایط بهداشتی استفاده شود.
یک شکایت به دفتر کمیسیونر اطلاعات (ICO) ارسال شد که ادعا میکرد دادهها باید به صورت شناور و رمزنگاری شوند. در ماه مه ۲۰۱۶، New Scientist مقالهای دیگر منتشر کرد که ادعا میکرد که این پروژه موفق به دریافت موافقت از گروه مشاوران مخفیگاهی مؤسسه تنظیم و ارزیابی محصولات پزشکی و درمانی نشده بود.
در سال ۲۰۱۷، کمیسیونر اطلاعات (ICO) پس از یک بررسی یکساله که بر روی این متمرکز بود که چگونه بنیاد Royal Free NHS اپلیکیشن Streams را در اواخر سالهای ۲۰۱۵ و ۲۰۱۶ آزمایش کرده است، به نتیجه رسید. کمیسیونر اطلاعات یافت که بنیاد Royal Free در ارائه جزئیات بیمار به DeepMind مغایرت با قانون حفاظت از دادهها داشت و چندین نقص در روش برخورد با دادهها را یافت، از جمله اینکه بیماران به طور کافی مطلع نشده بودند که دادههایشان به عنوان بخشی از آزمایش استفاده خواهد شد.
DeepMind در ژوئیه ۲۰۱۷ نظرات خود را درباره بررسی[۱۳۳] منتشر کرد و گفت “ما باید بهتر عمل کنیم” و برخی فعالیتها و فعالیتهایی را که برای شفافیت، نظارت و مشارکت آغاز کرده بودند، روشن کرد. این شامل توسعه یک استراتژی مشارکت بیمار و عمومی[۱۳۴] و شفافیت در شراکتهای خود بود.
در ماه مه ۲۰۱۷، شبکه اسکای خبری یک نامه درز شده از ناظر دادههای ملی، خانم فیونا کالدیکوت، منتشر کرد که نشان میدهد که به “نظر دقیق من” توافقنامه به اشتراک گذاری داده بین DeepMind و Royal Free بر روی یک “پایه قانونی نامناسب” انجام شده است. [۱۳۵] کمیسیونر اطلاعات در ژوئیه ۲۰۱۷ حکم داد که بیمارستان Royal Free برای پایبندی به قانون حفاظت از دادهها هنگام ارائه دادههای شخصی ۱.۶ میلیون بیمار به DeepMind، شکست خوردهاست.
اخلاق و جامعه DeepMind
در اکتبر ۲۰۱۷، DeepMind اعلام کرد که یک واحد تحقیقاتی جدید به نام اخلاق و جامعه DeepMind تأسیس کرده است. هدف آن تأمین مالی برای تحقیقات خارجی در موضوعات زیر است: حریم خصوصی، شفافیت و عدالت؛ تأثیرات اقتصادی؛ حکومت و مسئولیت؛ مدیریت ریسک هوش مصنوعی؛ اخلاق و ارزشهای هوش مصنوعی؛ و نحوه اینکه هوش مصنوعی میتواند چالشهای جهان را حل کند. به عنوان نتیجه، این تیم امیدوار است که درک بیشتری از پیامدهای اخلاقی هوش مصنوعی بدست آورد و به جامعه کمک کند تا ببیند که هوش مصنوعی چگونه میتواند مفید باشد.
این زیربخش جدید از DeepMind به طور کاملاً جدا از همکاری شرکتهای معروفی است که از هوش مصنوعی استفاده میکنند، همچون دانشگاهها، سازمانهای جامعه مدنی و موسسات غیرانتفاعی در پارتنرشیپ در مورد هوش مصنوعی برای بهرهمندی از مردم و جامعه که DeepMind هم جزء آن است، است.
هیئت اخلاق و جامعه DeepMind نیز از هیئت اخلاقی هوش مصنوعی متمایز است که گوگل ابتدا در موقعیت خرید DeepMind به تشکیل آن پذیرفته بود.
منبع:لینک