استارتاپ هاانگلیسانگلیسگزارش نامه

معرفی DeepMind استارتاپ هوش مصنوعی

DeepMind: شرکت هوش مصنوعی که بر روی توسعه هوش مصنوعی عمومی کار می‌کند

Google DeepMind

Google DeepMind Technologies Limited is یک آزمایشگاه تحقیقاتی هوش مصنوعی بریتانیایی-آمریکایی است که به عنوان یکی از زیرمجموعه‌های گوگل فعالیت می‌کند. این شرکت در سال ۲۰۱۰ در بریتانیا تأسیس شد و در سال ۲۰۱۴ توسط گوگل خریداری شد و در آوریل ۲۰۲۳ با بخش Google Brain از Google AI ادغام شد تا Google DeepMind تشکیل شود. این شرکت در لندن مستقر است و مراکز تحقیقاتی در کانادا، فرانسه، آلمان و ایالات متحده دارد.

DeepMind دستگاه‌های تورینگ عصبی را معرفی کرده است (شبکه‌های عصبی که می‌توانند به حافظه خارجی مانند یک ماشین تورینگ متعارف دسترسی داشته باشند) که منجر به ایجاد یک کامپیوتر شد که به طور سست به حافظه کوتاه‌مدت در مغز انسان شباهت دارد.

Google DeepMind مدل‌های شبکه عصبی برای بازی‌های ویدئویی و تخته‌ای ایجاد کرده است. این شرکت در سال ۲۰۱۶ پس از اینکه برنامه AlphaGo آن یک بازیکن حرفه‌ای انسان به نام لی سدول را در بازی گو، یک قهرمان جهانی، در یک مسابقه پنج بازی شکست داد، خبرساز شد که این مسابقه موضوع یک فیلم مستند بود. یک برنامه عمومی‌تر به نام AlphaZero نیز پس از چند روز بازی در برابر خود، قدرتمندترین برنامه‌ها را در بازی‌های گو، شطرنج و شوگی (شطرنج ژاپنی) شکست داد.

در سال ۲۰۲۰، DeepMind پیشرفت‌های قابل توجهی در مسئله تا خوردن پروتئین با استفاده از AlphaFold به دست آورد. در ژوئیه ۲۰۲۲، اعلام شد که بیش از ۲۰۰ میلیون ساختار پروتئینی پیش‌بینی شده، که نمایانگر تقریباً تمام پروتئین‌های شناخته شده هستند، در پایگاه داده AlphaFold منتشر خواهد شد. پایگاه داده پیش‌بینی‌های AlphaFold رکوردهای پیشرفته‌ای را در تست‌های معیار برای الگوریتم‌های تا خوردن پروتئین به دست آورد، هرچند که هر پیش‌بینی فردی همچنان نیاز به تأیید توسط آزمایش‌های تجربی دارد.

AlphaFold3 در ماه مه ۲۰۲۴ منتشر شد و پیش‌بینی‌های ساختاری برای تعامل پروتئین‌ها با مولکول‌های مختلف انجام داد. این نسخه جدید استانداردهای جدیدی را در معیارهای مختلف به دست آورد و دقت‌های پیشرفته را از ۲۸ و ۵۲ درصد به ۶۵ و ۷۶ درصد افزایش داد.

Google DeepMind
Google DeepMind

تاریخچه

استارتاپ DeepMind توسط دمیس هسابیس، شین لگ و مصطفی سلیمان در سپتامبر ۲۰۱۰ تأسیس شد. هسابیس و لگ اولین بار در واحد علوم اعصاب محاسباتی گتسبی در دانشگاه کالج لندن (UCL) با یکدیگر آشنا شدند.

دمیس هسابیس گفته است که این استارتاپ کار خود را بر روی فناوری هوش مصنوعی با آموزش بازی‌های قدیمی از دهه‌های هفتاد و هشتاد میلادی آغاز کرد که در مقایسه با بازی‌های امروزی نسبتاً ابتدایی هستند. برخی از این بازی‌ها شامل Breakout، Pong و Space Invaders بودند. هوش مصنوعی بدون داشتن هیچ دانش قبلی از قوانین بازی، ابتدا با یک بازی آشنا می‌شد و پس از مدتی تمرین، به یک کارشناس در آن بازی تبدیل می‌شد.

“فرآیندهای شناختی که هوش مصنوعی از آنها عبور می‌کند، بسیار شبیه به فرآیندهای انسانی است که تا به حال آن بازی را ندیده است و سعی دارد آن را بفهمد و در آن مهارت پیدا کند.” هدف بنیانگذاران، ایجاد یک هوش مصنوعی چندمنظوره است که می‌تواند در تقریباً هر کاری مفید و موثر باشد.

شرکت‌های بزرگ سرمایه‌گذاری مانند Horizons Ventures و Founders Fund در این شرکت سرمایه‌گذاری کردند، همچنین کارآفرینانی مانند اسکات بنستر، پیتر تیل و ایلان ماسک. جان تالین یکی از سرمایه‌گذاران اولیه و مشاور این شرکت بود.

در ۲۶ ژانویه ۲۰۱۴، گوگل تأیید کرد که DeepMind را با قیمتی که بین ۴۰۰ میلیون تا ۶۵۰ میلیون دلار گزارش شده بود، خریداری کرده است و با تصاحب شرکت DeepMind Technologies موافقت کرده است. فروش به گوگل پس از آن صورت گرفت که فیس‌بوک مذاکرات خود را با DeepMind Technologies در سال ۲۰۱۳ به پایان رساند. پس از آن، شرکت به نام Google DeepMind تغییر نام داد و حدود دو سال این نام را حفظ کرد.
در سال ۲۰۱۴، دیپ‌مایند جایزه “شرکت سال” را از آزمایشگاه کامپیوتر کمبریج دریافت کرد.

**لوگو از ۲۰۱۵–۲۰۱۶**

**لوگو از ۲۰۱۶–۲۰۱۹**

در سپتامبر ۲۰۱۵، دیپ‌مایند و Royal Free NHS Trust اولین توافقنامه اشتراک‌گذاری اطلاعات خود را برای توسعه یک اپ مدیریت وظایف بالینی به نام Streams امضا کردند.

پس از تصاحب گوگل، شرکت یک هیئت اخلاقی برای هوش مصنوعی ایجاد کرد. هیئت اخلاقی برای تحقیقات هوش مصنوعی همچنان به عنوان یک معما باقی مانده است و هر دو شرکت گوگل و دیپ‌مایند از افشای اعضای این هیئت خودداری کرده‌اند. دیپ‌مایند یک واحد جدید به نام DeepMind Ethics and Society افتتاح کرده است که بر سوالات اخلاقی و اجتماعی ناشی از هوش مصنوعی تمرکز دارد و فیلسوف برجسته نیک بوستروم به عنوان مشاور در آن حضور دارد. در اکتبر ۲۰۱۷، دیپ‌مایند یک تیم تحقیقاتی جدید برای بررسی اخلاق هوش مصنوعی راه‌اندازی کرد.

در دسامبر ۲۰۱۹، یکی از بنیانگذاران، سلیمان اعلام کرد که دیپ‌مایند را ترک خواهد کرد و به گوگل می‌پیوندد تا در یک نقش سیاست‌گذاری فعالیت کند.

در آوریل ۲۰۲۳، دیپ‌مایند با بخش Google Brain گوگل ادغام شد تا Google DeepMind را تشکیل دهد، به عنوان بخشی از تلاش‌های مستمر شرکت برای تسریع کار بر روی هوش مصنوعی در پاسخ به ChatGPT از OpenAI. این رویداد پایان یک مبارزه چند ساله از سوی مدیران دیپ‌مایند برای به دست آوردن استقلال بیشتر از گوگل را نشان داد.

محصولات و فناوری ها

در سال ۲۰۱۶، گوگل ریسرچ مقاله‌ای درباره امنیت هوش مصنوعی و جلوگیری از رفتارهای نامطلوب در طی فرایند یادگیری هوش مصنوعی منتشر کرد. در سال ۲۰۱۷، دیپ‌مایند GridWorld را معرفی کرد، یک بستر آزمایشی متن‌باز برای ارزیابی اینکه آیا یک الگوریتم یاد می‌گیرد کلید کشتن خود را غیرفعال کند یا رفتارهای نامطلوب دیگری را از خود نشان دهد.

در جولای ۲۰۱۸، محققان دیپ‌مایند یکی از سیستم‌های خود را برای بازی کردن بازی کامپیوتری Quake III Arena آموزش دادند.

تا سال ۲۰۲۰، دیپ‌مایند بیش از هزار مقاله منتشر کرده است که شامل سیزده مقاله‌ای است که توسط مجلات Nature یا Science پذیرفته شده‌اند. دیپ‌مایند در دوران AlphaGo توجه رسانه‌ها را به خود جلب کرد؛ طبق جستجوی LexisNexis، ۱۸۴۲ خبر منتشر شده در سال ۲۰۱۶ به دیپ‌مایند اشاره داشتند، که این تعداد در سال ۲۰۱۹ به ۱۳۶۳ کاهش یافت.

محصولات و فناوری ها
محصولات و فناوری ها

بازی‌ها

برخلاف هوش مصنوعی‌های قبلی مثل Deep Blue یا Watson که برای اهداف مشخصی توسعه داده شده بودن و فقط در همون حوزه‌ها کار می‌کردن، الگوریتم‌های اولیه دیپ‌مایند برای استفاده عمومی طراحی شده بودن. اون‌ها از یادگیری تقویتی استفاده می‌کردن، یه الگوریتم که از تجربه یاد می‌گیره و فقط از پیکسل‌های خام به عنوان ورودی داده استفاده می‌کنه. روش اولیه‌شون از یادگیری Q عمیق با یه شبکه عصبی پیچشی استفاده می‌کرد.

دیپ‌مایند سیستم خودشون رو روی بازی‌های ویدئویی، به‌خصوص بازی‌های آرکید قدیمی مثل Space Invaders و Breakout تست کردن. بدون تغییر کد، همون هوش مصنوعی می‌تونست بعضی از بازی‌ها رو بهتر از هر انسانی بازی کنه.

در سال 2013، دیپ‌مایند تحقیقی منتشر کرد درباره یه سیستم هوش مصنوعی که تو بازی‌هایی مثل Pong، Breakout و Enduro از توانایی‌های انسان فراتر رفته بود، در حالی که تو بازی‌هایی مثل Seaquest، Beamrider و Q*bert هم عملکرد بهتری نسبت به پیشرفته‌ترین سیستم‌های اون زمان داشت. این کارشون ظاهراً باعث شد که گوگل اونا رو بخره. در ابتدا، هوش مصنوعی دیپ‌مایند روی بازی‌های ویدئویی از دهه‌های 1970 و 1980 تمرکز داشت، و کار روی بازی‌های سه‌بعدی پیچیده‌تر مثل Quake که در دهه 1990 معرفی شد، ادامه داشت.

در سال 2020، دیپ‌مایند Agent57 رو معرفی کرد، یه عامل هوش مصنوعی که تو همه 57 بازی مجموعه Atari 2600 از سطح انسانی بهتر عمل می‌کرد. در ژوئیه 2022، دیپ‌مایند توسعه DeepNash رو اعلام کرد، یه سیستم یادگیری تقویتی چند عامله بدون مدل که می‌تونست بازی تخته‌ای Stratego رو در سطح یه کارشناس انسانی بازی کنه.

AlphaGo و جانشینان

### مقاله‌های اصلی: AlphaGo، AlphaGo Zero، AlphaZero، و MuZero

در اکتبر ۲۰۱۵، یه برنامه کامپیوتری به نام AlphaGo که توسط دیپ‌مایند توسعه داده شده بود، تونست فن هویی، قهرمان گو اروپا رو که یه بازیکن حرفه‌ای ۲ دان (از ۹ دان ممکن) بود، پنج به صفر شکست بده. این اولین باری بود که یه هوش مصنوعی تونست یه بازیکن حرفه‌ای گو رو شکست بده. قبلاً کامپیوترها فقط در سطح آماتور بازی می‌کردن. بازی گو خیلی سخت‌تر از شطرنج و بازی‌های دیگه برای کامپیوترهاست، به خاطر تعداد خیلی زیادی از حالات ممکن که روش‌های سنتی هوش مصنوعی مثل جستجوی همه‌جانبه رو خیلی سخت می‌کنه.

در مارس ۲۰۱۶، AlphaGo تونست لی سدول، یکی از بالاترین رتبه‌های بازیکنان جهان، رو با امتیاز ۴ به ۱ در یه مسابقه پنج‌بازی شکست بده. در اجلاس آینده گو ۲۰۱۷، AlphaGo تونست یه مسابقه سه‌گانه رو با که جی، که دو سال رتبه اول جهان رو داشت، برنده بشه. در ۲۰۱۷، نسخه بهبود یافته‌ای به نام AlphaGo Zero، تونست AlphaGo رو در صد بازی از صد بازی شکست بده.

بعداً همون سال، نسخه اصلاح شده‌ای به نام AlphaZero، تونست به قابلیت‌های فوق‌انسانی در شطرنج و شوگی دست پیدا کنه. در ۲۰۱۹، دیپ‌مایند یه مدل جدید به نام MuZero رو معرفی کرد که بدون داده‌های انسانی، دانش حوزه یا قوانین شناخته‌شده، تونست بازی‌های گو، شطرنج، شوگی و بازی‌های آتاری ۲۶۰۰ رو یاد بگیره و مسلط بشه.

فناوری AlphaGo بر اساس یادگیری تقویتی عمیق توسعه داده شد، که اون رو از فناوری‌های هوش مصنوعی دیگه که در بازار بودن متفاوت می‌کرد. داده‌های وارد شده به الگوریتم AlphaGo شامل حرکات مختلفی از داده‌های تاریخی مسابقات بود. تعداد حرکات به تدریج زیاد شد تا اینکه بیش از ۳۰ میلیون حرکت پردازش شد. هدف این بود که سیستم رفتار بازیکن انسانی رو که توسط داده‌های ورودی نمایانده می‌شه، تقلید کنه و در نهایت بهتر بشه. این سیستم با خودش بازی می‌کرد و از نتایج یاد می‌گرفت؛ بنابراین، یاد گرفت که خودش رو به مرور زمان بهبود بده و نرخ برد خودش رو افزایش بده.

AlphaGo از دو شبکه عصبی عمیق استفاده می‌کرد: یه شبکه سیاست برای ارزیابی احتمال حرکات و یه شبکه ارزش برای ارزیابی موقعیت‌ها. شبکه سیاست از طریق یادگیری نظارت‌شده آموزش داده شد و سپس با یادگیری تقویتی مبتنی بر گرادیان سیاست اصلاح شد. شبکه ارزش یاد گرفت که برنده‌های بازی‌هایی رو که توسط شبکه سیاست در برابر خودش بازی می‌کرد، پیش‌بینی کنه. بعد از آموزش، این شبکه‌ها از جستجوی درختی مونت کارلو با نگاه به جلو استفاده می‌کردن، به این صورت که شبکه سیاست حرکات با احتمال بالا رو شناسایی می‌کرد و شبکه ارزش (به همراه پیمایش‌های مونت کارلو با استفاده از سیاست پیمایش سریع) موقعیت‌های درخت رو ارزیابی می‌کرد.

مقایسه با AlphaGo Zero

در مقابل، AlphaGo Zero بدون استفاده از داده‌های بازی‌های انجام شده توسط انسان آموزش داده شد. به جای اون، خودش داده‌های لازم رو تولید کرد و میلیون‌ها بازی در برابر خودش انجام داد. این سیستم از یک شبکه عصبی استفاده می‌کرد، نه دو شبکه سیاست و ارزش جداگانه. جستجوی درختی ساده‌شده اون بر اساس همین شبکه عصبی برای ارزیابی موقعیت‌ها و نمونه‌برداری از حرکات متکی بود. یه الگوریتم یادگیری تقویتی جدید جستجوی پیش‌نگر رو درون حلقه آموزش گنجاند. AlphaGo Zero از حدود ۱۵ نفر و میلیون‌ها واحد منابع محاسباتی استفاده کرد.

در نهایت، نیاز به قدرت محاسباتی کمتری نسبت به AlphaGo داشت و به جای ۴۸ پردازنده تخصصی هوش مصنوعی (TPUهای گوگل)، با چهار واحد TPU کار می‌کرد. همچنین زمان آموزش کمتری نیاز داشت و بعد از فقط سه روز تونست نسخه قبلی خودش رو شکست بده، در حالی که AlphaGo اصلی ماه‌ها زمان نیاز داشت. به همین ترتیب، AlphaZero هم از طریق بازی با خودش یاد گرفت.

کاربرد MuZero در فشرده‌سازی ویدئو

پژوهشگران MuZero رو برای حل چالش واقعی فشرده‌سازی ویدئو با تعداد بیت‌های مشخص در رابطه با ترافیک اینترنت در سایت‌هایی مثل یوتیوب، توییچ و گوگل میت به کار بردن. هدف MuZero این بود که ویدئو رو به صورت بهینه فشرده کنه تا کیفیت ویدئو حفظ بشه و در عین حال میزان داده کاهش پیدا کنه. نتیجه نهایی استفاده از MuZero کاهش میانگین ۶.۲۸ درصدی در نرخ بیت بود.
AlphaStar

AlphaStar (نرم‌افزار)

در سال 2016، هسابیس به بازی StarCraft به عنوان چالشی برای آینده اشاره کرد، زیرا این بازی نیاز به تفکر استراتژیک و مدیریت اطلاعات ناقص دارد.

در ژانویه 2019، دیپ‌مایند برنامه‌ای به نام AlphaStar معرفی کرد که بازی استراتژی زمان واقعی StarCraft II را بازی می‌کرد. AlphaStar از یادگیری تقویتی بر اساس بازپخش‌های بازیکنان انسانی استفاده کرد و سپس برای بهبود مهارت‌های خود در مقابل خودش بازی کرد. در زمان ارائه، AlphaStar دارای دانشی معادل 200 سال زمان بازی بود. این برنامه توانست در 10 مسابقه متوالی دو بازیکن حرفه‌ای را شکست دهد، اگرچه این مزیت ناعادلانه‌ای داشت که قادر بود کل میدان بازی را ببیند، در حالی که بازیکن انسانی باید دوربین را به صورت دستی حرکت دهد. نسخه ابتدایی که در آن این مزیت اصلاح شده بود، در مسابقه بعدی شکست خورد.

در ژوئیه 2019، AlphaStar شروع به بازی کردن در برابر انسان‌های تصادفی در نردبان چندنفره 1v1 اروپا کرد. برخلاف نسخه اول AlphaStar که فقط به عنوان نژاد Protoss بازی می‌کرد، این نسخه به عنوان تمامی نژادهای بازی بازی می‌کرد و مزیت‌های ناعادلانه‌ای که قبلاً داشت، اصلاح شده بود. تا اکتبر 2019، AlphaStar به سطح Grandmaster در نردبان StarCraft II برای هر سه نژاد StarCraft رسید و تبدیل به اولین AI شد که بدون هیچ محدودیت بازی به لیگ برتر یک ورزش الکترونیک محبوب دست یافت.

ترکیب پروتئین‌ها

 

 مقاله اصلی: الفافولد

در سال 2016، دیپ‌مایند هوش مصنوعی خود را به ترکیب پروتئین‌ها، یک مشکل معمول در زیست‌شناسی مولکولی، معطوف کرد. در دسامبر 2018، الفافولد دیپ‌مایند، با پیش‌بینی دقیق‌ترین ساختار برای ۲۵ از ۴۳ پروتئین، برنده چهاردهمین ارزیابی حیاتی تکنیک‌های پیش‌بینی ساختار پروتئین (CASP) شد.

“این یک پروژه مهم است، اولین سرمایه‌گذاری اصلی ما از نظر افراد و منابع در یک مسئله اساسی، بسیار مهم و واقعی در دنیای واقعی علمی است”، هسابیس به گاردین گفت. در سال 2020، در CASP چهاردهم، پیش‌بینی‌های الفافولد یک امتیاز دقتی کسب کرد که با تکنیک‌های آزمایشگاهی قابل مقایسه است. دکتر اندری کریشتافویچ، یکی از اعضای هیئت داوران علمی، این دستاورد را “بسیار قابل توجه” توصیف کرد و گفت که مسئله پیش‌بینی چگونگی ترکیب پروتئین‌ها به طور “بزرگی حل شده است”.

در ژوئیه 2021، RoseTTAFold و الفافولد۲ به صورت منبع باز منتشر شدند تا به دانشمندان اجازه دهند نسخه‌های خود از ابزارها را اجرا کنند. یک هفته پس از آن، دیپ‌مایند اعلام کرد که الفافولد پیش‌بینی تقریباً همه پروتئین‌های انسان و همچنین کل پروتئوم‌های ۲۰ ارگانیسم مورد مطالعه گستردهٔ دیگر را به پایان رسانده است. ساختارها در پایگاه داده ساختار پروتئین الفافولد منتشر شدند. در ژوئیه 2022، اعلام شد که پیش‌بینی‌های بیش از ۲۰۰ میلیون پروتئین، که تقریباً تمام پروتئین‌های شناخته شده را نمایندگی می‌کنند، در پایگاه داده الفافولد منتشر خواهد شد.

آخرین به‌روزرسانی، الفافولد۳، در مه 2024 منتشر شد و پیش‌بینی تعامل پروتئین‌ها با DNA، RNA و مولکول‌های مختلف را انجام داد. در یک آزمایش مقایسه‌ای خاص درباره مسئله تعامل DNA، دقت الفافولد۳ به ۶۵٪ رسید،

مدل‌های زبانی

در سال ۲۰۱۶، دیپ‌مایند سیستم متن به گفتار WaveNet را معرفی کرد. در ابتدا برای استفاده در محصولات مصرف‌کننده، بسیار محاسباتی بود، اما در اواخر سال ۲۰۱۷ آماده استفاده در برنامه‌های مصرف‌کننده مانند Google Assistant شد. در سال ۲۰۱۸، گوگل محصول تبدیل متن به گفتار تجاری Cloud Text-to-Speech را بر اساس WaveNet معرفی کرد. در سال ۲۰۱۸، دیپ‌مایند مدلی موثرتر به نام WaveRNN را معرفی کرد که به همراه Google AI توسعه یافت. در سال ۲۰۲۰، WaveNetEQ، یک روش پنهان‌سازی از دست دادن بسته‌ها بر اساس معماری WaveRNN، معرفی شد. در سال ۲۰۱۹، گوگل شروع به ارائه WaveRNN با WavenetEQ به کاربران Google Duo کرد.

در مه ۲۰۲۲، Gato مدل چندمنظوره چندرسانه‌ای منتشر شد. این مدل بر روی ۶۰۴ وظیفه، مانند توصیف تصویر، گفتگو یا ساخت بلوک‌ها، آموزش دید. بر روی ۴۵۰ از این وظایف، Gato حداقل نیمی از زمان بهتر از کارشناسان انسانی عمل کرد، به گفته دیپ‌مایند. بر خلاف مدل‌هایی مانند MuZero، Gato نیاز به دوباره آموزش برای تغییر از یک وظیفه به دیگری ندارد.

Sparrow یک چت‌بات قدرتمند هوش مصنوعی است که توسط دیپ‌مایند توسعه یافته است تا با استفاده از ترکیب بازخورد انسانی و پیشنهادات جستجوی گوگل، سیستم‌های یادگیری ماشین ایمن‌تری ایجاد کند.

Chinchilla یک مدل زبانی است که توسط دیپ‌مایند توسعه یافته است.

دیپ‌مایند در تاریخ ۲۸ آوریل ۲۰۲۲ یک مطلب درباره یک مدل زبانی تصویری تک، به نام Flamingo منتشر کرد که توانایی توصیف دقیق یک تصویر را با تنها چند تصویر آموزشی دارد.

AlphaCode

در سال ۲۰۲۲، دیپ‌مایند موتور کدزنی قدرتمندی به نام AlphaCode را معرفی کرد، که برنامه‌های کامپیوتری را با سرعتی مقایسه‌پذیر با یک برنامه‌نویس معمولی ایجاد می‌کند. شرکت این سیستم را در برابر چالش‌های کدنویسی ایجاد شده توسط Codeforces که در رقابت‌های کدنویسی انسانی مورد استفاده قرار می‌گیرد، تست کرد. پس از آموزش بر روی داده‌های GitHub و مسائل و راه‌حل‌های Codeforce، AlphaCode در Codeforces موفق به کسب رتبه‌ای معادل ۵۴٪ از امتیاز میانی شد. این برنامه موظف بود تا راه‌حل منحصربه‌فردی ارائه دهد و از تکرار جواب‌ها جلوگیری شود.

Gemini

Gemini DeepMind
Gemini DeepMind

مقاله اصلی: جمینی (مدل زبان)

جمینی یک مدل زبان بزرگ چندحالته است که در ۶ دسامبر ۲۰۲۳ منتشر شد. (منبع۹۴) این مدل جانشین مدل‌های زبانی LaMDA و PaLM 2 شرکت گوگل بود و هدف از ارائه آن، رقابت با مدل GPT-4 شرکت OpenAI بود. (منبع۹۵) جمینی در سه اندازه Nano، Pro و Ultra عرضه شده است. (منبع۹۶) همچنین جمینی نام چت‌باتی است که از جمینی استفاده می‌کند (و که قبلاً به نام بارد نامیده می‌شد).

Gemma

مقاله اصلی: گما (مدل زبان)

گما یک خانواده از مدل‌های زبان بزرگ، منبع باز و سبک است که در ۲۱ فوریه ۲۰۲۴ منتشر شد. این مدل در دو اندازه متمایز موجود است: یک مدل ۷ میلیارد پارامتری که برای استفاده از GPU و TPU بهینه شده است، و یک مدل ۲ میلیارد پارامتری که برای استفاده از CPU و برنامه‌های روی دستگاه طراحی شده است. مدل‌های گما با استفاده از معماری‌ها، مجموعه داده‌ها و روش‌های آموزش مشابه با خانواده مدل جمینی آموزش داده شده‌اند.

SIMA

در مارس ۲۰۲۴، دیپ‌مایند عامل چندکلمه‌ای قابل دستور دادن مقیاس‌پذیر یا SIMA را معرفی کرد، یک عامل هوش مصنوعی که قادر به درک و پیروی از دستورات زبان طبیعی برای انجام وظایف در محیط‌های مجازی ۳ بعدی مختلف است. با آموزش دیدگاه از نه بازی ویدیویی از هشت استودیو و چهار محیط تحقیقاتی، SIMA قابلیت سازگاری با وظایف و تنظیمات جدید را بدون نیاز به دسترسی به کد منبع بازی یا رابط‌های برنامه‌نویسی (APIs) نشان داد.

این عامل شامل مدل‌های پیش‌آموزش دیدگاه و زبان است که بر روی داده‌های بازی بهینه‌سازی شده‌اند، با زبان مهم برای درک و انجام وظایف داده‌شده به عنوان دستور العمل. هدف تحقیقات دیپ‌مایند از توسعه عوامل هوش مصنوعی مفیدتر با ترجمه قابلیت‌های پیشرفته هوش مصنوعی به اعمال واقعی در جهان واقعی از طریق یک رابط زبانی است.

رباتیک

در ژوئن ۲۰۲۳، روبوکت یک مدل هوش مصنوعی است که می‌تواند دست‌های رباتیک را کنترل کند. این مدل قادر است به مدل‌های جدیدی از دست‌های رباتیک و به انواع جدیدی از وظایف سازگار شود.

ورزش

محققان دیپ‌مایند مدل‌های یادگیری ماشین را به ورزش فوتبال اعمال کرده‌اند، که در آمریکای شمالی به عنوان فوتبال شناخته می‌شود، با مدل‌سازی رفتار بازیکنان فوتبال، از جمله دروازه‌بان، دفاع‌کنندگان و مهاجمان در شرایط مختلفی مانند پنالتی‌ها. محققان از نقشه‌های حرارتی و تجزیه و تحلیل خوشه‌ای استفاده کرده‌اند تا بازیکنان را بر اساس میل آن‌ها به رفتار خاصی در طول بازی در مواجهه با تصمیمی درباره چگونگی گلزنی یا جلوگیری از امتیاز تیم حریف، سازماندهی کنند.

محققان اشاره می‌کنند که مدل‌های یادگیری ماشین می‌توانند برای دموکراتیزه کردن صنعت فوتبال استفاده شوند، با انتخاب خودکار فیلم‌های جذاب بازی که به عنوان نقاط قوت خدمات می‌کند. این امکان از طریق جستجوی ویدیوها برای رویدادهای خاص ممکن است، که این امکان به دلیل تجزیه و تحلیل ویدیو یک زمینه مستقل از یادگیری ماشین است. این همچنین امکان پذیر است به دلیل تجزیه و تحلیل ورزشی گسترده بر اساس داده‌های از جمله گذر‌ها یا شوت‌های حاوی اطلاعات، سنسورهایی که داده‌های مربوط به حرکات بازیکنان را در طول یک بازی چندین بار ثبت می‌کنند و مدل‌های تئوری بازی.

باستان‌شناسی

گوگل یک برنامه جدید باستان‌شناسی را معرفی کرده است که Ithaca نامیده شده و به نام جزیره‌ای یونانی در ادیسه هومر اشاره دارد. این شبکه عصبی عمیق به محققان کمک می‌کند تا متن‌های یونانی آسیب‌دیده را بازسازی کنند و تاریخ و منشأ جغرافیایی آن‌ها را شناسایی کنند. این کار بر پایه شبکه تحلیل متن دیگری است که دیپ‌مایند در سال 2019 با نام Pythia منتشر کرد.

Ithaca در بازسازی متون آسیب‌دیده به دقت ۶۲٪ و در شناسایی مکانی با دقت ۷۱٪ موفق بوده و دقت تاریخ‌گذاری آن ۳۰ سال است. نویسندگان ادعا کردند که استفاده از Ithaca توسط “تاریخ‌نگاران ماهر” دقت کار خود را از ۲۵٪ به ۷۲٪ افزایش داده است. با این حال، الینور دیکی توجه کرد که این آزمون در واقع فقط از دانشجویان تشکیل شده بود و گفت که واضح نیست که Ithaca به “ویراستاران واقعیاً واجد شایستگی” چقدر کمک می‌کند.

تیم در حال کار بر روی گسترش مدل به زبان‌های باستانی دیگر است، از جمله دموتیک، آکادیایی، عبری و مایایی.

DeepMind
DeepMind

علوم مواد

در نوامبر ۲۰۲۳، گوگل دیپ‌مایند اعلام کرد یک شبکه گراف متن‌باز برای اکتشاف مواد (GNoME) را معرفی کرده است. این ابزار میلیون‌ها ماده قبلاً ناشناخته برای شیمی پیشنهاد می‌دهد، از جمله چند صد هزار ساختار بلوری پایدار، از جمله ۷۳۶ ساختار که تا زمان انتشار توسط موسسه فناوری ماساچوست پردازش شده‌اند. با این حال، طبق اظهارات آنتونی چیتام، GNoME “یک مشارکت مفید و عملی برای دانشمندان تجربی مواد نساخته است.” یک مقاله بررسی اثر گذار توسط چیتام و رام سشادری نتوانست هیچ ماده “به شدت جدید” را که توسط GNoME پیدا شده‌باشد، شناسایی کند، با بیشتری از آن‌ها به عنوان تغییرات کوچک از موادی که قبلاً شناخته شده‌اند، معرفی شدند.

ریاضیات

آلفاتنزورAlphaTensor

AlphaTensor
AlphaTensor

در اکتبر ۲۰۲۲، دیپ‌مایند آلفاتنزور را منتشر کرد، که از تکنیک‌های یادگیری تقویتی مشابه آن‌هایی که در آلفاگو استفاده می‌شود، برای پیدا کردن الگوریتم‌های نوآورانه برای ضرب ماتریس استفاده می‌کند. در مورد خاص ضرب دو ماتریس ۴×۴ با مقادیر عددی، جایی که فقط زوج یا فرد بودن مقادیر ثبت می‌شود، آلفاتنزور الگوریتمی را پیدا کرد که فقط ۴۷ ضرب نوعی متمایز را نیاز داشت؛ به عبارت دیگر، بهینه قبلی که از سال ۱۹۶۹ معروف بود، الگوریتم کلی Strassen با استفاده از ۴۹ ضرب بود.

دانشمند رایانه جاش المن آلفاتنزور را “یک اثبات مفهوم برای چیزی که می‌تواند شکستی شود” توصیف کرد، در حالی که واسیلوسکا ویلیامز آن را “یک کم بیش از اندازه” توصیف کرد، با وجود اینکه به عنوان “چیزی کاملاً متفاوت” از روش‌های قبلی تقویت یادگیری تأکید کرد.

آلفاجیومتری

مقاله اصلی: آلفاجیومتری

آلفاجیومتری یک هوش مصنوعی نورو-نمادین است که توانست ۲۵ از ۳۰ مسئله هندسی المپیاد ریاضی بین‌المللی را حل کند، کارایی قابل مقایسه‌ای با دارنده مدال طلایی دارد.

برنامه‌های هندسه سنتی موتورهای نمادین هستند که کاملاً بر روی قوانین انسانی کد شده برای تولید اثبات‌های دقیق تکیه دارند، که باعث می‌شود در شرایط غیرمعمول از انعطاف کمی برخوردار باشند. آلفاجیومتری چنین موتوری نمادین را با یک مدل زبان بزرگ ویژه که بر روی داده‌های سنتی اثبات‌های هندسی آموزش دیده است، ترکیب می‌کند.

زمانی که موتور نمادین نتواند به تنهایی اثباتی رسمی و دقیق پیدا کند، به مدل زبان بزرگ مراجعه می‌کند که یک ساختار هندسی را برای پیشروی پیشنهاد می‌دهد. با این حال، نامشخص است که این روش چقدر قابل اجرا در دامنه‌های دیگری از ریاضی یا استدلال است، زیرا موتورهای نمادین بر روی قوانین خاص حوزه و همچنین نیاز به داده‌های مصنوعی وابسته‌است.
Google اعلام کرده که الگوریتم‌های DeepMind به طور چشمگیری کارایی سردخانه‌های داده خود را افزایش داده‌اند، با تعادل خودکار هزینه‌های خرابی‌های سخت‌افزاری با هزینه‌های خنک کردن. همچنین، DeepMind (همراه با محققان هوش مصنوعی دیگر Alphabet) در پیشنهادهای شخصی‌سازی برنامه‌های Google Play کمک می‌کند.

DeepMind همچنین با تیم اندروید در گوگل برای ایجاد دو ویژگی جدید که برای افرادی با دستگاه‌هایی که سیستم عامل موبایلی گوگل را اجرا می‌کنند، یعنی Android Pie، نصب شدند، همکاری کرده است. این ویژگی‌ها، باتری تطبیقی و روشنایی تطبیقی نامیده می‌شوند، که از یادگیری ماشین برای صرفه‌جویی در انرژی و استفاده آسان‌تر از دستگاه‌هایی که سیستم عامل را اجرا می‌کنند، استفاده می‌کنند. این اولین بار است که DeepMind از این تکنیک‌ها در اندازه‌های آنچنانی استفاده می‌کند، که برنامه‌های یادگیری ماشین معمولاً نیازمند توانایی‌های محاسباتی به مراتب بیشتری هستند.

DeepMind Health

در ژوئیه ۲۰۱۶، همکاری بین DeepMind و بیمارستان چشم‌پزشکی مورفیلدز برای توسعه برنامه‌های هوش مصنوعی در حوزه بهداشت اعلام شد. DeepMind به تجزیه و تحلیل اسکن‌های چشم ناشناس برای جستجوی نشانه‌های زودهنگام بیماری‌هایی که منجر به نابینایی می‌شوند، اعمال می‌شد.

در اوت ۲۰۱۶، برنامه تحقیقاتی با بیمارستان دانشگاه کالج لندن اعلام شد با هدف توسعه الگوریتمی که بتواند به طور خودکار بین بافت‌های سالم و سرطانی در مناطق سر و گردن تفاوت قائل شود.

همچنین پروژه‌هایی با بنیاد موسسان بیمارستان لندن و بنیاد موسسان دانشگاه امپریال لندن برای توسعه برنامه‌های جدید موبایل بالینی مرتبط با سوابق بیمار الکترونیکی در حال انجام است. کارکنان بیمارستان Royal Free گزارش داده‌اند که در دسامبر ۲۰۱۷ دسترسی به داده‌های بیمار از طریق برنامه به صرفه زمان زیادی را صرفه جویی کرده و تاثیر فوق‌العاده‌ای بر مدیریت بیماران با آسیب کلیه ناشی از حادت شده است. داده‌های نتیجه آزمایش به تلفن‌های همراه کارکنان ارسال می‌شود و آنها را به تغییرات در وضعیت بیمار هشدار می‌دهد. همچنین به کارکنان اجازه می‌دهد ببینند که آیا کسی دیگر پاسخ داده است و به بیماران نتایج خود را به صورت تصویری نشان دهند.

در نوامبر ۲۰۱۷، DeepMind اعلام کرد که با مرکز تحقیقات سرطان UK در کالج امپریال لندن همکاری تحقیقاتی دارد با هدف بهبود تشخیص سرطان پستان با استفاده از یادگیری ماشین در ماموگرافی. علاوه بر این، در فوریه ۲۰۱۸، DeepMind اعلام کرد که با وزارت امور امور وترانس آمریکا در تلاش است برای استفاده از یادگیری ماشین برای پیش‌بینی شروع کلیه حاد در بیماران، و همچنین به طور کلی تدهور بیماران در طول بستری در بیمارستان تا دکتران و پرستاران بتوانند به سرعت بیماران نیازمند را درمان کنند.
DeepMind توسعه داد یک برنامه به نام Streams که هشدارها را به پزشکان در مورد بیماران در خطر ابتلا به آسیب کلیه حاد ارسال می‌کند. در ۱۳ نوامبر ۲۰۱۸، DeepMind اعلام کرد که بخش بهداشت و برنامه Streams آن به Google Health جذب خواهد شد.

فعالان حفاظت از حریم خصوصی گفتند که این اعلام خیانت به اعتماد بیماران است و به نظر می‌رسد با اظهارات قبلی DeepMind که داده‌های بیماران به حساب‌ها یا خدمات گوگل متصل نخواهند شد، مغایرت داشته باشد. یک سخنگوی DeepMind گفت که داده‌های بیماران همچنان جدا از خدمات یا پروژه‌های گوگل نگه داشته می‌شود.

NHS data-sharing controversy

DeepMind nhs
DeepMind nhs

در آوریل ۲۰۱۶، New Scientist یک نسخه از توافقنامه به اشتراک گذاری داده بین DeepMind و بنیاد Royal Free London NHS را دریافت کرد. این بنیاد سه بیمارستان در لندن را اداره می‌کند که سالانه حدود ۱.۶ میلیون بیمار در آنها درمان می‌شوند. این توافقنامه نشان می‌دهد که DeepMind Health به داده‌های ورودی، خروجی و انتقال، بخش اورژانس، پاتولوژی و رادیولوژی و مراقبت‌های ویژه در این بیمارستان‌ها دسترسی داشته است. این شامل جزئیات شخصی مانند اینکه آیا بیماران با اچ‌آی‌وی تشخیص داده شده‌اند، از افسردگی رنج می‌برند یا تاکنون عمل سقط جنین انجام داده‌اند بود تا برای انجام تحقیقاتی جهت بهبود نتایج مختلف شرایط بهداشتی استفاده شود.

یک شکایت به دفتر کمیسیونر اطلاعات (ICO) ارسال شد که ادعا می‌کرد داده‌ها باید به صورت شناور و رمزنگاری شوند. در ماه مه ۲۰۱۶، New Scientist مقاله‌ای دیگر منتشر کرد که ادعا می‌کرد که این پروژه موفق به دریافت موافقت از گروه مشاوران مخفیگاهی مؤسسه تنظیم و ارزیابی محصولات پزشکی و درمانی نشده بود.
در سال ۲۰۱۷، کمیسیونر اطلاعات (ICO) پس از یک بررسی یک‌ساله که بر روی این متمرکز بود که چگونه بنیاد Royal Free NHS اپلیکیشن Streams را در اواخر سال‌های ۲۰۱۵ و ۲۰۱۶ آزمایش کرده است، به نتیجه رسید. کمیسیونر اطلاعات یافت که بنیاد Royal Free در ارائه جزئیات بیمار به DeepMind مغایرت با قانون حفاظت از داده‌ها داشت و چندین نقص در روش برخورد با داده‌ها را یافت، از جمله اینکه بیماران به طور کافی مطلع نشده بودند که داده‌هایشان به عنوان بخشی از آزمایش استفاده خواهد شد.

DeepMind در ژوئیه ۲۰۱۷ نظرات خود را درباره بررسی[۱۳۳] منتشر کرد و گفت “ما باید بهتر عمل کنیم” و برخی فعالیت‌ها و فعالیت‌هایی را که برای شفافیت، نظارت و مشارکت آغاز کرده بودند، روشن کرد. این شامل توسعه یک استراتژی مشارکت بیمار و عمومی[۱۳۴] و شفافیت در شراکت‌های خود بود.

در ماه مه ۲۰۱۷، شبکه اسکای خبری یک نامه درز شده از ناظر داده‌های ملی، خانم فیونا کالدیکوت، منتشر کرد که نشان می‌دهد که به “نظر دقیق من” توافقنامه به اشتراک گذاری داده بین DeepMind و Royal Free بر روی یک “پایه قانونی نامناسب” انجام شده است. [۱۳۵] کمیسیونر اطلاعات در ژوئیه ۲۰۱۷ حکم داد که بیمارستان Royal Free برای پایبندی به قانون حفاظت از داده‌ها هنگام ارائه داده‌های شخصی ۱.۶ میلیون بیمار به DeepMind، شکست خورده‌است.

اخلاق و جامعه DeepMind

در اکتبر ۲۰۱۷، DeepMind اعلام کرد که یک واحد تحقیقاتی جدید به نام اخلاق و جامعه DeepMind تأسیس کرده است. هدف آن تأمین مالی برای تحقیقات خارجی در موضوعات زیر است: حریم خصوصی، شفافیت و عدالت؛ تأثیرات اقتصادی؛ حکومت و مسئولیت؛ مدیریت ریسک هوش مصنوعی؛ اخلاق و ارزش‌های هوش مصنوعی؛ و نحوه اینکه هوش مصنوعی می‌تواند چالش‌های جهان را حل کند. به عنوان نتیجه، این تیم امیدوار است که درک بیشتری از پیامدهای اخلاقی هوش مصنوعی بدست آورد و به جامعه کمک کند تا ببیند که هوش مصنوعی چگونه می‌تواند مفید باشد.

این زیربخش جدید از DeepMind به طور کاملاً جدا از همکاری شرکت‌های معروفی است که از هوش مصنوعی استفاده می‌کنند، همچون دانشگاه‌ها، سازمان‌های جامعه مدنی و موسسات غیرانتفاعی در پارتنرشیپ در مورد هوش مصنوعی برای بهره‌مندی از مردم و جامعه که DeepMind هم جزء آن است، است.

هیئت اخلاق و جامعه DeepMind نیز از هیئت اخلاقی هوش مصنوعی متمایز است که گوگل ابتدا در موقعیت خرید DeepMind به تشکیل آن پذیرفته بود.

منبع:لینک

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا