تکنولوژی

۲۰ ثانیه تفکر، به اندازه ۱۰۰,۰۰۰ برابر داده ارزش دارد

نواَم براون، یکی از پژوهشگران ارشد در OpenAI، روز سه‌شنبه در کنفرانس TED AI در سان‌فرانسیسکو به صحنه آمد تا سخنرانی قدرتمندی درباره آینده هوش مصنوعی ارائه دهد، با تمرکز ویژه بر مدل جدید OpenAI به نام o1 و پتانسیل آن برای تحول صنایع از طریق استدلال راهبردی، کدنویسی پیشرفته و تحقیقات علمی. براون، که پیش از این در پیشرفت‌هایی همچون سیستم‌های هوش مصنوعی مانند Libratus (هوش مصنوعی بازی پوکر) و CICERO (که در بازی دیپلماسی به تسلط رسید) نقش کلیدی داشت، اکنون آینده‌ای را پیش‌بینی می‌کند که در آن هوش مصنوعی نه تنها به عنوان یک ابزار، بلکه به عنوان موتور اصلی نوآوری و تصمیم‌گیری در بخش‌های مختلف عمل می‌کند.

براون سخنرانی خود را با این جملات آغاز کرد: “پیشرفت‌های شگرف در هوش مصنوعی طی پنج سال گذشته را می‌توان در یک کلمه خلاصه کرد: مقیاس.” او خطاب به جمعیت حاضر که شامل توسعه‌دهندگان، سرمایه‌گذاران و رهبران صنعت بودند، ادامه داد: “بله، پیشرفت‌های بسیاری صورت گرفته است، اما مدل‌های پیشرو امروز همچنان بر اساس همان معماری ترانسفورمر هستند که در سال ۲۰۱۷ معرفی شد. تفاوت اصلی در مقیاس داده‌ها و محاسباتی است که در آن‌ها به کار می‌رود.”

براون، که یکی از چهره‌های اصلی تحقیقات OpenAI است، تأکید کرد که در حالی که گسترش مدل‌ها عامل مهمی در پیشرفت هوش مصنوعی بوده، اکنون زمان یک تغییر پارادایم رسیده است. او به نیاز هوش مصنوعی برای فراتر رفتن از پردازش صرف داده‌ها و ورود به آنچه که او “تفکر سیستم دوم” نامید اشاره کرد—شکلی آهسته‌تر و متفکرانه‌تر از استدلال که به روش‌های حل مسائل پیچیده توسط انسان‌ها شبیه است.

مقایسه ارزش فکر کردن و هوش مصنوعی

روان‌شناسی پشت جهش بزرگ بعدی هوش مصنوعی: درک تفکر سیستم دو

برای تأکید بر این نکته، براون داستانی از دوران دکتری خود را به اشتراک گذاشت، زمانی که بر روی Libratus، هوش مصنوعی بازی پوکر که به طور مشهور در سال ۲۰۱۷ بهترین بازیکنان انسانی را شکست داد، کار می‌کرد.

براون گفت: “معلوم شد که اجازه دادن به یک ربات برای فکر کردن به مدت ۲۰ ثانیه در یک دست پوکر، به همان اندازه عملکرد را بهبود می‌بخشد که افزایش مقیاس مدل به اندازه ۱۰۰,۰۰۰ برابر و آموزش آن به مدت ۱۰۰,۰۰۰ برابر بیشتر.” او ادامه داد: “زمانی که این نتیجه را به دست آوردم، واقعاً فکر کردم که یک باگ است. در طول سه سال اول دوره دکتری‌ام، توانسته بودم این مدل‌ها را ۱۰۰ برابر گسترش دهم. به این کار افتخار می‌کردم. چندین مقاله نوشته بودم که چگونه این گسترش را انجام دهم، اما خیلی زود فهمیدم که همه آن‌ها در مقایسه با این افزایش مقیاس تفکر سیستم دو یک پاورقی خواهند بود.”

ارائه براون، تفکر سیستم دو را به عنوان راه‌حلی برای محدودیت‌های گسترش سنتی معرفی کرد. این مفهوم که توسط روان‌شناس دانیل کانمن در کتاب “تفکر، سریع و کند” مشهور شده است، به شیوه‌ای آهسته‌تر و متفکرانه‌تر از تفکر اشاره دارد که انسان‌ها برای حل مسائل پیچیده از آن استفاده می‌کنند. براون معتقد است که گنجاندن این رویکرد در مدل‌های هوش مصنوعی می‌تواند منجر به افزایش عملکرد چشم‌گیری بدون نیاز به داده‌ها یا قدرت محاسباتی به طور نمایی بیشتر شود.

او خاطرنشان کرد که اجازه دادن به Libratus برای فکر کردن به مدت ۲۰ ثانیه قبل از تصمیم‌گیری تأثیر عمیقی داشت و آن را معادل با افزایش مقیاس مدل به ۱۰۰,۰۰۰ برابر دانست. براون گفت: “نتایج من را شگفت‌زده کرد”، و توضیح داد که چگونه کسب‌وکارها می‌توانند با تمرکز بر تفکر سیستم دو، نتایج بهتری را با منابع کمتری به دست آورند.

درون مدل o1 OpenAI: مدل انقلابی که زمان برای تفکر می‌گیرد

سخنرانی براون بلافاصله پس از انتشار مدل‌های سری o1 OpenAI انجام شد، که تفکر سیستم دو را به هوش مصنوعی معرفی می‌کند. این مدل‌ها که در سپتامبر ۲۰۲۴ راه‌اندازی شدند، طراحی شده‌اند تا اطلاعات را با دقت بیشتری نسبت به مدل‌های قبلی پردازش کنند و بنابراین برای وظایف پیچیده در زمینه‌هایی مانند تحقیقات علمی، کدنویسی و تصمیم‌گیری استراتژیک ایده‌آل هستند.

براون توضیح داد: “ما دیگر محدود به فقط گسترش آموزش سیستم یک نیستیم. اکنون می‌توانیم تفکر سیستم دو را نیز گسترش دهیم و نکته جالب در گسترش در این جهت این است که عمدتاً نادیده گرفته شده است.” او افزود: “این انقلابی نیست که ۱۰ سال دیگر یا حتی ۲ سال دیگر اتفاق بیفتد. این انقلابی است که اکنون در حال رخ دادن است.”

مدل‌های o1 در benchmark‌های مختلف عملکرد قوی‌ای را نشان داده‌اند. به عنوان مثال، در یک آزمون مقدماتی المپیاد ریاضی بین‌المللی، مدل o1 توانست ۸۳ درصد دقت را به دست آورد—پرش چشمگیری از ۱۳ درصدی که مدل GPT-4o OpenAI کسب کرده بود. براون تأکید کرد که توانایی استدلال در برابر فرمول‌های ریاضی پیچیده و داده‌های علمی، مدل o1 را به ویژه برای صنایعی که به تصمیم‌گیری مبتنی بر داده وابسته‌اند، ارزشمند می‌سازد.

•   مدل هوش مصنوعی جدید شرکت آنتروپیک (Anthropic) می‌تواند رایانه شما را کنترل کند.

دلیل تجاری برای هوش مصنوعی کندتر: چرا صبر در راه‌حل‌های شرکتی به نفع شماست

برای کسب‌وکارها، مدل o1 OpenAI مزایایی فراتر از عملکرد علمی ارائه می‌دهد. براون تأکید کرد که گسترش تفکر سیستم دو می‌تواند فرآیندهای تصمیم‌گیری را در صنایعی مانند بهداشت و درمان، انرژی و مالی بهبود بخشد. او از درمان سرطان به عنوان مثال استفاده کرد و از حاضران پرسید: “دست خود را بالا ببرید اگر مایلید بیش از ۱ دلار برای درمان جدید سرطان پرداخت کنید… چطور با ۱,۰۰۰ دلار؟ چطور با یک میلیون دلار؟”

براون پیشنهاد کرد که مدل o1 می‌تواند به محققان در سرعت بخشیدن به جمع‌آوری و تحلیل داده‌ها کمک کند و به آن‌ها این امکان را بدهد که بیشتر بر روی تفسیر نتایج و تولید فرضیه‌های جدید تمرکز کنند. در حوزه انرژی، او اشاره کرد که این مدل می‌تواند توسعه پنل‌های خورشیدی کارآمدتر را تسریع کند و ممکن است به پیشرفت‌هایی در انرژی‌های تجدیدپذیر منجر شود.

او به تردیدها در مورد مدل‌های هوش مصنوعی کندتر اشاره کرد و گفت: “وقتی این موضوع را به مردم می‌گویم، یک پاسخ رایج این است که ممکن است افراد مایل نباشند چند دقیقه برای دریافت پاسخ صبر کنند، یا چند دلار برای پاسخ به یک سوال پرداخت کنند.” اما او استدلال کرد که برای مهم‌ترین مسائل، این هزینه به خوبی ارزشش را دارد.

مقایسه ارزش فکر کردن و هوش مصنوعی

رقابت جدید هوش مصنوعی در سیلیکون ولی: چرا قدرت پردازش همه چیز نیست

تغییر جهت OpenAI به سمت تفکر سیستم دو می‌تواند چشم‌انداز رقابتی هوش مصنوعی را به ویژه در کاربردهای تجاری دگرگون کند. در حالی که اکثر مدل‌های کنونی برای سرعت بهینه‌سازی شده‌اند، فرآیند استدلال دقیق مدل o1 می‌تواند برای کسب‌وکارها بینش‌های دقیق‌تری ارائه دهد، به خصوص در صنایعی مانند مالی و بهداشت و درمان.

در بخش فناوری، جایی که شرکت‌هایی مانند گوگل و متا سرمایه‌گذاری‌های سنگینی در هوش مصنوعی انجام می‌دهند، تمرکز OpenAI بر استدلال عمیق، این شرکت را متمایز می‌کند. برای مثال، مدل هوش مصنوعی گوگل به نام Gemini برای وظایف چندوجهی بهینه‌سازی شده است، اما هنوز مشخص نیست که این مدل در مقایسه با مدل‌های OpenAI از نظر قابلیت‌های حل مسئله چگونه عمل خواهد کرد.

با این حال، هزینه اجرای مدل o1 ممکن است مانع از پذیرش گسترده آن شود. این مدل نسبت به نسخه‌های قبلی کندتر و گران‌تر است. گزارش‌ها نشان می‌دهند که مدل پیش‌نمایش o1 برای هر یک میلیون توکن ورودی ۱۵ دلار و برای هر یک میلیون توکن خروجی ۶۰ دلار هزینه دارد، که بسیار بیشتر از GPT-4o است. با این وجود، برای کسب‌وکارهایی که به خروجی‌های با دقت بالا نیاز دارند، ممکن است این سرمایه‌گذاری ارزشمند باشد.

براون در پایان سخنرانی خود تأکید کرد که توسعه هوش مصنوعی در یک نقطه حساس قرار دارد: «اکنون ما یک پارامتر جدید داریم، پارامتری که می‌توانیم تفکر سیستم دو را نیز مقیاس دهیم — و ما فقط در آغاز مقیاس‌دهی در این جهت هستیم.»

منبع
venturebeat.com

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا