۲۰ ثانیه تفکر، به اندازه ۱۰۰,۰۰۰ برابر داده ارزش دارد
نواَم براون، یکی از پژوهشگران ارشد در OpenAI، روز سهشنبه در کنفرانس TED AI در سانفرانسیسکو به صحنه آمد تا سخنرانی قدرتمندی درباره آینده هوش مصنوعی ارائه دهد، با تمرکز ویژه بر مدل جدید OpenAI به نام o1 و پتانسیل آن برای تحول صنایع از طریق استدلال راهبردی، کدنویسی پیشرفته و تحقیقات علمی. براون، که پیش از این در پیشرفتهایی همچون سیستمهای هوش مصنوعی مانند Libratus (هوش مصنوعی بازی پوکر) و CICERO (که در بازی دیپلماسی به تسلط رسید) نقش کلیدی داشت، اکنون آیندهای را پیشبینی میکند که در آن هوش مصنوعی نه تنها به عنوان یک ابزار، بلکه به عنوان موتور اصلی نوآوری و تصمیمگیری در بخشهای مختلف عمل میکند.
براون سخنرانی خود را با این جملات آغاز کرد: “پیشرفتهای شگرف در هوش مصنوعی طی پنج سال گذشته را میتوان در یک کلمه خلاصه کرد: مقیاس.” او خطاب به جمعیت حاضر که شامل توسعهدهندگان، سرمایهگذاران و رهبران صنعت بودند، ادامه داد: “بله، پیشرفتهای بسیاری صورت گرفته است، اما مدلهای پیشرو امروز همچنان بر اساس همان معماری ترانسفورمر هستند که در سال ۲۰۱۷ معرفی شد. تفاوت اصلی در مقیاس دادهها و محاسباتی است که در آنها به کار میرود.”
براون، که یکی از چهرههای اصلی تحقیقات OpenAI است، تأکید کرد که در حالی که گسترش مدلها عامل مهمی در پیشرفت هوش مصنوعی بوده، اکنون زمان یک تغییر پارادایم رسیده است. او به نیاز هوش مصنوعی برای فراتر رفتن از پردازش صرف دادهها و ورود به آنچه که او “تفکر سیستم دوم” نامید اشاره کرد—شکلی آهستهتر و متفکرانهتر از استدلال که به روشهای حل مسائل پیچیده توسط انسانها شبیه است.
روانشناسی پشت جهش بزرگ بعدی هوش مصنوعی: درک تفکر سیستم دو
برای تأکید بر این نکته، براون داستانی از دوران دکتری خود را به اشتراک گذاشت، زمانی که بر روی Libratus، هوش مصنوعی بازی پوکر که به طور مشهور در سال ۲۰۱۷ بهترین بازیکنان انسانی را شکست داد، کار میکرد.
براون گفت: “معلوم شد که اجازه دادن به یک ربات برای فکر کردن به مدت ۲۰ ثانیه در یک دست پوکر، به همان اندازه عملکرد را بهبود میبخشد که افزایش مقیاس مدل به اندازه ۱۰۰,۰۰۰ برابر و آموزش آن به مدت ۱۰۰,۰۰۰ برابر بیشتر.” او ادامه داد: “زمانی که این نتیجه را به دست آوردم، واقعاً فکر کردم که یک باگ است. در طول سه سال اول دوره دکتریام، توانسته بودم این مدلها را ۱۰۰ برابر گسترش دهم. به این کار افتخار میکردم. چندین مقاله نوشته بودم که چگونه این گسترش را انجام دهم، اما خیلی زود فهمیدم که همه آنها در مقایسه با این افزایش مقیاس تفکر سیستم دو یک پاورقی خواهند بود.”
ارائه براون، تفکر سیستم دو را به عنوان راهحلی برای محدودیتهای گسترش سنتی معرفی کرد. این مفهوم که توسط روانشناس دانیل کانمن در کتاب “تفکر، سریع و کند” مشهور شده است، به شیوهای آهستهتر و متفکرانهتر از تفکر اشاره دارد که انسانها برای حل مسائل پیچیده از آن استفاده میکنند. براون معتقد است که گنجاندن این رویکرد در مدلهای هوش مصنوعی میتواند منجر به افزایش عملکرد چشمگیری بدون نیاز به دادهها یا قدرت محاسباتی به طور نمایی بیشتر شود.
او خاطرنشان کرد که اجازه دادن به Libratus برای فکر کردن به مدت ۲۰ ثانیه قبل از تصمیمگیری تأثیر عمیقی داشت و آن را معادل با افزایش مقیاس مدل به ۱۰۰,۰۰۰ برابر دانست. براون گفت: “نتایج من را شگفتزده کرد”، و توضیح داد که چگونه کسبوکارها میتوانند با تمرکز بر تفکر سیستم دو، نتایج بهتری را با منابع کمتری به دست آورند.
درون مدل o1 OpenAI: مدل انقلابی که زمان برای تفکر میگیرد
سخنرانی براون بلافاصله پس از انتشار مدلهای سری o1 OpenAI انجام شد، که تفکر سیستم دو را به هوش مصنوعی معرفی میکند. این مدلها که در سپتامبر ۲۰۲۴ راهاندازی شدند، طراحی شدهاند تا اطلاعات را با دقت بیشتری نسبت به مدلهای قبلی پردازش کنند و بنابراین برای وظایف پیچیده در زمینههایی مانند تحقیقات علمی، کدنویسی و تصمیمگیری استراتژیک ایدهآل هستند.
براون توضیح داد: “ما دیگر محدود به فقط گسترش آموزش سیستم یک نیستیم. اکنون میتوانیم تفکر سیستم دو را نیز گسترش دهیم و نکته جالب در گسترش در این جهت این است که عمدتاً نادیده گرفته شده است.” او افزود: “این انقلابی نیست که ۱۰ سال دیگر یا حتی ۲ سال دیگر اتفاق بیفتد. این انقلابی است که اکنون در حال رخ دادن است.”
مدلهای o1 در benchmarkهای مختلف عملکرد قویای را نشان دادهاند. به عنوان مثال، در یک آزمون مقدماتی المپیاد ریاضی بینالمللی، مدل o1 توانست ۸۳ درصد دقت را به دست آورد—پرش چشمگیری از ۱۳ درصدی که مدل GPT-4o OpenAI کسب کرده بود. براون تأکید کرد که توانایی استدلال در برابر فرمولهای ریاضی پیچیده و دادههای علمی، مدل o1 را به ویژه برای صنایعی که به تصمیمگیری مبتنی بر داده وابستهاند، ارزشمند میسازد.
• مدل هوش مصنوعی جدید شرکت آنتروپیک (Anthropic) میتواند رایانه شما را کنترل کند.
دلیل تجاری برای هوش مصنوعی کندتر: چرا صبر در راهحلهای شرکتی به نفع شماست
برای کسبوکارها، مدل o1 OpenAI مزایایی فراتر از عملکرد علمی ارائه میدهد. براون تأکید کرد که گسترش تفکر سیستم دو میتواند فرآیندهای تصمیمگیری را در صنایعی مانند بهداشت و درمان، انرژی و مالی بهبود بخشد. او از درمان سرطان به عنوان مثال استفاده کرد و از حاضران پرسید: “دست خود را بالا ببرید اگر مایلید بیش از ۱ دلار برای درمان جدید سرطان پرداخت کنید… چطور با ۱,۰۰۰ دلار؟ چطور با یک میلیون دلار؟”
براون پیشنهاد کرد که مدل o1 میتواند به محققان در سرعت بخشیدن به جمعآوری و تحلیل دادهها کمک کند و به آنها این امکان را بدهد که بیشتر بر روی تفسیر نتایج و تولید فرضیههای جدید تمرکز کنند. در حوزه انرژی، او اشاره کرد که این مدل میتواند توسعه پنلهای خورشیدی کارآمدتر را تسریع کند و ممکن است به پیشرفتهایی در انرژیهای تجدیدپذیر منجر شود.
او به تردیدها در مورد مدلهای هوش مصنوعی کندتر اشاره کرد و گفت: “وقتی این موضوع را به مردم میگویم، یک پاسخ رایج این است که ممکن است افراد مایل نباشند چند دقیقه برای دریافت پاسخ صبر کنند، یا چند دلار برای پاسخ به یک سوال پرداخت کنند.” اما او استدلال کرد که برای مهمترین مسائل، این هزینه به خوبی ارزشش را دارد.
رقابت جدید هوش مصنوعی در سیلیکون ولی: چرا قدرت پردازش همه چیز نیست
تغییر جهت OpenAI به سمت تفکر سیستم دو میتواند چشمانداز رقابتی هوش مصنوعی را به ویژه در کاربردهای تجاری دگرگون کند. در حالی که اکثر مدلهای کنونی برای سرعت بهینهسازی شدهاند، فرآیند استدلال دقیق مدل o1 میتواند برای کسبوکارها بینشهای دقیقتری ارائه دهد، به خصوص در صنایعی مانند مالی و بهداشت و درمان.
در بخش فناوری، جایی که شرکتهایی مانند گوگل و متا سرمایهگذاریهای سنگینی در هوش مصنوعی انجام میدهند، تمرکز OpenAI بر استدلال عمیق، این شرکت را متمایز میکند. برای مثال، مدل هوش مصنوعی گوگل به نام Gemini برای وظایف چندوجهی بهینهسازی شده است، اما هنوز مشخص نیست که این مدل در مقایسه با مدلهای OpenAI از نظر قابلیتهای حل مسئله چگونه عمل خواهد کرد.
با این حال، هزینه اجرای مدل o1 ممکن است مانع از پذیرش گسترده آن شود. این مدل نسبت به نسخههای قبلی کندتر و گرانتر است. گزارشها نشان میدهند که مدل پیشنمایش o1 برای هر یک میلیون توکن ورودی ۱۵ دلار و برای هر یک میلیون توکن خروجی ۶۰ دلار هزینه دارد، که بسیار بیشتر از GPT-4o است. با این وجود، برای کسبوکارهایی که به خروجیهای با دقت بالا نیاز دارند، ممکن است این سرمایهگذاری ارزشمند باشد.
براون در پایان سخنرانی خود تأکید کرد که توسعه هوش مصنوعی در یک نقطه حساس قرار دارد: «اکنون ما یک پارامتر جدید داریم، پارامتری که میتوانیم تفکر سیستم دو را نیز مقیاس دهیم — و ما فقط در آغاز مقیاسدهی در این جهت هستیم.»
1 دیدگاه