آیا چتجیپیتی میتواند بازی بسازد؟
با اسکرول در توییتر و پرسه زدن در محافل مربوط به هوش مصنوعی در ماههای اخیر، با ادعاهای گندهای روبهرو شدم. چند روز بعد از اینکه OpenAI از مدل هوش مصنوعی جیپیتی ۴ خود پرده داشت، این ادعاها آتششان تندتر شد — در رشته توییتهای مختلف پشت سر هم ملتْ ادعا میکنند چت جیپیتی میتواند بازی بسازد. هوش مصنوعیای چنان پیشرفته که بتواند خودش یک بازی را برنامهنویسی کند و مردم هم بازیاش کنند یا یک سناریوی علمی تخیلی است یا مال آیندهای خیلی دور. اما در واقع، بازیسازان و مشتاقان آن همین الانش هم مدتهاست که همیشه از هوش مصنوعی در بازیهایشان استفاده میکنند.
توسعهدهندگان و دوستداران هوش مصنوعی تاکنون از چت جیپیتی برای بازسازی بازیهای کلاسیکی مثل Pong، Tetris و Snake استفاده کردهاند. همچنین، یا برای کدنویسی بازیهایشان یا تولید دیالوگ و ایدههای داستانی برای نقشآفرینیهای متنمحور استفاده کردهاند. برای ترکیب همهی اینها با هم، اخیرا کسی از این هوش مصنوعی درخواست کرده تا بازی Pokemon Emerald که برای گیم بوی ادونس منتشر شده بود را به یک بازی ادونچر متنی تبدیل کند. برخی از استودیوهای بازیسازی طراز اول/AAA هم دنبال راههایی میگردند تا این ابزار پیشرفته را در بازیشان ادغام کند تا در بازیهایشان دیالوگ کاراکترها را بدون دخالت انسان بنویسد.
برای برخی، تاثیر چت جیپیتی آنقدری بزرگ هست که بتواند چهرهی جهان را تغییر دهد؛ عدهای اما از این بابت چندان مطمئن نیستند، به زیربنای قضیه نگاه میکنند و برایشان میزان تواناییهای این تکنولوژی جای سوال دارد. چتباتها و هوش مصنوعیها مدت زیادی است که حضور دارند، و شکی نیست که نمونهی اخیر ساختهی OpenAI هم مهم است. اما تاثیر واقعیاش فعلا معلوم نیست و باید صبر کرد و دید، علیرغم اینکه هیاهو و سروصداها پیرامون آن در اخبار و شبکههای اجتماعی فراوان است. بیایید یک قدم عقب برداشته و قضیه را بشکافیم و ببینیم این تکنولوژی چگونه کار میکند، تا به فهم خود چت جیپیتی برسیم و اینکه در حال حاضر — و آینده — چگونه از آن در بازیهای ویدئویی استفاده میشود و خواهد شد.
چتجیپیتی چیست؟
چتجیپیتی یک چتبات متصل به هوش مصنوعی است که توسط OpenAI در نوامبر ۲۰۲۲ منتشر شد. نسخهی کاربرپسندتر همان جیپیتی است، که سازندگانش اسمش را گذاشته بودند «مدل بزرگ چندوجهی»/Large Multimodal Model گذاشته بودند. جیپیتی، در چهارمین نسخهی خود (جیپیتی ۴)، الگوهای درون دادهها را پیدا کرده و سپس آن را در قالب یک زبان طبیعی یا کد بیان میکند؛ آن بخش «چندوجهی» هم منظورش این است که جیپیتی ۴ میتواند متون، اصوات، تصاویر و غیره را درک کند. (هوش مصنوعیهای قدیمی تنها یک نوع داده را میتوانستند درک کنند). چت جیپیتی از این نظر پیشگام است چون نه تنها از حجم عظیم دادههایی که واردش میشود، بلکه از واکنشی هم که کاربر انسانی به او دارد، میآموزد. بنابراین، طبق گفتهی خود سازندگانش «با معیارهای حرفهای و آکادمیک که بسنجیم، عملکرد آن مشابه انسانهاست.» البته همین سازندگان متفقالقولاند که جیپیتی ۴ «در خیلی از سناریوهای دنیای واقعی قابلیتشان ضعیفتر از انسان است.»
میتوانید در مرورگرتان به رایگان به چت جیپیتی وصل شوید، اما مدل جدید آن یعنی جیپیتی ۴ تنها برای مشتریانی که حاضرند ماهی ۲۰ دلار بپردازند قابل دسترس است. در پایین وبسایت کادری هست که میتوانید متن را واردش کنید. مثلا اگر میخواهید چت جیپیتی برایتان پایان سریال بازی تاج و تخت را بازنویسی کند، آنجا همان کادری است که باید درخواست خود را ثبت کنید. یا، اگر میخواهید برای شما یک موضوع پیچیده را شرح دهید، باز هم میتوانید از همان کادر استفاده کنید.
از چت جیپیتی پرسیدم نحوهی کارش چگونه است و این متن را تولید کرد:
چت جیپیتی یک مدل زبانی گسترده است که از معماری شبکههای نورونی به نام جیپیتی ۳.۵ (مخفف مبدل مولدهای از پیش آموزش دیده/Generative Pre-trained Transformer) استفاده میکند. این مدل از قبل بر اساس حجم عظیمی از دادههای متنی آموزش دیده است، بنابراین میتواند زبانهای طبیعی را درک کرده و بر اساس آنها متن تولید کند.
تمرین دیدن بر اساس دادهها شامل طیف وسیعی از منابع میشد؛ صفحات وب، کتابها، و مقالات. در طول تمرین، این مدل میآموزد بر اساس مجموعه کلمات موجود از قبل در جمله، کلمهی مناسب بعدی برای جمله را پیشبینی کند. به این فرآیند مدلسازی زبان میگویند.
وقتی مدل تمرین دید، میتوان آن را برای وظیفهی مشخصی تنظیم کرد، مثل جواب دادن به سوالات یا تولید متن جدید. در طول تنظیم، مدل میآموزد تنها روی مجموعهی محدودتر و تخصصیتری از دادهها که به آن وظیفه ربط دارند تمرکز کند، و اینگونه به نکتههای ظریف آن حیطه هم پی میبرد و یاد میگیرد.
وقتی کاربری با چت جیپیتی تعامل برقرار میکند، مدلْ ورودی کاربر را پردازش کرده و جوابی تولید میکند، که بر اساس فهم آن از زبان و وظیفهای است که برایش تمرین دیده. این مدل طوری طراحی شده تا جوابهایی تولید کند که منسجم هستند و به آنچه کاربر خواسته مربوطند، و میتواند در سبک و لحنهای مختلف دیگری هم تولید متن انجام دهد.
در کل، چت جیپیتی با اعمال نفوذ بر تواناییهای دیپلرنینگ قادر به فهم و تولید زبان طبیعی میشود، و بنابراین برای وظایف مربوط به زبان و طیف وسیعی از آنها ابزار قدرتمندی است.
اگر جوابی که چت جیپیتی بهتان میدهد مفهوم نیست یا میخواهید کمی در جوابش تغییر ایجاد کنید، میتوانید بعد از اینکه جواب اول را ارسال کرد دوباره همان سوال را وارد کنید. چت جیپیتی آنچه قبلا نوشته بود را به «یاد» دارد. در تلاش دوم، از جت چیپیتی خواستم خودش را در یک پاراگراف برای من طوری توضیح دهد که گویی برای یک بچهی پنج ساله توضیح میدهد. و این متنی است که تولید کرد:
چت جیپیتی یک برنامهی هوشمند کامپیوتریه که میتونه باهات طوری صحبت کنه که انگار یه انسان داره حرف میزنه! از چیزی به نام «ماشین لرنینگ» استفاده میکنه، به این معنی که میتونه با نگاه به کلی و کلی کلمه و جمله اونها رو یاد بگیره. سپس از همهی اطلاعاتی که جمع کرده استفاده میکنه تا متوجه بشه حرف شما چیه و نسبت به اون جواب بده. یه جورایی شبیه وقتیه که با گوش دادن به خانواده یا معلمها یاد میگیرید، با این فرق که چت جیپیتی با خوندن کلی کتاب و مقاله اینها رو یاد گرفته. پس وقتی از چت جیپیتی سوال میکنید، سعی میکنه بر اساس چیزهایی که یاد گرفته بهترین جواب رو بده!
آن سوی دیگر جوابهای چت جیپیتی این است که امکان دارد این هوش مصنوعی جوابهای نادرستی تولید کند، که به قول OpenAI یعنی «دستورالعملهای آسیبزا یا محتوایی که سوگیری دارد» ارائه دهد. و همهی آنچه از رویدادهای دنیا میداند هم تا سال ۲۰۲۱ است چون دادههای سالهای آینده وارد این هوش مصنوعی نشده است.
اگر میخواهید با چتجیپیتی بازی بسازید، فرآیندش فرقی با چیزی که توصیفش رفت ندارد: در کادر درخواستتان را مینویسید و چت جیپیتی هم بهتان جواب میدهد.
آیا چتجیپیتی و هوش مصنوعی میتوانند واقعا بازی بسازند؟
چتجیپیتی میتواند برای یک بازی ویدئویی کد بنویسد، اما خود آن بازی را نمیتوان در چتجیپیتی اجرا کرد. برای مثال، عمار رشی/Ammaar Reshi، از دوستداران پروپاقرص هوش مصنوعی، با کمک جیپیتی ۴ کدی برای بازی Snake تولید کرد. دقیقتر بگوییم، رشی از هوش مصنوعی خواست کدهایی به زبان HTML، CSS و جاوااسکریپت که برای اجرای این بازی نیاز هستند را بنویسد. چتبات هم همه را نوشت و رشی فقط کافی بود آنها را در برنامهی لازم کپی کرده و اجرایش کند. رشی گفت بازی آنطوری که لازم بود کار نمیکرد، اما چتجیپیتی در جوابهای بعدیاش بر کدها تغییر اعمال کرد (به اضافهی توضیحات و دلایل) و اینگونه مشکل حل شد.
او بعدا از این مدل برای تولید کدهای ورژنی از بازی SkyRoads که در سال ۱۹۹۳ منتشر شده بود استفاده کرد. مشابها، ژاوی لوپز/Javi Lopez، یکی دیگر از علاقهمندان هوش مصنوعی، با کمک چتجیپیتی توانست کدی برای اجرای دووم به دست بیاورد (البته فقط در حد اجرا، نه در حد اینکه بتوان کامل آن را بازی کرد).
چتجیپیتی لزوما خود بازی را نمیسازد، بلکه کدی که برای ساخت آن لازم است را مینویسد. این بازیها البته در مقایسه با بازیهای مدرن کدهای نسبتا ساده و کوتاهی دارد، اما هنوز هم بازی ویدئویی حساب میشوند. وقتی از چتجیپیتی میخواهید کد فلان بازیای که همین الان هم موجود است را بنویسد باید به یاد داشته باشید که چتجیپیتی با آن بازی آشنایی داشته باشد [و هر بازی گمنام و ناآشنایی را نمیتوان با این هوش مصنوعی تولید کرد].
البته چتجیپیتی با بازیهای خیلی زیادی آشناست، که شامل بازی نامبردهی Pokemon Emerald هم میشود. در این مورد، چتجیپیتی اینطور نبود که واقعا کدهای آن بازی را بنویسد؛ صرفا با توجه به دانشی که از قبل از پوکمون داشت یک چیزی سرهم کرد، مشابه وقتی یک ادونچر متنی به متنی که بازیکن در آن مینویسند واکنش نشان میدهد. دن دانگوند/Dan Dangond، که این آزمایش را انجام داده، به سایت پالیگان گفت «بهترین مثال برای درک قضیه اینه که تصور کنید به دوستتون بگید وانمود کنه Pokemon Emerald هستش. البته وانمود اون تا جایی خوبه که خاطرات و دانشی که از اون بازی داره دقیق باشه. و به نظر میاد چتجیپیتی دانش خیلی زیادی از طیف وسیعی از بازیها داره.»
دیگران از چتجیپیتی برای ساخت بازیهای جدید هم استفاده کردهاند، خصوصا برای دیالوگنویسی برای بازیهایشان. مثلا در شبیهساز دوستیابی Love in the Classroom، همانطور که در گزارش سایت Inverse دربارهی این بازی میخوانیم، از چتجیپیتی استفاده شده و کاراکترها به کمک آن میتوانند بیشمار دیالوگ تولید کنند. دیگرانی هم از این چتبات برای ایدهپردازی یا مشاوره برای بازیسازی استفاده کردهاند. یکی از مادسازان هم با کمک این هوش مصنوعی توانسته کاری کند تا NPCهای درون بازی Mount & Blade 2: Bannerlord دیالوگهایشان واقعگرایانه و کمتر تکراری باشد. به علاوه، محدودیتهایی بر این سیستم اعمال کرده تا کاراکترها به نقشی که در دیالوگها ایفا میکنند «احترام» بگذارند [چراکه اگر محدودیتی نباشد ممکن است کاراکترهای دیالوگهای بیربط بگویند یا چیزهایی که در قرون وسطایی که بازی در آن جریان دارد هنوز اتفاق نیافتاده].
همچنین با رابط کاربری چتجیپیتی میتوان بازیهای ادونچر متنی انجام داد و جهان و قوانینش را تعیین کرد. مثل این میماند که دانجنز اند دراگونز را آنلاین با خودتان بازی کنید و دانجن مستر هم نه یک انسان بلکه هوش مصنوعی باشد. مدیرعامل شرکت Beamable، جان ردوف/Jon Radoff، با این چتبات توانست فرمانی برای بازی ادونچر فانتزیاش بسازد که همهی استانداردها را برای فرمان، اینونتوری و نقشه رعایت کرده است. او گفت با چتجیپیتی توانست «قوانین و محدودیتهایی» را اعمال کند که حتی خود AI Dungeon (هوش مصنوعیای که منحصرا برای ساخت بازیهای متنی دانجنمحور ساخته شده) هم نمیتوانست بکند.
آیا استودیوی بزرگی هم هست که از اینها استفاده کند؟
هوش مصنوعی بخش اساسی بازیهای ویدئویی است. شخصیتهای غیرقابلبازی/NPC با هوش مصنوعی کنترل میشوند و با آن به کارهای بازیکن واکنش نشان میدهند؛ از هوش مصنوعی هم برای شخصیتهای همراه (مثل الی در لست آو آس) استفاده میشود و هم دشمنان (مثلا دوباره در لست آو آس، دشمنهای اینفکتد). بعضی از بازیهای چندنفره هم از هوش مصنوعی بسیار استفاده میکنند، تا جایی که مبارزه علیه باتها مثل مبارزه علیه انسانها باشد. تولید تصادفی جهانها/Procedural Generation هم با کمک همین تکنولوژی انجام میشود. واچ داگز لژیون و ماینکرفت مشت نمونهی خروار هستند.
اما اگر صحبت بر سر صرفا جیپیتی ۴ و چتجیپیتی باشد، فعلا زیادی بوی نویی میدهند و هنوز در بازیهای طراز اول/AAA استفاده نشدهاند. اما بعضی از استودیوهای بزرگ قصد دارند از تکنولوژیهای مشابه استفاده کنند. مثلا نتایز/NetEase در فوریهی امسال اعلام کرد میخواهد برای بازی چینی Nishuihan در سبک MMO یک مدل شبیه چتجیپیتی بسازد تا بازیکنان بتوانند آزادانه با کاراکترهای درون بازی چت کنند (گزارش کاملتر در خبرگزاری صبحگاهی جنوب چین). نتایز همچنین اعلام میخواهد در بازیهای بیشتری از «هوش مصنوعیهای مکالمهمحور» استفاده کند تا «محتوا و ماموریت» آنها را متحول و متنوع کند.
اخیرا هم یوبیسافت از یک ابزار هوش مصنوعی مولدی در کنفرانسی در GDC 2023 در ماه مارس پرده برداشت و در مقالهی بلاگی دیگری بیشتر در این مورد توضیح داد. اسم این ابزار گوسترایتر/Ghostwriter است و، به گفتهی یوبیسافت، صرفا به نویسندگان بازیهای ویدئویی کمک میکند نه آنکه جایگزینشان شود. رکسانه بارث/Roxane Barth از یوبیسافت دربارهی ابزاری که یکی از اعضای تیم تحقیق و توسعهی آنها یعنی بن سوآنسون/Ben Swanson ساخته اینچنین میگوید: «گوسترایتر پیشنویسی از نمودار دیالوگهای دمدستیای که قراره گفته بشه رو میسازه — عبارات یا اصواتی که NPCها سر بزنگاه باید بگن — بنابراین وقت نویسندهها آزاد میشه تا روایت رو در جاهای دیگهای صیقل و پیشرفت بدن.» پس وقتی یک کاراکتر ساخته شد، گوسترایتر بر اساس نیازهایی که برایش تعریف شده نموداری از دیالوگهایی که میتواند بیان کند را خودبهخود مینویسد، و نویسنده باید صرفا آنها را برداشته و ویرایش کند. یوبیسافت هنوز اعلام نکرده کدام پروژه، یا آیا پروژههای فعلی، از این ابزار استفاده میکنند.
آیا این ابزاری است که نویسندگان هم میخواهند؟ یوبیسافت میگوید بله — در مقالهی که در بلاگ خود منتشر کرده مینویسد «این نتیجهی گفتوگو با طراحان روایت است که آن را معضل میدانند. و بن (سوانسون) هم این معضل را شناسایی کرد و گفت میتواند با یک ابزار هوش مصنوعی حل شود.» اما بعد از سخنرانی سوانسون در GDC واکنشهای سریع و ناهمگونی در شبکههای اجتماعی به او نشان دادند. برای برخی، این ابزار بسیار خلاقانه است چون خطوط دیالوگ سادهای که مردم اغلب در بازیها میشنوند به هوش مصنوعی سپرده میشود و ارزششان هم بیشازاین نیست. عدهای اما نگرناند تکنولوژی اینگونه مشاغل آنها که سطح پایینتری دارند از بین میرود؛ نویسندگان غیرارشد بههرحال کارشان گاهی نوشتن همین دیالوگهاست.
ابزارهایی مثل چتجیپیتی و گوسترایتر روی نحوهی ساخت بازیهای ویدئویی اثر خواهند گذاشت، اما هنوز اجماع کلیای بر سر اینکه این تاثیرات چگونه خواهند بود وجود ندارد.
چرا چتباتهای هوش مصنوعیمحور حالا محبوب شدهاند؟
این چتباتها البته خیلی، خیلی وقت پیش محبوب بودند. برنامهای به نام الیزا که در سال ۱۹۶۶ منتشر شد، اگر نه اولین ولی یکی از اولین چتباتهای دنیا شناخته میشود. طوری برنامهنویسی شد تا مثل یک روانکاو عمل کند، و در دورهی خودش هم، طبق گزارش CNN، باورپذیر بود. (حتی یک بازی ویدئویی هم با الهام از آن با همان نام Eliza توسط استودیوی Zachtronics ساخته شده است).
مایکروسافت هم یک چتبات بدنام برای توییتر به نام تی/Tay ساخته بود، که احتمالا تا ابد این داغ بر پیشانیاش خواهد ماند که در ظرف یک روز به یک «آشغال نژادپرست» تبدیل شد. تی با هدف «پروژهای در ماشین لرنینگ» طراحی شده بود که با کمک دادههایی که انسان واردش میکرد یاد میگرفت، و انسانها هم در اینکه کاری کنند تا این هوش مصنوعی عین طوطی الفاظ نژادپرستانه تکرار کند سنگتمام گذاشتند — درسی مهم در باب خطرات این پروژهها. به ما یادآوری میکند که هوش مصنوعیها حاصل و دستآموز انسانهایی با سوگیریها و تعصبات مختلفاند و در نتیجه همان سوگیریها را بازتولید خواهند کرد.
مدلهای زبانی جیپیتی ساختهی OpenAI از طرفهای ۲۰۱۸ به اینور وجود داشتهاند (تاریخ عرضهی اول جیپیتی). سازندگان هم از آن زمان تاکنون روی ارتقای این مدل کار کردهاند و از جیپیتی ۲ در ۲۰۱۹ به جیپیتی ۳ در ۲۰۲۰ رسیدیم. اینکه چتجیپیتی اینقدر سروصدا کرد بهخاطر این بود که تعامل با جیپیتی ۳ سادهتر شد. و دلیل دیگری که اینقدر فوری روی مردم اثر گذاشت این بود که طوری مینوشت که بسیار طبیعی و مشابه مکالمات دنیای واقعی بود (ولو اینکه تکنولوژی آن صرفا از الگوریتمها برای نظامبخشی به جوابهایش استفاده میکند). جیپیتی ۴ هم اوایل مارس عرضه شد و قابلیتهای چتجیپیتی را بیش از پیش افزایش داد.
خلاصه بگوییم، چتجیپیتیْ هنوز دهانش بوی شیر میدهد، و خیلی از مردم — حتی آدمهای غیرفنی — برای اولین بار است که با یک مدل جیپیتی دارند ور میروند و آزمایشاش میکنند. چند کمپانی دیگر مثل مایکروسافت هم میخواهند ابزارهایی که رقیب چتجیپیتی شود بسازند.
آیا هوش مصنوعی میتواند در آینده جایگزین بازیسازان شود؟
خیر. اول از همه، چتجیپیتی نمیتواند بدون ورودیهایی که انسان به او میدهد کاری انجام دهد. بنابراین به انسان نیاز است تا وظیفهی آن را مشخص کند، خواه برای تولید ایده باشد، یا کد، یا دیالوگ، یا هر چیز خلاقانهی دیگر. آنقدری هم پیشرفته نیست که این کارها را بینقص انجام دهد. تیتر اخباری که اعلام میکند هوش مصنوعی جایگزین مهندسین و توسعهدهندگان و هنرمندان و نویسندگان خواهد شد اکثرا القای وحشتاند و اغراق درشان زیاد است.
در حال حاضر، چتجیپیتی در مرحلهی آزمایش است، و OpenAI هم ضعفهای آن را فهرست کرده. چتجیپیتی با اعتمادبهنفس خطا میکند. همانطور که جنا بورل/Jenna Burrell، سرپرست تحقیق در موسسهی Data & Society، در وبسایت Poynter توضیح میدهد، چتجیپیتی قادر به کارهای فراوانی است اما «در سطح مکفی هم نمیتواند تحقیق انجام دهد، واقعیتسنجی کند، یا کپیرایتینگ بنویسد [نوشتن جهت تبلیغ محصولات].»
چتجیپیتی با کمک دادههای موجود — با اینکه این دادهها شدیدا متنوع و فراواناند — و استفاده از آنهاست که میتواند چیزی تولید کند. قطعا هر از گاهی چیزهای جدید هم تولید میکند، اما خروجیاش همیشه وابسته به چیزی بیرونی است. البته مغز انسان برای خلاقبودن هم همینطوری فکر میکند؛ تجارب و خاطرات ما بر اینکه چه خلق میکنیم تاثیر میگذراند. اما انسانها قابلیتی ورای هوش مصنوعیهای پیشرفته دارند، چون این خود ماییم که چیزی را خلق میکنیم [برعکس هوش مصنوعیهایی که دیگری باید به آنها بگوید]، و این قابلیت فعلا جایگزینشدنی نیست. انسانها هنوز نتوانستهاند هوش مصنوعیای بسازند که بدون راهنما یا دستور اولیه بتواند چیز جدیدی بسازد. برای همین است که همیشه جلوی پای هوش مصنوعیها محدودیتی هست که مقابل انسانها نیست.
منبع: Polygon