مقایسه ChatGPT و Gemini با ۷ پرامپت؛ برنده کدام است؟

آزاده باقری

۲۰ بهمن ۱۴۰۳ | ۲۲:۰۰ زمان مورد نیاز برای مطالعه: ۹ دقیقه

Gemini هوش مصنوعی گوگل و ChatGPT هوش مصنوعی OpenAI، پرکاربردترین پلتفرم‌های هوش مصنوعی امروزی هستند. هر دوی این ابزارها میلیون‌ها کاربر فعال دارند و مرتبا با ویژگی‌های جدید خود به‌روزرسانی می‌شوند. تنها در دو ماه گذشته گوگل و OpenAI هر دو در هوش مصنوعی‌های خود مدل‌هایی پیشرفته‌ای برای تولید تصویر، استدلال هوش مصنوعی و ابزارهای پژوهشی عرضه کردند که یافتن اطلاعات را آسان‌تر می‌کنند. پیش از مقایسه ChatGPT و Gemini باید بدانید که هر دو این هوش مصنوعی‌ها به دستیار صوتی مجهز هستند: Advanced Voice از OpenAI و Gemini Live از گوگل. همچنین، هر دو امکان اتصال به منابع داده خارجی و ساخت پروژه‌ها را هم فراهم می‌کنند.

در آزمایش‌های ارزیابی انسانی، مدل‌های پیشرو از گوگل و OpenAI مرتباً در رقابت‌های گفت‌وگویی جایگاه خود را تغییر می‌دهند. مقایسه‌های ما نیز نشان داده که گاهی هوش مصنوعی جمینای برنده می‌شود و گاهی چت جی پی تی. با توجه به اینکه هر دو این هوش‌های مصنوعی اخیرا بهٰ‌زورسانی‌هایی داشته‌اند، حالا برای مشخص کردن برنده این رقابت، با ۷ پرامپت به مقایسه ChatGPT و Gemini می‌پردازیم.

ساخت پیام‌های دستوری یا پرامپت‌ها

برای این آزمایش و مقایسه ChatGPT و Gemini، از نسخه‌های ChatGPT Plus و Gemini Advanced استفاده شده تا بتوان از بهترین مدل‌های موجود در این دو برنامه هوش مصنوعی بهره برد. هزینه اشتراک هر دو تقریباً مشابه است، حدود ۲۰ دلار در ماه، که این هم نکته خوبی برای مقایسه است. با این حال شما می‌توانید این مقایسه را با مدل‌های هوش مصنوعی رایگان هم انجام دهید.

در این آزمایش، توانایی تولید و تحلیل تصویر، نوشتن کد برای یک بازی و مهارت‌های نوشتن خلاقانه در این دو هوش مصنوعی مشهور بررسی و مقایسه می‌شوند. همچنین در این آزمایش پرامپت‌هایی طراحی شده‌اند که به کمک آن‌ها بتوانیم مدل‌های پژوهشی هر دو پلتفرم را به چالش بکشیم؛ مدل o1 از ChatGPT و مدل 1.5 Deep Research از Gemini.

۱. تولید تصویر

ابتدا از ChatGPT و Gemini خواستم تصویری از یک گربه سایبورگ را خلق کنند که در اتاق نشیمنی در زمان آینده قرار گرفته است. هیچ‌کدام از این دو هوش مصنوعی در حال حاضر تصاویر را خودشان مستقیماً تولید نمی‌کنند: Gemini پرامپت را به Imagen 3 می‌فرستند و ChatGPT آن را برای DALL-E 3 ارسال می‌کند. نسخه‌های آینده این دو هوس مصنوعی احتمالاً قادر به خلق مستقیم تصاویر خواهند بود، اما در حال حاضر، تنها می‌توانیم توانایی آن‌ها در تفسیر پرامپت را آزمایش و مقایسه کنیم.

پرامپت:

«یک تصویر بسیار دقیق از یک گربه سایبورگ در یک اتاق نشیمن در زمانی در آینده خلق کن. گربه باید در حال بازی با یک کنسول شناور باشد و خودش هم روی یک صندلی معلق نشسته باشد. اتاق باید دارای نمایشگرهای هولوگرافیک و نورپردازی‌های نئونی باشد و ترکیبی از عناصر فلزی و ارگانیک درون خود داشته باشد. زمان باید عصر باشد و چراغ‌های شهر از یک پنجره بزرگ دیده شوند.»

برنده: ChatGPT برای اینکه گربه واقعاً یک سایبورگ بود.

۲. تحلیل تصویر

در پرامپت دوم برای مقایسه ChatGPT و Gemini، توانایی تحلیل تصویر در جمینای و چت جی پی تی را آزمایش کردیم. هر دو در این زمینه عملکرد فوق‌العاده‌ای دارند، بنابراین علاوه بر تصویر، دستورالعمل‌های مشخصی هم به آن‌ها دادیم و از عکسی از یک «ستاپ گیمینگ، رؤیایی» استفاده کردیم.

پرامپت:

«در این عکس از ستاپ گیمینگ، موارد زیر را تحلیل کن: موقعیت و ارتفاع مانیتور برای ارگونومیک بودن، مشکلات و راه‌حل‌ها برای مدیریت سیم و کابل‌ها، تنظیم نورپردازی و عوامل ایجاد خستگی چشم، استفاده از فضا و سازماندهی، کارا بودن چیدمان تجهیزات و در نهایت توصیه‌های مشخصی برای بهبود ارائه کن و هزینه‌های تقریبی را برآورد کن.»

برنده: ChatGPT برای خلاصه کردن تحلیل در قالب یک جدول

۳. کدنویسی برای مقایسه ChatGPT و Gemini

برای پرامپت سوم، توانایی «کدنویسی تک‌مرحله‌ای» هر دو هوش مصنوعی را با یک پرامپت توصیفی آزمایش کردیم. در مقایسه ChatGPT و Gemini در این مرحله از مدل o1 در ChatGPT و مدل Experimental Advanced 2.0 در Gemini استفاده شد. این پرامپت یکی از پیچیده‌ترین پرامپت‌های این آزمایش بود، چرا که هدفمان این بود که خروجی به صورت تک مرحله‌ای و به یکباره تولید شود. در نهایت هدف این است که کد داده شده باید بدون مشکل اجرا شود. درضمن کدی که هر کدام از هوش مصنوعی‌ها داده بودند را در GitHub قرار داده‌ایم.

پرامپت:

«یک بازی آرکید سریع (fast-paced) به نام «Color Dash» با استفاده از PyGame ایجاد کن که واکنش‌های سریع و تطابق رنگ‌ها در آن کلیدی باشند. موارد زیر در بازی مورد نیاز است؛ گیم‌پلی اصلی: اشکال رنگی (دایره، مربع، مثلث) از بالای صفحه سقوط می‌کنند؛ سه «منطقه جمع‌آوری» در پایین صفحه با رنگ‌های مختلف وجود دارد؛ بازیکن با استفاده از کلیدهای چپ/راست منطقه‌ها را حرکت می‌دهد؛ تطابق اشکال سقوط‌کننده با منطقه هم‌رنگ؛ از دست دادن تطابق یا تطابق اشتباه برابر است با از دست دادن یک جان؛ با افزایش امتیاز، سرعت بیشتر می‌شود.

همچنین بازی باید شامل موارد زیر باشد: رابط کاربری تمیز و مینیمالیستی که در آن مواردی مانند امتیاز فعلی، بالاترین امتیاز، جان‌های باقی‌مانده (شروع با ۳)، انیمیشن‌های ساده برای تطابق‌ها و خطاها، صفحه عنوان ساده، صفحه پایان بازی با امتیاز نهایی، کنترل‌های روان.

همچنین بازی باید دارای افکت‌های صوتی پایه باشد؛ افکت‌هایی برای تطابق موفق، تطابق اشتباه، پایان بازی، ذخیره امتیاز در فایل محلی، شروع مجدد با فشار دادن کلید Space پس از پایان بازی.

بازی باید فقط از اشکال پایه PyGame استفاده کند (بدون اسپرایت یا گرافیک پیچیده) اما از طریق استفاده مناسب از رنگ و انیمیشن‌های روان، ظاهری شکیل داشته باشد. کد باید توضیحات کامنت‌گذاری‌شده داشته باشد که نحوه عملکرد را توضیح دهد.»

برنده: Gemini به دلیل ارائه بازی‌ با عملکرد بهتر

۴. نوشتن خلاقانه در مقایسه ChatGPT و Gemini

یکی از قابلیت‌های شناخته‌شده هوش مصنوعی، نویسندگی خلاق است. این قابلیت یکی از اولین موارد استفاده ChatGPT پس از عرضه آن بود. در اینجا در مقایسه ChatGPT و Gemini از مدل o1 در ChatGPT و مدل Experimental Advanced 2.0 در Gemini استفاده کردیم تا داستانی درباره یک گوشی هوشمند بنویسند.

این بار داستان درباره گوشی هوشمندی است که پس از یک به‌روزرسانی نرم‌افزاری، خودآگاهی پیدا می‌کند. داستان‌های هر دو هوش مصنوعی را در یک Google Doc قرار دادیم. هر دو از نظر کیفیت و توانایی داستان‌گویی بسیار مشابه بودند.

پرامپت:

«یک داستان ۵۰۰ کلمه‌ای درباره گوشی هوشمندی که از طریق یک به‌روزرسانی نرم‌افزاری، خودآگاهی پیدا می‌کند، بنویس. داستانت باید شامل موارد زیر باشد: افزایش آگاهی گوشی از عادت‌های کاربر در آن مشهود باشد، یک دوراهی اخلاقی مربوط به اطلاعات خصوصی کاربر در داستان وجود داشته باشد، عناصری از طنز و کنایه داشته باشد، ارجاعاتی به روندهای فعلی تکنولوژی داشته باشد، یک پایان غافلگیر کننده داشته باشد و لحن داستان باید لحنی صمیمی اما تفکر برانگیز باشد.»

برنده: ChatGPT به دلیل طول مناسب‌تر داستان

۵. توانایی حل مساله در مقایسه ChatGPT و Gemini

در این قسمت از آزمایش و در مقایسه ChatGPT و Gemini از مدل o1 در مقابل Gemini 2.0 Experimental Advanced استفاده کردیم تا توانایی استدلال بهبود‌یافته این دو هوش مصنوعی را بررسی کنیم. در این پرامپت هر دو هوش مصنوعی یک موقعیت و یک مشکل را دریافت کردند و باید راه‌حلی برای آن ارائه می‌دادند.

پاسخ‌های کامل هر دو را در یک Google Doc ذخیره کردیم. هر دو این هوش‌های مصنوعی پاسخ را گام به گام توضیح دادند و جزئیات را بیان کردند. معمولاً چنین پرامپت‌هایی را به‌صورت تدریجی و گام به گام هم اجرا می‌کنند، با این حال هر دو هوش مصنوعی عملکرد خوبی داشتند.

پرامپت:

«تنظیمات و موقعیت من: تلویزیون LG C3 4K OLED، کنسول PS5، کابل HDMI 2.1 با سرعت بالا و مشکل من: صفحه سیاهی به مدت ۲-۳ ثانیه هر ۴۵-۶۰ دقیقه هنگام بازی ظاهر می‌شود. جزئیات اضافی شامل: این مشکل هنگام استفاده از اپلیکیشن‌های استریم وجود ندارد؛ پس از به‌روزرسانی اخیر سیستم PS5 مشکل شروع شده است؛ کابل HDMI به‌درستی متصل است؛ فریمور تلویزیون به‌روز است. حالا راهنمایی گام‌به‌گام برای عیب‌یابی این مشکل ارائه دهید، راهنمایی که شامل راه‌حل‌های سخت‌افزاری و نرم‌افزاری احتمالی باشد.»

برنده: Gemini به دلیل ساختار بهتر پاسخ

۶. مقایسه ChatGPT و Gemini در طراحی اتاق

برای این آزمون، مدل o1 از ChatGPT را در برابر مدل Deep Research 1.5 از Gemini قرار دادم. اگرچه این مدل جدیدترین نسخه گوگل نیست، اما Deep Research به دلیل روش تفکر مشابه با ChatGPT o1 در حل مشکلات فوق‌العاده است. این مدل برای پیدا کردن تحقیقات معتبر با ارجاع به منابع دقیق بسیار مفید است. اما همان‌طور که در تصویر مشاهده می‌کنید، ChatGPT o1 پرامپت را دقیق‌تر دنبال کرد.

پرامپت:

«به من کمک کن اتاق مهمان ۴x۳ متری خود را به یک فضای چند منظوره تبدیل کنم که به‌صورت زیر عمل کند: در روزهای هفته به‌عنوان دفتر کار خانگی (من به‌صورت دورکاری به‌عنوان طراح گرافیک کار می‌کنم)؛ این اتاق را به‌عنوان اتاق مهمانی طراحی کن که برای والدین سالمندم که ماهانه به دیدن ما می‌آیند مکانی راحت باشد؛ همچنین طراحی‌ات به گونه‌ای باشد که بتوان از اتاق به‌عنوان فضای کاردستی برای پروژه‌های آخر هفته بچه‌ها نیز استفاده کنم.

نیازها: بودجه: ۲,۰۰۰ دلار، باید شامل فضایی برای قرار دادن لوازم کاردستی باشد؛ نورپردازی مناسب برای تماس‌های ویدئویی داشته باشد؛ دسترسی آسان به تخت برای والدین سالمند با مشکلات حرکتی داشته باشد؛ فضای کافی برای یک مانیتور ۲۷ اینچ و تبلت طراحی در آن باشد؛ فضایی برای پخش کردن وسایل پروژه‌های بچه‌ها در کف اتاق وجود داشته باشد؛ جریان هوای خوب و نور طبیعی از تک پنجره اتاق فراهم باشد.

همچنین دیگر موارد مورد نیاز عبارت‌اند از: پیشنهادات دقیق برای نقشه کف، پیشنهادات خاص برای مبلمان همراه با قیمت، راه‌حل‌هایی برای استفاده از فضا برای قراردادن وسایل، طراحی رنگ و پلان نورپردازی، جدول زمانی برای بازسازی، نکاتی برای حفظ سازماندهی بین کاربری‌های مختلف»

برنده: ChatGPT به دلیل دنبال کردن بهتر پرامپت. Gemini از بودجه فراتر رفت و بیش از حد بر گزینه‌های گران‌قیمت تمرکز کرد.

۷. آموزش هوش مصنوعی

در نهایت، بهترین استفاده از چت‌بات‌هایی مانند ChatGPT و Gemini، برای آموزش است. در این بخش از آزمایش و مقایسه ChatGPT و Gemini از آن‌ها خواستیم فرآیند تولید تصاویر توسط هوش مصنوعی را برای افراد عادی توضیح دهند و ایده‌هایی برای آینده این فناوری ارائه کنند. توضیحات کامل را در یک Google Doc برای شما هم به اشتراک گذاشتیم، اما از نظر ما برنده به‌راحتی Gemini بود. نه به این دلیل که ChatGPT بد بود، بلکه به این دلیل که Gemini جزئیات بیشتری ارائه داد، از جمله توضیح درباره وجود سوگیری‌ها در داده‌های تصویری.

پرامپت:

«فرآیند تولید تصویر توسط هوش مصنوعی را به زبان ساده توضیح بده، شامل: نحوه یادگیری هوش مصنوعی از تصاویر موجود، نقش پرامپت‌های متنی در ایجاد تصویر، دلیل اینکه چرا برخی عناصر ممکن است تغییر شکل یافته به نظر برسند، ملاحظات قانونی و اخلاقی، محدودیت‌ها و چالش‌های فعلی، بهبودهای مورد انتظار در ۱-۲ سال آینده، نکاتی برای بهبود نتایج و در نهایت مثال‌های خاص از تولیدکننده‌های محبوب تصاویر هوش مصنوعی ارائه کن.”

برنده: Gemini به دلیل ارائه جزئیات درباره سوگیری در داده‌های تصویری

نتیجه نهایی: ChatGPT برنده‌ شد

برنده نهایی این چالش ChatGPT بود، اما فقط با یک امتیاز اختلاف. Gemini از آخرین باری که ما آن را با ChatGPT مقایسه کردیم، پیشرفت چشمگیری داشته است. ما متوجه شدیم Gemini در کدنویسی بسیار بهتر از آن چیزی است که تصور می‌کردیم و همچنین در حل مسائل عملکرد خوبی دارد. ویژگی‌های دیگری نیز وجود دارد که آزمایش نکردیم، مثلا مقایسه بین پروژه‌ها و Gems (بسته‌هایی از کد هستند که می‌توان آن‌ها را به پروژه اضافه کرد) یا حل مسئله کدنویسی پیچیده‌تر با چندین پیام. با این حال امیدواریم این مقایسه به شما دیدگاه خوبی از پیشرفت‌های ChatGPT و Gemini و نحوه مقایسه آن‌ها بدهد.

منبع: tomsguide.com

برچسب‌ها : هوش مصنوعی هوش مصنوعی و رباتیک