مقایسه ChatGPT و Gemini با ۷ پرامپت؛ برنده کدام است؟

Gemini هوش مصنوعی گوگل و ChatGPT هوش مصنوعی OpenAI، پرکاربردترین پلتفرمهای هوش مصنوعی امروزی هستند. هر دوی این ابزارها میلیونها کاربر فعال دارند و مرتبا با ویژگیهای جدید خود بهروزرسانی میشوند. تنها در دو ماه گذشته گوگل و OpenAI هر دو در هوش مصنوعیهای خود مدلهایی پیشرفتهای برای تولید تصویر، استدلال هوش مصنوعی و ابزارهای پژوهشی عرضه کردند که یافتن اطلاعات را آسانتر میکنند. پیش از مقایسه ChatGPT و Gemini باید بدانید که هر دو این هوش مصنوعیها به دستیار صوتی مجهز هستند: Advanced Voice از OpenAI و Gemini Live از گوگل. همچنین، هر دو امکان اتصال به منابع داده خارجی و ساخت پروژهها را هم فراهم میکنند.
در آزمایشهای ارزیابی انسانی، مدلهای پیشرو از گوگل و OpenAI مرتباً در رقابتهای گفتوگویی جایگاه خود را تغییر میدهند. مقایسههای ما نیز نشان داده که گاهی هوش مصنوعی جمینای برنده میشود و گاهی چت جی پی تی. با توجه به اینکه هر دو این هوشهای مصنوعی اخیرا بهٰزورسانیهایی داشتهاند، حالا برای مشخص کردن برنده این رقابت، با ۷ پرامپت به مقایسه ChatGPT و Gemini میپردازیم.
ساخت پیامهای دستوری یا پرامپتها
برای این آزمایش و مقایسه ChatGPT و Gemini، از نسخههای ChatGPT Plus و Gemini Advanced استفاده شده تا بتوان از بهترین مدلهای موجود در این دو برنامه هوش مصنوعی بهره برد. هزینه اشتراک هر دو تقریباً مشابه است، حدود ۲۰ دلار در ماه، که این هم نکته خوبی برای مقایسه است. با این حال شما میتوانید این مقایسه را با مدلهای هوش مصنوعی رایگان هم انجام دهید.
در این آزمایش، توانایی تولید و تحلیل تصویر، نوشتن کد برای یک بازی و مهارتهای نوشتن خلاقانه در این دو هوش مصنوعی مشهور بررسی و مقایسه میشوند. همچنین در این آزمایش پرامپتهایی طراحی شدهاند که به کمک آنها بتوانیم مدلهای پژوهشی هر دو پلتفرم را به چالش بکشیم؛ مدل o1 از ChatGPT و مدل 1.5 Deep Research از Gemini.
۱. تولید تصویر
ابتدا از ChatGPT و Gemini خواستم تصویری از یک گربه سایبورگ را خلق کنند که در اتاق نشیمنی در زمان آینده قرار گرفته است. هیچکدام از این دو هوش مصنوعی در حال حاضر تصاویر را خودشان مستقیماً تولید نمیکنند: Gemini پرامپت را به Imagen 3 میفرستند و ChatGPT آن را برای DALL-E 3 ارسال میکند. نسخههای آینده این دو هوس مصنوعی احتمالاً قادر به خلق مستقیم تصاویر خواهند بود، اما در حال حاضر، تنها میتوانیم توانایی آنها در تفسیر پرامپت را آزمایش و مقایسه کنیم.
پرامپت:
«یک تصویر بسیار دقیق از یک گربه سایبورگ در یک اتاق نشیمن در زمانی در آینده خلق کن. گربه باید در حال بازی با یک کنسول شناور باشد و خودش هم روی یک صندلی معلق نشسته باشد. اتاق باید دارای نمایشگرهای هولوگرافیک و نورپردازیهای نئونی باشد و ترکیبی از عناصر فلزی و ارگانیک درون خود داشته باشد. زمان باید عصر باشد و چراغهای شهر از یک پنجره بزرگ دیده شوند.»
برنده: ChatGPT برای اینکه گربه واقعاً یک سایبورگ بود.
۲. تحلیل تصویر
در پرامپت دوم برای مقایسه ChatGPT و Gemini، توانایی تحلیل تصویر در جمینای و چت جی پی تی را آزمایش کردیم. هر دو در این زمینه عملکرد فوقالعادهای دارند، بنابراین علاوه بر تصویر، دستورالعملهای مشخصی هم به آنها دادیم و از عکسی از یک «ستاپ گیمینگ، رؤیایی» استفاده کردیم.
پرامپت:
«در این عکس از ستاپ گیمینگ، موارد زیر را تحلیل کن: موقعیت و ارتفاع مانیتور برای ارگونومیک بودن، مشکلات و راهحلها برای مدیریت سیم و کابلها، تنظیم نورپردازی و عوامل ایجاد خستگی چشم، استفاده از فضا و سازماندهی، کارا بودن چیدمان تجهیزات و در نهایت توصیههای مشخصی برای بهبود ارائه کن و هزینههای تقریبی را برآورد کن.»
برنده: ChatGPT برای خلاصه کردن تحلیل در قالب یک جدول
۳. کدنویسی برای مقایسه ChatGPT و Gemini
برای پرامپت سوم، توانایی «کدنویسی تکمرحلهای» هر دو هوش مصنوعی را با یک پرامپت توصیفی آزمایش کردیم. در مقایسه ChatGPT و Gemini در این مرحله از مدل o1 در ChatGPT و مدل Experimental Advanced 2.0 در Gemini استفاده شد. این پرامپت یکی از پیچیدهترین پرامپتهای این آزمایش بود، چرا که هدفمان این بود که خروجی به صورت تک مرحلهای و به یکباره تولید شود. در نهایت هدف این است که کد داده شده باید بدون مشکل اجرا شود. درضمن کدی که هر کدام از هوش مصنوعیها داده بودند را در GitHub قرار دادهایم.
پرامپت:
«یک بازی آرکید سریع (fast-paced) به نام «Color Dash» با استفاده از PyGame ایجاد کن که واکنشهای سریع و تطابق رنگها در آن کلیدی باشند. موارد زیر در بازی مورد نیاز است؛ گیمپلی اصلی: اشکال رنگی (دایره، مربع، مثلث) از بالای صفحه سقوط میکنند؛ سه «منطقه جمعآوری» در پایین صفحه با رنگهای مختلف وجود دارد؛ بازیکن با استفاده از کلیدهای چپ/راست منطقهها را حرکت میدهد؛ تطابق اشکال سقوطکننده با منطقه همرنگ؛ از دست دادن تطابق یا تطابق اشتباه برابر است با از دست دادن یک جان؛ با افزایش امتیاز، سرعت بیشتر میشود.
همچنین بازی باید شامل موارد زیر باشد: رابط کاربری تمیز و مینیمالیستی که در آن مواردی مانند امتیاز فعلی، بالاترین امتیاز، جانهای باقیمانده (شروع با ۳)، انیمیشنهای ساده برای تطابقها و خطاها، صفحه عنوان ساده، صفحه پایان بازی با امتیاز نهایی، کنترلهای روان.
همچنین بازی باید دارای افکتهای صوتی پایه باشد؛ افکتهایی برای تطابق موفق، تطابق اشتباه، پایان بازی، ذخیره امتیاز در فایل محلی، شروع مجدد با فشار دادن کلید Space پس از پایان بازی.
بازی باید فقط از اشکال پایه PyGame استفاده کند (بدون اسپرایت یا گرافیک پیچیده) اما از طریق استفاده مناسب از رنگ و انیمیشنهای روان، ظاهری شکیل داشته باشد. کد باید توضیحات کامنتگذاریشده داشته باشد که نحوه عملکرد را توضیح دهد.»
برنده: Gemini به دلیل ارائه بازی با عملکرد بهتر
۴. نوشتن خلاقانه در مقایسه ChatGPT و Gemini
یکی از قابلیتهای شناختهشده هوش مصنوعی، نویسندگی خلاق است. این قابلیت یکی از اولین موارد استفاده ChatGPT پس از عرضه آن بود. در اینجا در مقایسه ChatGPT و Gemini از مدل o1 در ChatGPT و مدل Experimental Advanced 2.0 در Gemini استفاده کردیم تا داستانی درباره یک گوشی هوشمند بنویسند.
این بار داستان درباره گوشی هوشمندی است که پس از یک بهروزرسانی نرمافزاری، خودآگاهی پیدا میکند. داستانهای هر دو هوش مصنوعی را در یک Google Doc قرار دادیم. هر دو از نظر کیفیت و توانایی داستانگویی بسیار مشابه بودند.
پرامپت:
«یک داستان ۵۰۰ کلمهای درباره گوشی هوشمندی که از طریق یک بهروزرسانی نرمافزاری، خودآگاهی پیدا میکند، بنویس. داستانت باید شامل موارد زیر باشد: افزایش آگاهی گوشی از عادتهای کاربر در آن مشهود باشد، یک دوراهی اخلاقی مربوط به اطلاعات خصوصی کاربر در داستان وجود داشته باشد، عناصری از طنز و کنایه داشته باشد، ارجاعاتی به روندهای فعلی تکنولوژی داشته باشد، یک پایان غافلگیر کننده داشته باشد و لحن داستان باید لحنی صمیمی اما تفکر برانگیز باشد.»
برنده: ChatGPT به دلیل طول مناسبتر داستان
۵. توانایی حل مساله در مقایسه ChatGPT و Gemini
در این قسمت از آزمایش و در مقایسه ChatGPT و Gemini از مدل o1 در مقابل Gemini 2.0 Experimental Advanced استفاده کردیم تا توانایی استدلال بهبودیافته این دو هوش مصنوعی را بررسی کنیم. در این پرامپت هر دو هوش مصنوعی یک موقعیت و یک مشکل را دریافت کردند و باید راهحلی برای آن ارائه میدادند.
پاسخهای کامل هر دو را در یک Google Doc ذخیره کردیم. هر دو این هوشهای مصنوعی پاسخ را گام به گام توضیح دادند و جزئیات را بیان کردند. معمولاً چنین پرامپتهایی را بهصورت تدریجی و گام به گام هم اجرا میکنند، با این حال هر دو هوش مصنوعی عملکرد خوبی داشتند.
پرامپت:
«تنظیمات و موقعیت من: تلویزیون LG C3 4K OLED، کنسول PS5، کابل HDMI 2.1 با سرعت بالا و مشکل من: صفحه سیاهی به مدت ۲-۳ ثانیه هر ۴۵-۶۰ دقیقه هنگام بازی ظاهر میشود. جزئیات اضافی شامل: این مشکل هنگام استفاده از اپلیکیشنهای استریم وجود ندارد؛ پس از بهروزرسانی اخیر سیستم PS5 مشکل شروع شده است؛ کابل HDMI بهدرستی متصل است؛ فریمور تلویزیون بهروز است. حالا راهنمایی گامبهگام برای عیبیابی این مشکل ارائه دهید، راهنمایی که شامل راهحلهای سختافزاری و نرمافزاری احتمالی باشد.»
برنده: Gemini به دلیل ساختار بهتر پاسخ
۶. مقایسه ChatGPT و Gemini در طراحی اتاق
برای این آزمون، مدل o1 از ChatGPT را در برابر مدل Deep Research 1.5 از Gemini قرار دادم. اگرچه این مدل جدیدترین نسخه گوگل نیست، اما Deep Research به دلیل روش تفکر مشابه با ChatGPT o1 در حل مشکلات فوقالعاده است. این مدل برای پیدا کردن تحقیقات معتبر با ارجاع به منابع دقیق بسیار مفید است. اما همانطور که در تصویر مشاهده میکنید، ChatGPT o1 پرامپت را دقیقتر دنبال کرد.
پرامپت:
«به من کمک کن اتاق مهمان ۴x۳ متری خود را به یک فضای چند منظوره تبدیل کنم که بهصورت زیر عمل کند: در روزهای هفته بهعنوان دفتر کار خانگی (من بهصورت دورکاری بهعنوان طراح گرافیک کار میکنم)؛ این اتاق را بهعنوان اتاق مهمانی طراحی کن که برای والدین سالمندم که ماهانه به دیدن ما میآیند مکانی راحت باشد؛ همچنین طراحیات به گونهای باشد که بتوان از اتاق بهعنوان فضای کاردستی برای پروژههای آخر هفته بچهها نیز استفاده کنم.
نیازها: بودجه: ۲,۰۰۰ دلار، باید شامل فضایی برای قرار دادن لوازم کاردستی باشد؛ نورپردازی مناسب برای تماسهای ویدئویی داشته باشد؛ دسترسی آسان به تخت برای والدین سالمند با مشکلات حرکتی داشته باشد؛ فضای کافی برای یک مانیتور ۲۷ اینچ و تبلت طراحی در آن باشد؛ فضایی برای پخش کردن وسایل پروژههای بچهها در کف اتاق وجود داشته باشد؛ جریان هوای خوب و نور طبیعی از تک پنجره اتاق فراهم باشد.
همچنین دیگر موارد مورد نیاز عبارتاند از: پیشنهادات دقیق برای نقشه کف، پیشنهادات خاص برای مبلمان همراه با قیمت، راهحلهایی برای استفاده از فضا برای قراردادن وسایل، طراحی رنگ و پلان نورپردازی، جدول زمانی برای بازسازی، نکاتی برای حفظ سازماندهی بین کاربریهای مختلف»
برنده: ChatGPT به دلیل دنبال کردن بهتر پرامپت. Gemini از بودجه فراتر رفت و بیش از حد بر گزینههای گرانقیمت تمرکز کرد.
۷. آموزش هوش مصنوعی
در نهایت، بهترین استفاده از چتباتهایی مانند ChatGPT و Gemini، برای آموزش است. در این بخش از آزمایش و مقایسه ChatGPT و Gemini از آنها خواستیم فرآیند تولید تصاویر توسط هوش مصنوعی را برای افراد عادی توضیح دهند و ایدههایی برای آینده این فناوری ارائه کنند. توضیحات کامل را در یک Google Doc برای شما هم به اشتراک گذاشتیم، اما از نظر ما برنده بهراحتی Gemini بود. نه به این دلیل که ChatGPT بد بود، بلکه به این دلیل که Gemini جزئیات بیشتری ارائه داد، از جمله توضیح درباره وجود سوگیریها در دادههای تصویری.
پرامپت:
«فرآیند تولید تصویر توسط هوش مصنوعی را به زبان ساده توضیح بده، شامل: نحوه یادگیری هوش مصنوعی از تصاویر موجود، نقش پرامپتهای متنی در ایجاد تصویر، دلیل اینکه چرا برخی عناصر ممکن است تغییر شکل یافته به نظر برسند، ملاحظات قانونی و اخلاقی، محدودیتها و چالشهای فعلی، بهبودهای مورد انتظار در ۱-۲ سال آینده، نکاتی برای بهبود نتایج و در نهایت مثالهای خاص از تولیدکنندههای محبوب تصاویر هوش مصنوعی ارائه کن.”
برنده: Gemini به دلیل ارائه جزئیات درباره سوگیری در دادههای تصویری
نتیجه نهایی: ChatGPT برنده شد
برنده نهایی این چالش ChatGPT بود، اما فقط با یک امتیاز اختلاف. Gemini از آخرین باری که ما آن را با ChatGPT مقایسه کردیم، پیشرفت چشمگیری داشته است. ما متوجه شدیم Gemini در کدنویسی بسیار بهتر از آن چیزی است که تصور میکردیم و همچنین در حل مسائل عملکرد خوبی دارد. ویژگیهای دیگری نیز وجود دارد که آزمایش نکردیم، مثلا مقایسه بین پروژهها و Gems (بستههایی از کد هستند که میتوان آنها را به پروژه اضافه کرد) یا حل مسئله کدنویسی پیچیدهتر با چندین پیام. با این حال امیدواریم این مقایسه به شما دیدگاه خوبی از پیشرفتهای ChatGPT و Gemini و نحوه مقایسه آنها بدهد.
منبع: tomsguide.com