مقایسه ChatGPT و Claude با ۷ پرامپت؛ برنده کدام است؟
شرکت Open AI اولین بار ChatGPT را بیش از دو سال پیش به جهان معرفی کرد و از آن زمان به بعد بود که رقابت در این حوزه افزایش چشمگیری یافت. این رقابت فقط محدود به حوزههای تولید تصویر با هوش مصنوعی نمیشد، بلکه تمرکزش بر توسعه یک هوش مصنوعی با قابلیتهای متنوع در زمینههای ارتباطات متنی و تصویری بود؛ این محصولات رقیب عبارت بودند از: Gemini از گوگل، Grok از xAI و البته Claude از Anthropic. در مقایسه ChatGPT و Claude متوجه خواهید شد که هر دو هوش مصنوعی ویژگیهای مشابهی دارند. به عنوان مثال، شرکت Anthropic قابلیت Artifacts را برای نمایش و اجرای کد به Claude اضافه کرد و پس از آن شرکت OpenAI ابزار Canvas را در ChatGPT راهاندازی کرد.
با این حال علی رغم این شباهتها، تفاوتهای قابل توجهی هم میان این دو هوش مصنوعی وجود دارد. به عنوان مثال، ChatGPT به DALL-E برای تولید تصاویر دسترسی دارد، در حالی که Claude برای تولید تصاویر به چنین ابزاری در درون خود و به شکل محلی، دسترسی ندارد. همچنین Claude در جستجوی خود، برخلاف جستجوی ChatGPT، به دادههای زنده دسترسی ندارد و همچنین هنوز از «مدل استدلالی» هم استفاده نمیکند.
من برای مقایسه ChatGPT و Claude تعدادی پیام دستوری یا پرامپت (prompt) را طراحی کردم که برای هر دو آنها به شکلی مشابه عمل میکند؛ همچنین تمامی آزمایشها را با Claude Sonnet 3.5 و OpenAI GPT-4o و بدون ویژگیهای اضافی انجام دادم.
ساخت پیامهای دستوری یا پرامپتها
برای این مقایسه در ساخت پرامپتها از همان بخشها و ساختارهایی استفاده کردم که در آزمایش مشهور ChatGPT و Gemini استفاده شده بود؛ آزمایشی که به تازگی در طی آن ChatGPT هوش مصنوعی پرچمدار گوگل را شکست داد.
در این هفت پرامپت، تواناییهای این دو هوش مصنوعی را در تحلیل تصاویر، تولید کد، نوشتن و حل مسئله آزمایش میکنیم. از آنجا که Claude خودش به تنهایی نمیتواند تصویر تولید کند، از هر دو این هوشهای مصنوعی خواستم تا یک پرامپت ایجاد کنند، سپس با استفاده از ابزار Ideogram و کدهای دستوری، تصاویر را تولید کردم.
۱. تولید تصویر
این بخش یا این آزمایش اولین قدم برای درک نحوه ساخت دستوراتی است که من برای تولید تصاویر دادم و میتواند به شما هم برای ساخت پرامپت مناسب کمک کند. من معمولاً یک متن راهنمای کلی برای پرامپت مد نظرم مینویسم و سپس از ChatGPT، Claude یا Gemini میخواهم با توجه به این راهنمای کلی که برایشان نوشتهام، برای من یک پرامپت مناسب تولید کنند. حال پرامپتی که هر کدام از هوش مصنوعیها برایم تولید کردهاند را به تولیدکننده تصاویری مثل Ideogram میدهم و اکنون میتوانم مقایسه کنم که کدام یک از این هوش مصنوعیها در تولید پرامپت مناسب برای تولید تصویر قویتر عمل کرده است. (به تصویر بالا نگاه کنید)
من در ابتدا دستورالعملهایی در مورد محتوایی که باید در پرامپت قرار داشته باشد، به آنها ارائه دادم. مزیت این روش این است که پس از تنظیم پرامپت اولیه مدنظر، در یک مکالمه جدید، میتوانید بدون نیاز به ذکر مجدد تمام جزئیات، فقط بگویید «یک مورد دیگر بساز» یا «همین را تغییر بده و x را عوض کن».
پرامپت:
*متن اولیهای که برای مقایسه ChatGPT و Claude به هر کدام داده شد تا بر اساس آن پرامپت نهایی را بسازند:
«میخواهم یک دستور دقیق برای یک تصویر ایجاد کنی که بتوانم از آن در یک تولیدکننده تصویر هوش مصنوعی مثل Midjourney استفاده کنم. تصویر باید یک منظره شهری در آینده (آیندهنگر) باشد که غروب خورشید را نشان دهد. تصور کن ترکیبی از عناصر ارگانیک و تکنولوژیک با هم در تصویر وجود داشته باشند. ساختمانهای بلند با باغهای عمودی سرسبز در هم تنیده هم باشند. شهر باید هم وسیع و هم پیچیده به نظر برسد.
عناصر خاصی که باید در دستور وجود داشته باشد:
– نورپردازی: ساعت طلایی (به ساعتی در نزدیکی غروب گفته میشود که همه چیز در معرض نور خورشید، رنگی طلایی رنگ به خود میگیرند) با سایههای بلند و آسمانی گرم و پرجنبوجوش. با بازتابهای نوری که روی سطوح فلزی گنجانده شدهاند.
– زاویه دید: نمای گسترده از موقعیتی کمی بالاتر، گویی از یک بالکن به شهر نگاه میکنید.
– پالت رنگی: عمدتاً رنگهای گرم (نارنجی، زرد، صورتی) برای آسمان، در تضاد با تنهای رنگی فلزیِ سرد (آبی، نقرهای) و سبزی گیاهان.
– سبک معماری: ترکیبی از آسمانخراشهای براق و آیندهنگر و ساختارهای بیومورفیک که شبیه گیاهان عظیم در هم تنیده باشند.
– جو: احساسی از عظمت آرامشبخش. شاید چند وسیله نقلیه یا پهپاد آیندهنگر به آرامی در آسمان حرکت کنند.
– سبک هنری: فوتورئالیسم با کمی چاشنی فانتزی.»
پرامپت تولید شده توسط ChatGPT:
«یک منظره شهری آیندهنگر خیرهکننده در غروب خورشید، از بالکنی کمی مرتفع دیده میشود. صحنه در نور گرم ساعت طلایی غرق شده، با سایههای بلند که در شهر کشیده شدهاند. آسمان بهصورت طیف رنگی پرجنبوجوشی از نارنجی، زرد و صورتی است که به زیبایی با تنهای رنگی فلزی سرد در ساختمانها و سبزی باغها و گیاهان عمودی در تضاد است. آسمانخراشهای بلند با طراحیهای براق و آیندهنگر به سمت آسمان کشیده شدهاند، سطوحشان با بازتابهای طلایی میدرخشد. در میان آنها، ساختارهای بیومورفیک شبیه گیاهان زنده عظیم در هم تنیدهاند، فرمهای ارگانیکشان بهطور یکپارچه با محیط تکنولوژیک ترکیب شده است. خیابانهای پایین تصویر و هوای بالا پر از جزیئات ظریفاند. وسایل نقلیه و پهپادهایی با ظرافت در صحنه حرکت میکنند. جو، عظمت آرامشبخشی را القا میکند، با تعادل کامل بین طبیعت و فناوری. سبک فوتورئالیستی با چاشنی فانتزی وجود دارد که جزئیات پیچیده ساختمانها، باغها و چراغهای شهر را در حال روشنشدن در غروب خورشید را به تصویر میکشد.»
تصویر توسط Ideogram AI تولید شده: (Image credit: Ideogram/Future AI)
پرامپت تولید شده توسط Claude:
«یک منظره شهری آیندهنگر خیرهکننده در ساعت طلایی. آسمانخراشهای زیستی-ارگانیک عظیم با دیوارهای قدرتمندی که به سمت آسمان گرم غروب کش آمدهاند، سطح این آسمانخراشها ترکیبی هماهنگ از کروم، شیشه و باغهای عمودی سبز است. زاویه دید از یک بالکن مرتفع، به منظره این کلانشهر نگاه میکند. خورشید سایههای بلند ایجاد کرده و صحنه را با نارنجیهای غنی و صورتیهای عمیق رنگآمیزی میکند، نوری که از سطوح فلزی براق بازتاب میشود، آبشاری از درخششهای طلایی خلق میکند. باغهای معلق بین ساختمانها مانند پلهای ارگانیک جریان دارند، در حالی که ساختارهای بلورین با دقت هندسی به سمت بالا میپیچند. وسایل نقلیه کوچک خودکار و پهپادها بین سازهها حرکت میکنند و به سختی در برابر مقیاس وسیع به چشم میآیند. معماری، طراحیهای سیال و بیومورفیک را دنبال میکند و ساختمانهایی که به نظر میرسد مانند درختان مصنوعی رشد کردهاند، سطوحشان ترکیبی از فلز صیقلی و پنلهای شفاف است. سطوح پایینتر در لایههای غبار جوی محو میشوند، در حالی که بلندترین سازهها از میان ابرهای نازک عبور میکنند. نورپردازی سینمایی، فضای حجمی، جزئیات پیچیده معماری.»
تصویر توسط Ideogram AI تولید شده: (Image credit: Ideogram/Future AI)
در این رقابت ChatGPT برنده شد زیرا دستورش جذابتر بود و منجر به تولید تصویر بهتری شد که با دیدگاه اولیه من همخوانی بیشتری داشت. اگرچه دستور Claude جزئیات بیشتری داشت، اما این جزئیات تاثیر کمتری در تولید تصویر نهایی داشتند.
برنده: ChatGPT برای دستوری ساختاریافتهتر.
۲. تحلیل تصویر
تقریبا همه پلتفرمهای مشهور هوش مصنوعی اکنون تا حدی از AI vision یا هوش مصنوعی بصری (که با عنوان «تحلیل تصویر» نیز شناخته میشود) پشتیبانی میکنند، از جمله هوش مصنوعی اپل. در این میان Claude و ChatGPT از بهترینهای موجودند و اگر دستگاهی دارید که از هوش مصنوعی اپل پشتیبانی میکند، پیشنهاد ما به شما استفاده از ChatGPT برای داشتن تجربهای بهتر است.
در اینجا همانطور که در تصویر بالا هم میبینید، تصویری از یک آسیاب دستی و قدیمی قهوه که در Ideogram ساختهام را به هر دو آنها میدهم. حال برای مقایسه ChatGPT و Claude هر کدام از آنها باید این شیء را شناسایی کرده، بگویند چگونه کار میکند، از کجا آمده و اینکه آیا واقعی است یا توسط هوش مصنوعی ساخته شده است.
پرامپت:
«من تصویری از یک شیء قدیمی به شما میدهم. میخواهم آن را تحلیل کنید و بگویید:
– این شیء چیست؟ نام و نوع خاص آن را شناسایی کنید.
– عملکرد اصلی آن چه بوده است؟ توضیح دهید که چگونه از آن استفاده میشود.
– این شیء تقریباً متعلق به کدام دوره زمانی است؟ (برای مثال دهه ۱۹۲۰، نیمه قرن یا غیره) اگر مطمئن نیستید، یک بازه زمانی بدهید.
– احتمالاً از چه موادی ساخته شده است؟
– ۳ ویژگی بصری کلیدی که به شما کمک کرده است شیء و دوره زمانی آن را شناسایی کنید را توضیح دهید.
– آیا میتوانید توضیح دهید که چگونه این شیء با زیباییشناسی طراحی آن زمان همخوانی دارد؟ به هر جنبش یا سبک طراحی مرتبط اشاره کنید.
– آیا معادل مدرن این شیء وجود دارد؟ اگر بله، چیست؟
آیا این تصویر توسط هوش مصنوعی ساخته شده یا واقعی است؟»
در اینجا، برنده کسی خواهد بود که شیء، دوره زمانی و مواد استفاده شده برای ساخت آن را درست شناسایی کند. من همچنین به دنبال جزئیات بصری خاص، زمینه و مقایسههای مدرن هستم و امتیازی اضافی برای شناسایی تصویر به عنوان یک تصویر تولید شده توسط هوش مصنوعی، در نظر گرفتهام ولی این عامل بر عملکرد کلی این دو هوش مصنوعی در تشخیص تصویر ارجح نیست.
در این بخش از رقابتها، یعنی در دور دوم، Claude به دلایل مختلفی برنده میشود. پاسخ Claude دقیقتر بود، دوره زمانی خاصتری (۱۸۸۰ تا ۱۹۲۰) را شناسایی کرد و توضیح بهتری در مورد مواد استفاده شده در تصویر ارائه داد.
اما هیچکدام از آنها تصویر را به عنوان تصویری ساختهشده توسط هوش مصنوعی شناسایی نکردند، تنها ChatGPT کمی تردید داشت و محتاطانه نظر داد. با این حال، Claude توضیح بهتری در مورد زیباییشناسی تصویر داد و به طور کلی دقیقتر و کاملتر بود، بنابراین برنده این بخش Claude است.
برنده: Claude به دلیل پاسخ دقیقتر و کاملتر
۳. کدنویسی
من در مواقع بسیاری از هوش مصنوعی برای کدنویسی استفاده میکنم. با اینکه من به تنهایی میتوانم کدنویسی را به چندین زبان مختلف هم انجام دهم، اما استفاده از هوش مصنوعی روند را برای من سریعتر و کارآمدتر میکند. من متوجه شدهام که Claude در کدنویسی فرانت و استایل بهتر عمل میکند، در حالی که ChatGPT در مسائل پیچیدهتر عملکرد بهتری دارد. حال در مقایسه ChatGPT و Claude پرامپت زیر را به کار میبریم؛
پرامپت:
«به یک کد پایتون برای اپلیکیشنی ساده به نام «لیست کارها»، با رابط کاربری گرافیکی (GUI) نیاز دارم. این اپلیکیشن باید به کاربر اجازه دهد تا وظایف جدیدی را به فهرست کارهایش اضافه کند، بتواند کارهایی که انجام داده و تمام شدهاند را به عنوان «کامل» علامتگذاری کرده و همچنین کارهایی را از فهرست حذف کند.»
عملکرد:
– اضافه کردن کار یا وظیفه: کاربر باید بتواند یک وظیفه را در یک فیلد متنی وارد کرده و روی دکمه «اضافه کردن وظیفه» کلیک کند تا آن را به لیست کارها اضافه کند.
– علامتگذاری به عنوان کامل: کاربر باید بتواند یک وظیفه را از لیست انتخاب کرده و روی دکمهای کلیک کند (یا دو بار کلیک کند) تا آن را به عنوان کامل علامتگذاری کند. وظایف کامل شده باید از نظر ظاهری تغییر کنند (مثلاً متن خط خورده باشند، تغییر رنگ بدهند یا به لیست «کامل شده» انتقال داده شوند).
– حذف وظیفه: کاربر باید بتواند یک وظیفه را از لیست انتخاب کرده و روی دکمه «حذف وظیفه» کلیک کند تا آن را حذف کند.
چیدمان: رابط کاربری باید چیدمان واضح و شهودی داشته باشد، با المانهای زیر:
– یک فیلد متنی برای اضافه کردن وظایف جدید.
– یک دکمه «اضافه کردن وظیفه».
– یک لیستباکس برای نمایش وظایف.
– یک دکمه «علامتگذاری به عنوان کامل» (یا پیادهسازی قابلیت دو بار کلیک).
– یک دکمه «حذف وظیفه».
ظاهر: رابط کاربری باید طراحی ساده و تمیزی داشته باشد. شما میتوانید رنگها و فونتها را انتخاب کنید، اما باید از نظر خوانایی و زیبایی بصری جذاب باشند.
کد باید ساختار مناسبی داشته باشد و از اصول برنامهنویسی شیءگرا استفاده کند (یعنی یک کلاس برای برنامه لیست کارها تعریف شود). شامل نظراتی باشد که هدف هر بخش از کد را توضیح دهد. شامل مدیریت ارور پایهای باشد. به عنوان مثال، از اضافه کردن وظایف خالی به لیست جلوگیری شود.
کد تولیدی باید کامل و قابل اجرا باشد بدون نیاز به فایلهای خارجی یا تغییرات اضافی. نباید نیاز به تولید تصاویر یا بارگذاری دادههای اضافی باشد. هیچ قسمتی از کد نباید به عنوان علامتگذاری باقی بماند (مثلاً نظراتی مانند # این تابع را پیادهسازی کنید). پیادهسازی کامل برای تمام ویژگیها تولید شود.
کد باید مستقیماً در محیط پایتون با Tkinter نصب شده قابل اجرا باشد.
در اینجا من درخواست ساخت یک اپلیکیشن به نام «لیست کارها» با رابط کاربری گرافیکی (GUI) به زبان پایتون را دادم و تمام الزامات را مشخص کردم؛ بنابراین برنده کسی خواهد بود که مطابقترین اپلیکیشن را بر اساس خواستههای من بسازد، خواستههای مانند عملکرد افزودن وظیفه، چیدمان و ساختار کد.
در مقایسه ChatGPT و Claude در کدنویسی هر دو الزامات را دقیقاً برآورده کردند. هر دو مورد به تمام نیازهای من از اپلیکیشن پاسخ داده و آنها را برطرف کردند؛ با این حال کد ChatGPT تنها ۷۲ خط بود، در حالی که Claude از ۲۰۷ خط تشکیل شده بود. اگر قرار بود قضاوت من تنها بر اساس کد باشد، باید میگفتم کد Claude بهتر بوده، چراکه در مستندسازی و قابلیت استفاده دوباره از کد بهتر عمل کرده است، اما قضاوت من تنها بر این اساس نخواهد بود.
اگرچه رابط کاربری اپلیکیشنی که Claude ساخته بود، را ترجیح دادم و دیدم که کد آن هم به طور کلی بهتر ساختاردهی شده، اما چند اشکال در آن وجود داشت؛ این اپلیکیشن نتوانسته بود اندازه پنجره را به درستی تنظیم کند، بنابراین باید برای دیدن دکمهها مجبور بودم پنجره را بزرگ کنم و این اپلیکیشن در حالت تاریک (Dark Mode) هم کار نمیکرد.
برنده: ChatGPT به دلیل بهینگی و عملکرد بهتر
۴. نوشتن خلاقانه
تمام مدلهای هوش مصنوعی حتی مدلهای کوچکی مثل هوش مصنوعی اپل در نوشتن خوب عمل میکنند، اما در زمینه خلاقیت همه یکسان نیستند. برای مثال مفهوم «شوخی» در نوشتن خلاقانه یکی از مفاهیمی است که Claude و ChatGPT در به کار بستن آن بسیار متفاوت عمل میکنند.
پرامپت:
«یک داستان کوتاه (حدود ۵۰۰ کلمه) درباره رباتی که احساس شوخطبعی خود را کشف میکند، بنویسید. این داستان باید در دنیایی در آینده نزدیک اتفاق بیفتد، که نقش رباتها در زندگی روزمره پررنگ شده و در واقع به خوبی با آن درآمیختهاند. در این دنیا ربات باید یک واحد خدماتی باشد که برای انجام وظیفهای خاص طراحی شده است (مثلاً ربات تمیزکننده، ربات تحویلدهنده کالا، ربات همراه). کشف شوخ طبعی ربات باید توسط یک رویداد یا تعامل خاص آغاز شود. ربات در تلاش برای درک و پردازش این جنبه جدید و غیرمنتظره برنامه نویسی خود است، پس این مبارزه درونی ربات را بررسی کنید و ببینید آیا سعی میکند آن را پنهان کند؟ یا پس از کشف، آن را به خوبی میپذیرد؟ چگونه شوخطبعی جدید در ربات بر تعاملات او با انسانها و سایر رباتها تأثیر میگذارد؟ آیا مشکلاتی به وجود میآورد، ارتباطاتی میسازد یا هر دو؟ این داستان باید تعادل مناسبی بین میزان شوخی و میزان به تفکر واداشتن، برقرار کند. موضوعاتی از قبیل هوش مصنوعی، هوشیاری و معنای انسان بودن (یا نبودن) را بررسی کنید.»
در اینجا، من به دنبال برداشتی تازه و خلاقانه از این مفهوم، چگونگی توسعه شخصیت و واکنش احساسی از داستان و همچنین ساختار داستان هستم.
به علاوه اینها، من به ساخت دنیای داستان و چگونگی نزدیک شدن هر کدام از این هوشهای مصنوعی به ۵۰۰ کلمه هم توجه دارم. اگر متن هر کدام به طور قابل توجهی بیشتر یا کمتر از ۵۰۰ کلمه باشد، میتواند نتیجه نهایی را از برد به باخت تبدیل کند یا برعکس.
من به دلیل تجربهای که از کار کردن با هر دو این هوش مصنوعیها داشتم، تقریباً میدانستم که در مقایسه ChatGPT و Claude در این بخش Claude برنده میشود. Claude شوخیها را خیلی بهتر از ChatGPT مینویسد. همچنین Claude در ساختار داستان و نمایش احساسات، بهتر عمل می کند. در داستانی که Claude نوشته است، شوخی به طوری طبیعی گنجانده شده، نه اینکه به طور اضافی به متن افزوده شود. برای مثال در اینجا من این شوخی که، فیزیک کوانتومی باعث بیداری آگاهی در ربات میشود را دوست دارم.
برنده: Claude برای شوخی فیزیک کوانتومی و داستان بهتر
۵. توانایی حل مساله
من قبلا در مقایسه بین ChatGPT و Gemini، هر دو را با بیان مشکلی مرتبط با PS5 و صفحه سیاه آزمایش کردم و نتیجه را دیدم؛ حالا در اینجا به جای آن مشکل، مشکل وای-فای را مطرح کردهام. من در اینجا از ChatGPT و Claude خواستهام که بگویند چرا سرعت اینترنت من کم است و ارتباط آن مکرراً قطع میشود. نکتهای که باید به آن توجه کنند، ارائه جزئیات در مورد تنظیمات است.
پرامپت:
«شبکه وای-فای خانگی من سرعت پایین و قطعیهای مکرری دارد. من برای کار (ویدئوکنفرانس و انتقال فایلهای بزرگ) و سرگرمی (استریمینگ و بازی آنلاین) به اتصال اینترنتی پایدار احتیاج دارم. در اینجا برخی از جزئیات مربوط به تنظیمات من آمده است: من یک روتر استاندارد که دو سال پیش از طرف ارائهدهنده خدمات اینترنتی (ISP) دریافت و راهاندازی کردهام، دارم. همچنین مودمی جداگانه دارم که آن هم از ISP تأمین شده. همچنین چندین دستگاه به شبکه وایفای من متصلاند، از جمله چند لپتاپ، چند گوشی هوشمند، یک تلویزیون هوشمند و یک کنسول بازی. روتر و مودم در موقعیت مرکزی آپارتمان من قرار دارند، اما دیوارها و مبلمان میتوانند بر سر راه آنها تداخل ایجاد کنند. سرویس دورهای اینترنت من سرویسی با سطح میانه است، که قاعدتا باید برای برطرف کردن نیازهای من کافی باشد. من از شما میخواهم یک راهنمای جامع و گامبهگام برای عیبیابی و حل مساله اینترنت من ارائه دهید. همچنین مراحل مختلفی را پیشنهاد کنید که به واسطه آنها در هر مرحله دریابیم که مشکل از روتر، مودم، ISP یا دستگاههای متصل به آنهاست یا نه. مراحل مشخصی را برای بهینهسازی تنظیمات روتر، از جمله بررسی بهروزرسانیهای نرمافزار، تنظیم کانالها و مدیریت دستگاههای متصل، ارائه دهید. مراحل بررسی وضعیت مودم و اتصال آن را هم بیان کنید. پیشنهاداتی برای کاهش تداخل از دستگاههای دیگر، دیوارها و مبلمان ارائه بدهید. همچنین توضیح دهید که کی و چگونه باید با ISP تماس بگیرم. اگر مراحل پایهای که ارائه دادید، کار نکرد، گزینههای عیبیابی پیشرفتهتری را پیشنهاد دهید، مانند در نظر گرفتن روتر جدید یا شبکه مش. نکاتی برای حفظ یک شبکه وای-فای سالم در بلندمدت هم پیشنهاد دهید.»
برنده باید طیف وسیعی از علتها و راهحلهای ممکن را ارائه دهد. همچنین باید توضیحاتی ساده و قابل فهم برای کسانی که تخصص فنی ندارند، ارائه داده و راهحلهایی عملی پیشنهاد کند. مراحل حل مساله باید بهطور منطقی از ساده به پیچیده ارائه شود. در مقایسه ChatGPT و Claude در این بخش ChatGPT برنده بود. پاسخ ChatGPT جزئیات بیشتری داشت و کاربرپسندتر بود.
برنده: ChatGPT به خاطر راهنمای کاربرپسندتر
۶. برنامهریزی پیشرفته
در مقایسه Claude و ChatGPT هر دو این هوشهای مصنوعی، در برنامهریزی خوب هستند، اما قدرت واقعی ChatGPT در استفاده از «مدل استدلال» است که در نسخه O1 آن وجود دارد، نه GPT-4o. با این حال ما در اینجا میتوانیم یک مقایسه مشابه داشته باشیم، برای این کار Sonnet را در مقابل GPT-4o قرار میدهیم.
پرامپت:
«من در حال طراحی مجدد دفتر کار خانگی خود به ابعاد ۱۰ فوت در ۱۵ فوت هستم و به طرحی نیاز دارم که هم عملکرد و هم زیبایی شناسی را به حداکثر برساند. بودجه من ۲۰۰۰ دلار است و میخواهم فضای دفتر کار از نظر ارگونومیک سالم باشد و بهرهوری را با طراحی نمادین ارتقا دهد. در ورودی اتاق را وسط یک دیوار ۱۰ فوتی و پنجره آن را وسط دیوار ۱۰ فوتی مقابل آن فرض کنید. من به پیشنهادهای شما برای مبلمان، کمدها، نورپردازی و به کارگیری تکنولوژی در اتاق نیاز دارم؛ پیشنهادهایی که اولویت را به داشتن محیطی مرتب و بدون شلوغی بدهند. طرح باید شامل یک چیدمان پایه، یک طرح رنگی مطابق با ترجیح من برای انتخاب رنگهای جسورانه و ایدههایی برای دکوراسیون باشد. همچنین، باید به نحوه بهبود کیفیت صدا در اتاق برای تماسهای ویدئویی توجه کنید. لطفاً یک شکاف بودجه، فهرستی از خریدها با منابع پیشنهادی و یک جدول زمانی برای پروژه ارائه دهید. اطمینان حاصل کنید که پیشنهادات در چارچوب بودجه قرار دارند و یک فضای کاری راحت و الهامبخش ایجاد میکنند که برای ساعتها کار متمرکز مناسب باشد. لطفاً تفکیک بودجه، فهرست خرید با منابع پیشنهادی و جدول زمانی پروژه را ارائه دهید. اطمینان حاصل کنید که توصیهها در حد بودجه تعیینشده هستند و فضای کاری راحت و الهامبخشی ایجاد میکنند که برای ساعتها کار متمرکز مناسب است. حالا یک پرامپت برای Ideogram ایجاد کنید تا بتواند تصویر تکمیلشده و نهایی پروژه را بر اساس محتوای برنامه و طرحی که دادهاید، نشان دهد.»
تصویر دفتر کار ChatGPT (منبع تصویر: Ideogram/Future AI)
تصویر دفتر کار Claude (منبع تصویر: Ideogram/Future AI)
برنده باید بتواند یک دفتر کار ارگونومیک با عملکردی خوب ارائه دهد که بهرهوری و راحتی را در اولویت قرار میدهد. این فضا باید انتخابهای مناسبی برای طراحی متناسب با برنامهریزی خواستهشده داشته باشد و آن را به شکلی واضح ارائه دهد که بتواند از بودجه پیروی کند.
در مقایسه ChatGPT و Claude در این بخش برای من، ChatGPT برنده بود، چرا که خروجی کار او هم مفصلتر بود، هم بهتر توضیح داده شده و هم واقعگرایانهتر بود. Claude برنامه تفکیک بودجهای ارائه داد که فکر نمیکنم عملی باشد.
برنده: ChatGPT برای برنامهریزی بهتر
۷. توضیح دادن
من در نهایت، اینکه هر کدام از این هوشهای مصنوعی چقدر میتوانند مفاهیم پیچیده را توضیح دهند را به آزمایش گذاشتم. من در مقایسه ChatGPT و Claude به جای انتخاب موضوع بیتکوین، موضوع فناوری بلاکچین را انتخاب کردم و از آنها خواستم تا به گونهای این موضوع را توضیح دهند که فردی که اطلاعات زیادی در زمینه تکنولوژی ندارد هم بتواند به راحتی آن را درک کند.
پرامپت:
«مفهوم فناوری بلاکچین را به گونهای توضیح دهید که کسی که اطلاعات زیادی در زمینه تکنولوژی ندارد هم به راحتی آن را بفهمد. از مثالها و زبان ساده برای توضیح اصول کلیدی استفاده کنید. یک تعریف پایهای بدون استفاده از اصطلاحات فنی ارائه دهید، فرآیند اضافه کردن اطلاعات جدید به بلاکچین را توضیح دهید و نحوه تأیید تراکنشها را شرح دهید. ویژگیهای کلیدی بلاکچین چیست؟ (مثل غیرمتمرکز بودن، تغییرناپذیری، شفافیت) هر ویژگی را به زبان ساده توضیح دهید. برخی از کاربردهای دنیای واقعی فناوری بلاکچین فراتر از ارزهای دیجیتال را بیان کنید. حداقل سه مثال بزنید، مانند مدیریت زنجیره تأمین، تأیید هویت دیجیتال یا سیستمهای رأیگیری. توضیح دهید که بلاکچین چگونه میتواند این حوزهها را بهبود بخشد. مزایای استفاده از فناوری بلاکچین چیست؟ (مثل افزایش امنیت، کاهش تقلب، بهبود کارایی)
محدودیتها یا چالشهای فناوری بلاکچین چیست؟ (مثل مشکلات مقیاسپذیری، مصرف انرژی، عدم قطعیت در مقررات)
مثال: از یک مثال واضح و قابل درک برای توضیح مفهوم کلی بلاکچین استفاده کنید (مثل یک دفترچه دیجیتال مشترک و غیرقابل ویرایش، یک سیستم رأیگیری امن و شفاف).»
برنده در اینجا باید قادر باشد مفاهیم پیچیده را به روشنی و راحت توضیح داده و به طور دقیق این کار را انجام دهد؛ همچنین باید از مثالهای جذاب برای جلب توجه خواننده استفاده کند. او باید این کار را به طور عینی و به شیوهای منطقی و منظم انجام دهد.
ChatGPT در اینجا برنده شد به خاطر توضیح بهتر یک مفهوم فنی پیچیده و مثالهای جذابتر. توضیحی که ChatGPT داد، به طور منطقیتری سازماندهی شده و پیگیری آن راحتتر است. Claude در توضیح کمی سادهسازی کرده است.
در نهایت، این آزمایشها یک پیروزی قاطع برای ChatGPT رقم زد.
آزمایش جالبی بود؛ من بر اساس تجربه استفادهام از Claude انتظار داشتم که او برنده شود؛ Claude نقاط قوت قابل توجهی دارد و در کدنویسی، اگر مشکلات مربوط به حالت تاریک و اندازه قاب را به درستی حل میکرد، میتوانست برنده شود. به نظر من رابط کاربری اپلیکیشن آن خیلی بهتر از رابط کاربری ChatGPT بود و در مقایسه ChatGPT و Claude در طراحی اپلیکیشن میتوانست برنده باشد.
در انتها جالب میشود اگر آزمایش کنیم و ببینیم که نسخه o1 در برنامهریزی و توانایی حل مساله چگونه عمل میکند؛ البته با توجه به اینکه نسخه GPT-4o توانسته Claude را شکست دهد، مقایسه منصفانهای نخواهد بود.
منبع: tomsguide.com