مقایسه ChatGPT و Claude با ۷ پرامپت؛ برنده کدام است؟

آزاده باقری

۲۶ دی ۱۴۰۳ | ۱۷:۳۰ زمان مورد نیاز برای مطالعه: ۱۹ دقیقه

شرکت Open AI اولین بار ChatGPT را بیش از دو سال پیش به جهان معرفی کرد و از آن زمان به بعد بود که رقابت در این حوزه افزایش چشمگیری یافت. این رقابت فقط محدود به حوزه‌های تولید تصویر با هوش مصنوعی نمی‌شد، بلکه تمرکزش بر توسعه یک هوش مصنوعی با قابلیت‌های متنوع در زمینه‌های ارتباطات متنی و تصویری بود؛ این محصولات رقیب عبارت بودند از: Gemini از گوگل، Grok از xAI و البته Claude از Anthropic. در مقایسه ChatGPT و Claude متوجه خواهید شد که هر دو هوش مصنوعی ویژگی‌های مشابهی دارند. به عنوان مثال، شرکت Anthropic قابلیت Artifacts را برای نمایش و اجرای کد به Claude اضافه کرد و پس از آن شرکت OpenAI ابزار Canvas را در ChatGPT راه‌اندازی کرد.

با این حال علی رغم این شباهت‌ها، تفاوت‌های قابل توجهی هم میان این دو هوش مصنوعی وجود دارد. به عنوان مثال، ChatGPT به DALL-E برای تولید تصاویر دسترسی دارد، در حالی که Claude برای تولید تصاویر به چنین ابزاری در درون خود و به شکل محلی، دسترسی ندارد. همچنین Claude در جستجوی خود، برخلاف جستجوی ChatGPT، به داده‌های زنده دسترسی ندارد و همچنین هنوز از «مدل استدلالی» هم استفاده نمی‌کند.

لپ تاپ 15.6 اینچی لنوو مدل Ideapad 1-Celeron N4020-4GB DDR4-256SSD-TN

لپ تاپ ۱۵.۶ اینچی لنوو مدل Ideapad 1-Celeron N4020-4GB DDR4-256SSD-TN

۱۵,۹۹۰,۰۰۰

تومان

لپ تاپ 15.6 اینچی ایسوس مدل Vivobook 15 F1504VA-NJ823-i5 1335U-12GB DDR4-512GB SSD-TN-Fingerprint-Backlit

لپ تاپ ۱۵.۶ اینچی ایسوس مدل Vivobook 15 F1504VA-NJ823-i5 1335U-12GB DDR4-512GB SSD-TN-Fingerprint-Backlit

۳۹,۸۷۰,۰۰۰

تومان

خرید لپ‌تاپ از دیجی‌کالا

مشاهده همه

من برای مقایسه ChatGPT و Claude تعدادی پیام دستوری یا پرامپت (prompt) را طراحی کردم که برای هر دو آن‌ها به شکلی مشابه عمل می‌کند؛ همچنین تمامی آزمایش‌ها را با Claude Sonnet 3.5 و OpenAI GPT-4o و بدون ویژگی‌های اضافی انجام دادم.

ساخت پیام‌های دستوری یا پرامپت‌ها

برای این مقایسه در ساخت پرامپت‌ها از همان بخش‌ها و ساختارهایی استفاده کردم که در آزمایش مشهور ChatGPT و Gemini استفاده شده بود؛ آزمایشی که به تازگی در طی آن ChatGPT هوش مصنوعی پرچم‌دار گوگل را شکست داد.

در این هفت پرامپت، توانایی‌های این دو هوش مصنوعی را در تحلیل تصاویر، تولید کد، نوشتن و حل مسئله آزمایش می‌کنیم. از آنجا که Claude خودش به تنهایی نمی‌تواند تصویر تولید کند، از هر دو این هوش‌های مصنوعی خواستم تا یک پرامپت ایجاد کنند، سپس با استفاده از ابزار Ideogram و کدهای دستوری، تصاویر را تولید کردم.

۱. تولید تصویر

این بخش یا این آزمایش اولین قدم برای درک نحوه ساخت دستوراتی است که من برای تولید تصاویر دادم و می‌تواند به شما هم برای ساخت پرامپت مناسب کمک کند. من معمولاً یک متن راهنمای کلی برای پرامپت مد نظرم می‌نویسم و سپس از ChatGPT، Claude یا Gemini می‌خواهم با توجه به این راهنمای کلی که برایشان نوشته‌ام، برای من یک پرامپت مناسب تولید کنند. حال پرامپتی که هر کدام از هوش مصنوعی‌ها برایم تولید کرده‌اند را به تولیدکننده تصاویری مثل Ideogram می‌دهم و اکنون می‌توانم مقایسه کنم که کدام یک از این هوش مصنوعی‌ها در تولید پرامپت مناسب برای تولید تصویر قوی‌تر عمل کرده است. (به تصویر بالا نگاه کنید)

من در ابتدا دستورالعمل‌هایی در مورد محتوایی که باید در پرامپت قرار داشته باشد، به آن‌ها ارائه دادم. مزیت این روش این است که پس از تنظیم پرامپت اولیه مدنظر، در یک مکالمه جدید، می‌توانید بدون نیاز به ذکر مجدد تمام جزئیات، فقط بگویید «یک مورد دیگر بساز» یا «همین را تغییر بده و x را عوض کن».

پرامپت:
*متن اولیه‌ای که برای مقایسه ChatGPT و Claude به هر کدام داده شد تا بر اساس آن پرامپت نهایی را بسازند:

«می‌خواهم یک دستور دقیق برای یک تصویر ایجاد کنی که بتوانم از آن در یک تولیدکننده تصویر هوش مصنوعی مثل Midjourney استفاده کنم. تصویر باید یک منظره شهری در آینده (آینده‌نگر) باشد که غروب خورشید را نشان دهد. تصور کن ترکیبی از عناصر ارگانیک و تکنولوژیک با هم در تصویر وجود داشته باشند. ساختمان‌های بلند با باغ‌های عمودی سرسبز در هم تنیده هم باشند. شهر باید هم وسیع و هم پیچیده به نظر برسد.

عناصر خاصی که باید در دستور وجود داشته باشد:
– نورپردازی: ساعت طلایی (به ساعتی در نزدیکی غروب گفته می‌شود که همه چیز در معرض نور خورشید، رنگی طلایی رنگ به خود می‌گیرند) با سایه‌های بلند و آسمانی گرم و پرجنب‌وجوش. با بازتاب‌های نوری که روی سطوح فلزی گنجانده شده‌اند.
– زاویه دید: نمای گسترده از موقعیتی کمی بالاتر، گویی از یک بالکن به شهر نگاه می‌کنید.
– پالت رنگی: عمدتاً رنگ‌های گرم (نارنجی، زرد، صورتی) برای آسمان، در تضاد با تن‌های رنگی فلزیِ سرد (آبی، نقره‌ای) و سبزی گیاهان.
– سبک معماری: ترکیبی از آسمان‌خراش‌های براق و آینده‌نگر و ساختارهای بیومورفیک که شبیه گیاهان عظیم در هم تنیده باشند.
– جو: احساسی از عظمت آرامش‌بخش. شاید چند وسیله نقلیه یا پهپاد آینده‌نگر به آرامی در آسمان حرکت کنند.
– سبک هنری: فوتورئالیسم با کمی چاشنی فانتزی.»

پرامپت تولید شده توسط ChatGPT:

«یک منظره شهری آینده‌نگر خیره‌کننده در غروب خورشید، از بالکنی کمی مرتفع دیده می‌شود. صحنه در نور گرم ساعت طلایی غرق شده، با سایه‌های بلند که در شهر کشیده شده‌اند. آسمان به‌صورت طیف رنگی پرجنب‌وجوشی از نارنجی، زرد و صورتی است که به زیبایی با تن‌های رنگی فلزی سرد در ساختمان‌ها و سبزی باغ‌ها و گیاهان عمودی در تضاد است. آسمان‌خراش‌های بلند با طراحی‌های براق و آینده‌نگر به سمت آسمان کشیده شده‌اند، سطوحشان با بازتاب‌های طلایی می‌درخشد. در میان آن‌ها، ساختارهای بیومورفیک شبیه گیاهان زنده عظیم در هم تنیده‌اند، فرم‌های ارگانیکشان به‌طور یکپارچه با محیط تکنولوژیک ترکیب شده است. خیابان‌های پایین تصویر و هوای بالا پر از جزیئات ظریف‌اند. وسایل نقلیه و پهپادهایی با ظرافت در صحنه حرکت می‌کنند. جو، عظمت آرامش‌بخشی را القا می‌کند، با تعادل کامل بین طبیعت و فناوری. سبک فوتورئالیستی با چاشنی فانتزی وجود دارد که جزئیات پیچیده ساختمان‌ها، باغ‌ها و چراغ‌های شهر را در حال روشن‌شدن در غروب خورشید را به تصویر می‌کشد.»

هر آنچه در مورد مدل هوش مصنوعی GPT-4o باید بدانید

تصویر توسط Ideogram AI تولید شده: (Image credit: Ideogram/Future AI)

پرامپت تولید شده توسط Claude:

«یک منظره شهری آینده‌نگر خیره‌کننده در ساعت طلایی. آسمان‌خراش‌های زیستی-ارگانیک عظیم با دیوارهای قدرتمندی که به سمت آسمان گرم غروب کش آمده‌اند، سطح این آسمان‌خراش‌ها ترکیبی هماهنگ از کروم، شیشه و باغ‌های عمودی سبز است. زاویه دید از یک بالکن مرتفع، به منظره این کلان‌شهر نگاه می‌کند. خورشید سایه‌های بلند ایجاد کرده و صحنه را با نارنجی‌های غنی و صورتی‌های عمیق رنگ‌آمیزی می‌کند، نوری که از سطوح فلزی براق بازتاب می‌شود، آبشاری از درخشش‌های طلایی خلق می‌کند. باغ‌های معلق بین ساختمان‌ها مانند پل‌های ارگانیک جریان دارند، در حالی که ساختارهای بلورین با دقت هندسی به سمت بالا می‌پیچند. وسایل نقلیه کوچک خودکار و پهپادها بین سازه‌ها حرکت می‌کنند و به سختی در برابر مقیاس وسیع به چشم می‌آیند. معماری، طراحی‌های سیال و بیومورفیک را دنبال می‌کند و ساختمان‌هایی که به نظر می‌رسد مانند درختان مصنوعی رشد کرده‌اند، سطوحشان ترکیبی از فلز صیقلی و پنل‌های شفاف است. سطوح پایین‌تر در لایه‌های غبار جوی محو می‌شوند، در حالی که بلندترین سازه‌ها از میان ابرهای نازک عبور می‌کنند. نورپردازی سینمایی، فضای حجمی، جزئیات پیچیده معماری.»

تصویر توسط Ideogram AI تولید شده: (Image credit: Ideogram/Future AI)

در این رقابت ChatGPT برنده شد زیرا دستورش جذاب‌تر بود و منجر به تولید تصویر بهتری شد که با دیدگاه اولیه من همخوانی بیشتری داشت. اگرچه دستور Claude جزئیات بیشتری داشت، اما این جزئیات تاثیر کمتری در تولید تصویر نهایی داشتند.

برنده: ChatGPT برای دستوری ساختاریافته‌تر.

۲. تحلیل تصویر

تقریبا همه‌ پلتفرم‌های مشهور هوش مصنوعی اکنون تا حدی از AI vision یا هوش مصنوعی بصری (که با عنوان «تحلیل تصویر» نیز شناخته می‌شود) پشتیبانی می‌کنند، از جمله هوش مصنوعی اپل. در این میان Claude و ChatGPT از بهترین‌های موجودند و اگر دستگاهی دارید که از هوش مصنوعی اپل پشتیبانی می‌کند، پیشنهاد ما به شما استفاده از ChatGPT برای داشتن تجربه‌ای بهتر است.

در اینجا همان‌طور که در تصویر بالا هم می‌بینید، تصویری از یک آسیاب دستی و قدیمی قهوه که در Ideogram ساخته‌ام را به هر دو آن‌ها می‌دهم. حال برای مقایسه ChatGPT و Claude هر کدام از آن‌ها باید این شیء را شناسایی کرده، بگویند چگونه کار می‌کند، از کجا آمده و اینکه آیا واقعی است یا توسط هوش مصنوعی ساخته شده است.

پرامپت:

«من تصویری از یک شیء قدیمی به شما می‌دهم. می‌خواهم آن را تحلیل کنید و بگویید:

– این شیء چیست؟ نام و نوع خاص آن را شناسایی کنید.
– عملکرد اصلی آن چه بوده است؟ توضیح دهید که چگونه از آن استفاده می‌شود.
– این شیء تقریباً متعلق به کدام دوره زمانی است؟ (برای مثال دهه ۱۹۲۰، نیمه قرن یا غیره) اگر مطمئن نیستید، یک بازه زمانی بدهید.
– احتمالاً از چه موادی ساخته شده است؟
– ۳ ویژگی بصری کلیدی که به شما کمک کرده است شیء و دوره زمانی آن را شناسایی کنید را توضیح دهید.
– آیا می‌توانید توضیح دهید که چگونه این شیء با زیبایی‌شناسی طراحی آن زمان همخوانی دارد؟ به هر جنبش یا سبک طراحی مرتبط اشاره کنید.
– آیا معادل مدرن این شیء وجود دارد؟ اگر بله، چیست؟
آیا این تصویر توسط هوش مصنوعی ساخته شده یا واقعی است؟»

در اینجا، برنده کسی خواهد بود که شیء، دوره زمانی و مواد استفاده شده برای ساخت آن را درست شناسایی کند. من همچنین به دنبال جزئیات بصری خاص، زمینه و مقایسه‌های مدرن هستم و امتیازی اضافی برای شناسایی تصویر به عنوان یک تصویر تولید شده توسط هوش مصنوعی، در نظر گرفته‌ام ولی این عامل بر عملکرد کلی این دو هوش مصنوعی در تشخیص تصویر ارجح نیست.

در این بخش از رقابت‌ها، یعنی در دور دوم، Claude به دلایل مختلفی برنده می‌شود. پاسخ Claude دقیق‌تر بود، دوره زمانی خاص‌تری (۱۸۸۰ تا ۱۹۲۰) را شناسایی کرد و توضیح بهتری در مورد مواد استفاده‌ شده در تصویر ارائه داد.

اما هیچ‌کدام از آن‌ها تصویر را به عنوان تصویری ساخته‌شده توسط هوش مصنوعی شناسایی نکردند، تنها ChatGPT کمی تردید داشت و محتاطانه نظر داد. با این حال، Claude توضیح بهتری در مورد زیبایی‌شناسی تصویر داد و به طور کلی دقیق‌تر و کامل‌تر بود، بنابراین برنده این بخش Claude است.

برنده: Claude به دلیل پاسخ دقیق‌تر و کامل‌تر

۳. کدنویسی

من در مواقع بسیاری از هوش مصنوعی برای کدنویسی استفاده می‌کنم. با اینکه من به تنهایی می‌توانم کدنویسی را به چندین زبان مختلف هم انجام دهم، اما استفاده از هوش مصنوعی روند را برای من سریع‌تر و کارآمدتر می‌کند. من متوجه شده‌ام که Claude در کدنویسی فرانت و استایل بهتر عمل می‌کند، در حالی که ChatGPT در مسائل پیچیده‌تر عملکرد بهتری دارد. حال در مقایسه ChatGPT و Claude پرامپت زیر را به کار می‌بریم؛

پرامپت:

«به یک کد پایتون برای اپلیکیشنی ساده به نام «لیست کارها»، با رابط کاربری گرافیکی (GUI) نیاز دارم. این اپلیکیشن باید به کاربر اجازه دهد تا وظایف جدیدی را به فهرست کارهایش اضافه کند، بتواند کارهایی که انجام داده و تمام شده‌اند را به عنوان «کامل» علامت‌گذاری کرده و همچنین کارهایی را از فهرست حذف کند.»

عملکرد:
– اضافه کردن کار یا وظیفه: کاربر باید بتواند یک وظیفه را در یک فیلد متنی وارد کرده و روی دکمه «اضافه کردن وظیفه» کلیک کند تا آن را به لیست کارها اضافه کند.
– علامت‌گذاری به عنوان کامل: کاربر باید بتواند یک وظیفه را از لیست انتخاب کرده و روی دکمه‌ای کلیک کند (یا دو بار کلیک کند) تا آن را به عنوان کامل علامت‌گذاری کند. وظایف کامل شده باید از نظر ظاهری تغییر کنند (مثلاً متن خط خورده باشند، تغییر رنگ بدهند یا به لیست «کامل شده» انتقال داده شوند).
– حذف وظیفه: کاربر باید بتواند یک وظیفه را از لیست انتخاب کرده و روی دکمه «حذف وظیفه» کلیک کند تا آن را حذف کند.

چیدمان: رابط کاربری باید چیدمان واضح و شهودی داشته باشد، با المان‌های زیر:
– یک فیلد متنی برای اضافه کردن وظایف جدید.
– یک دکمه «اضافه کردن وظیفه».
– یک لیست‌باکس برای نمایش وظایف.
– یک دکمه «علامت‌گذاری به عنوان کامل» (یا پیاده‌سازی قابلیت دو بار کلیک).
– یک دکمه «حذف وظیفه».

ظاهر: رابط کاربری باید طراحی ساده و تمیزی داشته باشد. شما می‌توانید رنگ‌ها و فونت‌ها را انتخاب کنید، اما باید از نظر خوانایی و زیبایی بصری جذاب باشند.

کد باید ساختار مناسبی داشته باشد و از اصول برنامه‌نویسی شیء‌گرا استفاده کند (یعنی یک کلاس برای برنامه لیست کارها تعریف شود). شامل نظراتی باشد که هدف هر بخش از کد را توضیح دهد. شامل مدیریت ارور پایه‌ای باشد. به عنوان مثال، از اضافه کردن وظایف خالی به لیست جلوگیری شود.

کد تولیدی باید کامل و قابل اجرا باشد بدون نیاز به فایل‌های خارجی یا تغییرات اضافی. نباید نیاز به تولید تصاویر یا بارگذاری داده‌های اضافی باشد. هیچ قسمتی از کد نباید به عنوان علامت‌گذاری باقی بماند (مثلاً نظراتی مانند # این تابع را پیاده‌سازی کنید). پیاده‌سازی کامل برای تمام ویژگی‌ها تولید شود.

کد باید مستقیماً در محیط پایتون با Tkinter نصب شده قابل اجرا باشد.

در اینجا من درخواست ساخت یک اپلیکیشن به نام «لیست کارها» با رابط کاربری گرافیکی (GUI) به زبان پایتون را دادم و تمام الزامات را مشخص کردم؛ بنابراین برنده کسی خواهد بود که مطابق‌ترین اپلیکیشن را بر اساس خواسته‌های من بسازد، خواسته‌های مانند عملکرد افزودن وظیفه، چیدمان و ساختار کد.

در مقایسه ChatGPT و Claude در کدنویسی هر دو الزامات را دقیقاً برآورده کردند. هر دو مورد به تمام نیازهای من از اپلیکیشن پاسخ داده و آن‌ها را برطرف کردند؛ با این حال کد ChatGPT تنها ۷۲ خط بود، در حالی که Claude از ۲۰۷ خط تشکیل شده بود. اگر قرار بود قضاوت من تنها بر اساس کد باشد، باید می‌گفتم کد Claude بهتر بوده، چراکه در مستندسازی و قابلیت استفاده دوباره از کد بهتر عمل کرده است، اما قضاوت من تنها بر این اساس نخواهد بود.

اگرچه رابط کاربری اپلیکیشنی که Claude ساخته بود، را ترجیح دادم و دیدم که کد آن هم به طور کلی بهتر ساختاردهی شده، اما چند اشکال در آن وجود داشت؛ این اپلیکیشن نتوانسته بود اندازه پنجره را به درستی تنظیم کند، بنابراین باید برای دیدن دکمه‌ها مجبور بودم پنجره را بزرگ کنم و این اپلیکیشن در حالت تاریک (Dark Mode) هم کار نمی‌کرد.

برنده: ChatGPT به دلیل بهینگی و عملکرد بهتر

۴. نوشتن خلاقانه

تمام مدل‌های هوش مصنوعی حتی مدل‌های کوچکی مثل هوش مصنوعی اپل در نوشتن خوب عمل می‌کنند، اما در زمینه خلاقیت همه یکسان نیستند. برای مثال مفهوم «شوخی» در نوشتن خلاقانه یکی از مفاهیمی است که Claude و ChatGPT در به کار بستن آن بسیار متفاوت عمل می‌کنند.

پرامپت:

«یک داستان کوتاه (حدود ۵۰۰ کلمه) درباره رباتی که احساس شوخ‌طبعی خود را کشف می‌کند، بنویسید. این داستان باید در دنیایی در آینده نزدیک اتفاق بیفتد، که نقش ربات‌ها در زندگی روزمره پررنگ شده و در واقع به خوبی با آن درآمیخته‌اند. در این دنیا ربات باید یک واحد خدماتی باشد که برای انجام وظیفه‌ای خاص طراحی شده است (مثلاً ربات تمیزکننده، ربات تحویل‌دهنده کالا، ربات همراه). کشف شوخ طبعی ربات باید توسط یک رویداد یا تعامل خاص آغاز شود. ربات در تلاش برای درک و پردازش این جنبه جدید و غیرمنتظره برنامه نویسی خود است، پس این مبارزه درونی ربات را بررسی کنید و ببینید آیا سعی می‌کند آن را پنهان کند؟ یا پس از کشف، آن را به خوبی می‌پذیرد؟ چگونه شوخ‌طبعی جدید در ربات بر تعاملات او با انسان‌ها و سایر ربات‌ها تأثیر می‌گذارد؟ آیا مشکلاتی به وجود می‌آورد، ارتباطاتی می‌سازد یا هر دو؟ این داستان باید تعادل مناسبی بین میزان شوخی و میزان به تفکر واداشتن، برقرار کند. موضوعاتی از قبیل هوش مصنوعی، هوشیاری و معنای انسان بودن (یا نبودن) را بررسی کنید.»

در اینجا، من به دنبال برداشتی تازه و خلاقانه از این مفهوم، چگونگی توسعه شخصیت و واکنش احساسی‌ از داستان و همچنین ساختار داستان هستم.

به علاوه این‌ها، من به ساخت دنیای داستان و چگونگی نزدیک شدن هر کدام از این هوش‌های مصنوعی به ۵۰۰ کلمه هم توجه دارم. اگر متن هر کدام به طور قابل توجهی بیشتر یا کمتر از ۵۰۰ کلمه باشد، می‌تواند نتیجه نهایی را از برد به باخت تبدیل کند یا برعکس.

من به دلیل تجربه‌ای که از کار کردن با هر دو این هوش مصنوعی‌ها داشتم، تقریباً می‌دانستم که در مقایسه ChatGPT و Claude در این بخش Claude برنده می‌شود. Claude شوخی‌ها را خیلی بهتر از ChatGPT می‌نویسد. همچنین Claude در ساختار داستان و نمایش احساسات، بهتر عمل می کند. در داستانی که Claude نوشته است، شوخی به طوری طبیعی گنجانده شده، نه اینکه به طور اضافی به متن افزوده شود. برای مثال در اینجا من این شوخی که، فیزیک کوانتومی باعث بیداری آگاهی در ربات می‌شود را دوست دارم.

برنده: Claude برای شوخی فیزیک کوانتومی و داستان بهتر

۵. توانایی حل مساله

من قبلا در مقایسه بین ChatGPT و Gemini، هر دو را با بیان مشکلی مرتبط با PS5 و صفحه سیاه آزمایش کردم و نتیجه را دیدم؛ حالا در اینجا به جای آن مشکل، مشکل وای-فای را مطرح کرده‌ام. من در اینجا از ChatGPT و Claude خواسته‌ام که بگویند چرا سرعت اینترنت من کم است و ارتباط آن مکرراً قطع می‌شود. نکته‌ای که باید به آن توجه کنند، ارائه جزئیات در مورد تنظیمات است.

پرامپت:

«شبکه وای-فای خانگی من سرعت پایین و قطعی‌های مکرری دارد. من برای کار (ویدئوکنفرانس و انتقال فایل‌های بزرگ) و سرگرمی (استریمینگ و بازی آنلاین) به اتصال اینترنتی پایدار احتیاج دارم. در اینجا برخی از جزئیات مربوط به تنظیمات من آمده است: من یک روتر استاندارد که دو سال پیش از طرف ارائه‌دهنده خدمات اینترنتی (ISP) دریافت و راه‌اندازی کرده‌ام، دارم. همچنین مودمی جداگانه دارم که آن هم از ISP تأمین شده. همچنین چندین دستگاه به شبکه وای‌فای من متصل‌اند، از جمله چند لپ‌تاپ‌، چند گوشی هوشمند، یک تلویزیون هوشمند و یک کنسول بازی. روتر و مودم در موقعیت مرکزی آپارتمان من قرار دارند، اما دیوارها و مبلمان می‌توانند بر سر راه آن‌ها تداخل ایجاد کنند. سرویس دوره‌ای اینترنت من سرویسی با سطح میانه است، که قاعدتا باید برای برطرف کردن نیازهای من کافی باشد. من از شما می‌خواهم یک راهنمای جامع و گام‌به‌گام برای عیب‌یابی و حل مساله اینترنت من ارائه دهید. همچنین مراحل مختلفی را پیشنهاد کنید که به واسطه آن‌ها در هر مرحله دریابیم که مشکل از روتر، مودم، ISP یا دستگاه‌های متصل به آن‌هاست یا نه. مراحل مشخصی را برای بهینه‌سازی تنظیمات روتر، از جمله بررسی به‌روزرسانی‌های نرم‌افزار، تنظیم کانال‌ها و مدیریت دستگاه‌های متصل، ارائه دهید. مراحل بررسی وضعیت مودم و اتصال آن را هم بیان کنید. پیشنهاداتی برای کاهش تداخل از دستگاه‌های دیگر، دیوارها و مبلمان ارائه بدهید. همچنین توضیح دهید که کی و چگونه باید با ISP تماس بگیرم. اگر مراحل پایه‌ای که ارائه دادید، کار نکرد، گزینه‌های عیب‌یابی پیشرفته‌تری را پیشنهاد دهید، مانند در نظر گرفتن روتر جدید یا شبکه مش. نکاتی برای حفظ یک شبکه وای-فای سالم در بلندمدت هم پیشنهاد دهید.»

برنده باید طیف وسیعی از علت‌ها و راه‌حل‌های ممکن را ارائه دهد. همچنین باید توضیحاتی ساده و قابل فهم برای کسانی که تخصص فنی ندارند، ارائه داده و راه‌حل‌هایی عملی پیشنهاد کند. مراحل حل مساله باید به‌طور منطقی از ساده به پیچیده ارائه شود. در مقایسه ChatGPT و Claude در این بخش ChatGPT برنده بود. پاسخ ChatGPT جزئیات بیشتری داشت و کاربرپسندتر بود.

برنده: ChatGPT به خاطر راهنمای کاربرپسندتر

۶. برنامه‌ریزی پیشرفته

در مقایسه Claude و ChatGPT هر دو این هوش‌های مصنوعی، در برنامه‌ریزی خوب هستند، اما قدرت واقعی ChatGPT در استفاده از «مدل استدلال» است که در نسخه O1 آن وجود دارد، نه GPT-4o. با این حال ما در اینجا می‌توانیم یک مقایسه مشابه داشته باشیم، برای این کار Sonnet را در مقابل GPT-4o قرار می‌دهیم.

پرامپت:

«من در حال طراحی مجدد دفتر کار خانگی خود به ابعاد ۱۰ فوت در ۱۵ فوت هستم و به طرحی نیاز دارم که هم عملکرد و هم زیبایی شناسی را به حداکثر برساند. بودجه من ۲۰۰۰ دلار است و می‌خواهم فضای دفتر کار از نظر ارگونومیک سالم باشد و بهره‌وری را با طراحی نمادین ارتقا دهد. در ورودی اتاق را وسط یک دیوار ۱۰ فوتی و پنجره آن را وسط دیوار ۱۰ فوتی مقابل آن فرض کنید. من به پیشنهاد‌های شما برای مبلمان، کمدها، نورپردازی و به کارگیری تکنولوژی در اتاق نیاز دارم؛ پیشنهادهایی که اولویت را به داشتن محیطی مرتب و بدون شلوغی بدهند. طرح باید شامل یک چیدمان پایه، یک طرح رنگی مطابق با ترجیح من برای انتخاب رنگ‌های جسورانه و ایده‌هایی برای دکوراسیون باشد. همچنین، باید به نحوه بهبود کیفیت صدا در اتاق برای تماس‌های ویدئویی توجه کنید. لطفاً یک شکاف بودجه، فهرستی از خریدها با منابع پیشنهادی و یک جدول زمانی برای پروژه ارائه دهید. اطمینان حاصل کنید که پیشنهادات در چارچوب بودجه قرار دارند و یک فضای کاری راحت و الهام‌بخش ایجاد می‌کنند که برای ساعت‌ها کار متمرکز مناسب باشد. لطفاً تفکیک بودجه، فهرست خرید با منابع پیشنهادی و جدول زمانی پروژه را ارائه دهید. اطمینان حاصل کنید که توصیه‌ها در حد بودجه تعیین‌شده هستند و فضای کاری راحت و الهام‌بخشی ایجاد می‌کنند که برای ساعت‌ها کار متمرکز مناسب است. حالا یک پرامپت برای Ideogram ایجاد کنید تا بتواند تصویر تکمیل‌شده و نهایی پروژه را بر اساس محتوای برنامه و طرحی که داده‌اید، نشان دهد.»

تصویر دفتر کار ChatGPT (منبع تصویر: Ideogram/Future AI)

تصویر دفتر کار Claude (منبع تصویر: Ideogram/Future AI)

برنده باید بتواند یک دفتر کار ارگونومیک با عملکردی خوب ارائه دهد که بهره‌وری و راحتی را در اولویت قرار می‌دهد. این فضا باید انتخاب‌های مناسبی برای طراحی متناسب با برنامه‌ریزی خواسته‌شده داشته باشد و آن را به شکلی واضح ارائه دهد که بتواند از بودجه پیروی کند.

در مقایسه ChatGPT و Claude در این بخش برای من، ChatGPT برنده بود، چرا که خروجی کار او هم مفصل‌تر بود، هم بهتر توضیح داده شده و هم واقع‌گرایانه‌تر بود. Claude برنامه تفکیک بودجه‌ای ارائه داد که فکر نمی‌کنم عملی باشد.

برنده: ChatGPT برای برنامه‌ریزی بهتر

۷. توضیح دادن

من در نهایت، اینکه هر کدام از این هوش‌های مصنوعی چقدر می‌توانند مفاهیم پیچیده را توضیح دهند را به آزمایش گذاشتم. من در مقایسه ChatGPT و Claude به جای انتخاب موضوع بیت‌کوین، موضوع فناوری بلاک‌چین را انتخاب کردم و از آن‌ها خواستم تا به گونه‌ای این موضوع را توضیح دهند که فردی که اطلاعات زیادی در زمینه تکنولوژی ندارد هم بتواند به راحتی آن را درک کند.

پرامپت:

«مفهوم فناوری بلاک‌چین را به گونه‌ای توضیح دهید که کسی که اطلاعات زیادی در زمینه تکنولوژی ندارد هم به راحتی آن را بفهمد. از مثال‌ها و زبان ساده برای توضیح اصول کلیدی استفاده کنید. یک تعریف پایه‌ای بدون استفاده از اصطلاحات فنی ارائه دهید، فرآیند اضافه کردن اطلاعات جدید به بلاک‌چین را توضیح دهید و نحوه تأیید تراکنش‌ها را شرح دهید. ویژگی‌های کلیدی بلاک‌چین چیست؟ (مثل غیرمتمرکز بودن، تغییرناپذیری، شفافیت) هر ویژگی را به زبان ساده توضیح دهید. برخی از کاربردهای دنیای واقعی فناوری بلاک‌چین فراتر از ارزهای دیجیتال را بیان کنید. حداقل سه مثال بزنید، مانند مدیریت زنجیره تأمین، تأیید هویت دیجیتال یا سیستم‌های رأی‌گیری. توضیح دهید که بلاک‌چین چگونه می‌تواند این حوزه‌ها را بهبود بخشد. مزایای استفاده از فناوری بلاک‌چین چیست؟ (مثل افزایش امنیت، کاهش تقلب، بهبود کارایی)
محدودیت‌ها یا چالش‌های فناوری بلاک‌چین چیست؟ (مثل مشکلات مقیاس‌پذیری، مصرف انرژی، عدم قطعیت در مقررات)
مثال‌: از یک مثال‌ واضح و قابل درک برای توضیح مفهوم کلی بلاک‌چین استفاده کنید (مثل یک دفترچه دیجیتال مشترک و غیرقابل ویرایش، یک سیستم رأی‌گیری امن و شفاف).»

برنده در اینجا باید قادر باشد مفاهیم پیچیده را به روشنی و راحت توضیح داده و به طور دقیق این کار را انجام دهد؛ همچنین باید از مثال‌های جذاب برای جلب توجه خواننده استفاده کند. او باید این کار را به طور عینی و به شیوه‌ای منطقی و منظم انجام دهد.

ChatGPT در اینجا برنده شد به خاطر توضیح بهتر یک مفهوم فنی پیچیده و مثال‌های جذاب‌تر. توضیحی که ChatGPT داد، به طور منطقی‌تری سازمان‌دهی شده و پیگیری آن راحت‌تر است. Claude در توضیح کمی ساده‌سازی کرده است.

در نهایت، این آزمایش‌ها یک پیروزی قاطع برای ChatGPT رقم زد.

آزمایش جالبی بود؛ من بر اساس تجربه استفاده‌ام از Claude انتظار داشتم که او برنده شود؛ Claude نقاط قوت قابل توجهی دارد و در کدنویسی، اگر مشکلات مربوط به حالت تاریک و اندازه قاب را به درستی حل می‌کرد، می‌توانست برنده شود. به نظر من رابط کاربری اپلیکیشن آن خیلی بهتر از رابط کاربری ChatGPT بود و در مقایسه ChatGPT و Claude در طراحی اپلیکیشن می‌توانست برنده باشد.

در انتها جالب می‌شود اگر آزمایش کنیم و ببینیم که نسخه o1 در برنامه‌ریزی و توانایی حل مساله چگونه عمل می‌کند؛ البته با توجه به اینکه نسخه GPT-4o توانسته Claude را شکست دهد، مقایسه منصفانه‌ای نخواهد بود.

منبع: tomsguide.com

برچسب‌ها : هوش مصنوعی هوش مصنوعی و رباتیک