هوش مصنوعی پیشفرضهای ما از مفهوم «عکس» را تغییر میدهد
با ظهور هوش مصنوعی، نگاه جدیدی به عکس تعریف شده که با دیدگاههای پیشین ما متفاوت است و شاید نیاز به بازنگری در درک پیشین خود داشته باشیم. پس از معرفی قابلیتهای خیرهکنندهی هوش مصنوعی در عکاسی سری جدید گوشیهای پیکسل گوگل، این موضوع جدیتر از همیشه مطرح شده است که در عصر هوش مصنوعی، چقدر میتوان به عکسها و تصاویر اعتماد کرد؟
در یک ساختمان قدیمی آجرنما، انفجاری رخ داده است. یک دوچرخه در تقاطع شهری تصادف کرده است. یک سوسک در جعبه غذای بیرونبر پیدا شده است. ساخت هر یک از این تصاویر با ابزار Reimagine در ویرایشگر جادویی گوشی Pixel 9 کمتر از ۱۰ ثانیه طول میکشد. این تصاویر واضح، رنگی و با کیفیت بالا هستند. هیچ پسزمینهی مبهمی ندارند و هیچ انگشت ششم مشخصی که در نسخههای اولیهی هوش مصنوعی زایا وجود داشت، در آنها دیده نمیشود. این عکسها به طرز خارقالعادهای قانعکننده و البته همهی آنها کاملا جعلی هستند!
هر کسی که گوشی Pixel 9 گوگل، جدیدترین پرچمدار گوگل را بخرد، از صفحهی گوشی خود به راحتترین و سادهترین رابط کاربری برای ایجاد دروغهای درجه یک دسترسی خواهد داشت. این موضوع به احتمال بسیار زیاد به یک استاندارد تبدیل خواهد شد؛ به ویژه با توجه به اینکه ویژگیهای مشابه هماکنون در دستگاههای رقیب وجود دارد و به زودی در دستگاههای دیگر هم عرضه خواهد شد. زمانی که یک گوشی هوشمند «درست کار میکند»، معمولا چیز خوبی است؛ اما در اینجا، مشکل اصلی همان درست کار کردن است!
عکاسی از زمان پیدایش برای فریب مخاطب هم استفاده شده است. برای نمونه عکسهای ارواح ویکتوریایی، عکس هیولای لخنس، یا سانسور در عکسهای استالین را در نظر بگیرید. اما بیانصافی است بگوییم که عکسها هرگز به عنوان شواهد مستند و قابل اعتماد در نظر گرفته نشدهاند. هر کسی که در سال ۲۰۲۴ این مقاله را میخواند، در دورانی بزرگ شده که «عکس» به طور پیشفرض نمایانگر حقیقت بوده است. یک صحنهی ساختگی با جلوههای سینمایی، دستکاری دیجیتال عکس یا اخیرا تصاویر جعل عمیق (دیپ فیک)، همه پتانسیل فریب دادن را داشتند، اما از نظر احتمال جزو استثنائات بودند و برای تضعیف اعتماد مستقیم به یک عکس، دانش تخصصی و ابزارهای تخصصی لازم بود. در حقیقت جعلی بودن یک استثنا و نه یک قاعده به شمار میرفت.
برای نمونه اگر صحبت از میدان تیانآنمن چین شود، به احتمال زیاد همان عکسی را به یاد میآورید که دیگران در ذهن دارند. این موضوع برای تصاویری از زندان ابوغریب یا دختری که در ناپالم گرفتار شده است هم صدق میکند. این تصاویر، جنگها و انقلابها را تعریف کردهاند و چنان حقیقت را دربر گرفتهاند که بیان کامل آن بدون تصاویر غیرممکن است. هیچ نیازی به توضیح این نیست که چرا این عکسها مهم هستند، چرا چنین نقش محوری دارند و چرا اینقدر به آنها بها میدهیم. اعتماد ما به عکاسی به اندازهای عمیق بوده است که وقتی زمان خود را صرف بحث در مورد صحت تصاویر میکردیم، بیشتر توجه به این موضوع اهمیت داشت که «گاهی اوقات» هم ممکن است عکسها جعلی باشند.
اما اکنون همه چیز در حال تغییر است. فرض اولیه دربارهی یک عکس در حال تبدیل شدن به این است که «جعلی است». زیرا ساخت عکسهای واقعی و باورپذیر جعلی اکنون بسیار آسان شده است و ما هنوز برای آنچه که در آینده رخ خواهد داد، آماده نیستیم!
تا به امروز، هیچکس روی کره زمین در دنیایی زندگی نکرده است که عکسها محور اصلی اجماع اجتماعی نبوده باشند؛ برعکس، برای مدت زمانی که هر یک از ما زیستهایم، عکسها هر یک چیزی را اثبات کردهاند. تمام راههایی را که در آنها صحت فرضی یک عکس حقیقت تجربیات شما را تأیید کرده است، در نظر بگیرید. برای نمونه در هنگام ایجاد خراشیدگی روی سپر ماشین اجارهایتان، نشت سقف، رسیدن یک بسته، پیدا شدن یک حشره در غذای بیرونبر، آتشسوزی جنگلی در نزدیکی منطقهی مسکونی شما و … چگونه وضعیت را به دوستان و آشنایان خود اطلاع میدهید؟
تا کنون، بار اثبات کردن، بیشتر بر عهدهی کسانی بود که حقیقت یک عکس را انکار میکردند. یک طرفدار زمین تخت، از اجماع اجتماعی عقب مانده است؛ نه به این دلیل که فیزیک نجومی را نمیفهمد (در واقع چند نفر از ما واقعا فیزیک نجومی را میفهمیم؟) بلکه به این دلیل که باید درگیر توجیهات بسیار پیچیدهای شوند که چرا برخی عکسها و ویدیوها واقعی نیستند. آنها باید یک تئوری توطئهی دولتی عظیم اختراع کنند تا خروجی پیوستهی عکسهای ماهوارهای که انحنای زمین را ثبت میکنند، توضیح دهند. آنها باید یک صحنهی فیلمبرداری برای فرود بر ماه در سال ۱۹۶۹ ایجاد کنند.
تا کنون این موضوع را بدیهی میدانستیم که بار اثبات بر عهدهی کسانی است که با وجود شواهد، حقیقت را انکار میکنند. اما در عصر هوش مصنوعی و با ابزارهای سادهای مانند پیکسل ۹، شاید بهتر باشد که شروع به مرور فیزیک نجومی کنیم! به عبارتی باید در جهت اثبات واقعی بودن یک عکس تلاش کنیم.
به طور کلی، تصویر معمولی ایجاد شده توسط این ابزارهای هوش مصنوعی به خودی خود بیضرر هستند، برای مثال یک درخت اضافی در پسزمینه، یک تمساح در پیتزافروشی، یک لباس عجیب که به تن یک گربه شده است. اما در مجموع، این گرایش فزاینده به تولید تصاویر با هوش مصنوعی، نحوهی برخورد ما با مفهوم عکس را کاملا تغییر میدهد و خود این موضوع است که پیامدهای زیادی به دنبال دارد. برای نمونه دههی گذشته تنشهای اجتماعی فوقالعادهای در آمریکا روی داده است که جرقهی آن توسط ویدیوهای نه چندان باکیفیت از خشونت پلیس زده شده است. جایی که مقامات واقعیت را مبهم یا پنهان کردند، این ویدیوها حقیقت را نشان دادند.
اما اکنون آغاز دورهای بیپایان از تصاویر جعلی است، دورهای که در آن تأثیر حقیقت با سیل دروغها از بین خواهد رفت. ابوغریب بعدی در دریایی از جنایات جنگی تولیدشده توسط هوش مصنوعی دفن خواهد شد. جورج فلوید بعدی نادیده گرفته میشود و شرایط اجتماعی ناعادلانه خواهد ماند.
شما میتوانید نمونهای را از آنچه که در پیش است، حتی از حالا ببینید. در محاکمهی «کایل ریتنهاوس» (Kyle Rittenhouse)، وکیل مدافع ادعا کرد که قابلیت زوم اپل، عکسها را دستکاری میکند و قاضی را متقاعد کرد که بار اثبات موضوع بر عهدهی دادستانی است تا نشان دهد که فیلم بزرگنمایی شده در آیفون با هوش مصنوعی دستکاری نشده است. یا حتی به تازگی «دونالد ترامپ» ادعایی غیرواقعی را مطرح کرد که عکسی از یک تجمع پربینندهی «کامالا هریس» توسط هوش مصنوعی تولید شده است، ادعایی که فقط به این دلیل قابل طرح بود که مردم توانستند آن را باور کنند.
حتی پیش از هوش مصنوعی، در رسانهها به صورت محافظهکارانه عمل میکردیم و جزئیات و منشاء هر تصویر را برای جلوگیری از زمینههای گمراهکننده یا دستکاریهای عکاسی، بررسی میکردیم. به ویژه با توجه به اینکه هر رویداد خبری بزرگ با هجوم اطلاعات نادرست همراه است. اما تغییر پارادایم پیشِ رو، چیزی بسیار بنیادینتر را دربر دارد که بیش از مبارزهی پیوسته با سوءظن یا به نوعی همان «سواد دیجیتال» (Digital Literacy) هم نامیده میشود.
گوگل کاملا میداند که ویژگیهای گوشی هوشمندی مانند پیکسل ۹ با عکس به عنوان یک نهاد چه میکند. مدیر محصول گروه دوربین پیکسل در مصاحبهای با Wired ابزار ویرایش را اینگونه توصیف کرده است: «[این ابزار] به شما کمک میکند یک لحظه را همانطور که شما آن را به یاد میآورید، ایجاد کنید. لحظهای که به خاطرات شما و به متن بزرگتر وفادار است، اما شاید به یک میلیثانیهی خاص وفادار نباشد.»
در این جهان، عکس دیگر مکمل حافظه ناقص انسانی نیست، بلکه آینهی آن است. و همانطور که عکسها تبدیل به چیزی جز توهمات متجلی نمیشوند، بحثهای احمقانهتر به نبردهای دادگاهی بر سر اعتبار شاهدان و وجود مدارک تأییدکننده تنزل خواهد یافت.
این فرسایش اجماع اجتماعی حتی پیش از پیکسل ۹ هم آغاز شده بود و فقط هم توسط این گوشی مبتنی بر هوش مصنوعی ادامه نخواهد یافت. با این حال، قابلیتهای جدید هوش مصنوعی پیکسل ۹ قابل توجه است؛ نه فقط به این دلیل که ورود به آن بسیار آسان است، بلکه به این دلیل که ضمانتهای ایمنی که با آن مواجه شدیم به طرز حیرتانگیزی ضعیف بودند. استانداردهای پیشنهادی صنعت برای واترمارکگذاری تصاویر هوش مصنوعی، هنوز درگیر کشمکشهای معمول استانداردگذاری است و سیستم واترمارکگذاری هوش مصنوعی خود گوگل که آن را بسیار تبلیغ کرده است، هنگام آزمون، عملا هیچ جا کاربرد نداشت.
عکسهایی که با ابزار Reimagine تغییر یافتهاند، فقط یک خط فراداده (متادیتای) قابل حذف به آنها اضافه شده است. شکنندگی ذاتی این نوع متادیتا، قرار بود با اختراع واترمارک نوع SynthID غیرقابل حذف گوگل، بازبینی شود. به گفتهی گوگل، خروجیهای پیکسل استودیو (یک تولیدکنندهی متن خالص که نزدیکتر به DALL-E است) با یک واترمارک SynthID برچسبگذاری خواهند شد؛ اما مشخص شده است که قابلیتهای ابزار Reimagine ویرایشگر جادویی پیکسل، که عکسهای موجود را تغییر میدهد، بسیار نگرانکنندهتر هستند.
گوگل ادعا میکند که گوشی پیکسل ۹ یک کارخانهی دروغبافی بدون نظارت نخواهد بود اما چندان هم تضمیت واقعی ارائه نمیدهد. به گفتهی «الکس موریکونی» (Alex Moriconi) مدیر ارتباطات گوگل: «ما ابزارهای هوش مصنوعی مولد خود را به نحوی طراحی میکنیم که به نیت درخواستهای کاربران احترام بگذارند و این بدان معناست که ممکن است محتواهایی تولید کنند که بر اساس گزارههای درخواستی کاربر، توهینآمیز باشد.»
البته او توضیح داده است که «با این حال، هر چیزی هم مجاز نیست. ما سیاستها و شرایط خدمات واضحی در مورد انواع محتوایی که اجازه میدهیم و نمیدهیم، داریم و خط مشیهایی برای جلوگیری از سوءاستفاده ایجاد میکنیم. گاهی اوقات، برخی درخواستها میتوانند خط مشی این ابزارها را به چالش بکشند و ما متعهد به بهبود و اصلاح مداوم خط مشیهایی هستیم که در اختیار داریم.»
سیاستها همان چیزی است که انتظار دارید. برای نمونه شما نمیتوانید از خدمات گوگل برای آسانسازی جرایم یا تحریک به خشونت استفاده کنید. برخی درخواستهای انجام شده پیغام خطای عمومی «ویرایشگر جادویی نمیتواند این ویرایش را انجام دهد. سعی کنید چیزی دیگر تایپ کنید.» را نشان میدهد. با این حال، همانطور که دیده میشود، چند درخواست نگرانکننده هم وجود داشته که کار کرده است. اما در نهایت مدیریت محتوای معمولی، نجاتدهندهی خود مفهوم «عکس» به عنوان نشانهای از حقیقت، از نابودی قریبالوقوع نخواهد بود.
ما به طور مختصر در دورهای زندگی کردیم که عکس، میانبری به واقعیت و ابزاری برای دانستن چیزهای مختلف بود. یک راهکار فوقالعاده سودمند برای پیمایش در دنیای اطراف ما بود. اما اکنون در حال پریدن به آیندهای هستیم که در آن واقعیت، پیچیدهتر از همیشه قابل دانستن است. اگر روند بهتری پیش میرفت، کتابخانهی گمشدهی اسکندریه میتوانست روی کارت microSD کنسول نینتندو سوییچ جا بگیرد و با این حال، اکنون لبهی فناوری یک تلفن همراه است که به عنوان یک ویژگی سرگرمکننده، امکان جعل مفهوم عکس را فراهم کرده است. آیا این روندی رو به نابودی است؟
منبع: The Verge