گوگل ترنسلیت بهزودی برای ترجمه همزمان صدای کاربران را تقلید میکند
ساعاتی قبل، گوگل از یک مدل جدید برای ترجمه موسوم به Translatotron معرفی کرد که با بهرهگیری از صدای کاربران میتواند کار ترجمه همزمان را انجام دهد. در حال حاضر، برای چنین کاری، ابتدا صدا به متن تبدیل میشود، و بعد از ترجمهی متن، کامپیوتر آن را میخواند. اما در عوض، این ابزار از روش جدیدی استفاده میکند که با بهرهگیری از آن، میتواند مستقیما صدای کاربر را به زبانی دیگر ترجمه کند.
بر اساس پستی که گوگل منتشر کرده، Translatotron با بهرهگیری از مدل مبتنی بر شبکه «توالی به توالی» (sequence-to-sequence)، ورودی صدا را دریافت میکند و بعد از پردازش آن بهعنوان «طیف نگاره» (spectrogram)-یک نمایش بصری از فرکانسها-میتواند طیف نگارهای در زبان جدید خلق کند. این رویکرد میتواند سرعت ترجمه را تا حد زیادی افزایش بدهد. علاوه بر این، باید به یکی دیگر از قابلیتهای جذاب این ابزار اشاره کنیم که آن هم امکان تقلید صدای کاربر است. اگرچه صدای ترجمه شده کاملا طبیعی نیست و تا حدی مصنوعی به نظر میرسد، ولی تا حد زیادی مبتنی بر ویژگیهای صدای کاربر است. برای نمونه صداهایی که با بهرهگیری از این ابزار گوگل ایجاد شدهاند، میتوانید به این صفحه گیتهاب مراجعه کنید.
گوگل در ماههای اخیر نشان داده که میخواهد فرایند ترجمه خودکار را تا حد زیادی بهبود ببخشد. سال گذشته، شاهد معرفی لهجههای مختلف در گوگل ترنسلیت بودیم و همچنین باید به افزوده شدن زبانهای بیشتر برای قابلیت ترجمه همزمان اشاره کنیم. چند ماه قبل هم قابلیت ترجمه همزمان برای نمایشگرها و اسپیکرهای هوشمند معرفی شد که چنین کاری را میتوانند با ۲۶ زبان مختلف انجام دهند. به نظر میرسد بهزودی حتی استفاده کاربران ایرانی هم از این سرویس بیش از صرف ترجمه انگلیسی به فارسی خواهد بود.
منبع: Engadget
پیش به سوی مکالمات جعلی … !