ترجمه همزمان از زبانهای مختلف با عینک گوگل
برقراری ارتباط با افراد غیر همزبان، همواره مشکلی چالشبرانگیز بوده؛ با اینحال، گوگل در رویداد I/O با معرفی یک عینک مترجم، راهحلی مهم و ساده را در این زمینه ارائه کرده است.
قبلا محصولاتی که برای حل مشکل ترجمه طراحی شده اند رو مفصل بررسی کرده بودیم که توصیه میکنم اگر به این قبیل محصولات علاقه دارید حتما اول اون مقاله رو بخونید؛
اما رونمایی گوگل از یک محصول تازه، دوباره بحث و اختلافنظر را رسانهها راه انداخته است؛ گوگل با معرفی یک عینک واقعیت افزوده، میگوید که قرار است به زودی حرف زدن را بین افرادی که زبان یکدیگر را نمیدانند آسان کند. بر اساس کلیپ کوتاهی که گوگل منتشر کرده، عملکرد این عینک نسبتاً ساده و خلاقانه است: شما به حرفهای طرف مقابل گوش میدهید و ترجمهٔ حرفهای او به زبان خودتان روی شیشهٔ دوربین برایتان نمایش داده میشود.

چنین عینکی میتواند افراد بسیاری را از یادگیری زبانهای خارجی – حداقل برای گفتگوهای اولیهٔ روزمره – بینیاز کند. ضمن این که ناشنوایان هم این امکان را خواهند داشت که حرفهای طرف مقابل را در قالب یک متن مکتوب ببینند.
گوگل در ویدئوی بالا، از عینک واقعیت افزودهای رونمایی کرد که تنها یک قابلیت دارد و آن نمایش ترجمهی صحبتهای افراد درست در گسترهی دید کاربری است که عینک به چشم دارد. در این ویدئوی احساسی که در پایین آن عبارت «نمایش شبیهسازیشده» درج شده بود، مادر و فرزندی را دیدیم که برای اولین بار توانستند حرف یکدیگر را بفهمند. همچنین فردی را دیدیم که داشت به زبان اشاره صحبت میکرد و ترجمهی حرفهایش به زبان انگلیسی برای کسی که عینک گوگل را به چشم داشت، بهصورت واقعیت افزوده و زنده بهنمایش درمیآمد. مدیر محصول گوگل قابلیت ترجمهی زنده این عینک را «زیرنویسی برای دنیا» توصیف و ما را برای مدت کوتاهی در تصور آیندهای زیباتر از آنچه معمولاً انتظارش را داریم، غرق کرد.
اما چقدر این تصور عملی است و چقدر با این آینده فاصله داریم؟ آنقدری که شاید به عمر ما نرسد یا زیر انبوه پروژههای رهاشدهی گوگل دفن شود؟
همین که گوگل تصمیم گرفته این عینک را تنها به یک قابلیت و آن هم قابلیتی که ۱۶ سال در حال بهبود آن است، مجهز کند، تصمیم بسیار هوشمندانهای بوده و ما را کمی به آیندهی آن امیدوار میکند. بااینحال، گوگل ترنسلیت اگرچه ابزار بسیار کاربردی و حیرتانگیزی است که در مواقع اضطراری، به کمکمان آمده است، در عین حال به مراتب پیش آمده که اشتباهات خجالتآور زیادی در ترجمه انجام دهد. شاید در حد احوالپرسی و پرسیدن آدرس بتوان به ترجمهی گوگل ترنسلیت اعتماد کرد، اما بههیچوجه نمیتوان از درستی ترجمهی داستانهای کلاسیک یا ضربالمثلها و جملات پیچیده آن هم از زبانهای غیراروپایی مطمئن بود.
برخی رسانهها از این خبر استقبال کردهاند (+). اما برخی دیگر یادآوری کردهاند که هستهٔ اصلی این محصول، Google Translate است که همین الان هم ترجمههای آن چندان مطلوب نیست. به ویژه این که قرار باشد به جای متنِ نوشته شده، صحبتهای طرف مقابل را بشنود و خطاهای «تشخیص صدا» هم به خطاهای ترجمه افزوده شود (+).
احتمالاً ادعای ناموفق قبلی گوگل در عرضهٔ هدفونهایی که توانایی ترجمهٔ همزمان دارند نیز در این نگاه منفی سهم دارد. تلاشهای قبلی گوگل در حوزهٔ عینکهای واقعیت افزوده چندان موفق نبوده است. اولین عینکهای گوگل که توانایی ضبط تصویر داشتند، با توجه به نقض حریم خصوصی، به شدت مورد نقد قرار گرفتهاند و حتی برخی رسانهها افرادی را که از Google Glass استفاده میکردند، با اصطلاح Glasshole (ترکیب یک فحش و کلمهٔ عینک) مسخره و تحقیر کردند.
مستقل از این که محصول تازهٔ گوگل، موفق شود یا نه، این یک واقعیت است که «آیندهای که یادگیری زبانهای خارجی، حداقل برای رفع نیازهای اولیه ضروری نباشد» واضح و شفاف، پیش چشم ماست.
گوگل عینک مترجم را زیرنویسی برای دنیا توصیف میکند
سال ۲۰۱۷ نیز گوگل زمانی که داشت برای نسل اول پیکسل بادز تبلیغ میکرد، روی قابلیت ترجمهی زنده آن مانور زیادی داد. البته افرادی که تجربهی استفاده از این هدفون را داشتند، قابلیت ترجمهی زندهی آن را ایدهای تحسینبرانگیز اما با پیادهسازی تأسفبار توصیف کردند. ظاهراً توانایی این هدفون در ترجمهی مکالمهی افراد در حدی بود که احساس میکردید یک کودک پنجساله در حال صحبت با شما است و این تجربه با آنچه گوگل آن زمان در ویدئوی تبلیغاتی پیکسل بادز نمایش داده بود، زمین تا آسمان تفاوت داشت.
مشکلات و چالشهای گوگل در زمینهی ترجمه به کنار، این شرکت وعده داده که ترجمه قرار است داخل عینک واقعیت افزوده صورت گیرد؛ حوزهی دیگری که گوگل از سال ۲۰۱۲ همچنان با آن درگیر است و هنوز نتوانسته حتی ۱۰ درصد از آنچه را که در ویدئوی مفهومی گوگل گلس که آن زمان نشان داده بود، به واقعیت تبدیل کند. در این ویدئو، گوگل وعدههای شگفتانگیز و بلندپروازنهای میدهد؛ تماشا و تعامل با تمام اپلیکیشنهای کاربردی گوشیهای هوشمند مثل یادآوریها، پیامها، ساعت و گزارش آبوهوا، گزارش لحظهای از وضعیت مترو و فلشهای مسیریابی و تماس ویدئویی و ثبت عکس و آپلود آن در شبکههای اجتماعی، همه و همه درست در فضای جلوی چشمان کاربر و بهکمک گوگل گلس انجام میشود. اما این پروژه به جایی نرسید و به یک شکست تمامعیار برای گوگل تبدیل شد، بهطوری که تا چند سال سراغی از آن نگرفت.
البته عینک مترجم گوگل از پروژهی نافرجام گلس متمرکزتر است و فقط قرار است یک کار را انجام دهد که این موضوع، وعدهی این شرکت بدسابقه را کمی باور پذیرتر میکند. چیزی که گوگل به ما نشان داد عینکی بود که فقط قرار است متن ترجمهشده را نمایش دهد نه اینکه تمام کارهای یک گوشی هوشمند را یکجا به عهده بگیرد؛ اما انجام همین یک وظیفه چقدر امکانپذیر است، بهخصوص در شرایطی که گوگل هنوز هیچ توضیحی دربارهی سازوکار این عینک ارائه نداده است؟
حقیقت این است که ساخت عینکهای واقعیت افزوده اصلاً کار آسانی نیست. اگر در محیطی باشید که میزان نور فقط کمی زیاد باشد، نمیتوانید بهراحتی متنها را بخوانید. حتی خواندن زیرنویس از روی نمایشگر تلویزیون وقتی نور مستقیم خورشید به آن تابیده است، بسیار چالشبرانگیز میشود؛ چه برسد به اینکه بخواهیم این تجربه را روی نمایشگری چسبیده به صورت و آن هم زمانی که مشغول صحبت با کسی هستیم که زبانش را نمیفهمیم، داشته باشیم.
البته این را هم باید قبول داشت که تکنولوژی با سرعت در حال پیشرفت است و گوگل ممکن است بتواند تا چند سال دیگر از پس چالشهای کنونی برآید. اما این حقیقت هنوز پا بر جا است که گوگل ترنسلیت به حدی پیشرفت نکرده تا بتوان با آن ترجمهی دقیق و کاملاً درستی از مکالمات انجام داد؛ چطور میتوان انتظار ترجمهای روان را در عینک واقعیت افزودهی این شرکت داشت؟
البته همانطور که موقع صحبت کردن با الکسا، سیری یا گوگل اسیستنت از فرمانهای صوتی مشخص و سادهتری استفاده میکنیم تا برای هوش ماشینی قابل فهم باشد، هنگام استفاده از ابزار ترجمه نیز ممکن است از جملات ساده و واضحتری استفاده کنیم. اما در سادهترین حالت هم عملکرد گوگل ترنسلیت در حد انتظار نبوده است. مثلاً یکی از افراد مسلط به زبان کرهای عنوان کرد که در ویدئوی شمارش معکوس رویداد I/O گوگل، از کلمهای برای «خوش آمدید» استفاده شده بود که هیچ کرهای زبانی از آن استفاده نمیکند.
تازه این اشتباه پیشوپاافتادهای است؛ زمانی که گوگل داشت با آبوتاب از اضافه شدن ۲۴ زبان جدید به ترنسلیت صحبت میکرد، اشتباه بزرگتر و نابخشودنیتری افتاد! در نمایشگر پشت سر سوندار پیچای، مدیر عامل گوگل، نام زبانهایی که با الفبای عربی نوشته شده بودند، بهصورت جدا از هم و برعکس و کاملاً نامفهوم تایپ شده بود. حتی یکی از کاربران عربی زبان در توییتر با منشن کردن پیچای، به گوگل طعنه انداخت و گفت: «استارتاپهای کوچک و مستقلی چون گوگل بودجه کافی برای استخدام کسی که سواد نوشتن به زبان عربیاش در حد دانش آموز دبستانی باشد، ندارند.» راستش ما توقع تجربهای صددرصد بیعیب و نقص از محصولات گوگل نداریم؛ اما برای شرکتی که بهسختی در تلاش است ما را قانع کند چیزی نمانده تا ترجمهی زنده را به عینکهای واقعیت افزوده بیاورد، پیش آمدن چنین اشتباهات خجالتآوری، باورپذیری ادعای گوگل را زیر سؤال میبرد. (به گزارش Android Police، یکی از کارمندان گوگل این اشتباه را تأیید و در ویدیوی آپلود شده از این رویداد در یوتیوب، آن را اصلاح کرده است.)

گوگل درحالی از اضافه شدن ۲۴ زبان جدید به ترنسلیت خبر داد که نام برخی از آنها اشتباه نوشته شده بود.
واضح است که گوگل سعی در حل مشکلی بینهایت پیچیده را دارد. ترجمهی کلمات آسان است، فهم گرامر دشوار اما شدنی است؛ اما زبان و مکالمه بسیار پیچیدهتر از کلمات و گرامر هستند. مثلاً افرادی که چند زبانه هستند، گاهی هنگام صحبت به یک زبان، از کلمات زبان دیگر استفاده میکنند. فکر میکنید عینک مترجم گوگل بتواند از پس ترجمهی این مدل مکالمه برآید؟ تازه داستان زمانی که پای جملات نیمهکاره، دوپهلو، ضربالمثلها و ارجاعات گنگ به میان میآید، پیچیدهتر میشود.
البته گوگل در رقابت عینکهای واقعیت افزوده تنها نیست. شرکت متا تاکنون میلیاردها دلار برای توسعهی عینکهای AR خرج کرده و تعداد کارمندان بخش سختافزار و نرمافزار متاورسی آن بهحدود ۱۸ هزار نفر افزایش یافته که فقط در سال گذشته بیش از ۱۰ میلیارد دلار برای این شرکت هزینه داشته است. نقشهی راه متا برای عرضهی این عینکها که البته از عینک مترجم گوگل بلندپروازانهتر بهنظر میرسند، از سال ۲۰۲۴ تا ۲۰۲۶ تعیین شده؛ اما بسیار بعید است تا چند سال دیگر شاهد تکنولوژیای باشیم که بتواند فردی را بهشکل هولوگرام جلوی ما بنشاند تا با هم شطرنج بازی کنیم.
جمعبندی
با تمام این حرفها، برنامه گوگل برای عرضهی عینک مترجم کاملاً تحسینبرانگیز است و من بیصبرانه منتظر روزی هستم که تمام افراد بتوانند مانند مادر و فرزند ویدئوی گوگل، بدون هیچ مشکلی حرف همدیگر را بفهمند. اما تا رسیدن آن روز و فراگیر شدن استفاده از عینکهای واقعیت افزوده، راه درازی در پیش است و بعید میدانم تلاشهای اولیهی گوگل برای عرضهی این عینک بهاندازهی ویدئویی که در رویداد I/O تماشا کردیم، رضایتبخش باشد؛
البته که طراحی عینک های هوشمند در دستور کار شرکت های بزرگ دیگه ای مثل متا و ری بن هم قرار داره(+)، اگر گوگل محصولش رو به موقع عرضه نکنه قطعا رقبای اون منتظر نخواهند موند؛