پاسخ گوگل به این سوال: که آیا انتشار محتوای ترجمه شده ماشینی که فقط کمی از نظر کیفیت تغییر کرده است، مشکلی ندارد؟
در پادکست «Google SEO office-hours» در ماه اکتبر2022 به این سوال پاسخ داده شده که آیا استفاده از محتوای ترجمه شده اتوماتیک که توسط یک انسان بازبینی شده و تنها با بهینه سازی های جزئی ویرایش شده است، اشکالی دارد یا نه؟
برنامه Google SEO office-hours
این قسمت از برنامه Google SEO office-hours از قالب جدیدی پیروی میکند که در آن سؤالات به صورت کتبی ارسال می شوند و سپس به آنها پاسخ ها داده می شود. کارمندان گوگل، که به سوالات پاسخ می دهند، لیزی ساسمن و جان مولر هستند.
لیزی ساسمن (Lizzi Sassman) نویسنده حوزه فناوری است که مستندسازی مرکز گوگل سایت را انجام می دهد.
بر خلاف فرمت زنده قبلی، که در آن مخاطبان در لحظه سؤال می پرسیدند، این قالب جدید فرصت پرسیدن سؤالات بعدی که در ادامه ممکن است پیش بیاید را از بین می برد.
این روش منجر به پاسخهایی میشود که تقریبا مستندات گوگل را منعکس میکنند، بدون اینکه هیچ شانسی برای درخواست شفافسازی وجود داشته باشد.
شخصی که این سوال را پرسید نگران محتوای خود بود که به صورت ماشینی از زبان دیگری ترجمه شده بود؛ آنها از ویراستاران انسانی استفاده می کردند تا محتوایی را که معمولا مقبول بوده و فقط به تغییرات جزئی نیاز دارد، بررسی کنند.
به طور طبیعی، شخصی که این سوال را می پرسد نگران این است که آیا «تغییرات جزئی» برای قابل قبول کردن محتوا برای گوگل کافی است یا خیر.
لیزی ساسمن این سوال را با پاسخی دقیقا برآمده از مستندات گوگل پاسخ داد.
مسلماً، با یک سؤال بعدی در خصوص اینکه آیا «تغییرات جزئی» به اندازه کافی خوب هستند یا خیر، پاسخ میتوانست شفاف تر شود.
درنهایت، این سوال به صراحت می پرسد که آیا بهینه سازی های جزئی به اندازه کافی برای گوگل خوب هستند یا خیر.
احتمالا پاسخ دو پهلو به این سوال برای این است که خودتان درمورد کیفیت متن ترجمه شده قضاوت کنید.
آیا محتوای ترجمه شده ماشینی با مقداری ویرایش قابل قبول است؟
سوال پرسیده شده:
« سایتی از ترجمه ماشینی برای انتشار پست به زبان های دیگر استفاده می کند.
محتوا توسط مترجمان انسانی بررسی می شود و آنها اغلب پس از تغییرات جزئی از کیفیت آن راضی هستند.
آیا گوگل با این مسئله مشکلی ندارد؟»
لیزی ساسمن از گوگل پاسخ داد:
خوب است که می شنویم که مترجمان انسانی راضی هستند و تا زمانی که انسانی در فرآیند بررسی حضور داشته باشد، گوگل با این مسئله مشکلی نخواهد داشت. نکته کلیدی دقیقا همین است.
چیزی که باید مراقب آن باشید این است که مطمئن شوید کیفیت همچنان خوب باقی بماند و برای افرادی که محتوا را میخوانند کاربردی باشد.
پاسخ به طور مشخص نمیگوید که آیا ویرایشهای جزئی خوب هستند یا خیر، فقط میگوید اگر «مترجمان انسانی» با آن مشکلی نداشته باشند، گوگل هم با آن مشکلی ندارد.
آیا ممکن است گوگل بررسی نکند که محتوا به صورت ماشینی ترجمه شده است یا خیر و به سیگنالهای کیفیت محتوای استاندارد متکی باشد؟
از جواب این سوال اطلاعی نداریم
قالب جدید پادکست به فردی که سؤال میپرسد فرصتی برای پرسیدن سؤال بعدی نمیدهد.
سیاست های اسپم گوگل
مستندات گوگل در مورد محتوای اسپم به ابزارهای ترجمه اتوماتیک متن اشاره میکند و به صراحت میگوید که اسپم است، مگر زمانی که یک عنصر انسانی در آن دخیل باشد.
این چیزی است که مستندات گوگل بیان می کند:
«نمونههایی از محتوای تولید شده اسپم عبارتند از:
متن ترجمه شده توسط یک ابزار خودکار بدون بازبینی یا نظارت انسانی قبل از انتشار»
بنابراین از دستورالعملهای منتشر شده گوگل مشخص است که تا زمانی که یک انسان در حال ویرایش محتوای ترجمه شده توسط ماشین باشد، گوگل با آن مشکلی ندارد.
علاوه بر این، جان مولر در یک ویدیو در این برنامه در آوریل 2022 به این موضوع اشاره کرد که چگونه محتوای تولید شده توسط هوش مصنوعی اسپم محسوب می شود و سپس به محتوای ترجمه شده خودکار اشاره کرد.
مولر در مورد ابزارهای تولید محتوای هوش مصنوعی صحبت کرد و آنها را با ابزارهای ترجمه خودکار مقایسه کرد.
مولر در دقیقه 24:55 در برنامه Office-Hours video آوریل 2022 گفت:
فکر میکنم، شاید با گذشت زمان، این ابزار تکامل پیدا کند، به این ترتیب که بیشتر به ابزاری برای استفاده مردم تبدیل شود.
مثلا اینکه از ترجمه ماشینی به عنوان مبنایی برای ایجاد نسخه ترجمه شده یک وب سایت استفاده شود.
اما شما هنوز ... اساساً به صورت دستی روی آن کار می کنید.
چرا باید یک انسان محتوای ترجمه شده خودکار را بررسی کند؟
همانطور که در بالا ذکر شد، نگرانی گوگل این است که محتوای ارجاع شده از صفحات نتایج موتور جستجو (SERP)، با کیفیت باشد و کاربران از آن راضی باشند.
چیزی که مورد بحث قرار نگرفت، این است که محتوای ترجمه شده حاوی نشانههایی است که الگوریتم تشخیص ترجمه می تواند آنها را شناسایی کند.
تشخیص محتوای ترجمه شده توسط ماشین چیزی است که سال هاست مورد تحقیق قرار گرفته است.
یک مقاله تحقیقاتی در سال 2021 (تشخیص متن ترجمه شده با ماشین از طریق تشابه متن با ترجمه رفت و برگشتی - دانلود PDF) بیان میکند که محتوایی که از زبانی به زبان دیگر ترجمه میشود میتواند برای انسان پیچیده باشد.
به عنوان مثال، با استفاده از 100 متن ترجمه شده، مترجمهای انسانی تنها توانستند بیش از نیمی از متون ترجمه شده را شناسایی کنند.
محققان خاطرنشان کردند:
«متوسط دقت، 53.3٪ (55٪ برای افراد بومی زبان و 52٪ برای افراد غیربومی) بود که نزدیک به تصادفی است.»
این رویکرد که تشابه متن با ترجمه رفت و برگشتی (TSRT یا Text Similarity With Round-Trip Translation) نامیده میشود، عملکرد بهتری نسبت به ارزیابیکنندههای انسانی داشت و در زمان انتشار مقاله در سال 2021 ، امتیازی بهتری نسبت به ابزارهای تشخیصص ترجمه پیشرفته آن زمان کسب کرد.
به طور جالبی این تکنیک می تواند زبان اصلی متون ترجمه شده را تشخیص دهد. همچنین می تواند تعیین کند که کدام الگوریتم ترجمه، ترجمه را انجام داده است.
آنها گزارش کردند:
«نتایج ارزیابی نشان میدهد که TSRT (با دقت 90.2%) از سایر روشها بهتر عمل میکند.
علاوه بر این، TSRT همچنین می تواند مترجم اصلی و زبان ترجمه را به ترتیب با دقت 93.3 و 85.6 درصد شناسایی کند.»
مشخص نیست که آیا گوگل میتواند محتوای ترجمهشده را تشخیص می دهد یا نه و اینکه آیا گوگل حتی در تلاش برای شناسایی محتوای ترجمه شده است یا خیر؟
اما می دانیم که فناوری برای تشخیص آن وجود دارد. این فناوری می تواند محتوای ترجمه شده را بهتر از انسان تشخیص دهد و تعیین کند که کدام الگوریتم ترجمه، ترجمه را انجام داده است.
اگر بودن بر خلاف دستورالعملهای وب مستر و امکان بروز تجربه کاربری منفی ، برای ایجاد انگیزه جهت ویرایش متن ترجمه شده ماشینی کافی نباشد، شاید این احتمال که گوگل در حال تجزیه و تحلیل کیفیت محتوای ترجمه های ماشینی است، دلیلی برای پرداختن کامل به این نوع محتوا باشد.
منبع محتوا :
دقیقه 17:50 از برنامه Google Office Hours
این مقاله چقدر برای شما مفید بود؟
تعداد رای ها:
0
با تشکر از شما برای امتیاز دادن به این پست!
فرارنک
تیم فنی و آموزشی هی سئو با بیش از ۱۲ سال تجربه تمام دانش خود را به صورت صادقانه با شما عزیزان به اشتراک می گذارد.