همکاری غول های تکنولوژی برای بهبود تشخیص صدا

پروژه جدید دسترس پذیری صوتی، پنج شرکت فناوری را گرد هم می آورد تا تشخیص صدا را برای کسانی که الگوهای گفتاری غیر استاندارد دارند بهبود بخشد. به جای کار جداگانه، نیروهای هر پنج شرکت در حال پیوستن برای بهبود تشخیص صدا هستند.

گوگل اعلام کرد که به پروژه دسترس پذیری صوتی می‌پیوندد تا به توسعه سیستم‌های تشخیص گفتار پیشرفته کمک کند که بتوانند نیازهای افراد دارای اختلال گفتار را برآورده کنند.

تشخیص گفتار برای دسترسی به وب سایت ها، دستیارهای صوتی دستگاه ها و ترجمه گفتار استفاده می شود.

اما اگر الگوی گفتار کاربر تحت تأثیر بیماری لو گهریگ، بیماری پارکینسون یا سندرم داون و غیره باشد، ممکن است کار کردن دستگاه‌ها و سرویس‌های فعال‌شده با صدا دشوار باشد.

هدف این پروژه

هدف این پروژه تغییر این وضعیت با استفاده از پروژه‌ای است که پنج شرکت فناوری را گرد هم می‌آورد، که می‌توانند با هم همکاری کنند تا چالش ایجاد تشخیص گفتار برای کسانی که الگوهای گفتاری غیر استاندارد دارند را حل کنند.

این پروژه ابتدا با زبان انگلیسی و سپس به زبان های دیگر گسترش می یابد.

وب سایت این پروژه توضیح داد:

«...بدون داده‌های متنوع و معرف، مدل‌های ML نمی‌توانند یاد بگیرند که چگونه تنوع گفتار را درک کنند. هدف این پروژه تغییر آن با ایجاد مجموعه داده های مورد نیاز برای آموزش موثرتر این مدل های یادگیری ماشینی است.»

پروژه جدید برای پیشبرد دسترس پذیری

پروژه دسترس پذیری صوتی، یک برنامه جدید توسط دانشگاه ایلینویز و پنج شرکت فناوری است که با هم کار می کنند تا فناوری فعال سازی صوتی را در دسترس گروه وسیع تری از مردم قرار دهد.

شرکت های زیر اعضای جدید هستند:

آمازون
اپل
گوگل
متا
مایکروسافت

وب سایت پروژه، مشکلی که حل خواهند کرد را اینگونه بیان میکند:

«سیستم‌های تشخیص گفتار امروزی، مانند دستیارهای صوتی و ابزارهای ترجمه، اغلب افرادی را با الگوهای گفتاری متنوع که اغلب با ناتوانی‌ها مرتبط هستند، تشخیص نمی‌دهند.

این شامل گفتار تحت تأثیر بیماری لو گریگ، یا اسکلروز جانبی آمیوتروفیک، بیماری پارکینسون، فلج مغزی و سندرم داون است.

در واقع، ممکن است بسیاری از افراد در این جوامع نتوانند از جدیدترین ابزارهای تشخیص گفتار بهره مند شوند.»

راه حل دسترسی به تشخیص گفتار

پروژه دسترس پذیری صوتی نمونه هایی از الگوهای صوتی مختلف را جمع آوری می کند و یک مجموعه داده ناشناس ایجاد می کند.

سپس از این مجموعه داده برای ایجاد مدل‌های یادگیری ماشینی استفاده می‌شود که می‌توانند انواع الگوهای صوتی را که در حال حاضر مورد استفاده قرار نمی‌گیرند، بهتر درک کنند.

پروژه یوفونیا (Euphonia)

گوگل موقعیت دستیابی مبتنی بر هوش مصنوعی خود را در سال 2019 با نام Project Euphonia راه اندازی کرد. این پروژه به گوگل کمک کرد تا تشخیص گفتار را برای درک گفتاری غیر استاندارد انگلیسی تطبیق دهد.

گوگل ضبط الگوی گفتار را از بیش از 2000 شرکت کننده در پروژه خود جمع آوری کرد.

یکی از کمک‌های گوگل به پروژه دسترسی به گفتار این است که شرکت کردن در پروژه Euphonia را آسان می‌کند تا افراد بتوانند به طور ناشناس نمونه‌های الگوی گفتار خود را در پروژه دسترسی‌پذیری صوتی به اشتراک بگذارند.

در اطلاعیه گوگل آمده است:

«امید ما این است که با در دسترس قرار دادن این مجموعه داده ها در اختیار تیم های تحقیق و توسعه، بتوانیم به بهبود سیستم های ارتباطی برای همه از جمله افراد دارای معلولیت کمک کنیم.»

تشخیص گفتار پیشرفته

این پروژه جدید نقطه عطفی در ایجاد فناوری است که می تواند به کسانی که الگوهای گفتاری غیر استاندارد دارند خدمت کند.

چیزی که این پروژه را هیجان انگیز می کند این است که هر پنج شرکت فناوری به جای کار در بخش های جداگانه برای حل مشکلات تشخیص گفتار با یکدیگر همکاری خواهند کرد.

بهبود دسترسی به دستگاه ها و اینترنت برای جوامع محروم به نفع همه است.

منبع محتوا : speechaccessibilityproject

فرارنک

تیم فنی و آموزشی هی سئو با بیش از ۱۲ سال تجربه تمام دانش خود را به صورت صادقانه با شما عزیزان به اشتراک می گذارد.

این مقاله را به اشتراک بگذارید

همکاری گوگل، اپل، متا، آمازون و مایکروسافت برای بهبود تشخیص صدا