پروژه جدید دسترس پذیری صوتی، پنج شرکت فناوری را گرد هم می آورد تا تشخیص صدا را برای کسانی که الگوهای گفتاری غیر استاندارد دارند بهبود بخشد. به جای کار جداگانه، نیروهای هر پنج شرکت در حال پیوستن برای بهبود تشخیص صدا هستند.
گوگل اعلام کرد که به پروژه دسترس پذیری صوتی میپیوندد تا به توسعه سیستمهای تشخیص گفتار پیشرفته کمک کند که بتوانند نیازهای افراد دارای اختلال گفتار را برآورده کنند.
تشخیص گفتار برای دسترسی به وب سایت ها، دستیارهای صوتی دستگاه ها و ترجمه گفتار استفاده می شود.
اما اگر الگوی گفتار کاربر تحت تأثیر بیماری لو گهریگ، بیماری پارکینسون یا سندرم داون و غیره باشد، ممکن است کار کردن دستگاهها و سرویسهای فعالشده با صدا دشوار باشد.
هدف این پروژه
هدف این پروژه تغییر این وضعیت با استفاده از پروژهای است که پنج شرکت فناوری را گرد هم میآورد، که میتوانند با هم همکاری کنند تا چالش ایجاد تشخیص گفتار برای کسانی که الگوهای گفتاری غیر استاندارد دارند را حل کنند.
این پروژه ابتدا با زبان انگلیسی و سپس به زبان های دیگر گسترش می یابد.
وب سایت این پروژه توضیح داد:
«...بدون دادههای متنوع و معرف، مدلهای ML نمیتوانند یاد بگیرند که چگونه تنوع گفتار را درک کنند. هدف این پروژه تغییر آن با ایجاد مجموعه داده های مورد نیاز برای آموزش موثرتر این مدل های یادگیری ماشینی است.»
پروژه جدید برای پیشبرد دسترس پذیری
پروژه دسترس پذیری صوتی، یک برنامه جدید توسط دانشگاه ایلینویز و پنج شرکت فناوری است که با هم کار می کنند تا فناوری فعال سازی صوتی را در دسترس گروه وسیع تری از مردم قرار دهد.
شرکت های زیر اعضای جدید هستند:
- آمازون
- اپل
- گوگل
- متا
- مایکروسافت
وب سایت پروژه، مشکلی که حل خواهند کرد را اینگونه بیان میکند:
«سیستمهای تشخیص گفتار امروزی، مانند دستیارهای صوتی و ابزارهای ترجمه، اغلب افرادی را با الگوهای گفتاری متنوع که اغلب با ناتوانیها مرتبط هستند، تشخیص نمیدهند.
این شامل گفتار تحت تأثیر بیماری لو گریگ، یا اسکلروز جانبی آمیوتروفیک، بیماری پارکینسون، فلج مغزی و سندرم داون است.
در واقع، ممکن است بسیاری از افراد در این جوامع نتوانند از جدیدترین ابزارهای تشخیص گفتار بهره مند شوند.»
راه حل دسترسی به تشخیص گفتار
پروژه دسترس پذیری صوتی نمونه هایی از الگوهای صوتی مختلف را جمع آوری می کند و یک مجموعه داده ناشناس ایجاد می کند.
سپس از این مجموعه داده برای ایجاد مدلهای یادگیری ماشینی استفاده میشود که میتوانند انواع الگوهای صوتی را که در حال حاضر مورد استفاده قرار نمیگیرند، بهتر درک کنند.
پروژه یوفونیا (Euphonia)
گوگل موقعیت دستیابی مبتنی بر هوش مصنوعی خود را در سال 2019 با نام Project Euphonia راه اندازی کرد. این پروژه به گوگل کمک کرد تا تشخیص گفتار را برای درک گفتاری غیر استاندارد انگلیسی تطبیق دهد.
گوگل ضبط الگوی گفتار را از بیش از 2000 شرکت کننده در پروژه خود جمع آوری کرد.
یکی از کمکهای گوگل به پروژه دسترسی به گفتار این است که شرکت کردن در پروژه Euphonia را آسان میکند تا افراد بتوانند به طور ناشناس نمونههای الگوی گفتار خود را در پروژه دسترسیپذیری صوتی به اشتراک بگذارند.
در اطلاعیه گوگل آمده است:
«امید ما این است که با در دسترس قرار دادن این مجموعه داده ها در اختیار تیم های تحقیق و توسعه، بتوانیم به بهبود سیستم های ارتباطی برای همه از جمله افراد دارای معلولیت کمک کنیم.»
تشخیص گفتار پیشرفته
این پروژه جدید نقطه عطفی در ایجاد فناوری است که می تواند به کسانی که الگوهای گفتاری غیر استاندارد دارند خدمت کند.
چیزی که این پروژه را هیجان انگیز می کند این است که هر پنج شرکت فناوری به جای کار در بخش های جداگانه برای حل مشکلات تشخیص گفتار با یکدیگر همکاری خواهند کرد.
بهبود دسترسی به دستگاه ها و اینترنت برای جوامع محروم به نفع همه است.
منبع محتوا :
speechaccessibilityproject
این مقاله چقدر برای شما مفید بود؟
تعداد رای ها:
0
با تشکر از شما برای امتیاز دادن به این پست!
فرارنک
تیم فنی و آموزشی هی سئو با بیش از ۱۲ سال تجربه تمام دانش خود را به صورت صادقانه با شما عزیزان به اشتراک می گذارد.