Teknolohiya Text-To-Speech sa isang kusang istilo, na binuo ni Xiaomi AI Lab sa China, isa ito sa mga huling hangganan pagdating sa pagkilala sa boses at paggamit ng mga device sa pamamagitan ng boses. Ang proyekto na ipinanganak sa loob ng laboratoryo ito ay tinatawag na "Pagmamay-ari ang Aking Boses“. Pinapayagan nito ang mga tatanggap na sa kasamaang palad ay nagdurusa sakit sa pagsasalita upang magkaroon ng natatangi at personalized na mga boses para makipag-usap sa ibang tao. Tingnan natin nang detalyado kung ano ito at kung gaano katagal ang kumpanyang Tsino ay nagtatrabaho dito.
Inihayag ng Xiaomi ang pinakabagong application nito ng mga advanced na algorithm at self-developed voice technology na tumutulong sa mga may speech disorder
Xiaomi nagmamalasakit sa mga tao at nagsisikap na matugunan ang kanilang magkakaibang mga pangangailangan sa pamamagitan ng makabagong teknolohiya. Sa nakalipas na ilang taon, natuklasan ng Chinese brand ang pagnanais ng maraming user na may mga speech disorder sariling boses, kahit na kakaiba, na gagamitin para sa pang-araw-araw na komunikasyon. Para sa kadahilanang ito itinatag ng Xiaomi ang pangkat ng proyekto "Pagmamay-ari ang Aking Boses“. Si Zhu Xi, coordinator ng Technology Committee on Tech for Good sa Xiaomi, ay nagsabi:
Nasasabik kaming tuklasin ang maraming halaga na inaalok sa amin ng teknolohikal na pagbabago, tulad ng pagtugon sa mga kahilingan ng user para sa personal na pagkakakilanlan at pagbuo ng pagkakakilanlan
Upang makabuo ng pinakaangkop at personalized na boses para sa user na may mga karamdaman sa pagsasalita, mayroon ang Xiaomi project team nag-recruit ng higit sa 200 boluntaryo sa loob para ibigay ang iyong boses. Ginamit ang voiceprint matching algorithm upang itugma ang mga katangian ng mga boses na naibigay ng mga boluntaryo sa boses ng tatanggap. Sa pamamagitan ng diskarteng ito, ito ay natagpuan ang pinakaangkop na boses bilang reference na tunog pangunahing patinig para sa tatanggap.
Basahin din ang: Ang Mi Band 7 ay lumabas sa bukas na kumpleto sa petsa at presyo | Larawan
Kasunod nito, ginamit ng mga iskolar ang kusang istilong text-to-speech na teknolohiya sa sanayin ang modelo ng AI. Sa ganitong paraan, isang natural na ritmo at intonasyon na may kakayahang unti-unting idagdag sa bagong boses na ito ipahayag ang damdamin nang totoo at ang tono ng isang tao.
Idinagdag ni Zhu Xi:
Kung mapapansin at tutugunan natin ang mga pangangailangan ng mga grupong minorya sa maagang yugto, ang proseso ng pagsasabog ng teknolohiya ay maaaring makabuluhang paikliin. Nagbibigay-daan ito sa mga benepisyo ng mga bagong teknolohiya na maging kaagad na ma-access ng mga user na may mga espesyal na pangangailangan
Ang backbone ng proyektong ito ay isang grupo ng mga dalubhasa sa teknolohiya ng boses ng Xiaomi AI Lab. Mula sa 2017 naglathala ng 37 artikulo sa ganitong kahulugan at naroroon sa mahahalagang kapaligiran tulad ngInternational Conference on Acoustics, Speech, at Signal Processing (ICASSP). Ang tagumpay ng "Pagmamay-ari ang Aking Boses” higit sa lahat ay nakasalalay sa kusang istilo ng teknolohiyang Text-To-Speech na kanilang binuo. Ang kusang istilo ng teknolohiya Talagang ginagawa ng Text-To-Speech na parang totoong tao ang synthesize na boses sa intonasyon, pause, bilis at iba pang katangian nito. Pinapalitan nito ang monotonous at hindi natural na pakiramdam ng electronic voice ng mas natural.