Chociaż Personal Voice był jedną z bardziej ekscytujących funkcji ułatwień dostępu, które Apple ogłosił w tym tygodniu, można by pomyśleć, że nie jest to istotne dla większości ludzi. Ale nowy raport dzisiaj sugeruje, że powinniśmy wszyscy Skorzystaj z niego, gdy pojawi się iOS 17.
Dzieje się tak dlatego, że afazja może wystąpić nagle w wyniku stanów chorobowych, takich jak ALS (ALS).Stwardnienie zanikowe boczne). Zanim ludzie zdadzą sobie sprawę, że potrzebują syntezatora brzmiącego jak oni sami, może być już za późno…
Od głosu robota Stephena Hawkinga do bankowości głosowej
Wszyscy znamy syntezator mowy używany przez nieżyjącego już Stephena Hawkinga. Może wybierać słowa i frazy, które mają być wypowiadane na głos, ale bardzo mechanicznym głosem.
Kolejnym ważnym osiągnięciem była bardziej naturalnie brzmiąca mowa, taka jak używana przez Siri.
Ale najlepszą opcją dla tych, którzy nie mogą już mówić wyraźnie lub wcale, jest taka, która brzmi tak jak Ty.
Jest to możliwe dzięki technologii zwanej bankowością głosową. Twój głos jest nagrywany, gdy wypowiadasz zestaw fraz, a system komputerowy tworzy dźwięk, który wygląda dokładnie tak, jak twój, ucząc się barwy, akcentu, intonacji i czasu Twojej wypowiedzi.
Bankowość głosowa zajmuje obecnie tygodnie
Tradycyjna bankowość głosowa to żmudny proces. Zwykle wymaga wypowiedzenia około 1500 fraz i może być kosztowne i czasochłonne.
powiedział Philip Green, dyrektor organizacji non-profit zajmującej się ALS FastCo Bankowość głosowa zajęła mu kilka tygodni.
Cztery lata temu, kiedy Philip Green dokonał transkrypcji swojego głosu, musiał nagrać 1500 fraz do celów ćwiczeniowych, co było zniechęcającym zadaniem, które zajęło tygodnie. Rozumie więc, dlaczego inni mogą unikać konfrontacji z nim.
„Szczerze mówiąc, masz o wiele więcej na głowie niż„ Och, powinienem zainwestować czas w przechowywanie kopii mojego głosu, której mogę potrzebować za dwa lata, sześć miesięcy, cztery lata ”- mówi Green, członek zarządu kl Zespół GleasonaJest to organizacja non-profit służąca ludziom z ALS.
Zespół Gleasona Został założony przez byłego gracza New Orleans Saints, Steve’a Gleasona, po zdiagnozowaniu u niego ALS w 2011 roku.
Zielony kontynuuje:
„Tak naprawdę o tym nie myślisz. Ale to, co próbujemy zrobić, to edukować ludzi. Zrób to, gdy tylko się dowiesz”. [your diagnosis]Ponieważ jest to w zasadzie polisa ubezpieczeniowa, z której masz nadzieję, że nie będziesz musiał korzystać”.
Kiedy ludzie mogą używać głosu podobnego do ich własnego, może to być głęboko znacząca część doświadczenia. „Chcę, aby moja rodzina słyszała mój sztuczny głos i nie myślała, że jestem robotem” — wyjaśnia Green. „Ale jestem tą samą osobą, którą byłam przed diagnozą”.
W niektórych przypadkach możesz stracić możliwość używania głosu, nawet zanim dowiesz się, dlaczego.
Moja mama zmarła w grudniu po krótkiej siedmiomiesięcznej walce z chorobą. Jedną z pierwszych rzeczy, które straciłem, był jej głos. W rzeczywistości, zanim oficjalnie zdiagnozowano u niej ALS, jej głos już zniknął.
Osobisty głos działa w ciągu 15 minut
To, co Apple osiągnęło dzięki Personal Voice, to użycie potężnego systemu AI do przeprowadzenia procesu bankowości głosowej w zaledwie 15 minut.
Użytkownicy mogą stworzyć osobisty dźwięk, czytając wraz z losowo wybranymi wiadomościami tekstowymi, aby nagrać 15 minut dźwięku na iPhonie lub iPadzie. Ta funkcja dostępu głosowego wykorzystuje uczenie maszynowe na urządzeniu, aby zapewnić prywatność i bezpieczeństwo informacji użytkowników, i bezproblemowo integruje się z Live Speech, dzięki czemu użytkownicy mogą mówić własnym głosem, dzwoniąc do swoich bliskich.
Całe przetwarzanie odbywa się na Twoim urządzeniu
Jednym z problemów związanych z tradycyjną bankowością głosową jest to, że odbywa się to na serwerze. Jeśli ten serwer zostanie zhakowany, istnieje ryzyko, że ktoś przejmie Twój plik audio i będzie mógł wykonywać połączenia telefoniczne, które wyglądają tak samo jak Ty.
Firma była bardzo świadoma tego rodzaju ryzyka, mówi Sarah Herlinger, kierownik ds. ułatwień dostępu w Apple, dlatego całe przetwarzanie odbywa się lokalnie na własnym urządzeniu za pomocą Neural Engine.
„Oprócz dostępności jako jednej z podstawowych wartości naszej firmy, tak samo jest z prywatnością i nie uważamy, że trzeba rezygnować z jednej, aby uzyskać drugą” – mówi Herlinger.
Każdy powinien używać osobistego głosu
Osobiste audio nie tylko zmniejsza czas i wysiłek osób, u których zdiagnozowano już chorobę prowadzącą do utraty mowy, ale jest na tyle bezbolesne, że ma dla nich sens. wszyscy Aby to zrobić, jako polisa ubezpieczeniowa.
Dyrektor Salesforce, Brooke Eby, zgadza się.
Po zdiagnozowaniu ALS Ebby udała się na Instagram i TikTok, aby podzielić się swoją podróżą, edukować innych o ALS i sprawić, by świat był bardziej komfortowy, rozmawiając o chorobie i jej skutkach dla tych, którzy na nią cierpią.
Rozmawiając z innymi członkami społeczności, mówi: „Ciągle słyszę:„ Szkoda, że nie mam banku głosu wcześniej ”. Mówią: „Nieważne, to i tak nie brzmi jak ja, więc może po prostu użyję [generic] głos robota. „
Na pewno to zrobię – a Ty?
zdjęcie: pułapka dźwiękowa/rozpryskiwać
More Stories
Premiera PlayStation 5 Pro planowana jest za kilka tygodni
Kuo: Aktualizacja pamięci RAM do 12 GB w przyszłym roku będzie ograniczona do iPhone’a 17 Pro Max
Firma zajmująca się sztuczną inteligencją Midjourney zapowiada produkt sprzętowy w nowej formie