Tym razem w zeszłym roku media społecznościowe płonęły wirusową „Głęboką nostalgią” MyHeritage, której magia AI animuje nasze stare rodzinne zdjęcia z niepokojącym realizmem. Cóż, jeśli cię to przestraszy, poczekaj, aż zobaczysz nową funkcję, którą właśnie nazwałem LiveStory.
Tym razem technologia internetowej firmy genealogicznej nie tworzy małego klipu składającego się z 10-20 klipów na podstawie starego zdjęcia Twojego krewnego. Zamiast tego LiveStory idzie dalej, tworząc dłuższe animowane wideo Twojego przodka, które opowiada historię jego całego życia, wraz z dźwiękiem zsynchronizowanym z ustami i pokazem slajdów ze starych zdjęć.
Tak jak poprzednio, działa przy użyciu technologii „odtwarzania” opartej na sztucznej inteligencji, która animuje obraz twarzy twojego krewnego. Ale tym razem otrzymujesz również głos, który jest automatycznie generowany z drzewa genealogicznego MyHeritage lub wprowadzany ręcznie przez Ciebie. Następnie technologia przetwarzania tekstu na mowę ożywia historię, a dźwięk jest zsynchronizowany z poruszającym się głośnikiem Twojego krewnego.
Jak to działa?
Podobnie jak w przypadku zeszłorocznej technologii „Deep Nostalgia”, animacje LiveStory są tworzone przy użyciu dużej kolekcji „filmów ze sterownikami”. Gdy algorytmy usługi przeanalizują przesłany obraz, jego najistotniejsze cechy lub „cechy” twarzy są następnie mapowane na wideo kierowcy, aby stworzyć wrażenie ruchu. Algorytmy uzupełniają również brakujące szczegóły. Generator głosu syntetycznego tworzy również narrację na podstawie informacji z profilu osoby lub możesz stworzyć własny skrypt od podstaw. Możesz także przesłać własne nagranie audio.
MyHeritage i D-ID, izraelska firma, która tworzy i licencjonuje technologię, twierdzi, że efekt końcowy jest w pełni konfigurowalny, co daje możliwość zmiany narracji, obrazów i dźwięku przed wysłaniem go do rodziny lub mediów społecznościowych. LiveStory wydaje się również obsługiwać 31 języków, dziesiątki dialektów i setki znaków głosowych, a także kilka opcji głosu męskiego i żeńskiego.
Mimo to nie ma wątpliwości, że technologia jest nieco przerażająca i zabiera nas w jeszcze większą podróż w niesamowitą dolinę. Dla niektórych dodawanie dźwięku mogło posunąć się za daleko, a MyHeritage musiał dodać pewne zastrzeżenia, aby mieć pewność, że technologia nie jest nadużywana. Mówi, że LiveStory „jest przeznaczony wyłącznie do wykorzystania na zdjęciach zmarłych osób, zwykle przodków” i że „nigdy nie należy go używać na zdjęciu żywej osoby bez jej zgody”.
Jednak wiele osób w mediach społecznościowych odkryło, że zeszłoroczna technika „głębokiej nostalgii” była pocieszającym, a nawet ocieplającym sposobem na relacje, których nigdy wcześniej nie widzieli w prawdziwym życiu. Podobnie jak ta funkcja, LiveStory jest obecnie dostępna do wypróbowania za darmo na komputerach stacjonarnych i mobilnych (zarówno za pośrednictwem Witryna MyHeritage) oraz w aplikacji mobilnej MyHeritage. Możesz stworzyć kilka LiveStories za darmo, ale potem będziesz musiał zapłacić za subskrypcję (od 119 USD / 89 GBP rocznie).
Analiza: Odważniejszy ruch w dolinę niesamowitości
Podobnie jak w zeszłym roku „Deep Nostalgia”, jesteśmy trochę rozdarci nową funkcją MyHeritage „LiveStory”. Nie ma wątpliwości, że technologia jest świetna, a fakt, że może automatycznie wygenerować 90-sekundową biografię wideo ze zdjęcia, drzewa genealogicznego i tekstu, jest zarówno imponujący, jak i przerażający.
Jednak nie możemy oprzeć się wrażeniu, że duża część poprzedniego sukcesu wirusowego technologii (który zaowocował 100 milionami animacji) wynika z jej dokładności. Ruchome twarze, które stworzyła Deep Nostalgia, od czasu do czasu mrugały lub przechylały głowy, ale tak właśnie było – i to ograniczenie pomogło stworzyć iluzję, jednocześnie maskując ograniczenia technologii.
Dodanie dźwięku jest logicznym krokiem i bez wątpienia okaże się popularnym narzędziem dla tych, którzy nie odczuwają dreszczy spowodowanych niezaprzeczalnym czynnikiem pełzania. Ale z przykładów, które widzieliśmy do tej pory, intonacja jest czasami zautomatyzowana, a fakt, że dźwięk nie jest samplowany z oryginału, czyni go nieco sztucznym.
Obecnie LiveStory wydaje się być bardziej odpowiedni dla muzeów lub edukacji, gdzie jego zdolność do ożywiania postaci historycznych (zamiast relacji osobistych) może być użytecznym sposobem na uatrakcyjnienie historii dla zwiedzających i dzieci.
Oczywiście istnieje również możliwość nadużycia, chociaż D-ID (twórca technologii) ustanowił pewne bariery, aby temu zapobiec. Wszyscy użytkownicy muszą zaakceptować warunki, w tym obietnicę, że nie będą ich używać na żywych ludziach, zanim będą mogli stworzyć LiveStory. Na pokładzie znajduje się również algorytm modyfikacji tekstu w celu sprawdzenia obraźliwych, zniesławiających lub fałszywych informacji, chociaż nie jest jasne, w jaki sposób te ostatnie są sprawdzane.
gdy Rozmawialiśmy z D-ID w zeszłym roku w ekskluzywnym wywiadzieJesteśmy pod wrażeniem jej zaangażowania w upewnienie się, że jej technologia sztucznej inteligencji nie jest wykorzystywana w nikczemny sposób, choć trochę irytuje nas jej przewidywania, że większość mediów wizualnych, które widzimy w Internecie, będzie syntetyczna „w ciągu 5-10 lat”. LiveStory jest wyraźnie kolejnym krokiem na linii.Ten utwór, jeśli nie ruch, to wirusowy przebój, który był „głęboką nostalgią” w zeszłym roku.
„Specjalista sieciowy. Odwieczny maniak zombie. Kawowy ninja. Przyjazny dla hipsterów analityk.”
More Stories
Premiera PlayStation 5 Pro planowana jest za kilka tygodni
Kuo: Aktualizacja pamięci RAM do 12 GB w przyszłym roku będzie ograniczona do iPhone’a 17 Pro Max
Firma zajmująca się sztuczną inteligencją Midjourney zapowiada produkt sprzętowy w nowej formie