Kredyty obrazkowe: Bryce’a Durbina/TechCruncha
OpenAI zaprezentowało dzisiaj ulepszoną wersję swojego narzędzia do przetwarzania tekstu na obraz, DALL-E, które wykorzystuje ChatGPT — wirusowego chatbota OpenAI — aby zmniejszyć ból związany z monitowaniem.
Większość dzisiejszych wyrafinowanych narzędzi do tworzenia obrazów opartych na sztucznej inteligencji pobiera podpowiedzi — opisy obrazów — i przekształca je w dzieła sztuki w różnych stylach, od fotorealistycznych po fantastyczne. Jednak stworzenie odpowiedniego wektora może być wyzwaniem do tego stopnia, że „zwinna inżynieria” stała się prawdziwym zawodem.
Nowe narzędzie OpenAI, DALL-E 3, wykorzystuje ChatGPT do wypełniania wniosków. Za pośrednictwem ChatGPT subskrybenci planów Premium ChatGPT, ChatGPT Plus i ChatGPT Enterprise firmy OpenAI mogą napisać prośbę o obraz i udoskonalić go poprzez rozmowy z chatbotem – otrzymując wyniki bezpośrednio w aplikacji do czatowania.
ChatGPT przyjmie krótką podpowiedź składającą się z nie więcej niż kilku słów i uczyni ją bardziej opisową, zapewniając więcej wskazówek dla modelu DALL-E 3.
Integracja ChatGPT nie jest jedyną nowością w DALL-E 3. DALL-E 3 tworzy także obrazy o wyższej jakości, które dokładniej odzwierciedlają podpowiedzi, twierdzi OpenAI — szczególnie w przypadku dłuższych podpowiedzi. Lepiej radzi sobie z treściami, które w przeszłości utrudniały modele generowania obrazów, takimi jak tekst i ludzkie ręce.
Co więcej, DALL-E 3 ma nowe mechanizmy zmniejszające błąd algorytmiczny i poprawiające bezpieczeństwo, tak przynajmniej twierdzi OpenAI. Na przykład DALL-E 3 odrzuci prośby o portret w stylu żyjących artystów lub przedstawienia osób publicznych. Artyści mogą teraz zdecydować, że nie będą wykorzystywać części lub całości swoich dzieł sztuki do szkolenia przyszłych generacji modeli OpenAI w zakresie konwersji tekstu na obraz. (OpenAI wraz z niektórymi jego konkurentami stoi w obliczu procesu sądowego za rzekome wykorzystywanie dzieł artystów chronionych prawem autorskim do szkolenia swoich generatywnych modeli obrazów AI).
Premiera DALL-E 3 następuje w momencie, gdy wyścig o generatywną sztuczną inteligencję nabiera tempa, szczególnie w dziedzinie syntezy obrazu. Konkurenci, tacy jak Midjourney i Stability AI, nadal udoskonalają swoje modele generujące obrazy, wywierając presję na OpenAI, aby utrzymała się na rynku.
OpenAI planuje udostępnić DALL-E 3 użytkownikom premium ChatGPT w październiku, a następnie laboratoriom badawczym i klientom API. Firma nie powiedziała, kiedy i czy planuje udostępnić bezpłatne narzędzie internetowe, tak jak miało to miejsce w przypadku DALL-E 2 i oryginalnego modelu DALL-E.
„Specjalista sieciowy. Odwieczny maniak zombie. Kawowy ninja. Przyjazny dla hipsterów analityk.”
More Stories
Premiera PlayStation 5 Pro planowana jest za kilka tygodni
Kuo: Aktualizacja pamięci RAM do 12 GB w przyszłym roku będzie ograniczona do iPhone’a 17 Pro Max
Firma zajmująca się sztuczną inteligencją Midjourney zapowiada produkt sprzętowy w nowej formie