OpenAI przedstawia DALL-E 3, który pozwala artystom zrezygnować ze szkolenia

OpenAI przedstawia DALL-E 3, który pozwala artystom zrezygnować ze szkolenia

Kredyty obrazkowe: Bryce’a Durbina/TechCruncha

OpenAI zaprezentowało dzisiaj ulepszoną wersję swojego narzędzia do przetwarzania tekstu na obraz, DALL-E, które wykorzystuje ChatGPT — wirusowego chatbota OpenAI — aby zmniejszyć ból związany z monitowaniem.

Większość dzisiejszych wyrafinowanych narzędzi do tworzenia obrazów opartych na sztucznej inteligencji pobiera podpowiedzi — opisy obrazów — i przekształca je w dzieła sztuki w różnych stylach, od fotorealistycznych po fantastyczne. Jednak stworzenie odpowiedniego wektora może być wyzwaniem do tego stopnia, że ​​„zwinna inżynieria” stała się prawdziwym zawodem.

Nowe narzędzie OpenAI, DALL-E 3, wykorzystuje ChatGPT do wypełniania wniosków. Za pośrednictwem ChatGPT subskrybenci planów Premium ChatGPT, ChatGPT Plus i ChatGPT Enterprise firmy OpenAI mogą napisać prośbę o obraz i udoskonalić go poprzez rozmowy z chatbotem – otrzymując wyniki bezpośrednio w aplikacji do czatowania.

ChatGPT przyjmie krótką podpowiedź składającą się z nie więcej niż kilku słów i uczyni ją bardziej opisową, zapewniając więcej wskazówek dla modelu DALL-E 3.

Integracja ChatGPT nie jest jedyną nowością w DALL-E 3. DALL-E 3 tworzy także obrazy o wyższej jakości, które dokładniej odzwierciedlają podpowiedzi, twierdzi OpenAI — szczególnie w przypadku dłuższych podpowiedzi. Lepiej radzi sobie z treściami, które w przeszłości utrudniały modele generowania obrazów, takimi jak tekst i ludzkie ręce.

Obraz stworzony przez DALL-E 3.

Co więcej, DALL-E 3 ma nowe mechanizmy zmniejszające błąd algorytmiczny i poprawiające bezpieczeństwo, tak przynajmniej twierdzi OpenAI. Na przykład DALL-E 3 odrzuci prośby o portret w stylu żyjących artystów lub przedstawienia osób publicznych. Artyści mogą teraz zdecydować, że nie będą wykorzystywać części lub całości swoich dzieł sztuki do szkolenia przyszłych generacji modeli OpenAI w zakresie konwersji tekstu na obraz. (OpenAI wraz z niektórymi jego konkurentami stoi w obliczu procesu sądowego za rzekome wykorzystywanie dzieł artystów chronionych prawem autorskim do szkolenia swoich generatywnych modeli obrazów AI).

READ  Marketer wywołuje panikę, twierdząc, że używa inteligentnych urządzeń do podsłuchiwania ludzi

Premiera DALL-E 3 następuje w momencie, gdy wyścig o generatywną sztuczną inteligencję nabiera tempa, szczególnie w dziedzinie syntezy obrazu. Konkurenci, tacy jak Midjourney i Stability AI, nadal udoskonalają swoje modele generujące obrazy, wywierając presję na OpenAI, aby utrzymała się na rynku.

OpenAI planuje udostępnić DALL-E 3 użytkownikom premium ChatGPT w październiku, a następnie laboratoriom badawczym i klientom API. Firma nie powiedziała, kiedy i czy planuje udostępnić bezpłatne narzędzie internetowe, tak jak miało to miejsce w przypadku DALL-E 2 i oryginalnego modelu DALL-E.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *