15 listopada, 2024

Magyar24

Polska Najnowsze wiadomości, zdjęcia, filmy i raporty specjalne z. Polska Blogi, komentarze i wiadomości archiwalne na …

OpenAI przedstawia DALL-E 3, który pozwala artystom zrezygnować ze szkolenia

Kredyty obrazkowe: Bryce’a Durbina/TechCruncha

OpenAI zaprezentowało dzisiaj ulepszoną wersję swojego narzędzia do przetwarzania tekstu na obraz, DALL-E, które wykorzystuje ChatGPT — wirusowego chatbota OpenAI — aby zmniejszyć ból związany z monitowaniem.

Większość dzisiejszych wyrafinowanych narzędzi do tworzenia obrazów opartych na sztucznej inteligencji pobiera podpowiedzi — opisy obrazów — i przekształca je w dzieła sztuki w różnych stylach, od fotorealistycznych po fantastyczne. Jednak stworzenie odpowiedniego wektora może być wyzwaniem do tego stopnia, że ​​„zwinna inżynieria” stała się prawdziwym zawodem.

Nowe narzędzie OpenAI, DALL-E 3, wykorzystuje ChatGPT do wypełniania wniosków. Za pośrednictwem ChatGPT subskrybenci planów Premium ChatGPT, ChatGPT Plus i ChatGPT Enterprise firmy OpenAI mogą napisać prośbę o obraz i udoskonalić go poprzez rozmowy z chatbotem – otrzymując wyniki bezpośrednio w aplikacji do czatowania.

ChatGPT przyjmie krótką podpowiedź składającą się z nie więcej niż kilku słów i uczyni ją bardziej opisową, zapewniając więcej wskazówek dla modelu DALL-E 3.

Integracja ChatGPT nie jest jedyną nowością w DALL-E 3. DALL-E 3 tworzy także obrazy o wyższej jakości, które dokładniej odzwierciedlają podpowiedzi, twierdzi OpenAI — szczególnie w przypadku dłuższych podpowiedzi. Lepiej radzi sobie z treściami, które w przeszłości utrudniały modele generowania obrazów, takimi jak tekst i ludzkie ręce.

Obraz stworzony przez DALL-E 3.

Co więcej, DALL-E 3 ma nowe mechanizmy zmniejszające błąd algorytmiczny i poprawiające bezpieczeństwo, tak przynajmniej twierdzi OpenAI. Na przykład DALL-E 3 odrzuci prośby o portret w stylu żyjących artystów lub przedstawienia osób publicznych. Artyści mogą teraz zdecydować, że nie będą wykorzystywać części lub całości swoich dzieł sztuki do szkolenia przyszłych generacji modeli OpenAI w zakresie konwersji tekstu na obraz. (OpenAI wraz z niektórymi jego konkurentami stoi w obliczu procesu sądowego za rzekome wykorzystywanie dzieł artystów chronionych prawem autorskim do szkolenia swoich generatywnych modeli obrazów AI).

Premiera DALL-E 3 następuje w momencie, gdy wyścig o generatywną sztuczną inteligencję nabiera tempa, szczególnie w dziedzinie syntezy obrazu. Konkurenci, tacy jak Midjourney i Stability AI, nadal udoskonalają swoje modele generujące obrazy, wywierając presję na OpenAI, aby utrzymała się na rynku.

OpenAI planuje udostępnić DALL-E 3 użytkownikom premium ChatGPT w październiku, a następnie laboratoriom badawczym i klientom API. Firma nie powiedziała, kiedy i czy planuje udostępnić bezpłatne narzędzie internetowe, tak jak miało to miejsce w przypadku DALL-E 2 i oryginalnego modelu DALL-E.