Centrum wiedzy o technologiach i pracy w IT

DALL-E 2 – nowa wersja generatora obrazów

OpenAI zajmuje się badaniami oraz wdrażaniem sztucznej inteligencji. Zespół badawczy stworzył nową wersję narzędzia DALL-E, które umożliwia generowanie obrazu na bazie tekstu wprowadzanego przez użytkowników. Ulepszenia w DALL-E 2 dotyczą wyższej rozdzielczości, mniejszych opóźnień podczas tworzenia obrazu, a także ich edycji. Narzędzie nie jest jednak dostępne publicznie. Zainteresowani mogą wpisać się na listę oczekujących, aby zyskać dostęp do podglądu systemu.

Sprawdź: Multisearch – nowa funkcja wyszukiwania w Google Lens

DALL-E – pierwsza wersja

Poprzednia wersja narzędzia pozwalała tworzyć obrazy w ograniczonym stopniu skomplikowania. Rozdzielczość utworzonego obrazu wynosiła 256 x 256 px.

Sztuczna inteligencja mogła przedstawić wizualnie prosto opisany obiekt i tak na przykład powstały fotele w kształcie awokado albo ilustracja małej rzodkiewki, która spaceruje z psem.

Źródło: openai.com

Mimo to DALL-E musiało się wykazać wiązaniem zmiennych, które umożliwiały tworzenie skojarzeń. Na przykładzie wyrażenia: „Pies w żółtym kapeluszu, niebieskich butach, czerwonych spodniach” DALL-E musi poprawnie skomponować każdy element ubioru z postacią zwierzęcia oraz utworzyć pary skojarzeń, np. żółty, kapelusz, a przy tym ich nie pomieszać. Ta wersja narzędzia oferowała pewien stopień kontroli atrybutów, jednak wszystko zależało również od sformułowania podpisu.

DALL-E 2 – nowa odsłona

DALL-E 2 umożliwia tworzenie obrazów o większym poziomie skomplikowania, a efekty są bardzo plastyczne i intrygujące. Przede wszystkim użytkownik ma możliwość wgrania istniejącego już obrazu i zdecydować o modyfikacji konkretnego obszaru. Daje to spore możliwości tworzenia wizualizacji lub montażu.

Źródło: openai.com

Narzędzie może dodawać oraz usuwać obiekty z uwzględnianiem cieni. Ponadto użytkownicy mogą „wyszukiwać” inne zdjęcia, które tak naprawdę nie istnieją, ale są podobne do bazowego, które zostało przesłane do modelu. Znacznie wyższa rozdzielczość o parametrach 1024 x 1024 px pozwala uzyskać o wiele bardziej estetyczne efekty.

Zobacz: Panel słoneczny, który produkuje prąd w nocy

Twórcy zadbali również o zabezpieczenia związane z możliwymi nadużyciami. DALL-E 2 został wytrenowany na materiałach budzących zastrzeżenia, co skutecznie ograniczyło jego zdolność do wytworzenia kontrowersyjnej treści. Model nie może generować obrazów znanych, rozpoznawalnych twarzy. Zablokowano również możliwość tworzenia symboli nienawiści, wulgarnych treści lub obrazów, które mogłyby stanowić nawiązania geopolityczne.

Total
0
Shares
_podobne artykuły