Generatory grafiki AI są z nami obecne już od dobrych kilku lat. W początkowej fazie, efekty ich pracy mogły budzić jedynie uśmiech, który z politowania przechodził z czasem w coraz większy podziw. Choć pierwsze grafiki były jeszcze pokraczne, wiadomo było, że zwycięzcą w tym wyścigu będzie ten, kto jak najbardziej zbliży się do fotograficznego realizmu. I choć obecnie wiele modeli jest w stanie generować grafiki o jakości dobrego zdjęcia, to Flux wszedł na salony przebojem. Bo jako pierwszy pozwala to robić na własnych warunkach.
Midjourney, Stable Difussion XL i inne modele AI generujące grafikę już świetnie sobie radzą z fotorealizmem. Co zatem wyjątkowego jest we Fluxie? Jest to model, który jest dostępny w modelu opensource. A to oznacza, że można taki model postawić na własnej infrastrukturze. Pliki dostępne są zarówno na GitHubie, jak i na Hugging Face. Model korzysta z 12 miliardów parametrów, co sprawia, że jest on porównywalny z Midjourney czy Stable Diffusion.
Oczywiście, Flux oferuje możliwość korzystania z niego w wersji on-line, zarówno za darmo (po zalogowaniu), jak i w kilku planach abonamentowych. System pozwala wybrać jaka ma być wielkość wygenerowanej grafiki. Dostępne jest kilka najpopularniejszych rozdzielczości w tym Instagram Post (1080x1080 pikseli). Wybieramy też, który z modeli AI chcemy użyć: od flux-shnell, który jest najszybszy aż po flux-realistic, który daje najbardziej zaawansowane i realistyczne obrazy. Ciekawą funkcją jest też „Image to prompt”, która pozwala po wgraniu zdjęcia zobaczyć, jaki prompt powinien prowadzić do wygenerowania analogicznego obrazu.
Flux AI bardzo dobrze radzi sobie z generowaniem tekstu i napisów, ludzką anatomią i pozwala na szybkie generowanie wysokiej jakości fotorealistycznych obrazów. Wyzwaniem może być generowanie polskich znaków.
Źródło tytułowego zdjęcia: https://x.com/RodrigoLacorte2/status/1825137560353652845