Flux (також відомий як FLUX.1) — це модель перетворення тексту в зображення, розроблена Black Forest Labs, що базується у Фрайбурзі-ім-Брайсгау, Німеччина. Black Forest Labs заснували колишні співробітники Stability AI. Як і інші моделі перетворення тексту в зображення, Flux генерує зображення з текстових описів.
Історія
Black Forest Labs була заснована в 2024 році Робіном Ромбахом, Андреасом Блатманом і Патріком Ессером, колишніми співробітниками Stability AI[3][4]. Усі троє засновників раніше досліджували створення зображень штучним інтелектом в Мюнхенському університеті Людвіга Максиміліана, як асистенти під керівництвом Бйорна Оммера[5][6][7]. У 2022 році вони опублікували результати свого дослідження генерації зображень, що призвело до створення Stable Diffusion[7][8]. Серед інвесторів Black Forest Labs були компанія венчурного капіталу Andreessen Horowitz та низка індивідуальних інвесторів[9]. Компанія отримала початкові інвестиції в 31 мільйон доларів США[10][11].
У серпні 2024 року Flux було інтегровано в чат-бот Grok, розроблений компанією xAI, і він став доступним як частина преміум-функції на X (раніше Twitter)[12][13][14][15]. У грудні 2024 року Grok перейшов на власну модель перетворення тексту в зображення Aurora.[16]
18 листопада 2024 року компанія Mistral AI оголосила, що її чат-бот Le Chat інтегрував Flux Pro як модель генерації зображень[17][18].
21 листопада 2024 року Black Forest Labs оголосила про випуск Flux.1 Tools, набору інструментів для редагування, призначених для використання поверх існуючих моделей Flux[19].
У січні 2025 року Black Forest Labs оголосила про партнерство з Nvidia для включення моделей Flux як базових моделей для мікроархітектури Blackwell[en] від Nvidia[20]. Компанія також оголосила про випуск Flux Pro Finetuning API, призначеного для точного налаштування зображень, створених Flux, у партнерстві з німецькою медіакомпанією Hubert Burda Media для використання Flux Pro як частини створення контенту[21].
Моделі
Flux — це серія моделей перетворення тексту в зображення. Моделі засновані на гібридній архітектурі, яка поєднує мультимодальні та паралельні блоки дифузійних трансформаторів, масштабовані до 12мільярдів параметрів.[9] Моделі випускаються за різними ліцензіями: Schnell (що означає «швидкий» німецькою мовою) випущено як програмне забезпечення з відкритим вихідним кодом за ліцензією Apache, Dev випущено як програмне забезпечення з вихідним кодом за некомерційною ліцензією, а Pro випущено як пропрієтарне програмне забезпечення та доступне лише як API, яке можуть ліцензувати сторонні користувачі[22][23]. Користувачі зберігали право власності на отримані результати незалежно від використовуваних моделей[24][25].
Моделі можна використовувати як онлайн, так і локально за допомогою генеративних інтерфейсів користувача AI, таких як ComfyUI та Stable Diffusion WebUI Forge (форк Automatic1111 WebUI)[9][26].
Покращена модель Flux 1.1 Pro була випущена 2 жовтня 2024 року.[27][28]. 6 листопада було додано два додаткові режими: Ultra, який може створювати зображення з роздільною здатністю в чотири рази вищою та до 4 мегапікселів, і Raw, який може створювати гіперреалістичні зображення[29][30][31].
Рецепція
Відповідно до тесту, проведеного Ars Technica, вихідні дані, створені Flux.1 Dev і Flux.1 Pro, можна порівняти з DALL-E 3 з точки зору швидкої точності, причому фотореалізм майже відповідає Midjourney 6 і генерує людські руки з більшою послідовністю порівняно з попередніми моделями, такими як Stable Diffusion XL[32].
Flux критикували за дуже реалістичні створені зображення. Згідно з повідомленнями ЗМІ, зображення варіювалися від зображення Дональда Трампа, який позує зі зброєю, до тривожних сцен, які викликали дискусії щодо етичних наслідків технологій, розроблених Black Forest Labs[5][14].
Після випуску моделі соціальні мережі X були переповнені зображеннями, створеними Flux[33][34]. Black Forest Labs не надала точних деталей щодо даних, використаних для навчання моделі[29]. Ars Technica підозрювала, що Flux базується на великій несанкціонованій колекції зображень, зібраних з Інтернету, що є суперечливою практикою з потенційними правовими наслідками[32][35].
Сторонні інтеграції
Хоча Black Forest Labs не пропонують прямого доступу до своїх моделей на своєму вебсайті, моделі Flux широко доступні через різні сторонні платформи для творчого та професійного використання.
↑flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux. GitHub(англ.). Архів оригіналу за 15 вересня 2024. Процитовано 18 листопада 2024. Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model.
↑API Agreement - BFL Docs (Pro). Black Forest Labs. 1 серпня 2024. Архів оригіналу за 3 жовтня 2024. Процитовано 18 листопада 2024. Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters.