Affects the cost of a generation.",0.0005,"8000",[],"The maximum number of tokens to use as input for a model.","Максимальное количество токенов для использования в качестве входных данных для модели.","Длина контекста",30,"Generate text, interpret images, and automate workflows for coding",0.003,0.015,5,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/claude.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/claude-3.5-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/claude-3.5-preview.png",1275,"2025-08-29T16:36:28.770Z","2024-10-22T10:51:00.000Z","2024-09-01T10:51:39.578Z","Claude 3.5 Sonnet is a versatile generative AI tuned for creative writing, advanced coding, visual reasoning, and autonomous multi-step workflows. Built for enterprises and developers and available via platforms such as Yale’s Clarity, Amazon Bedrock, Vertex AI, and Claude.ai, Sonnet helps teams prototype software, migrate legacy code, draft polished content, and extract insights from images and mixed data. Its improved software engineering performance (SWE-bench Verified rising from 33% to 49%) and benchmark gains on domain tests make it one of the leading public models for practical coding tasks. Sonnet can write, edit, and execute code to accelerate development cycles, support debugging, and generate working functions from high-level specifications. Its vision capabilities interpret charts, diagrams, and imperfect images reliably, enabling better business intelligence in retail, logistics, and finance. Unique tool-integration training enables Sonnet to interact with software interfaces and perform web navigation and multi-step workflows autonomously where platform integrations allow. On Claude.ai, the Artifacts workspace supports collaborative creation and iterative editing of code, documents, and other assets in real time. The model also excels at complex customer support, orchestrating multi-stage resolutions, and producing statistical visualizations and actionable analysis from unstructured data. Operationally, Sonnet delivers lower latency and stronger instruction following than prior versions while maintaining the same price and speed. It underwent safety evaluations by U.S. and U.K. AI safety institutes and follows responsible scaling practices. Limitations include restricted file-upload support on some platforms, non-recommendation for processing ePHI, and the need for human oversight for mission-critical or highly specialized tasks. For teams seeking a high-performance assistant that bridges creative, analytical, and engineering workflows, Claude 3.5 Sonnet offers a powerful, practical, and collaborative solution.",12,[],[494,495,496,497],"68a9d79ee3ac04ad89b91f81","68a9d79ee3ac04ad89b91f83","68a9d79ee3ac04ad89b91f85","68a9d79ee3ac04ad89b91f87","Генерирует текст, понимает изображения и автоматизирует рабочие процессы для кода","Claude 3.5 Sonnet — универсальная генеративная модель, оптимизированная для творческого письма, продвинутой разработки кода, визуального анализа и автономных многошаговых рабочих процессов. Доступный на платформах, таких как Yale Clarity, Amazon Bedrock, Vertex AI и Claude.ai, Sonnet помогает командам быстро прототипировать ПО, мигрировать устаревший код, готовить отредактированные тексты и извлекать инсайты из изображений и смешанных данных. Модель демонстрирует заметный рост в инженерных бенчмарках (SWE-bench Verified: с 33% до 49%) и улучшения в доменных тестах, что делает её одной из лидирующих публичных моделей для практических задач программирования. Sonnet умеет писать, править и запускать код, ускоряя цикл разработки, помогая с отладкой и формируя рабочие функции по высоким спецификациям. Её зрительные возможности позволяют надёжно интерпретировать диаграммы, графики и неидеальные снимки, что полезно для ритейла, логистики и финансов. Обучение взаимодействию с инструментами даёт модели способность работать с интерфейсами программ, выполнять навигацию по вебу и автономно решать многошаговые задачи там, где доступны интеграции. В Claude.ai рабочее пространство Artifacts поддерживает совместное создание и итеративное редактирование кода и документов в реальном времени. Модель также эффективно решает сложные запросы службы поддержки, оркестрирует многоступенчатые процессы и генерирует статистические визуализации и практические выводы из неструктурированных данных. Sonnet обеспечивает низкую задержку и улучшённое следование инструкциям, сохраняя прежние цену и скорость, прошла оценку безопасности в США и Великобритании. Ограничения: частичная поддержка загрузки файлов на некоторых платформах, не рекомендуется для обработки ePHI и требует контроля человека для критичных задач. Для команд, которым нужен мощный помощник, объединяющий креативность, аналитику и разработку, Claude 3.5 Sonnet представляет собой практичное и продуктивное решение.",{"top_p":439,"temperature":449,"max_tokens":461,"capacity":473},{"replicateApiType":6,"outputPath":7,"_id":502,"key":503,"label":504,"shortLabel":504,"description":505,"isInstantModel":12,"ruDescription":506,"releaseDate":507,"ruLongDescription":508,"contextCapacity":426,"maxTokens":427,"createdAt":489,"generationCount":509,"type":428,"generationType":429,"generationTypes":510,"api":431,"settingConfigs":511,"percs":549,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":478,"gemTokenCost":491,"iconUrl":483,"previewImageUrl":485,"bannerImageUrl":484,"position":38,"secondCost":30,"generationCost":30,"inputTokenCost":480,"outputTokenCost":481,"stepPrice":30,"examples":553,"updatedAt":554,"__v":555,"isReasoningModel":61,"isUpscaler":12,"oneImageCost":30,"supportFiles":61,"tokenStrategy":556,"supportedFileTypes":557,"isAvailableAfterAuth":12,"longDescription":558,"configValue":559},"67bdc786862d887d2b1bda1e","claude-3-7-sonnet-latest","Claude 3.7 Sonnet","Hybrid-reasoning model for deep analysis, coding, and long outputs","Гибридная модель для глубокого анализа, кодирования и длинных ответов","2024-10-21T10:51:00.000Z","Claude 3.7 Sonnet — гибридная языковая модель, созданная для практичного баланса между скоростью и глубиной рассуждений. Модель поддерживает два режима работы: быстрый стандартный режим для оперативных ответов высокого качества и режим «углублённого мышления», который выполняет пошаговый анализ, планирование и многоперспективную оценку перед формированием ответа. Это делает модель полезной как для мгновенной помощи, так и для решения сложных задач, требующих вдумчивого подхода.\n\nМодель особенно хорошо справляется с задачами разработки ПО — показывает лучшие в индустрии результаты в бенчмарках по кодированию и является самым мощным решением Anthropic для контекстно-зависимого и творческого программирования. Разработчики могут использовать агентные рабочие процессы через инструмент Claude Code для делегирования значительных инженерных задач прямо из терминала. Claude 3.7 Sonnet поддерживает очень большие взаимодействия: до 200 000 входных токенов и до 128 000 выходных токенов (64K обычно доступно, 128K в бета), что позволяет работать с большими кодовыми базами, подробными отчётами и исследовательскими материалами в одной сессии.\n\nAPI предоставляет тонкую настройку времени «размышления» модели, что помогает регулировать скорость, глубину и стоимость ответов. Практичные функции включают пакетные предсказания, кэширование промптов, вызов функций и подсчёт токенов. Модель доступна на платформах Anthropic API, Amazon Bedrock и Google Vertex AI; режим углублённого мышления включён в платные тарифы. Знания актуальны по ноябрь 2024 года.\n\nИспользуйте Claude 3.7 Sonnet для сложного кодирования и отладки, AI-агентов с многошаговыми рабочими процессами, генерации длинного контента и технической документации, а также для задач, требующих пошагового анализа. Несмотря на наличие Sonnet 4 с улучшениями, Claude 3.7 остаётся мощным и гибким выбором при необходимости сильных возможностей кодирования и работы с большим контекстом.",1541,[429],[512,516,520,524,528,539],{"fileTypes":513,"_id":514,"key":436,"model":502,"title":437,"tooltipContent":438,"description":438,"ruTitle":442,"ruDescription":441,"step":249,"max":38,"min":30,"defaultValue":439,"options":515,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67bdc786862d887d2b1bda20",[],{"fileTypes":517,"_id":518,"key":446,"model":502,"title":447,"tooltipContent":448,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":519,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67bdc786862d887d2b1bda22",[],{"fileTypes":521,"_id":522,"key":457,"model":502,"title":458,"tooltipContent":459,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":82,"defaultValue":461,"isAdvanced":61,"options":523,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67bdc786862d887d2b1bda24",[],{"fileTypes":525,"_id":526,"key":469,"model":502,"title":470,"tooltipContent":471,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":426,"min":427,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":527,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67bdc786862d887d2b1bda26",[],{"fileTypes":529,"_id":530,"key":531,"model":502,"title":532,"description":533,"ruTitle":534,"ruDescription":535,"defaultValue":25,"options":536,"settingType":537,"fileSource":28,"__v":30,"icon":538},[],"67c03ce0331b8be9fcb0a40e","reasoning","Reasoning","Ability to think deeper","Рассуждать","Подумать глубже",[],"button","Brain",{"fileTypes":540,"_id":541,"key":542,"model":502,"title":543,"description":544,"ruTitle":545,"ruDescription":546,"step":65,"max":547,"min":427,"costMultiplier":38,"defaultValue":461,"options":548,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67c045648efe633b5d1c990f","reasoning_tokens","Reasoning Tokens","Budget for reasoning. Must be lesser than Max Tokens (length of an output)","Бюджет на расуждения","Сколько токенов будет потрачено на рассуждение. Число должно быть больше чем длина выхода. ",16000,[],[550,551,552],"68a9de73e3ac04ad89b920fa","68a9de73e3ac04ad89b920fc","68a9de73e3ac04ad89b920fe",[],"2025-08-23T15:29:55.815Z",8,"claude",[63,64],"Claude 3.7 Sonnet is a hybrid-reasoning language model built to give users a practical balance between speed and depth. It offers two operational modes: a fast standard mode for quick, high-quality replies, and an extended thinking mode that performs step-by-step reasoning, planning, and multi-perspective analysis before returning an answer. This makes it useful both for near-instant support and for tackling complex problems that need careful deliberation.\n\nThe model excels at software engineering tasks — it achieves industry-leading coding benchmark results and is Anthropic’s most capable model for creative and context-aware coding. Developers can use agentic workflows via the Claude Code command-line tool to delegate substantial engineering tasks directly from the terminal. Claude 3.7 Sonnet also supports very large interactions: up to 200,000 input tokens and up to 128,000 output tokens (64K generally available, 128K in beta), letting you handle long codebases, detailed reports, and extensive research in a single session.\n\nAPI users get fine-grained control over how long the model ‘thinks’, helping balance response speed, depth, and cost. Practical features include batch predictions, prompt caching, function calling, and token counting. The model is widely available across Anthropic’s plans and major cloud providers (Anthropic API, Amazon Bedrock, Google Vertex AI); extended thinking is included on paid tiers. Knowledge is current through November 2024. \n\nUse Claude 3.7 Sonnet for complex coding and debugging, AI agents requiring multi-step workflows, long-form content and technical documentation, and problems that benefit from deliberate, stepwise reasoning. While Sonnet 4 improves on some capabilities, Claude 3.7 remains a powerful, flexible choice when you need strong coding performance, large-context handling, and controllable reasoning depth.",{"top_p":439,"temperature":449,"max_tokens":461,"capacity":473,"reasoning":25,"reasoning_tokens":461},{"_id":561,"key":562,"label":563,"shortLabel":564,"description":565,"isInstantModel":12,"isReasoningModel":61,"ruDescription":566,"releaseDate":507,"ruLongDescription":567,"isUpscaler":12,"contextCapacity":426,"maxTokens":427,"createdAt":489,"generationCount":568,"type":428,"generationType":429,"generationTypes":569,"api":431,"settingConfigs":570,"percs":596,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":597,"cost":478,"gemTokenCost":491,"iconUrl":483,"previewImageUrl":485,"bannerImageUrl":484,"position":38,"secondCost":30,"generationCost":30,"inputTokenCost":481,"outputTokenCost":598,"stepPrice":30,"tokenStrategy":556,"oneImageCost":30,"examples":599,"updatedAt":600,"__v":126,"isAvailableAfterAuth":61,"isBanned":12,"outputPath":7,"replicateApiType":6,"configValue":601},"686bc08ac86982629c730604","claude-opus-4-20250514","Claude 4 Opus","Claude 4 Sonnet","Anthropic's most advanced model with reasoning and web-search capabilities.","Самая продвинутая модель Anthropic с возможностями рассуждения и веб-поиска.","\u003Cp>Эта современная модель искусственного интеллекта превосходно справляется с созданием креативного контента, логическим решением проблем и обеспечивает точные результаты в различных областях с повышенной эффективностью и адаптивностью.\u003C/p>",1724,[429],[571,575,579,584,588,592],{"_id":572,"key":436,"model":561,"title":437,"tooltipContent":438,"description":438,"ruTitle":442,"ruDescription":441,"step":249,"max":38,"min":30,"defaultValue":439,"options":573,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":574},"686bc08ac86982629c730606",[],[],{"_id":576,"key":446,"model":561,"title":447,"tooltipContent":448,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":577,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":578},"686bc08ac86982629c730608",[],[],{"_id":580,"key":457,"model":561,"title":458,"tooltipContent":459,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":65,"defaultValue":581,"isAdvanced":61,"options":582,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":583},"686bc08ac86982629c73060a","4000",[],[],{"_id":585,"key":469,"model":561,"title":470,"tooltipContent":471,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":426,"min":427,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":586,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":587},"686bc08ac86982629c73060c",[],[],{"_id":589,"key":531,"model":561,"title":532,"description":533,"icon":538,"ruTitle":534,"ruDescription":535,"defaultValue":25,"options":590,"settingType":537,"fileSource":28,"__v":30,"fileTypes":591},"686bc08ac86982629c73060e",[],[],{"_id":593,"key":542,"model":561,"title":543,"description":544,"ruTitle":545,"ruDescription":546,"step":65,"max":547,"min":427,"costMultiplier":38,"defaultValue":461,"options":594,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":595},"686bc08ac86982629c730610",[],[],[],[63,64],0.075,[],"2025-09-08T15:05:32.782Z",{"top_p":439,"temperature":449,"max_tokens":581,"capacity":473,"reasoning":25,"reasoning_tokens":461},{"replicateApiType":6,"outputPath":7,"_id":603,"key":604,"label":564,"shortLabel":564,"description":605,"isInstantModel":12,"isReasoningModel":61,"ruDescription":606,"releaseDate":507,"ruLongDescription":607,"isUpscaler":12,"contextCapacity":426,"maxTokens":427,"createdAt":489,"generationCount":608,"type":428,"generationType":429,"generationTypes":609,"api":431,"settingConfigs":610,"percs":636,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":641,"cost":478,"gemTokenCost":491,"iconUrl":483,"previewImageUrl":485,"bannerImageUrl":484,"position":38,"secondCost":30,"generationCost":30,"inputTokenCost":480,"outputTokenCost":481,"stepPrice":30,"tokenStrategy":556,"oneImageCost":30,"examples":642,"updatedAt":643,"__v":226,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":644,"configValue":645},"68305b4fa4ebb5f6ebb13669","claude-sonnet-4-20250514","Generate text, analyze images and huge documents; excels at coding","Генерирует текст, анализирует изображения и большие документы; отлично для кода","Claude Sonnet 4 — универсальная модель среднего размера, которая сочетает сильные навыки рассуждения и мультимодальное понимание с экономичностью и скоростью. Она предлагает два режима работы — почти мгновенные ответы для быстрых задач и расширенный пошаговый режим для глубокого анализа — так вы можете выбирать между оперативными черновиками и вдумчивым решением многозадачных проблем. Sonnet 4 понимает текст и изображения, может программно взаимодействовать с содержимым экрана и генерировать обширный код (до 64K выходных токенов), что делает её полезной для планирования, отладки, рефакторинга и полного цикла разработки.\n\nОчень большая контекстная память (в превью — до 1 миллиона токенов) позволяет командам синтезировать и анализировать целые кодовые базы, длинные юридические или исследовательские документы и сложные многозадачные рабочие процессы, не теряя связности. Улучшенная управляемость (steerability) даёт контроль над тоном, структурой и поведением вывода для клиентских агентов, конвейеров контента и внутренней автоматизации. По сравнению с самой большой моделью Opus 4, Sonnet 4 обеспечивает более быструю и экономичную работу для повседневных корпоративных и разработческих задач, при этом превзойдя предыдущие версии Sonnet в качестве кодирования и рассуждений.\n\nПрактические сценарии включают создание продвинутых агентoв поддержки, которые понимают тонкие инструкции и исправляют ошибки, инструменты для инженеров по всему жизненному циклу разработки, суммаризацию и извлечение структурированных данных из больших документов, а также помощь исследовательским или маркетинговым командам. Ограничения: Sonnet 4 уступает Opus 4 в самых сложных задачах рассуждения, а некоторые продвинутые возможности (например, окно в 1M токенов) находятся в превью и могут быть доступны с ограничениями. Для большинства команд Sonnet 4 предлагает удачный баланс возможностей, скорости и экономичности для реальных задач.",1804,[429],[611,615,619,623,627,631],{"fileTypes":612,"_id":613,"key":436,"model":603,"title":437,"tooltipContent":438,"description":438,"ruTitle":442,"ruDescription":441,"step":249,"max":38,"min":30,"defaultValue":439,"options":614,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68305b4fa4ebb5f6ebb1366b",[],{"fileTypes":616,"_id":617,"key":446,"model":603,"title":447,"tooltipContent":448,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":618,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68305b4fa4ebb5f6ebb1366d",[],{"fileTypes":620,"_id":621,"key":457,"model":603,"title":458,"tooltipContent":459,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":65,"defaultValue":461,"isAdvanced":61,"options":622,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68305b4fa4ebb5f6ebb1366f",[],{"fileTypes":624,"_id":625,"key":469,"model":603,"title":470,"tooltipContent":471,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":426,"min":427,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":626,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68305b4fa4ebb5f6ebb13671",[],{"fileTypes":628,"_id":629,"key":531,"model":603,"title":532,"description":533,"icon":538,"ruTitle":534,"ruDescription":535,"defaultValue":25,"options":630,"settingType":537,"fileSource":28,"__v":30},[],"68305b4fa4ebb5f6ebb13673",[],{"fileTypes":632,"_id":633,"key":542,"model":603,"title":543,"description":544,"ruTitle":545,"ruDescription":546,"step":65,"max":547,"min":427,"costMultiplier":38,"defaultValue":634,"options":635,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68305b4fa4ebb5f6ebb13675","2000",[],[637,638,639,640],"68a9df88e3ac04ad89b92142","68a9df88e3ac04ad89b92144","68a9df88e3ac04ad89b92146","68a9df88e3ac04ad89b92148",[63,64],[],"2025-09-12T12:54:34.486Z","Claude Sonnet 4 is a versatile, mid-size AI model that balances strong reasoning and multimodal understanding with cost-efficiency and speed. It offers two operational modes — near-instant responses for quick tasks and an extended, step-by-step mode for deeper reasoning — so you can choose fast drafts or careful multi-step problem solving. Sonnet 4 reads and reasons over text and images, interacts with on-screen content programmatically, and supports rich code generation up to 64K output tokens, making it practical for planning, debugging, refactors, and end-to-end development tasks.\n\nIts very large context capabilities (preview support for up to 1 million tokens) let teams synthesize and analyze entire codebases, long legal or research documents, and complex multi-step workflows without losing coherence. Improved steerability lets you control tone, structure, and behavior for consistent customer-facing agents, content pipelines, or internal automation. Compared with Anthropic’s largest Opus 4 model, Sonnet 4 provides faster and more cost-effective performance for everyday enterprise and developer workflows while still improving on previous Sonnet releases in coding and reasoning quality.\n\nPractical use cases include building advanced customer-support agents that follow nuanced instructions and recover from errors, powering software engineering assistants across the lifecycle, summarizing and extracting structured insights from massive documents, and aiding research or marketing teams with fast, high-quality outputs. Limitations: Sonnet 4 is not as powerful as Opus 4 for the most demanding reasoning tasks, and some advanced features (like the 1M token window) are in preview and may have limited availability. For most teams, Sonnet 4 delivers a strong blend of capability, speed, and affordability for real-world applications.",{"top_p":439,"temperature":449,"max_tokens":461,"capacity":473,"reasoning":25,"reasoning_tokens":634},{"replicateApiType":6,"outputPath":7,"_id":647,"key":648,"label":649,"shortLabel":564,"description":650,"isInstantModel":12,"isReasoningModel":61,"ruDescription":651,"releaseDate":507,"ruLongDescription":652,"isUpscaler":12,"contextCapacity":426,"maxTokens":427,"createdAt":489,"generationCount":653,"type":428,"generationType":429,"generationTypes":654,"api":431,"settingConfigs":655,"percs":676,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":681,"cost":478,"gemTokenCost":491,"iconUrl":483,"previewImageUrl":485,"bannerImageUrl":484,"position":38,"secondCost":30,"generationCost":30,"inputTokenCost":481,"outputTokenCost":598,"stepPrice":30,"tokenStrategy":556,"oneImageCost":30,"examples":682,"updatedAt":683,"__v":126,"isAvailableAfterAuth":61,"isBanned":12,"longDescription":684,"configValue":685},"68948551f099317827bbc26c","claude-opus-4-1","Claude 4.1 Opus","Generate high-quality text with long-term memory and coding","Генерирует качественный текст с долгосрочной памятью и кодированием","Claude 4.1 Opus — это современный корпоративный AI-ассистент, разработанный для сложных и длительных рабочих процессов. Модель сочетает надёжную долгосрочную память, гибкие режимы рассуждения и передовые возможности в программировании, помогая командам и специалистам решать многоступенчатые задачи, которые длятся дни, недели или месяцы. Используйте её для управления кросс-функциональными кампаниями, агентного поиска по документам и вебу, отладки и рефакторинга больших кодовых баз, а также для персонализированного коучинга и поддержки клиентов с учётом истории взаимодействий.\n\nПрактические преимущества включают: сохранение контекста на протяжении длинных разговоров и проектов (до 32 000 токенов), переключение между быстрыми сводками и подробными пошаговыми рассуждениями, а также автономное управление внешними инструментами и API для выполнения многоэтапных задач. Разработчики оценят высокую точность в кодинге (сильные результаты в бенчмарках и улучшение по сравнению с предыдущими версиями), работу с несколькими файлами и генерацию больших последовательных фрагментов кода и документации. Продакт- и маркетинговые команды могут полагаться на стратегическое планирование, снижение ошибок и исполнение многоканальных кампаний.\n\nБезопасность и выравнивание — ключевые элементы: Claude 4.1 Opus использует принципы constitutional AI для минимизации предвзятых, вредных или вводящих в заблуждение ответов и сознательно перенаправляет по чувствительным вопросам к экспертам (например, в медицине или юриспруденции). Модель доступна через API и крупные облачные платформы для корпоративной интеграции.\n\nОграничения: модель осознанно осторожна в чувствительных областях, требует продуманного проектирования подсказок для полного раскрытия агентных возможностей и может быть избыточной для простых задач. В целом Claude 4.1 Opus превосходна там, где критичны долговременная память, точность в кодировании, автономное выполнение многоэтапных задач и безопасные профессиональные ответы.",1736,[429],[656,660,664,668,672],{"fileTypes":657,"_id":658,"key":446,"model":647,"title":447,"tooltipContent":448,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":659,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68948551f099317827bbc270",[],{"fileTypes":661,"_id":662,"key":457,"model":647,"title":458,"tooltipContent":459,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":65,"defaultValue":581,"isAdvanced":61,"options":663,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68948551f099317827bbc272",[],{"fileTypes":665,"_id":666,"key":469,"model":647,"title":470,"tooltipContent":471,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":426,"min":427,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":667,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68948551f099317827bbc274",[],{"fileTypes":669,"_id":670,"key":531,"model":647,"title":532,"description":533,"icon":538,"ruTitle":534,"ruDescription":535,"defaultValue":25,"options":671,"settingType":537,"fileSource":28,"__v":30},[],"68948551f099317827bbc276",[],{"fileTypes":673,"_id":674,"key":542,"model":647,"title":543,"description":544,"ruTitle":545,"ruDescription":546,"step":65,"max":547,"min":427,"costMultiplier":38,"defaultValue":634,"options":675,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"68948551f099317827bbc278",[],[677,678,679,680],"68a9e0ece3ac04ad89b92199","68a9e0ece3ac04ad89b9219b","68a9e0ece3ac04ad89b9219d","68a9e0ece3ac04ad89b9219f",[63,64],[],"2025-09-10T13:38:03.128Z","Claude 4.1 Opus is a next-generation enterprise AI assistant built for complex, sustained workflows. It combines reliable long-term memory, flexible reasoning modes, and industry-leading coding capabilities to help teams and professionals tackle multi-step projects that span days, weeks, or months. Use it to manage cross-functional campaigns, run agentic searches across documents and the web, debug and refactor large codebases, or provide ongoing personalized coaching and customer support that remembers prior interactions.\n\nPractical benefits include: maintaining context across long conversations and projects (supporting up to 32,000-token contexts), switching between fast summaries and detailed step-by-step reasoning, and autonomously orchestrating tools and APIs to complete multi-stage tasks. Developers will value its high coding accuracy (strong benchmark performance and improved junior-developer results), multi-file refactoring, and ability to output very long, coherent code and documentation. Product and marketing teams can rely on its strategic planning, error reduction, and ability to execute multi-channel workflows.\n\nSafety and alignment are core features: Claude 4.1 Opus applies constitutional AI principles to reduce biased, harmful, or misleading outputs and deliberately defers to human experts in sensitive domains like medical or legal advice. It is accessible via API and major cloud platforms for enterprise integration.\n\nLimitations: it is intentionally cautious in sensitive areas, requires thoughtful prompt design to unlock advanced agentic behavior, and may be heavier than necessary for trivial tasks. Overall, Claude 4.1 Opus excels where long-term context retention, high-accuracy coding, autonomous multi-step task execution, and safe, professional outputs are essential.",{"temperature":449,"max_tokens":581,"capacity":473,"reasoning":25,"reasoning_tokens":634},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":687,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":688,"key":689,"label":690,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"api":67,"tier":692,"__v":482,"iconType":693,"cost":408,"generationCount":694,"iconUrl":695,"previewImageUrl":696,"description":697,"generationTypes":698,"settingConfigs":699,"bannerImageUrl":718,"isPromptRequired":61,"generationCost":719,"inputTokenCost":30,"outputTokenCost":30,"secondCost":30,"stepPrice":30,"isBanned":61,"websiteUrl":720,"position":721,"isAdminModel":12,"createdAt":722,"examples":723,"isOutdated":12,"longDescription":724,"percs":725,"updatedAt":729,"ruDescription":730,"ruLongDescription":731,"isAvailableAfterAuth":12,"configValue":732},[63,64],"656ee024025ddd19a58e2fa1","dall-e-2","DALL·E 2","text-to-image","PRO","gpt4",894,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/gpt-4.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/dalle-2-preview.png","Generate high-resolution photorealistic and creative images from text",[691],[700],{"fileTypes":701,"_id":702,"key":703,"model":688,"title":704,"step":38,"defaultValue":705,"options":706,"settingType":282,"fileSource":28,"isRequired":12,"valueType":215,"__v":30,"ruTitle":715,"description":716,"ruDescription":717},[],"65f986aec0eab1fcd8e33052","resolution","Resolution","1024x1024",[707,709,712],{"label":708,"value":705},"Square 1024x1024",{"label":710,"value":711},"Vertical 1024x1792","1024x1792",{"label":713,"value":714},"Horizontal 1792x1024","1792x1024","Разрешение","The resolution of the output.","Разрешение получаемого результата.","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/dalle-2-banner.png",0.02,"https://openai.com/dall-e-2",224,"2024-09-13T14:29:03.669Z",[],"DALL·E 2 converts natural-language prompts into high-resolution, photorealistic and stylized images, letting users visualize ideas that never existed before. It produces 1024×1024 outputs across many styles — photos, illustrations, paintings, digital art, icons and more — and can blend unrelated concepts into coherent, surprising visuals. Beyond one-off generation, DALL·E 2 can edit existing images (fill, replace or retouch areas) and create multiple variations while preserving key elements, making it useful for rapid iteration and creative exploration.\n\nPractically, designers and artists use DALL·E 2 to prototype concepts, produce concept art, and explore stylistic directions quickly. Marketers and advertisers can generate campaign imagery and product mockups without expensive shoots. Content creators and publishers can produce tailored stock visuals or imaginative scenes for storytelling, games, and education. The model’s editing tools enable photo manipulation tasks like adding props, changing backgrounds, or applying theme-based changes (e.g., holiday decorations) while maintaining realistic lighting and shadows.\n\nDALL·E 2 is accessible via OpenAI’s web and API interfaces and is tuned for efficient, high-quality outputs. Its diffusion-based approach improves visual coherence and detail, so users get clearer, more realistic images than earlier systems. Limitations include a credit-based usage model, sensitivity to prompt wording (better prompts yield better results), occasional inaccuracies or implausible placements for very complex prompts, and possible reflection of biases present in training data. With mindful prompting and review, however, DALL·E 2 is a powerful tool for anyone who needs fast, flexible visual creation and image editing without heavy production overhead.",[726,727,728],"68a9d2b2e3ac04ad89b91e61","68a9d2b2e3ac04ad89b91e63","68a9d2b2e3ac04ad89b91e65","2025-09-04T00:49:55.495Z","Создаёт фотореалистичные и творческие изображения высокого разрешения по тексту","DALL·E 2 преобразует текстовые описания в изображения высокого разрешения — как фотореалистичные, так и стилизованные — позволяя визуализировать идеи, которых никогда не было. Модель генерирует изображения 1024×1024 в разных стилях: фото, иллюстрации, живопись, цифровое искусство, иконки и др., умеет сочетать несвязанные концепции в цельные, неожиданные кадры. Кроме создания с нуля, DALL·E 2 может редактировать существующие изображения (заполнять, заменять или ретушировать участки) и порождать вариации, сохраняя ключевые элементы — это удобно для быстрой итерации и поиска творческих решений.\n\nНа практике дизайнеры и художники используют DALL·E 2 для прототипирования концептов, создания концепт-артов и подбора стилистики. Маркетологи и рекламщики получают возможность готовить визуалы и мокапы без дорогостоящих съёмок. Создатели контента и издательства — индивидуальные стоковые изображения и сценки для сторителлинга, игр и образования. Инструменты редактирования позволяют добавлять объекты, менять фон или применять тематические правки (например, праздничные элементы) при сохранении реалистичного освещения и теней.\n\nDALL·E 2 доступен через веб-интерфейс и API OpenAI и оптимизирован для эффективной генерации качественных изображений. Его подход обеспечивает лучшую связность и детализацию по сравнению с ранними системами. Ограничения включают кредитную модель использования, чувствительность к формулировкам запросов (чёткие промпты дают лучшие результаты), редкие ошибки в расположении объектов или деталях при очень сложных запросах, а также риск отражения предвзятостей из обучающей выборки. При аккуратном использовании и проверке результатов DALL·E 2 — мощный инструмент для быстрого и гибкого создания и редактирования визуального контента.",{"resolution":705},{"_id":734,"key":735,"label":736,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"api":67,"tier":692,"__v":126,"iconType":693,"cost":737,"generationCount":738,"iconUrl":695,"previewImageUrl":739,"description":740,"generationTypes":741,"settingConfigs":742,"isAdminModel":12,"isOutdated":12,"position":751,"replicateId":163,"bannerImageUrl":752,"isPromptRequired":61,"generationCost":753,"inputTokenCost":30,"outputTokenCost":30,"secondCost":30,"stepPrice":30,"isBanned":12,"websiteUrl":754,"updatedAt":755,"examples":756,"percs":757,"releaseDate":327,"createdAt":762,"longDescription":763,"shortLabel":764,"ruDescription":765,"ruLongDescription":766,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":767,"tokenStrategy":67,"isAvailableAfterAuth":12,"outputPath":7,"replicateApiType":6,"configValue":768},"656ee024025ddd19a58e2fa3","dall-e-3","DALL·E 3",120,6128,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/dalle-3-preview.png","Generate high-resolution, prompt-accurate images from text",[691],[743],{"fileTypes":744,"_id":745,"key":703,"title":704,"model":734,"modelKey":735,"tooltipContent":746,"step":38,"max":71,"min":30,"options":747,"settingType":282,"__v":30,"isClearable":61,"defaultValue":705,"fileSource":28,"description":716,"ruDescription":717,"ruTitle":715},[],"65c4e6061415e4c7d572f4cf","Output image resolution",[748,749,750],{"value":705,"label":708},{"value":711,"label":710},{"value":714,"label":713},129,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/dalle-3-banner.png",0.04,"https://openai.com/dall-e-3","2025-09-09T19:50:41.923Z",[],[758,759,760,761],"68a9d2d1e3ac04ad89b91e6c","68a9d2d1e3ac04ad89b91e6e","68a9d2d1e3ac04ad89b91e70","68a9d2d1e3ac04ad89b91e72","2024-09-11T09:39:25.073Z","DALL·E 3 is a text-to-image model built to convert complex, natural-language prompts into high-resolution, highly detailed images that closely match user intent. It understands nuanced scene descriptions and relationships between elements, so users can ask for intricate compositions — for example, a “vibrant orange sunset casting long shadows over a calm sea” — and receive faithful, visually coherent results. The model produces sharp details, vivid colors, realistic textures, and improved rendering of difficult elements such as human anatomy and hands. Unlike many image AIs, DALL·E 3 can generate crisp, readable text inside images, making it practical for logos, posters, signage, and typographic designs.\n\nIntegrated into platforms like ChatGPT and Microsoft Copilot, DALL·E 3 supports interactive refinement: you can describe adjustments in natural language (change colors, add or remove elements, alter mood or aspect ratio) and iterate quickly. It also supports multiple aspect ratios (horizontal, square, vertical), reducing the need for post-generation cropping. Fast generation speeds and high fidelity make it useful for concept art, illustration, branding, marketing visuals, rapid prototyping, educational media, and entertainment assets.\n\nOpenAI includes safety and policy measures to reduce harmful or misleading content; for example, the model declines requests to generate named public figures and incorporates bias mitigation strategies. Practical limitations remain: very abstract or extremely dense scenes can still be challenging, outputs depend on prompt quality and iteration, and some use cases are constrained by safety rules. Overall, DALL·E 3 is a powerful tool for creators and designers who want prompt-accurate, high-quality visuals with an interactive, conversational workflow for faster, more controlled image generation.","dalle","Генерирует высокоразрешённые и точные изображения по текстовому запросу","DALL·E 3 — модель преобразования текста в изображение, разработанная для создания высокоразрешённых, детализированных картинок, точно соответствующих пользовательским запросам. Модель хорошо понимает нюансы и сложные описания, корректно передаёт взаимосвязи между объектами и деталями сцены — например, «яркий оранжевый закат, отбрасывающий длинные тени на спокойное море» будет воспроизведён с визуальной целостностью и выразительностью. DALL·E 3 даёт чёткие детали, насыщенные цвета и реалистичные текстуры, а также улучшенно отображает сложные элементы, такие как анатомия человека и руки. В отличие от многих генераторов, модель способна создавать разборчивый текст на изображениях, что делает её пригодной для логотипов, постеров и вывесок.\n\nБлагодаря интеграции с ChatGPT и Microsoft Copilot доступна интерактивная доработка изображений: вы можете попросить изменить цвета, добавить или убрать объекты, поменять настроение или соотношение сторон — и быстро получить обновлённую версию. Поддержка горизонтального, квадратного и вертикального форматов уменьшает необходимость в дополнительной обрезке. Высокая скорость генерации и качество делают модель полезной для концепт‑арта, иллюстраций, брендинга, маркетинговых материалов, быстрой визуальной прототипировки, образовательного и развлекательного контента.\n\nOpenAI реализует меры безопасности: модель отказывается генерировать изображения по именам публичных фигур и включает механизмы снижения предвзятости. Однако есть ограничения: очень абстрактные или перегруженные сцены могут оставаться сложными, результат сильно зависит от качества запроса и итераций, а ряд сценариев ограничен политиками безопасности. В целом DALL·E 3 — мощный инструмент для создателей и дизайнеров, стремящихся получать точные, высококачественные изображения через удобный диалоговый рабочий процесс.",[63,64],{"resolution":705},{"replicateApiType":6,"outputPath":7,"_id":770,"key":771,"label":772,"shortLabel":771,"description":773,"isInstantModel":12,"isReasoningModel":12,"ruDescription":774,"releaseDate":775,"ruLongDescription":776,"contextCapacity":777,"maxTokens":462,"createdAt":778,"generationCount":779,"type":428,"generationType":429,"generationTypes":780,"api":771,"settingConfigs":781,"percs":812,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":40,"gemTokenCost":817,"iconUrl":818,"previewImageUrl":819,"bannerImageUrl":820,"position":30,"secondCost":30,"generationCost":30,"inputTokenCost":66,"outputTokenCost":481,"stepPrice":30,"examples":821,"updatedAt":822,"__v":126,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":823,"tokenStrategy":67,"isAvailableAfterAuth":12,"longDescription":824,"configValue":825},"67c051a7d0835996cc4b547e","deepseek","Deepseek","Generates text, understands images and code; excels at reasoning","Генерирует текст, понимает изображения и код; отлично решает задачи рассуждения","2024-05-13T11:49:00.000Z","DeepSeek — это универсальная семейство ИИ-моделей, объединяющее глубокое понимание языка, мультимодальное восприятие, продвинутые возможности рассуждения и практическую помощь в программировании. Оно помогает пользователям создавать, редактировать и резюмировать тексты, анализировать изображения вместе с текстом, генерировать и отлаживать код, а также решать многоэтапные задачи с прозрачной и проверяемой логикой. DeepSeek ориентирован на реальные сценарии: команды используют его для обзора исследований, создания маркетинговых материалов, автоматизации аналитики данных, подготовки заметок по проектам и ускорения разработки ПО.\n\nОсобенность DeepSeek — сочетание высокой эффективности и производительности. Модель дает возможности крупной сети, оставаясь при этом экономичной по вычислениям, что упрощает масштабирование и локальное развертывание для защищённых и настроенных рабочих процессов. Модель выводит последовательность своих рассуждений в видимых тегах (например, \u003Cthink>...\u003C/think>), что позволяет пользователям отслеживать, проверять и при необходимости корректировать логику при решении сложных математических, логических или многоэтапных задач по коду. Новые версии умеют переключаться между краткими ответами и детальными цепочками рассуждений в зависимости от запроса.\n\nИмеются мультимодальные варианты для совместной обработки изображений и текста, а также специальная редакция Coder для генерации, объяснения и отладки кода на разных языках и фреймворках. Гибкий API, мобильные приложения и возможность локального дообучения делают модель удобной для предприятий, исследователей и разработчиков. Обратите внимание: несмотря на открытый характер, лицензия DeepSeek содержит коммерческие ограничения, которые стоит изучить. В целом DeepSeek подходит пользователям, которым требуется точная, контекстная поддержка в написании текстов, исследованиях, анализе данных, управлении проектами и разработке ПО с прозрачными рассуждениями и экономичной работой.",128000,"2024-08-28T20:47:29.702Z",3775,[429],[782,791,797,802,808],{"fileTypes":783,"_id":784,"key":436,"model":770,"title":785,"tooltipContent":786,"description":787,"ruTitle":788,"ruDescription":789,"step":249,"max":38,"min":30,"costMultiplier":472,"defaultValue":439,"options":790,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67c051a7d0835996cc4b5480","Diversity control","Top_p. Filters AI responses based on probability.\u003Cbr> Lower values = top few likely responses,\u003Cbr> Higher values = larger pool of options.","Top_p. Filters AI responses based on probability.\u003Cbr> Lower values = top few likely responses,\u003Cbr> Higher values = larger pool of options. ","Контроль разнообразия","Top_p. Фильтрует ответы AI на основе вероятности.\u003Cbr> Меньшие значения = несколько наиболее вероятных ответов,\u003Cbr> Большие значения = больший набор вариантов.",[],{"fileTypes":792,"_id":793,"key":457,"model":770,"title":458,"tooltipContent":794,"description":463,"ruTitle":465,"ruDescription":464,"step":795,"max":462,"min":82,"isAdvanced":61,"options":796,"settingType":43,"fileSource":28,"__v":30,"defaultValue":461},[],"67c051a7d0835996cc4b5482","Length of a response",200,[],{"fileTypes":798,"_id":799,"key":446,"model":770,"title":447,"tooltipContent":800,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":71,"min":30,"defaultValue":449,"options":801,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67c051a8d0835996cc4b5484","Temperature. Controls AI response creativity.\u003Cbr> Lower values = more focused, Higher values = more varied.",[],{"fileTypes":803,"_id":804,"key":469,"model":770,"title":470,"tooltipContent":805,"description":475,"ruTitle":477,"ruDescription":476,"step":806,"max":777,"min":82,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":807,"settingType":43,"fileSource":28,"__v":30},[],"67c051a8d0835996cc4b5486","Size of a context window \u003Cbr/>Affects the cost of a generation.",500,[],{"fileTypes":809,"_id":810,"key":531,"model":770,"title":532,"description":533,"icon":538,"ruTitle":534,"ruDescription":535,"defaultValue":25,"options":811,"settingType":537,"fileSource":28,"__v":30},[],"67c05c3734edcc84f37a7807",[],[813,814,815,816],"68a9de9ce3ac04ad89b92105","68a9de9ce3ac04ad89b92107","68a9de9ce3ac04ad89b92109","68a9de9ce3ac04ad89b9210b",20,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/deepseek.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/gpt-4-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/gpt-4-banner.png",[],"2025-08-23T15:30:36.861Z",[63,64],"DeepSeek is a versatile AI model family that combines strong natural language comprehension, multimodal understanding, advanced reasoning, and practical coding assistance. It helps users draft, edit, and summarize text, analyze images alongside text, debug and generate code, and solve multi-step problems with transparent, checkable reasoning. DeepSeek is designed for real-world productivity: teams can use it to summarize research, generate marketing copy, automate data insights, prepare project notes, and accelerate software development.\n\nWhat makes DeepSeek special is its balance of performance and efficiency. It delivers large-model capabilities while keeping compute and cost manageable, so you can deploy it at scale or run models locally for secure, customized workflows. The model exposes its step-by-step reasoning in visible tags (e.g., \u003Cthink>...\u003C/think>), enabling users to follow, verify, and correct the model’s logic when tackling complex math, logic puzzles, or multi-stage coding tasks. Newer releases switch seamlessly between concise direct answers and detailed chain-of-thought modes depending on your needs.\n\nDeepSeek also provides multimodal variants that understand images with text, plus a developer-focused Coder edition that generates, explains, and debugs code across languages and frameworks. Flexible API access, a mobile app, and options for local fine-tuning make it practical for enterprises, researchers, and individual developers. Note that while the family is open-source and fine-tunable, the DeepSeek Model License has specific commercial restrictions to review. Overall, DeepSeek is ideal for users who need accurate, context-aware assistance in writing, research, data analysis, project work, and software development, with transparent reasoning and cost-effective performance.",{"top_p":439,"max_tokens":461,"temperature":449,"capacity":473,"reasoning":25},{"_id":827,"key":828,"label":829,"description":830,"isInstantModel":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"ruDescription":831,"releaseDate":832,"type":14,"generationType":15,"generationTypes":833,"api":834,"settingConfigs":835,"percs":843,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":844,"replicateApiType":6,"outputPath":7,"cost":845,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":846,"createdAt":847,"updatedAt":848,"__v":38,"iconUrl":849,"generationCount":414,"configValue":850},"68a4904d5adad360a9b4a934","elevenlabs-music","ElevenLabs Music","Music genration model","Модель генерации музыки","2025-08-06T14:53:00.000Z",[],"elevenlabs",[836],{"fileTypes":837,"_id":838,"key":839,"model":827,"title":36,"ruTitle":37,"step":38,"max":840,"min":40,"defaultValue":841,"options":842,"settingType":43,"fileSource":28,"__v":30},[],"68a496108e3272ddc4c8b340","duration_seconds",300,"10",[],[],[63,64],360,[],"2025-08-19T14:55:09.451Z","2025-08-21T12:09:21.647Z","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/eleven-labs-logo.png",{"duration_seconds":841},{"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":852,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":853,"key":854,"label":855,"shortLabel":856,"type":14,"generationType":15,"generationTypes":857,"api":834,"settingConfigs":858,"isPromptRequired":61,"cost":840,"description":878,"position":879,"secondCost":30,"generationCost":880,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":71,"generationCount":881,"bannerImageUrl":882,"iconUrl":849,"previewImageUrl":883,"updatedAt":884,"isAdminModel":12,"examples":885,"isBanned":12,"isOutdated":12,"longDescription":886,"percs":887,"createdAt":892,"websiteUrl":893,"ruDescription":894,"ruLongDescription":895,"isInstantModel":12,"releaseDate":896,"isAvailableAfterAuth":61,"configValue":897},[63,64],"667976291acb3c48219c81e7","elevenlabs-sound-effects","ElevenLabs Sound Effects","EL SE",[15],[859,869],{"fileTypes":860,"_id":861,"key":839,"model":853,"title":36,"step":862,"max":863,"min":862,"defaultValue":864,"options":865,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":866,"ruDescription":867,"ruTitle":868},[],"667976291acb3c48219c81e9",0.5,22,"5",[],"Length of an output","Длина выхода","Продолжительность",{"fileTypes":870,"_id":871,"key":872,"model":853,"title":873,"tooltipContent":874,"step":249,"max":38,"min":30,"defaultValue":261,"options":875,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":874,"ruDescription":876,"ruTitle":877},[],"667976291acb3c48219c81eb","prompt_influence","Prompt infulence","A higher prompt influence makes your generation follow the prompt more closely while also making generations less variable.",[],"Более высокое влияние подсказки заставляет ваше поколение более точно следовать подсказке, а также делает поколения менее вариативными.","Оперативность","Generate realistic, customizable sound effects from text prompts",75,0.022,177,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/elevenlabs-sound-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/elevenlabs-sound-preview.png","2025-09-11T19:00:46.217Z",[],"ElevenLabs Sound Effects turns plain text descriptions into high-fidelity, customizable sound effects suited for film, games, podcasts, animation, and other multimedia projects. Describe the sound you need — for example “heavy footsteps crunching through dry leaves” — and the model synthesizes a contextually accurate audio asset that captures texture, pitch, environmental cues, and subtle variations. Outputs range from animal calls and weather ambience to machinery, Foley, and layered soundscapes.\n\nThe model is fine-tuned with a large, ethically sourced licensed sound library (Shutterstock), which expands the range and realism of generated audio and helps reduce legal risk for commercial use. After generation, creators can refine results by adjusting intensity, pitch, duration, and applying effects or EQ tweaks to make the sound fit seamlessly into a mix. Developers can integrate the model via API with support for streaming and commercial licensing; usage-based pricing (for example, around $0.002 per second) lets teams scale generation to project needs.\n\nElevenLabs balances professional-grade quality with practical performance: it produces complex, layered sounds rather than simple loops, and offers variants optimized for lower-latency use cases when needed, while prioritizing fidelity. Typical workflows include generating background atmospheres for film, dynamic in-game SFX that adapt to gameplay, bespoke effects for audio drama and podcasts, or rapid prototyping for sound designers who lack access to recording studios.\n\nLimitations to note: AI-generated sounds may occasionally lack the tiniest imperfections of hand-recorded material and often depend on the clarity of your prompt — more detail yields more accurate results. Usage costs and compliance with licensing or copyright practices should be considered for large-scale commercial deployments. Overall, ElevenLabs Sound Effects fast-tracks the creation of diverse, realistic audio assets and gives creators flexible control without needing extensive recording or sample libraries.",[888,889,890,891],"68a9d7d0e3ac04ad89b91f8e","68a9d7d0e3ac04ad89b91f90","68a9d7d0e3ac04ad89b91f92","68a9d7d0e3ac04ad89b91f94","2024-09-10T15:39:53.969Z","https://elevenlabs.io/sound-effects","Генерирует реалистичные настраиваемые звуковые эффекты по тексту","ElevenLabs Sound Effects преобразует текстовые описания в высококачественные настраиваемые звуковые эффекты, подходящие для фильмов, игр, подкастов, анимации и других мультимедийных проектов. Опишите желаемый звук — например «тяжёлые шаги, хрустящие сухие листья» — и модель синтезирует контекстно точный аудио-материал, учитывая текстуру, высоту тона, окружение и тонкие вариации. Результаты охватывают от животных и погодных эффектов до механики, фоли и многослойных звуковых ландшафтов.\n\nМодель дообучена на большой этически полученной лицензированной библиотеке звуков (Shutterstock), что расширяет диапазон и реализм генераций и снижает юридические риски при коммерческом использовании. После генерации вы можете уточнять звук, меняя интенсивность, высоту, длительность, а также добавлять эффекты и эквалайзер, чтобы идеально встройить материал в микс. Для разработчиков доступно API с поддержкой стриминга и коммерческого использования; оплата по объёму (например, около $0.002 за секунду) позволяет масштабировать решения под задачи проекта.\n\nElevenLabs сочетает профессиональное качество с практичной производительностью: модель создаёт сложные многослойные звуки, а не простые лупы, и предлагает варианты с пониженной задержкой для нуждающихся в реальном времени сценариев, при этом делая приоритет на точность воспроизведения. Типичные сценарии: фоновые атмосферы для кино, динамичные эффекты в играх, уникальные звуки для аудио-драм и подкастов, а также быстрая генерация для звукорежиссёров без доступа к студии.\n\nОграничения: искусственно сгенерированные звуки иногда могут не содержать микронюансов живой записи и сильно зависят от детальности запроса — чем конкретнее промпт, тем точнее результат. Также стоит учитывать затраты при масштабном использовании и соблюдение лицензионных требований. В целом модель ускоряет создание разнообразных реалистичных звуков и даёт гибкие средства управления без необходимости в обширных библиотеках или записи.","2024-07-01T18:22:00.000Z",{"duration_seconds":864,"prompt_influence":261},{"_id":899,"key":900,"label":901,"shortLabel":902,"type":14,"generationType":15,"generationTypes":903,"api":834,"settingConfigs":904,"isAdminModel":12,"isPromptRequired":61,"cost":478,"description":1072,"position":879,"secondCost":30,"generationCost":1073,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":555,"generationCount":1074,"bannerImageUrl":1075,"iconUrl":849,"previewImageUrl":1076,"updatedAt":1077,"examples":1078,"isBanned":12,"isOutdated":12,"longDescription":1079,"percs":1080,"createdAt":1085,"websiteUrl":1086,"ruDescription":1087,"ruLongDescription":1088,"isInstantModel":12,"isGenerationTypeRequired":12,"isReasoningModel":12,"isAvailableAfterAuth":12,"oneImageCost":30,"outputPath":7,"replicateApiType":6,"supportFiles":12,"supportedFileTypes":1089,"tokenStrategy":67,"descriptionForAI":1090,"configValue":1091},"666a0e48ae5a6bde89018168","elevenlabs-text-to-speach","ElevenLabs TTS","EL TTS",[15],[905,929,1057,1065],{"_id":906,"key":907,"model":899,"title":908,"defaultValue":909,"options":910,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":927,"fileTypes":928},"666a1b8d8fe06556df850276","model_id","Model","eleven_turbo_v2",[911,914,917,920,922,924],{"label":912,"value":913},"Eleven Multilingual v2","eleven_multilingual_v2",{"label":915,"value":916},"Eleven Multilingual v1","eleven_multilingual_v1",{"label":918,"value":919},"Eleven English v1","eleven_monolingual_v1",{"label":921,"value":909},"Eleven Turbo v2",{"label":912,"value":923},"eleven_multilingual_sts_v2",{"label":925,"value":926},"Eleven English v2","eleven_english_sts_v2","Модель",[],{"_id":930,"key":931,"model":899,"title":932,"defaultValue":933,"options":934,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1055,"fileTypes":1056},"666a0e48ae5a6bde8901816a","voice","Voice","XB0fDUnXU5powFXDhCwa",[935,940,950,955,960,965,970,975,980,985,990,995,1000,1005,1010,1015,1020,1025,1030,1035,1040,1045,1050],{"value":936,"label":937,"previewUrl":938,"models":939},"21m00Tcm4TlvDq8ikWAM","Rachel","https://storage.googleapis.com/eleven-public-prod/premade/voices/21m00Tcm4TlvDq8ikWAM/b4928a68-c03b-411f-8533-3d5c299fd451.mp3",[],{"value":941,"label":942,"previewUrl":943,"models":944},"2EiwWnXFnvU5JabPnv8n","Clyde","https://storage.googleapis.com/eleven-public-prod/premade/voices/2EiwWnXFnvU5JabPnv8n/65d80f52-703f-4cae-a91d-75d4e200ed02.mp3",[945,946,947,913,916,948,949,909],"eleven_v2_flash","eleven_flash_v2","eleven_turbo_v2_5","eleven_v2_5_flash","eleven_flash_v2_5",{"value":951,"label":952,"previewUrl":953,"models":954},"CwhRBWXzGAHq8TQ4Fs17","Roger","https://storage.googleapis.com/eleven-public-prod/premade/voices/CwhRBWXzGAHq8TQ4Fs17/58ee3ff5-f6f2-4628-93b8-e38eb31806b0.mp3",[945,946,947,913,948,949,909],{"value":956,"label":957,"previewUrl":958,"models":959},"EXAVITQu4vr4xnSDxMaL","Sarah","https://storage.googleapis.com/eleven-public-prod/premade/voices/EXAVITQu4vr4xnSDxMaL/01a3e33c-6e99-4ee7-8543-ff2216a32186.mp3",[909,913,947],{"value":961,"label":962,"previewUrl":963,"models":964},"FGY2WhTYpPnrIDTdsKH5","Laura","https://storage.googleapis.com/eleven-public-prod/premade/voices/FGY2WhTYpPnrIDTdsKH5/67341759-ad08-41a5-be6e-de12fe448618.mp3",[945,946,947,913,948,949,909],{"value":966,"label":967,"previewUrl":968,"models":969},"GBv7mTt0atIp3Br8iCZE","Thomas","https://storage.googleapis.com/eleven-public-prod/premade/voices/GBv7mTt0atIp3Br8iCZE/98542988-5267-4148-9a9e-baa8c4f14644.mp3",[945,946,947,913,916,948,949,909],{"value":971,"label":972,"previewUrl":973,"models":974},"IKne3meq5aSn9XLyUdCD","Charlie","https://storage.googleapis.com/eleven-public-prod/premade/voices/IKne3meq5aSn9XLyUdCD/102de6f2-22ed-43e0-a1f1-111fa75c5481.mp3",[945,946,947,913,916,948,949,909],{"value":976,"label":977,"previewUrl":978,"models":979},"JBFqnCBsd6RMkjVDRZzb","George","https://storage.googleapis.com/eleven-public-prod/premade/voices/JBFqnCBsd6RMkjVDRZzb/e6206d1a-0721-4787-aafb-06a6e705cac5.mp3",[945,946,947,913,948,949,909],{"value":981,"label":982,"previewUrl":983,"models":984},"N2lVS1w4EtoT3dr4eOWO","Callum","https://storage.googleapis.com/eleven-public-prod/premade/voices/N2lVS1w4EtoT3dr4eOWO/ac833bd8-ffda-4938-9ebc-b0f99ca25481.mp3",[945,946,947,913,916,948,949,909],{"value":986,"label":987,"previewUrl":988,"models":989},"SAz9YHcvj6GT2YYXdXww","River","https://storage.googleapis.com/eleven-public-prod/premade/voices/SAz9YHcvj6GT2YYXdXww/e6c95f0b-2227-491a-b3d7-2249240decb7.mp3",[945,946,947,923,913,948,949,909],{"value":991,"label":992,"previewUrl":993,"models":994},"SOYHLrjzK2X1ezoPC6cr","Harry","https://storage.googleapis.com/eleven-public-prod/premade/voices/SOYHLrjzK2X1ezoPC6cr/86d178f6-f4b6-4e0e-85be-3de19f490794.mp3",[945,946,947,913,916,948,949,909],{"value":996,"label":997,"previewUrl":998,"models":999},"TX3LPaxmHKxFdv7VOQHJ","Liam","https://storage.googleapis.com/eleven-public-prod/premade/voices/TX3LPaxmHKxFdv7VOQHJ/63148076-6363-42db-aea8-31424308b92c.mp3",[945,946,947,913,916,948,949,909],{"value":1001,"label":1002,"previewUrl":1003,"models":1004},"Xb7hH8MSUJpSbSDYk0k2","Alice","https://storage.googleapis.com/eleven-public-prod/premade/voices/Xb7hH8MSUJpSbSDYk0k2/d10f7534-11f6-41fe-a012-2de1e482d336.mp3",[945,946,947,913,948,949,909],{"value":1006,"label":1007,"previewUrl":1008,"models":1009},"XrExE9yKIg1WjnnlVkGX","Matilda","https://storage.googleapis.com/eleven-public-prod/premade/voices/XrExE9yKIg1WjnnlVkGX/b930e18d-6b4d-466e-bab2-0ae97c6d8535.mp3",[945,946,947,913,916,948,949,909],{"value":1011,"label":1012,"previewUrl":1013,"models":1014},"bIHbv24MWmeRgasZH58o","Will","https://storage.googleapis.com/eleven-public-prod/premade/voices/bIHbv24MWmeRgasZH58o/8caf8f3d-ad29-4980-af41-53f20c72d7a4.mp3",[945,946,947,913,948,949,909],{"value":1016,"label":1017,"previewUrl":1018,"models":1019},"cgSgspJ2msm6clMCkdW9","Jessica","https://storage.googleapis.com/eleven-public-prod/premade/voices/cgSgspJ2msm6clMCkdW9/56a97bf8-b69b-448f-846c-c3a11683d45a.mp3",[945,946,947,913,948,949,909],{"value":1021,"label":1022,"previewUrl":1023,"models":1024},"cjVigY5qzO86Huf0OWal","Eric","https://storage.googleapis.com/eleven-public-prod/premade/voices/cjVigY5qzO86Huf0OWal/d098fda0-6456-4030-b3d8-63aa048c9070.mp3",[945,946,947,913,948,949,909],{"value":1026,"label":1027,"previewUrl":1028,"models":1029},"iP95p4xoKVk53GoZ742B","Chris","https://storage.googleapis.com/eleven-public-prod/premade/voices/iP95p4xoKVk53GoZ742B/3f4bde72-cc48-40dd-829f-57fbf906f4d7.mp3",[945,946,947,913,948,949,909],{"value":1031,"label":1032,"previewUrl":1033,"models":1034},"nPczCjzI2devNBz1zQrb","Brian","https://storage.googleapis.com/eleven-public-prod/premade/voices/nPczCjzI2devNBz1zQrb/2dd3e72c-4fd3-42f1-93ea-abc5d4e5aa1d.mp3",[945,946,947,913,948,949,909],{"value":1036,"label":1037,"previewUrl":1038,"models":1039},"onwK4e9ZLuTAKqWW03F9","Daniel","https://storage.googleapis.com/eleven-public-prod/premade/voices/onwK4e9ZLuTAKqWW03F9/7eee0236-1a72-4b86-b303-5dcadc007ba9.mp3",[945,946,947,913,916,948,949,909],{"value":1041,"label":1042,"previewUrl":1043,"models":1044},"pFZP5JQG7iQjIQuC4Bku","Lily","https://storage.googleapis.com/eleven-public-prod/premade/voices/pFZP5JQG7iQjIQuC4Bku/89b68b35-b3dd-4348-a84a-a3c13a3c2b30.mp3",[945,946,947,913,948,949,909],{"value":1046,"label":1047,"previewUrl":1048,"models":1049},"pqHfZKP75CvOlQylNhV4","Bill","https://storage.googleapis.com/eleven-public-prod/premade/voices/pqHfZKP75CvOlQylNhV4/d782b3ff-84ba-4029-848c-acf01285524d.mp3",[945,946,947,913,948,949,909],{"value":1051,"label":1052,"previewUrl":1053,"models":1054},"Obuyk6KKzg9olSLPaCbl","Arcadias","https://storage.googleapis.com/eleven-public-prod/database/user/uzlHdClx3tehMYugzC22yfl8GWn1/voices/Obuyk6KKzg9olSLPaCbl/ruVsG3yIeWDzZsrt3IeY.mp3",[947,923,913,948,949],"Голос",[],{"_id":1058,"key":1059,"model":899,"title":1060,"step":249,"max":38,"min":30,"defaultValue":1061,"options":1062,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"ruTitle":1063,"fileTypes":1064},"666a1116e92009076416e75b","similarity_boost","Similarity Boost","0.55",[],"Повышение сходства",[],{"_id":1066,"key":1067,"model":899,"title":1068,"step":249,"max":38,"min":30,"defaultValue":1061,"options":1069,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"ruTitle":1070,"fileTypes":1071},"666a1116e92009076416e75f","stability","Stability",[],"Стабильность",[],"Human-like text-to-speech: expressive, multilingual, low-latency",0.001,210,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/elevenlabs-t2s-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/elevenlabs-t2s-preview.png","2025-09-11T18:50:04.692Z",[],"ElevenLabs TTS is a high-fidelity text-to-speech service designed to produce natural, emotionally expressive voice output at scale. It replicates subtle human speech cues—intonation, pacing, and emotional tone—so you can create dialogues, narrations, and character voices that feel authentic. The platform supports over 32 languages and offers thousands of community voices plus professional and instant voice-cloning tools, enabling personalized or brand-specific voice personas.\n\nChoose from models optimized for different needs: Flash v2.5 for ultra-low latency (~75 ms) ideal for real-time conversational agents and interactive games, or Multilingual v2 for highest audio quality and improved text normalization for numbers and dates. The API supports real-time streaming, making ElevenLabs suitable for live applications like virtual assistants, interactive storytelling, and multiplayer game voice chat. Developers can balance speed, cost, and quality with multiple model options and pay-per-character pricing.\n\nCommon use cases include conversational AI and customer service bots with emotional context, dynamic character voices for entertainment and gaming, audiobooks and media narration with nuanced delivery, and automated voiceovers for videos, podcasts, and ads. Practical benefits include rapid integration via a fast API, extensive voice libraries to match many styles, and the option to clone or craft unique voices for consistent brand identity.\n\nNote: the fastest Flash v2.5 model disables number normalization by default to keep latency low; this can affect pronunciation of phone numbers, dates, or currencies unless normalization is enabled (Enterprise) or text is preprocessed. Overall, ElevenLabs TTS excels when lifelike, expressive, and multilingual speech — delivered with low latency — is essential to the user experience.",[1081,1082,1083,1084],"68a9d777e3ac04ad89b91f74","68a9d777e3ac04ad89b91f76","68a9d777e3ac04ad89b91f78","68a9d777e3ac04ad89b91f7a","2024-09-10T15:41:03.164Z","https://elevenlabs.io/text-to-speech","Реалистичный синтез речи: выразительный, многоязычный, с низкой задержкой","\u003Cp>ElevenLabs TTS — это высококачественный сервис синтеза речи, предназначенный для создания естественного, эмоционально выразительного голосового контента в масштабе. Модель воспроизводит тонкие особенности человеческой речи — интонацию, темп и эмоциональный окрас — так, чтобы диалоги, озвучки и голоса персонажей звучали правдоподобно. Платформа поддерживает более 32 языков и предлагает тысячи голосов из сообщества, а также профессиональные и мгновенные инструменты клонирования голоса для персонализированных или фирменных голосовых персонажей.\n\nДоступны модели, оптимизированные под разные задачи: Flash v2.5 обеспечивает ультранизкую задержку (~75 мс) и идеально подходит для реального времени — разговорных агентов и интерактивных игр, тогда как Multilingual v2 ориентирован на максимальное качество звука и лучшую нормализацию чисел и дат. API поддерживает потоковую передачу в реальном времени, что делает ElevenLabs подходящим для живых приложений — виртуальных помощников, интерактивных историй и голосового чата в многопользовательских играх. Разработчики могут выбирать баланс скорости, стоимости и качества благодаря нескольким моделям и оплате по символам.\n\nТипичные кейсы: разговорный ИИ и боты поддержки с эмоциональным контекстом, динамичные голоса для развлечений и игр, аудиокниги и медианарративы с нюансированной подачей, а также автоматические озвучки для видео, подкастов и рекламы. Практические преимущества — быстрая интеграция через API, широкий каталог голосов и возможность клонировать или создавать уникальные голоса для единообразного бренда.\n\nВажно: самая быстрая модель Flash v2.5 по умолчанию отключает нормализацию чисел для поддержания низкой задержки; это может повлиять на произношение телефонных номеров, дат или валют, если не включить нормализацию (Enterprise) или не предобработать текст. В целом ElevenLabs TTS выделяется, когда необходим реалистичный, выразительный и многоязычный голос с низкой задержкой.\u003C/p>",[63,64],"Model you should use for voiceovers",{"model_id":909,"voice":933,"similarity_boost":1061,"stability":1061},{"_id":1093,"key":1094,"label":1095,"contextCapacity":82,"maxTokens":65,"type":63,"generationTypes":1096,"api":85,"settingConfigs":1097,"isAdminModel":12,"isOutdated":12,"isPromptRequired":12,"replicateId":1117,"iconType":163,"cost":482,"iconUrl":1118,"previewImageUrl":1119,"bannerImageUrl":1120,"description":1121,"tier":125,"position":1122,"secondCost":1123,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":555,"generationType":83,"generationCount":1124,"examples":1125,"isBanned":12,"percs":1126,"shortLabel":1131,"updatedAt":1132,"createdAt":185,"longDescription":1133,"ruDescription":1134,"ruLongDescription":1135,"isInstantModel":12,"isGenerationTypeRequired":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":117,"supportFiles":12,"supportedFileTypes":1136,"tokenStrategy":67,"configValue":1137},"65e9dc7c44f732690c0230d4","codeplugtech/face-swap","Face Swap",[83],[1098,1108],{"fileTypes":1099,"_id":1100,"key":1101,"model":1093,"title":1102,"tooltipContent":1103,"description":1104,"ruTitle":1105,"ruDescription":1106,"accept":92,"step":38,"defaultValue":163,"options":1107,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30},[],"67b899c88f3c7b40fd9d55d3","input_image","Target Image","The image we'll get the face from","Source Image","Источник","Изображение из которого будет взято лицо",[],{"fileTypes":1109,"_id":1110,"key":1111,"model":1093,"title":1104,"tooltipContent":1112,"description":1113,"ruTitle":1114,"ruDescription":1115,"accept":92,"step":38,"defaultValue":163,"options":1116,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30},[],"67b89aa0fcc03ce8466b75d2","swap_image","The image for the face swap","Image where face will be placed","Целевое изображение","Изображение на которое будет вставлено лицо",[],"codeplugtech/face-swap:278a81e7ebb22db98bcba54de985d22cc1abeead2754eb1f2af717247be69b34","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/face-swap.svg","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/face-swap-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/face-swap-preview-banner.png","Seamlessly swap faces in photos and videos with photoreal results",256,0.000225,238,[],[1127,1128,1129,1130],"68a9d5dee3ac04ad89b91f12","68a9d5dee3ac04ad89b91f14","68a9d5dee3ac04ad89b91f16","68a9d5dee3ac04ad89b91f18","Swap faces in two photos","2025-08-23T14:53:18.889Z","Face Swap is an image-to-image AI designed to detect, map, and replace faces in photos and videos with highly realistic, natural-looking results. It automatically finds facial landmarks, aligns features, and synthesizes skin tone, lighting and texture to blend a source face onto a target subject with minimal artifacts. Users can refine outputs using manual alignment, mask controls, expression morphing and skin-tone matching to achieve the exact look they want.\n\nPractical for both still images and moving footage, Face Swap supports high-resolution outputs suitable for social media content, marketing, film post-production, game avatars and creative art. It handles challenging conditions like moderate motion, partial occlusion and varying lighting, and can run fast enough for near real-time video applications on capable hardware. Advanced workflows also include gender or age adjustments for creative variations.\n\nWhat makes this model useful: it delivers photoreal swaps that maintain correct proportions and facial expressions, offers adjustable controls for increased user control, and produces high-resolution results suitable for professional use. For best outcomes, provide clear, high-resolution source and target images with similar expression and lighting. The model respects data privacy practices — many implementations process images temporarily and remove them after processing.\n\nLimitations and responsible use: Face Swap is optimized for human faces and may perform poorly on non-human subjects. Results depend on input quality and adequate compute power for high-resolution or real-time video. Because face replacement can raise ethical and legal issues, always obtain consent and use the tool transparently and responsibly.","Бесшовно меняет лица на фото и в видео с фотореалистичным результатом","Face Swap — модель image-to-image, созданная для обнаружения, сопоставления и замены лиц на фотографиях и в видео с высоким уровнем реализма. Модель автоматически определяет ключевые точки лица, выравнивает черты и синтезирует тон кожи, освещение и текстуры, чтобы органично совместить исходное лицо с целевым без заметных искажений. Для точной доработки доступны ручная подстройка выравнивания, маскирование, морфинг выражений и коррекция тона кожи.\n\nПрактическое применение охватывает как статичные изображения, так и видеоматериалы: контент для соцсетей, маркетинговые ролики, пост-продакшн в кино, игровые аватары и художественные проекты. Модель устойчиво работает при умеренном движении, частичной заслонённости и переменном освещении, а на мощном оборудовании обеспечивает скорость, близкую к реальному времени. Дополнительно доступны творческие эффекты — смена пола или старение лица.\n\nПреимущества: фотореалистичные замены лиц с сохранением пропорций и выражений, инструменты для тонкой настройки, поддержка высоких разрешений для профессионального использования. Для лучших результатов используйте качественные исходные изображения с похожими выражениями и освещением. Многие реализации соблюдают конфиденциальность — данные обрабатываются временно и удаляются после выполнения задачи.\n\nОграничения и ответственность: модель оптимизирована для человеческих лиц и может некорректно работать с не‑людскими объектами. Качество результата зависит от входных данных и доступных вычислительных ресурсов. Поскольку замена лиц может поднимать этические и правовые вопросы, используйте инструмент ответственно и с согласием затронутых лиц.",[63,64],{"input_image":163,"swap_image":163},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":1139,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":1140,"key":1141,"label":1142,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":83,"generationTypes":1143,"api":85,"settingConfigs":1144,"isPromptRequired":61,"replicateId":1220,"secondCost":1221,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":414,"isAdminModel":12,"generationCount":1222,"bannerImageUrl":1223,"iconUrl":1224,"previewImageUrl":1225,"description":1226,"cost":1227,"githubUrl":1228,"licenseUrl":1229,"position":1230,"updatedAt":1231,"examples":1232,"isBanned":12,"isOutdated":12,"percs":1233,"releaseDate":1237,"createdAt":1238,"longDescription":1239,"ruDescription":1240,"ruLongDescription":1241,"isGenerationTypeRequired":12,"isInstantModel":12,"isUpscaler":12,"isAvailableAfterAuth":12,"replicateApiType":117,"configValue":1242},[63,64],"65f33eebfb4b9fb57e704f5b","face-to-many","Face to many",[83],[1145,1154,1175,1182,1191,1201,1210],{"fileTypes":1146,"_id":1147,"key":63,"model":1140,"title":1148,"tooltipContent":1149,"accept":92,"step":38,"defaultValue":163,"options":1150,"settingType":94,"fileType":63,"isRequired":61,"__v":30,"fileSource":1151,"description":1149,"ruDescription":1152,"ruTitle":1153},[],"65f33eebfb4b9fb57e704f5f","Source image","Image that will be changed",[],"url","Изображение, которое будет изменено","Источник изображения",{"fileTypes":1155,"_id":1156,"key":1157,"model":1140,"title":1158,"tooltipContent":1159,"defaultValue":1160,"options":1161,"settingType":282,"isRequired":61,"__v":30,"fileSource":28,"step":38,"description":1159,"ruDescription":1173,"ruTitle":1174},[],"65f33eebfb4b9fb57e704f61","style","Style","Choose a style to convert to","Video game",[1162,1164,1166,1167,1169,1171],{"label":1163,"value":1163},"3D",{"label":1165,"value":1165},"Emoji",{"label":1160,"value":1160},{"label":1168,"value":1168},"Pixels",{"label":1170,"value":1170},"Clay",{"label":1172,"value":1172},"Toy","Выберите стиль для преобразования","Стиль",{"fileTypes":1176,"_id":1177,"key":206,"model":1140,"title":207,"tooltipContent":1178,"step":38,"defaultValue":163,"options":1179,"settingType":214,"isRequired":12,"__v":30,"valueType":215,"fileSource":28,"description":1178,"ruDescription":1180,"ruTitle":1181},[],"65f33eebfb4b9fb57e704f69","Things you do not want in the image",[],"Вещи, которые вы не хотите видеть на изображении","Негативная подсказка",{"fileTypes":1183,"_id":1184,"key":1185,"model":1140,"title":1186,"tooltipContent":1187,"step":38,"max":817,"min":30,"defaultValue":312,"options":1188,"settingType":43,"isRequired":61,"valueType":44,"__v":30,"fileSource":28,"description":1187,"ruDescription":1189,"ruTitle":1190},[],"65f33eebfb4b9fb57e704f6b","prompt_strength","Prompt Weight"," Controls how much the generation follows the text prompt.",[]," Контролирует, насколько генерация следует за текстовой подсказкой.","Вес подсказки",{"fileTypes":1192,"_id":1193,"key":1194,"model":1140,"title":1195,"tooltipContent":1196,"step":249,"max":38,"min":30,"defaultValue":1197,"options":1198,"settingType":43,"isRequired":61,"__v":30,"valueType":44,"fileSource":28,"isAdvanced":61,"description":1196,"ruDescription":1199,"ruTitle":1200},[],"65f33eebfb4b9fb57e704f6d","denoising_strength","Denoising Strength","How much of the original image to keep. 1 is the complete destruction of the original image, 0 is the original image","0.65",[],"Сколько исходного изображения нужно сохранить. 1 - полное уничтожение исходного изображения, 0 - исходное изображение","Сила денуазинга",{"fileTypes":1202,"_id":1203,"key":1204,"model":1140,"title":1205,"tooltipContent":1206,"step":249,"max":38,"min":30,"defaultValue":449,"options":1207,"settingType":43,"isRequired":12,"__v":30,"valueType":44,"fileSource":28,"isAdvanced":61,"description":1206,"ruDescription":1208,"ruTitle":1209},[],"65f33eebfb4b9fb57e704f6f","instant_id_strength","Instant Id Strength","How strong the InstantID will be.",[],"Насколько сильным будет InstantID.","Мгновенная сила идентификации",{"fileTypes":1211,"_id":1212,"key":1213,"model":1140,"title":1214,"tooltipContent":1215,"step":249,"max":38,"min":30,"defaultValue":1216,"options":1217,"settingType":43,"isRequired":61,"__v":30,"valueType":44,"fileSource":28,"isAdvanced":61,"description":1215,"ruDescription":1218,"ruTitle":1219},[],"65f33eebfb4b9fb57e704f71","control_depth_strength","Control Depth Strength","Strength of depth controlnet. The bigger this is, the more controlnet affects the output.","0.9",[],"Сила сети контроля глубины. Чем больше этот показатель, тем сильнее сеть контроля влияет на выход.","Контроль Глубина Прочность","fofr/face-to-many:352f1ad684b6e7e6d5c0895a73dde3bf22131ebdc4a2b17aa3a64e7c2aa40d96",0.000725,1059,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/face-to-many-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/face-to-many.svg","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/face-to-many-preview.png","Identify individuals by matching one face against millions",80,"https://github.com/fofr/cog-face-to-many","https://github.com/fofr/cog-face-to-many/blob/main/weights_licenses.md",139,"2025-09-12T17:55:49.456Z",[],[1234,1235,1236],"68a9d609e3ac04ad89b91f1f","68a9d609e3ac04ad89b91f21","68a9d60ae3ac04ad89b91f23","2024-03-05T09:41:00.000Z","2024-09-11T09:41:29.056Z","Face to many is an image-based identification model built for one-to-many face matching: a single input face is compared against a large enrolled gallery to find the closest matches. Designed for practical identification workflows rather than pairwise verification, it detects faces in photos or video frames, extracts compact faceprints (embeddings), and performs highly optimized searches across indexed databases. Users can identify individuals quickly across groups from dozens to millions of enrolled identities.\n\nPractical benefits include real-time matching for live video streams, support for multiple enrolled images per person to improve match quality, and reduced bias through synthetic data augmentation that expands variability in lighting, pose and expression. Built-in adversarial augmentation and anti-spoofing techniques improve resistance to presentation attacks and some manipulated imagery, increasing reliability in security-sensitive deployments.\n\nThe model scales to enterprise and government use cases where speed and low latency are critical: efficient indexing and search algorithms enable rapid lookup even in very large galleries. Typical use cases are security and surveillance, airport screening, access control for large organizations, law-enforcement searches, and crowd monitoring.\n\nLimitations and responsible-use considerations are important. Accuracy depends on enrollment and training data quality; poor lighting, occlusions or low-resolution inputs can produce false positives or negatives. Identification raises privacy, ethical and legal issues—deployers should use consent, clear policies, audit logs and legal compliance measures. When used responsibly, Face to many gives organizations a fast, scalable tool to identify individuals across large populations while offering mechanisms to improve fairness and robustness.","Определяет человека, сравнивая одно лицо с миллионами","Face to many — модель для идентификации по изображению, реализующая подход «один‑ко‑многим»: одно входное лицо сравнивается с большой базой зарегистрированных образцов, чтобы найти наиболее подходящие совпадения. Модель ориентирована на практические задачи идентификации, а не на попарную верификацию: она находит лица на фото или видео, извлекает компактные отпечатки (векторные представления) и выполняет оптимизированный поиск по индексированной галерее. Это позволяет быстро идентифицировать людей в группах от десятков до миллионов записей.\n\nПрактические преимущества включают быструю обработку живых видеопотоков, поддержку нескольких изображений на одного человека для повышения качества совпадений и уменьшение смещений за счёт синтетического дополнения данных, расширяющего вариативность по освещению, позе и мимике. Встроенные методы противостояния атакам и анти‑спуфинг повышают устойчивость к попыткам обмана и манипуляциям с изображениями, что важно для задач безопасности.\n\nМодель масштабируется для корпоративных и государственных применений, где важны скорость и низкая задержка: эффективные алгоритмы индексации и поиска обеспечивают быстрый доступ даже к очень большим галереям. Типичные сценарии — безопасность и наблюдение, досмотр в аэропортах, контроль доступа в крупных организациях, розыск по базам данных правоохранительных органов и мониторинг толпы.\n\nВажно учитывать ограничения и требования ответственного использования. Точность зависит от качества данных регистрации и обучения; при плохом освещении, закрытии лица или низком разрешении возможны ложные срабатывания. Идентификация связана с приватностью, этикой и правовым регулированием — необходимо применять согласие, прозрачные политики, журналы аудита и соответствие законодательству. При ответственном использовании Face to many предоставляет быстрый и масштабируемый инструмент для идентификации людей с механизмами повышения справедливости и устойчивости.",{"image":163,"style":1160,"negative_prompt":163,"prompt_strength":312,"denoising_strength":1197,"instant_id_strength":449,"control_depth_strength":1216},{"outputPath":7,"_id":1244,"key":1245,"label":1246,"shortLabel":1247,"description":1248,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1249,"releaseDate":1250,"ruLongDescription":1251,"createdAt":1252,"generationCount":1253,"type":63,"generationType":691,"generationTypes":1254,"api":85,"settingConfigs":1255,"percs":1289,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":1294,"replicateApiType":6,"cost":1295,"iconUrl":1296,"position":65,"secondCost":30,"generationCost":1297,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":1298,"updatedAt":1299,"__v":38,"isAvailableAfterAuth":61,"isBanned":12,"longDescription":1300,"configValue":1301},"683e369087ae59eca4ad54bf","black-forest-labs/flux-kontext-max","Flux Kontext Max","Flux Kontext Pro","Generates consistent multi-scene images from long text and images","Генерирует согласованные многосценные изображения по длинным текстам и изображениям","2024-11-20T23:55:00.000Z","Flux Kontext Max — это премиальная модель для генерации и редактирования изображений, созданная для длительных повествований, сложной визуальной логики и высокой согласованности между сценами. Она анализирует большие тексты — романы, сценарии или диалоги — и автоматически выделяет структуру кадров, действия персонажей, эмоциональные переходы и смены сцен, создавая несколько связанных изображений, которые отражают ход сюжета. Модель стабильно сохраняет идентичность персонажей — прически, одежду, возраст и выражения лица — в разных сценах, что делает её идеальной для комиксов, раскадровок, серийных визуалов и брендовых маскотов.\n\nFlux Kontext Max поддерживает мультимодальные входы: можно комбинировать длинный текст с референсными фото или иллюстрациями для точного управления композицией, выполнять локальные правки, заменять объекты или текст на изображениях, а также применять единый художественный стиль ко всему проекту. Алгоритм, ориентированный на раскадровку, сопоставляет кинематографические поворотные моменты с изображениями, обеспечивая осмысленное разнообразие планов и логическую последовательность без ручного создания каждого кадра. Модель также умеет качественно расширять изображения (по горизонтали, вертикали или с нескольких сторон), сохраняя семантику и стиль без «заплаток».\n\nПрактическая польза — быстрые и надежные итерации: закрепите стиль для проекта, дорабатывайте персонажей в несколько шагов или приведите разрозненные активы к единому визуальному языку для маркетинга и производства. Flux Kontext Max ориентирован на профессиональных создателей и команды, которым важны непрерывность и высокая скорость работы: модель улучшает соответствие подсказкам, качество типографики и производительность — заметно быстрее многих предыдущих решений. Учитывайте, что некоторые функции «max» экспериментальные, а качество результата во многом зависит от ясности и качества входных текстов и референсов.","2024-11-24T23:58:27.966Z",202,[],[1256,1261],{"fileTypes":1257,"_id":1258,"key":1101,"model":1244,"title":90,"tooltipContent":1259,"description":1259,"accept":92,"options":1260,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":12,"__v":30},[],"683e369087ae59eca4ad54c1","Image to remix",[],{"fileTypes":1262,"_id":1263,"key":1264,"model":1244,"title":1265,"ruTitle":1266,"ruDescription":163,"defaultValue":1267,"options":1268,"settingType":282,"fileSource":28,"__v":30},[],"683e369187ae59eca4ad54c3","aspect_ratio","Aspect Ratio","Соотношение сторон","match_input_image",[1269,1271,1273,1275,1277,1279,1281,1283,1285,1287],{"label":1270,"value":1267,"cost":163},"Input",{"label":1272,"value":1272,"cost":163},"1:1",{"label":1274,"value":1274,"cost":163},"16:9",{"label":1276,"value":1276,"cost":163},"9:16",{"label":1278,"value":1278,"cost":163},"4:3",{"label":1280,"value":1280,"cost":163},"3:4",{"label":1282,"value":1282,"cost":163},"3:2",{"label":1284,"value":1284,"cost":163},"2:3",{"label":1286,"value":1286,"cost":163},"5:4",{"label":1288,"value":1288,"cost":163},"4:5",[1290,1291,1292,1293],"68a9dff2e3ac04ad89b9215a","68a9dff2e3ac04ad89b9215c","68a9dff2e3ac04ad89b9215e","68a9dff2e3ac04ad89b92160",[63,64],400,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/flux.png",0.08,[],"2025-09-01T13:27:39.602Z","Flux Kontext Max is a premium image-generation and editing model built for long-form storytelling, complex visual logic, and high consistency across multi-scene projects. It ingests extended text like novels, scripts or dialogue and automatically extracts shot structure, character actions, emotional shifts, and scene transitions to produce multiple coherent images that follow the narrative flow. The model preserves character identity—hairstyles, clothing, age and recurring expressions—across scenes, making it ideal for graphic novels, storyboards, episodic visuals, and brand mascots.\n\nFlux Kontext Max supports multimodal inputs: you can combine long text with reference photos or illustrations to direct composition, perform precise local edits, swap objects or replace text in images, and transfer a unified art style across an entire project. Its storyboard-aware algorithm maps cinematic beats to images so you get sensible shot variety and logical scene progression without manually composing each frame. The model also offers robust image expansion (horizontal, vertical or multi-sided) that maintains semantic coherence and avoids patchy seams.\n\nPractically, this means faster, more reliable iterations: bind a project-wide style, refine characters across multiple editing turns, or convert existing assets into a consistent visual language for marketing and production. Flux Kontext Max is designed for professional creators and teams who need reliable continuity and rapid throughput: it emphasizes prompt adherence, typography quality, and speed—reported significantly faster than many prior solutions. Note that some “max” features are experimental and the best results depend on clear, high-quality input text and reference images. Overall, Flux Kontext Max is tailored to users who require high-fidelity, consistent imagery across extended narratives and complex visual workflows.",{"aspect_ratio":1267},{"outputPath":7,"_id":1303,"key":1304,"label":1247,"shortLabel":1247,"description":1305,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1306,"releaseDate":1250,"ruLongDescription":1307,"createdAt":1252,"generationCount":1308,"type":63,"generationType":691,"generationTypes":1309,"api":85,"settingConfigs":1310,"percs":1329,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":1333,"cost":795,"iconUrl":1296,"position":65,"secondCost":30,"generationCost":753,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":1334,"updatedAt":1335,"__v":71,"replicateApiType":6,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":1336,"configValue":1337},"683e33b1b2e717ccf6d7f1d2","black-forest-labs/flux-kontext-pro","Generate and iteratively edit images from text and reference images","Генерирует и итеративно редактирует изображения по тексту и референсам","Flux Kontext Pro — это мультимодальная модель для генерации и редактирования изображений, созданная для быстрых, итеративных и контекстно чувствительных рабочих процессов. Принимая текстовые подсказки и референсные изображения, Kontext Pro позволяет создавать целевые изображения и выполнять точечные локальные правки — изменить вывеску, одежду или ретушь лица — не затрагивая остальную часть сцены. Модель сохраняет идентичность персонажей, стиль и отличительные черты между последовательными правками, что делает её идеальной для проектов с необходимостью постоянства персонажей или повторяющихся визуальных элементов в разных сценах и ракурсах. Kontext Pro работает примерно в 8–10 раз быстрее предыдущих лидеров рынка, обеспечивая интерактивную или почти в реальном времени работу.\n\nПользователи могут выполнять как локальные редактирования областей, так и глобальные трансформации сцены, применять перенос стиля и уточнять визуал на нескольких итерациях без необходимости дообучения — достаточно текстовых инструкций и референсов. Это особенно полезно для художников, дизайнеров, рекламных команд, создателей визуальных новелл и подготовки анимации, которым требуются воспроизводимые и высококачественные результаты. Контекстное понимание повышает соответствие подсказкам и визуальную связность, а механизм согласованности сохраняет идентичность и стиль через серию изображений. Доступны версии: production‑ориентированная pro, экспериментальная max для улучшенной точности подсказок и типографики, и облегчённая dev (частная бета) для исследований и кастомизации.\n\nПрактические преимущества включают ускорённые сроки выполнения, меньше ручной доработки и объединённый рабочий процесс генерации и редактирования, снижающий сложность инструментов. Ограничения: dev‑версия сейчас в приватной бете, результаты чувствительны к качеству подсказок, и для достижения наилучших результатов может потребоваться небольшая практика в мультимодальном промптинге. В целом Flux Kontext Pro ускоряет творческие пайплайны за счёт скорости, точности и надёжной согласованности в итеративных правках.",191,[],[1311,1315],{"fileTypes":1312,"_id":1313,"key":1101,"model":1303,"title":90,"tooltipContent":1259,"description":1259,"accept":92,"options":1314,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":12,"__v":30},[],"683e34dbb2e717ccf6d806d1",[],{"fileTypes":1316,"_id":1317,"key":1264,"model":1303,"title":1265,"ruTitle":1266,"ruDescription":163,"defaultValue":1267,"options":1318,"settingType":282,"fileSource":28,"__v":30},[],"683e34dbb2e717ccf6d806d4",[1319,1320,1321,1322,1323,1324,1325,1326,1327,1328],{"label":1270,"value":1267,"cost":163},{"label":1272,"value":1272,"cost":163},{"label":1274,"value":1274,"cost":163},{"label":1276,"value":1276,"cost":163},{"label":1278,"value":1278,"cost":163},{"label":1280,"value":1280,"cost":163},{"label":1282,"value":1282,"cost":163},{"label":1284,"value":1284,"cost":163},{"label":1286,"value":1286,"cost":163},{"label":1288,"value":1288,"cost":163},[1330,1331,1332],"68a9dfc2e3ac04ad89b9214f","68a9dfc2e3ac04ad89b92151","68a9dfc2e3ac04ad89b92153",[63,64],[],"2025-09-04T17:06:26.919Z","Flux Kontext Pro is a multimodal image generation and editing model built for fast, iterative, and context-aware visual workflows. By accepting both text prompts and reference images, Kontext Pro enables targeted image creation and precise local edits—change a sign, swap clothing, or retouch a face—without disturbing the rest of the scene. Its iterative editing loop preserves character identity, style, and distinctive features across multiple turns, making it ideal for projects that require consistent characters or repeated visual elements across scenes and viewpoints. Kontext Pro runs up to 8–10x faster than previous state-of-the-art systems, supporting near-real-time interaction and rapid experimentation.\n\nUsers can perform local region edits or global scene transformations, apply style transfers, and refine visuals over multiple passes with no fine-tuning required—simple text instructions and reference images are enough. This makes Kontext Pro especially useful for artists, designers, advertising teams, visual-novel creators, and pre-production animation workflows that need repeatable, high-fidelity results. The model’s context awareness improves prompt adherence and visual coherence, while its consistency engine maintains identity and style across a sequence of images. Versions include a production-focused pro build, an experimental max build for enhanced prompt fidelity and typography, and a lightweight dev build (private beta) for research and customization.\n\nPractical benefits include faster turnarounds, fewer manual corrections, and a unified generation+editing workflow that reduces tool complexity. Limitations: the dev variant is in private beta, outputs remain prompt-sensitive, and a short learning curve for multimodal prompting yields the best results. Overall, Flux Kontext Pro streamlines creative pipelines with speed, precision, and reliable continuity across iterative edits.",{"aspect_ratio":1267},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":1339,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":1340,"key":1341,"label":1342,"shortLabel":1342,"description":1343,"isInstantModel":12,"releaseDate":1344,"type":63,"generationType":691,"generationTypes":1345,"api":17,"settingConfigs":1346,"percs":1347,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":795,"iconUrl":1296,"websiteUrl":1351,"position":38,"secondCost":30,"generationCost":753,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":1352,"createdAt":1353,"updatedAt":1354,"__v":30,"generationCount":1355,"ruDescription":1356,"isGenerationTypeRequired":12,"isAvailableAfterAuth":12,"longDescription":1357,"ruLongDescription":1358,"configValue":1359},[63,64],"67043358372f360c22895754","fal-ai/flux-pro/v1.1","Flux Pro 1.1","Fast text-to-image generator, precise prompts, professional 2K output","2024-10-03T19:13:00.000Z",[691],[],[1348,1349,1350],"68a9da31e3ac04ad89b9201e","68a9da32e3ac04ad89b92020","68a9da32e3ac04ad89b92022","https://blackforestlabs.ai/",[],"2024-10-07T19:15:36.846Z","2025-09-04T00:53:33.653Z",514,"Быстрый генератор изображений по тексту — точные запросы, профессиональный 2К вывод","Flux Pro 1.1 (Flux 1.1 Pro AI) is a high-speed, professional text-to-image generator designed to turn detailed prompts into polished visuals with exceptional speed and fidelity. Delivering images roughly six times faster than its predecessor, Flux Pro 1.1 lets creators iterate rapidly — ideal for tight deadlines, concept exploration, and high-velocity creative workflows. The model produces clear, highly detailed images up to 2K resolution and supports a broad range of artistic styles and visual variations, from polished concept art and marketing visuals to experimental and illustrative work.\n\nUsers benefit from strong prompt adherence and dependable output diversity: complex or nuanced instructions are interpreted accurately so the final result aligns closely with your intent. Flux Pro 1.1 is tuned for practical use — commercial rights are included and pricing is usage-based at $0.04 per megapixel, making it straightforward to estimate costs for projects. The model is widely accessible through platforms such as Flux1.AI, BasedLabs.ai, Segmind (serverless API), and the Flux AI Image Generator tool, enabling both hobbyists and enterprises to integrate it into existing pipelines.\n\nLimitations to consider: the maximum native resolution tops out at 2K, so ultra-high-resolution print jobs may require upscaling or alternative tooling; costs accumulate with high-volume or very large images; and best results typically come from well-crafted, specific prompts. Overall, Flux Pro 1.1 is an excellent choice for artists, designers, content creators, and businesses that need fast, reliable, professional-grade image generation with predictable pricing and enterprise-ready accessibility.","Flux Pro 1.1 (Flux 1.1 Pro AI) — это высокоскоростной профессиональный генератор изображений по тексту, созданный для превращения подробных подсказок в качественные визуалы с высокой скоростью и точностью. Модель работает примерно в шесть раз быстрее предшественника, что позволяет быстро проводить итерации — это особенно полезно при сжатых сроках, разработке концептов и высокодинамичных творческих процессах. Flux Pro 1.1 выдаёт чёткие, детализированные изображения до 2K и поддерживает широкий спектр стилей и визуальных вариаций — от концепт-артов и рекламных изображений до экспериментальных и иллюстративных работ.\n\nПользователи получают надёжное соответствие подсказкам и разнообразие результатов: модель хорошо интерпретирует сложные и нюансированные инструкции, поэтому итоговый результат чаще всего совпадает с ожидаемым. Flux Pro 1.1 ориентирована на практическое использование — коммерческие права включены, а цена расчётна по использованию: $0.04 за мегапиксель, что упрощает планирование бюджета проекта. Модель доступна через платформы Flux1.AI, BasedLabs.ai, Segmind (serverless API) и инструмент Flux AI Image Generator, что облегчает интеграцию как для отдельных пользователей, так и для компаний.\n\nОграничения: максимальное родное разрешение — 2K, поэтому для очень высокого разрешения печати может потребоваться последующее увеличение; при большом объёме или крупных изображениях затраты на использование накапливаются; для лучшего результата полезно формулировать точные и подробные подсказки. В целом, Flux Pro 1.1 — отличное решение для художников, дизайнеров, контент-креаторов и бизнеса, которым нужны быстрые, надёжные и профессиональные изображения с прозрачной тарификацией и готовностью к внедрению в рабочие процессы.",{},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":1361,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":1362,"key":1363,"label":1364,"shortLabel":1364,"description":1365,"isInstantModel":12,"ruDescription":1366,"ruLongDescription":1367,"type":63,"generationType":83,"generationTypes":1368,"api":17,"settingConfigs":1369,"percs":1390,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":795,"position":65,"secondCost":30,"generationCost":1394,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":1395,"createdAt":1396,"updatedAt":1397,"__v":226,"generationCount":1398,"iconUrl":1296,"isAvailableAfterAuth":12,"longDescription":1399,"configValue":1400},[63,64],"6743b7a26912d40e32e261b5","fal-ai/flux-pro/v1.1/redux","Flux Pro 1.1 Redux","Fast, high-quality image-to-image transformations and style transfers","Быстрая, высококачественная трансформация изображений и перенос стиля","Flux Pro 1.1 Redux — высокопроизводительная модель для преобразования изображений, оптимизированная для быстрой модификации и стилизации существующих изображений при сохранении их ключевого содержания. Наследуя уровень качества Flux Pro, Redux обеспечивает высокую визуальную четкость и точное следование подсказкам, но настроена на ускоренную итерацию — это делает её отличным выбором, когда нужно доработать или эволюционировать изображение, а не генерировать его с нуля. Пользователи могут применять перенос стиля, улучшать детали, менять освещение или настроение, а также создавать несколько вариантов одного исходного изображения при помощи текстовых подсказок или референсов. Практические преимущества включают фотореалистичные и художественно сочетающиеся результаты, быстрое время отклика для ускорения циклов проверки, а также гибкие стилистические опции, подходящие для редакционных, коммерческих и личных задач. Redux доступна через платформы с поддержкой API (например, Fal.ai), что облегчает интеграцию в автоматизированные пайплайны, инструменты контент-производства и дизайн-приложения. Стоимость обычно выставляется за мегапиксель, поэтому вы можете сознательно управлять разрешением и качеством. Типичные сценарии использования: творческое редактирование изображений для дизайнеров и иллюстраторов, быстрый перенос стиля и улучшение для фотографов, адаптация материалов для маркетинга и соцсетей, а также исследовательские эксперименты с вариациями изображений. Следует учитывать практические ограничения: качество результата зависит от качества исходного изображения, расходы могут увеличиваться при больших разрешениях или объёмах, а модель специализирована именно на задачах image-to-image и не заменяет генерацию изображений по тексту. Для пользователей, которым нужны быстрые, точные и универсальные преобразования изображений — от тонкой доработки до полной стилизации — Flux Pro 1.1 Redux предлагает производительное, готовое к интеграции решение, сочетающее скорость, качество и удобство использования.",[],[1370,1376,1382],{"fileTypes":1371,"_id":1372,"key":1373,"model":1362,"title":1374,"tooltipContent":90,"description":90,"accept":92,"options":1375,"settingType":94,"fileType":63,"fileSource":1151,"__v":30,"isRequired":61},[],"6743b7a26912d40e32e261b7","image_url","Input image",[],{"fileTypes":1377,"_id":1378,"key":306,"model":1362,"title":1379,"tooltipContent":50,"step":38,"max":53,"min":38,"defaultValue":1380,"options":1381,"settingType":43,"fileType":64,"fileSource":28,"valueType":44,"__v":30},[],"6743b7a26912d40e32e261b9","Number of inference steps","28",[],{"fileTypes":1383,"_id":1384,"key":1385,"model":1362,"title":1386,"tooltipContent":1387,"description":1387,"step":225,"max":40,"min":38,"defaultValue":1388,"options":1389,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6743b9c7f21c29d07400b866","guidance_scale","Guidance Scale","The CFG (Classifier Free Guidance) scale indicates how closely you want the model to adhere to your prompt when searching for a related image to present to you.","3.5",[],[1391,1392,1393],"68a9db89e3ac04ad89b92076","68a9db89e3ac04ad89b92078","68a9db89e3ac04ad89b9207a",0.05,[],"2024-11-24T23:32:50.084Z","2025-09-03T14:50:27.145Z",81,"Flux Pro 1.1 Redux is a high-performance image-to-image transformation model optimized for quickly modifying and stylizing existing images while preserving their core content. Built on the Flux Pro lineage, Redux delivers the same high visual fidelity and strong prompt adherence you expect from a top-tier model, but tuned for rapid iteration — making it ideal for workflows where evolving or enhancing an image is more efficient than generating from scratch. Users can apply style transfers, refine details, change lighting or mood, and produce multiple variations of a single source image guided by textual prompts or reference controls. Practical advantages include photorealistic and artistically coherent outputs, fast turnaround times that accelerate creative review cycles, and flexible stylistic options suitable for editorial, commercial, and personal projects. Redux is accessible through platforms with API support (for example, Fal.ai), enabling easy integration into automated pipelines, content production tools, and design software. Pricing is typically billed per megapixel to reflect inference cost, so you can scale quality and resolution intentionally. Typical use cases include creative image editing for designers and illustrators, rapid style transfer and enhancement for photographers, on-demand content adaptation for marketing and social media, and experimental R&D in image variation workflows. Keep in mind practical limits: output quality depends on the input image, costs can add up with high-resolution or high-volume usage, and the model is specialized for image-to-image tasks rather than pure text-to-image generation. For most users who need fast, accurate, and versatile image modifications — from subtle touch-ups to full stylistic reworks — Flux Pro 1.1 Redux offers a powerful, production-ready option that balances speed, quality, and ease of integration.",{"num_inference_steps":1380,"guidance_scale":1388},{"supportFiles":12,"supportedFileTypes":1402,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":1403,"key":1404,"label":1405,"shortLabel":1405,"description":1406,"isInstantModel":12,"ruDescription":1407,"releaseDate":1250,"ruLongDescription":1408,"type":63,"generationType":83,"generationTypes":1409,"api":17,"settingConfigs":1410,"percs":1424,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":795,"iconUrl":1296,"position":65,"secondCost":30,"generationCost":1394,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":1425,"createdAt":1252,"updatedAt":1426,"__v":71,"generationCount":1427,"isReasoningModel":12,"isAvailableAfterAuth":12,"configValue":1428},[63,64],"6743bda3f21c29d0740198bd","fal-ai/flux-pro/v1/canny","Flux Pro Canny","State-of-the-art retexturing. Edit an image given a text prompt.","Современное ретекстурирование. Редактируйте изображение по текстовой подсказке.","\u003Cp>Современное ретекстурирование. Редактируйте изображение по текстовой подсказке.\u003C/p>",[],[1411,1416,1420],{"fileTypes":1412,"_id":1413,"key":1414,"model":1403,"title":90,"tooltipContent":1259,"description":1259,"accept":92,"options":1415,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":61,"__v":30},[],"6743bde9f21c29d07401b6e6","control_image_url",[],{"fileTypes":1417,"_id":1418,"key":1385,"model":1403,"title":1386,"description":1387,"step":225,"max":40,"min":30,"defaultValue":1388,"options":1419,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6743bda3f21c29d0740198c1",[],{"fileTypes":1421,"_id":1422,"key":306,"model":1403,"title":1379,"tooltipContent":50,"description":50,"step":38,"max":53,"min":38,"defaultValue":1380,"options":1423,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6743bda3f21c29d0740198c3",[],[],[],"2025-08-21T12:13:23.702Z",85,{"guidance_scale":1388,"num_inference_steps":1380},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":1430,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":1431,"key":1432,"label":1433,"shortLabel":1433,"description":1434,"isInstantModel":12,"ruDescription":1435,"releaseDate":1436,"ruLongDescription":1437,"type":63,"generationType":83,"generationTypes":1438,"api":17,"settingConfigs":1439,"percs":1452,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":795,"position":65,"secondCost":30,"generationCost":1394,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":1456,"createdAt":1457,"updatedAt":1458,"__v":71,"iconUrl":1296,"generationCount":1459,"isAvailableAfterAuth":12,"longDescription":1460,"configValue":1461},[63,64],"6745e11a3baaf5e5333a9a28","fal-ai/flux-pro/v1/fill","Flux Pro Fill","Professional inpainting and outpainting for seamless image edits","Профессиональная инпейтинг и аутпейтинг для натуральных правок изображений","2024-11-06T14:52:00.000Z","Flux Pro Fill — специализированная модель для профессионального инпейтинга и аутпейтинга, создающая естественные и контекстно-согласованные правки. Разработанная для фотографов, дизайнеров и реставраторов, модель позволяет удалять или заменять объекты, восстанавливать повреждённые участки и расширять сцены за пределы оригинальных границ, сохраняя освещение, перспективу, текстуру и общую согласованность изображения. Модель принимает файлы изображений, маски (включая альфа-каналы) и текстовые подсказки, а также предлагает настраиваемые параметры — guidance, шаги и уровень безопасности — чтобы вы могли управлять точностью, креативностью и ограничениями для каждой задачи.\n\nПрактические сценарии использования Flux Pro Fill включают удаление объектов (линии электропередач, прохожие, ненужные предметы), реставрацию фотографий (заполнение утраченных или повреждённых областей), расширение и завершение фона и творческое увеличение сцены по описанию. Обработка альфа-масок позволяет точно задавать, какие зоны сохранять, а какие изменять. Модель оптимизирована для скорости и эффективности — среднее время обработки около 9 секунд — что подходит для итеративной работы и производственных конвейеров.\n\nFlux Pro Fill выделяется тем, что создаёт бесшовные заполнения, гармонирующие с исходным изображением и минимизирует видимые швы, несоответствия текстур и ошибки перспективы. Модель устойчива в сложных сценах и поддерживает мультимодальные входы, позволяя использовать референсы и детальные инструкции. Важно: качество результата сильно зависит от точности масок и ясности подсказок; расплывчатые входные данные или выход за пределы допустимых параметров могут ухудшить итог. Уровень безопасности влияет на креативность — его увеличение ограничивает рискованные генерации, уменьшение даёт более экспериментальные варианты. В целом Flux Pro Fill — мощное и гибкое решение для тех, кому нужны точные, качественные правки изображений с быстрым временем обработки и детальным контролем.",[],[1440,1445],{"fileTypes":1441,"_id":1442,"key":1373,"model":1431,"title":1374,"tooltipContent":1443,"description":1443,"accept":92,"options":1444,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":61,"__v":30},[],"6745e11a3baaf5e5333a9a2a","Image to edit",[],{"fileTypes":1446,"_id":1447,"key":1448,"model":1431,"title":1449,"tooltipContent":1450,"description":1450,"accept":92,"options":1451,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"maskFor":1373},[],"6745e11a3baaf5e5333a9a2c","mask_url","Mask","Area that will be inpainted",[],[1453,1454,1455],"68a9dc4fe3ac04ad89b9208f","68a9dc4fe3ac04ad89b92091","68a9dc4fe3ac04ad89b92093",[],"2024-11-26T14:54:18.009Z","2025-08-23T15:20:47.665Z",117,"Flux Pro Fill is a purpose-built image model for professional inpainting and outpainting that delivers natural, context-aware edits. Designed for photographers, designers, and restoration specialists, it removes or replaces objects, repairs damaged areas, and extends scenes beyond their original borders while preserving lighting, perspective, texture, and overall scene coherence. The model accepts image files, masks (including alpha masks), and text prompts, and it exposes tunable parameters such as guidance, steps, and safety tolerance so you can balance fidelity, creativity, and safety for each job.\n\nPractical workflows supported by Flux Pro Fill include object removal (power lines, people, unwanted items), photo restoration (filling missing or deteriorated regions), background extension and completion, and creative scene expansion based on descriptive prompts. Alpha mask handling enables precise editing—protecting areas you want to keep unchanged while targeting only the parts you want replaced. The model is optimized for speed and efficiency, with average runtimes around nine seconds, which makes it well suited for iterative editing and production pipelines.\n\nFlux Pro Fill stands out for producing seamless fills that blend with the source image, reducing visible seams, texture mismatches, and perspective errors common to lesser tools. It is robust in complex scenes and supports multi-modal inputs so users can provide references and detailed instructions. Note that output quality depends on well-defined masks and clear prompts; overly vague inputs or out-of-range parameter settings can reduce result quality. Also, safety tolerance influences creativity—raising it restricts risky content while lowering it allows more experimental generation. Overall, Flux Pro Fill is a powerful, flexible solution for anyone needing precise, high-quality image inpainting and outpainting with fast turnaround and fine-grained control.",{},{"replicateApiType":6,"outputPath":7,"_id":1463,"key":1464,"label":1465,"shortLabel":1465,"description":1466,"isInstantModel":12,"releaseDate":1467,"type":63,"generationType":691,"generationTypes":1468,"api":17,"settingConfigs":1469,"percs":1491,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":1496,"gemTokenCost":1497,"websiteUrl":1498,"position":30,"secondCost":30,"generationCost":1499,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":1500,"createdAt":1501,"updatedAt":1502,"__v":226,"iconUrl":1296,"generationCount":1503,"ruDescription":1504,"ruLongDescription":1505,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":1506,"tokenStrategy":67,"isAvailableAfterAuth":12,"longDescription":1507,"configValue":1508},"674343106912d40e32dd54cf","fal-ai/flux-pro/v1.1-ultra","Flux Pro Ultra 1.1 ","Generate photorealistic 4MP images fast - ideal for pro visuals","2024-11-06T15:14:00.000Z",[691],[1470,1477],{"fileTypes":1471,"_id":1472,"key":1473,"model":1463,"title":1474,"defaultValue":25,"options":1475,"settingType":27,"fileSource":28,"valueType":29,"__v":30,"description":1474,"tooltipContent":1474,"ruDescription":1476,"ruTitle":1476},[],"674346086912d40e32de3dc2","raw","Raw mode",[],"Сырое изображение",{"fileTypes":1478,"_id":1479,"key":1264,"model":1463,"title":1265,"tooltipContent":1480,"description":1480,"defaultValue":1272,"options":1481,"settingType":282,"fileSource":28,"valueType":215,"__v":30},[],"6745b2662f40465828d6e53a","Aspect ratio",[1482,1483,1484,1485,1486,1487,1489],{"label":1272,"value":1272,"cost":163},{"label":1278,"value":1278,"cost":163},{"label":1280,"value":1280,"cost":163},{"label":1274,"value":1274,"cost":163},{"label":1276,"value":1276,"cost":163},{"label":1488,"value":1488,"cost":163},"21:9",{"label":1490,"value":1490,"cost":163},"9:21",[1492,1493,1494,1495],"68a9db53e3ac04ad89b92069","68a9db53e3ac04ad89b9206b","68a9db53e3ac04ad89b9206d","68a9db53e3ac04ad89b9206f",250,240,"https://blackforestlabs.ai/flux-1-1-ultra/",0.06,[],"2024-11-24T15:15:28.111Z","2025-09-03T16:06:45.088Z",365,"Генируйте фотореалистичные 4MP изображения быстро — для профессиональной графики","Flux Pro Ultra 1.1 — высокопроизводительная модель text-to-image, созданная для профессионалов и креаторов, которым нужны большие фотореалистичные изображения с минимальными задержками. Модель генерирует изображения до 4MP (например, 2048×2048), что обеспечивает заметно более высокую детализацию и тонкие текстуры по сравнению с моделями, ограниченными ~2MP. Время генерации составляет примерно 8–10 секунд, что позволяет быстро итеративно работать и выпускать контент партиями без потери качества.\n\nДоступны режимы для разных задач: Ultra Mode — для широкой задачи высокого качества, Raw Mode — оптимизирован для максимально натурального, фотографического результата (полезно для портретов, продукта и детализированных пейзажей). Специализированные режимы для портретов и пейзажей дополнительно улучшают работу с человеческими образами и ландшафтными композициями. Модель точно следует подсказкам, при этом демонстрирует улучшенное разнообразие и реализм человеческих персонажей и природных сцен.\n\nПрактические сценарии включают печать большого формата и изобразительное искусство, быстрый маркетинговый контент, визуализацию продукта и прототипов, концепт-арт и дизайн персонажей, архитектурные и ландшафтные визуализации. Улучшенная передача света, резкость краев и работа с текстурами делают модель подходящей для презентаций и клиентских материалов.\n\nОбратите внимание, что для оптимальной работы требуются современные мощные GPU из‑за повышенных вычислительных требований. Некоторые технические детали обучения остаются закрытыми, но на практике модель обеспечивает удобный рабочий процесс для тех, кто ценит сочетание качества и скорости. Flux Pro Ultra 1.1 доступна на платформах вроде Flux AI и Pixel Dojo, где иногда предлагаются пробные версии.",[63,64],"Flux Pro Ultra 1.1 is a high-performance text-to-image model built for professionals and creators who need large, photorealistic images fast. It generates up to 4MP outputs (for example 2048×2048), delivering much sharper detail and finer textures than many models that stop at ~2MP. Typical generation times are about 8–10 seconds, enabling efficient iteration and batch production without sacrificing fidelity.\n\nThe model offers versatile modes to match creative goals: Ultra Mode for broad, high-quality generation and Raw Mode tuned for the most natural, photographic results—particularly useful for portraits, products, and fine-detail landscapes. Specialized portrait and landscape modes further refine human subjects and scenic compositions, respectively. Flux Pro Ultra 1.1 preserves prompt accuracy, producing images that closely follow user instructions while improving diversity in human subjects and natural scenes for more inclusive results.\n\nPractical uses include large-format printing and fine art, fast marketing asset creation, product visualization and prototyping, concept art and character design, and architectural or landscape visualizations. Its enhanced lighting, edge sharpness, and texture handling make it well suited to presentations, client deliverables, and portfolio work where realism matters.\n\nUsers should note the model benefits from high-end GPUs due to its resolution and compute needs. While some internal training details are proprietary, the result is an accessible workflow for creatives who require professional-grade images with minimal wait times. Flux Pro Ultra 1.1 is available through platforms like Flux AI and Pixel Dojo, with trial options on some services so teams can evaluate quality and speed in real workflows.",{"raw":25,"aspect_ratio":1272},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":1510,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":1511,"key":1512,"label":1513,"shortLabel":1514,"type":63,"generationType":691,"generationTypes":1515,"api":85,"settingConfigs":1516,"isPromptRequired":61,"replicateId":163,"replicateApiType":6,"cost":817,"licenseUrl":1542,"githubUrl":1543,"description":1544,"position":863,"secondCost":30,"generationCost":480,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"createdAt":1545,"updatedAt":1546,"__v":482,"generationCount":1547,"iconUrl":1296,"isAdminModel":12,"examples":1548,"isBanned":12,"isOutdated":12,"percs":1550,"releaseDate":1554,"websiteUrl":1351,"longDescription":1555,"ruDescription":1556,"ruLongDescription":1557,"isAvailableAfterAuth":12,"configValue":1558},[63,64],"66c9d3d8ba4eeb518ba3db62","black-forest-labs/flux-schnell","Flux Schnell","Flux.S",[],[1517,1532],{"fileTypes":1518,"_id":1519,"key":1264,"model":1511,"title":1265,"options":1520,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"defaultValue":1272,"description":1530,"tooltipContent":1530,"ruDescription":1531,"ruTitle":1266},[],"66c9d3d8ba4eeb518ba3db64",[1521,1522,1523,1524,1525,1526,1527,1528,1529],{"label":1272,"value":1272},{"label":1274,"value":1274},{"label":1276,"value":1276},{"label":1488,"value":1488},{"label":1490,"value":1490},{"label":1284,"value":1284},{"label":1282,"value":1282},{"label":1288,"value":1288},{"label":1286,"value":1286},"The aspect ratio of an output image","Соотношение сторон выходного изображения",{"fileTypes":1533,"_id":1534,"key":1535,"model":1511,"title":1536,"step":38,"max":65,"min":30,"defaultValue":1537,"options":1538,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":1539,"tooltipContent":1539,"ruDescription":1540,"ruTitle":1541},[],"66c9d3d8ba4eeb518ba3db66","output_quality","Output Quality","80",[],"The quality of an output image","Качество выходного изображения","Качество продукции","https://github.com/black-forest-labs/flux/blob/main/model_licenses/LICENSE-FLUX1-schnell","https://github.com/replicate/cog-flux-schnell","Ultra-fast text-to-image generator, high-quality images in seconds","2024-08-24T12:36:40.570Z","2025-09-02T13:42:29.406Z",437,[1549],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-examples/66c9d3d8ba4eeb518ba3db62/optimized_1713982573170.webp",[1551,1552,1553],"68a9d859e3ac04ad89b91fb3","68a9d859e3ac04ad89b91fb5","68a9d859e3ac04ad89b91fb7","2024-08-02T15:06:00.000Z","Flux.1 Schnell is an ultra-fast text-to-image model designed for users who need rapid, high-quality visuals with commercial usage rights. Optimized for very low-latency inference, it typically generates images in 1–4 steps and often returns results in sub-second to second ranges on capable hardware. The model produces professional-grade images up to 1024×1024, supports both text-to-image and some image-to-image workflows, and interprets complex, nuanced prompts reliably.\n\nWhat makes Flux.1 Schnell valuable is its balance of speed, cost-efficiency, and output quality. While it trades a small amount of peak fidelity compared with larger, slower variants, it delivers excellent results for marketing assets, social media visuals, rapid prototyping, e-commerce imagery, concept art, and game or storyboard art where fast iteration is critical. The permissive Apache 2.0 license allows commercial deployment and resale of generated images, making it suitable for agencies and product teams.\n\nPractical benefits include low per-image costs (estimated around $0.003), easy integration into existing pipelines and UIs (examples include Hugging Face and Comfy UI), and the ability to run on consumer-grade systems—though a dedicated GPU and ample RAM (model size is roughly 24GB) are recommended for the best experience. Flux.1 Schnell is ideal when turnaround time, iteration speed, and cost matter more than extracting the absolute last bit of visual fidelity. It excels at producing consistent styles, handling detailed prompts, and enabling high-throughput creative workflows for businesses and individual creators alike.","Ультра‑быстрый генератор изображений по тексту, качественные картинки за секунды","Flux.1 Schnell — это ультра‑быстрая модель генерации изображений по текстовым подсказкам, созданная для тех, кому нужны быстрые, качественные визуалы с правом коммерческого использования. Модель оптимизирована для очень низкой задержки: обычно формирует изображение за 1–4 шага и часто возвращает результат за доли секунды или секунды на подходящем железе. Поддерживается генерация до 1024×1024, имеются возможности как для text-to-image, так и частично для image-to-image, а также уверенное понимание сложных и нюансированных подсказок.\n\nГлавное преимущество Flux.1 Schnell — баланс скорости, экономичности и качества. Модель отказывает немного в предельной детализации по сравнению с более медленными и крупными вариантами, но выдаёт отличные результаты для маркетинга, социальных сетей, быстрого прототипирования, e‑commerce-снимков, концепт‑артов и игровых ассетов, где важна быстрая итерация. Лицензия Apache 2.0 даёт право коммерческого развёртывания и использования сгенерированного контента, что делает модель удобной для агентств и продуктовых команд.\n\nПрактические выгоды: низкая стоимость одного изображения (примерно $0.003), простая интеграция в существующие пайплайны и интерфейсы (например, Hugging Face, Comfy UI), а также возможность запуска на потребительском оборудовании — при этом рекомендуется GPU и достаточный объём оперативной памяти (размер модели около 24 ГБ) для оптимальной работы. Flux.1 Schnell идеально подходит, когда важны скорость, частые итерации и экономичность, при этом сохраняя коммерчески годный уровень качества.",{"aspect_ratio":1272,"output_quality":1537},{"_id":1560,"key":1561,"label":1562,"shortLabel":764,"description":1563,"isInstantModel":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"ruDescription":1564,"releaseDate":327,"ruLongDescription":1565,"contextCapacity":82,"maxTokens":65,"createdAt":762,"generationCount":1566,"type":63,"generationType":691,"generationTypes":1567,"api":67,"settingConfigs":1568,"percs":1580,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":1584,"replicateId":163,"replicateApiType":6,"outputPath":7,"cost":737,"iconUrl":695,"previewImageUrl":739,"bannerImageUrl":752,"websiteUrl":754,"position":751,"secondCost":30,"generationCost":753,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":1585,"updatedAt":1586,"__v":71,"longDescription":1587,"configValue":1588},"68accb359694eed02ad406f2","gpt-image-1","GPT image 1","Generate photorealistic images from text and edit images easily","Создаёт фотореалистичные изображения по тексту и легко редактирует фото","GPT Image 1 — высококачественная мультимодальная модель для создания и редактирования изображений по тексту и изображениям. Модель умеет генерировать фотореалистичные и стилизованные изображения разрешением до 1536×1536, точно учитывая указания по композиции, освещению, стилю и деталям. Помимо текст-в-изображение она поддерживает преобразование изображения в изображение для получения вариаций и инпейтинг (включая правки по ограничивающим рамкам) для замены фона, удаления или изменения объектов и коррекции освещения — всё через простые текстовые команды. Отдельное преимущество — надёжная отрисовка читаемого текста внутри картинок, что полезно для учебных материалов, раскадровок, макетов и пользовательских интерфейсов.\n\nМодель хорошо справляется с новыми и сложными запросами без дополнительной донастройки, что делает её удобной для творческих задач (концепт-арт, маркетинговые визуалы, рендеры продуктов), образовательных иллюстраций и разработки игр и приложений (ассеты, фоны, персонажи). GPT Image 1 ориентирована на качество и гибкость, поэтому она медленнее лёгких моделей и использование высокого качества может быть дороже из‑за цен на токены и генерацию изображений. Доступ предоставляется через API с ограничениями по скорости, которые масштабируются в зависимости от тарифа.\n\nНа практике даже пользователи без дизайнерских навыков могут быстро получать готовые визуалы и правки: достаточно описать желаемый результат или загрузить пример и дать инструкции. Команды получают инструмент для быстрой итерации, а разработчики — возможность интегрировать мощные мультимодальные функции в приложения. GPT Image 1 сочетает фотореализм, управляемость и поддержку разных входов, что делает её отличным выбором, когда важны точность и качество изображения.",6133,[691],[1569,1576],{"_id":1570,"key":703,"model":1560,"title":704,"tooltipContent":746,"description":716,"ruTitle":715,"ruDescription":717,"step":38,"max":71,"min":30,"defaultValue":705,"isClearable":61,"options":1571,"settingType":282,"fileTypes":1575,"fileSource":28,"__v":30},"68accb359694eed02ad406f4",[1572,1573,1574],{"value":705,"label":708},{"value":711,"label":710},{"value":714,"label":713},[],{"_id":1577,"key":63,"model":1560,"title":90,"ruTitle":96,"accept":92,"options":1578,"settingType":94,"fileTypes":1579,"fileSource":28,"__v":30},"68acd14e38a372ed30d24d23",[],[63],[1581,1582,1583],"68acd1c15bed5b87e5229af8","68acd1c15bed5b87e5229afa","68acd1c15bed5b87e5229afc",[63,64],[],"2025-09-08T15:19:19.756Z","GPT Image 1 is a high-fidelity multimodal image model that creates and edits images from natural language and image inputs. It excels at producing photorealistic and stylized visuals up to 1536×1536 resolution, handling complex prompts that specify composition, lighting, style, and fine details. Beyond text-to-image, it supports image-to-image generation for variations, and inpainting/editing (including bounding-box edits) to change backgrounds, remove or modify objects, or alter lighting — all via simple text instructions. A standout capability is reliable text rendering inside images, making it ideal for storyboards, educational graphics, packaging mockups, and UI assets.\n\nUsers benefit from strong zero-shot generalization: the model performs well on novel, challenging requests without extra fine-tuning. This makes it suited to creative workflows (concept art, marketing visuals, product renders), education (illustrations with embedded labels and captions), and game/app development (assets, backgrounds, and character studies). While GPT Image 1 prioritizes quality and versatility, it is relatively slower than some lightweight models and may cost more for high-volume or very large outputs due to token- and per-image pricing. Access is provided via a gated API with rate limits that scale by tier.\n\nIn practice, non-experts can quickly produce polished images and edits without deep design skills: provide a descriptive prompt or an example image plus instructions, and the model returns detailed, usable visuals. Creative teams gain a flexible tool for rapid iteration; developers can integrate multimodal image generation and editing into apps; educators can generate images with readable, embedded text. GPT Image 1 balances photorealism, controllability, and multi-input flexibility, making it a powerful choice when image fidelity and editing precision matter.",{"resolution":705},{"replicateApiType":6,"outputPath":7,"_id":1590,"key":1591,"label":1592,"shortLabel":1591,"description":1593,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1594,"releaseDate":775,"ruLongDescription":1595,"contextCapacity":1596,"maxTokens":462,"createdAt":778,"generationCount":1597,"type":428,"generationType":429,"generationTypes":1598,"api":67,"settingConfigs":1599,"percs":1616,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":1620,"cost":40,"gemTokenCost":817,"iconUrl":695,"previewImageUrl":819,"bannerImageUrl":820,"position":30,"secondCost":30,"generationCost":30,"inputTokenCost":1621,"outputTokenCost":1622,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":1623,"updatedAt":1624,"__v":71,"isAvailableAfterAuth":12,"longDescription":1625,"configValue":1626},"67fdfe2f796b6d77a67eb548","gpt-4.1","GPT-4.1","Generates text, understands images/video and large files; excels at coding","Генерирует текст, понимает изображения/видео и большие файлы; превосходен в кодинге","GPT-4.1 — универсальная модель ИИ, ориентированная на практические задачи с высокой точностью: продвинутая помощь в программировании, работа с длинными документами и мультимодальное понимание. Модель генерирует чище и исполняемый код, помогает с отладкой и рефакторингом, а также устойчиво выполняет сложные многошаговые инструкции. Ключевая особенность — окно контекста до одного миллиона токенов: вы можете загрузить целые книги, большие кодовые базы или длительные рабочие процессы агентов в одну сессию и сохранить весь контекст для продолжительной аналитики и правок.\n\nУлучшенное мультимодальное восприятие позволяет GPT-4.1 анализировать изображения и видео вместе с текстом: извлекать выводы из документов с иллюстрациями, резюмировать длительные записи собраний или анализировать визуальный контент для модерации и маркетинга. Семейство моделей выпускается в трёх вариантах: стандартная версия для самых сложных задач; GPT-4.1 Mini — оптимальный баланс скорости, стоимости и точности в задачах с изображениями; и GPT-4.1 Nano — для сверхбыстрой классификации и автодополнения. Mini и Nano обеспечивают значительное сокращение задержки и расходов при сохранении высокого качества, что делает продвинутые возможности доступными в продакшене.\n\nПрактические сценарии использования включают автоматизацию разработки ПО (генерация, ревью, рефакторинг), обеспечение автономных многошаговых агентов, анализ больших наборов данных в одной сессии и мультимодальные приложения для модерации, образования и маркетинга. Доступна настройка (fine-tuning) под доменные потребности. Хотя GPT-4.1 снижает частоту ошибок и лучше следует инструкциям, критические результаты следует проверять. В целом модель сочетает длинную память контекста, сильное мультимодальное понимание и высокие показатели в кодинге для ускорения реальных рабочих процессов.",1000000,4393,[429],[1600,1604,1608,1612],{"fileTypes":1601,"_id":1602,"key":436,"model":1590,"title":785,"tooltipContent":786,"description":787,"ruTitle":788,"ruDescription":789,"step":249,"max":38,"min":30,"costMultiplier":472,"defaultValue":439,"options":1603,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67fdfe2f796b6d77a67eb54a",[],{"fileTypes":1605,"_id":1606,"key":457,"model":1590,"title":458,"tooltipContent":794,"description":463,"ruTitle":465,"ruDescription":464,"step":795,"max":462,"min":82,"isAdvanced":61,"options":1607,"settingType":43,"fileSource":28,"__v":30,"defaultValue":461},[],"67fdfe2f796b6d77a67eb54c",[],{"fileTypes":1609,"_id":1610,"key":446,"model":1590,"title":447,"tooltipContent":800,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":71,"min":30,"defaultValue":449,"options":1611,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67fdfe2f796b6d77a67eb54e",[],{"fileTypes":1613,"_id":1614,"key":469,"model":1590,"title":470,"tooltipContent":805,"description":475,"ruTitle":477,"ruDescription":476,"step":806,"max":1596,"min":82,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":1615,"settingType":43,"fileSource":28,"__v":30},[],"67fdfe2f796b6d77a67eb550",[],[1617,1618,1619],"68a9dec8e3ac04ad89b92112","68a9dec8e3ac04ad89b92114","68a9dec8e3ac04ad89b92116",[63,64],0.002,0.008,[],"2025-09-11T17:57:56.187Z","GPT-4.1 is a versatile AI built for practical, high‑accuracy work: advanced coding assistance, long-document reasoning, and multimodal understanding. It generates cleaner, runnable code, helps debug and refactor existing projects, and follows detailed multi-step instructions more reliably than previous GPT-4 models. A standout capability is its one‑million token context window — you can load entire books, long codebases, or extended agent workflows into a single session and keep full context for sustained reasoning or editing. \n\nMultimodal improvements let GPT-4.1 interpret images and video alongside text for richer outputs: extract insights from documents with embedded figures, summarize long meeting recordings, or analyze visual content for moderation and marketing tasks. The family ships in three variants to match needs: the full standard model for the most complex tasks; GPT-4.1 Mini for a strong balance of speed, cost, and vision accuracy; and GPT-4.1 Nano for ultra-low-latency tasks like classification and autocompletion. Mini and Nano deliver major reductions in latency and cost while retaining high benchmark performance, making advanced capabilities accessible in production. \n\nPractical use cases include automated coding (generation, review, and refactor), powering agentic workflows that perform multi-step tasks, large-scale research and data analysis in a single session, and multimodal applications such as content moderation, education, and digital marketing. Businesses benefit from fine-tuning support for domain customization and the option to trade raw power for speed and cost-efficiency. \n\nWhile GPT-4.1 reduces common failure modes and improves instruction following, users should still validate critical outputs. Overall, GPT-4.1 combines long-context memory, strong multimodal understanding, and superior coding performance to accelerate complex real-world workflows.",{"top_p":439,"max_tokens":461,"temperature":449,"capacity":473},{"supportedFileTypes":1628,"replicateApiType":6,"outputPath":7,"_id":1629,"key":1630,"label":1631,"shortLabel":1631,"contextCapacity":777,"maxTokens":462,"type":428,"generationType":429,"generationTypes":1632,"api":67,"settingConfigs":1633,"isPromptRequired":61,"description":1650,"position":30,"secondCost":30,"generationCost":30,"inputTokenCost":66,"outputTokenCost":481,"stepPrice":30,"__v":482,"cost":40,"bannerImageUrl":820,"iconUrl":695,"previewImageUrl":819,"generationCount":1651,"isBanned":12,"updatedAt":1652,"isAdminModel":12,"isOutdated":12,"createdAt":778,"examples":1653,"percs":1654,"gemTokenCost":817,"longDescription":1659,"releaseDate":775,"ruDescription":1660,"ruLongDescription":1661,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"supportFiles":61,"oneImageCost":30,"tokenStrategy":67,"isAvailableAfterAuth":12,"configValue":1662},[63,64],"6642770aa98598a0848d2db0","gpt-4o","GPT-4o",[429],[1634,1638,1642,1646],{"fileTypes":1635,"_id":1636,"key":436,"title":785,"model":1629,"modelKey":1630,"tooltipContent":786,"step":249,"max":38,"min":30,"options":1637,"settingType":43,"fileSource":28,"costMultiplier":472,"valueType":44,"description":787,"ruDescription":789,"ruTitle":788,"defaultValue":439},[],"66428807827b1d7482ed6519",[],{"fileTypes":1639,"_id":1640,"key":457,"title":458,"model":1629,"modelKey":1630,"step":795,"max":462,"min":82,"options":1641,"settingType":43,"isAdvanced":61,"fileSource":28,"tooltipContent":794,"description":463,"ruDescription":464,"ruTitle":465,"defaultValue":461},[],"66428807827b1d7482ed6518",[],{"fileTypes":1643,"_id":1644,"key":446,"title":447,"model":1629,"modelKey":1630,"tooltipContent":800,"step":249,"max":71,"min":30,"options":1645,"settingType":43,"fileSource":28,"valueType":44,"description":451,"ruDescription":452,"ruTitle":453,"defaultValue":449},[],"66428807827b1d7482ed6517",[],{"fileTypes":1647,"_id":1648,"key":469,"title":470,"model":1629,"modelKey":1630,"step":806,"max":777,"min":82,"options":1649,"settingType":43,"isAdvanced":61,"tooltipContent":805,"costMultiplier":472,"fileSource":28,"defaultValue":473,"description":475,"ruDescription":476,"ruTitle":477},[],"66428807827b1d7482ed6516",[],"An advanced AI model excelling in contextual understanding and generating human-like text across diverse topics.",4197,"2025-09-04T09:33:00.048Z",[],[1655,1656,1657,1658],"672e2e24315626010a1cc7bf","672e2ccaf39f256ba09706c7","672e2cb1f39f256ba09706be","672e314b222833d65e6e222e","\u003Cp>An innovative AI model designed to provide remarkable understanding of context, enabling it to generate highly coherent, human-like text responses tailored to a wide variety of subjects and tasks. The model's architecture also enhances problem solving and creative thinking, making it suitable for complex applications.\u003C/p>","Продвинутая модель искусственного интеллекта, способная понимать контекст и генерировать человекоподобные тексты на различные темы.","\u003Cp>Инновационная модель искусственного интеллекта, разработанная с учетом особенностей контекста, что позволяет ей генерировать высокопоследовательные, похожие на человеческие, текстовые ответы, адаптированные к широкому спектру предметов и задач. Архитектура модели также улучшает решение проблем и творческое мышление, что делает ее пригодной для сложных приложений.\u003C/p>",{"top_p":439,"max_tokens":461,"temperature":449,"capacity":473},{"replicateApiType":6,"outputPath":7,"_id":1664,"key":1665,"label":1666,"type":428,"generationType":429,"generationTypes":1667,"api":67,"settingConfigs":1668,"isPromptRequired":61,"cost":38,"description":1690,"position":1691,"secondCost":30,"generationCost":30,"inputTokenCost":1692,"outputTokenCost":1693,"stepPrice":30,"__v":555,"generationCount":1694,"contextCapacity":777,"maxTokens":427,"updatedAt":1695,"iconUrl":695,"createdAt":1696,"isAdminModel":12,"examples":1697,"isBanned":12,"isOutdated":12,"percs":1698,"longDescription":1703,"releaseDate":1704,"gemTokenCost":1705,"ruDescription":1706,"ruLongDescription":1707,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":61,"supportedFileTypes":1708,"tokenStrategy":67,"isAvailableAfterAuth":12,"configValue":1709},"66b0c5b43af0982241f6554f","gpt-4o-mini","GPT-4o Mini",[429],[1669,1676,1680,1685],{"fileTypes":1670,"_id":1671,"key":436,"model":1664,"title":1672,"step":249,"max":71,"min":30,"defaultValue":439,"options":1673,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":1674,"ruDescription":1675,"ruTitle":1672},[],"66b0c5b43af0982241f65551","Top P",[],"Top_p. Filters AI responses based on probability.\u003Cbr> Lower values = top few likely responses,\u003Cbr> higher values = larger pool of options.\u003Cbr> Range: 0.1 to 1.0","Top_p. Фильтрует ответы AI на основе вероятности.\u003Cbr> Меньшие значения = несколько наиболее вероятных ответов,\u003Cbr> большие значения = больший набор вариантов.\u003Cbr> Диапазон: 0.1 - 1.0",{"fileTypes":1677,"_id":1678,"key":446,"model":1664,"title":447,"tooltipContent":163,"step":249,"max":71,"min":30,"defaultValue":449,"options":1679,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":451,"ruDescription":452,"ruTitle":453},[],"66b0c5b43af0982241f65553",[],{"fileTypes":1681,"_id":1682,"key":457,"model":1664,"title":458,"step":65,"max":1683,"min":65,"options":1684,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"defaultValue":461,"description":463,"ruDescription":464,"ruTitle":465},[],"66b0c5b43af0982241f65555",8000,[],{"fileTypes":1686,"_id":1687,"key":469,"model":1664,"title":470,"tooltipContent":805,"step":82,"max":777,"min":30,"isAdvanced":12,"options":1688,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"defaultValue":1689,"description":475,"ruDescription":476,"ruTitle":477},[],"66b0c5b43af0982241f65557",[],"16000","Generate text and understand images; fast, large-context, affordable",54,0.00015,0.0006,1075,"2025-09-11T13:50:44.345Z","2024-08-27T12:42:22.631Z",[],[1699,1700,1701,1702],"68a9d837e3ac04ad89b91fa6","68a9d837e3ac04ad89b91fa8","68a9d837e3ac04ad89b91faa","68a9d837e3ac04ad89b91fac","GPT-4o Mini is a cost-efficient, multimodal AI model that accepts text and images and produces high-quality text outputs. Built to balance strong language understanding with lower compute cost and faster responses, it’s ideal for developers and teams who need scalable, real-time AI without the price of larger frontier models. The model supports a very large context window (up to 128,000 tokens) and can generate long outputs (up to 16,000 tokens), allowing you to process entire documents, long codebases, or extended conversation histories in a single request. GPT-4o Mini is optimized for practical tasks such as summarization, long-form content creation, question answering, conversational agents, and vision-based features like image captioning and scene description.\n\nPriced to be affordable for high-volume use, GPT-4o Mini makes it feasible to run multi-step workflows, handle many parallel calls, and build cost-sensitive automation pipelines. It achieves strong benchmark results (around 82% on MMLU) and in many preference tests outperforms larger GPT-4 variants on chat quality, while delivering lower latency for real-time applications. Typical use cases include customer support chatbots that handle text+image inputs, content generation and editing tools, accessibility features for visually impaired users, and education or tutoring platforms that need extensive context handling.\n\nLimitations include text-only outputs today (audio and video support are planned), occasional factual errors, and the need for human oversight in critical situations. While powerful and versatile, GPT-4o Mini trades some of the highest-end reasoning capabilities found in newer frontier models for affordability and speed—making it a practical choice for production systems where large context, multimodal input, and cost efficiency matter most.","2024-07-18T16:50:00.000Z",0.6,"Генерирует текст и понимает изображения; быстро, большой контекст, недорогой","GPT-4o Mini — это экономичный мультимодальный ИИ, который принимает текст и изображения и выдаёт качественные текстовые ответы. Модель создана, чтобы сочетать мощное понимание языка с низкой стоимостью и быстрой скоростью отклика, что делает её подходящей для разработчиков и команд, которым нужен масштабируемый реальный AI без затрат на более крупные модели. GPT-4o Mini поддерживает очень большой контекст (до 128 000 токенов) и может генерировать длинные ответы (до 16 000 токенов), что позволяет обрабатывать целые документы, большие кодовые базы или длинные истории диалогов в одном запросе. Модель хорошо подходит для задач, таких как суммаризация, создание длинных текстов, ответы на вопросы, чат‑агенты и визуальные задачи — например, генерация подписей к изображениям и описание сцен.\n\nБлагодаря доступной цене GPT-4o Mini выгоден для интенсивного использования: выполнение многошаговых рабочих процессов, параллельные вызовы и автоматизация, чувствительная к затратам. Модель показывает сильные результаты в бенчмарках (около 82% по MMLU) и в ряде тестов по качеству диалога превосходит некоторые варианты GPT-4, при этом обеспечивая более низкую задержку для приложений в реальном времени. Среди типичных случаев применения — чат‑боты для поддержки клиентов с обработкой текста и изображений, инструменты генерации и редактирования контента, средства доступности для слабовидящих и образовательные платформы, которым требуется широкая обработка контекста.\n\nОграничения включают текстовый вывод (аудио и видео поддерживаются в будущем), вероятность фактических ошибок и необходимость проверки человеком в критичных сценариях. GPT-4o Mini предлагает практичный компромисс между производительностью, ценой и скоростью — отличный выбор для задач, где важны большой контекст, мультимодальная обработка и экономичность.",[63,64],{"top_p":439,"temperature":449,"max_tokens":461,"capacity":1689},{"_id":1711,"key":1712,"label":1713,"shortLabel":1591,"description":1714,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1715,"releaseDate":775,"ruLongDescription":1716,"contextCapacity":1596,"maxTokens":462,"createdAt":778,"generationCount":1717,"type":428,"generationType":429,"generationTypes":1718,"api":67,"settingConfigs":1719,"percs":1729,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":1733,"cost":40,"gemTokenCost":817,"iconUrl":1734,"previewImageUrl":819,"bannerImageUrl":820,"position":30,"secondCost":30,"generationCost":30,"inputTokenCost":1735,"outputTokenCost":1073,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":1736,"updatedAt":1737,"__v":226,"outputPath":7,"replicateApiType":6,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":1738,"configValue":1739},"6894e5c19f44470f52e6a5ab","gpt-5-2025-08-07","GPT-5","Understands text and images, excels at complex reasoning and code","Понимает текст и изображения, отлично решает сложные задачи и код","GPT-5 — универсальная мультимодальная модель, которая одновременно обрабатывает текст и изображения и даёт надёжные, качественные результаты для сложного рассуждения, программирования и многоэтапных рабочих процессов. Она умеет интерпретировать диаграммы, графики и фотографии, отвечать на вопросы в контексте больших документов, суммировать визуальную информацию и генерировать или отлаживать большие кодовые базы. Благодаря настраиваемым уровням рассуждения и нескольким вариантам модели (regular, mini, nano, chat) GPT-5 позволяет выбирать баланс между скоростью и глубиной: быстрые легковесные ответы для рутинных задач или более глубокий анализ, когда важна точность.\n\nПрактические преимущества: ускоренная работа разработчиков (генерация прототипов, фронтенд-решения, отладка больших проектов), создание продуктовых функций с мультимодальными возможностями, исследования смешанных медиа и помощь специалистам в юриспруденции, логистике, инженерии и здравоохранении, которым нужны последовательные многошаговые решения. Большой контекстный объём позволяет работать с длинными документами, масштабными диалогами и многомодульными кодовыми репозиториями без потери контекста.\n\nGPT-5 также ориентирован на безопасность и удобство: вместо резких отказов он может выдавать частичные или высокоуровневые ответы, когда полная информация рискованна, что повышает продуктивность и снижает вероятность вреда. Модель демонстрирует высокие результаты по задачам математики, кодирования и мультимодального понимания и заметно реже «галлюцинирует» по сравнению с предыдущими версиями. Заметьте: GPT-5 принимает изображения, но выводит текст (может генерировать код для изображений, например SVG), и по умолчанию запросы могут направляться на более лёгкие варианты модели, если не выбран повышенный режим.",4477,[429],[1720,1725],{"fileTypes":1721,"_id":1722,"key":1723,"model":1711,"title":458,"tooltipContent":794,"description":463,"ruTitle":465,"ruDescription":464,"step":795,"max":777,"min":82,"defaultValue":461,"isAdvanced":61,"options":1724,"settingType":43,"fileSource":28,"__v":30},[],"6894e5c19f44470f52e6a5af","max_completion_tokens",[],{"fileTypes":1726,"_id":1727,"key":469,"model":1711,"title":470,"tooltipContent":805,"description":475,"ruTitle":477,"ruDescription":476,"step":806,"max":1596,"min":82,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":1728,"settingType":43,"fileSource":28,"__v":30},[],"6894e5c19f44470f52e6a5b3",[],[1730,1731,1732],"68a9e140e3ac04ad89b921a6","68a9e140e3ac04ad89b921a8","68a9e140e3ac04ad89b921aa",[63,64],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/gpt-5.png",0.00125,[],"2025-09-12T12:34:50.334Z","GPT-5 is a versatile multimodal AI that processes text and images together and delivers reliable, high-quality results for complex reasoning, coding, and multi-step workflows. It reliably interprets charts, diagrams, photos, and long documents, and can answer context-rich questions, summarize visual information, or generate and debug large codebases. With configurable reasoning levels and multiple model sizes (regular, mini, nano, chat), GPT-5 lets teams balance speed and depth: choose faster, lighter responses for routine tasks or deeper reasoning when accuracy matters.\n\nPractical benefits include accelerated developer workflows (prototype generation, front-end scaffolding, debugging across large projects), product teams building multimodal features, researchers exploring mixed-media analysis, and knowledge workers in law, logistics, engineering, and healthcare who need sustained, multi-step problem solving. The model supports very large context windows, enabling work on long documents, extensive chats, and multi-file codebases without losing track of earlier details.\n\nGPT-5 also emphasizes safer, more usable output: instead of outright refusals it can provide partial, high-level, or redacted answers when full responses would be risky, improving productivity while reducing potential harm. It achieves strong benchmark performance across math, coding, multimodal understanding, and domain-specific tasks, and significantly reduces hallucinations compared to earlier models. Note: GPT-5 accepts image inputs but produces text outputs (it can generate code to create images, e.g., SVG), and the API may route queries to lighter variants by default unless higher reasoning is requested.\n\nOverall, GPT-5 is best as a dependable default for real-world applications that require deep understanding across mixed media, robust coding assistance, and flexible response tuning for speed or thoroughness.",{"max_completion_tokens":461,"capacity":473},{"_id":1741,"key":1742,"label":1743,"shortLabel":1591,"description":1744,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1745,"releaseDate":775,"ruLongDescription":1746,"contextCapacity":1596,"maxTokens":462,"createdAt":778,"generationCount":1747,"type":428,"generationType":429,"generationTypes":1748,"api":67,"settingConfigs":1749,"percs":1758,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":1762,"replicateApiType":6,"outputPath":7,"cost":40,"gemTokenCost":817,"iconUrl":1734,"previewImageUrl":819,"bannerImageUrl":820,"position":30,"secondCost":30,"generationCost":30,"inputTokenCost":1735,"outputTokenCost":1073,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":1763,"updatedAt":1764,"__v":38,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":1765,"configValue":1766},"689a7cb598239d7af7b16e88","gpt-5-mini","GPT-5-mini","Fast, cost-efficient text generator that understands images and large files","Быстрый и экономичный генератор текста, понимающий изображения и большие файлы","GPT-5-mini — облегчённая и экономичная версия семейства GPT-5, созданная для быстрой и надёжной обработки повседневных задач и запросов большого объёма. Модель принимает текстовые и графические входные данные (мультимодальный ввод) и возвращает текстовый вывод, что делает её удобной для кратких сводок, ответов в службе поддержки, базовой помощи с кодом и простого анализа документов с визуальным контекстом. Разработчики могут выбирать уровень рассуждений — минимальный, низкий, средний или высокий — чтобы настроить баланс между скоростью и глубиной ответа. \n\nGPT-5-mini оптимизирована для масштабирования и эффективности, хорошо работает как резервная модель, когда основной GPT-5 исчерпывает лимиты, или когда важны задержки и стоимость. Она поддерживает очень большие контексты (вход — до ~272 000 токенов, вывод — до ~128 000 токенов), поэтому способна обрабатывать длинные документы, продолжительные диалоги и агрегированные данные в одном запросе. По сравнению с более тяжёлыми вариантами GPT-5, GPT-5-mini жертвует частью возможностей глубокого многошагового рассуждения ради более быстрой работы и меньших вычислительных затрат, при этом поддерживая высокую точность и сниженное число ошибок по сравнению с ранними версиями. \n\nПрактические сценарии использования включают масштабируемые чат‑боты, рутинную генерацию контента, массовое суммирование, простые мультимодальные анализы (например, суммаризация документа с изображениями) и роль резервной модели для непрерывной работы сервиса. Ограничения: текстовый вывод только (нет прямой визуализации изображений или мультимедиа), менее подходяща для сложных многошаговых задач (там лучше GPT-5-main или GPT-5-thinking) и знание устарело на 30 мая 2024 года. В целом GPT-5-mini предлагает прагматичное сочетание скорости, экономичности и мультимодальной гибкости для реальных приложений без накладных расходов полной модели GPT-5.",4394,[429],[1750,1754],{"fileTypes":1751,"_id":1752,"key":1723,"model":1741,"title":458,"tooltipContent":794,"description":463,"ruTitle":465,"ruDescription":464,"step":795,"max":777,"min":82,"defaultValue":461,"isAdvanced":61,"options":1753,"settingType":43,"fileSource":28,"__v":30},[],"689a7cb598239d7af7b16e8a",[],{"fileTypes":1755,"_id":1756,"key":469,"model":1741,"title":470,"tooltipContent":805,"description":475,"ruTitle":477,"ruDescription":476,"step":806,"max":1596,"min":82,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":1757,"settingType":43,"fileSource":28,"__v":30},[],"689a7cb598239d7af7b16e8c",[],[1759,1760,1761],"68a9e292e3ac04ad89b921ed","68a9e292e3ac04ad89b921ef","68a9e292e3ac04ad89b921f1",[63,64],[],"2025-09-11T18:58:08.276Z","GPT-5-mini is a lightweight, resource-efficient member of the GPT-5 family designed for fast, reliable handling of everyday tasks and high-volume requests. It accepts text and image inputs (multimodal input) and returns text outputs, making it useful for things like short summaries, customer support replies, basic code help, and simple document analysis with visual context. Developers can choose configurable reasoning levels — minimal, low, medium, or high — to balance response speed and depth depending on the task. \n\nBuilt for scale and efficiency, GPT-5-mini excels when the main GPT-5 model reaches usage limits or when latency and cost matter. It handles very large contexts (input limits up to ~272,000 tokens and output limits up to ~128,000 tokens), so it can process long documents, extended conversations, and aggregated datasets in a single request. Compared with heavier GPT-5 variants, GPT-5-mini trades some deep multi-step reasoning power for faster responses and lower compute costs while maintaining strong accuracy and fewer hallucinations than earlier generations. \n\nPractical use cases include high-volume chatbots, routine content generation, bulk summarization, simple multimodal analyses (e.g., summarizing a document with referenced images), and acting as a fallback to ensure uninterrupted service when primary models are unavailable. Limitations include text-only output (no direct image or multimedia rendering), reduced suitability for deeply complex, multi-step reasoning tasks (where GPT-5-main or GPT-5-thinking are recommended), and a knowledge cutoff of May 30, 2024. Overall, GPT-5-mini offers a pragmatic balance of speed, cost-effectiveness, and multimodal convenience for many real-world applications that need steady, competent AI without the overhead of the full GPT-5 model.",{"max_completion_tokens":461,"capacity":473},{"_id":1768,"key":1769,"label":1770,"shortLabel":1770,"description":1771,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1772,"releaseDate":1773,"ruLongDescription":1774,"contextCapacity":1775,"maxTokens":1776,"generationCount":1777,"type":428,"generationType":429,"generationTypes":1778,"api":85,"settingConfigs":1779,"percs":1828,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":1835,"replicateId":1836,"replicateApiType":1837,"outputPath":7,"cost":478,"gemTokenCost":491,"iconUrl":695,"previewImageUrl":1838,"bannerImageUrl":1838,"websiteUrl":1839,"licenseUrl":1840,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":1692,"outputTokenCost":1841,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":1842,"createdAt":1843,"updatedAt":1844,"__v":71,"isAvailableAfterAuth":12,"isBanned":12,"configValue":1845},"6899c39095f29ef4019dac36","openai/gpt-oss-120b","GPT-OSS 120B","120b open-weight language model from OpenAI","120-миллиардная открытая языковая модель от OpenAI","2025-08-05T18:05:57.381Z","\u003Cp>Это 120-миллиардная открытая языковая модель от OpenAI, разработанная для высококачественной генерации и понимания текста с отличной производительностью в различных областях.\u003C/p>",8192,16384,4656,[429],[1780,1789,1796,1806,1815,1822],{"fileTypes":1781,"_id":1782,"key":457,"model":1768,"title":1783,"tooltipContent":1784,"description":1784,"ruTitle":1785,"ruDescription":1786,"step":38,"max":1776,"min":38,"defaultValue":1787,"options":1788,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6899c39095f29ef4019dac38","Max Tokens","The maximum number of tokens the model should generate as output.","Максимальное количество токенов","Максимальное количество токенов, которое модель должна сгенерировать в качестве вывода.","1024",[],{"fileTypes":1790,"_id":1791,"key":446,"model":1768,"title":447,"tooltipContent":1792,"description":1792,"ruTitle":453,"ruDescription":1793,"step":249,"max":71,"min":30,"defaultValue":1794,"options":1795,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6899c39095f29ef4019dac3a","The value used to modulate the next token probabilities.","Значение, используемое для модуляции вероятностей следующего токена.","0.1",[],{"fileTypes":1797,"_id":1798,"key":1799,"model":1768,"title":1800,"tooltipContent":1801,"description":1801,"ruTitle":1802,"ruDescription":1803,"step":249,"max":71,"min":1804,"defaultValue":347,"options":1805,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6899c39095f29ef4019dac3c","presence_penalty","Presence Penalty","Presence penalty","Штраф за присутствие","Штраф за присутствие токенов в тексте",-2,[],{"fileTypes":1807,"_id":1808,"key":1809,"model":1768,"title":1810,"tooltipContent":1811,"description":1811,"ruTitle":1812,"ruDescription":1813,"step":249,"max":71,"min":1804,"defaultValue":347,"options":1814,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6899c39095f29ef4019dac3e","frequency_penalty","Frequency Penalty","Frequency penalty","Штраф за частоту","Штраф за частоту повторения токенов",[],{"fileTypes":1816,"_id":1817,"key":436,"model":1768,"title":1672,"tooltipContent":1818,"description":1818,"ruTitle":1672,"ruDescription":1819,"step":249,"max":38,"min":30,"defaultValue":1820,"options":1821,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6899c39095f29ef4019dac40","Top-p (nucleus) sampling","Выборка Top-p (nucleus sampling)","1",[],{"fileTypes":1823,"_id":1824,"key":469,"model":1768,"title":1825,"ruTitle":1826,"dimensions":163,"position":327,"step":82,"max":777,"min":462,"defaultValue":581,"options":1827,"settingType":43,"fileSource":28,"__v":30},[],"6899c45395f29ef4019dcfdc","Context Capacity","Окно Контекста",[],[1829,1830,1831,1832,1833,1834],"6899c39095f29ef4019dac42","6899c39095f29ef4019dac44","6899c39095f29ef4019dac46","6899c39095f29ef4019dac48","6899c39095f29ef4019dac4a","6899c39095f29ef4019dac4c",[63,64],"openai/gpt-oss-120b:ac6bfc61d439c4e20f11128294cdca41705b53baae7aa384e017fed49758174a","STREAM","https://tjzk.replicate.delivery/models_models_featured_image/a2d6b4a5-3491-4e2c-b9c8-ca1898188199/tmp4khgzalg.jpg","https://replicate.com/openai/gpt-oss-120b","https://huggingface.co/datasets/choosealicense/licenses/blob/main/markdown/apache-2.0.md",0.00065,[],"2025-08-11T10:18:56.680Z","2025-08-21T12:17:40.858Z",{"max_tokens":1787,"temperature":1794,"presence_penalty":347,"frequency_penalty":347,"top_p":1820,"capacity":581},{"replicateApiType":6,"outputPath":7,"_id":1847,"key":1848,"label":1849,"shortLabel":1849,"description":1850,"releaseDate":1851,"longDescription":1852,"contextCapacity":1596,"maxTokens":1683,"type":428,"generationType":429,"generationTypes":1853,"api":1854,"settingConfigs":1855,"percs":1884,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":482,"iconUrl":1889,"websiteUrl":1890,"position":1891,"secondCost":30,"generationCost":30,"inputTokenCost":1892,"outputTokenCost":1893,"stepPrice":30,"examples":1894,"createdAt":1895,"updatedAt":1896,"__v":71,"generationCount":1897,"ruDescription":1898,"ruLongDescription":1899,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":61,"supportedFileTypes":1900,"tokenStrategy":1854,"isAvailableAfterAuth":12,"configValue":1901},"66f2a197e524693772a677b1","gemini-1.5-flash","Gemini 1.5 flash","Fast, multimodal text & media understanding with long context.","2024-05-10T11:20:00.000Z","Gemini 1.5 Flash is a lightweight, multimodal AI optimized for speed, efficiency, and large-scale production use. It processes text, images, audio, video and documents within the same prompt, delivering real-time responses for high-frequency workloads. With an extremely long context window (up to 1 million tokens for Flash and 2 million tokens in the Pro tier), it can summarize, analyze, and reason over very large documents, extended conversations, or hours of media. Engineered for low latency—responses for most queries are under 3 milliseconds—Flash is ideal for chatbots, live customer support, interactive tools, and any application that requires near-instant inference at scale.\n\nBecause it is distilled from the larger Gemini 1.5 Pro model, Flash retains strong reasoning and multimodal capabilities while lowering computational cost and serving latency, making it an attractive option for production deployments that must balance performance and budget. It accepts large uploads (files up to 500 MB) and integrates smoothly with Google Cloud services such as Vertex AI and Google AI Studio for easy deployment, monitoring, and orchestration.\n\nCommon use cases include long-form summarization, structured data extraction from documents and tables, image and video captioning, transcription and analysis of long audio recordings, and powering conversational agents that maintain deep context across extended interactions. Practical benefits include faster response times, lower operational costs compared with larger models, and the ability to handle rich, mixed-media inputs in a single model. Limitations: Flash trades a degree of top-end capability for speed and cost-efficiency compared to Gemini 1.5 Pro, and the 1M-token window may be smaller than Pro for some extreme-scale workflows.",[],"google",[1856,1860,1867,1875,1879],{"fileTypes":1857,"_id":1858,"key":446,"model":1847,"title":447,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":1859,"settingType":43,"fileSource":28,"__v":30},[],"6821f9a663b8c721c568f3b5",[],{"fileTypes":1861,"_id":1862,"key":1863,"model":1847,"title":1672,"description":1864,"ruTitle":1672,"ruDescription":1865,"step":249,"max":38,"min":30,"defaultValue":261,"options":1866,"settingType":43,"fileSource":28,"__v":30},[],"6821f9a663b8c721c568f3b8","topP","Tokens are selected from the most to least probable until the sum of their probabilities equals this value. Use a lower value for less random responses and a higher value for more random responses.","Токены выбираются от наиболее к наименее вероятным, пока сумма их вероятностей не станет равна этому значению. Используйте меньшее значение для менее случайных ответов и большее значение для более случайных ответов.",[],{"fileTypes":1868,"_id":1869,"key":1870,"model":1847,"title":1871,"description":1872,"ruTitle":1871,"ruDescription":1873,"step":249,"max":38,"min":30,"defaultValue":261,"options":1874,"settingType":43,"fileSource":28,"__v":30},[],"6821f9a663b8c721c568f3bb","topK","Top K","For each token selection step, the top_k tokens with the highest probabilities are sampled. Then tokens are further filtered based on top_p with the final token selected using temperature sampling. Use a lower number for less random responses and a higher number for more random responses.","Для каждого шага выбора токена отбираются токены top_k с наивысшими вероятностями. Затем токены фильтруются на основе top_p, а окончательный токен выбирается с использованием температурной выборки. Используйте меньшее число для менее случайных ответов и большее число для более случайных ответов.",[],{"fileTypes":1876,"_id":1877,"key":469,"model":1847,"title":470,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":1596,"min":462,"defaultValue":1689,"options":1878,"settingType":43,"fileSource":28,"__v":30},[],"6821f9a763b8c721c568f3be",[],{"fileTypes":1880,"_id":1881,"key":1882,"model":1847,"title":458,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":82,"defaultValue":461,"options":1883,"settingType":43,"fileSource":28,"__v":30},[],"6821f9e463b8c721c568f3fa","maxOutputTokens",[],[1885,1886,1887,1888],"68a9d87ee3ac04ad89b91fbe","68a9d87ee3ac04ad89b91fc0","68a9d87ee3ac04ad89b91fc2","68a9d87ee3ac04ad89b91fc4","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/google-gemini-icon.svg","https://deepmind.google/technologies/gemini/flash/",352,0.000075,0.0003,[],"2024-09-24T11:25:11.194Z","2025-08-23T15:04:31.151Z",58,"Быстрое мультимодальное понимание текста и медиа с длинным контекстом.","Gemini 1.5 Flash — легковесная мультимодальная модель ИИ, оптимизированная для скорости, эффективности и промышленного использования в масштабах. Она обрабатывает текст, изображения, аудио, видео и документы в рамках одного запроса, обеспечивая ответы в реальном времени для задач с высокой частотой обращений. Благодаря очень большому окну контекста (до 1 миллиона токенов в Flash и до 2 миллионов в Pro) модель может суммировать, анализировать и делать выводы по очень большим документам, длительным диалогам или часам медиаконтента. Flash обеспечивает низкую задержку — для большинства запросов время отклика ниже 3 миллисекунд — и поэтому подходит для чат-ботов, живой поддержки, интерактивных приложений и других сценариев, где важна мгновенная обработка.\n\nМодель обучена через дистилляцию от более крупной Gemini 1.5 Pro, что позволяет сохранить ключевые способности при снижении вычислительных затрат и времени отклика. Flash поддерживает загрузку больших файлов (до 500 МБ) и легко интегрируется с сервисами Google Cloud, такими как Vertex AI и Google AI Studio, для простого развёртывания и управления.\n\nТипичные сценарии применения включают суммаризацию больших материалов, извлечение структурированных данных из документов и таблиц, генерацию подписей для изображений и видео, расшифровку и анализ длительных аудиозаписей, а также создание диалоговых агентов с глубоким контекстом. Практические преимущества — быстрое время отклика, более низкая стоимость эксплуатации по сравнению с крупными моделями и возможность обрабатывать смешанные мультимедийные данные одним решением. Ограничения: в обмен на скорость и экономичность Flash несколько уступает в максимальной точности и возможностях модели Gemini 1.5 Pro, а окно в 1 млн токенов может быть недостаточно для экстремально больших задач.",[63,64],{"temperature":449,"topP":261,"topK":261,"capacity":1689,"maxOutputTokens":461},{"replicateApiType":6,"outputPath":7,"_id":1903,"key":1904,"label":1905,"shortLabel":1849,"description":1906,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1907,"releaseDate":1851,"ruLongDescription":1908,"contextCapacity":1596,"maxTokens":1683,"createdAt":1895,"generationCount":1909,"type":428,"generationType":429,"generationTypes":1910,"api":1854,"settingConfigs":1911,"percs":1932,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":1937,"cost":482,"iconUrl":1889,"websiteUrl":1890,"position":1891,"secondCost":30,"generationCost":30,"inputTokenCost":1938,"outputTokenCost":1939,"stepPrice":30,"tokenStrategy":1854,"oneImageCost":30,"examples":1940,"updatedAt":1941,"__v":38,"isAvailableAfterAuth":12,"longDescription":1942,"configValue":1943},"6822082f17e68d497de84523","gemini-2.0-flash","Gemini 2.0 flash","Fast multimodal AI — generates text, images, audio and video","Быстрая мультимодальная ИИ — генерирует текст, изображения, аудио и видео","Gemini 2.0 Flash — высокоскоростная и высокоточная мультимодальная модель ИИ, которая в реальном времени обрабатывает и генерирует текст, изображения, аудио и видео. Она вдвое быстрее, чем Gemini 1.5 Flash, при этом по точности соответствует или превосходит более крупные и медленные модели. Это практичное решение для продакшн‑приложений, где важны задержка, стоимость и качество. Модель поддерживает очень большие контексты — до миллиона токенов — что позволяет работать с длинными документами и продолжительными диалогами. Поддержка Multimodal Live обеспечивает прием живого аудио и видео, а мультимодальные выходы дают возможность комбинировать текст с изображениями или создавать управляемую многоязычную синтезированную речь для интерактивных интерфейсов. Режим Thinking Mode показывает пошаговые пути рассуждений, что улучшает прозрачность и упрощает проверку и совместную доработку выводов. Прямая интеграция с инструментами (Google Search, выполнение кода, функции третьих сторон) позволяет модели получать актуальные данные, выполнять вычисления или вызывать внешние сервисы в составе ответа. Практические преимущества: быстрое создание мультимедийного контента, расширенные ассистенты с объяснениями, поточные транскрипция/перевод/модерация в реальном времени и масштабируемые корпоративные развертывания с выгодной стоимостью. Вариант Flash‑Lite и упрощенное ценообразование снижают затраты для больших текстовых задач, а улучшенная энергоэффективность делает модель привлекательной для мобильных и встроенных решений. Некоторые функции (полные мультимодальные выходы и Multimodal Live API) находятся на ранней или ограниченной стадии доступа, а для реального времени и интеграций может потребоваться дополнительная настройка. В целом, Gemini 2.0 Flash идеально подходит разработчикам и организациям, которым нужен быстрый, точный и гибкий мультимодальный ИИ для реального времени, работы с большими контекстами и промышленных задач.",73,[],[1912,1916,1920,1924,1928],{"fileTypes":1913,"_id":1914,"key":446,"model":1903,"title":447,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":1915,"settingType":43,"fileSource":28,"__v":30},[],"6822082f17e68d497de84525",[],{"fileTypes":1917,"_id":1918,"key":1863,"model":1903,"title":1672,"description":1864,"ruTitle":1672,"ruDescription":1865,"step":249,"max":38,"min":30,"defaultValue":261,"options":1919,"settingType":43,"fileSource":28,"__v":30},[],"6822082f17e68d497de84527",[],{"fileTypes":1921,"_id":1922,"key":1870,"model":1903,"title":1871,"description":1872,"ruTitle":1871,"ruDescription":1873,"step":249,"max":38,"min":30,"defaultValue":261,"options":1923,"settingType":43,"fileSource":28,"__v":30},[],"6822082f17e68d497de84529",[],{"fileTypes":1925,"_id":1926,"key":469,"model":1903,"title":470,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":1596,"min":462,"defaultValue":1689,"options":1927,"settingType":43,"fileSource":28,"__v":30},[],"6822082f17e68d497de8452b",[],{"fileTypes":1929,"_id":1930,"key":1882,"model":1903,"title":458,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":82,"defaultValue":461,"options":1931,"settingType":43,"fileSource":28,"__v":30},[],"6822082f17e68d497de8452d",[],[1933,1934,1935,1936],"68a9df61e3ac04ad89b92135","68a9df61e3ac04ad89b92137","68a9df61e3ac04ad89b92139","68a9df61e3ac04ad89b9213b",[63,64],0.0001,0.0004,[],"2025-08-23T15:33:53.583Z","Gemini 2.0 Flash is a high-speed, high-accuracy multimodal AI that processes and generates text, images, audio, and video in real time. It’s designed to be twice as fast as Gemini 1.5 Flash while matching or exceeding the accuracy of larger, slower models. The result is a practical engine for production-grade applications where latency, cost, and quality all matter. Users can feed long documents or ongoing conversations—up to a million tokens of context—so the model retains memory across very large inputs. Multimodal Live streaming support enables live audio and video ingestion, and multimodal outputs let you combine generated text with images or steerable multilingual text‑to‑speech audio for polished, interactive experiences. A transparent Thinking Mode shows step‑by‑step reasoning paths, improving interpretability and making the model’s conclusions easier to audit or refine collaboratively. Direct tool integrations (Google Search, code execution, and third‑party functions) let the model fetch live data, run computations, or call external services as part of its responses. Practical benefits include rapid content creation (mixed media, localized assets, voiceovers), advanced assistants that explain their reasoning, real‑time transcription/translation/moderation pipelines, and enterprise deployments that require both scale and cost efficiency. A Flash‑Lite variant and simplified pricing help lower operating costs for large text output workloads, and improved energy efficiency makes the model attractive for mobile or edge scenarios. Some advanced features (full multimodal output and the Multimodal Live API) are in early or limited access, and real‑time/tooling setups may require integration work. Overall, Gemini 2.0 Flash is ideal for developers and organizations that need a fast, accurate, and versatile multimodal AI for real‑time apps, large context tasks, and production deployments.",{"temperature":449,"topP":261,"topK":261,"capacity":1689,"maxOutputTokens":461},{"replicateApiType":6,"outputPath":7,"_id":1945,"key":1946,"label":1947,"shortLabel":1849,"description":1948,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1949,"releaseDate":1851,"ruLongDescription":1950,"contextCapacity":1596,"maxTokens":1683,"createdAt":1895,"generationCount":1951,"type":428,"generationType":429,"generationTypes":1952,"api":1854,"settingConfigs":1953,"percs":1978,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":1983,"cost":482,"iconUrl":1889,"websiteUrl":1890,"position":1891,"secondCost":30,"generationCost":30,"inputTokenCost":1735,"outputTokenCost":249,"stepPrice":30,"tokenStrategy":1854,"oneImageCost":30,"examples":1984,"updatedAt":1985,"__v":126,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":1986,"configValue":1987},"685de3137edc80654046c258","gemini-2.5-pro","Gemini 2.5 Pro","Process massive multimodal inputs and complex reasoning for research","Обрабатывает масштабные мультимодальные данные и сложное рассуждение для исследований","Gemini 2.5 Pro — самая мощная модель Google на 2025 год, предназначенная для решения сложных задач с экстремально большим объёмом данных и различными типами контента. Модель сочетает встроенное поэтапное рассуждение и понимание мультимодальных входов — текста, изображений, аудио, видео и кода — и сохраняет связный контекст на объёмах до 2 миллионов токенов. Это позволяет ей анализировать целые кодовые базы, длинные научные статьи, юридические документы или мультимедийные наборы данных, не теряя важных взаимосвязей.\n\nПрактическая польза для пользователей: точная поэтапная отладка и генерация кода для масштабных проектов, глубокая синтезирующая аналитика по множеству источников, интегрированная интерпретация диаграмм вместе с текстом или аудио, а также взвешенная поддержка принятия решений в научных и бизнес‑задачах. Внутренние механизмы модели оптимизируют выбор подходящих компонентов для баланса скорости и точности, обеспечивая быстрые и надёжные ответы. По бенчмаркам Gemini 2.5 Pro занимает лидирующие позиции в задачах рассуждения и генерации и доступна через Google Cloud Vertex AI и Gemini API с возможностью масштабирования пропускной способности.\n\nОграничения: полный доступ обычно требует подписки Google AI Pro и может подразумевать расходы и квоты; некоторые продвинутые функции находятся в экспериментальном доступе. Для простых и критичных по задержке задач могут быть эффективнее более лёгкие модели. В целом Gemini 2.5 Pro подходит, когда требуется глубокое, контекстно‑осмысленное рассуждение по большим мультимодальным наборам данных — от анализа кодовых баз и отладки до синтеза исследований и мультимедийной аналитики.",118,[],[1954,1958,1962,1966,1970,1974],{"fileTypes":1955,"_id":1956,"key":446,"model":1945,"title":447,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":1957,"settingType":43,"fileSource":28,"__v":30},[],"685de3137edc80654046c25a",[],{"fileTypes":1959,"_id":1960,"key":1863,"model":1945,"title":1672,"description":1864,"ruTitle":1672,"ruDescription":1865,"step":249,"max":38,"min":30,"defaultValue":261,"options":1961,"settingType":43,"fileSource":28,"__v":30},[],"685de3137edc80654046c25c",[],{"fileTypes":1963,"_id":1964,"key":1870,"model":1945,"title":1871,"description":1872,"ruTitle":1871,"ruDescription":1873,"step":249,"max":38,"min":30,"defaultValue":261,"options":1965,"settingType":43,"fileSource":28,"__v":30},[],"685de3137edc80654046c25e",[],{"fileTypes":1967,"_id":1968,"key":469,"model":1945,"title":470,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":1596,"min":462,"defaultValue":1689,"options":1969,"settingType":43,"fileSource":28,"__v":30},[],"685de3137edc80654046c260",[],{"fileTypes":1971,"_id":1972,"key":1882,"model":1945,"title":458,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":82,"defaultValue":461,"options":1973,"settingType":43,"fileSource":28,"__v":30},[],"685de3137edc80654046c262",[],{"fileTypes":1975,"_id":1976,"key":531,"model":1945,"title":532,"ruTitle":534,"options":1977,"settingType":537,"fileSource":28,"__v":30,"icon":538},[],"686c2dc91eca8a9cba5e3e26",[],[1979,1980,1981,1982],"68a9e041e3ac04ad89b92174","68a9e041e3ac04ad89b92176","68a9e041e3ac04ad89b92178","68a9e041e3ac04ad89b9217a",[63,64],[],"2025-08-23T15:37:37.562Z","Gemini 2.5 Pro is Google’s most capable AI model for 2025, built to solve complex problems across extremely large inputs and multiple media types. It combines embedded multi-step reasoning with multimodal understanding — text, images, audio, video and code — and can keep coherent context across up to 2 million tokens. That makes it uniquely suited to analyze entire codebases, long research papers, multi-document legal briefs, or multimedia datasets without losing important connections.\n\nFor users, Gemini 2.5 Pro delivers practical benefits: accurate multi-turn debugging and large-scale code generation, deep synthesis of research from many sources, integrated interpretation of diagrams and associated text or audio, and nuanced decision support for scientific or business workflows. Its internal selection mechanism optimizes for speed and precision, so responses are fast while retaining high reliability. Benchmarks place it at the top for reasoning and generative tasks, and it’s accessible through Google Cloud Vertex AI and the Gemini API with options for scaled throughput.\n\nConsiderations: full-feature access is offered primarily via Google AI Pro plans and may incur costs and quota limits; some advanced capabilities remain in experimental phases. For routine, low-latency tasks, lighter models may be more cost-effective. Overall, Gemini 2.5 Pro is ideal when you need robust, context-aware reasoning over vast multimodal data — from end-to-end codebase understanding and debugging to long-form research synthesis, multimedia content analysis, and other high‑complexity applications.",{"temperature":449,"topP":261,"topK":261,"capacity":1689,"maxOutputTokens":461},{"replicateApiType":6,"outputPath":7,"_id":1989,"key":1990,"label":1991,"shortLabel":1849,"description":1992,"isInstantModel":12,"isReasoningModel":12,"ruDescription":1993,"releaseDate":1851,"ruLongDescription":1994,"contextCapacity":1596,"maxTokens":1683,"createdAt":1895,"generationCount":1995,"type":428,"generationType":429,"generationTypes":1996,"api":1854,"settingConfigs":1997,"percs":2018,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":2023,"cost":482,"iconUrl":1889,"websiteUrl":1890,"position":1891,"secondCost":30,"generationCost":30,"inputTokenCost":1938,"outputTokenCost":1939,"stepPrice":30,"tokenStrategy":1854,"oneImageCost":30,"examples":2024,"updatedAt":2025,"__v":38,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":2026,"configValue":2027},"686c2e511eca8a9cba5e48b3","gemini-2.5-flash","Gemini 2.5 flash","Generates text and understands images, audio & video — fast, cost-effective","Генерирует текст и понимает изображения, аудио и видео — быстро и экономично","Gemini 2.5 Flash — это сбалансированная высокопроизводительная модель ИИ, которая сочетает в себе продвинутое рассуждение с низкой задержкой и экономичным потреблением ресурсов. Модель обрабатывает мультимодальные входные данные (текст, изображения, аудио и видео) и генерирует качественные текстовые ответы, что делает её удобной для продуктов, работающих с разными типами данных в масштабах. Это «модель с мышлением»: она может демонстрировать ход рассуждений для повышения прозрачности и точности ответов; разработчики могут регулировать глубину такого «мышления» через параметр API, настраивая баланс скорости и тщательности. Flash-Lite оптимизирована для минимальной задержки и затрат, и в ней по умолчанию мышление отключено для максимальной пропускной способности, тогда как другие варианты Flash допускают более глубокое мышление при необходимости более качественного ответа.\n\nНативные интеграции (поиск Google для обоснования ответов, контекст по URL, вызов функций и выполнение кода) помогают получать контекстно осмысленные и практичные результаты. В превью Live API доступны низколатентные двунаправленные голосовые и видеовозможности для приложений в реальном времени. Благодаря расширенному окну контекста (до 1 миллиона токенов) Gemini 2.5 Flash может поддерживать длинные диалоги и обрабатывать очень большие документы без потери связности.\n\nПрактические сценарии включают масштабную классификацию и суммаризацию, мультимодальные ассистенты, интерпретирующие изображения и аудио вместе с текстом, интерактивные голосовые/видео системы для клиентов и бюджетно ориентированные задачи кодирования и рассуждений, где важен баланс производительности и стоимости. В сравнении с 2.5 Pro Flash делает упор на соотношение цена/качество: она не самая мощная для сверхсложных задач, но обеспечивает отличную ценность для проектов с высокими объёмами и требованиями к низкой задержке. Обратите внимание, что некоторые функции Live API находятся в превью, а включение режима рассуждения повышает качество ответов, но увеличивает расходы и задержку.",74,[],[1998,2002,2006,2010,2014],{"fileTypes":1999,"_id":2000,"key":446,"model":1989,"title":447,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":2001,"settingType":43,"fileSource":28,"__v":30},[],"686c2e511eca8a9cba5e48b5",[],{"fileTypes":2003,"_id":2004,"key":1863,"model":1989,"title":1672,"description":1864,"ruTitle":1672,"ruDescription":1865,"step":249,"max":38,"min":30,"defaultValue":261,"options":2005,"settingType":43,"fileSource":28,"__v":30},[],"686c2e511eca8a9cba5e48b7",[],{"fileTypes":2007,"_id":2008,"key":1870,"model":1989,"title":1871,"description":1872,"ruTitle":1871,"ruDescription":1873,"step":249,"max":38,"min":30,"defaultValue":261,"options":2009,"settingType":43,"fileSource":28,"__v":30},[],"686c2e511eca8a9cba5e48b9",[],{"fileTypes":2011,"_id":2012,"key":469,"model":1989,"title":470,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":1596,"min":462,"defaultValue":1689,"options":2013,"settingType":43,"fileSource":28,"__v":30},[],"686c2e521eca8a9cba5e48bb",[],{"fileTypes":2015,"_id":2016,"key":1882,"model":1989,"title":458,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":82,"defaultValue":461,"options":2017,"settingType":43,"fileSource":28,"__v":30},[],"686c2e521eca8a9cba5e48bd",[],[2019,2020,2021,2022],"68a9e087e3ac04ad89b92181","68a9e087e3ac04ad89b92183","68a9e087e3ac04ad89b92185","68a9e087e3ac04ad89b92187",[63,64],[],"2025-08-23T15:38:47.793Z","Gemini 2.5 Flash is a balanced, high-throughput AI model that combines strong reasoning with low latency and cost efficiency. It accepts multimodal inputs (text, images, audio, and video) and generates high-quality text responses, making it practical for products that must handle diverse data types at scale. The model is a “thinking model,” so it can surface its chain-of-thought-style reasoning to improve transparency and answer accuracy; developers can control this reasoning depth via an API parameter to tune speed versus thoroughness. Flash-Lite is optimized for the lowest latency and cost and has thinking turned off by default for maximum throughput, while other Flash variants allow more thinking when higher answer quality is required.\n\nNative integrations (Google Search grounding, URL context, function calling, and code execution) help the model deliver context-aware and actionable outputs. A Live API preview adds low-latency bidirectional voice and video capabilities for real-time conversational applications. With an expanded context window (up to 1 million tokens), Gemini 2.5 Flash can maintain long conversations or process very long documents without losing coherence.\n\nPractical uses include large-scale classification and summarization pipelines, multimodal assistants that interpret images or audio alongside text, interactive voice/video systems for customer-facing applications, and cost-sensitive coding or reasoning tasks where a balance between performance and expense matters. Compared to 2.5 Pro, Flash prioritizes price-performance: it’s not the top option for the most complex coding or advanced reasoning workloads, but it offers excellent real-world value for high-volume, latency-sensitive deployments. Note that some Live API features are in preview and that enabling the model’s thinking improves quality for complex tasks but increases compute and latency.",{"temperature":449,"topP":261,"topK":261,"capacity":1689,"maxOutputTokens":461},{"replicateApiType":6,"outputPath":7,"_id":2029,"key":2030,"label":2031,"shortLabel":1591,"description":2032,"isInstantModel":12,"isReasoningModel":12,"ruDescription":2033,"releaseDate":775,"ruLongDescription":2034,"contextCapacity":2035,"maxTokens":462,"createdAt":778,"generationCount":2036,"type":428,"generationType":429,"generationTypes":2037,"api":2038,"settingConfigs":2039,"percs":2056,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":2060,"cost":40,"gemTokenCost":817,"iconUrl":2061,"previewImageUrl":819,"bannerImageUrl":820,"position":30,"secondCost":30,"generationCost":30,"inputTokenCost":480,"outputTokenCost":481,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":2062,"updatedAt":2063,"__v":71,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":2064,"configValue":2065},"6875941d1b78e2155126b79a","grok-4","Grok 4","Understands text, images and voice; excels at coding and reasoning","Понимает текст, изображения и голос; превосходен в коде и рассуждениях","Grok 4 — универсальный мультимодальный ассистент, созданный для решения сложных задач. Он воспринимает текст, изображения и голос, интегрирует актуальные данные и особенно силён в многошаговом логическом рассуждении, математических доказательствах и анализе кода. Благодаря поддержке чрезвычайно длинных контекстов (до 128k токенов в приложении и до 256k токенов через API), Grok 4 способен обрабатывать большие документы, целые кодовые базы, научные статьи и продолжительные диалоги без потери контекста.\n\nПрактическая польза для пользователей очевидна: разработчики получают точные обзоры кода, помощь в отладке и рекомендации по оптимизации для множества языков; исследователи и аналитики могут запросить пошаговые математические выводы, интерпретацию экспериментов или анализ визуальных графиков; преподаватели и студенты получают понятные и объясняющие разборы сложных тем. Модель также возвращает актуальную информацию, интегрируя данные о текущих событиях, рынках и обсуждениях в соцсетях.\n\nGrok 4 отдаёт приоритет глубине и точности ответов, а не максимальной скорости генерации. Встроено голосовое взаимодействие (ассистент с британским акцентом по имени Eve) и поддержка мультимодальных входов, что позволяет комбинировать текст, изображения и аудио в одной сессии. Доступ предоставляется через приложение xAI для подписчиков SuperGrok и Premium+ и через xAI API.\n\nИспользуйте Grok 4, когда нужны надёжные и качественные рассуждения на длинных или сложных данных — для глубокой проверки кода, продвинутых математических и научных задач, синтеза исследований или бизнес‑интеллекта с актуальными данными. Его сильные стороны: точность, работа с большими контекстами и мультимодальная гибкость.",256000,4372,[429],"x",[2040,2044,2048,2052],{"fileTypes":2041,"_id":2042,"key":436,"model":2029,"title":785,"tooltipContent":786,"description":787,"ruTitle":788,"ruDescription":789,"step":249,"max":38,"min":30,"costMultiplier":472,"defaultValue":439,"options":2043,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6875941d1b78e2155126b79c",[],{"fileTypes":2045,"_id":2046,"key":457,"model":2029,"title":458,"tooltipContent":794,"description":463,"ruTitle":465,"ruDescription":464,"step":795,"max":462,"min":82,"defaultValue":461,"isAdvanced":61,"options":2047,"settingType":43,"fileSource":28,"__v":30},[],"6875941d1b78e2155126b79e",[],{"fileTypes":2049,"_id":2050,"key":446,"model":2029,"title":447,"tooltipContent":800,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":71,"min":30,"defaultValue":449,"options":2051,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6875941d1b78e2155126b7a0",[],{"fileTypes":2053,"_id":2054,"key":469,"model":2029,"title":470,"tooltipContent":805,"description":475,"ruTitle":477,"ruDescription":476,"step":806,"max":2035,"min":82,"costMultiplier":472,"defaultValue":473,"isAdvanced":61,"options":2055,"settingType":43,"fileSource":28,"__v":30},[],"6875941d1b78e2155126b7a2",[],[2057,2058,2059],"68a9e0bfe3ac04ad89b9218e","68a9e0bfe3ac04ad89b92190","68a9e0bfe3ac04ad89b92192",[63,64],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/grok.png",[],"2025-08-24T12:57:03.103Z","Grok 4 is a versatile multimodal assistant built for complex problem solving. It understands text, images and voice, integrates real‑time data, and is particularly strong at multi‑step logical reasoning, mathematical proofs and code analysis. Because it supports extremely long contexts (up to 128k tokens in-app and 256k tokens via API), Grok 4 can review long documents, entire codebases, research papers, and extended conversations without losing thread.\n\nPractical users benefit from Grok 4 in several ways: developers get precise code reviews, debugging help and performance suggestions across many languages; researchers and analysts can ask for step‑by‑step mathematical derivations, experimental interpretation, or visual chart analysis; educators and students receive clear, explainable walkthroughs of difficult concepts. The model also provides up‑to‑date answers by integrating live information about current events, markets and social media trends.\n\nGrok 4 trades some generation speed for depth: it focuses on accuracy and thoughtful responses rather than instant replies. It includes voice interaction (a British‑accented assistant named Eve) and is built to handle multimodal inputs so you can combine text, images and audio in a single session. Access is available via xAI’s app for SuperGrok and Premium+ subscribers and through the xAI API.\n\nUse Grok 4 when you need reliable, high‑quality reasoning over long or complex inputs — for deep code reviews, advanced math and science work, research synthesis, or business intelligence that depends on current data. Its strengths are accuracy, long‑context understanding, and multimodal flexibility.",{"top_p":439,"max_tokens":461,"temperature":449,"capacity":473},{"replicateApiType":6,"outputPath":7,"_id":2067,"key":2068,"label":2069,"description":2070,"longDescription":2071,"type":63,"generationType":83,"generationTypes":2072,"api":2073,"settingConfigs":2074,"percs":2120,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":12,"cost":1497,"iconUrl":2124,"bannerImageUrl":163,"websiteUrl":2125,"position":2126,"secondCost":30,"generationCost":1499,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":2127,"createdAt":2128,"updatedAt":2129,"__v":126,"generationCount":2130,"ruDescription":2131,"ruLongDescription":2132,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":2133,"tokenStrategy":67,"isUpscaler":61,"isAvailableAfterAuth":12,"configValue":2134},"66f4069cf3c590fef3522fa6","ideogram-upscaler","Ideogram Upscaler","Double image resolution with AI detail enhancement and crop","Ideogram Upscaler doubles image resolution while improving perceived quality using AI-driven detail synthesis and gap filling. Designed to work directly inside the Ideogram AI workflow, it converts images (for example, 1024×1024 to 2048×2048) while intelligently enhancing texture, edges and small features rather than only enlarging pixels. Users can fine-tune results with two sliders — \"resemblance\" (how closely the upscaled output matches the original) and \"detail\" (how much new detail the model should introduce) — giving control over fidelity versus enhancement.\n\nThe Upscaler supports a set of standard aspect ratios and will crop to the nearest supported ratio to ensure final outputs conform to common formats (1:1, 16:9, 3:2, etc.). It is available to customers on the Basic plan and above; uploading custom images for upscaling requires a Plus subscription or higher. Because the tool is integrated into Ideogram AI, creators can upscale generated artwork or uploaded assets without exporting to external apps.\n\nTypical uses include preparing AI-generated art for prints and presentations, improving logos and social-media graphics, producing higher-resolution product mockups and marketing visuals, and preserving or improving text readability in images. The AI approach reduces blur and pixelation common with naive upscaling and produces more natural, visually appealing results. Limitations to consider: the current maximum is 2× enlargement, and aspect-ratio cropping may alter composition. Overall, Ideogram Upscaler is a practical, easy-to-use solution for anyone who needs higher-resolution imagery with better detail and text clarity, directly inside the Ideogram platform.",[83],"ideogram",[2075,2083,2093,2112],{"fileTypes":2076,"_id":2077,"key":255,"model":2067,"title":256,"tooltipContent":2078,"description":2079,"step":38,"max":65,"min":30,"defaultValue":2080,"options":2081,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"ruDescription":2082,"ruTitle":259},[],"66f4069cf3c590fef3522fa8","Controls how closely the output image resembles the reference image.","Adjust the level of similarity between the output and reference image. Higher values result in closer resemblance.","50",[],"Настройте уровень сходства между выходным и эталонным изображением. Более высокие значения приводят к более близкому сходству.",{"fileTypes":2084,"_id":2085,"key":2086,"model":2067,"title":2087,"tooltipContent":2088,"description":2089,"step":38,"max":65,"min":30,"defaultValue":2080,"options":2090,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"ruDescription":2091,"ruTitle":2092},[],"66f4069cf3c590fef3522faa","detail","Detail Level","Determines the level of detail in the upscaled image.","Control the amount of detail in the upscaled image. Higher values produce more intricate and refined results.",[],"Контролирует количество деталей в увеличенном изображении. Более высокие значения позволяют получить более сложные и изысканные результаты.","Уровень детализации",{"fileTypes":2094,"_id":2095,"key":2096,"model":2067,"title":2097,"tooltipContent":2098,"description":2099,"defaultValue":2100,"options":2101,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruDescription":2110,"ruTitle":2111},[],"66f4069cf3c590fef3522fac","magic_prompt_option","Magic Prompt","Determines if MagicPrompt should be used in generating the request.","Choose whether to use MagicPrompt in the image generation process. Auto lets the system decide, On always uses it, and Off never uses it.","AUTO",[2102,2104,2107],{"value":2100,"label":2103},"Auto",{"value":2105,"label":2106},"ON","On",{"value":2108,"label":2109},"OFF","Off","Выберите, использовать ли MagicPrompt в процессе создания изображения. Auto позволяет системе решать, On - всегда, а Off - никогда.","Магическая подсказка",{"fileTypes":2113,"_id":2114,"key":2115,"model":2067,"title":1104,"tooltipContent":1104,"description":2116,"accept":92,"options":2117,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"ruDescription":2118,"ruTitle":1153,"dimensions":2119},[],"66f4069cf3c590fef3522fae","image_file","Image that will be upscaled",[],"Изображение, которое будет увеличено","1024x1024, 1024x819, 1024x768, 1024x640, 1024x576, 900x600, 819x1024, 800x600, 768x1024, 640x1024, 640x480, 600x900, 600x800, 512x512",[2121,2122,2123],"68a9d9a0e3ac04ad89b91ffd","68a9d9a0e3ac04ad89b91fff","68a9d9a0e3ac04ad89b92001","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/ideogram.svg","https://ideogram.com",299,[],"2024-09-25T12:48:28.492Z","2025-08-23T15:09:20.738Z",33,"Увеличивает разрешение изображения в 2× с AI-улучшением деталей и обрезкой","Ideogram Upscaler увеличивает разрешение изображения вдвое и одновременно повышает качество с помощью AI — синтезируя детали и заполняя пробелы. Инструмент встроен прямо в интерфейс Ideogram AI и превращает, например, 1024×1024 в 2048×2048, улучшая текстуры, края и мелкие элементы вместо простого масштабирования пикселей. Пользователи могут регулировать два ползунка: «сходство» (насколько результат должен соответствовать исходнику) и «деталь» (насколько модель должна добавлять новых деталей), что даёт контроль между точностью и усилением образа.\n\nАпскейлер поддерживает набор стандартных соотношений сторон и обрезает изображение до ближайшего поддерживаемого формата (1:1, 16:9, 3:2 и т.д.), чтобы итоговые файлы соответствовали обычным размерам. Функция доступна пользователям с тарифом Basic и выше; загрузка собственных изображений для апскейла требует тарифа Plus или выше. Поскольку инструмент интегрирован в Ideogram AI, можно апскейлить созданные в системе изображения или загруженные файлы, не экспортируя их во внешние приложения.\n\nТипичные сценарии применения: подготовка сгенерированного AI-арта к печати и презентациям, улучшение логотипов и графики для соцсетей, создание более качественных мокапов и маркетинговых материалов, а также сохранение и повышение читаемости текста на изображениях. AI-подход снижает размытие и пикселизацию, характерные для простого масштабирования, и даёт более естественный результат. Ограничения: максимальное увеличение — 2×, а обрезка по соотношению сторон может изменить композицию. В целом Ideogram Upscaler — удобный и практичный инструмент для получения изображений более высокого разрешения с улучшенными деталями и читаемостью текста прямо в платформе.",[63,64],{"resemblance":2080,"detail":2080,"magic_prompt_option":2100},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":2136,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2137,"key":2138,"label":2139,"shortLabel":2139,"description":2140,"longDescription":2141,"generationCount":2142,"type":63,"generationType":691,"generationTypes":2143,"api":2073,"settingConfigs":2144,"percs":2200,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":1497,"iconUrl":2124,"position":2204,"secondCost":30,"generationCost":1499,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":2205,"__v":126,"createdAt":2206,"updatedAt":2207,"ruDescription":2208,"ruLongDescription":2209,"isAvailableAfterAuth":12,"configValue":2210},[63,64],"66f3fa8b052f508b234e1793","V_1","Ideogram v1","Generate photoreal images with precise, legible text rendering","Ideogram v1 is a text-to-image model built for creators who need high-fidelity visuals with reliably readable text. It produces photorealistic and artistically striking images that follow long, detailed prompts closely, making it easy to turn precise ideas into publishable visuals. A standout capability is advanced text rendering: Ideogram v1 significantly reduces errors when placing words inside images, so you can generate posters, memes, T-shirt designs, greeting cards, logos, and on-image product mockups with legible, context-appropriate text.\n\nThe model supports ultra-high resolution outputs (up to 2048×2048), a wide variety of photographic and artistic styles (25+ presets), and flexible aspect ratios. Its Magic Prompt feature helps users expand short ideas into rich, detailed prompts, lowering the creative barrier and accelerating iteration. Ideogram v1 is also fast — often producing results in seconds — which makes it well suited for rapid prototyping, social media content creation, and marketing workflows.\n\nPractical benefits include creating professional print-ready imagery, customized merchandise, brand assets with accurate typography, and repeatable seamless patterns for backgrounds and textiles. An integrated editor and a community on ideogram.ai make it easy to refine images and share inspiration. Note that free users have limited daily generations, and newer model versions exist that further improve speed and capabilities; however, Ideogram v1 remains a strong choice when text fidelity and visual quality are top priorities.",48,[691],[2145,2170,2178,2184,2191],{"fileTypes":2146,"_id":2147,"key":1264,"model":2137,"title":1265,"tooltipContent":2148,"defaultValue":2149,"isClearable":12,"options":2150,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1266},[],"66f400862f386b22b86a8835","Determines the image's resolution. Cannot be used with resolution.","ASPECT_1_1",[2151,2152,2155,2158,2160,2162,2164,2166,2168],{"value":2149,"label":1272},{"value":2153,"label":2154},"ASPECT_10_16","10:16",{"value":2156,"label":2157},"ASPECT_16_10","16:10",{"value":2159,"label":1276},"ASPECT_9_16",{"value":2161,"label":1274},"ASPECT_16_9",{"value":2163,"label":1282},"ASPECT_3_2",{"value":2165,"label":1284},"ASPECT_2_3",{"value":2167,"label":1278},"ASPECT_4_3",{"value":2169,"label":1280},"ASPECT_3_4",{"fileTypes":2171,"_id":2172,"key":2096,"model":2137,"title":2097,"tooltipContent":2173,"defaultValue":2100,"isClearable":12,"options":2174,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":2111},[],"66f400862f386b22b86a8838","Determine if MagicPrompt should be used in generating the request.",[2175,2176,2177],{"value":2100,"label":2103},{"value":2105,"label":2106},{"value":2108,"label":2109},{"fileTypes":2179,"_id":2180,"key":206,"title":207,"model":2181,"modelKey":2138,"tooltipContent":2182,"valueType":215,"defaultValue":163,"options":2183,"__v":30,"fileSource":28,"settingType":214,"ruTitle":1181},[],"66f3fa8b052f508b234e1798","66f2e91d04c45132a18198c7","Description of what to exclude from an image. Prompt takes precedence over negative prompt.",[],{"fileTypes":2185,"_id":2186,"key":2115,"title":1259,"model":2137,"modelKey":2138,"tooltipContent":2187,"description":2187,"accept":92,"options":2188,"isRequired":12,"__v":30,"settingType":94,"fileSource":28,"fileType":63,"ruDescription":2189,"ruTitle":2190},[],"66f3fcfe97dcce11c69cd8d7","Image that will be remixed.",[],"Изображение, которое будет ремикшировано.","Изображение для ремикса",{"fileTypes":2192,"fileSource":28,"_id":2193,"key":2194,"title":2195,"model":2137,"modelKey":2138,"tooltipContent":2196,"description":2196,"step":38,"max":65,"min":30,"valueType":44,"defaultValue":2080,"options":2197,"isRequired":12,"__v":30,"ruDescription":2198,"ruTitle":2199},[],"66f4014839bae7f26f0d4e2f","image_weight","Image weight","How much input image affects the generation.",[],"Насколько сильно входное изображение влияет на генерацию.","Вес изображения",[2201,2202,2203],"68a9d92be3ac04ad89b91fe5","68a9d92be3ac04ad89b91fe7","68a9d92be3ac04ad89b91fe9",278,[],"2024-09-25T11:56:59.599Z","2025-08-23T15:07:23.380Z","Создаёт фотореалистичные изображения с точной, читаемой встроенной текстовой графикой","Ideogram v1 — модель text-to-image, созданная для авторов, которым нужны высококачественные изображения с надёжно читаемым текстом. Она генерирует фотореалистичные или художественно выразительные картинки, точно исполняя длинные и детализированные подсказки, что позволяет быстро превращать идеи в готовые визуалы. Ключевая особенность — улучшенное отображение текста внутри изображений: Ideogram v1 значительно снижает количество ошибок при размещении слов, поэтому легко создавать плакаты, мемы, дизайны футболок, открытки, логотипы и макеты продуктов с разборчивой и уместной типографикой.\n\nМодель поддерживает высокое разрешение (до 2048×2048), множество фотографических и художественных стилей (более 25 пресетов) и разные соотношения сторон. Функция Magic Prompt помогает развить короткую идею в детальную подсказку, упрощая творчество и ускоряя итерации. Ideogram v1 также работает быстро — часто выдаёт результат за секунды — что делает её удобной для прототипирования, создания контента для соцсетей и маркетинга.\n\nПрактическая польза включает создание готовых к печати материалов, персонализированных товаров, брендовых активов с точной типографикой и бесшовных узоров для фонов и тканей. Встроенный редактор и сообщество на ideogram.ai облегчают доработку изображений и обмен идеями. У бесплатных пользователей есть ограничение на число генераций в день, и существуют более новые версии модели с улучшенными характеристиками; тем не менее Ideogram v1 остаётся отличным выбором, когда важны точность текста и визуальное качество.",{"aspect_ratio":2149,"magic_prompt_option":2100,"negative_prompt":163,"image_weight":2080},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":2212,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2213,"key":2214,"label":2215,"shortLabel":2216,"description":2217,"longDescription":2218,"generationCount":74,"type":63,"generationType":691,"generationTypes":2219,"api":2073,"settingConfigs":2220,"percs":2253,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":1227,"iconUrl":2124,"position":2258,"secondCost":30,"generationCost":719,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":2259,"__v":126,"createdAt":2260,"updatedAt":2261,"ruDescription":2262,"ruLongDescription":2263,"isAvailableAfterAuth":12,"configValue":2264},[63,64],"66f3fac4d6b04b0b2cda5c2d","V_1_TURBO","Ideogram v1 Tubro","Ideogram v1 Turbo","Generate images with clear, legible text — fast, affordable design tool","Ideogram v1 Turbo is an image-generation model optimized to produce fast, cost-effective visuals with especially strong text rendering. Built as a quicker, lower-cost variant of the original Ideogram v1, it shines where text clarity and typography matter: logos, posters, memes, social media graphics, and simple advertisements. Users can expect photorealistic imagery combined with contextually appropriate, legible text—solving a common pain point for many image models.\n\nThe model is tuned for speed and affordability, making it practical for hobbyists, small businesses, and designers who need rapid iteration without high compute costs. It’s available through user-friendly platforms (for example NightCafe), so beginners can produce professional-looking designs with minimal setup. Typical workflows include quick prototyping of marketing assets, creating text-forward visuals for campaigns, and generating visual concepts for presentations or product mockups.\n\nStrengths include reliably readable text inside images, good photorealistic detail for standard prompts, and significantly faster generation than the original Ideogram v1 at a lower per-image cost. Limitations are minor: text can occasionally contain small inaccuracies, and extremely complex or highly detailed prompts may produce less nuance than newer or larger models. Additionally, while great for non-commercial and small-scale projects, large commercial productions may benefit from higher-capacity models.\n\nPractically, Ideogram v1 Turbo helps end users move from idea to visual output quickly: create on-brand social posts, iterate logo concepts with embedded text, produce eye-catching posters, or generate meme templates without spending time correcting illegible type. Its balance of speed, cost, and text accuracy makes it a go-to tool for typography-focused image generation.",[691],[2221,2234,2241,2245,2249],{"fileTypes":2222,"_id":2223,"key":1264,"model":2213,"title":1265,"tooltipContent":2148,"defaultValue":2149,"isClearable":12,"options":2224,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1266},[],"66f400702f386b22b86a7a99",[2225,2226,2227,2228,2229,2230,2231,2232,2233],{"value":2149,"label":1272},{"value":2153,"label":2154},{"value":2156,"label":2157},{"value":2159,"label":1276},{"value":2161,"label":1274},{"value":2163,"label":1282},{"value":2165,"label":1284},{"value":2167,"label":1278},{"value":2169,"label":1280},{"fileTypes":2235,"_id":2236,"key":2096,"model":2213,"title":2097,"tooltipContent":2173,"defaultValue":2100,"isClearable":12,"options":2237,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":2111},[],"66f400702f386b22b86a7a9c",[2238,2239,2240],{"value":2100,"label":2103},{"value":2105,"label":2106},{"value":2108,"label":2109},{"fileTypes":2242,"_id":2243,"key":206,"title":207,"model":2181,"modelKey":2214,"tooltipContent":2182,"valueType":215,"defaultValue":163,"options":2244,"__v":30,"fileSource":28,"settingType":214,"ruTitle":1181},[],"66f3fac4d6b04b0b2cda5c32",[],{"fileTypes":2246,"_id":2247,"key":2115,"title":1259,"model":2213,"modelKey":2214,"tooltipContent":2187,"description":2187,"accept":92,"options":2248,"isRequired":12,"__v":30,"settingType":94,"fileSource":28,"fileType":63,"ruDescription":2189,"ruTitle":2190},[],"66f3fcfe97dcce11c69cd8da",[],{"fileTypes":2250,"fileSource":28,"_id":2251,"key":2194,"title":2195,"model":2213,"modelKey":2214,"tooltipContent":2196,"description":2196,"step":38,"max":65,"min":30,"valueType":44,"defaultValue":2080,"options":2252,"isRequired":12,"__v":30,"ruDescription":2198,"ruTitle":2199},[],"66f4014839bae7f26f0d4e32",[],[2254,2255,2256,2257],"68a9d961e3ac04ad89b91ff0","68a9d961e3ac04ad89b91ff2","68a9d961e3ac04ad89b91ff4","68a9d961e3ac04ad89b91ff6",288,[],"2024-09-25T11:57:56.627Z","2025-08-23T15:08:18.103Z","Создаёт изображения с чётким, разборчивым текстом — быстро и недорого","Ideogram v1 Turbo — это модель генерации изображений, оптимизированная для быстрого и экономичного создания визуалов с особенно качественной проработкой текста. Разработанная как более быстрая и доступная по стоимости версия оригинальной Ideogram v1, она особенно полезна там, где важны читаемость и типографика: логотипы, плакаты, мемы, графика для соцсетей и простые рекламные материалы. Модель совмещает фотореалистичную детальность с контекстно уместным и разборчивым текстом — решение типичной проблемы многих генеративных систем.\n\nМодель настроена на скорость и экономичность, что делает её удобной для хобби-проектов, малого бизнеса и дизайнеров, которым нужны быстрые итерации без высоких затрат на вычисления. Она доступна через удобные платформы (например, NightCafe), поэтому даже новички могут быстро получить визуалы профессионального уровня. Частые сценарии использования: быстрый прототипинг маркетинговых материалов, создание текстоцентричной графики для кампаний и генерация концептов для презентаций или мокапов продуктов.\n\nК сильным сторонам относятся надёжная читаемость текста в изображениях, хорошая фотореалистичная детализация для стандартных запросов и заметно более быстрая генерация по сравнению с оригинальной Ideogram v1 при меньшей стоимости за изображение. Ограничения: текст иногда может содержать незначительные неточности, а очень сложные или детализированные запросы могут дать менее нюансированный результат по сравнению с более новыми или мощными моделями. Для крупных коммерческих проектов иногда лучше подходят модели более высокой мощности.\n\nНа практике Ideogram v1 Turbo помогает быстро переходить от идеи к изображению: создавать фирменные посты в соцсетях, быстро пробовать варианты логотипов с встроенным текстом, формировать выразительные плакаты или шаблоны мемов без долгой правки текста. Баланс скорости, стоимости и точности текста делает модель удобным инструментом для задач, ориентированных на типографику.",{"aspect_ratio":2149,"magic_prompt_option":2100,"negative_prompt":163,"image_weight":2080},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":2266,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2267,"key":2268,"label":2269,"shortLabel":2269,"description":2270,"longDescription":2271,"generationCount":2272,"type":63,"generationType":691,"generationTypes":2273,"api":2073,"settingConfigs":2274,"percs":2330,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":2335,"iconUrl":2124,"position":2336,"secondCost":30,"generationCost":1297,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":2337,"__v":226,"createdAt":2338,"updatedAt":2339,"ruDescription":2340,"ruLongDescription":2341,"isAvailableAfterAuth":61,"configValue":2342},[63,64],"66f3f99d4f0f518fe9e8c1ac","V_2","Ideogram v2","Generate high-quality images from text; excellent text rendering","Ideogram v2 is a text-to-image model built to help creators, designers, and businesses produce high-quality visuals quickly and affordably. It converts text prompts into polished images with strong prompt adherence and unusually accurate on-image text rendering, making it a good fit for graphic design, branding, and typographic work. Users can choose from multiple built-in styles — Realistic, Design, 3D, and Anime — and control color palettes to match a specific aesthetic or brand identity. \n\nPractical features include Magic Prompt and Describe tools that expand simple ideas into detailed prompts and creative variations, accelerating ideation and reducing the time spent crafting technical prompts. The model also supports inpainting-like image modification workflows (as seen in similar ideogram models), allowing edits and refinements to existing images. Outputs are suitable for marketing materials, social media assets, book covers, concept art, product visualizations, and other content-creation needs. \n\nWhat makes Ideogram v2 valuable is its balance of image quality, text accuracy, and cost-effectiveness — it produces visuals that often approach photorealism while remaining easy to steer via prompt details and style controls. That said, users should be aware of limitations: extremely specific or highly technical details may not always render perfectly, and absolute photographic realism can vary by scene. For best results, use clear, descriptive prompts, leverage Magic Prompt to expand concepts, and apply style and palette controls to refine the output. Overall, Ideogram v2 is a versatile, user-friendly tool that speeds up visual production and helps non-experts and professionals alike create compelling imagery from text.",91,[691],[2275,2288,2295,2318,2322,2326],{"fileTypes":2276,"_id":2277,"key":1264,"model":2267,"title":1265,"tooltipContent":2148,"defaultValue":2149,"isClearable":12,"options":2278,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1266},[],"66f4009a2f386b22b86a8853",[2279,2280,2281,2282,2283,2284,2285,2286,2287],{"value":2149,"label":1272},{"value":2153,"label":2154},{"value":2156,"label":2157},{"value":2159,"label":1276},{"value":2161,"label":1274},{"value":2163,"label":1282},{"value":2165,"label":1284},{"value":2167,"label":1278},{"value":2169,"label":1280},{"fileTypes":2289,"_id":2290,"key":2096,"model":2267,"title":2097,"tooltipContent":2173,"defaultValue":2100,"isClearable":12,"options":2291,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":2111},[],"66f4009a2f386b22b86a8856",[2292,2293,2294],{"value":2100,"label":2103},{"value":2105,"label":2106},{"value":2108,"label":2109},{"fileTypes":2296,"_id":2297,"key":2298,"model":2267,"title":2299,"tooltipContent":2300,"defaultValue":2100,"isClearable":61,"options":2301,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1174},[],"66f4009b2f386b22b86a8859","style_type","Style Type","The style type to generate with; applicable for models V_2 and above.",[2302,2303,2306,2309,2312,2315],{"value":2100,"label":2103},{"value":2304,"label":2305},"GENERAL","General",{"value":2307,"label":2308},"REALISTIC","Realistic",{"value":2310,"label":2311},"DESIGN","Design",{"value":2313,"label":2314},"RENDER_3D","3D Render",{"value":2316,"label":2317},"ANIME","Anime",{"fileTypes":2319,"_id":2320,"key":206,"model":2267,"title":207,"tooltipContent":2182,"defaultValue":163,"options":2321,"settingType":214,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1181},[],"66f4009b2f386b22b86a885c",[],{"fileTypes":2323,"_id":2324,"key":2115,"title":1259,"model":2267,"modelKey":2268,"tooltipContent":2187,"description":2187,"accept":92,"options":2325,"isRequired":12,"__v":30,"fileSource":28,"settingType":94,"fileType":63,"ruDescription":2189,"ruTitle":2190},[],"66f3fcfe97dcce11c69cd8dd",[],{"fileTypes":2327,"_id":2328,"key":2194,"title":2195,"model":2267,"modelKey":2268,"tooltipContent":2196,"description":2196,"step":38,"max":65,"min":30,"valueType":44,"defaultValue":2080,"options":2329,"isRequired":12,"__v":30,"fileSource":28,"ruDescription":2198,"ruTitle":2199},[],"66f4014839bae7f26f0d4e35",[],[2331,2332,2333,2334],"68a9d8cfe3ac04ad89b91fd8","68a9d8cfe3ac04ad89b91fda","68a9d8cfe3ac04ad89b91fdc","68a9d8cfe3ac04ad89b91fde",320,267,[],"2024-09-25T11:53:01.611Z","2025-09-08T12:20:17.773Z","Создаёт качественные изображения из текста; отличная отрисовка текста","Ideogram v2 — это модель text-to-image, которая помогает авторам, дизайнерам и бизнесам быстро и экономично создавать качественные визуальные материалы. Она превращает текстовые подсказки в готовые изображения с высокой точностью следования запросу и особенно аккуратной отрисовкой текста в кадре, что важно для графического дизайна и работ с типографикой. Пользователи могут выбирать встроенные стили — Realistic, Design, 3D и Anime — а также управлять цветовой палитрой для соответствия эстетике или фирменному стилю.\n\nПрактичные функции включают инструменты Magic Prompt и Describe, которые развивают простые идеи в подробные подсказки и вариации, ускоряя процесс генерации и снижая потребность в сложных вручную составленных промптах. Модель поддерживает и возможности модификации изображений (inpainting-подобные операции), позволяя править и улучшать уже созданные картинки. Результаты подходят для маркетинга, постов в социальных сетях, обложек книг, концепт-артов и визуализаций продуктов.\n\nПреимущество Ideogram v2 — сочетание высокого качества изображений, точности в передаче текста и экономичности: модель часто даёт результаты, близкие к фотореалистичным, при этом её легко направлять через промпты и настройки стиля. Однако стоит учесть ограничения: очень специфичные или технические детали могут передаваться не идеально, а уровень фотореализма может варьироваться. Для лучших результатов используйте чёткие описания, применяйте Magic Prompt для расширения идей и регулируйте стиль и палитру для тонкой настройки. В целом Ideogram v2 — универсальный и удобный инструмент для быстрого создания выразительных изображений по тексту.",{"aspect_ratio":2149,"magic_prompt_option":2100,"style_type":2100,"negative_prompt":163,"image_weight":2080},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":2344,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2181,"key":2345,"label":2346,"shortLabel":2346,"description":2347,"longDescription":2348,"type":63,"generationType":691,"generationTypes":2349,"api":2073,"settingConfigs":2350,"percs":2393,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":795,"position":38,"secondCost":30,"generationCost":1394,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":2398,"createdAt":2401,"updatedAt":2402,"__v":40,"iconUrl":2124,"generationCount":2403,"websiteUrl":2404,"ruDescription":2405,"ruLongDescription":2406,"isInstantModel":12,"isGenerationTypeRequired":12,"isAvailableAfterAuth":12,"configValue":2407},[63,64],"V_2_TURBO","Ideogram v2 Turbo","Generate high-fidelity images from text with flexible style control","Ideogram v2 Turbo is a fast, flexible multimodal text-to-image model built for creators and teams who need high-quality, controllable visuals from simple prompts. It produces detailed, prompt-faithful images across multiple styles — Realistic, Design, 3D, and Anime — and supports image inputs, masks for selective inpainting, and random seeds for reproducible results. Practical controls like arbitrary aspect ratios (including panoramic or vertical extremes), color palette locking, and significantly improved in-image text rendering make it ideal for branding, marketing, and typography-heavy graphic design.\n\nThe model includes creative assistant tools — Magic Prompt and Describe — which generate rich prompt suggestions and explore variations from existing images, accelerating ideation and iteration. Turbo inference speeds let you iterate quickly in real-time workflows or produce large batches efficiently via the public API or iOS app. Users can rely on strong prompt adherence and high visual quality for posters, social content, product mockups, advertising concepts, and photorealistic illustrations where lifelike textures and human features are required.\n\nWhile photorealism has improved, very specialized real-world detail may still occasionally fall short of photographic perfection. Public generation limits and shared visibility of public images may affect privacy needs, and API pricing should be considered for high-volume deployments. Overall, Ideogram v2 Turbo balances quality, speed, and creative control, making it a practical choice for designers, marketers, and developers who want reproducible, style-consistent images with advanced editing and prompting tools.",[691],[2351,2364,2371,2381,2385,2389],{"fileTypes":2352,"_id":2353,"key":1264,"model":2181,"title":1265,"tooltipContent":2148,"defaultValue":2149,"isClearable":12,"options":2354,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1266},[],"66f2e91d04c45132a18198c9",[2355,2356,2357,2358,2359,2360,2361,2362,2363],{"value":2149,"label":1272},{"value":2153,"label":2154},{"value":2156,"label":2157},{"value":2159,"label":1276},{"value":2161,"label":1274},{"value":2163,"label":1282},{"value":2165,"label":1284},{"value":2167,"label":1278},{"value":2169,"label":1280},{"fileTypes":2365,"_id":2366,"key":2096,"model":2181,"title":2097,"tooltipContent":2173,"defaultValue":2100,"isClearable":12,"options":2367,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":2111},[],"66f2e91d04c45132a18198cb",[2368,2369,2370],{"value":2100,"label":2103},{"value":2105,"label":2106},{"value":2108,"label":2109},{"fileTypes":2372,"_id":2373,"key":2298,"model":2181,"title":2299,"tooltipContent":2300,"defaultValue":163,"isClearable":12,"options":2374,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1174},[],"66f2e91d04c45132a18198cd",[2375,2376,2377,2378,2379,2380],{"value":2100,"label":2103},{"value":2304,"label":2305},{"value":2307,"label":2308},{"value":2310,"label":2311},{"value":2313,"label":2314},{"value":2316,"label":2317},{"fileTypes":2382,"_id":2383,"key":206,"model":2181,"title":207,"tooltipContent":2182,"defaultValue":163,"options":2384,"settingType":214,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1181},[],"66f2e91d04c45132a18198cf",[],{"fileTypes":2386,"_id":2387,"key":2115,"title":1259,"model":2181,"modelKey":2345,"tooltipContent":2187,"description":2187,"accept":92,"options":2388,"isRequired":12,"__v":30,"fileSource":28,"fileType":63,"settingType":94,"ruDescription":2189,"ruTitle":2190},[],"66f3fcfe97dcce11c69cd8e0",[],{"fileTypes":2390,"_id":2391,"key":2194,"title":2195,"model":2181,"modelKey":2345,"tooltipContent":2196,"description":2196,"step":38,"max":65,"min":30,"valueType":44,"defaultValue":2080,"options":2392,"isRequired":12,"__v":30,"fileSource":28,"ruDescription":2198,"ruTitle":2199},[],"66f4014839bae7f26f0d4e38",[],[2394,2395,2396,2397],"68a9d8a5e3ac04ad89b91fcb","68a9d8a5e3ac04ad89b91fcd","68a9d8a5e3ac04ad89b91fcf","68a9d8a5e3ac04ad89b91fd1",[2399,2400],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-examples/66f2e91d04c45132a18198c7/optimized_601886074178.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-examples/66f2e91d04c45132a18198c7/optimized_638861418376.webp","2024-09-24T16:30:21.221Z","2025-09-04T00:53:28.208Z",203,"https://ideogram.ai/","Создавайте высококачественные изображения по тексту с гибкими стилями","Ideogram v2 Turbo — быстрый и гибкий мультимодальный текст–в–изображение модель, предназначенная для создателей и команд, которым нужны качественные и управляемые визуалы по простым подсказкам. Модель генерирует детализированные и соответствующие промпту изображения в разных стилях — реалистичном, дизайнерском, 3D и аниме — поддерживает входные изображения, маски для избирательной докраски и случайные seed’ы для воспроизводимости. Практичные настройки, такие как произвольные соотношения сторон (включая панорамные и вертикальные форматы), фиксация цветовой палитры и существенно улучшенная отрисовка текста внутри картинок, делают модель идеальной для брендинга, маркетинга и задач с типографикой.\n\nВ комплекте есть инструменты творческой помощи — Magic Prompt и Describe — которые генерируют подробные подсказки и варианты на основе существующих изображений, что ускоряет генерацию идей и итерации. Turbo-режим обеспечивает высокую скорость вывода, позволяя быстро экспериментировать в реальном времени или обрабатывать большие партии через публичный API или iOS-приложение. Пользователи получают надежное соответствие промпту и высокое качество для постеров, контента в соцсетях, макетов продуктов, рекламных концепций и фотореалистичных иллюстраций с естественными текстурами и чертами людей.\n\nХотя фотореализм улучшен, в рекордно точных деталях реального мира модель иногда может не достичь абсолютной фотогеничности. Ограничения публичной генерации и видимость публичных изображений могут повлиять на требования к приватности, а стоимость API стоит учесть при больших объёмах. В целом Ideogram v2 Turbo сочетает качество, скорость и творческий контроль, делая его практичным решением для дизайнеров, маркетологов и разработчиков.",{"aspect_ratio":2149,"magic_prompt_option":2100,"style_type":163,"negative_prompt":163,"image_weight":2080},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":2409,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2410,"key":2411,"label":2412,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":83,"generationTypes":2413,"api":85,"settingConfigs":2414,"isAdminModel":12,"isPromptRequired":12,"replicateId":2433,"cost":40,"iconUrl":2434,"previewImageUrl":2435,"bannerImageUrl":2436,"description":2437,"secondCost":1123,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":71,"generationCount":2438,"githubUrl":2439,"licenseUrl":2440,"position":879,"examples":2441,"isBanned":12,"isOutdated":12,"percs":2442,"updatedAt":2447,"createdAt":2448,"releaseDate":2449,"longDescription":2450,"ruDescription":2451,"ruLongDescription":2452,"isInstantModel":12,"isGenerationTypeRequired":12,"isUpscaler":61,"isAvailableAfterAuth":12,"replicateApiType":117,"configValue":2453},[63,64],"65e9cb9344f732690cf927d5","nightmareai/real-esrgan","Image Upscaler",[83],[2415,2423],{"fileTypes":2416,"_id":2417,"key":63,"model":2410,"title":2418,"tooltipContent":2419,"defaultValue":163,"options":2420,"settingType":94,"fileType":63,"isRequired":61,"__v":30,"step":38,"accept":92,"fileSource":28,"description":2419,"ruDescription":2421,"ruTitle":2422},[],"65e9cb9344f732690cf927d7","Image to upscale","Match the style of your own reference image",[],"Соответствуйте стилю вашего собственного эталонного изображения","Увеличение изображения",{"fileTypes":2424,"_id":2425,"key":2426,"model":2410,"title":2427,"tooltipContent":2428,"step":38,"max":40,"min":30,"defaultValue":2429,"options":2430,"settingType":43,"fileType":63,"isRequired":61,"__v":30,"valueType":44,"fileSource":28,"description":2428,"ruDescription":2431,"ruTitle":2432},[],"65e9cb9344f732690cf927d9","scale","Scale","Shows how much the image size changes","4",[],"Показывает, насколько сильно изменяется размер изображения","Лестницы","nightmareai/real-esrgan:42fed1c4974146d4d2414e2be2c5277c7fcf05fcc3a73abf41610695738c1d7b","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/upscaler.svg","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/upscaler-esrgan-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/upscaler-esrgan-banner.png","Upscale and restore images with AI for sharper, print-ready results",325,"https://github.com/NightmareAI/Real-ESRGAN","https://github.com/NightmareAI/Real-ESRGAN/blob/master/LICENSE",[],[2443,2444,2445,2446],"68a9d588e3ac04ad89b91efa","68a9d589e3ac04ad89b91efc","68a9d589e3ac04ad89b91efe","68a9d589e3ac04ad89b91f00","2025-08-23T14:51:53.250Z","2024-09-11T09:38:51.408Z","2021-07-21T09:39:00.000Z","Image Upscaler is an AI-powered tool that enlarges photos and graphics while restoring lost detail, producing sharp, natural-looking results suitable for print and high-resolution displays. Built on proven real-world super-resolution approaches (Real-ESRGAN and similar methods), the model intelligently fills in missing textures, edges, and fine features that traditional interpolation methods cannot recover. Users can upscale by common factors (2×, 4× and even up to 8×) to generate outputs appropriate for 4K displays, large prints, product listings, and archival restoration. \n\nThe upscaler runs automatically with minimal user input — simply provide an image and choose the scale — making it accessible to photographers, designers, e-commerce teams, content creators, and hobbyists. It excels at recovering detail from mildly compressed, noisy, or small originals, sharpening faces, textiles, architectural lines, and other fine structures while avoiding the blockiness and blur typical of classic resampling. Processing is fast on modern GPUs and optimized cloud services, often completing in seconds to minutes depending on size and scale. \n\nPractical uses include preparing photos for large-format printing, improving product imagery for online stores, restoring old family photos or scanned media, and enhancing game or video textures for higher-resolution displays. The model balances quality and speed, and is available in web tools, desktop software, and integrations for image workflows. \n\nLimitations: extremely low-quality or heavily corrupted images may not fully recover all original information, and aggressive upscaling can sometimes introduce artificial textures. The AI predicts plausible detail based on learned patterns rather than reproducing lost originals exactly. Overall, Image Upscaler offers a reliable, user-friendly way to achieve high-quality enlargements beyond traditional resizing.","Увеличение и восстановление изображений ИИ для чёткой печати","Image Upscaler — инструмент на базе ИИ, который увеличивает фотографии и графику, одновременно восстанавливая утерянные детали и давая чёткие, естественные результаты, пригодные для печати и для дисплеев высокого разрешения. Основанный на проверенных методах сверхразрешения (Real-ESRGAN и аналогичных), модель интеллектуально заполняет недостающие текстуры, контуры и мелкие элементы, которых не способны вернуть традиционные методы интерполяции. Пользователи могут увеличивать изображение в 2×, 4× и даже до 8×, получая выходы, подходящие для 4K, больших отпечатков, карточек товаров и архивного восстановления. \n\nМодель работает автоматически и требует минимального вмешательства — достаточно загрузить изображение и выбрать масштаб, что делает её доступной для фотографов, дизайнеров, команд e‑commerce, контент-мейкеров и любителей. Она хорошо восстанавливает детали из слегка сжатых, шумных или мелких исходников: улучшает лица, текстуры тканей, архитектурные линии и другие тонкие структуры, избегая размытости и «квадратности», характерных для классического масштабирования. Обработка быстрая на современных GPU и в облаке — от нескольких секунд до минут в зависимости от размера и выбранного масштаба. \n\nПрактические применения включают подготовку фото для крупноформатной печати, улучшение товарных изображений для интернет-магазинов, восстановление старых семейных снимков или сканов и улучшение текстур в играх и видео для дисплеев с высоким разрешением. Ограничения: при крайне низком качестве или сильных повреждениях полностью восстановить исходные данные невозможно, а агрессивное увеличение иногда приводит к появлению искусственных текстур. ИИ генерирует правдоподобные детали на основе изученных закономерностей, но не воспроизводит утраченные пиксели по‑настоящему. В целом Image Upscaler — надёжный и удобный способ получить качественное увеличение изображения по сравнению с классическими методами.",{"image":163,"scale":2429},{"outputPath":7,"_id":2455,"key":2456,"label":2457,"contextCapacity":82,"maxTokens":65,"type":63,"generationTypes":2458,"api":85,"settingConfigs":2459,"isAdminModel":12,"replicateId":2477,"cost":177,"__v":71,"previewImageUrl":2478,"generationType":83,"bannerImageUrl":2479,"generationCount":2480,"description":2481,"generationCost":30,"iconUrl":2482,"inputTokenCost":30,"isPromptRequired":61,"outputTokenCost":30,"secondCost":1221,"stepPrice":30,"githubUrl":2483,"licenseUrl":2484,"position":2485,"createdAt":2486,"examples":2487,"isBanned":12,"isOutdated":12,"longDescription":2488,"percs":2489,"updatedAt":2493,"shortLabel":2494,"ruDescription":2495,"ruLongDescription":2496,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":2497,"tokenStrategy":67,"isAvailableAfterAuth":12,"replicateApiType":117,"configValue":2498},"65cd1f244bee8b0d0b28bbbb","zsxkib/instant-id","Instant ID",[429],[2460,2468],{"fileTypes":2461,"_id":2462,"key":63,"model":2455,"title":2463,"tooltipContent":2464,"step":38,"options":2465,"settingType":94,"fileType":63,"__v":30,"accept":92,"fileSource":28,"isRequired":61,"description":2464,"ruDescription":2466,"ruTitle":2467},[],"65cd1f244bee8b0d0b28bbbd","Input face image","Image with a face that will be altered based on your prompt",[],"Изображение с лицом, которое будет изменено в соответствии с вашей подсказкой","Входное изображение лица",{"fileTypes":2469,"_id":2470,"key":2471,"model":2455,"title":2472,"step":38,"options":2473,"settingType":94,"fileType":63,"__v":30,"accept":92,"fileSource":28,"tooltipContent":2474,"description":2474,"ruDescription":2475,"ruTitle":2476},[],"65cd1f244bee8b0d0b28bbbf","pose_image","Pose image",[],"image with a pose that you want to replicate in your generation","изображение с позой, которую вы хотите повторить в своем поколении","Изображение позы","zsxkib/instant-id:6af8583c541261472e92155d87bba80d5ad98461665802f2ba196ac099aaedc9","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/instant-id-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/instant-id-banner.png",79,"Zero-shot identity-preserving image generation from one face","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/instant-id.svg","https://github.com/zsxkib/InstantID","https://github.com/zsxkib/InstantID/blob/main/LICENSE",235,"2024-09-13T14:29:03.674Z",[],"InstantID is a fast, tuning-free model that generates high-fidelity images that preserve a subject’s identity using only a single reference face photo. Without fine-tuning or multiple examples, InstantID extracts identity cues in a single forward pass and produces realistic or stylized outputs while allowing users to change pose, style, or scene with an optional text prompt or pose reference. Because it functions as a lightweight adapter for popular diffusion models (e.g., Stable Diffusion 1.5 and SDXL) and works with ControlNets, InstantID integrates smoothly into existing text-to-image pipelines and community workflows.\n\nPractical benefits for end users include rapid generation (images produced in seconds), strong identity fidelity even from a single input image, and flexible editing — swap hairstyles, alter expressions, place the person in different styles or artistic treatments, or guide composition with a pose reference. Creators can make personalized avatars, stylized portraits, marketing images, or in-game assets without collecting large datasets or waiting for model fine-tuning. Because InstantID is tuning-free and lightweight, it is resource-efficient and simple to deploy for one-off edits or interactive workflows.\n\nLimitations: InstantID is optimized for single-person facial images and performs best with clear, well-lit input photos and descriptive prompts. It may be less suitable for group photos or non-facial image tasks, and, as a newer approach, community resources and prebuilt checkpoints are less abundant than for long-established models. Overall, InstantID is ideal for anyone who needs quick, realistic, identity-preserving image synthesis from a single photo — whether for content creation, editing, or rapid prototyping.",[2490,2491,2492],"68a9d39be3ac04ad89b91ea9","68a9d39be3ac04ad89b91eab","68a9d39be3ac04ad89b91ead","2025-08-23T14:43:39.886Z","InstantID","Нулевая адаптация: генерация изображений с сохранением личности по одной фотографии","InstantID — быстрый и не требующий дообучения модельный модуль, который генерирует высококачественные изображения, сохраняющие идентичность человека по одной референсной фотографии. Без необходимости в дообучении или множестве примеров InstantID извлекает черты личности за один проход и создаёт реалистичные или стилизованные результаты, позволяя пользователю менять позу, стиль или окружение с помощью текстового промпта или референса позы. Плагин-архитектура обеспечивает совместимость с популярными диффузионными моделями (например, Stable Diffusion 1.5 и SDXL) и ControlNet, что упрощает интеграцию в существующие пайплайны и рабочие процессы.\n\nПрактические преимущества для пользователей включают быструю генерацию (результат за секунды), высокую точность сохранения личности даже с одной фотографии и гибкие инструменты редактирования — смена причёски, выражения лица, применение художественных стилей или управление композицией через референс позы. Создатели контента могут быстро получать персонализированные аватары, стилизованные портреты, изображения для маркетинга или игровые ассеты без сбора больших наборов данных и ожидания длительного дообучения. Благодаря лёгкости и отсутствии дообучения InstantID экономичен в ресурсах и прост в развёртывании для одноразовых правок или интерактивных сценариев.\n\nОграничения: InstantID оптимизирован для одиночных лицевых изображений и лучше работает с качественными, хорошо освещёнными фотографиями и точными промптами. Меньше подходит для групповых снимков или задач вне области лица; кроме того, у метода пока может быть меньше готовых чекпойнтов и поддержки сообщества по сравнению с устоявшимися моделями. В целом, InstantID отлично подходит тем, кому нужна быстрая, реалистичная генерация и редактирование изображений с сохранением личности по одной фотографии — для создания контента, редактирования и быстрой прототипизации.",[63,64],{},{"_id":2500,"key":2501,"label":2502,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":83,"generationTypes":2503,"api":85,"settingConfigs":2504,"isAdminModel":12,"isPromptRequired":61,"replicateId":2547,"cost":478,"description":2548,"__v":126,"generationCount":2549,"bannerImageUrl":2550,"previewImageUrl":2551,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"secondCost":2552,"stepPrice":30,"iconUrl":2553,"position":2554,"examples":2555,"isBanned":12,"isOutdated":12,"percs":2556,"updatedAt":2560,"createdAt":2561,"websiteUrl":2562,"githubUrl":2563,"licenseUrl":2564,"releaseDate":2565,"longDescription":2566,"ruDescription":2567,"ruLongDescription":2568,"isGenerationTypeRequired":12,"isInstantModel":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":117,"supportFiles":12,"supportedFileTypes":2569,"tokenStrategy":67,"configValue":2570},"65d390451efd1391240f0ad5","timothybrooks/instruct-pix2pix","Instruct pix2pix",[83],[2505,2510,2516,2524,2532],{"fileTypes":2506,"_id":2507,"key":63,"model":2500,"title":90,"tooltipContent":1443,"step":38,"options":2508,"settingType":94,"fileType":63,"isRequired":61,"__v":30,"accept":92,"fileSource":28,"description":1443,"ruDescription":2509,"ruTitle":96},[],"65d390451efd1391240f0ad7",[],"Изображение для редактирования",{"fileTypes":2511,"_id":2512,"key":206,"model":2500,"title":207,"tooltipContent":2513,"accept":92,"step":38,"options":2514,"settingType":214,"fileType":63,"__v":30,"fileSource":28,"description":2513,"ruDescription":2515,"ruTitle":1181},[],"65d390451efd1391240f0ad9","Type what you do not want to see in the generation",[],"Введите то, что вы не хотите видеть в генерации",{"fileTypes":2517,"_id":2518,"key":306,"model":2500,"title":307,"tooltipContent":2519,"step":38,"max":806,"min":38,"costMultiplier":327,"defaultValue":2520,"isAdvanced":61,"options":2521,"settingType":43,"__v":30,"fileSource":28,"valueType":44,"description":2519,"ruDescription":2522,"ruTitle":2523},[],"65d390451efd1391240f0adb","Number of denoising steps","100",[],"Количество шагов обесцвечивания","Шаги умозаключения",{"fileTypes":2525,"_id":2526,"key":1385,"model":2500,"title":1386,"tooltipContent":2527,"step":38,"max":817,"min":38,"defaultValue":2528,"isAdvanced":61,"options":2529,"settingType":43,"__v":30,"fileSource":28,"valueType":44,"description":2527,"ruDescription":2530,"ruTitle":2531},[],"65d390451efd1391240f0add","Prompt alignment","7.5",[],"Оперативное выравнивание","Руководящая шкала",{"fileTypes":2533,"_id":2534,"key":286,"model":2500,"title":287,"tooltipContent":163,"step":38,"defaultValue":2535,"isAdvanced":61,"options":2536,"settingType":282,"__v":30,"fileSource":28,"description":163,"ruTitle":290},[],"65d390451efd1391240f0adf","K_EULER",[2537,2538,2539,2541,2543,2545],{"label":300,"value":300},{"label":2535,"value":2535},{"label":2540,"value":2540},"DPMSolverMultistep",{"label":2542,"value":2542},"K_EULER_ANCESTRAL",{"label":2544,"value":2544},"PNDM",{"label":2546,"value":2546},"KLMS","timothybrooks/instruct-pix2pix:30c1d0b916a6f8efce20493f5d61ee27491ab2a60437c13c588468b9810ec23f","Text-guided image editor — fast, precise image-to-image edits",82,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/instruct-pix2pix-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/instruct-pix2pix-preview.png",0.00115,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/pix-2-pix.svg",767,[],[2557,2558,2559],"68a9d4e8e3ac04ad89b91ed7","68a9d4e8e3ac04ad89b91ed9","68a9d4e8e3ac04ad89b91edb","2025-09-03T21:03:05.120Z","2024-09-11T10:05:35.378Z","https://www.timothybrooks.com/instruct-pix2pix","https://github.com/timothybrooks/instruct-pix2pix","https://github.com/timothybrooks/instruct-pix2pix?tab=License-1-ov-file","2021-12-21T10:06:00.000Z","Instruct Pix2pix is a user-friendly image editing model that transforms photos and artwork according to plain-language instructions. Provide an input image and a short directive (for example, “turn the horse into a dragon,” “add a red hat,” or “make background foggy”), and the model edits only the requested parts while keeping the rest of the image intact. Because it performs edits in a single pass without per-image fine-tuning or inversion, Instruct Pix2pix delivers results in seconds, making it practical for interactive workflows and batch processing alike. Its strengths include high fidelity to the original image structure, precise adherence to text instructions when they are clear, and support for a wide variety of edits — from subtle retouches (color changes, accessories, small object removals) to dramatic transformations (changing subjects, styles, or backgrounds). This makes the model valuable for graphic designers, marketers, filmmakers, and casual users who want rapid, text-driven changes without deep editing skills. Integration-friendly deployment options (used in tools and community interfaces) let teams slot it into content pipelines or creative apps easily. Be mindful that output quality depends on the clarity and specificity of the instructions: vague prompts may lead to ambiguous edits. Also, like all trained models, its behavior reflects the patterns and biases present in its training data and may struggle with very abstract or highly complex scene understanding. Overall, Instruct Pix2pix offers a fast, accessible way to iterate on visual ideas and create targeted image variants with minimal effort.","Редактор изображений по тексту — быстрые, точные преобразования изображений","Instruct Pix2pix — удобная модель для редактирования изображений по простым текстовым командам. Пользователь загружает исходную картинку и даёт указание (например, «преврати лошадь в дракона», «добавь красную шляпу» или «сделай фон туманным»), и модель изменяет только указанные элементы, сохраняя остальную часть изображения без изменений. Поскольку правки выполняются за один проход и не требуют тонкой донастройки под каждое изображение, Instruct Pix2pix выдаёт результаты за секунды, что удобно для интерактивной работы и пакетной обработки. Модель хорошо сохраняет структуру исходной сцены и точно следует понятным текстовым инструкциям; она подходит для лёгких ретушей (изменение цвета, добавление аксессуаров, удаление мелких объектов) и для более драматических преобразований (смена объектов, стиля или фона). Это делает её полезной для графических дизайнеров, маркетологов, кинематографистов и обычных пользователей, которым нужны быстрые текстовые правки без глубоких навыков редактирования. Возможности интеграции позволяют встроить модель в рабочие конвейеры и приложения. Следует учитывать, что качество результата сильно зависит от ясности запроса: расплывчатые инструкции могут приводить к непредсказуемым изменениям. Также, как и у других моделей, поведение отражает особенности и ограничения обучающих данных и может испытывать трудности с очень абстрактными или сложными сценами. В целом Instruct Pix2pix обеспечивает быстрый и доступный способ итераций над визуальными идеями и создания целевых вариантов изображений.",[63,64],{"num_inference_steps":2520,"guidance_scale":2528,"scheduler":2535},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":2572,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2573,"key":2574,"label":2575,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"generationTypes":2576,"api":85,"settingConfigs":2577,"isAdminModel":12,"isPromptRequired":61,"replicateId":2650,"cost":408,"description":2651,"__v":226,"generationCount":2652,"bannerImageUrl":2653,"previewImageUrl":2654,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"secondCost":2552,"stepPrice":30,"iconUrl":2655,"githubUrl":2656,"licenseUrl":2657,"position":2658,"createdAt":107,"examples":2659,"isBanned":12,"isOutdated":12,"longDescription":2660,"percs":2661,"updatedAt":2665,"ruDescription":2666,"ruLongDescription":2667,"isAvailableAfterAuth":12,"replicateApiType":117,"configValue":2668},[63,64],"65d3866109bb7a2911b0602e","ai-forever/kandinsky-2.2","Kandinskiy 2.2",[691],[2578,2584,2614,2635,2640],{"fileTypes":2579,"_id":2580,"key":206,"model":2573,"title":207,"tooltipContent":2581,"step":38,"options":2582,"settingType":214,"__v":30,"fileSource":28,"description":2581,"ruDescription":2583,"ruTitle":1181},[],"65d3866109bb7a2911b06030","Things you don't want to see in the output",[],"То, что вы не хотите видеть в выходных данных",{"fileTypes":2585,"_id":2586,"key":2587,"model":2573,"title":2588,"tooltipContent":163,"step":38,"costMultiplier":327,"defaultValue":1787,"options":2589,"settingType":282,"fileType":63,"isRequired":61,"__v":30,"fileSource":28,"description":163,"ruTitle":2613},[],"65d3866109bb7a2911b06032","width","Width",[2590,2592,2594,2596,2598,2600,2602,2603,2605,2607,2609,2611],{"label":2591,"value":2591},"384",{"label":2593,"value":2593},"512",{"label":2595,"value":2595},"576",{"label":2597,"value":2597},"640",{"label":2599,"value":2599},"704",{"label":2601,"value":2601},"960",{"label":1787,"value":1787},{"label":2604,"value":2604},"1152",{"label":2606,"value":2606},"1280",{"label":2608,"value":2608},"1536",{"label":2610,"value":2610},"1792",{"label":2612,"value":2612},"2048","Ширина",{"fileTypes":2615,"_id":2616,"key":2617,"model":2573,"title":2618,"step":38,"options":2619,"__v":30,"settingType":282,"defaultValue":1787,"fileSource":28,"ruTitle":2634},[],"65d3866209bb7a2911b06034","height","Height",[2620,2621,2622,2623,2624,2625,2627,2628,2629,2630,2631,2632,2633],{"label":2591,"value":2591},{"label":2593,"value":2593},{"label":2595,"value":2595},{"label":2597,"value":2597},{"label":2599,"value":2599},{"label":2626,"value":2626},"768",{"label":2601,"value":2601},{"label":1787,"value":1787},{"label":2604,"value":2604},{"label":2606,"value":2606},{"label":2608,"value":2608},{"label":2610,"value":2610},{"label":2612,"value":2612},"Высота",{"fileTypes":2636,"_id":2637,"key":306,"model":2573,"title":307,"tooltipContent":2519,"step":38,"max":806,"min":38,"options":2638,"settingType":43,"__v":30,"isAdvanced":61,"defaultValue":2639,"fileSource":28,"fileType":63,"isRequired":61,"valueType":44,"description":2519,"ruDescription":2522,"ruTitle":2523},[],"65d38b041efd1391240ea2e3",[],"75",{"fileTypes":2641,"_id":2642,"key":2643,"model":2573,"title":2644,"tooltipContent":2645,"step":38,"max":806,"min":38,"isAdvanced":61,"options":2646,"settingType":43,"__v":30,"defaultValue":2647,"fileSource":28,"valueType":44,"description":2645,"ruDescription":2648,"ruTitle":2649},[],"65d38b741efd1391240ea2fe","num_inference_steps_prior","Inference Steps Prior","Number of inference steps for prior",[],"25","Количество шагов вывода для предварительного","Шаги умозаключения Предварительный","ai-forever/kandinsky-2.2:ea1addaab376f4dc227f5368bbd8eff901820fd1cc14ed8cad63b29249e9d463","Generate photorealistic images from text, edit and blend images",154,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/kandinsky-2.2-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/kandinsky-2.2-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/Kandinsky-2.2.png","https://github.com/chenxwh/Kandinsky-2/tree/v2.2","https://github.com/ai-forever/Kandinsky-2/blob/main/license",756,[],"Kandinsky 2.2 is an open-source text-to-image model that produces high-resolution, photorealistic and stylized images from natural language prompts while also supporting guided image editing and blending. It delivers detailed textures, realistic lighting and fine detail up to 1024×1024, making it suitable for portraits, landscapes, cityscapes, fantasy concepts and abstract art. Improved text–image alignment helps the model follow complex instructions and yield consistent results across varied prompts. \n\nBeyond standard text-to-image generation, Kandinsky 2.2 offers text-guided image manipulation: you can inpaint, extend, or alter parts of an existing photo by describing changes in words. The model also supports image interpolation and morphing between sources, letting you create hybrid visuals or smooth transitions guided by text. Integration with ControlNet gives precise control over composition—condition generation on sketches, edge maps or other structural inputs—to produce repeatable, layout-driven outputs that are valuable for concept artists, illustrators and designers. \n\nPractically, Kandinsky 2.2 is useful for rapid prototyping in advertising, game and film concepting, portrait and landscape generation, and image restoration or creative recomposition. Its open-source, permissive licensing enables customization and integration into research and commercial pipelines. Note that high-quality and high-resolution outputs require significant GPU resources, and the model can reflect dataset biases or occasionally produce artifacts. Overall, Kandinsky 2.2 balances realism, controllability and versatility, offering creatives and researchers a powerful tool for generating and editing images from text prompts.",[2662,2663,2664],"68a9d4b1e3ac04ad89b91ecc","68a9d4b1e3ac04ad89b91ece","68a9d4b1e3ac04ad89b91ed0","2025-08-23T14:48:17.933Z","Генерирует фотореалистичные изображения по тексту, редактирует и смешивает изображения","Kandinsky 2.2 — это открытая модель «текст-в-изображение», которая создаёт высокоразрешённые фотореалистичные и стилизованные изображения по естественным текстовым запросам, а также поддерживает управляемое редактирование и смешивание изображений. Модель выдаёт детализированные текстуры, реалистичное освещение и мелкие детали до 1024×1024, поэтому хорошо подходит для портретов, пейзажей, городских видов, фантастических концепций и абстрактного искусства. Улучшенное соответствие текста и изображения помогает точнее выполнять сложные инструкции. \n\nКроме генерации из текста, Kandinsky 2.2 умеет текст‑управляемое редактирование: вы можете дорисовывать, восстанавливать или изменять части существующей фотографии, описав изменения словами. Также доступна интерполяция изображений и плавное смешивание источников для создания гибридных визуалов. Интеграция с ControlNet обеспечивает точный контроль композиции — привязку к эскизам, картам границ или другим структурным входам, что делает модель удобной для концепт‑артистов, иллюстраторов и дизайнеров. \n\nПрактическое применение включает быстрый прототипинг в рекламе, игровом и кино‑дизайне, создание портретов и пейзажей, а также реставрацию и креативную переработку фотографий. Открытая и разрешающая лицензия даёт возможность настраивать и интегрировать модель в научные и коммерческие проекты. Учтите, что генерация высокого качества и разрешения требует мощного GPU, а модель может отражать предвзятости данных и иногда давать артефакты. В целом Kandinsky 2.2 сочетает реализм, управляемость и универсальность, предлагая мощный инструмент для генерации и редактирования изображений по текстовым подсказкам.",{"width":1787,"height":1787,"num_inference_steps":2639,"num_inference_steps_prior":2647},{"_id":2670,"key":2671,"label":2672,"description":2673,"isInstantModel":12,"type":2674,"generationType":2675,"generationTypes":2676,"api":17,"settingConfigs":2678,"percs":2714,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":12,"cost":795,"position":879,"secondCost":30,"generationCost":2719,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":2720,"createdAt":2721,"updatedAt":2722,"__v":2723,"isGenerationTypeRequired":61,"generationCount":2724,"iconUrl":2725,"shortLabel":2726,"isAvailableAfterAuth":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":6,"ruLongDescription":2727,"supportFiles":12,"supportedFileTypes":2728,"tokenStrategy":67,"longDescription":2729,"ruDescription":2730,"configValue":2731},"672e8ad94f14d933235793df","fal-ai/kling-video/v1","Kling.io","Generate cinematic 1080p videos from text or images (up to 2min)","video","text-to-video",[2677],"image-to-video",[2679,2684,2697,2706],{"_id":2680,"key":1373,"model":2670,"title":398,"tooltipContent":2681,"options":2682,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":12,"valueType":215,"__v":30,"accept":92,"fileTypes":2683},"672e8ad94f14d933235793e1","Reference image for video generation",[],[],{"_id":2685,"key":2686,"model":2670,"title":2687,"tooltipContent":2688,"defaultValue":2689,"options":2690,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":2696},"672e8ad94f14d933235793e3","tier","Tier","Select the tier for video generation","standard",[2691,2694],{"value":2692,"label":2693},"pro","Pro",{"value":2689,"label":2695},"Standard",[],{"_id":2698,"key":35,"model":2670,"title":36,"tooltipContent":2699,"defaultValue":864,"options":2700,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":2705},"672e8ad94f14d933235793e5","The duration of the generated video in seconds",[2701,2703],{"value":864,"label":2702},"5 seconds",{"value":841,"label":2704},"10 seconds",[],{"_id":2707,"key":1264,"model":2670,"title":1265,"tooltipContent":2708,"defaultValue":1274,"options":2709,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":2713},"672e8ad94f14d933235793e7","The aspect ratio of the generated video frame",[2710,2711,2712],{"value":1274,"label":1274},{"value":1276,"label":1276},{"value":1272,"label":1272},[],[2715,2716,2717,2718],"68a9dadce3ac04ad89b9204e","68a9dadde3ac04ad89b92050","68a9dadde3ac04ad89b92052","68a9dadde3ac04ad89b92054",0.03,[],"2024-11-08T22:04:09.275Z","2025-08-26T19:45:01.738Z",7,115,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/kling.png","kling","Kling.io — платформа на базе ИИ, превращающая текстовые подсказки и статичные изображения в кинематографичные реалистичные видео в формате Full HD (1080p) с частотой 30 FPS. В отличие от многих генераторов коротких роликов, Kling поддерживает расширенные длительности — до двух минут — что позволяет создавать короткометражки, демонстрации продуктов, рекламные ролики и сюжетные сцены без склейки множества фрагментов. Платформа также анимирует фотографии, добавляя естественное движение, глубину и кинематографический поток, что оживляет концепт-арт, портреты и статику.\n\nКлючевые преимущества: поддержка кастомных моделей лица для гиперреалистичных персонализированных видео; расширенный контроль движения (Motion Brush и физически правдоподобная динамика) для плавных и естественных анимаций; высокая согласованность персонажей и объектов во времени, благодаря чему внешность сохраняется на протяжении всего ролика. Кинематографические эффекты камеры — зумы, смены угла и переходы — и гибкие соотношения сторон (16:9, 9:16, 1:1) помогают адаптировать контент под YouTube, TikTok, Instagram и другие платформы. Облачный рендеринг обеспечивает быструю генерацию без мощного локального железа.\n\nKling предоставляет API (Kling 1.6 Pro) для интеграции в рабочие процессы с настраиваемыми параметрами (степень соответствия подсказке, соотношение сторон, «негативные» подсказки); текущая коммерческая версия API ориентирована на более короткие клипы (обычно 5–10 секунд), тогда как более длинные видео доступны в продвинутых вариантах. Сервис лицензируется для коммерческого использования и сопровождается этическими правилами.\n\nПрактическая польза: маркетологи и авторы могут быстро получать готовые промо и соцконтент; преподаватели и сказочники — превращать сценарии и изображения в киноматериал; специалисты развлечений — прототипировать реалистичные сцены. Ограничения: зависимость от интернета/облака, возможные расходы и редкие артефакты генерации, характерные для современных ИИ.",[63,64],"Kling.io is an AI-powered video generation platform that transforms text prompts and static images into cinematic, realistic videos at full HD (1080p) and 30 FPS. Unlike many short-form generators, Kling supports extended outputs—videos up to two minutes—so users can produce short films, product demos, social ads, or narrative scenes without stitching many clips. It also animates photos by adding natural motion, depth, and camera flow, making concept art, portraits, and stills feel alive.\n\nKey strengths include custom face model support for hyper-realistic personalized videos, advanced motion control (Motion Brush and physics-aware dynamics) for smooth, believable object and character movement, and strong character consistency so subjects retain the same appearance throughout a sequence. Cinematic camera effects—zoom, angle changes, and transitions—plus flexible aspect ratios (16:9, 9:16, 1:1) let creators optimize content for YouTube, TikTok, Instagram, and more. Cloud-based rendering produces results quickly without local hardware demands.\n\nKling offers an API (Kling 1.6 Pro) for integration into production workflows, with configurable parameters like prompt adherence, aspect ratio, and negative prompts; note that the current commercial API variant supports shorter clip durations (typically 5–10 seconds), while longer outputs are available in higher-tier versions. The platform is commercially licensed and guided by ethical usage policies.\n\nPractical benefits: marketers and creators can rapidly produce polished promotional and social content; educators and storytellers can turn scripts or images into cinematic teaching materials; and entertainment teams can prototype realistic character scenes. Limitations include dependence on internet/cloud access, potential usage costs, and occasional generative artifacts common to current AI systems.","Создаёт кинематографичные 1080p видео из текста или изображения (до 2 мин)",{"tier":2689,"duration":864,"aspect_ratio":1274},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":2733,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2734,"key":2735,"label":2736,"description":2737,"isInstantModel":12,"ruDescription":2738,"ruLongDescription":2739,"contextCapacity":777,"maxTokens":462,"type":428,"generationType":429,"generationTypes":2740,"api":2741,"settingConfigs":2742,"percs":2760,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":482,"iconUrl":2765,"websiteUrl":2766,"licenseUrl":163,"position":30,"secondCost":30,"generationCost":482,"inputTokenCost":2767,"outputTokenCost":2767,"stepPrice":30,"examples":2768,"createdAt":2769,"updatedAt":2770,"__v":38,"generationCount":2771,"releaseDate":2772,"isAvailableAfterAuth":12,"longDescription":2773,"configValue":2774},[63,64],"6759848b44fd912d24523aec","meta-llama/Llama-3.3-70B-Instruct-Turbo","LLama 3.3 70B","Instruction-tuned Llama model — deep reasoning, 128K context","Инструктированная модель Llama — глубокое рассуждение, контекст 128K","Llama 3.3 70B — это обученная следовать инструкциям текстовая языковая модель с 70 миллиардами параметров, созданная для высококачественных, контекстно-зависимых задач обработки естественного языка. Благодаря очень большому окну контекста в 128 000 токенов модель превосходно справляется с генерацией больших текстов, многоходовыми диалогами, суммаризацией документов и помощью с кодом. Модель надежно выполняет сложные инструкции, что делает её подходящей для интерактивных агентов, ботов поддержки клиентов, образовательных тьюторов и инструментов для разработчиков, требующих точных и согласованных ответов в длинных сессиях или при работе с большими документами.\n\nПользователи получают преимущества в задачах рассуждения, программирования и математических вычислений: модель помогает генерировать и отлаживать код, составлять техническую документацию, анализировать тексты и создавать многоязычный контент. Она поддерживает несколько языков, что полезно для глобальных приложений — от мультилингвальной поддержки клиентов до локализации материалов. Модель ориентирована на корпоративные развёртывания: поддерживаются распределённые мульти-GPU конфигурации, автоматическое распределение нагрузки, восстановление при сбоях и оптимизации для снижения задержек.\n\nПрактические плюсы — уменьшение потери контекста в длинных сессиях, лучшее следование инструкциям и возможность дообучения на собственных данных (модель с открытым исходным кодом). Для развёртывания требуются мощные GPU (≈53+ ГБ видеопамяти на GPU) или масштабирование по нескольким устройствам. В режиме on-demand ответ обычно ограничен (примерно 4 000 токенов), но на выделённом хостинге доступно всё окно контекста. Несмотря на высокие требования к ресурсам, Llama 3.3 70B обеспечивает высокую точность и подходит организациям и разработчикам, которым нужен мощный и настраиваемый текстовый LLM для продвинутых NLP-задач.",[429],"togetherai",[2743,2747,2751,2756],{"fileTypes":2744,"_id":2745,"key":446,"model":2734,"title":447,"step":249,"max":38,"min":30,"defaultValue":449,"options":2746,"settingType":43,"fileSource":28,"__v":30,"description":451,"ruDescription":452,"ruTitle":453},[],"6759855e44fd912d245256ad",[],{"fileTypes":2748,"_id":2749,"key":436,"model":2734,"title":1672,"tooltipContent":163,"step":249,"max":38,"min":30,"defaultValue":439,"options":2750,"settingType":43,"fileSource":28,"__v":30},[],"6759855e44fd912d245256b0",[],{"fileTypes":2752,"_id":2753,"key":469,"model":2734,"title":470,"tooltipContent":2754,"description":475,"max":777,"min":82,"defaultValue":473,"options":2755,"settingType":43,"fileSource":28,"__v":30,"ruDescription":476,"ruTitle":477},[],"6759855e44fd912d245256b3","The amount of tokens model can consume",[],{"fileTypes":2757,"_id":2758,"key":457,"model":2734,"title":458,"tooltipContent":866,"description":463,"step":65,"max":462,"min":65,"defaultValue":461,"options":2759,"settingType":43,"fileSource":28,"__v":30,"ruDescription":464,"ruTitle":465},[],"6759855e44fd912d245256b6",[],[2761,2762,2763,2764],"68a9dc76e3ac04ad89b9209a","68a9dc76e3ac04ad89b9209c","68a9dc76e3ac04ad89b9209e","68a9dc76e3ac04ad89b920a0","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/llama.png","https://www.llama.com/docs/model-cards-and-prompt-formats/llama3_3/",0.00088,[],"2024-12-11T12:24:43.956Z","2025-08-23T15:21:26.818Z",101,"2024-12-06T13:43:00.000Z","Llama 3.3 70B is an instruction-tuned, text-only large language model designed for high-quality, context-aware natural language tasks. With 70 billion parameters and an exceptionally large 128,000-token context window, it excels at long-form generation, multi-turn dialogues, document summarization, and code assistance. The model is optimized to follow complex instructions reliably, making it a strong choice for interactive agents, customer support bots, educational tutors, and developer tools that require accurate, coherent responses across extended conversations or long documents.\n\nUsers can leverage its improved reasoning, coding, and math abilities to generate and debug code, draft technical documentation, analyze text, and create multilingual content. The model handles many languages well, enabling global applications such as multilingual customer care and content localization. It is built for enterprise deployments: it supports distributed multi-GPU setups, automatic load balancing, fault tolerance, and efficiency optimizations to reduce latency and improve throughput in production environments.\n\nPractical benefits include reduced context loss in long sessions, better instruction following for task-specific queries, and flexibility to fine-tune on domain data (open-source availability). Note deployment requires substantial GPU memory (≈53+ GB per GPU or horizontal scaling across consumer GPUs). On-demand hosted use may cap response length (typically 4,000 tokens), while dedicated hosting can utilize the full 128K context. Despite being resource-intensive, Llama 3.3 70B offers high accuracy for classification, translation, and text generation tasks, making it well suited to enterprises and developers who need a powerful, customizable text model for advanced NLP applications.",{"temperature":449,"top_p":439,"capacity":473,"max_tokens":461},{"outputPath":7,"_id":2776,"key":2777,"label":2778,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"api":85,"settings":2779,"tier":125,"__v":2723,"replicateId":2789,"iconType":2790,"cost":482,"generationCount":2791,"iconUrl":2792,"previewImageUrl":2793,"description":2794,"generationTypes":2795,"settingConfigs":2796,"bannerImageUrl":2831,"isPromptRequired":61,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"secondCost":2552,"stepPrice":30,"githubUrl":2832,"licenseUrl":2833,"position":2834,"isAdminModel":12,"createdAt":2835,"examples":2836,"isBanned":12,"isOutdated":12,"longDescription":2837,"percs":2838,"updatedAt":2843,"ruDescription":2844,"ruLongDescription":2845,"isInstantModel":12,"isGenerationTypeRequired":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":2846,"tokenStrategy":67,"isAvailableAfterAuth":12,"replicateApiType":117,"configValue":2847},"656ee027025ddd19a58e2fb7","fofr/latent-consistency-model","Latent Consistency",[2780,2783,2786],{"key":1185,"title":2781,"tooltipContent":2782,"step":225,"max":38,"min":30},"Weight","Prompt strength. Idictates how closely the generated image mirrors your prompt",{"key":306,"title":2784,"tooltipContent":2785,"step":38,"max":53,"min":38},"Inference steps","Number of denoising steps.",{"key":1385,"title":2787,"tooltipContent":2788,"step":862,"max":817,"min":38},"Guidance scale","Scale for classifier-free guidance","fofr/latent-consistency-model:e94cee618da9b2891d690abb21b079cad95931e38b21c40ab6ff6196e87e9476","latentConsistency",486,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/latent-consistency.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/latent-consistency-preview.png","Generate high-quality images from text in under a second",[691],[2797,2804,2814,2821,2827],{"fileTypes":2798,"_id":2799,"key":1385,"title":2787,"model":2776,"modelKey":2800,"tooltipContent":2788,"step":38,"max":817,"min":38,"options":2801,"settingType":43,"__v":30,"position":71,"fileSource":28,"defaultValue":2802,"isAdvanced":61,"fileType":63,"valueType":44,"description":2788,"ruDescription":2803,"ruTitle":2531},[],"65c396a41670521834949778","latent-consistency",[],"8","Шкала для руководства без классификаторов",{"fileTypes":2805,"_id":2806,"key":1185,"title":2807,"model":2776,"modelKey":2800,"tooltipContent":2808,"step":249,"max":38,"min":30,"options":2809,"settingType":43,"__v":30,"defaultValue":2810,"position":38,"fileSource":28,"fileType":63,"valueType":44,"isRequired":61,"description":2811,"ruDescription":2812,"ruTitle":2813},[],"65c396a41670521834949776","Prompt weight","Define how your reference image impacts the result",[],"0.8","Define how your prompt impacts the result","Определите, как промпт влияет на результат","Вес",{"fileTypes":2815,"_id":2816,"key":306,"title":2784,"model":2776,"modelKey":2800,"tooltipContent":2785,"step":38,"max":53,"min":38,"options":2817,"settingType":43,"__v":30,"position":126,"fileSource":28,"defaultValue":2818,"fileType":63,"isAdvanced":61,"valueType":44,"description":2785,"ruDescription":2819,"ruTitle":2820},[],"65c396a41670521834949777",[],"35","Количество шагов инференса.","Шаги генерации",{"fileTypes":2822,"_id":2823,"key":2587,"model":2776,"title":2588,"tooltipContent":2588,"position":71,"step":555,"max":2824,"min":2825,"defaultValue":2626,"options":2826,"settingType":43,"fileType":63,"fileSource":28,"valueType":44,"__v":30,"description":2588,"ruDescription":2613,"ruTitle":2613},[],"65fd350d027f53151a5c2d4f",1024,128,[],{"fileTypes":2828,"_id":2829,"key":2617,"model":2776,"title":2618,"tooltipContent":2618,"position":126,"step":555,"max":2824,"min":2825,"defaultValue":2626,"options":2830,"settingType":43,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"description":2618,"ruDescription":2634,"ruTitle":2634},[],"65fd355c027f53151a5c2f06",[],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/latent-consistency-banner.png","https://github.com/luosiallen/latent-consistency-model","https://github.com/fofr/cog-lcm/blob/main/LICENSE",724,"2024-09-13T14:29:03.673Z",[],"Latent Consistency is a text-to-image model built for speed and practical image production. It delivers high-quality images much faster than traditional diffusion models — often in under a second per image — which makes it ideal for interactive and real-time workflows. By operating in a compact latent space and using consistency-focused distillation, the model needs only a few inference steps (sometimes one) to produce polished outputs, cutting GPU time and iteration latency dramatically.\n\nUsers can rely on Latent Consistency for rapid prototyping, live content creation, game asset generation, and batch production where turnaround time matters. It supports fine-tuning on custom datasets (latent consistency fine-tuning) so teams can adapt the model to particular visual styles, product catalogs, or branding. Practical controls such as conditioning and controlnet-style inputs are compatible, enabling more deterministic outputs for production pipelines.\n\nThe model strikes a balance between speed and fidelity: outputs are comparable to multi-step diffusion models for many common use cases, though very complex, highly detailed scenes may still benefit from slower, many-step pipelines. Because inference is lightweight, Latent Consistency also reduces compute and energy costs, simplifying deployment in environments where resources or response time are constrained.\n\nIn short, this model is best for anyone who needs quick, reliable image generation from text with the option to customize to a domain. It’s particularly valuable for creatives, developers, and teams building applications that require real-time visual feedback or high-volume generation where time and cost savings directly impact productivity.",[2839,2840,2841,2842],"68a9d369e3ac04ad89b91e9c","68a9d369e3ac04ad89b91e9e","68a9d369e3ac04ad89b91ea0","68a9d369e3ac04ad89b91ea2","2025-08-23T14:42:49.393Z","Генерирует качественные изображения по тексту за менее чем секунду","Latent Consistency — модель для преобразования текста в изображение, разработанная для скорости и практического использования. Она создаёт качественные изображения значительно быстрее традиционных диффузионных моделей — часто менее чем за секунду на изображение — что делает её подходящей для интерактивных и реального времени сценариев. Работа в компактном латентном пространстве и методы консистентной дистилляции позволяют модели обходиться несколькими (иногда одним) шагом вывода, значительно сокращая время работы GPU и задержки итераций.\n\nПользователи могут применять Latent Consistency для быстрого прототипирования, создания контента в реальном времени, генерации игровых ассетов и пакетной обработки, когда важна скорость. Модель поддерживает дообучение на собственных наборах данных (latent consistency fine-tuning), что позволяет адаптировать стиль и визуальные характеристики под бренд или нишу. Практические механизмы управления и совместимость с контрольными входами (аналогично controlnet) дают возможность получать более детерминированные результаты для производственных пайплайнов.\n\nМодель сбалансирована по скорости и качеству: в большинстве задач её выходы сопоставимы с многошаговыми диффузионными моделями, однако для очень сложных и детализированных сцен преимущества остаются за более медленными подходами. Благодаря лёгкому выводу Latent Consistency также снижает вычислительные и энергозатраты, упрощая развёртывание в условиях ограниченных ресурсов или строгих требований по задержке.\n\nВкратце: эта модель подходит тем, кому нужны быстрые и надёжные изображения по текстовым описаниям с возможностью адаптации под конкретную область. Особенно полезна для креативщиков, разработчиков и команд, где скорость и экономия ресурсов напрямую повышают производительность.",[63,64],{"guidance_scale":2802,"prompt_strength":2810,"num_inference_steps":2818,"width":2626,"height":2626},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":2849,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2850,"key":2851,"label":2852,"contextCapacity":1683,"maxTokens":82,"cost":53,"generationCount":2853,"inputTokenCost":2854,"outputTokenCost":2854,"iconType":327,"description":2855,"iconUrl":2765,"type":428,"api":2741,"settingConfigs":2856,"isAdminModel":12,"__v":482,"generationCost":30,"generationType":429,"generationTypes":2878,"isPromptRequired":61,"position":2879,"secondCost":30,"stepPrice":30,"previewImageUrl":2880,"bannerImageUrl":2881,"shortLabel":163,"updatedAt":2882,"gemTokenCost":2883,"examples":2884,"isBanned":12,"isOutdated":12,"longDescription":2885,"percs":2886,"createdAt":2888,"releaseDate":2889,"websiteUrl":2890,"ruDescription":2891,"ruLongDescription":2892,"isAvailableAfterAuth":12,"configValue":2893},[63,64],"662a2584b1553a6893f707a8","meta-llama/Llama-3-70b-chat-hf","Llama 3 70B",346,0.0009,"A large-scale language model designed for efficient, interactive dialog and versatile text generation.",[2857,2862,2867,2872],{"fileTypes":2858,"_id":2859,"key":436,"title":2860,"model":2850,"modelKey":2851,"tooltipContent":1674,"step":249,"max":38,"min":30,"options":2861,"settingType":43,"__v":30,"fileSource":28,"defaultValue":439,"description":1674,"ruDescription":1675,"ruTitle":788},[],"662a2584b1553a6893f707ac","Diversity Control",[],{"fileTypes":2863,"_id":2864,"key":446,"title":447,"model":2850,"modelKey":2851,"tooltipContent":2865,"step":249,"max":38,"min":30,"options":2866,"settingType":43,"__v":30,"fileSource":28,"defaultValue":449,"description":451,"ruDescription":452,"ruTitle":453},[],"662a2584b1553a6893f707ae","Temperature. Controls AI response creativity.\u003Cbr> Lower values = more focused, higher values = more varied.\u003Cbr> Range: 0 to 2.0.",[],{"fileTypes":2868,"_id":2869,"key":469,"title":470,"model":2850,"modelKey":2851,"step":806,"max":1683,"min":427,"options":2870,"settingType":43,"__v":30,"fileSource":28,"defaultValue":473,"description":475,"tooltipContent":2871,"ruDescription":476,"ruTitle":477},[],"662a2585b1553a6893f707b0",[],"Amount of text data passed to model\u003Cbr/>Affects the cost of a generation.",{"fileTypes":2873,"_id":2874,"key":457,"title":458,"model":2850,"modelKey":2851,"step":795,"max":462,"min":2875,"options":2876,"settingType":43,"__v":30,"fileSource":28,"description":463,"tooltipContent":2877,"ruDescription":464,"ruTitle":465,"defaultValue":461},[],"662a2585b1553a6893f707b2",600,[],"Size of an output",[429],490,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/llama-3-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/llama-3-banner.png","2025-08-21T12:29:05.010Z",3.6,[],"This state-of-the-art model offers improved conversational abilities, enabling seamless interaction through adaptive natural language understanding and generation in diverse contexts.",[1655,2887,1656,1657],"672e2ccaf39f256ba09706c9","2024-09-10T15:33:49.324Z","2024-04-18T15:33:00.000Z","websiteUrl","Крупномасштабная языковая модель, предназначенная для эффективного интерактивного диалога и универсальной генерации текстов.","Эта современная модель предлагает улучшенные разговорные возможности, обеспечивая беспрепятственное взаимодействие благодаря адаптивному пониманию и генерации естественного языка в различных контекстах.",{"top_p":439,"temperature":449,"capacity":473,"max_tokens":461},{"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":2895,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":2896,"key":2897,"label":2898,"contextCapacity":1683,"maxTokens":82,"cost":482,"generationCount":478,"inputTokenCost":2899,"outputTokenCost":2899,"iconType":327,"description":2900,"iconUrl":2765,"type":428,"api":2741,"settingConfigs":2901,"isAdminModel":12,"__v":71,"generationCost":30,"generationType":429,"generationTypes":2919,"isPromptRequired":61,"position":2920,"secondCost":30,"stepPrice":30,"bannerImageUrl":2921,"previewImageUrl":2922,"gemTokenCost":2923,"examples":2924,"isBanned":12,"isOutdated":12,"percs":2925,"updatedAt":2926,"websiteUrl":2890,"createdAt":2927,"longDescription":2928,"ruDescription":2929,"ruLongDescription":2930,"isInstantModel":12,"isAvailableAfterAuth":12,"configValue":2931},[63,64],"662a2586b1553a6893f707cb","meta-llama/Llama-3-8b-chat-hf","Llama 3 8B",0.0002,"A powerful, conversational AI model optimized for natural language understanding and generation tasks.",[2902,2906,2910,2915],{"fileTypes":2903,"_id":2904,"key":436,"title":2860,"model":2896,"modelKey":2897,"tooltipContent":1674,"step":249,"max":38,"min":30,"options":2905,"settingType":43,"__v":30,"fileSource":28,"description":1674,"ruDescription":1675,"ruTitle":788,"defaultValue":439},[],"662a2586b1553a6893f707cd",[],{"fileTypes":2907,"_id":2908,"key":446,"title":447,"model":2896,"modelKey":2897,"tooltipContent":2865,"step":249,"max":38,"min":30,"options":2909,"settingType":43,"__v":30,"fileSource":28,"description":451,"ruDescription":452,"ruTitle":453,"defaultValue":449},[],"662a2586b1553a6893f707cf",[],{"fileTypes":2911,"_id":2912,"key":469,"title":470,"model":2896,"modelKey":2897,"step":806,"max":1683,"min":427,"options":2913,"settingType":43,"__v":30,"fileSource":28,"description":475,"tooltipContent":2914,"ruDescription":476,"ruTitle":477},[],"662a2586b1553a6893f707d1",[],"undefined \u003Cbr/>Affects the cost of a generation. \u003Cbr/>Affects the cost of a generation.",{"fileTypes":2916,"_id":2917,"key":457,"title":458,"model":2896,"modelKey":2897,"step":795,"max":462,"min":2875,"options":2918,"settingType":43,"__v":30,"fileSource":28,"ruTitle":465,"defaultValue":461,"description":463,"ruDescription":464},[],"662a2586b1553a6893f707d3",[],[429],501,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/llama-3-8b-banner-1.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/llama-3-8b-preview.png",0.8,[],[1655,1657,1656,1658],"2025-08-21T12:29:20.570Z","2024-09-11T09:29:22.186Z","An advanced conversational AI model equipped with capabilities for natural language tasks including dialogue generation, text summarization, and sentiment analysis. It leverages a large parameter count for nuanced interaction, delivering high-quality responses in various contexts.","Мощная модель разговорного ИИ, оптимизированная для задач понимания и генерации естественного языка.","Передовая модель разговорного ИИ, оснащенная возможностями для решения задач на естественном языке, включая генерацию диалогов, обобщение текста и анализ настроений. Она использует большое количество параметров для тонкого взаимодействия, обеспечивая высококачественные ответы в различных контекстах.",{"top_p":439,"temperature":449,"max_tokens":461},{"_id":2933,"key":2934,"label":2935,"shortLabel":2935,"description":2936,"isInstantModel":12,"releaseDate":2937,"type":2674,"generationType":2675,"generationTypes":2938,"api":2939,"settingConfigs":2940,"percs":2966,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":2971,"gemTokenCost":2972,"iconUrl":2973,"websiteUrl":2974,"position":30,"secondCost":30,"generationCost":2975,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":2976,"createdAt":2977,"updatedAt":2978,"__v":414,"generationCount":99,"ruDescription":2979,"isGenerationTypeRequired":12,"isAvailableAfterAuth":61,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":6,"supportFiles":12,"supportedFileTypes":2980,"tokenStrategy":67,"longDescription":2981,"ruLongDescription":2982,"configValue":2983},"6722a9b802220c683a14419e","ray-1-6","Luma Dream Machine","Generate cinematic, physics-aware videos from text or still images","2024-06-11T21:46:00.000Z",[2675,2677],"luma",[2941,2950,2958],{"_id":2942,"key":2943,"model":2933,"title":2944,"tooltipContent":2945,"description":2946,"ruTitle":2946,"accept":2947,"options":2948,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"valueType":215,"__v":30,"fileTypes":2949},"676f173608f5693e4bee578f","frame0","Frame 1","Upload an image for the first frame of the video","Первый кадр","image/*,video/*",[],[63,2674],{"_id":2951,"key":2952,"model":2933,"title":2953,"tooltipContent":2954,"accept":92,"options":2955,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"valueType":215,"__v":30,"description":2956,"ruTitle":2956,"fileTypes":2957},"675df7863f3def64ddfe43e8","frame1","Frame 2","Upload an image for the second frame of the video",[],"Второй кадр",[],{"_id":2959,"key":2960,"model":2933,"title":2961,"tooltipContent":2962,"description":2962,"options":2963,"settingType":27,"fileSource":28,"valueType":29,"__v":30,"ruDescription":2964,"ruTitle":2964,"fileTypes":2965},"6722b552e8e38df7bebb1fb0","loop","Loop","Loop video (not supported with 2 frames)",[],"Зациклить",[],[2967,2968,2969,2970],"68a9daa9e3ac04ad89b92041","68a9daa9e3ac04ad89b92043","68a9daa9e3ac04ad89b92045","68a9daa9e3ac04ad89b92047",1600,1500,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/LUMA.png","lumalabs.ai",0.4,[],"2024-10-30T21:48:40.366Z","2025-09-09T19:56:23.497Z","Создаёт кинематографичные видео с реалистичной физикой по тексту или из статичных изображений",[63,64],"Luma Dream Machine is an AI-powered text-to-video and image-to-video generator designed to help creators produce cinematic, realistic videos quickly and affordably. From a single text prompt or a still image, Dream Machine generates motion that respects physics and produces coherent object and character behavior, making outputs look natural and believable. The platform is optimized for fast iteration — for example, it can render around 120 frames in roughly 120 seconds — so you can prototype, refine, and publish visual ideas without long wait times.\n\nThe model is built for accessibility: an intuitive web interface and editing tools (keyframes, camera motion controls, and visual reference support) let non-experts craft and fine-tune scenes. Artists can animate artwork or memes, storytellers can create short cinematic sequences, and marketing teams can generate quick concept trailers or social content without a full production crew. Dream Machine is also cost-effective, lowering traditional production expenses while scaling to both individual creators and teams.\n\nWhat makes Dream Machine stand out is its focus on believable motion and continuity. Outputs typically maintain consistent lighting, object relationships, and physical interactions across frames, which improves realism compared with many other text-to-video approaches. At the same time, users should be aware of a few practical limits: exact maximum resolution details are not fully specified, and there have been discussions about training data transparency and potential copyright similarity in some early outputs. These considerations mean Dream Machine is ideal for rapid prototyping, social and marketing content, animation experiments, and visual storytelling — especially when speed, realism, and ease of use are top priorities.","Luma Dream Machine — это AI-система для генерации видео из текста и анимации статичных изображений, разработанная для быстрых и доступных кинематографичных результатов. По одной текстовой подсказке или по исходному изображению Dream Machine создаёт движение, которое учитывает физику и обеспечивает связное поведение объектов и персонажей, благодаря чему полученные ролики выглядят естественно и правдоподобно. Платформа оптимизирована для быстрой итерации — например, модель может сгенерировать примерно 120 кадров примерно за 120 секунд — что позволяет быстро проверять идеи и вносить правки.\n\nСистема ориентирована на удобство: интуитивный веб-интерфейс и инструменты редактирования (ключевые кадры, управление движением камеры и поддержка визуальных референсов) дают возможность пользователям без технической подготовки создавать и дорабатывать сцены. Художники могут оживлять картины и мемы, сценаристы — создавать короткие кинематографичные последовательности, маркетологи — быстро делать концепт-трейлеры и контент для соцсетей без съёмочной группы. Dream Machine также экономит затраты, снижая потребность в традиционном производстве и легко масштабируясь для отдельных авторов и команд.\n\nОсобенность Dream Machine — акцент на правдоподобном движении и непрерывности между кадрами: модель чаще сохраняет согласование освещения, взаимосвязи объектов и физические взаимодействия, что повышает реализм по сравнению со многими аналогами. При этом следует учитывать практические ограничения: точные максимальные разрешения не всегда указаны, а также обсуждаются вопросы прозрачности данных обучения и возможного сходства с защищённым авторским стилем у отдельных ранних результатов. Эти моменты делают Dream Machine отличным выбором для быстрого прототипирования, маркетингового и социального контента, экспериментов с анимацией и визуального сторителлинга — особенно когда важны скорость, реализм и простота использования.",{},{"replicateApiType":6,"outputPath":7,"_id":2985,"key":2986,"label":2987,"shortLabel":2935,"description":2988,"isInstantModel":12,"ruDescription":2989,"releaseDate":2937,"createdAt":2977,"generationCount":2990,"type":2674,"generationType":2675,"generationTypes":2991,"api":2939,"settingConfigs":2992,"percs":3013,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":3017,"gemTokenCost":2972,"iconUrl":2973,"websiteUrl":2974,"position":30,"secondCost":30,"generationCost":2923,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":3018,"updatedAt":3019,"__v":71,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":3020,"tokenStrategy":67,"isAvailableAfterAuth":61,"longDescription":3021,"ruLongDescription":3022,"configValue":3023},"67a5f7a2b3cfbc04ce6fa326","ray-2","Luma Ray 2","Generate photorealistic video from text or image prompts","Создаёт фотореалистичное видео по тексту или изображению",241,[2675,2677],[2993,2997,3001,3005],{"fileTypes":2994,"_id":2995,"key":2943,"model":2985,"title":2944,"tooltipContent":2945,"description":2946,"ruTitle":2946,"accept":92,"options":2996,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},[],"67a5f7a2b3cfbc04ce6fa328",[],{"fileTypes":2998,"_id":2999,"key":2952,"model":2985,"title":2953,"tooltipContent":2954,"description":2956,"ruTitle":2956,"accept":92,"options":3000,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},[],"67a5f7a2b3cfbc04ce6fa32a",[],{"fileTypes":3002,"_id":3003,"key":2960,"model":2985,"title":2961,"tooltipContent":2962,"description":2962,"ruTitle":2964,"ruDescription":2964,"options":3004,"settingType":27,"fileSource":28,"valueType":29,"__v":30},[],"67a5f7a2b3cfbc04ce6fa32c",[],{"fileTypes":3006,"_id":3007,"key":703,"model":2985,"title":704,"defaultValue":3008,"options":3009,"settingType":282,"fileSource":28,"__v":30,"description":716,"ruDescription":717,"ruTitle":715},[],"67a5f80eb3cfbc04ce6fa44d","720p",[3010,3012],{"label":3011,"value":3011,"cost":163},"540p",{"label":3008,"value":3008,"cost":163},[3014,3015,3016],"68a9de48e3ac04ad89b920ef","68a9de48e3ac04ad89b920f1","68a9de48e3ac04ad89b920f3",3200,[],"2025-09-11T20:09:35.406Z",[63,64],"Luma Ray 2 is a video-generation model that converts text or image prompts into short, photorealistic video clips with cinematic control. Designed for creators who need high-quality visuals without a deep technical stack, Ray 2 produces up to 1080p footage and clips up to 10 seconds long. Users can direct camera moves, lighting and character interactions with simple natural-language instructions or by providing reference images, allowing rapid prototyping or production-ready sequences for film, ads, games, e-commerce and education.\n\nRay 2 emphasizes realism: smooth motion, believable lighting and lifelike textures make generated scenes suitable for cutscenes, product demos, short commercial spots, and illustrative educational clips. The model supports both text-to-video and image-to-video workflows, so you can start from a written concept or feed it a reference image to preserve style, composition or subject appearance. Integration with Amazon Bedrock and Luma’s Dream Machine platform simplifies access, letting non-technical users create complex shots through an intuitive interface.\n\nPractical benefits include faster iteration on storyboards and visual concepts, reduced need for costly location shoots or actor sessions for short sequences, and the ability to produce consistent, repeatable visuals for marketing and prototype content. Note the current constraints: clips are limited to around 10 seconds at up to 1080p, the model does not support custom fine-tuning, and availability is tied to paid Dream Machine subscriptions. Some users have reported slower generation times or occasional failures during high demand. Despite these caveats, Luma Ray 2 delivers a powerful, user-friendly option for anyone who needs realistic short video generation from text or reference images.","Luma Ray 2 — модель генерации видео, преобразующая текстовые или графические подсказки в короткие фотореалистичные видеоролики с кинематографическим управлением. Предназначена для создателей, которым нужны качественные визуальные материалы без глубокой технической подготовки: Ray 2 выдаёт видео до 1080p и клипы длительностью до 10 секунд. Пользователи могут задавать движения камеры, освещение и взаимодействия персонажей простыми естественными инструкциями или использовать референсные изображения, что ускоряет прототипирование и создание готовых сцен для кино, рекламы, игр, e‑commerce и образования.\n\nRay 2 делает ставку на реализм: сглаженная анимация, правдоподобное освещение и естественные текстуры делают сцены подходящими для кат-сцен, демонстраций товара, коротких рекламных роликов и учебных материалов. Модель поддерживает как текст‑видео, так и изображение‑видео сценарии, позволяя начать либо с концепта в словах, либо с референса для сохранения стиля, композиции или внешности объекта. Интеграция с Amazon Bedrock и платформой Dream Machine от Luma упрощает доступ и даёт интуитивный интерфейс для пользователей без технического опыта.\n\nПрактические преимущества: ускорение итераций сториборда и визуальных концептов, сокращение затрат на съёмки для коротких сцен и возможность воспроизводить согласованный визуал для маркетинга и прототипов. Ограничения: клипы — до ~10 секунд и до 1080p, отсутствует возможность тонкой донастройки модели, доступ пока ограничен подписчиками Dream Machine. При высокой нагрузке возможны замедления генерации и редкие сбои. Несмотря на это, Luma Ray 2 остаётся мощным и удобным инструментом для создания реалистичных коротких видео по текстовым или графическим подсказкам.",{"resolution":3008},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":3025,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":3026,"key":3027,"label":3028,"shortLabel":3029,"description":3030,"isInstantModel":12,"type":2674,"generationType":2675,"generationTypes":3031,"api":17,"settingConfigs":3032,"percs":3044,"isAdminModel":12,"isGenerationTypeRequired":61,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":427,"position":3045,"secondCost":30,"generationCost":862,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":3046,"createdAt":3047,"updatedAt":3048,"__v":38,"generationCount":3049,"iconUrl":3050,"isAvailableAfterAuth":61,"configValue":3051},[63,64],"672ea03fc1a6faf76015e6f6","fal-ai/minimax-video","MiniMax (Hailuo AI)","MiniMax","Open Source video model",[],[3033,3037],{"fileTypes":3034,"_id":3035,"key":1373,"model":3026,"title":398,"accept":92,"options":3036,"settingType":94,"fileType":63,"fileSource":1151,"__v":30},[],"672ea03fc1a6faf76015e6f8",[],{"fileTypes":3038,"_id":3039,"key":3040,"model":3026,"title":3041,"tooltipContent":3042,"description":3042,"defaultValue":25,"options":3043,"settingType":27,"fileType":63,"fileSource":28,"valueType":29,"__v":30},[],"672ea03fc1a6faf76015e6fa","prompt_optimizer","Prompt Optimizer","If checked, then prompt will be enhanced",[],[],810,[],"2024-11-08T23:35:27.192Z","2025-08-21T12:32:16.435Z",59,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/hailuo.png",{"prompt_optimizer":25},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":3053,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":3054,"key":3055,"label":3056,"description":3057,"isInstantModel":12,"type":2674,"generationType":2675,"generationTypes":3058,"api":17,"settingConfigs":3059,"percs":3066,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":2971,"iconUrl":3071,"position":3072,"secondCost":30,"generationCost":2975,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":3073,"createdAt":3074,"updatedAt":3075,"__v":38,"generationCount":3076,"isAvailableAfterAuth":61,"longDescription":3077,"ruDescription":3078,"ruLongDescription":3079,"configValue":3080},[63,64],"672e9bcfc1a6faf76014d1b8","fal-ai/mochi-v1","Mochi v1","Generate high-fidelity, realistic videos from text prompts",[2675],[3060],{"fileTypes":3061,"_id":3062,"key":3063,"model":3054,"title":3064,"defaultValue":25,"options":3065,"settingType":27,"fileSource":28,"valueType":29,"__v":30},[],"672ea0c2c1a6faf76015fa7b","enable_prompt_expansion","Enhance prompt",[],[3067,3068,3069,3070],"68a9daf9e3ac04ad89b9205b","68a9daf9e3ac04ad89b9205d","68a9daf9e3ac04ad89b9205f","68a9daf9e3ac04ad89b92061","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/genmo.png",395,[],"2024-11-08T23:16:31.790Z","2025-08-23T15:15:05.748Z",18,"Mochi v1 is an open-source text-to-video model that turns simple written prompts into smooth, realistic videos. Designed for creators, researchers, and developers, Mochi v1 produces high-fidelity motion at 30 frames per second and reliably follows the details of your prompt so the output matches your intent. Because it is released under Apache 2.0, Mochi v1 is free for personal and commercial use and easy to integrate into custom pipelines or products.\n\nUsers can generate a wide range of outputs — from short narrative scenes and promotional clips to educational illustrations and synthetic datasets — by adjusting prompt text and generation parameters (seed, cfg-scale) to trade off between strict prompt adherence and creative variation. The model’s large-scale design delivers superior realism and prompt alignment compared with many open-source alternatives, making it well suited for storytelling, marketing, prototyping, and research experimentation.\n\nPractical considerations: Mochi v1 requires substantial GPU memory (around 60 GB VRAM) for smooth single-GPU operation, and it is currently provided in a preview/evaluation state, so expect ongoing improvements and occasional instability. Generating videos using hosted services often costs roughly $0.4 per video, reflecting the model’s quality and compute needs. \n\nIn short, Mochi v1 is ideal for users who need highly realistic, text-driven video generation and have access to strong hardware or cloud resources. Its strong prompt fidelity, customizable controls, and permissive license make it a flexible choice for creative projects, educational content, and research-focused video synthesis.","Генерирует высококачественные реалистичные видео по текстовым подсказкам","Mochi v1 — это открытая модель text-to-video, которая превращает простые текстовые подсказки в плавные и реалистичные видеоролики. Разработанная для авторов, исследователей и разработчиков, Mochi v1 создаёт высококачественное движение с частотой 30 кадров в секунду и точно следует деталям подсказки, благодаря чему результат соответствует вашей задумке. Модель распространяется под лицензией Apache 2.0, что позволяет бесплатно использовать её в личных и коммерческих проектах и легко интегрировать в рабочие процессы.\n\nПользователи могут получать разнообразные результаты — от коротких сюжетных сцен и рекламных роликов до образовательных иллюстраций и синтетических наборов данных — просто меняя текст подсказки и параметры генерации (seed, cfg-scale) для контроля между точным следованием подсказке и творческой вариативностью. Благодаря масштабности модель обеспечивает более высокую реалистичность и соответствие подсказкам по сравнению с многими другими открытыми решениями, что делает её подходящей для сторителлинга, маркетинга, прототипирования и исследовательских задач.\n\nПрактические замечания: Mochi v1 требует значительных ресурсов GPU (примерно 60 ГБ VRAM) для стабильной работы на одном графическом процессоре и пока доступна в режиме предварительной оценки, поэтому возможны улучшения и временные нестабильности. Генерация через облачные сервисы обычно стоит порядка $0.4 за видео, что отражает вычислительную сложность и качество модели.\n\nВ итоге Mochi v1 подходит тем, кто нуждается в реалистичной генерации видео по тексту и имеет доступ к мощному оборудованию или облачным ресурсам. Её точность в следовании подсказкам, настраиваемость и открытая лицензия делают модель гибким инструментом для творчества, образования и исследований.",{"enable_prompt_expansion":25},{"_id":3082,"key":3083,"label":3084,"contextCapacity":82,"maxTokens":65,"type":14,"generationType":15,"api":85,"settings":3085,"tier":692,"__v":226,"replicateId":3089,"iconType":3090,"cost":482,"generationCount":3091,"iconUrl":2765,"previewImageUrl":3092,"description":3093,"generationTypes":3094,"settingConfigs":3096,"bannerImageUrl":3201,"isPromptRequired":61,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"secondCost":2552,"stepPrice":30,"position":751,"updatedAt":3202,"createdAt":3203,"isAdminModel":12,"examples":3204,"isBanned":12,"isOutdated":12,"percs":3205,"websiteUrl":3209,"releaseDate":3210,"longDescription":3211,"ruDescription":3212,"ruLongDescription":3213,"isAvailableAfterAuth":12,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":6,"supportFiles":12,"supportedFileTypes":3214,"tokenStrategy":67,"configValue":3215},"656ee028025ddd19a58e2fb9","meta/musicgen","MusicGen",[3086],{"key":35,"title":36,"tooltipContent":3087,"step":38,"max":3088,"min":30},"The duration for which the model generates content.",90,"meta/musicgen:7be0f12c54a8d033a0fbd14418c9af98962da9a86f5ff7811f9b3423a1f0b7d7","llama",2747,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/musicgen-preview.png","Generate high-quality music from text or audio prompts with control",[15,3095],"audio-to-audio",[3097,3108,3119,3140,3161,3166,3175,3181,3191],{"_id":3098,"key":3099,"title":3100,"model":3082,"modelKey":3101,"tooltipContent":3102,"step":38,"max":1496,"min":40,"options":3103,"settingType":43,"__v":30,"defaultValue":3104,"promptTemplate":3105,"fileSource":28,"description":3102,"ruDescription":3106,"ruTitle":3100,"fileTypes":3107},"65cb8dd6ed26260abde31348","bpm","BPM","musicgen","Beats Per Minute. Set the tempo of a generation",[],"120","{prompt} in {value} BPM","Beats Per Minute. Установить темп поколения",[],{"_id":3109,"key":35,"title":3110,"model":3082,"modelKey":3101,"tooltipContent":3111,"step":38,"max":3088,"min":38,"options":3112,"settingType":43,"__v":30,"costMultiplier":3113,"fileSource":28,"valueType":44,"defaultValue":3114,"description":3111,"ruDescription":3115,"ruTitle":3116,"descriptionForAI":3117,"fileTypes":3118},"65c396a11670521834949760","Track duration","The duration of a generation",[],0.66,"20","Продолжительность поколения","Продолжительность трека","MUST BE INTEGER",[],{"_id":3120,"key":3121,"title":3122,"model":3082,"modelKey":3101,"tooltipContent":3123,"options":3124,"settingType":282,"__v":30,"defaultValue":3126,"step":38,"fileSource":28,"description":3123,"ruDescription":3137,"ruTitle":3138,"fileTypes":3139},"65c4e8521415e4c7d572f4d2","model_version","Model version","Different models make different sound.",[3125,3128,3131,3134],{"value":3126,"label":3127},"stereo-melody-large","Stereo Melody Large",{"value":3129,"label":3130},"stereo-large","Stereo Large",{"value":3132,"label":3133},"melody-large","Melody Large",{"value":3135,"label":3136},"large","Large","Разные модели издают разный звук.","Версия модели",[],{"_id":3141,"key":3142,"title":3143,"model":3082,"modelKey":3101,"tooltipContent":3144,"defaultValue":3145,"options":3146,"settingType":282,"__v":30,"step":38,"fileSource":28,"description":3144,"ruDescription":3158,"ruTitle":3159,"fileTypes":3160},"65c4ebec1415e4c7d572f4d3","normalization_strategy","Normalization Strategy","Strategy for normalizing audio","peak",[3147,3149,3152,3155],{"label":3148,"value":3145},"Peak",{"label":3150,"value":3151},"Loudness","loudness",{"label":3153,"value":3154},"Clip","clip",{"label":3156,"value":3157},"RMS","rms","Стратегия нормализации звука","Стратегия нормализации",[],{"_id":3162,"key":446,"title":447,"model":3082,"modelKey":3101,"tooltipContent":3163,"step":1394,"max":38,"min":30,"defaultValue":449,"options":3164,"settingType":43,"__v":30,"isAdvanced":61,"fileSource":28,"valueType":44,"description":451,"ruDescription":452,"ruTitle":453,"fileTypes":3165},"65c4ebec1415e4c7d572f4d4","Controls the 'conservativeness' of the sampling process. Higher temperature means more diversity.",[],[],{"_id":3167,"key":3168,"title":1871,"model":3082,"modelKey":3101,"tooltipContent":3169,"step":38,"max":1496,"min":38,"defaultValue":3170,"options":3171,"settingType":43,"__v":30,"isAdvanced":61,"fileSource":28,"valueType":44,"description":3172,"ruDescription":3173,"ruTitle":1871,"fileTypes":3174},"65c4ebec1415e4c7d572f4d5","top_k","Reduces sampling to the k most likely tokens.","250",[],"The number of top-ranked items to select from the output. Higher values result in more diverse outputs by considering more candidates.","Количество наиболее релевантных элементов для выбора из результата. Более высокие значения приводят к более разнообразным ответам за счет рассмотрения большего количества кандидатов.",[],{"_id":3176,"key":436,"title":1672,"model":3082,"modelKey":3101,"tooltipContent":3177,"step":38,"max":1496,"min":30,"defaultValue":439,"options":3178,"settingType":43,"__v":30,"isAdvanced":61,"fileSource":28,"valueType":44,"description":3177,"ruDescription":3179,"ruTitle":1672,"fileTypes":3180},"65c4ebec1415e4c7d572f4d6","Reduces sampling to tokens with cumulative probability of p. When set to `0` (default), top_k sampling is used.",[],"Сокращает выборку до лексем с кумулятивной вероятностью p. При значении `0` (по умолчанию) используется выборка top_k.",[],{"_id":3182,"key":3183,"title":3184,"model":3082,"modelKey":3101,"tooltipContent":3185,"step":38,"max":65,"min":30,"defaultValue":3186,"options":3187,"settingType":43,"__v":30,"isAdvanced":61,"fileSource":28,"valueType":44,"description":3185,"ruDescription":3188,"ruTitle":3189,"fileTypes":3190},"65c4ebec1415e4c7d572f4d7","classifier_free_guidance","Classifier Free Guidance","Increases the influence of inputs on the output. Higher values produce lower-varience outputs that adhere more closely to inputs.","3",[],"Увеличивает влияние входов на выход. При больших значениях получаются выходы с меньшей вариативностью, которые более тесно связаны с входами.","Классификатор Бесплатное руководство",[],{"_id":3192,"key":3193,"title":3194,"model":3082,"modelKey":3101,"tooltipContent":3195,"options":3196,"settingType":94,"__v":30,"accept":3197,"step":38,"fileSource":28,"fileType":14,"description":3195,"ruDescription":3198,"ruTitle":3199,"fileTypes":3200},"65ca43f12a8b955e6323b6f6","input_audio","Reference audio ","Match the style of your own reference audio file",[],"audio/*","Соответствие стилю вашего собственного эталонного аудиофайла","Эталонный звук",[],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/musicgen-correct1.png","2025-09-03T23:45:44.513Z","2024-08-27T14:28:32.720Z",[],[3206,3207,3208],"68a9d31be3ac04ad89b91e86","68a9d31be3ac04ad89b91e88","68a9d31be3ac04ad89b91e8a","https://audiocraft.metademolab.com/musicgen.html","2024-01-30T10:07:00.000Z","MusicGen is a versatile AI model for creating original music from text descriptions or audio examples. It lets users specify genre, mood, tempo, and instrumentation to produce polished background tracks, jingles, or full musical ideas. You can either type a prompt (for example: “upbeat lo-fi guitar with mellow keys, 90 BPM”) or supply an audio clip to continue or mimic a style — ideal for remixes, mashups, or extending short melodies. MusicGen supports both text-to-audio and audio-to-audio workflows, giving creators practical ways to prototype and finalize music quickly.\n\nDesigned for ease of use, MusicGen is suitable for hobbyists, video producers, game developers, and sound designers who need fast, customizable music without deep music-production experience. It outputs high-quality samples that are ready for use in videos, podcasts, games, or demo tracks, and offers controls over tempo, mood, and instrumentation to match project needs. Multiple model sizes let you balance quality and compute resources, and the model was trained on a broad set of licensed music to produce diverse results.\n\nWhat makes MusicGen particularly useful is its blend of quality, controllability, and support for audio references — you can get both fresh compositions from text and faithful continuations of an existing piece. Limitations to be aware of: vocal synthesis can be less realistic than instrumental output, and prompts in languages other than English may produce variable results depending on training coverage. Overall, MusicGen streamlines music creation, enabling fast iteration and creative exploration across personal and commercial projects.","Генерирует качественную музыку по тексту или аудиопримерам с управлением","MusicGen — универсальная модель ИИ для создания музыки по текстовым описаниям или аудиопримерам. Она позволяет задавать жанр, настроение, темп и инструментацию для получения готовых фоновых треков, джинглов или полноценных музыкальных идей. Вы можете ввести текстовый запрос (например: «энергичный lo-fi с гитарой и мягкими клавишными, 90 BPM») или подать аудиоклип, чтобы продолжить или сымитировать стиль — это удобно для ремиксов, мэшапов и расширения коротких мелодий. MusicGen поддерживает как text-to-audio, так и audio-to-audio сценарии, давая создателям практичные инструменты для быстрого прототипирования и финализации музыки.\n\nСозданная с упором на простоту использования, модель подходит и любителям, и видео/игровым продюсерам, и саунд-дизайнерам, которым нужна быстрая и настраиваемая музыка без глубоких знаний продакшена. Она генерирует качественные образцы, готовые для использования в видео, подкастах, играх или демо-треках, и предоставляет управление темпом, настроением и инструментами для соответствия требованиям проекта. Наличие нескольких размеров модели позволяет подобрать компромисс между качеством и вычислительными ресурсами; модель обучена на большом наборе лицензированной музыки для разнообразного звучания.\n\nЧто делает MusicGen особенно полезной — сочетание качества, управляемости и поддержки аудиореференсов: вы получаете как новые композиции из текста, так и правдоподобные продолжения существующих фрагментов. К ограничениям относятся менее реалистичное воспроизведение вокала и возможная нестабильность при запросах на языках, отличных от английского. В целом MusicGen упрощает создание музыки, ускоряет итерации и расширяет творческие возможности для личных и коммерческих проектов.",[63,64],{"bpm":3104,"duration":3114,"model_version":3126,"normalization_strategy":3145,"temperature":449,"top_k":3170,"top_p":439,"classifier_free_guidance":3186},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":3217,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":3218,"key":3219,"label":3220,"contextCapacity":82,"maxTokens":65,"type":14,"generationType":3095,"generationTypes":3221,"api":85,"settingConfigs":3222,"replicateId":3250,"cost":806,"iconUrl":2765,"previewImageUrl":3251,"description":3252,"__v":555,"generationCount":3253,"isAdminModel":12,"isPromptRequired":12,"bannerImageUrl":3254,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"secondCost":1221,"stepPrice":30,"position":751,"examples":3255,"isBanned":12,"isOutdated":12,"longDescription":3256,"percs":3257,"updatedAt":3262,"createdAt":3263,"githubUrl":3264,"licenseUrl":3265,"releaseDate":3266,"ruDescription":3267,"ruLongDescription":3268,"isAvailableAfterAuth":61,"replicateApiType":117,"configValue":3269},[63,64],"65d374bb1207fdb2de308642","sakemin/musicgen-remixer","MusicGen Remixer",[3095],[3223,3237],{"fileTypes":3224,"_id":3225,"key":3121,"model":3218,"title":3122,"tooltipContent":3226,"step":38,"options":3227,"settingType":282,"__v":30,"defaultValue":3235,"isAdvanced":12,"position":71,"isClearable":61,"valueType":215,"fileSource":28,"description":3226,"ruDescription":3236,"ruTitle":3138},[],"65d374bb1207fdb2de308644","Computations take longer when using `large` or `stereo` models.",[3228,3230,3233],{"key":3229,"value":3229,"label":3229},"stereo-chord",{"key":3231,"value":3232,"label":3232}," stereo-chord-large","chord-large",{"key":3234,"value":3235,"label":3235},"chord","stereo-chord-large","Вычисления занимают больше времени при использовании `больших` или `стерео` моделей.",{"fileTypes":3238,"_id":3239,"key":3240,"model":3218,"title":3241,"tooltipContent":3242,"accept":3197,"step":38,"options":3243,"settingType":94,"fileType":14,"__v":30,"isAdvanced":61,"isRequired":61,"fileSource":28,"description":3242,"ruDescription":3248,"ruTitle":3249},[],"65d374bb1207fdb2de308646","music_input","Input Track","Upload a track that will be remixed",[3244,3245,3246,3247],{"key":3229,"value":3229,"label":3229},{"key":3231,"value":3232,"label":3232},{"key":3234,"value":3235,"label":3235},{"key":3232,"value":3234,"label":3234},"Загрузите трек, который будет ремикширован","Входная дорожка","sakemin/musicgen-remixer:0b769f28e399c7c30e4f2360691b9b11c294183e9ab2fd9f3398127b556c86d7","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/remixer-preview.png","Remix and customize AI-generated music with chord-aware controls",265,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/remixer-banner.png",[],"MusicGen Remixer extends AI music creation by letting you remix and tailor AI-generated tracks quickly and intuitively. Designed for creators who need fast, high-quality music for videos, games, films, podcasts or personal projects, the Remixer accepts an existing MusicGen output (audio-to-audio) and lets you modify tempo, melody, harmony, arrangement and instrumentation. It supports both text conditioning and chord progressions, so remixes stay musically coherent and reflect your genre, mood or scene descriptions.\n\nThe web-friendly interface provides interactive controls and preset parameters (genre, mood, tempo, instruments) so you can iterate without deep production skills. Swap instruments, add effects, change chord voicings or nudge melodies until a piece fits your project. Because it’s chord-aware, it produces harmonically consistent results that often sound more natural than melody-only tools. Generation is fast, enabling rapid experimentation and multiple versions to find the right fit.\n\nMusicGen Remixer is free to use, lowering the barrier for hobbyists, students and professionals. Typical workflows include producing background tracks for social media, composing adaptive game music, refining film cues, or learning composition through guided remixing. It’s best used as an AI-driven composition and remix tool — for advanced mixing, mastering or sample-level editing you’ll likely combine Remixer outputs with a traditional DAW.\n\nLimitations include dependence on the quality of source tracks and prompts — poor inputs may limit output quality — and some advanced customizations may require trial and musical judgment. Overall, MusicGen Remixer provides fast, flexible, chord-aware remixing that helps creators turn AI-generated ideas into practical, project-ready music.",[3258,3259,3260,3261],"68a9d3bee3ac04ad89b91eb4","68a9d3bee3ac04ad89b91eb6","68a9d3bfe3ac04ad89b91eb8","68a9d3bfe3ac04ad89b91eba","2025-08-23T14:44:15.279Z","2024-09-11T10:10:38.536Z","https://github.com/sakemin/cog-musicgen-remixer","https://github.com/sakemin/cog-musicgen-remixer/blob/master/LICENSE","2023-11-02T10:11:00.000Z","Ремикшируйте и настраивайте AI‑музыку с поддержкой аккордов","MusicGen Remixer расширяет возможности создания музыки с помощью ИИ, позволяя быстро и удобно ремикшировать и адаптировать сгенерированные треки. Инструмент создан для авторов, которым нужна быстрая, качественная музыка для видео, игр, фильмов, подкастов или личных проектов. Remixer принимает существующий результат MusicGen (audio-to-audio) и позволяет изменять темп, мелодию, гармонию, аранжировку и инструментацию. Поддержка текстовых описаний и прогрессий аккордов помогает сохранять гармоническую согласованность ремиксов и отражать желаемый жанр, настроение или сцену.\n\nВеб‑интерфейс с удобными элементами управления и предустановленными параметрами (жанр, настроение, темп, инструменты) делает итерации простыми даже без глубоких навыков продакшна. Можно менять инструменты, добавлять эффекты, корректировать аккорды или мелодии до получения нужного результата. Благодаря учету аккордов ремиксы звучат более естественно по сравнению с моделями, работающими только с мелодией. Генерация происходит быстро, что обеспечивает возможность быстрого тестирования вариантов.\n\nMusicGen Remixer доступен бесплатно, что снижает барьеры для хобби‑создателей, студентов и профессионалов. Типичные сценарии использования: фоновая музыка для соцсетей, адаптивные игровые композиции, доработка киносаундтреков и обучение композиции через практику ремикса. Для продвинутой обработки, сведения и мастеринга всё же рекомендуется сочетать выходы Remixer с традиционными DAW.\n\nОграничения включают зависимость от качества исходного трека и подсказок — при плохом вводе качество результата может снизиться — а также то, что глубокая тонкая настройка иногда требует музыкального опыта. В целом, Remixer предлагает быстрый, гибкий и гармонически корректный способ превратить идеи ИИ в практичную музыку.",{"model_version":3235},{"_id":3271,"key":3272,"label":3273,"shortLabel":3273,"description":3274,"isInstantModel":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"ruDescription":3275,"releaseDate":3276,"ruLongDescription":3277,"contextCapacity":462,"maxTokens":82,"generationCount":3278,"type":63,"generationType":83,"generationTypes":3279,"api":85,"settingConfigs":3280,"percs":3292,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":3297,"replicateId":3298,"replicateApiType":6,"outputPath":7,"cost":3299,"gemTokenCost":40,"iconUrl":1889,"previewImageUrl":3300,"websiteUrl":3301,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":3302,"examples":3303,"createdAt":3307,"updatedAt":3308,"__v":126,"descriptionForAI":3309,"configValue":3310},"68b738fd9a409ff005d4b7e1","google/nano-banana","Nano Banana","Google's latest image editing model in Gemini 2.5","Новейшая модель редактирования изображений от Google в Gemini 2.5","2025-08-26T21:08:24.983Z","\u003Cp>Продвинутая модель редактирования изображений от Google, которая превосходно преобразует и модифицирует изображения на основе текстовых запросов. Часть пакета Gemini 2.5, предлагающая точный контроль над модификациями изображений.\u003C/p>",917184,[83,691],[3281],{"_id":3282,"key":3283,"model":3271,"title":3284,"tooltipContent":3285,"description":3286,"ruTitle":3287,"ruDescription":3288,"accept":92,"position":38,"options":3289,"settingType":94,"fileTypes":3290,"fileSource":1151,"isRequired":12,"valueType":3291,"__v":30,"allowMultiple":61},"68b738fd9a409ff005d4b7e3","image_input","Images","Upload images to transform or use as reference. Supports multiple images for better editing results.","Input images to transform or use as reference (supports multiple images)","Входные изображения","Входные изображения для преобразования или использования в качестве референса (поддерживает несколько изображений)",[],[63],"array",[3293,3294,3295,3296],"68b738fd9a409ff005d4b7e7","68b738fd9a409ff005d4b7e9","68b738fd9a409ff005d4b7eb","68b738fd9a409ff005d4b7ed",[63],"f0a9d34b12ad1c1cd76269a844b218ff4e64e128ddaba93e15891f47368958a0",160,"https://tjzk.replicate.delivery/models_models_featured_image/ed879e99-71b5-4689-bed3-e7305e35a28a/this.png","https://replicate.com/google/nano-banana",0.039,[3304,3305,3306],"Make the sheets in the style of the logo. Make the scene natural.","Transform this image to match the artistic style of the reference","Edit the lighting and colors to create a more dramatic effect","2025-09-02T18:35:41.731Z","2025-09-13T14:27:34.372Z","BEST MODEL FOR IMAGE EDITING, IF you are requested to merge/edit/compose/etc images, use this model",{},{"_id":3312,"key":3313,"label":3314,"shortLabel":3314,"description":3315,"isInstantModel":12,"isReasoningModel":12,"ruDescription":3316,"releaseDate":3317,"ruLongDescription":3318,"contextCapacity":30,"maxTokens":30,"generationCount":3319,"type":2674,"generationType":2677,"generationTypes":3320,"api":85,"settingConfigs":3321,"percs":3336,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":12,"supportFiles":61,"supportedFileTypes":3340,"replicateId":3341,"replicateApiType":6,"outputPath":7,"cost":3342,"gemTokenCost":817,"iconUrl":3343,"previewImageUrl":3344,"bannerImageUrl":3344,"websiteUrl":3345,"licenseUrl":327,"githubUrl":327,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":3346,"createdAt":3347,"updatedAt":3348,"__v":71,"isAvailableAfterAuth":61,"isBanned":12,"longDescription":3349,"descriptionForAI":3350,"configValue":3351},"689a6c52a460069e0c0906c4","bytedance/omni-human","Omni-Human","Generate realistic, lip-synced human videos from a single image","Генерирует реалистичные, слипсинкованные видео людей из одного изображения","2025-07-31T18:32:39.994Z","\u003Cp>Omni-Human — продвинутая модель генерации видео, которая превращает минимальные входные данные — например, одно фото плюс сигналы движения (аудио, видео или поза тела) — в высокореалистичные видео с синхронизированными губами. Модель объединяет несколько типов входа одновременно, поэтому вы можете управлять естественными мимикой, движением головы, жестикуляцией рук и полной анимацией тела с помощью аудио или данных позы, а также задавать стиль через текстовые подсказки или референсы. Модель особенно точна при создании синхронизированной речи и пения, включая автоматическое соотнесение слов с музыкальной партитурой. Помимо людей, Omni-Human умеет анимировать животных, предметы и стилизованные персонажи, поддерживает разные художественные стили, соотношения сторон и произвольную длину видео — подходя как для портретных, так и для полнотельных сцен. Практическая польза: быстрая генерация цифровых аватаров и виртуальных инфлюенсеров, реалистичные ролики для маркетинга и бренд‑амбассадоров, AI‑визуализации для кино и музыкальных клипов, а также ускоренное создание прототипов для игр и анимации. Модель устойчива к разным углам съемки (включая профиль и ракурсы снизу) и лучше переносит вариативность качества фото, чем многие аналоги. Ограничения: качество результата зависит от исходных изображений и аудио, требуются значительные вычислительные ресурсы для сложных задач, а доступ может быть ограничен платформой или лицензией. Для оптимального результата предоставляйте четкие референс‑изображения и качественные сигналы движения. В целом Omni-Human упрощает создание живых, выразительных видео из минимальных материалов, позволяя быстрее и с меньшими затратами получать профессиональные, синхронизированные анимации.\u003C/p>",1858,[2677],[3322,3328],{"_id":3323,"key":63,"model":3312,"title":90,"description":3324,"ruTitle":96,"ruDescription":3325,"accept":92,"position":30,"options":3326,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"valueType":215,"__v":30,"fileTypes":3327},"689a6c52a460069e0c0906c6","Input image containing a human subject, face or character.","Входное изображение, содержащее человека, лицо или персонажа.",[],[],{"_id":3329,"key":14,"model":3312,"title":3330,"description":3331,"ruTitle":3332,"ruDescription":3333,"accept":3197,"position":38,"options":3334,"settingType":94,"fileType":14,"fileSource":28,"isRequired":61,"valueType":215,"__v":30,"fileTypes":3335},"689a6c52a460069e0c0906c8","Audio File","Input audio file (MP3, WAV, etc.). For the best quality outputs audio should be no longer than 15 seconds. After 15 seconds the video quality will begin to degrade. If you have a lot of audio you want to process, we recommend splitting it into 15 second chunks.","Аудиофайл","Входной аудиофайл (MP3, WAV и т.д.). Для лучшего качества вывода аудио должно быть не длиннее 15 секунд. После 15 секунд качество видео начнет ухудшаться. Если у вас много аудио для обработки, рекомендуем разделить его на 15-секундные фрагменты.",[],[],[3337,3338,3339],"68a9e23fe3ac04ad89b921d5","68a9e23fe3ac04ad89b921d7","68a9e240e3ac04ad89b921d9",[63,14],"10001bfedccf0315f8c0ffac688929669d75077cc96c323f8b33a8438d5793b1",3000,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/bytedance.png","https://tjzk.replicate.delivery/models_models_featured_image/980eb6f7-0acd-4739-986e-37c0ce8c8660/replicate-prediction-hp67b527v.mp4","https://replicate.com/bytedance/omni-human",[],"2025-08-11T22:18:58.653Z","2025-09-05T16:41:04.365Z","Omni-Human is an advanced video generation model designed to turn minimal inputs — such as a single photo plus motion signals (audio, video, or body pose) — into highly realistic, lip‑synced human videos. It combines multiple input types at once, so you can drive natural facial expressions, head movements, hand gestures and full-body motion using audio or pose data, and even provide short text prompts or style references to shape the output. The model excels at producing perfectly synchronized speech and singing performances, including automatic lyric alignment for musical content. Beyond humans, Omni-Human can animate animals, objects or stylized characters, and it supports multiple artistic looks, aspect ratios and arbitrary video lengths, making it suitable for portrait, half-body or full‑body productions. Practical benefits for users include quick creation of digital avatars and virtual influencers, realistic lip‑synced clips for marketing and brand spokespeople, AI-driven performances for film and music video previsualization, and rapid prototyping for game and animation assets. The model is robust to varied input angles (including side profiles and upward views) and tolerates different image qualities better than many alternatives. Limitations to consider: output quality depends on the quality of supplied images and audio, complex generation can be computationally intensive, and access may be restricted by platform or licensing. For best results, provide clear reference images and high-quality motion signals. Overall, Omni-Human streamlines the creation of lifelike, expressive videos from minimal resources, enabling creators and professionals to produce polished, lip-synced animations faster and with fewer production constraints.","Model to animate speaking charaters, uses image or video and audio file to create video with voiceover",{},{"_id":3353,"key":3354,"label":3355,"shortLabel":3355,"description":3356,"isInstantModel":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"ruDescription":3357,"releaseDate":3358,"ruLongDescription":3359,"type":2674,"generationType":2675,"generationTypes":3360,"api":85,"settingConfigs":3361,"percs":3405,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":3409,"replicateId":3410,"replicateApiType":117,"outputPath":7,"cost":53,"gemTokenCost":817,"websiteUrl":3411,"githubUrl":3412,"position":65,"secondCost":30,"generationCost":1394,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":3413,"createdAt":3417,"updatedAt":3418,"__v":71,"generationCount":555,"longDescription":3419,"configValue":3420},"689e58c4f47a35ea88fb24b9","zsxkib/pyramid-flow","Pyramid Flow","Generate short, high-quality videos from text or images","Создавайте короткие высококачественные видео из текста или изображений","2024-10-10T20:39:57.745Z","Pyramid Flow — модель для генерации видео, предназначенная для создания коротких динамичных роликов по текстовому описанию или по референсному изображению. Она умеет генерировать визуально привлекательные видео длительностью до ~10 секунд в разрешении 768p при 24 FPS, что делает её удобной для роликов в социальных сетях, трейлеров, рекламных клипов, образовательных фрагментов и демонстраций продуктов. Пользователь может задать текстовый промпт или загрузить изображение, а модель выдаст готовое короткое видео с плавной сменой кадров и согласованным движением.\n\nРабочий процесс модели основан на поэтапной (многоуровневой) доработке изображения и покадровой генерации: большая часть вычислений выполняется на завершающем этапе с высоким разрешением. Это обеспечивает высокое качество финального видео и снижает лишние вычислительные затраты на ранних этапах, что помогает экономить ресурсы. Pyramid Flow обучена на открытых датасетах и поддерживает как текст‑видео, так и изображение‑видео сценарии, предоставляя гибкие варианты ввода для сторителлинга, прототипирования и маркетинга.\n\nПрактические преимущества включают быструю итерацию идей для коротких роликов, согласованное движение между кадрами и хорошие результаты для динамичных сцен и анимаций. Основные сценарии использования: короткие рекламные ролики и трейлеры, обучающие анимации, контент для соцсетей и промо‑материалы. Ограничения: модель оптимизирована для коротких видео (обычно 10–30 секунд), может испытывать сложности с длинным повествованием или абстрактными концепциями и не даёт тонкого контроля над такими деталями, как точные углы камеры или освещение. Финальная визуализация высокого качества всё ещё требует заметных вычислительных ресурсов. В целом, Pyramid Flow — практичное решение для тех, кто нуждается в эффективной генерации качественных коротких видео из текста или изображений без сложной ручной анимации.",[2675,2677],[3362,3368,3374,3383,3391],{"_id":3363,"key":63,"model":3353,"title":90,"description":3364,"ruTitle":96,"ruDescription":3365,"accept":92,"position":38,"options":3366,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"valueType":215,"__v":30,"fileTypes":3367},"689e58c4f47a35ea88fb24bb","Optional input image for image-to-video generation","Дополнительное входное изображение для генерации видео из изображения",[],[],{"_id":3369,"key":35,"model":3353,"title":36,"description":3370,"ruTitle":868,"ruDescription":3371,"position":71,"step":38,"max":40,"min":38,"defaultValue":3186,"options":3372,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":3373},"689e58c4f47a35ea88fb24bd","Duration of the video in seconds (1-3 for canonical mode, 1-10 for non-canonical mode)","Продолжительность видео в секундах (1-3 для канонического режима, 1-10 для неканонического режима)",[],[],{"_id":3375,"key":1385,"model":3353,"title":1386,"description":3376,"ruTitle":3377,"ruDescription":3378,"position":126,"step":225,"max":3379,"min":38,"defaultValue":3380,"options":3381,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":3382},"689e58c4f47a35ea88fb24bf","Guidance Scale for text-to-video generation","Масштаб направления","Масштаб направления для генерации видео из текста",15,"9",[],[],{"_id":3384,"key":3385,"model":3353,"title":3386,"description":3386,"ruTitle":3387,"ruDescription":3388,"position":226,"step":225,"max":3379,"min":38,"defaultValue":864,"options":3389,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":3390},"689e58c4f47a35ea88fb24c1","video_guidance_scale","Video Guidance Scale","Масштаб видео направления","Масштаб направления для видео",[],[],{"_id":3392,"key":3393,"model":3353,"title":3394,"description":3395,"ruTitle":3396,"ruDescription":3397,"position":482,"defaultValue":2802,"options":3398,"settingType":282,"fileSource":28,"valueType":44,"__v":30,"fileTypes":3404},"689e58c4f47a35ea88fb24c3","frames_per_second","Frames Per Second","Frame rate for the generated video","Кадров в секунду","Частота кадров для генерируемого видео",[3399,3401],{"label":3400,"value":555},"8 FPS",{"label":3402,"value":3403},"24 FPS",24,[],[3406,3407,3408],"68a9e2b8e3ac04ad89b921f8","68a9e2b8e3ac04ad89b921fa","68a9e2b8e3ac04ad89b921fc",[63],"zsxkib/pyramid-flow:8e221e66498a52bb3a928a4b49d85379c99ca60fec41511265deec35d547c1fb","https://replicate.com/zsxkib/pyramid-flow","https://github.com/zsxkib/cog-pyramid-flow/tree/replicate",[3414,3415,3416],"A gripping movie trailer showcasing a young female astronaut in a iridescent spacesuit, sporting a red wool knitted space helmet. She explores a bioluminescent alien forest under twin moons, filmed in vivid IMAX quality. Retro sci-fi aesthetic, lens flares","A cinematic shot of a majestic dragon soaring through storm clouds with lightning illuminating its scales","Time-lapse of a blooming flower garden transitioning from dawn to dusk with butterflies dancing around","2025-08-14T21:44:36.550Z","2025-08-23T15:48:08.463Z","Pyramid Flow is a video-generation model built to create short, dynamic clips from text prompts or reference images. It specializes in producing visually compelling videos up to about 10 seconds at 768p and 24 FPS, making it well suited for social media reels, trailers, ads, educational snippets, and quick product demos. Users can supply a text prompt or an image as the starting point and receive a polished short video that emphasizes smooth motion and coherent frame-to-frame transitions.\n\nThe model’s workflow uses progressive multi-resolution refinement and frame-by-frame generation so most computation is concentrated in the final high-resolution pass. This delivers high-quality output while reducing unnecessary compute early on, which helps keep costs down. Pyramid Flow is trained on open datasets and supports both text-to-video and image-to-video workflows, giving creators flexible input options for storytelling, prototyping, or marketing content.\n\nPractical benefits include fast iteration on short concepts, visually consistent motion across frames, and strong results for dynamic scenes and animations. Typical use cases are creating short commercials and trailers, animated educational segments, social media content, and marketing snippets that need quick turnaround. Limitations to consider: the model is optimized for short videos (commonly 10–30 seconds), may struggle with long-form narratives or very abstract concepts, and offers limited fine-grained control over precise camera angles or lighting. High-quality generation still requires reasonable compute resources during the final rendering stage. Overall, Pyramid Flow is a practical solution for teams and creators who need efficient, high-quality short video generation from text or images without complex manual animation workflows.",{"duration":3186,"guidance_scale":3380,"video_guidance_scale":864,"frames_per_second":2802},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":3422,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":3423,"key":3424,"label":3425,"description":3426,"isInstantModel":12,"ruDescription":3427,"ruLongDescription":3428,"type":63,"generationType":691,"generationTypes":3429,"api":85,"settingConfigs":3430,"percs":3482,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"replicateId":3487,"cost":482,"iconUrl":3488,"position":3489,"secondCost":1123,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":3490,"createdAt":3491,"updatedAt":3492,"__v":3493,"generationCount":3494,"isAvailableAfterAuth":12,"replicateApiType":117,"longDescription":3495,"configValue":3496},[63,64],"6745bced2f40465828d76703","zylim0702/qr_code_controlnet","QR Code Generator","Generate branded, secure QR codes with dynamic, trackable designs","Генерируйте брендированные защищённые QR‑коды с динамичным и отслеживаемым дизайном","QR Code Generator — это модель с поддержкой ИИ для создания высоко кастомизируемых, защищённых и готовых к аналитике QR‑кодов. Инструмент даёт маркетологам, организаторам мероприятий, преподавателям и авторам возможность создавать брендированные QR‑коды с логотипами, цветами и визуальными паттернами, оставаясь при этом легко читаемыми сканерами. Благодаря интеллектуальной оптимизации дизайн сочетается с надёжностью сканирования: вы можете добавлять визуальные элементы, не теряя производительности.\n\nПомимо внешнего вида, модель поддерживает динамическое содержимое: можно менять ссылку или сообщение после печати, персонализировать контент в зависимости от пользователей и перенаправлять аудитории на различные целевые страницы. Встроенные средства безопасности выявляют подделки и снижают риск мошенничества, а рекомендации по защите данных помогают сохранить конфиденциальность. Аналитика в реальном времени фиксирует количество сканов, геолокации, типы устройств и временные метки, что позволяет оценивать охват кампаний, проводить A/B‑тесты и повышать конверсию.\n\nПрактичные интеграции позволяют включать сгенерированные QR‑коды в маркетинговые платформы, системы управления мероприятиями или учебные платформы для удобного управления кампаниями. Основные сценарии использования: брендированные рекламные материалы, интерактивные мероприятия, защищённые билеты, учебные ресурсы и персонализированные промо‑предложения. Некоторые продвинутые функции могут быть доступны по подписке, а при использовании аналитики важно учитывать вопросы приватности. В целом, QR Code Generator упрощает создание эффектных и эффективных QR‑кодов, связывающих офлайн‑точки с цифровыми опытом и дающих измеримые результаты.",[691],[3431,3446,3455,3463,3468],{"fileTypes":3432,"_id":3433,"key":1151,"model":3423,"title":3434,"tooltipContent":3435,"description":3435,"position":3436,"defaultValue":3437,"options":3438,"settingType":214,"fileSource":28,"valueType":215,"__v":30},[],"6797df07614da558808c3f59","URL","The website/content your QR Code will point to.",-10,"https://ropewalk.ai",[3439,3442,3444],{"label":3440,"value":3441,"cost":163},"256x256","256",{"label":3443,"value":2593,"cost":163},"512x512",{"label":3445,"value":2626,"cost":163},"768x768",{"fileTypes":3447,"_id":3448,"key":3449,"model":3423,"title":704,"position":482,"step":1122,"max":3450,"min":1122,"defaultValue":2626,"options":3451,"settingType":282,"fileSource":28,"valueType":44,"__v":30},[],"6797df07614da558808c3f5c","image_resolution",2048,[3452,3453,3454],{"label":3440,"value":3441,"cost":163},{"label":3443,"value":2593,"cost":163},{"label":3445,"value":2626,"cost":163},{"fileTypes":3456,"_id":3457,"key":3458,"model":3423,"title":3459,"tooltipContent":3460,"description":3460,"position":126,"step":225,"max":226,"min":38,"defaultValue":3461,"options":3462,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6797df07614da558808c3f5f","qr_conditioning_scale","Controlnet Scale","Represent how close image will look to the requested QR code","1.3",[],{"fileTypes":3464,"_id":3465,"key":306,"model":3423,"title":1379,"tooltipContent":50,"description":50,"step":38,"max":65,"min":817,"defaultValue":3466,"options":3467,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"position":38},[],"6745c8133baaf5e533394c07","40",[],{"fileTypes":3469,"_id":3470,"key":1385,"model":3423,"title":1386,"tooltipContent":3471,"description":3472,"ruTitle":3473,"ruDescription":3474,"position":482,"step":38,"max":478,"min":30,"defaultValue":3380,"options":3475,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6797df07614da558808c3f64","Describes the background of the QR code","How close image will look to the prompt","Приближенность к промпту","Насколько сильно генерация будет следовать промпту",[3476,3479],{"label":3477,"value":3478,"cost":163},"White","white",{"label":3480,"value":3481,"cost":163},"Gray","gray",[3483,3484,3485,3486],"68a9dc1fe3ac04ad89b92082","68a9dc1fe3ac04ad89b92084","68a9dc1fe3ac04ad89b92086","68a9dc1fe3ac04ad89b92088","zylim0702/qr_code_controlnet:628e604e13cf63d8ec58bd4d238474e8986b054bc5e1326e50995fdbc851c557","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/qr-code.svg",469,[],"2024-11-26T12:19:57.839Z","2025-08-23T15:19:59.882Z",16,142,"QR Code Generator is an AI-driven image model for creating highly customizable, secure, and analytics-ready QR codes. It empowers marketers, event organizers, educators, and creators to produce branded QR codes that incorporate logos, colors, and visual patterns while remaining reliably scannable. Using intelligent optimization, the model balances aesthetics and machine-readability so you can add design elements without compromising scan performance.\n\nBeyond looks, the model supports dynamic QR content: you can change the destination or message after printing, personalize content based on user context, and route different audiences to tailored experiences. Built-in security features detect tampering and reduce fraud risk, while recommended best practices help protect encoded data. Real-time analytics capture scan counts, locations, device types, and timestamps so teams can measure campaign reach, A/B test designs, and improve conversion rates.\n\nPractical integrations let you embed generated QR assets into marketing stacks, event platforms, or LMS systems for seamless campaign management. Typical use cases include branded marketing materials, interactive event experiences, secure ticketing, classroom resources, and personalized promotional offers. Performance-focused features have led to measurable improvements in engagement—higher scan and conversion rates—by combining visual appeal with scan reliability.\n\nThe tool is designed for end users: no deep technical knowledge is required to create dynamic, trackable, and secure QR codes. Advanced features may be gated behind subscription tiers, and you should plan for data‑privacy handling when using analytics. Overall, QR Code Generator streamlines the creation of beautiful, effective QR codes that connect physical touchpoints to richer digital experiences and measurable outcomes.",{"url":3437,"image_resolution":2626,"qr_conditioning_scale":3461,"num_inference_steps":3466,"guidance_scale":3380},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":3498,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":3499,"key":3500,"label":3501,"shortLabel":3502,"description":3503,"isInstantModel":12,"ruDescription":3504,"type":63,"generationType":691,"generationTypes":3505,"api":3506,"settingConfigs":3507,"percs":3877,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":177,"iconUrl":3882,"position":30,"secondCost":30,"generationCost":753,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":3883,"createdAt":3884,"updatedAt":3885,"__v":71,"generationCount":3886,"isAvailableAfterAuth":12,"longDescription":3887,"ruLongDescription":3888,"configValue":3889},[63,64],"678a41400f789906d59cf8a9","recraft-v3","Recraft V3","Recraftv3","Create print-ready designs with flawless text, precise layout, and vectors","Создавайте макеты для печати с безупречным текстом, точным расположением и векторной графикой",[],"recraft",[3508,3841],{"fileTypes":3509,"_id":3510,"key":1157,"model":3499,"title":1158,"description":3511,"ruTitle":1174,"ruDescription":3512,"defaultValue":3513,"options":3514,"settingType":282,"fileSource":28,"__v":30},[],"678a41400f789906d59cf8ab","Style used in generation","Задайте стиль вашей генерации","any",[3515,3518,3522,3526,3530,3534,3538,3542,3545,3549,3553,3557,3561,3565,3569,3573,3577,3581,3585,3589,3593,3597,3601,3605,3609,3613,3617,3621,3625,3629,3633,3637,3641,3645,3649,3653,3657,3661,3665,3669,3673,3677,3681,3685,3689,3693,3697,3701,3705,3709,3713,3717,3721,3725,3729,3733,3737,3741,3745,3749,3753,3757,3761,3765,3769,3773,3777,3781,3785,3789,3793,3797,3801,3805,3809,3813,3817,3821,3825,3829,3833,3837],{"label":3516,"ruLabel":3517,"value":3513},"Any","Любой",{"label":3519,"ruLabel":3520,"value":3521},"Black and White","Черно-белое","realistic_image/b_and_w",{"label":3523,"ruLabel":3524,"value":3525},"Enterprise","Корпоративный","realistic_image/enterprise",{"label":3527,"ruLabel":3528,"value":3529},"Evening Light","Вечернее освещение","realistic_image/evening_light",{"label":3531,"ruLabel":3532,"value":3533},"Faded Nostalgia","Выцветшая ностальгия","realistic_image/faded_nostalgia",{"label":3535,"ruLabel":3536,"value":3537},"Forest Life","Лесная жизнь","realistic_image/forest_life",{"label":3539,"ruLabel":3540,"value":3541},"Hard Flash","Жесткая вспышка","realistic_image/hard_flash",{"label":3543,"ruLabel":3543,"value":3544},"HDR","realistic_image/hdr",{"label":3546,"ruLabel":3547,"value":3548},"Motion Blur","Размытие в движении","realistic_image/motion_blur",{"label":3550,"ruLabel":3551,"value":3552},"Mystic Naturalism","Мистический натурализм","realistic_image/mystic_naturalism",{"label":3554,"ruLabel":3555,"value":3556},"Natural Light","Естественное освещение","realistic_image/natural_light",{"label":3558,"ruLabel":3559,"value":3560},"Natural Tones","Натуральные тона","realistic_image/natural_tones",{"label":3562,"ruLabel":3563,"value":3564},"Organic Calm","Органическое спокойствие","realistic_image/organic_calm",{"label":3566,"ruLabel":3567,"value":3568},"Real Life Glow","Естественное свечение","realistic_image/real_life_glow",{"label":3570,"ruLabel":3571,"value":3572},"Retro Realism","Ретро реализм","realistic_image/retro_realism",{"label":3574,"ruLabel":3575,"value":3576},"Retro Snapshot","Ретро снимок","realistic_image/retro_snapshot",{"label":3578,"ruLabel":3579,"value":3580},"Studio Portrait","Студийный портрет","realistic_image/studio_portrait",{"label":3582,"ruLabel":3583,"value":3584},"Urban Drama","Городская драма","realistic_image/urban_drama",{"label":3586,"ruLabel":3587,"value":3588},"Village Realism","Деревенский реализм","realistic_image/village_realism",{"label":3590,"ruLabel":3591,"value":3592},"Warm Folk","Теплый фольклор","realistic_image/warm_folk",{"label":3594,"ruLabel":3595,"value":3596},"2D Art Poster","2D арт постер","digital_illustration/2d_art_poster",{"label":3598,"ruLabel":3599,"value":3600},"2D Art Poster 2","2D арт постер 2","digital_illustration/2d_art_poster_2",{"label":3602,"ruLabel":3603,"value":3604},"Antiquarian","Антикварный","digital_illustration/antiquarian",{"label":3606,"ruLabel":3607,"value":3608},"Bold Fantasy","Смелая фантазия","digital_illustration/bold_fantasy",{"label":3610,"ruLabel":3611,"value":3612},"Child Book","Детская книга","digital_illustration/child_book",{"label":3614,"ruLabel":3615,"value":3616},"Child Books","Детские книги","digital_illustration/child_books",{"label":3618,"ruLabel":3619,"value":3620},"Cover","Обложка","digital_illustration/cover",{"label":3622,"ruLabel":3623,"value":3624},"Crosshatch","Штриховка","digital_illustration/crosshatch",{"label":3626,"ruLabel":3627,"value":3628},"Digital Engraving","Цифровая гравюра","digital_illustration/digital_engraving",{"label":3630,"ruLabel":3631,"value":3632},"Engraving Color","Цветная гравюра","digital_illustration/engraving_color",{"label":3634,"ruLabel":3635,"value":3636},"Expressionism","Экспрессионизм","digital_illustration/expressionism",{"label":3638,"ruLabel":3639,"value":3640},"Freehand Details","Детали от руки","digital_illustration/freehand_details",{"label":3642,"ruLabel":3643,"value":3644},"Grain","Зернистость","digital_illustration/grain",{"label":3646,"ruLabel":3647,"value":3648},"Grain 20","Зернистость 20","digital_illustration/grain_20",{"label":3650,"ruLabel":3651,"value":3652},"Graphic Intensity","Графическая интенсивность","digital_illustration/graphic_intensity",{"label":3654,"ruLabel":3655,"value":3656},"Hand Drawn","Рисованный","digital_illustration/hand_drawn",{"label":3658,"ruLabel":3659,"value":3660},"Hand Drawn Outline","Рисованный контур","digital_illustration/hand_drawn_outline",{"label":3662,"ruLabel":3663,"value":3664},"Handmade 3D","Рукотворное 3D","digital_illustration/handmade_3d",{"label":3666,"ruLabel":3667,"value":3668},"Hard Comics","Жесткие комиксы","digital_illustration/hard_comics",{"label":3670,"ruLabel":3671,"value":3672},"Infantile Sketch","Детский рисунок","digital_illustration/infantile_sketch",{"label":3674,"ruLabel":3675,"value":3676},"Long Shadow","Длинная тень","digital_illustration/long_shadow",{"label":3678,"ruLabel":3679,"value":3680},"Modern Folk","Современный фольклор","digital_illustration/modern_folk",{"label":3682,"ruLabel":3683,"value":3684},"Multicolor","Многоцветный","digital_illustration/multicolor",{"label":3686,"ruLabel":3687,"value":3688},"Neon Calm","Неоновое спокойствие","digital_illustration/neon_calm",{"label":3690,"ruLabel":3691,"value":3692},"Noir","Нуар","digital_illustration/noir",{"label":3694,"ruLabel":3695,"value":3696},"Nostalgic Pastel","Ностальгическая пастель","digital_illustration/nostalgic_pastel",{"label":3698,"ruLabel":3699,"value":3700},"Outline Details","Детали контура","digital_illustration/outline_details",{"label":3702,"ruLabel":3703,"value":3704},"Pastel Gradient","Пастельный градиент","digital_illustration/pastel_gradient",{"label":3706,"ruLabel":3707,"value":3708},"Pastel Sketch","Пастельный эскиз","digital_illustration/pastel_sketch",{"label":3710,"ruLabel":3711,"value":3712},"Pixel Art","Пиксельная графика","digital_illustration/pixel_art",{"label":3714,"ruLabel":3715,"value":3716},"Pop Art","Поп-арт","digital_illustration/pop_art",{"label":3718,"ruLabel":3719,"value":3720},"Pop Renaissance","Поп-ренессанс","digital_illustration/pop_renaissance",{"label":3722,"ruLabel":3723,"value":3724},"Street Art","Уличное искусство","digital_illustration/street_art",{"label":3726,"ruLabel":3727,"value":3728},"Tablet Sketch","Эскиз на планшете","digital_illustration/tablet_sketch",{"label":3730,"ruLabel":3731,"value":3732},"Urban Glow","Городское свечение","digital_illustration/urban_glow",{"label":3734,"ruLabel":3735,"value":3736},"Urban Sketching","Городской скетчинг","digital_illustration/urban_sketching",{"label":3738,"ruLabel":3739,"value":3740},"Vanilla Dreams","Ванильные мечты","digital_illustration/vanilla_dreams",{"label":3742,"ruLabel":3743,"value":3744},"Young Adult Book","Книга для молодежи","digital_illustration/young_adult_book",{"label":3746,"ruLabel":3747,"value":3748},"Young Adult Book 2","Книга для молодежи 2","digital_illustration/young_adult_book_2",{"label":3750,"ruLabel":3751,"value":3752},"SVG: Bold Stroke","SVG: Жирный штрих","vector_illustration/bold_stroke",{"label":3754,"ruLabel":3755,"value":3756},"SVG: Chemistry","SVG: Химия","vector_illustration/chemistry",{"label":3758,"ruLabel":3759,"value":3760},"SVG: Colored Stencil","SVG: Цветной трафарет","vector_illustration/colored_stencil",{"label":3762,"ruLabel":3763,"value":3764},"SVG: Contour Pop Art","SVG: Контурный поп-арт","vector_illustration/contour_pop_art",{"label":3766,"ruLabel":3767,"value":3768},"SVG: Cosmics","SVG: Космос","vector_illustration/cosmics",{"label":3770,"ruLabel":3771,"value":3772},"SVG: Cutout","SVG: Вырезка","vector_illustration/cutout",{"label":3774,"ruLabel":3775,"value":3776},"SVG: Depressive","SVG: Депрессивный","vector_illustration/depressive",{"label":3778,"ruLabel":3779,"value":3780},"SVG: Editorial","SVG: Редакционный","vector_illustration/editorial",{"label":3782,"ruLabel":3783,"value":3784},"SVG: Emotional Flat","SVG: Эмоциональный флэт","vector_illustration/emotional_flat",{"label":3786,"ruLabel":3787,"value":3788},"SVG: Engraving","SVG: Гравюра","vector_illustration/engraving",{"label":3790,"ruLabel":3791,"value":3792},"SVG: Infographical","SVG: Инфографический","vector_illustration/infographical",{"label":3794,"ruLabel":3795,"value":3796},"SVG: Line Art","SVG: Линейное искусство","vector_illustration/line_art",{"label":3798,"ruLabel":3799,"value":3800},"SVG: Line Circuit","SVG: Линейная схема","vector_illustration/line_circuit",{"label":3802,"ruLabel":3803,"value":3804},"SVG: Linocut","SVG: Линогравюра","vector_illustration/linocut",{"label":3806,"ruLabel":3807,"value":3808},"SVG: Marker Outline","SVG: Контур маркером","vector_illustration/marker_outline",{"label":3810,"ruLabel":3811,"value":3812},"SVG: Mosaic","SVG: Мозаика","vector_illustration/mosaic",{"label":3814,"ruLabel":3815,"value":3816},"SVG: Naivector","SVG: Наивектор","vector_illustration/naivector",{"label":3818,"ruLabel":3819,"value":3820},"SVG: Roundish Flat","SVG: Округлый флэт","vector_illustration/roundish_flat",{"label":3822,"ruLabel":3823,"value":3824},"SVG: Segmented Colors","SVG: Сегментированные цвета","vector_illustration/segmented_colors",{"label":3826,"ruLabel":3827,"value":3828},"SVG: Sharp Contrast","SVG: Резкий контраст","vector_illustration/sharp_contrast",{"label":3830,"ruLabel":3831,"value":3832},"SVG: Thin","SVG: Тонкий","vector_illustration/thin",{"label":3834,"ruLabel":3835,"value":3836},"SVG: Vector Photo","SVG: Векторное фото","vector_illustration/vector_photo",{"label":3838,"ruLabel":3839,"value":3840},"SVG: Vivid Shapes","SVG: Яркие формы","vector_illustration/vivid_shapes",{"fileTypes":3842,"_id":3843,"key":3844,"model":3499,"title":3845,"description":163,"ruTitle":3846,"defaultValue":705,"options":3847,"settingType":282,"fileSource":28,"__v":30},[],"678a41400f789906d59cf8ad","size","Image Size","Размер изображения",[3848,3849,3851,3853,3855,3857,3859,3861,3863,3865,3867,3869,3871,3873,3875],{"label":705,"value":705,"cost":163},{"label":3850,"value":3850,"cost":163},"1365x1024",{"label":3852,"value":3852,"cost":163},"1024x1365",{"label":3854,"value":3854,"cost":163},"1536x1024",{"label":3856,"value":3856,"cost":163},"1024x1536",{"label":3858,"value":3858,"cost":163},"1820x1024",{"label":3860,"value":3860,"cost":163},"1024x1820",{"label":3862,"value":3862,"cost":163},"1024x2048",{"label":3864,"value":3864,"cost":163},"2048x1024",{"label":3866,"value":3866,"cost":163},"1434x1024",{"label":3868,"value":3868,"cost":163},"1024x1434",{"label":3870,"value":3870,"cost":163},"1024x1280",{"label":3872,"value":3872,"cost":163},"1280x1024",{"label":3874,"value":3874,"cost":163},"1024x1707",{"label":3876,"value":3876,"cost":163},"1707x1024",[3878,3879,3880,3881],"68a9dd4de3ac04ad89b920bd","68a9dd4de3ac04ad89b920bf","68a9dd4de3ac04ad89b920c1","68a9dd4de3ac04ad89b920c3","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/recraft.svg",[],"2025-01-17T11:38:40.423Z","2025-09-04T23:17:09.447Z",653,"Recraft V3 is a professional-grade text-to-image model built for graphic designers who need pixel-accurate control, brand consistency, and production-ready outputs. It excels at rendering long, complex text naturally inside compositions and guarantees flawless typographic results regardless of length. Designers can specify exact positions and sizes for every text block and image, enabling multi-object layouts, posters, packaging, and marketing collateral without manual rework.\n\nThe model accepts style references as input so you can match a brand look without retraining: feed it a set of images to tune color, texture, and overall visual language. Recraft V3 also generates vector graphics—pictograms, icons, and scalable illustrations—so outputs are resolution-independent and ready for print or large-format use. An integrated toolbox (AI Eraser, Inpainting, Outpainting, Mockuper, upscalers, background remover, and fine-tuning utilities) supports end-to-end design workflows and rapid iteration.\n\nRecraft V3 “thinks in design”: it composes with professional principles in mind, produces realistic characters and anatomically correct figures, and reduces the need for manual touch-ups. API access lets teams integrate generation, editing, and vector exports into design platforms and automated pipelines. The model is fast and geared toward iterative experimentation—ideal for branding, advertising campaigns, UI assets, and creative concepting.\n\nWhile focused on professional users and workflows (so there’s a learning curve), Recraft V3 streamlines complex tasks designers face daily and saves time by producing high-fidelity, print-ready visuals with precise layout, consistent style, and scalable vector output.","Recraft V3 — это профессиональная модель преобразования текста в изображение, созданная для графических дизайнеров, которым нужна точность макета, согласованность бренда и готовые к производству файлы. Модель превосходно справляется с размещением длинных и сложных текстов в композициях и гарантирует безошибочную типографику вне зависимости от объёма текста. Дизайнеры могут задавать точные позиции и размеры для каждого текстового блока и изображения, что позволяет создавать многообъектные макеты, постеры, упаковку и маркетинговые материалы без ручной доработки.\n\nМодель принимает стилистические референсы, поэтому вы можете добиться фирменного визуала без переобучения: достаточно загрузить набор изображений для заданного стиля (цвет, текстура, общая эстетика). Recraft V3 умеет генерировать векторную графику — пиктограммы, иконки и масштабируемые иллюстрации — что делает результаты независимыми от разрешения и готовыми к печати. Встроенный набор инструментов (AI Eraser, Inpainting, Outpainting, Mockuper, апскейлеры, удаление фона и утилиты для тонкой подстройки) поддерживает полный цикл дизайна и быстрые итерации.\n\nМодель «думает» на языке дизайна: она грамотно компонует кадр, создаёт реалистичных персонажей с анатомически корректными деталями и минимизирует необходимость ручной доработки. API позволяет интегрировать генерацию, редактирование и экспорт векторов в ваши дизайн-инструменты и рабочие процессы. Recraft V3 оптимизирован для быстрой работы и экспериментов — идеально подходит для брендинга, рекламных кампаний, UI-активов и креативных концептов.\n\nХотя инструмент ориентирован на профессиональное использование и требует времени для освоения, он значительно ускоряет выполнение сложных задач, позволяя получать готовые к печати, стильные и масштабируемые результаты с точным расположением элементов.",{"style":3513,"size":705},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":3891,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":3892,"key":3893,"label":3894,"shortLabel":3895,"description":3896,"isInstantModel":12,"type":2674,"generationType":2677,"generationTypes":3897,"api":3898,"settingConfigs":3899,"percs":3917,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":82,"iconUrl":3922,"websiteUrl":3923,"licenseUrl":163,"position":38,"secondCost":30,"generationCost":3924,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":3925,"createdAt":3926,"updatedAt":3927,"__v":126,"generationCount":3928,"ruDescription":3929,"isGenerationTypeRequired":12,"isAvailableAfterAuth":61,"longDescription":3930,"ruLongDescription":3931,"configValue":3932},[63,64],"6705998459aafe9761778761","gen3a_turbo","Runway Gen-3 Alpha Turbo","Runway Gen-3","Generate photorealistic videos from images with cinematic control",[83],"runway",[3900,3907],{"fileTypes":3901,"_id":3902,"key":3903,"model":3892,"title":90,"tooltipContent":3904,"description":3904,"accept":92,"options":3905,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":61,"valueType":215,"__v":30,"ruDescription":3906,"ruTitle":96},[],"6705998459aafe9761778763","promptImage","Upload the image to be transformed into a video.",[],"Загрузите изображение, которое нужно превратить в видеоролик.",{"fileTypes":3908,"_id":3909,"key":3910,"model":3892,"title":3911,"description":3911,"ruTitle":1266,"ruDescription":1266,"defaultValue":3912,"options":3913,"settingType":282,"fileSource":28,"__v":30,"isAdmin":12},[],"676c1738aad2b4c371a9eb18","ratio","Ratio","1280:768",[3914,3915],{"label":3912,"value":3912,"cost":163},{"label":3916,"value":3916,"cost":163},"768:1280",[3918,3919,3920,3921],"68a9da5ae3ac04ad89b92029","68a9da5ae3ac04ad89b9202b","68a9da5ae3ac04ad89b9202d","68a9da5ae3ac04ad89b9202f","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/RUNWAY.png","https://runwayml.com",0.25,[],"2024-10-08T20:43:48.527Z","2025-08-28T11:34:49.477Z",124,"Создаёт фотореалистичные видеоролики из изображений с кинематографичным контролем","Runway Gen-3 Alpha Turbo transforms a single static image or image+text prompt into short, high-fidelity videos with smooth, lifelike motion. Designed for creators who need cinematic results fast, the Turbo variant produces up to 10-second clips (extendable in 8-second increments) and is optimized to render a 10-second video in roughly the same time — enabling rapid iteration and cost-effective production. Users can combine image references and written directions to guide composition, style, and action, and apply fine-grained temporal controls and keyframes to choreograph motion, gestures, and timing precisely. Advanced camera controls let you shape pans, dollies, and movement intensity for a professional cinematic look, while physics-aware simulation handles effects like smoke, flowing fabric, and subtle dynamics for believable scenes and product visualizations. Because the model emphasizes photorealistic human figures and consistent motion, it’s especially useful for filmmakers creating B-roll, lifelike character shorts, or cinematic drone-style shots; artists exploring surreal or expressive sequences; and advertisers producing realistic product demos without expensive shoots. Runway integrates moderation and provenance (C2PA) safeguards to support responsible use. Practical benefits include a fast turnaround, high visual fidelity, and the ability to iterate with visual references and keyframe precision — shortening production cycles and reducing the need for complex on-set setups. Limitations include a per-generation cap of 10 seconds (requiring incremental extensions for longer narratives) and a learning curve to master advanced controls. Access and deep customization may be limited to Runway’s platform and partners.","Runway Gen-3 Alpha Turbo превращает одиночное статическое изображение или сочетание изображения и текстовой подсказки в короткие, высококачественные видеоролики с плавной и правдоподобной динамикой. Turbo-версия оптимизирована для скорости: клип длительностью до 10 секунд можно сгенерировать примерно за то же время, что позволяет быстро итераировать и экономить ресурсы. Видео можно расширять шагами по 8 секунд. Пользователи могут комбинировать визуальные референсы и текстовые указания для точной настройки композиции, стиля и действий; доступны тонкие временные настройки и кейфреймы для хореографии движений, жестов и тайминга. Расширенные камеральные управления дают возможность задавать панорамы, «долли»-движения и интенсивность съемки для профессионального кинематографического вида, а имитация физических эффектов обрабатывает дым, текучие ткани и другие деликатные динамики для реалистичных сцен и демонстраций продуктов. Модель особенно полезна для кинопроизводства (B-roll, правдоподобные персонажи, кинематографичные кадры), художников и рекламных команд, которым нужны реалистичные анимации без сложной съёмки. Встроенные механизмы модерации и стандарты происхождения (C2PA) помогают обеспечить ответственное использование. Практические преимущества — высокая скорость, визуальное качество и возможность итераций с референсами и кейфреймами, что сокращает производственные циклы. Ограничения: максимальная длительность одного генерации 10 секунд (для более длинных сцен требуется поэтапное расширение) и необходимость освоения тонких настроек. Доступ и кастомизация могут быть ограничены экосистемой Runway.",{"ratio":3912},{"_id":3934,"key":3935,"label":3936,"type":63,"generationType":691,"generationTypes":3937,"api":85,"settingConfigs":3938,"isPromptRequired":61,"replicateId":3963,"cost":817,"description":3964,"position":3965,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":226,"generationCount":3966,"bannerImageUrl":3967,"iconUrl":3968,"previewImageUrl":3967,"updatedAt":3969,"isAdminModel":12,"examples":3970,"isBanned":12,"isOutdated":12,"createdAt":3974,"percs":3975,"websiteUrl":3980,"releaseDate":3981,"licenseUrl":3982,"ruDescription":3983,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":117,"supportFiles":12,"supportedFileTypes":3984,"tokenStrategy":67,"isAvailableAfterAuth":12,"configValue":3985},"6657c89fba12c77ac0dab7f6","chenxwh/sdxl-flash","SDXL Flash",[691],[3939,3944,3948,3952,3956],{"fileTypes":3940,"_id":3941,"key":206,"model":3934,"title":207,"tooltipContent":207,"defaultValue":3942,"options":3943,"settingType":214,"fileSource":28,"isRequired":12,"valueType":215,"__v":30,"description":207,"ruDescription":1181,"ruTitle":1181},[],"6657c89fba12c77ac0dab7fa","(deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation, NSFW",[],{"fileTypes":3945,"_id":3946,"key":2587,"model":3934,"title":2588,"tooltipContent":2588,"step":555,"max":3450,"min":2825,"defaultValue":1787,"options":3947,"settingType":43,"fileType":63,"fileSource":28,"isRequired":61,"valueType":44,"__v":30,"description":2588,"ruDescription":2613,"ruTitle":2613},[],"6657c89fba12c77ac0dab7fc",[],{"fileTypes":3949,"_id":3950,"key":2617,"model":3934,"title":2618,"tooltipContent":2618,"step":555,"max":3450,"min":2825,"defaultValue":1787,"options":3951,"settingType":43,"fileType":63,"fileSource":28,"isRequired":61,"valueType":44,"__v":30,"description":2618,"ruDescription":2634,"ruTitle":2634},[],"6657c89fba12c77ac0dab7fe",[],{"fileTypes":3953,"_id":3954,"key":1385,"model":3934,"title":1386,"tooltipContent":1386,"max":817,"min":38,"defaultValue":3186,"options":3955,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30,"step":38,"description":1386,"ruDescription":2531,"ruTitle":2531},[],"6657c89fba12c77ac0dab800",[],{"fileTypes":3957,"_id":3958,"key":306,"model":3934,"title":3959,"tooltipContent":3959,"max":806,"min":38,"defaultValue":3960,"options":3961,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30,"step":38,"description":3959,"ruDescription":3962,"ruTitle":3962},[],"6657c89fba12c77ac0dab802","Num Inference Steps","15",[],"Шаги численного вывода","chenxwh/sdxl-flash:001bb81139b01780380407b4106ac681df46108e002eafbeb9ccb2d8faca42e1","Fast sdxl with higher quality",363,187,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sdflash-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/stability-model.png","2025-09-04T00:38:46.032Z",[3971,3972,3973],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_456149882339.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_1589148163365.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_177729678860.webp","2024-09-01T13:50:12.362Z",[3976,3977,3978,3979],"672e31b4222833d65e6e225f","672e3117222833d65e6e220b","672e31b4222833d65e6e2263","672e31b4222833d65e6e2266","https://huggingface.co/sd-community/sdxl-flash","2024-05-19T09:45:00.000Z","https://huggingface.co/spaces/CompVis/stable-diffusion-license","Быстрый sdxl с высоким качеством",[63,64],{"negative_prompt":3942,"width":1787,"height":1787,"guidance_scale":3186,"num_inference_steps":3960},{"_id":3987,"key":3988,"label":3989,"shortLabel":3989,"description":3990,"isInstantModel":12,"isReasoningModel":12,"ruDescription":3991,"releaseDate":3992,"ruLongDescription":3993,"contextCapacity":3994,"maxTokens":3994,"generationCount":3995,"type":63,"generationType":691,"generationTypes":3996,"api":85,"settingConfigs":3997,"percs":4147,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":61,"supportedFileTypes":4152,"replicateId":4153,"replicateApiType":117,"outputPath":7,"cost":3379,"gemTokenCost":4037,"iconUrl":4154,"previewImageUrl":4154,"websiteUrl":4155,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":1621,"tokenStrategy":67,"oneImageCost":30,"examples":4156,"createdAt":4160,"updatedAt":4161,"__v":71,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":4162,"configValue":4163},"689a7572a460069e0c0a2125","swartype/sdxl-pixar","SDXL Pixar","Generate Pixar-style poster art from text or image inputs","Генирует постерное искусство в стиле Pixar по тексту или изображению","2023-10-21T10:32:49.911Z","SDXL Pixar — это дообученная модель для генерации изображений по тексту и изображению, создающая высококачественные иллюстрации в стиле Pixar: постеры, персонажей и сценки. Модель предназначена для тех, кто хочет получить яркий, выразительный визуал в духе Pixar без длительной ручной отрисовки. Она даёт кинематографичное освещение, насыщенные композиции и эмоционально читаемых персонажей, что делает её полезной для концепт-артов, промо-изображений и превизуализации. Пользователь может вводить текстовый промпт или использовать исходное изображение для img2img и инпэйнтинга с маской, чтобы локально править картинку. Параметры генерации — размер изображения, seed, guidance scale и число шагов — позволяют настроить соотношение творчества и точности; дополнительные проходы и веса LoRA дают возможность тонкой стилизации и детализации. На практике SDXL Pixar помогает художникам и дизайнерам быстро прогонять идеи персонажей, концептов постеров, настроений и композиций, уменьшая время от идеи до готового визуала. Модель отлично подходит для маркетинговых макетов, иллюстраций для питча, концептов и сторибордов, где нужен узнаваемый Pixar-подобный стиль. Из ограничений: модель специализирована на определённом стиле и может показывать менее удачные результаты вне этой области; она генерирует только статичные изображения, а для анимации потребуются отдельные инструменты; также качественный результат сильно зависит от ясности промпта и доступных вычислительных ресурсов. SDXL Pixar сочетает удобство использования с высокой степенью соответствия стилю, давая практичный инструмент для быстрой генерации полированных Pixar-подобных изображений.",77,654294,[691,83],[3998,4006,4012,4019,4028,4034,4040,4060,4070,4076,4094,4104,4114,4124,4131,4139],{"_id":3999,"key":2587,"model":3987,"title":2588,"description":4000,"ruTitle":2613,"ruDescription":4001,"position":38,"step":4002,"max":3450,"min":4003,"defaultValue":1787,"options":4004,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4005},"689a7572a460069e0c0a2127","Width of output image","Ширина выходного изображения",64,512,[],[],{"_id":4007,"key":2617,"model":3987,"title":2618,"description":4008,"ruTitle":2634,"ruDescription":4009,"position":71,"step":4002,"max":3450,"min":4003,"defaultValue":1787,"options":4010,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4011},"689a7572a460069e0c0a2129","Height of output image","Высота выходного изображения",[],[],{"_id":4013,"key":206,"model":3987,"title":207,"description":4014,"ruTitle":4015,"ruDescription":4016,"position":126,"defaultValue":163,"options":4017,"settingType":214,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4018},"689a7572a460069e0c0a212b","Input Negative Prompt","Негативный промпт","Негативный промпт для исключения нежелательных элементов",[],[],{"_id":4020,"key":4021,"model":3987,"title":4022,"description":4023,"ruTitle":4024,"ruDescription":4025,"position":226,"step":38,"max":226,"min":38,"defaultValue":1820,"options":4026,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4027},"689a7572a460069e0c0a212d","num_outputs","Number of Images","Number of images to output","Количество изображений","Количество генерируемых изображений",[],[],{"_id":4029,"key":1385,"model":3987,"title":1386,"description":2788,"ruTitle":4030,"ruDescription":4031,"position":482,"step":862,"max":53,"min":38,"defaultValue":2528,"options":4032,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4033},"689a7572a460069e0c0a212f","Масштаб руководства","Масштаб для руководства без классификатора. Более высокие значения делают изображение более соответствующим промпту",[],[],{"_id":4035,"key":306,"model":3987,"title":307,"description":2519,"ruTitle":310,"ruDescription":4036,"position":4037,"step":38,"max":806,"min":38,"defaultValue":2080,"options":4038,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4039},"689a7572a460069e0c0a2131","Количество шагов шумоподавления. Больше шагов = лучшее качество, но медленнее",6,[],[],{"_id":4041,"key":286,"model":3987,"title":287,"description":4042,"ruTitle":290,"ruDescription":4043,"position":2723,"defaultValue":2535,"options":4044,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4059},"689a7572a460069e0c0a2133","Scheduler algorithm for denoising","Алгоритм планировщика для шумоподавления",[4045,4046,4048,4051,4054,4056,4058],{"label":300,"value":300},{"label":4047,"value":2540},"DPM Solver Multistep",{"label":4049,"value":4050},"Heun Discrete","HeunDiscrete",{"label":4052,"value":4053},"Karras DPM","KarrasDPM",{"label":4055,"value":2542},"K Euler Ancestral",{"label":4057,"value":2535},"K Euler",{"label":2544,"value":2544},[],{"_id":4061,"key":4062,"model":3987,"title":4063,"description":4064,"ruTitle":4065,"ruDescription":4066,"position":555,"step":225,"max":38,"min":30,"defaultValue":4067,"options":4068,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4069},"689a7572a460069e0c0a2135","lora_scale","LoRA Scale","LoRA additive scale. Only applicable on trained models","Масштаб LoRA","Масштаб добавления LoRA. Применимо только к обученным моделям","0.6",[],[],{"_id":4071,"key":317,"model":3987,"title":318,"description":4072,"ruTitle":321,"ruDescription":4073,"position":414,"defaultValue":163,"isAdvanced":61,"options":4074,"settingType":214,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4075},"689a7572a460069e0c0a2137","Random seed. Leave blank to randomize the seed","Случайное зерно. Оставьте пустым для случайного значения",[],[],{"_id":4077,"key":4078,"model":3987,"title":4079,"description":4080,"ruTitle":4081,"ruDescription":4082,"position":40,"defaultValue":4083,"isAdvanced":61,"options":4084,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4093},"689a7572a460069e0c0a2139","refine","Refine","Refiner model to use","Уточнение","Модель уточнения для использования","no_refiner",[4085,4087,4090],{"label":4086,"value":4083},"No Refiner",{"label":4088,"value":4089},"Expert Ensemble Refiner","expert_ensemble_refiner",{"label":4091,"value":4092},"Base Image Refiner","base_image_refiner",[],{"_id":4095,"key":4096,"model":3987,"title":4097,"description":4098,"ruTitle":4099,"ruDescription":4100,"position":4101,"step":225,"max":38,"min":30,"defaultValue":2810,"isAdvanced":61,"options":4102,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4103},"689a7572a460069e0c0a213b","high_noise_frac","High Noise Fraction","For expert_ensemble_refiner, the fraction of noise to use","Доля высокого шума","Для expert_ensemble_refiner, доля шума для использования",11,[],[],{"_id":4105,"key":4106,"model":3987,"title":4107,"description":4108,"ruTitle":4109,"ruDescription":4110,"position":491,"defaultValue":4111,"isAdvanced":61,"options":4112,"settingType":27,"fileSource":28,"valueType":29,"__v":30,"fileTypes":4113},"689a7572a460069e0c0a213d","apply_watermark","Apply Watermark","Applies a watermark to enable determining if an image is generated","Применить водяной знак","Применяет водяной знак для определения сгенерированного изображения","true",[],[],{"_id":4115,"key":4116,"model":3987,"title":4117,"description":4118,"ruTitle":4119,"ruDescription":4120,"position":4121,"defaultValue":25,"isAdvanced":61,"options":4122,"settingType":27,"fileSource":28,"valueType":29,"__v":30,"fileTypes":4123},"689a7572a460069e0c0a213f","disable_safety_checker","Disable Safety Checker","Disable safety checker for generated images","Отключить проверку безопасности","Отключить проверку безопасности для сгенерированных изображений",13,[],[],{"_id":4125,"key":63,"model":3987,"title":90,"description":4126,"ruTitle":96,"ruDescription":4127,"accept":92,"position":4128,"isAdvanced":61,"options":4129,"settingType":94,"fileType":63,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4130},"689a7572a460069e0c0a2141","Input image for img2img or inpaint mode","Входное изображение для режима img2img или inpaint",14,[],[],{"_id":4132,"key":4133,"model":3987,"title":1449,"description":4134,"ruTitle":4135,"ruDescription":4136,"accept":92,"position":3379,"isAdvanced":61,"options":4137,"settingType":94,"fileType":63,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4138},"689a7572a460069e0c0a2143","mask","Input mask for inpaint mode. Black areas will be preserved, white areas will be inpainted","Маска","Входная маска для режима inpaint. Черные области будут сохранены, белые области будут перерисованы",[],[],{"_id":4140,"key":1185,"model":3987,"title":4141,"description":4142,"ruTitle":4143,"ruDescription":4144,"position":3493,"step":225,"max":38,"min":30,"defaultValue":2810,"isAdvanced":61,"options":4145,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4146},"689a7572a460069e0c0a2145","Prompt Strength","Prompt strength when using img2img / inpaint. 1.0 corresponds to full destruction of information in image","Сила промпта","Сила промпта при использовании img2img / inpaint. 1.0 соответствует полному разрушению информации в изображении",[],[],[4148,4149,4150,4151],"68a9e26ae3ac04ad89b921e0","68a9e26ae3ac04ad89b921e2","68a9e26be3ac04ad89b921e4","68a9e26be3ac04ad89b921e6",[63],"swartype/sdxl-pixar:81f8bbd3463056c8521eb528feb10509cc1385e2fabef590747f159848589048","https://tjzk.replicate.delivery/models_models_cover_image/68125b17-60d7-4949-8984-0d50d736a623/out-0_5.png","https://replicate.com/swartype/sdxl-pixar",[4157,4158,4159],"breathtaking 3D animated movie poster in the style of Pixar with superman at the center and a destroyed city in the background","Pixar style animated poster of a brave princess in a magical forest","3D Pixar movie poster featuring a talking car racing through the desert","2025-08-11T22:57:54.529Z","2025-09-04T00:52:38.372Z","SDXL Pixar is a fine-tuned text-to-image and image-to-image model that creates high-quality, Pixar-inspired poster art, characters, and scenes from simple prompts or reference images. Designed for creators who want the vibrant, expressive look of Pixar animation without lengthy manual illustration, it produces cinematic lighting, rich compositions, and emotionally readable characters ideal for concept exploration, promotional art, and pre-visualization. Users can provide text prompts or use an input image for img2img workflows, including inpainting with masks to modify or refine parts of an image. Generation parameters such as image size, seed, guidance scale, and inference steps let you balance creativity and fidelity; optional refinement passes and LoRA weights enable further stylistic tuning or detail enhancement. Practically, SDXL Pixar helps artists and designers iterate quickly on character designs, poster concepts, mood frames, and scene compositions, reducing the time from idea to polished visual. It’s well-suited for marketing mockups, pitch illustrations, concept art, and storyboarding where a recognizable Pixar-like aesthetic is desired. Because it’s specialized, the model excels at the specific stylized look but may be less effective for unrelated visual styles. Outputs are static images — animators will still need separate tools or pipelines for motion. Also, like other high-fidelity generators, best results come from clear, descriptive prompts and adequate compute for higher-resolution renders. Available through platforms that integrate SDXL models, SDXL Pixar combines ease of use with deep style adherence, giving creators a practical tool for producing polished, Pixar-inspired visuals quickly and with fine control over the final image.",{"width":1787,"height":1787,"negative_prompt":163,"num_outputs":1820,"guidance_scale":2528,"num_inference_steps":2080,"scheduler":2535,"lora_scale":4067,"seed":163,"refine":4083,"high_noise_frac":2810,"apply_watermark":4111,"disable_safety_checker":25,"prompt_strength":2810},{"_id":4165,"key":4166,"label":4167,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"generationTypes":4168,"api":85,"settingConfigs":4169,"isAdminModel":12,"isPromptRequired":61,"replicateId":4226,"cost":53,"iconUrl":3968,"previewImageUrl":4227,"bannerImageUrl":4228,"description":4229,"secondCost":102,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":226,"generationCount":4230,"githubUrl":4231,"licenseUrl":4232,"position":3072,"examples":4233,"isBanned":12,"isOutdated":12,"percs":4234,"updatedAt":4239,"createdAt":4240,"longDescription":4241,"ruDescription":4242,"ruLongDescription":4243,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":117,"supportFiles":12,"supportedFileTypes":4244,"tokenStrategy":67,"isAvailableAfterAuth":12,"configValue":4245},"65e9c65744f732690cf71e42","lucataco/realvisxl-v2.0","SDXL Realism 2.0",[691,83],[4170,4175,4181,4187,4191,4195,4206,4210,4215,4220],{"fileTypes":4171,"_id":4172,"key":206,"model":4165,"title":207,"tooltipContent":2581,"defaultValue":4173,"options":4174,"settingType":214,"isRequired":12,"__v":30,"fileType":63,"step":38,"fileSource":28,"position":38,"description":2581,"ruDescription":2583,"ruTitle":1181},[],"65e9c65744f732690cf71e46","(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), open mouth",[],{"fileTypes":4176,"_id":4177,"key":63,"model":4165,"title":4178,"tooltipContent":2419,"options":4179,"settingType":94,"fileType":63,"isRequired":12,"__v":30,"step":38,"accept":92,"fileSource":28,"description":2419,"ruDescription":2421,"ruTitle":4180},[],"65e9c65744f732690cf71e48","Reference Image",[],"Эталонное изображение",{"fileTypes":4182,"_id":4183,"key":4133,"model":4165,"title":1449,"tooltipContent":4184,"options":4185,"settingType":94,"fileType":63,"isRequired":12,"__v":30,"isAdvanced":61,"step":38,"accept":92,"fileSource":28,"description":4184,"ruDescription":4186,"ruTitle":4135},[],"65e9c65744f732690cf71e4a","Black areas will be preserved, white areas will be inpainted.",[],"Черные участки будут сохранены, белые - закрашены.",{"fileTypes":4188,"_id":4189,"key":2587,"model":4165,"title":2588,"tooltipContent":2588,"step":555,"max":3450,"min":2825,"defaultValue":1787,"options":4190,"settingType":43,"fileType":63,"isRequired":61,"__v":30,"fileSource":28,"valueType":44,"position":126,"description":2588,"ruDescription":2613,"ruTitle":2613},[],"65e9c65744f732690cf71e4c",[],{"fileTypes":4192,"_id":4193,"key":2617,"model":4165,"title":2618,"tooltipContent":2618,"step":555,"max":3450,"min":2825,"defaultValue":1787,"options":4194,"settingType":43,"fileType":63,"isRequired":61,"__v":30,"fileSource":28,"valueType":44,"position":226,"description":2618,"ruDescription":2634,"ruTitle":2634},[],"65e9c65744f732690cf71e4e",[],{"fileTypes":4196,"_id":4197,"key":286,"model":4165,"title":287,"tooltipContent":163,"defaultValue":2540,"options":4198,"settingType":282,"isRequired":61,"__v":30,"isAdvanced":61,"step":38,"valueType":215,"fileSource":28,"description":163,"ruTitle":290},[],"65e9c65744f732690cf71e52",[4199,4200,4201,4202,4203,4204,4205],{"label":300,"value":300},{"label":2540,"value":2540},{"label":4050,"value":4050},{"label":4053,"value":4053},{"label":2542,"value":2542},{"label":2535,"value":2535},{"label":2544,"value":2544},{"fileTypes":4207,"_id":4208,"key":306,"model":4165,"title":3959,"tooltipContent":3959,"max":806,"min":38,"defaultValue":3466,"options":4209,"settingType":43,"isRequired":61,"__v":30,"isAdvanced":61,"step":38,"valueType":44,"fileSource":28,"description":3959,"ruDescription":3962,"ruTitle":3962},[],"65e9c65744f732690cf71e54",[],{"fileTypes":4211,"_id":4212,"key":1385,"model":4165,"title":1386,"tooltipContent":1386,"max":53,"min":38,"defaultValue":4213,"options":4214,"settingType":43,"isRequired":61,"__v":30,"isAdvanced":61,"step":38,"valueType":44,"fileSource":28,"description":1386,"ruDescription":2531,"ruTitle":2531},[],"65e9c65744f732690cf71e56","7",[],{"fileTypes":4216,"_id":4217,"key":1185,"model":4165,"title":1186,"tooltipContent":4218,"max":38,"min":30,"defaultValue":2810,"options":4219,"settingType":43,"isRequired":61,"__v":30,"step":249,"valueType":44,"fileSource":28,"position":71,"description":4218,"ruDescription":1189,"ruTitle":1190},[],"65e9c65744f732690cf71e58"," Controls how much the generation follows the text prompt",[],{"fileTypes":4221,"_id":4222,"key":4062,"model":4165,"title":4223,"tooltipContent":4223,"max":38,"min":30,"defaultValue":4067,"options":4224,"settingType":43,"isRequired":12,"__v":30,"isAdvanced":61,"step":249,"valueType":44,"fileSource":28,"description":4223,"ruDescription":4225,"ruTitle":4225},[],"65e9c65744f732690cf71e5e","Lora Scale",[],"Лора Лестница","lucataco/realvisxl-v2.0:7d6a2f9c4754477b12c14ed2a58f89bb85128edcdd581d24ce58b6926029de08","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sdxl-real-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sdxl-real-banner.png","Generate photorealistic images and portraits with cinematic lighting",752,"https://github.com/lucataco/cog-realvisxl-v2.0","https://huggingface.co/models?license=license%3Aopenrail%2B%2B",[],[4235,4236,4237,4238],"68a9d55be3ac04ad89b91eed","68a9d55be3ac04ad89b91eef","68a9d55be3ac04ad89b91ef1","68a9d55ce3ac04ad89b91ef3","2025-09-06T19:10:36.889Z","2024-09-11T09:55:00.768Z","SDXL Realism 2.0 (Realism Engine SDXL v2.0) is a fine-tuned SDXL model optimized to produce highly photorealistic images with exceptional detail, lighting, and anatomical accuracy. It excels at creating lifelike portraits, product renders, and cinematic scenes by delivering accurate colors, high contrast, and crisp textures. The model handles complex lighting — including reflections, light shafts and HDR-style highlights — which gives images a natural, three-dimensional feel.\n\nUsers benefit from strong facial and anatomical fidelity: realistic skin textures, natural expressions across diverse ethnicities, and reliable anatomy make it especially suitable for portrait work and character visualization. The model also shows improved semantic parsing for in-image text and logos, so signs and simple labels render more consistently than many alternatives. It responds well to straightforward prompts and usually produces consistent, high-quality results with minimal retries, making it accessible for both beginners and professionals.\n\nFor deployment and performance, the model includes an integrated VAE and is provided in SafeTensor format to improve inference efficiency and safer distribution. It supports both text-to-image and image-to-image workflows and can be further specialized with DreamBooth fine-tuning for subject- or style-consistent outputs. For best results, users can apply advanced sampling and upscaling workflows to increase detail and resolution.\n\nLimitations: SDXL Realism 2.0 is tuned for imitation and photorealistic synthesis rather than radically novel artistic concepts; achieving the highest-resolution, hyper-detailed outputs may require substantial GPU resources. Text-in-image rendering, while improved, can still struggle with highly stylized or intricate typography. Overall, it’s a practical tool for photographers, advertisers, concept artists, and content creators who need reliable, photorealistic imagery quickly.","Создаёт фотореалистичные портреты и сцены с киноосвещением","SDXL Realism 2.0 (Realism Engine SDXL v2.0) — это донастроенная модель SDXL, специально оптимизированная для генерации высокореалистичных изображений с выдающейся детализацией, освещением и точностью анатомии. Модель отлично подходит для создания натурных портретов, рендеров продуктов и кинематографичных сцен благодаря точной цветопередаче, высокому контрасту и чётким текстурам. SDXL Realism 2.0 умеет воспроизводить сложные световые эффекты — отражения, световые лучи и HDR-акценты — что придаёт изображениям объём и реалистичность.\n\nПреимущество модели — высокая достоверность лиц и анатомии: натуральные текстуры кожи, естественные выражения для разных этнических групп и корректная передача пропорций, что делает модель особенно полезной для портретной съёмки и визуализации персонажей. Улучшенное семантическое распознавание помогает достоверно генерировать встроенные тексты и логотипы. Модель хорошо реагирует на простые подсказки и стабильно выдаёт качественные результаты с минимальным числом повторных попыток, что удобно как для новичков, так и для профессионалов.\n\nДля развёртывания модель включает интегрированный VAE и распространяется в формате SafeTensor, что повышает эффективность инференса и безопасность распространения. Модель поддерживает text-to-image и image-to-image сценарии и может быть дополнительно адаптирована с помощью DreamBooth для сохранения стиля или конкретных объектов. Для максимального качества рекомендуется использовать продвинутые методы семплинга и апскейлинга.\n\nОграничения: модель ориентирована на фотореалистичное воссоздание, а не на создание радикально новых художественных концепций; генерация сверхвысоких разрешений требует серьёзных ресурсов GPU. Рендеринг сложных стилизованных шрифтов в изображениях всё ещё может давать ошибки. В целом, это практичный инструмент для фотографов, рекламщиков, концепт-художников и создателей контента, которым нужны надёжные фотореалистичные изображения быстро.",[63,64],{"negative_prompt":4173,"width":1787,"height":1787,"scheduler":2540,"num_inference_steps":3466,"guidance_scale":4213,"prompt_strength":2810,"lora_scale":4067},{"_id":4247,"key":4248,"label":4249,"shortLabel":4249,"description":4250,"isInstantModel":12,"isReasoningModel":12,"type":2674,"generationType":2675,"generationTypes":4251,"api":85,"settingConfigs":4252,"percs":4286,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":4290,"replicateId":163,"replicateApiType":6,"cost":795,"position":30,"secondCost":1394,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":4291,"createdAt":4292,"updatedAt":4293,"__v":555,"iconUrl":3343,"generationCount":1691,"outputPath":7,"ruDescription":4294,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":4295,"ruLongDescription":4296,"descriptionForAI":4297,"configValue":4298},"6898d1b2404843301665f60b","bytedance/seedance-1-pro","SeeDANCE 1 Pro","Generate cinematic 5–10s 1080p videos from text or images",[2675,2677],[4253,4257,4263,4275],{"_id":4254,"key":63,"model":4247,"title":398,"accept":92,"options":4255,"settingType":94,"fileType":63,"fileSource":28,"__v":30,"ruTitle":400,"fileTypes":4256},"6898d25c4048433016660c88",[],[],{"_id":4258,"key":35,"model":4247,"title":36,"options":4259,"settingType":282,"fileSource":28,"valueType":44,"__v":30,"ruTitle":37,"defaultValue":864,"fileTypes":4262},"6898d25c4048433016660c8b",[4260,4261],{"label":864,"value":864,"cost":163,"costMultiplier":1820},{"label":841,"value":841,"cost":163,"costMultiplier":227},[],{"_id":4264,"key":703,"model":4247,"title":704,"defaultValue":3008,"options":4265,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":715,"fileTypes":4274},"6898d2a14048433016660cb5",[4266,4269,4271],{"label":4267,"value":4267,"cost":4268},"480p","0,15",{"label":3008,"value":3008,"cost":4270},"0,3",{"label":4272,"value":4272,"cost":4273},"1080p","0,75",[],{"_id":4276,"key":1264,"model":4247,"title":1480,"ruTitle":1266,"defaultValue":1274,"options":4277,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4285},"6898d3084048433016660ce1",[4278,4279,4280,4281,4282,4283,4284],{"label":1274,"value":1274,"cost":163},{"label":1278,"value":1278,"cost":163},{"label":1272,"value":1272,"cost":163},{"label":1280,"value":1280,"cost":163},{"label":1276,"value":1276,"cost":163},{"label":1488,"value":1488,"cost":163},{"label":1490,"value":1490,"cost":163},[],[4287,4288,4289],"68a9e170e3ac04ad89b921b1","68a9e170e3ac04ad89b921b3","68a9e170e3ac04ad89b921b5",[63,64],[],"2025-08-10T17:06:58.587Z","2025-09-11T19:54:06.331Z","Генерируйте кинематографичные 5–10с ролики 1080p из текста или изображений","SeeDANCE 1 Pro is an advanced AI video generator built for producing short, cinematic-quality videos from text prompts or image references. It creates 5–10 second clips at 1080p and 24 FPS with smooth motion, stable multi-shot sequencing, and strong adherence to detailed user instructions. Native multi-shot storytelling keeps subjects, lighting, and style consistent across scene transitions, so creators can produce narrative-driven clips that feel like short film sequences rather than single-shot animations.\n\nThe model supports both text-to-video and image-to-video workflows: you can generate a fully guided video from a descriptive prompt or feed a reference image plus text to animate a specific character or scene. Precise camera control (fixed or dynamic framing, motion cues) and high prompt fidelity allow for professional cinematic effects and reliable reproduction of complex directions. Seed control gives deterministic outputs for repeatable results—useful for iterative production and brand-sensitive work.\n\nSeeDANCE 1 Pro is fast and practical, producing high-resolution clips in roughly 40–50 seconds on typical setups, faster than many competitors. It handles a wide range of visual styles (realistic, anime, illustrative, pixel art) while maintaining motion quality. Typical use cases include marketing and social ads, animated storyboards and concept reels, short-form entertainment, and rapid content iteration for creators and brands.\n\nLimitations: it focuses solely on visuals (no native audio generation) and is optimized for short clips rather than long-form video. Commercial access is provided via APIs and may require integration and licensing. Overall, SeeDANCE 1 Pro is ideal when you need quick, reliable, high-fidelity short videos with cinematic multi-shot storytelling and tight control over visual style and camera dynamics.","\u003Cp>SeeDANCE 1 Pro — продвинутая модель генерации видео, ориентированная на создание коротких кинематографичных роликов из текстовых описаний или референс-изображений. Модель генерирует клипы длиной 5–10 секунд в разрешении 1080p и 24 FPS с плавной анимацией, устойчивой сменой сцен и высокой точностью следования деталям запроса. Встроенная поддержка мультишотов обеспечивает согласованность персонажей, освещения и художественного стиля между сценами, что делает ролики похожими на короткие кинофрагменты, а не на разрозненные кадры.\n\nSeeDANCE 1 Pro работает как в режиме text-to-video, так и image-to-video: можно создать видео только по текстовому сценарию либо анимировать конкретный объект с помощью изображения и подсказки. Модель предоставляет точное управление камерой (фиксированная или динамичная съемка, движение кадра) и хорошо воспринимает подробные указания, что позволяет добиваться профессионального кинематографического результата. Управление seed обеспечивает детерминированный вывод для воспроизводимых и предсказуемых результатов — важно при итеративной работе и для брендированных проектов.\n\nМодель быстра: генерация 1080p клипа занимает примерно 40–50 секунд и быстрее многих аналогов. Она поддерживает разнообразные стили (реализм, аниме, иллюстрации, пиксель-арт) без потери качества движения. Подходящие сценарии использования — маркетинговые и соцмедийные ролики, сториборды и концепт-видео, короткий развлекательный контент и быстрая генерация материалов для создателей и брендов.\n\nОграничения: модель генерирует только визуал — звука нет, и она оптимизирована под короткие клипы, а не для длинных видео. Доступ осуществляется через API и может требовать интеграции и лицензирования. В целом, SeeDANCE 1 Pro идеален, когда нужны быстрые, надежные и высококачественные короткие видео с контролем стиля и кинематографической композицией.\u003C/p>","Best model for video generation at this point",{"duration":864,"resolution":3008,"aspect_ratio":1274},{"_id":4300,"key":4301,"label":4302,"shortLabel":4302,"description":4303,"isInstantModel":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"ruDescription":4304,"releaseDate":4305,"generationCount":4306,"type":2674,"generationType":2675,"generationTypes":4307,"api":85,"settingConfigs":4308,"percs":4377,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":4384,"replicateId":4385,"replicateApiType":6,"outputPath":7,"cost":53,"gemTokenCost":817,"iconUrl":3343,"previewImageUrl":4386,"websiteUrl":4387,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":4388,"createdAt":4389,"updatedAt":4390,"__v":482,"configValue":4391},"68b5ed459a409ff005d41805","bytedance/seedance-1-lite","Seedance 1 Lite","A video generation model that offers text-to-video and image-to-video support for 5s or 10s videos, at 480p and 720p resolution","Модель генерации видео, поддерживающая создание видео из текста и изображений длительностью 5 или 10 секунд в разрешении 480p и 720p","2025-06-18T21:34:07.363Z",571450,[2675,2677],[4309,4315,4324,4332,4344,4357,4368],{"_id":4310,"key":63,"model":4300,"title":90,"description":4311,"ruTitle":96,"ruDescription":4312,"accept":92,"position":38,"options":4313,"settingType":94,"fileTypes":4314,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},"68b5ed459a409ff005d41807","Input image for image-to-video generation","Входное изображение для генерации видео из изображения",[],[63],{"_id":4316,"key":4317,"model":4300,"title":4318,"description":4319,"ruTitle":4320,"ruDescription":4321,"accept":92,"position":71,"options":4322,"settingType":94,"fileTypes":4323,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},"68b5ed459a409ff005d41809","last_frame_image","Last Frame Image","Input image for last frame generation. This only works if an image start frame is given too.","Изображение последнего кадра","Входное изображение для генерации последнего кадра. Работает только при наличии начального кадра.",[],[63],{"_id":4325,"key":35,"model":4300,"title":36,"description":4326,"ruTitle":37,"ruDescription":4327,"position":126,"defaultValue":864,"options":4328,"settingType":282,"fileTypes":4331,"fileSource":28,"isRequired":12,"valueType":44,"__v":30},"68b5ed459a409ff005d4180b","Video duration in seconds","Длительность видео в секундах",[4329,4330],{"label":2702,"value":482,"costMultiplier":1820},{"label":2704,"value":40,"costMultiplier":227},[],{"_id":4333,"key":703,"model":4300,"title":704,"description":4334,"ruTitle":715,"ruDescription":4335,"position":226,"defaultValue":3008,"options":4336,"settingType":282,"fileTypes":4343,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},"68b5ed459a409ff005d4180d","Video resolution quality","Качество разрешения видео",[4337,4339,4341],{"label":4267,"value":4267,"cost":4338},"0,09",{"label":3008,"value":3008,"cost":4340},"0,18",{"label":4272,"value":4272,"cost":4342},"0,36",[],{"_id":4345,"key":1264,"model":4300,"title":1265,"description":4346,"ruTitle":1266,"ruDescription":4347,"position":482,"defaultValue":1274,"options":4348,"settingType":282,"fileTypes":4356,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},"68b5ed459a409ff005d4180f","Video aspect ratio","Соотношение сторон видео",[4349,4350,4351,4352,4353,4354,4355],{"label":1274,"value":1274},{"label":1278,"value":1278},{"label":1272,"value":1272},{"label":1280,"value":1280},{"label":1276,"value":1276},{"label":1488,"value":1488},{"label":1490,"value":1490},[],{"_id":4358,"key":4359,"model":4300,"title":4360,"description":4361,"ruTitle":4362,"ruDescription":4363,"position":4037,"defaultValue":4364,"options":4365,"settingType":282,"fileTypes":4367,"fileSource":28,"isRequired":12,"valueType":44,"__v":30},"68b5ed459a409ff005d41811","fps","Frame Rate (FPS)","Video frame rate per second","Частота кадров (FPS)","Частота кадров видео в секунду","24",[4366],{"label":3402,"value":3403},[],{"_id":4369,"key":4370,"model":4300,"title":4371,"description":4372,"ruTitle":4373,"ruDescription":4374,"position":2723,"defaultValue":25,"options":4375,"settingType":27,"fileTypes":4376,"fileSource":28,"isRequired":12,"valueType":29,"__v":30},"68b5ed459a409ff005d41813","camera_fixed","Fixed Camera","Whether to fix camera position during video generation","Фиксированная камера","Зафиксировать ли позицию камеры во время генерации видео",[],[],[4378,4379,4380,4381,4382,4383],"68b5ed459a409ff005d41817","68b5ed459a409ff005d41819","68b5ed459a409ff005d4181b","68b5ed459a409ff005d4181d","68b5ed459a409ff005d4181f","68b5ed459a409ff005d41821",[63],"3b5595965d9aaeaaaaf3c233ae679dbe9442d1009a9b05641c10364669f8be09","https://tjzk.replicate.delivery/models_models_featured_image/961a33d5-e27a-4b15-8cdd-3e37d5375297/replicate-seedance-1-lite.webp","https://replicate.com/bytedance/seedance-1-lite",[],"2025-09-01T19:00:21.752Z","2025-09-04T20:56:23.554Z",{"duration":864,"resolution":3008,"aspect_ratio":1274,"fps":4364,"camera_fixed":25},{"_id":4393,"key":4394,"label":4395,"shortLabel":4395,"description":4396,"isInstantModel":12,"isReasoningModel":12,"ruDescription":4397,"releaseDate":4398,"ruLongDescription":4399,"contextCapacity":4003,"maxTokens":4003,"type":63,"generationType":691,"generationTypes":4400,"api":85,"settingConfigs":4401,"percs":4455,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":4459,"replicateId":4460,"replicateApiType":6,"outputPath":7,"cost":737,"gemTokenCost":555,"iconUrl":3343,"previewImageUrl":4461,"bannerImageUrl":4461,"websiteUrl":4462,"githubUrl":327,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":249,"tokenStrategy":67,"oneImageCost":481,"examples":4463,"createdAt":4467,"updatedAt":4468,"__v":38,"generationCount":4128,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":4469,"configValue":4470},"6899d47332d1a9f88d2fd27a","bytedance/seedream-3","Seedream 3","Bilingual (CN/EN) text-to-image — native 2K output, fast & commercial","Двуязычная (CN/EN) генерация изображений — нативный 2K, быстрая и коммерческая","2025-06-25T09:52:01.536Z","Seedream 3 — это высокодетализированная двуязычная (китайский и английский) модель для генерации изображений по текстовому описанию, ориентированная на быстрое получение готовых к использованию материалов. Модель генерирует изображения нативно в 2K (до 2048 пикселей по длинной стороне) без апскейла, что даёт результаты, готовые к печати и отображению на экранах — от постеров и мобильных макетов до крупноформатной графики. Время генерации составляет примерно 3 секунды, что позволяет оперативно вносить правки и вести интерактивную работу над дизайном.\n\nМодель демонстрирует высокую точность компоновки, корректные отношения объектов и детализированную проработку лиц и текстур. Особое внимание уделено рендерингу текста и типографики: мелкие шрифты и многострочные блоки остаются читаемыми, что делает Seedream 3 пригодным для коммерческих задач. Поддерживаются различные стили — от фотореализма и кинематографичных концепт-артов до аниме и иллюстрации — при этом модель минимизирует типичные артефакты вроде ненатурального блеска.\n\nПрактическое применение включает создание рекламных и брендовых материалов, дизайн постеров, прототипы UI/UX и маркетинговых экранов, а также контент для игр и развлечений (концепт-арт, персонажи). Нативный 2K и корректная работа с текстом сокращают необходимость постобработки и апскейла, экономя время и сохраняя детализацию.\n\nОграничения: модель может испытывать трудности в чрезвычайно насыщенных сценах или при сверхтонких текстовых деталях, а также ограничена поддержкой в первую очередь китайского и английского языков. В целом Seedream 3 подходит дизайнерам, маркетологам и креативным специалистам, которым требуется быстрая и качественная двуязычная генерация изображений для коммерческих и творческих задач.",[691],[4402,4419,4425,4431,4448],{"fileTypes":4403,"_id":4404,"key":3844,"model":4393,"title":4405,"description":4406,"ruTitle":4407,"ruDescription":4408,"position":126,"defaultValue":4409,"options":4410,"settingType":282,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},[],"6899d47332d1a9f88d2fd27c","Size","Image size preset","Размер","Предустановка размера изображения","regular",[4411,4414,4416],{"label":4412,"value":4413},"Small","small",{"label":4415,"value":4409},"Regular",{"label":4417,"value":4418},"Big","big",{"fileTypes":4420,"_id":4421,"key":2587,"model":4393,"title":2588,"description":4422,"ruTitle":2613,"ruDescription":4423,"position":226,"step":38,"max":3450,"min":4003,"defaultValue":2612,"options":4424,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30},[],"6899d47332d1a9f88d2fd27e","Image width in pixels","Ширина изображения в пикселях",[],{"fileTypes":4426,"_id":4427,"key":2617,"model":4393,"title":2618,"description":4428,"ruTitle":2634,"ruDescription":4429,"position":482,"step":38,"max":3450,"min":4003,"defaultValue":2612,"options":4430,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30},[],"6899d47332d1a9f88d2fd280","Image height in pixels","Высота изображения в пикселях",[],{"fileTypes":4432,"_id":4433,"key":1264,"model":4393,"title":1265,"description":4434,"ruTitle":1266,"ruDescription":4435,"position":71,"defaultValue":1274,"options":4436,"settingType":282,"fileSource":28,"isRequired":12,"valueType":215,"__v":30},[],"6899d47332d1a9f88d2fd282","Image aspect ratio","Соотношение сторон изображения",[4437,4438,4439,4440,4441,4442,4443,4444,4445],{"label":1272,"value":1272},{"label":1280,"value":1280},{"label":1278,"value":1278},{"label":1274,"value":1274},{"label":1276,"value":1276},{"label":1284,"value":1284},{"label":1282,"value":1282},{"label":1488,"value":1488},{"label":4446,"value":4447},"Custom","custom",{"fileTypes":4449,"_id":4450,"key":1385,"model":4393,"title":1386,"description":4451,"ruTitle":4030,"ruDescription":4452,"position":4037,"step":225,"max":40,"min":38,"defaultValue":4453,"options":4454,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30},[],"6899d47332d1a9f88d2fd284","Prompt adherence. Higher = more literal.","Следование промпту. Выше = более буквально.","2.5",[],[4456,4457,4458],"68a9e214e3ac04ad89b921ca","68a9e214e3ac04ad89b921cc","68a9e214e3ac04ad89b921ce",[],"e97385a576173b08a6a87546457582b01f65bf29a4dc00f1191e884894e0bc73","https://tjzk.replicate.delivery/models_models_featured_image/de2ae1dd-f7b8-4b9e-901e-86125ac2b4a8/tmpcoezojc2.jpg","https://replicate.com/bytedance/seedream-3",[4464,4465,4466],"A cinematic portrait of a young woman with platinum hair","Photorealistic landscape with golden hour lighting","Urban street art scene with graffiti walls","2025-08-11T11:30:59.424Z","2025-09-04T00:54:08.843Z","Seedream 3 is a high-resolution bilingual (Chinese/English) text-to-image model built for fast, production-ready image generation. It produces native 2K images (up to 2048 px on the longer side) without upscaling, delivering print- and screen-ready results for posters, mobile visuals, and large-format assets. Typical generation time is about 3 seconds, enabling rapid iteration and near real-time creative workflows.\n\nThe model excels at rendering accurate layouts, coherent object relationships, and detailed facial expressions and textures. Its advanced text and typography handling makes small fonts, multi-line copy, and UI elements legible and commercially usable — a rare strength for image models. Seedream 3 supports a wide range of visual styles from photorealism and cinematic concept art to anime and illustration, while avoiding common artifacts like unnatural glossiness or stiffness.\n\nPractical uses include advertising and branding (fast ad assets, campaign visuals), graphic design and poster production (complex layouts with readable text), UI/UX mockups and marketing screens, and creative content for games and entertainment (concept art, character renders). Because it outputs high-resolution images directly and renders text well, it reduces the need for post-processing or external upscaling — saving time and preserving detail.\n\nWhile highly capable, Seedream 3 can still struggle with extremely dense scenes or very fine-grained text beyond industry-best standards, and its primary language focus is Chinese and English. Overall, Seedream 3 is ideal for designers, marketers, and creatives who need fast, high-fidelity, bilingual image generation for commercial and creative applications.",{"size":4409,"width":2612,"height":2612,"aspect_ratio":1274,"guidance_scale":4453},{"supportFiles":12,"supportedFileTypes":4472,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":4473,"key":4474,"label":4475,"shortLabel":163,"description":4476,"isInstantModel":12,"ruDescription":4477,"releaseDate":4478,"ruLongDescription":4479,"contextCapacity":4480,"maxTokens":462,"createdAt":4481,"generationCount":4482,"type":428,"generationType":429,"generationTypes":4483,"api":4484,"settingConfigs":4485,"percs":4508,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":482,"iconUrl":4512,"websiteUrl":4513,"position":4514,"secondCost":30,"generationCost":30,"inputTokenCost":480,"outputTokenCost":481,"stepPrice":30,"examples":4515,"updatedAt":4516,"__v":71,"isReasoningModel":12,"isAvailableAfterAuth":12,"longDescription":4517,"configValue":4518},[63,64],"67950301fba63965b0ef2a26","sonar","Sonar","Fast factual search & reasoning; also multilingual multimodal embeddings","Быстрый фактический поиск и рассуждение; мультиязычные мультимодальные векторы","2024-07-05T14:28:00.000Z","«Sonar» — это название нескольких продвинутых AI-решений с разными задачами и применением. Perplexity Sonar — модель для поиска и рассуждений, настроенная на мгновенные и проверяемые ответы с цитированием источников. Она ориентирована на скорость (низкая задержка), многошаговое логическое мышление, интеграцию с веб-поиском в реальном времени и приватность размещения — что делает её удобной для профессионалов, которым нужны краткие, надёжные ответы без долгого поиска. Доступ предоставляется через Perplexity Pro и Sonar API. Meta SONAR — мультиязычная и мультимодальная система эмбеддингов предложений, которая преобразует текст и речь в единое фиксированное семантическое пространство. Поддерживает около 200 языков, ускоряет семантический поиск, обеспечивает перевод текста и речи (включая zero-shot) и идеально подходит для кросс-лингвистического поиска и масштабируемых пайплайнов извлечения. Отдельно, инструменты Sonar в экосистеме разработки (SonarQube / SonarCloud) добавляют генеративные AI-функции для качества и безопасности кода — обнаруживают уязвимости, предлагают и применяют исправления, снижая риск ошибок в коде, созданном людьми или AI. Практическая выгода: выбирайте Perplexity Sonar для быстрых, проверяемых ответов и сложных рассуждений; Meta SONAR — для компактных, языконезависимых эмбеддингов, поиска и перевода; Sonar для кода — чтобы автоматизировать ревью и исправление ошибок. Ограничения и доступ: Perplexity Sonar — проприетарный сервис с подпиской/API; Meta SONAR — исследовательское решение, ориентированное на мультимодальные и мультиязычные задачи; Sonar-инструменты для кода — специализированы на рабочих процессах обеспечения качества ПО. Выбор зависит от того, приоритетно ли вам быстрое фактическое Q&A, масштабируемые мультиязычные эмбеддинги или автоматизация качества кода.",127000,"2024-09-24T13:14:30.421Z",167,[],"perplexity",[4486,4490,4494,4499,4504],{"fileTypes":4487,"_id":4488,"key":436,"model":4473,"title":1672,"tooltipContent":1674,"description":1674,"ruTitle":1672,"ruDescription":1675,"step":249,"max":38,"min":30,"defaultValue":439,"options":4489,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67950301fba63965b0ef2a28",[],{"fileTypes":4491,"_id":4492,"key":446,"model":4473,"title":447,"tooltipContent":2865,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":4493,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67950301fba63965b0ef2a2a",[],{"fileTypes":4495,"_id":4496,"key":457,"model":4473,"title":458,"tooltipContent":4497,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":65,"defaultValue":461,"options":4498,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67950301fba63965b0ef2a2c","The length of an output",[],{"fileTypes":4500,"_id":4501,"key":469,"model":4473,"title":470,"tooltipContent":4502,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":4480,"min":82,"defaultValue":473,"options":4503,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"67950301fba63965b0ef2a2e","Amount of tokens passed as a context to the LLM",[],{"fileTypes":4505,"_id":4506,"key":531,"model":4473,"title":532,"description":533,"icon":538,"ruTitle":534,"ruDescription":535,"defaultValue":25,"options":4507,"settingType":537,"fileSource":28,"__v":30},[],"67c066fb582c875211457706",[],[4509,4510,4511],"68a9ddb5e3ac04ad89b920d7","68a9ddb5e3ac04ad89b920d9","68a9ddb5e3ac04ad89b920db","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/perplexity.png","https://perplexity.ai",44,[],"2025-08-28T12:07:11.518Z","“Sonar” refers to multiple advanced AI offerings grouped under the same name, each optimized for different real-world needs. Perplexity’s Sonar is a search-and-reasoning LLM tuned to deliver instant, highly factual answers with cited sources. It emphasizes speed (very low latency), strong multi-step reasoning, real-time web search integration, and privacy-first hosting — making it ideal for professionals who need concise, trustworthy answers without digging through links. Developers can access it via Perplexity Pro or the Sonar API. Meta’s SONAR is a multilingual, multimodal sentence-embedding system that maps text and speech into a single fixed-size semantic space. It supports ~200 languages, powers fast semantic similarity search, and enables text-to-text and speech-to-text translation (including zero-shot transfers). It’s best for cross-lingual retrieval, large-scale embedding search, and translation pipelines where consistent, compact embeddings matter. Separately, Sonar-branded tools in the software-development ecosystem (SonarQube / SonarCloud) add generative-AI features for code quality and security — identifying vulnerabilities, suggesting fixes, and applying AI CodeFix recommendations to reduce bugs and outages from both human- and AI-written code. Practical benefits: use Perplexity Sonar when you want near-real-time, citation-backed answers and deep reasoning; use Meta SONAR when you need efficient, language-agnostic embeddings for multilingual search, retrieval, or speech+text translation; and use Sonar code tools to automate code review, vulnerability detection, and safe remediation. Limitations and access: Perplexity Sonar is a proprietary product available via subscription/API; Meta SONAR is a research-grade embedding service focused on cross-modal multilingual tasks; Sonar code tools are specialized for software quality workflows. Choosing the right Sonar depends on whether your priority is fast factual Q&A, scalable multilingual embeddings, or code quality automation.",{"top_p":439,"temperature":449,"max_tokens":461,"capacity":473,"reasoning":25},{"supportFiles":12,"supportedFileTypes":4520,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":4521,"key":4522,"label":4523,"shortLabel":163,"description":4524,"isInstantModel":12,"ruDescription":4525,"releaseDate":4478,"ruLongDescription":4526,"contextCapacity":426,"maxTokens":462,"createdAt":4481,"generationCount":1308,"type":428,"generationType":429,"generationTypes":4527,"api":4484,"settingConfigs":4528,"percs":4549,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":482,"iconUrl":4512,"websiteUrl":4513,"position":4514,"secondCost":30,"generationCost":30,"inputTokenCost":480,"outputTokenCost":481,"stepPrice":30,"examples":4554,"updatedAt":4555,"__v":226,"isReasoningModel":12,"isAvailableAfterAuth":12,"longDescription":4556,"configValue":4557},[63,64],"6795024afba63965b0ef1413","sonar-pro","Sonar Pro","Real-time web search and synthesis, fast, cited answers","Поиск в реальном времени и синтез информации, быстрые ответы с ссылками","Sonar Pro — это ориентированная на исследовательские задачи модель ИИ, которая сочетает поиск в реальном времени в интернете с продвинутым синтезом информации, чтобы предоставлять быстрые, точные и хорошо прокомментированные ответы. Модель извлекает актуальные данные из сети, объединяет несколько источников и формирует сжатые объяснения, резюме или развернутые аналитические отчёты в соответствии с потребностями пользователя. Sonar Pro поддерживает многошаговое рассуждение и очень большой контекст, что позволяет обрабатывать длинные документы, многоэтапные запросы и сложные исследовательские задачи без потери контекста. Пользователи могут настраивать список источников, к которым обращается модель, что удобно для целевого исследования и задач в узкой предметной области.\n\nПрактическое применение включает исследовательскую работу, верификацию фактов, анализ рынка, корпоративный поиск и службы поддержки. Модель показана в задачах мониторинга новостей, конкурентной разведки, обзоров литературы и создании контента, где нужны актуальные подтверждения. Sonar Pro оптимизирован по скорости — ответы формируются быстро даже при объединении данных из множества источников — при этом демонстрируется высокая точность фактов и хорошие оценки по метрикам качества. Модель также выгодна по соотношению цена/возможности по сравнению с некоторыми конкурентами.\n\nОграничения: Sonar Pro оптимизирован для синтеза информации и актуальных исследований, а не для сложных задач программирования или чисто абстрактных тестов на рассуждение; в этих сценариях другие модели могут показывать лучшие результаты. Модель не квантована по умолчанию, что может влиять на характеристики инференса в зависимости от среды развёртывания. В целом Sonar Pro лучше всего подходит, когда нужны быстрые, современные и хорошо документированные ответы в рамках длинных или сложных запросов.",[],[4529,4533,4537,4541,4545],{"fileTypes":4530,"_id":4531,"key":436,"model":4521,"title":1672,"tooltipContent":1674,"description":1674,"ruTitle":1672,"ruDescription":1675,"step":249,"max":38,"min":30,"defaultValue":439,"options":4532,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6795024afba63965b0ef1415",[],{"fileTypes":4534,"_id":4535,"key":446,"model":4521,"title":447,"tooltipContent":2865,"description":451,"ruTitle":453,"ruDescription":452,"step":249,"max":38,"min":30,"defaultValue":449,"options":4536,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6795024afba63965b0ef1417",[],{"fileTypes":4538,"_id":4539,"key":457,"model":4521,"title":458,"tooltipContent":4497,"description":463,"ruTitle":465,"ruDescription":464,"step":65,"max":462,"min":65,"defaultValue":461,"options":4540,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6795024bfba63965b0ef1419",[],{"fileTypes":4542,"_id":4543,"key":469,"model":4521,"title":470,"tooltipContent":4502,"description":475,"ruTitle":477,"ruDescription":476,"step":82,"max":426,"min":82,"defaultValue":473,"options":4544,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"6795024bfba63965b0ef141b",[],{"fileTypes":4546,"_id":4547,"key":531,"model":4521,"title":532,"description":533,"ruTitle":534,"ruDescription":535,"defaultValue":25,"options":4548,"settingType":537,"fileSource":28,"__v":30,"icon":538},[],"67c0679583a156458778d641",[],[4550,4551,4552,4553],"68a9dd76e3ac04ad89b920ca","68a9dd76e3ac04ad89b920cc","68a9dd77e3ac04ad89b920ce","68a9dd77e3ac04ad89b920d0",[],"2025-09-06T20:32:14.724Z","Sonar Pro is a research-focused AI that blends real-time web search with advanced synthesis to deliver fast, accurate, and well-cited answers. Designed for knowledge-intensive workflows, it pulls current information from the internet, combines multiple sources, and produces concise explanations, summaries, or extended analyses tailored to user needs. Sonar Pro supports multi-step reasoning and a very large context window, so it can process long documents, multi-stage queries, and complex research tasks without losing context. Users can also customize which sources Sonar Pro consults, making it ideal for targeted research or industry-specific investigations.\n\nPractically, Sonar Pro is useful for researchers, fact-checkers, market analysts, enterprise search, and customer service teams. It excels at producing verified, citation-rich outputs for news monitoring, competitive intelligence, literature reviews, and content creation that requires up-to-date evidence. The model is built for speed—responses arrive quickly even when synthesizing multiple sources—while maintaining high factual accuracy and a strong F-score in accuracy benchmarks. It’s also positioned as a cost-effective option compared to some competitors, offering robust capabilities without premium pricing.\n\nNotable limitations: Sonar Pro is optimized for information synthesis and up-to-date research rather than specialized coding or pure reasoning benchmark tasks; other models may outperform it on intensive programming or abstract reasoning tests. Additionally, Sonar Pro is not quantized by default, which can affect inference characteristics depending on the deployment environment. Overall, Sonar Pro is best when you need rapid, current, and well-sourced answers across long or complex inputs.",{"top_p":439,"temperature":449,"max_tokens":461,"capacity":473,"reasoning":25},{"isReasoningModel":12,"supportFiles":12,"supportedFileTypes":4559,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":4560,"key":4561,"label":4562,"shortLabel":4563,"type":14,"generationType":15,"generationTypes":4564,"api":17,"settingConfigs":4565,"isAdminModel":12,"isPromptRequired":61,"replicateId":163,"cost":65,"description":4590,"position":1691,"secondCost":327,"generationCost":719,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":226,"generationCount":4591,"updatedAt":4592,"examples":4593,"iconUrl":3968,"isBanned":12,"isOutdated":12,"percs":4594,"createdAt":4598,"longDescription":4599,"websiteUrl":4600,"releaseDate":4601,"ruDescription":4602,"ruLongDescription":4603,"isInstantModel":12,"isGenerationTypeRequired":12,"isAvailableAfterAuth":12,"configValue":4604},[63,64],"66891cb59fb1dca8f5081de3","fal-ai/stable-audio","Stable Audio","Stable Audio Open",[15],[4566,4576,4584],{"fileTypes":4567,"_id":4568,"key":4569,"model":4560,"title":4570,"tooltipContent":4571,"step":38,"max":478,"min":30,"defaultValue":4572,"options":4573,"settingType":43,"fileSource":28,"__v":30,"description":4571,"ruDescription":4574,"ruTitle":4575},[],"66891cb59fb1dca8f5081de5","seconds_start","Seconds Start","The start point of the audio clip","30",[],"Начальная точка аудиоклипа","Секунды Старт",{"fileTypes":4577,"_id":4578,"key":4579,"model":4560,"title":36,"step":862,"max":4580,"min":862,"costMultiplier":225,"defaultValue":4572,"isAdvanced":12,"options":4581,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":4582,"tooltipContent":4582,"ruDescription":4583,"ruTitle":868},[],"66891cb59fb1dca8f5081de7","seconds_total",47,[],"Length of the track","Длина пути",{"fileTypes":4585,"_id":4586,"key":4587,"model":4560,"title":2784,"step":38,"max":806,"min":482,"defaultValue":2520,"options":4588,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":50,"tooltipContent":50,"ruDescription":4589,"ruTitle":2523},[],"66891cb59fb1dca8f5081de9","steps",[],"Больше шагов - выше качество","Generate high-quality music and sound from text or audio prompts",51,"2025-08-23T15:02:21.547Z",[],[4595,4596,4597],"68a9d7fde3ac04ad89b91f9b","68a9d7fde3ac04ad89b91f9d","68a9d7fde3ac04ad89b91f9f","2024-09-06T21:51:56.231Z","Stable Audio is an AI model for creating high-quality audio from natural language or example files. You can type a descriptive prompt such as “headbanging heavy metal track” or upload an existing clip and ask the model to transform it. Stable Audio 2.0 produces full stereo tracks up to 3 minutes at 44.1 kHz, enabling intros, developments, and outros that feel coherent and structured. It also excels at short clips, sound effects, and ambient textures for games, film, advertising, and multimedia.\n\nPractical benefits include rapid prototyping of musical ideas, generating instrumentals for content, designing ambient layers and fx, and experimenting with audio style transfer by combining prompts and reference clips. The model is user-friendly: natural language prompts let creators with little technical expertise iterate quickly. For advanced users, Stable Audio Open provides model weights on Hugging Face so you can fine-tune or adapt the model to specific datasets and workflows.\n\nWhat makes Stable Audio valuable is its balance of quality and efficiency—outputs are rich and detailed while remaining accessible to users with varied hardware. The system was trained with licensed data and creator compensation practices, and it respects opt-outs, supporting more responsible use. Limitations include challenges with realistic vocals and very complex melodic lines, as well as a current maximum length of about three minutes. Best results often come from prompt refinement and iterative generation.\n\nWho should use it: musicians and producers looking for quick musical sketches or full pieces, sound designers needing bespoke effects and ambiences, game and film creators who want faster audio iteration, and developers interested in building customized audio tools via the open weights. Stable Audio speeds creative workflows while letting you keep control of style, length, and references.","https://stability.ai/news/introducing-stable-audio-open","2024-06-05T10:13:00.000Z","Генерирует качественную музыку и звуки по текстовым или аудио запросам","Stable Audio — это модель ИИ для создания высококачественного аудио по естественному языку или на основе загруженных примеров. Вы можете ввести описательный запрос, например «хэви-метал трек», или загрузить фрагмент и попросить модель преобразовать его. Stable Audio 2.0 умеет генерировать полноценные стерео треки до 3 минут с частотой 44.1 кГц, что позволяет получать вступления, развитие и окончания с ощущением музыкальной целостности. Модель также прекрасно справляется с короткими клипами, звуковыми эффектами и атмосферными слоями для игр, кино, рекламы и медиа-проектов.\n\nПрактические преимущества включают быструю прототипизацию музыкальных идей, создание инструментальных дорожек для контента, генерацию ambients и эффектов, а также эксперименты со стилевым переносом с помощью подсказок и референсов. Модель удобна для пользователей: естественные текстовые запросы позволяют быстро получать результаты без глубоких технических знаний. Для продвинутых задач доступна версия Stable Audio Open с весами на Hugging Face, что даёт возможность докачки и адаптации под собственные наборы данных.\n\nОсобенность Stable Audio — сочетание качества и эффективности: аудио получается детализированным, при этом модель доступна на различном оборудовании. Обучение проводилось на лицензированных данных с компенсацией авторам и уважением к opt-out, что способствует более ответственному использованию. Ограничения: модель хуже воспроизводит реалистичные вокалы и очень сложные мелодические линии, а максимальная длительность пока около трёх минут. Для лучших результатов часто требуется уточнение подсказок и итеративная генерация.\n\nКому полезна модель: музыкантам и продюсерам для быстрого создания идей и треков, саунд-дизайнерам для уникальных эффектов и амбиентов, разработчикам игр и фильмов для ускорения аудиопроцессов, а также разработчикам, желающим строить кастомные инструменты на открытых весах.",{"seconds_start":4572,"seconds_total":4572,"steps":2520},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":4606,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":4607,"key":4608,"label":4609,"type":63,"generationType":691,"generationTypes":4610,"api":1067,"settingConfigs":4611,"isAdminModel":12,"isPromptRequired":61,"cost":39,"iconUrl":3968,"websiteUrl":4653,"description":4654,"position":863,"secondCost":30,"generationCost":4655,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":414,"generationCount":4656,"bannerImageUrl":4657,"previewImageUrl":4658,"shortLabel":4659,"updatedAt":4660,"createdAt":4661,"examples":4662,"isBanned":12,"isOutdated":12,"percs":4664,"longDescription":4669,"ruDescription":4670,"ruLongDescription":4671,"isAvailableAfterAuth":12,"configValue":4672},[63,64],"66203ecd25a18466d8bf61c3","sd3","Stable Diffusion 3",[83,691],[4612,4627,4633,4642,4647],{"fileTypes":4613,"_id":4614,"key":1264,"model":4607,"title":1265,"defaultValue":1272,"options":4615,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"tooltipContent":4625,"description":4626,"ruDescription":1531,"ruTitle":1266},[],"66203ecd25a18466d8bf61c5",[4616,4617,4618,4619,4620,4621,4622,4623,4624],{"label":1272,"value":1272},{"label":1274,"value":1274},{"label":1488,"value":1488},{"label":1284,"value":1284},{"label":1282,"value":1282},{"label":1288,"value":1288},{"label":1286,"value":1286},{"label":1276,"value":1276},{"label":1490,"value":1490},"Aspect ratio of an output image","Output image aspect ratio",{"fileTypes":4628,"_id":4629,"key":206,"model":4607,"title":207,"tooltipContent":4630,"options":4631,"settingType":214,"fileSource":28,"valueType":215,"__v":30,"defaultValue":163,"description":4630,"ruDescription":4632,"ruTitle":1181},[],"66203ecd25a18466d8bf61c7","Something you don't want to see",[],"То, что вы не хотите видеть",{"fileTypes":4634,"_id":4635,"key":379,"model":4607,"title":380,"options":4636,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"defaultValue":385,"isAdvanced":61,"tooltipContent":4640,"description":4640,"ruDescription":4641,"ruTitle":383},[],"66203ecd25a18466d8bf61c9",[4637,4638],{"label":385,"value":385},{"label":4639,"value":4639},"jpeg","Output file format","Формат выходного файла",{"fileTypes":4643,"_id":4644,"key":4645,"model":4607,"title":1186,"position":40,"step":249,"max":38,"min":30,"defaultValue":439,"options":4646,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30,"tooltipContent":4218,"description":4218,"ruDescription":1189,"ruTitle":1190},[],"662044c825a18466d8bfcd53","strength",[],{"fileTypes":4648,"_id":4649,"key":63,"model":4607,"title":4178,"tooltipContent":4650,"accept":92,"options":4651,"settingType":94,"fileType":63,"fileSource":28,"__v":30,"description":4650,"ruDescription":4652,"ruTitle":4180},[],"66204a59c053f6c666808535","Image that will affect generation",[],"Образ, который повлияет на поколение","https://stability.ai","Generate high-resolution images from text and images, fast and customizable",0.065,2164,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sd3-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_1022998312549.webp","SD 3","2025-09-04T00:53:48.078Z","2024-09-02T09:40:05.446Z",[4663],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-examples/66203ecd25a18466d8bf61c3/optimized_446028758525.webp",[4665,4666,4667,4668],"68a9d64ce3ac04ad89b91f2a","68a9d64ce3ac04ad89b91f2c","68a9d64ce3ac04ad89b91f2e","68a9d64ce3ac04ad89b91f30","Stable Diffusion 3 is a next-generation text-to-image model that lets creators and professionals produce high-resolution, detailed visuals quickly and with fine-grained control. It generates photorealistic or stylized artwork with richer textures and fewer artifacts than prior versions, making it suitable for advertising, concept art, storyboards, and production-ready assets. Users can provide plain text prompts or combine text with sketches and reference images to steer composition, color, and style—enabling precise image-to-image edits and consistent output across a project.\n\nSpeed and cost-efficiency are core benefits: optimized training and generation techniques reduce the number of diffusion steps, so images synthesize faster and with lower compute and environmental overhead. This makes rapid iteration practical for designers and teams on tight schedules or budgets. Stability and consistency are improved, meaning fewer unpredictable artifacts and more reliable adherence to prompts—important when producing assets for commercial work.\n\nStable Diffusion 3 is also accessible: an 800M-parameter variant offers many capabilities with lower hardware requirements, while the open-source release encourages community extensions and custom fine-tuning for specialized workflows. Practical outcomes include rapid generation of marketing visuals, on-demand concept variations, quick storyboarding, and tailored illustrations that match specific brand or artistic guidelines. While expert prompt tuning and parameter adjustment can further improve results, non-experts will find it easier to get usable, high-quality images faster than before. Overall, Stable Diffusion 3 balances superior image fidelity, flexible multi-modal inputs, and faster turnaround—helping creative teams turn ideas into polished visuals with less friction.","Генерирует высококачественные изображения из текста и изображений — быстро и настраиваемо","Stable Diffusion 3 — это модель следующего поколения для преобразования текста в изображение, позволяющая профессионалам и творческим специалистам быстро получить высокоразрешённые детализированные визуалы с тонкой настройкой. Модель создаёт фотореалистичные или стилизованные работы с более богатой фактурой и минимальными артефактами по сравнению с предыдущими версиями, что делает её пригодной для рекламы, концепт-арта, сторибордов и готовых к продакшну материалов. Пользователи могут задавать текстовые подсказки или комбинировать их с эскизами и референсами, чтобы управлять композицией, цветом и стилем — это даёт возможность точечных правок изображения и последовательного результата в рамках проекта.\n\nКлючевые преимущества — скорость и экономичность: оптимизированные методы обучения и генерации уменьшают количество шагов диффузии, поэтому изображения синтезируются быстрее с меньшими вычислительными и экологическими затратами. Это делает быстрые итерации реальными для дизайнеров и команд с ограниченным бюджетом или сроками. Повышенная стабильность и предсказуемость означают меньше непредвиденных артефактов и лучшее соответствие запросам — важно для коммерческого использования.\n\nStable Diffusion 3 также доступна: версия с 800 млн параметров сохраняет многие возможности при более низких требованиях к оборудованию, а открытый исходный код стимулирует сообщество к доработкам и тонкой настройке под специфические задачи. Практические сценарии включают создание маркетинговых визуалов, быстрые варианты концепций, сторибординг и индивидуальные иллюстрации, соответствующие брендовым или художественным требованиям. Хотя улучшения достигаются дополнительной настройкой подсказок и параметров, даже непрофессионалы смогут получать качественные изображения быстрее и надежнее. В итоге модель сочетает высокое качество, гибкую работу с несколькими типами входов и ускорённую генерацию, помогая командам быстрее воплощать идеи в готовые визуалы.",{"aspect_ratio":1272,"negative_prompt":163,"output_format":385,"strength":439},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":4674,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":4675,"key":4676,"label":4677,"type":63,"generationType":691,"generationTypes":4678,"api":85,"settingConfigs":4679,"isAdminModel":12,"isOutdated":12,"isPromptRequired":61,"iconType":163,"cost":4726,"iconUrl":3968,"previewImageUrl":4727,"bannerImageUrl":4728,"description":4729,"tier":125,"position":4730,"secondCost":30,"generationCost":4731,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":226,"shortLabel":4732,"generationCount":4733,"replicateApiType":117,"replicateId":4676,"updatedAt":4734,"examples":4735,"isBanned":12,"createdAt":4738,"percs":4739,"websiteUrl":4744,"releaseDate":4745,"longDescription":4746,"ruDescription":4747,"ruLongDescription":4748,"isAvailableAfterAuth":12,"configValue":4749},[63,64],"6669c86cc3fe6cd78a6953bd","stability-ai/stable-diffusion-3:72c05df2daf615fb5cc07c28b662a2a58feb6a4d0a652e67e5a9959d914a9ed2","Stable Diffusion 3 Medium",[691],[4680,4686,4698,4707,4715],{"fileTypes":4681,"_id":4682,"key":206,"model":4675,"title":207,"tooltipContent":4683,"defaultValue":163,"options":4684,"settingType":214,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"isAdmin":12,"description":4683,"ruDescription":4685,"ruTitle":1181},[],"6669c86cc3fe6cd78a6953c1","Things you do not want to see in your image",[],"То, что вы не хотите видеть на своем изображении",{"fileTypes":4687,"_id":4688,"key":1264,"model":4675,"title":1264,"tooltipContent":4689,"defaultValue":1272,"options":4690,"settingType":282,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"description":4689,"ruDescription":4696,"ruTitle":4697},[],"6669c86cc3fe6cd78a6953c3","An enumeration.",[4691,4692,4693,4694,4695],{"label":1272,"value":1272},{"label":1274,"value":1274},{"label":1284,"value":1284},{"label":1282,"value":1282},{"label":1276,"value":1276},"Перечисление.","соотношение сторон",{"fileTypes":4699,"_id":4700,"key":4701,"model":4675,"title":4702,"tooltipContent":4703,"step":225,"max":817,"min":30,"defaultValue":4704,"options":4705,"settingType":43,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"description":4703,"ruDescription":4706,"ruTitle":4702},[],"6669c86cc3fe6cd78a6953c5","cfg","Cfg","The guidance scale tells the model how similar the output should be to the prompt.","4.5",[],"Шкала наведения указывает модели, насколько выходной сигнал должен быть похож на подсказку.",{"fileTypes":4708,"_id":4709,"key":379,"model":4675,"title":380,"tooltipContent":382,"defaultValue":385,"options":4710,"settingType":282,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"isAdvanced":61,"description":382,"ruDescription":4714,"ruTitle":383},[],"6669c86cc3fe6cd78a6953c7",[4711,4712,4713],{"label":393,"value":393},{"label":390,"value":390},{"label":385,"value":385},"Формат выходных изображений",{"fileTypes":4716,"_id":4717,"key":1535,"model":4675,"title":1536,"tooltipContent":4718,"step":38,"max":65,"min":30,"defaultValue":1537,"options":4719,"settingType":43,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"description":4718,"ruDescription":4725,"ruTitle":1541},[],"6669c86cc3fe6cd78a6953c9","Quality of the output images, from 0 to 100. 100 is best quality, 0 is lowest quality.",[4720,4721,4722,4723,4724],{"label":1272,"value":1272},{"label":1274,"value":1274},{"label":1284,"value":1284},{"label":1282,"value":1282},{"label":1276,"value":1276},"Качество выводимых изображений, от 0 до 100. 100 - наилучшее качество, 0 - наименьшее.",140,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sd3-med-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sd3-med.png","Generate photorealistic images from text; runs on consumer hardware",427,0.035,"SD3m",193,"2025-08-24T12:59:36.619Z",[4736,4737],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_1053437405638.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_216382560546.webp","2024-09-01T14:32:26.185Z",[4740,4741,4742,4743],"68a9d750e3ac04ad89b91f67","68a9d750e3ac04ad89b91f69","68a9d750e3ac04ad89b91f6b","68a9d750e3ac04ad89b91f6d","https://stability.ai/news/stable-diffusion-3-medium","2024-06-12T09:40:00.000Z","Stable Diffusion 3 Medium (SD3 Medium) is a powerful text-to-image model that produces high-quality, photorealistic images while remaining optimized for everyday laptops and PCs. It delivers rich textures, fine detail, and significantly improved handling of traditionally difficult elements such as hands, faces, and in-image text, letting creators get cleaner, more usable results with fewer prompt tweaks. The model understands complex, nuanced prompts — including spatial relationships, specific actions, and varied artistic directions — and supports multimodal inputs like sketches or reference images to guide generation more precisely.\n\nAt about 2 billion parameters, SD3 Medium strikes a balance between output quality and accessibility: it runs smoothly on consumer-grade hardware and benefits from GPU acceleration (NVIDIA and AMD) for faster synthesis. This makes it ideal for artists, designers, marketers, educators, and researchers who need reliable photorealistic imagery without high-end infrastructure. The model is available under the Stability Community License and distributed through platforms like Hugging Face and Stability AI’s services, enabling easy integration into creative workflows and applications.\n\nPractical uses include rapid concept generation for visual design, custom content for marketing and social media, educational tools that demonstrate AI-generated art, and research or experimentation in generative imaging. Users should note limitations: SD3 Medium is intended for synthetic, artistic imagery rather than accurate depictions of real people or historical events, and very large commercial deployments may require separate licensing arrangements. Overall, SD3 Medium offers a user-friendly, high-quality generation experience for anyone wanting photorealistic images on accessible hardware.","Создаёт фотореалистичные изображения по тексту; работает на обычных ПК","Stable Diffusion 3 Medium (SD3 Medium) — это мощная модель text-to-image, создающая высококачественные фотореалистичные изображения и при этом оптимизированная для обычных ноутбуков и ПК. Модель даёт богатые текстуры, проработанные детали и существенно улучшенную обработку сложных элементов — таких как руки, лица и текст на изображениях — что позволяет получать аккуратные готовые результаты с меньшим количеством корректировок промптов. SD3 Medium хорошо понимает сложные и нюансированные запросы, включая пространственные взаимоотношения, конкретные действия и разные художественные стили, а также поддерживает мультимодальные входы: эскизы или референсы для более точного управления генерацией.\n\nПри примерно 2 миллиардах параметров SD3 Medium удачно балансирует между качеством результата и доступностью: модель эффективно работает на потребительском железе и использует ускорение на GPU (NVIDIA и AMD) для более быстрой синтеза. Это делает её подходящей для художников, дизайнеров, маркетологов, преподавателей и исследователей, которым нужны надёжные фотореалистичные изображения без дорогостоящей инфраструктуры. Модель распространяется по лицензии Stability Community License и доступна через платформы вроде Hugging Face и сервисы Stability AI, что упрощает интеграцию в рабочие процессы и приложения.\n\nПрактические применения включают быстрое создание визуальных концептов, кастомный контент для маркетинга и соцсетей, образовательные инструменты для демонстрации AI-генерации и исследовательские эксперименты с генеративным изображением. Следует учитывать ограничения: SD3 Medium предназначена для синтетических художественных изображений и не гарантирует точного воспроизведения реальных людей или событий; для масштабного коммерческого использования может потребоваться отдельная лицензия. В целом, SD3 Medium предлагает удобный и качественный опыт генерации изображений на доступном оборудовании.",{"negative_prompt":163,"aspect_ratio":1272,"cfg":4704,"output_format":385,"output_quality":1537},{"_id":4751,"key":4752,"label":4753,"type":63,"generationType":691,"generationTypes":4754,"api":1067,"settingConfigs":4755,"isAdminModel":12,"isPromptRequired":61,"cost":737,"iconUrl":3968,"websiteUrl":4653,"description":4786,"position":4787,"secondCost":30,"generationCost":753,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":226,"generationCount":4788,"bannerImageUrl":4789,"previewImageUrl":4790,"shortLabel":4791,"examples":4792,"isBanned":12,"isOutdated":12,"percs":4793,"updatedAt":4798,"createdAt":4799,"releaseDate":4800,"longDescription":4801,"ruDescription":4802,"ruLongDescription":4803,"isAvailableAfterAuth":12,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":6,"supportFiles":12,"supportedFileTypes":4804,"tokenStrategy":67,"configValue":4805},"66204072e5fb74684ba2e562","sd3-turbo","Stable Diffusion 3 Turbo",[83,691],[4756,4762,4775,4780],{"fileTypes":4757,"_id":4758,"key":379,"model":4751,"title":380,"options":4759,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"defaultValue":385,"isAdvanced":61,"ruTitle":383},[],"662040b6e5fb74684ba2e563",[4760,4761],{"label":4639,"value":4639},{"label":385,"value":385},{"fileTypes":4763,"_id":4764,"key":1264,"model":4751,"title":1265,"defaultValue":1272,"options":4765,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1266},[],"6620410ae5fb74684ba2e564",[4766,4767,4768,4769,4770,4771,4772,4773,4774],{"label":1272,"value":1272},{"label":1274,"value":1274},{"label":1488,"value":1488},{"label":1284,"value":1284},{"label":1282,"value":1282},{"label":1288,"value":1288},{"label":1286,"value":1286},{"label":1276,"value":1276},{"label":1490,"value":1490},{"fileTypes":4776,"_id":4777,"key":4645,"model":4751,"title":1186,"position":4778,"step":249,"max":38,"min":30,"options":4779,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"defaultValue":439,"tooltipContent":1187,"description":1187,"ruDescription":1189,"ruTitle":1190},[],"662044ed25a18466d8bfcd9d",-109,[],{"fileTypes":4781,"_id":4782,"key":63,"model":4751,"title":4783,"tooltipContent":4650,"options":4784,"settingType":94,"fileType":63,"fileSource":28,"__v":30,"accept":92,"description":4650,"ruDescription":4652,"ruTitle":4785},[],"6620456625a18466d8bfce59","Image Reference",[],"Ссылка на изображение","Fast text-to-image & image-to-image generation, excellent typography",373,783,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sd3-turbo-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sd3-turbo-preview.png","SD 3 Turbo",[],[4794,4795,4796,4797],"68a9d676e3ac04ad89b91f37","68a9d676e3ac04ad89b91f39","68a9d676e3ac04ad89b91f3b","68a9d677e3ac04ad89b91f3d","2025-09-04T03:22:17.131Z","2024-09-11T09:49:32.956Z","2024-03-18T09:49:00.000Z","Stable Diffusion 3 Turbo is a distilled, optimized image generation model built for fast, high-fidelity text-to-image and image-to-image synthesis. It reduces the number of inference steps required to produce images, delivering much quicker results while preserving the strong prompt fidelity and visual quality users expect from Stable Diffusion 3. The model handles multilingual prompts naturally, so creators around the world can write instructions in their preferred language without loss of detail or nuance.\n\nWhat makes SD3 Turbo especially useful is its balance of performance and efficiency. Because it’s smaller and optimized, it runs well on consumer-grade GPUs and speeds up iteration for artists, designers, and developers. It excels at interpreting complex prompts and reproducing accurate, attractive typography inside images — a common pain point for many generative models — making it ideal for posters, ads, social posts, and other designs that combine imagery with text.\n\nPractical use cases include rapid prototyping of visual concepts, producing marketing assets, creating richly detailed scene art from written briefs, and using image-to-image workflows to refine or restyle source images. Developers integrating image generation into apps will appreciate the lower computational overhead and faster response times, while designers benefit from better prompt adherence and cleaner rendered text.\n\nLimitations: as a distilled variant, SD3 Turbo may yield slightly less variation or ultra-fine detail than the full-sized model in some cases, and it still benefits from GPU acceleration for best performance. Its primary focus is on text-to-image and image-to-image generation rather than other modalities such as video. Overall, it’s a practical choice for anyone needing accessible, fast, and typographically capable image synthesis.","Быстрая генерация изображений из текста и по изображению, отличная типографика","Stable Diffusion 3 Turbo — это уменьшенная и оптимизированная модель генерации изображений, созданная для быстрого и качественного синтеза по текстовым и по изображению подсказкам. Модель сокращает число шагов вывода, что обеспечивает заметное ускорение генерации при сохранении точности соответствия запросу и высокого уровня визуального качества, характерного для Stable Diffusion 3. SD3 Turbo корректно воспринимает подсказки на разных языках, позволяя авторам работать на родном языке без потери детализации.\n\nГлавные преимущества модели — сочетание скорости и экономности: за счёт компактной оптимизации она эффективно работает на потребительских видеокартах и ускоряет цикл итераций для художников, дизайнеров и разработчиков. Модель особенно хорошо справляется с точностью передачи сложных запросов и с генерацией аккуратной, эстетичной типографики в изображениях — это делает её отличным выбором для постеров, рекламных материалов, контента для социальных сетей и любых задач, где важна работа с текстом на изображении.\n\nПрактические сценарии использования включают быстрое прототипирование визуальных идей, создание маркетинговых материалов, получение детализированных сцен по текстовым описаниям и доработку исходных изображений через image-to-image. Разработчики оценят сниженные вычислительные затраты и ускоренное время отклика, а дизайнеры — лучшее соблюдение замысла и чистую визуализацию текста.\n\nОграничения: как дистиллированная версия, SD3 Turbo может в некоторых случаях давать чуть меньшую вариативность или крайне тонкие детали по сравнению с полной моделью; для максимальной производительности всё ещё рекомендуется GPU. Основной профиль модели — текст→изображение и image→image, а не другие модальности типа видео. В целом это практичный инструмент для быстрого, доступного и типографски ориентированного синтеза изображений.",[63,64],{"output_format":385,"aspect_ratio":1272,"strength":439},{"_id":4807,"key":4808,"label":4809,"description":4810,"isInstantModel":12,"releaseDate":4811,"type":63,"generationType":691,"generationTypes":4812,"api":85,"settingConfigs":4813,"percs":4860,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"replicateApiType":6,"cost":840,"iconUrl":3968,"position":38,"secondCost":30,"generationCost":4655,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":4864,"createdAt":4865,"updatedAt":4866,"__v":126,"generationCount":4867,"ruDescription":4868,"ruShortDescription":4869,"isAvailableAfterAuth":61,"isGenerationTypeRequired":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"supportFiles":12,"supportedFileTypes":4870,"tokenStrategy":67,"longDescription":4871,"ruLongDescription":4872,"configValue":4873},"671ab08ee04656a4f6c5d201","stability-ai/stable-diffusion-3.5-large","Stable Diffusion 3.5 Large","High-quality text-to-image and image-to-image at 1MP, strong prompt adherence","2024-10-22T20:38:00.000Z",[691,83],[4814,4820,4825,4831,4842,4849,4854],{"_id":4815,"key":4816,"model":4807,"title":1386,"tooltipContent":4817,"step":225,"max":817,"min":30,"defaultValue":1388,"options":4818,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4819},"671ab08ee04656a4f6c5d203","fg","Controls how similar the output should be to the prompt. Higher values increase similarity.",[],[],{"_id":4821,"key":63,"model":4807,"title":90,"tooltipContent":4822,"accept":92,"defaultValue":163,"options":4823,"settingType":94,"fileType":63,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4824},"671ab08ee04656a4f6c5d205","Upload an image for image-to-image mode. Output aspect ratio will match this image.",[],[],{"_id":4826,"key":4587,"model":4807,"title":4827,"tooltipContent":4828,"step":38,"max":53,"min":38,"defaultValue":2818,"options":4829,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4830},"671ab08ee04656a4f6c5d207","Sampling Steps","Number of steps to run the sampler for. More steps can improve quality but increase generation time.",[],[],{"_id":4832,"key":1264,"model":4807,"title":1265,"tooltipContent":4833,"defaultValue":1272,"options":4834,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4841},"671ab08ee04656a4f6c5d209","The aspect ratio of your output image. Ignored if using an input image.",[4835,4837,4838,4839,4840],{"value":1272,"label":4836},"1:1 (Square)",{"value":1278,"label":1278},{"value":1280,"label":1280},{"value":1274,"label":1274},{"value":1276,"label":1276},[],{"_id":4843,"key":379,"model":4807,"title":380,"tooltipContent":382,"defaultValue":393,"options":4844,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":4848},"671ab08ee04656a4f6c5d20b",[4845,4846,4847],{"value":393,"label":394},{"value":385,"label":388},{"value":390,"label":391},[],{"_id":4850,"key":1535,"model":4807,"title":1536,"tooltipContent":4718,"step":38,"max":65,"min":30,"defaultValue":4851,"options":4852,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4853},"671ab08ee04656a4f6c5d20d","90",[],[],{"_id":4855,"key":1185,"model":4807,"title":4141,"tooltipContent":4856,"step":249,"max":38,"min":30,"defaultValue":4857,"options":4858,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":4859},"671ab08ee04656a4f6c5d20f","Prompt strength (or denoising strength) when using image to image. 1.0 corresponds to full destruction of information in image.","0.85",[],[],[4861,4862,4863],"68a9da85e3ac04ad89b92036","68a9da86e3ac04ad89b92038","68a9da86e3ac04ad89b9203a",[],"2024-10-24T20:39:42.598Z","2025-09-04T00:40:03.374Z",310,"Высококачественная текст‑в‑изображение и изображение‑в‑изображение 1MP, точное следование запросам","Новейшая модель генерации изображений от Stability",[63,64],"Stable Diffusion 3.5 Large is an advanced text-to-image and image-to-image model designed for creators and professionals who need reliable, high-quality visuals at 1 megapixel (1024×1024). With 8.1 billion parameters and support for up to 256-token prompts across three text encoders, it excels at following detailed instructions so you get closer to your intended result on the first try. The model produces photorealistic imagery, illustrations, 3D-style renders, line art, and other aesthetics with fine detail and consistent lighting, color, and anatomy.\n\nPractical benefits include faster iteration cycles (especially when using the 3.5 Large Turbo variant) and flexible deployment choices — Large for maximum detail, Turbo for rapid outputs (similar visual quality in far fewer steps), and Medium for lower-resource setups. Typical generation uses 20–30 steps for the standard Large model and as few as 4 steps with Large Turbo, letting teams balance fidelity and throughput.\n\nUse cases span digital art and concept design, marketing and social content, fashion and architecture visualization, and synthetic dataset creation for machine learning. The model produces diverse, representative human images out of the box, reducing the need for complex prompting to get varied skin tones and features. Licensing is community-friendly: free for non-commercial use and permitted for smaller commercial entities under the stated limits, with users retaining ownership of generated media.\n\nLimitations include higher resource demands compared with smaller models and a learning curve for advanced negative prompting. Overall, Stable Diffusion 3.5 Large offers a strong mix of image quality, prompt fidelity, and practical speed options that make it a versatile choice for professionals and creative teams seeking dependable, production-ready image generation.","Stable Diffusion 3.5 Large — современная модель для генерации изображений из текста и преобразования изображений, созданная для профессионалов и творческих команд, которым нужны надёжные и детализированные изображения в разрешении 1 мегапиксель (1024×1024). С 8,1 миллиарда параметров и поддержкой до 256 токенов в трёх текстовых кодировщиках модель особенно хорошо следует подробным инструкциям, что позволяет получать близкие к ожидаемым результаты с первой генерации. Модель умеет создавать фотореалистичные изображения, иллюстрации, 3D‑рендеры, линейную графику и другие стили с аккуратной проработкой деталей, света и цветов.\n\nПрактические преимущества включают ускоренную итерацию (особенно в варианте Large Turbo) и гибкие варианты развертывания: Large для максимального качества, Turbo для быстрого вывода схожего качества с меньшим числом шагов и Medium для систем с ограниченными ресурсами. Стандартная версия обычно требует 20–30 шагов генерации, а Turbo — около 4, что даёт возможность оптимально выбирать баланс между качеством и скоростью.\n\nСценарии применения охватывают цифровое искусство и концепт‑дизайн, маркетинг и социальный контент, визуализацию моды и архитектуры, а также синтетическую генерацию данных для исследований в машинном обучении. Модель сразу выдаёт разнообразные и репрезентативные изображения людей без сложных подсказок. Лицензия дружественна к сообществу: бесплатное некоммерческое использование и коммерческое для организаций с доходом менее $1M, при этом права на генерируемые материалы остаются у пользователей.\n\nОграничения включают повышенные требования к ресурсам и необходимость навыков для эффективного использования негативных подсказок. В сумме Stable Diffusion 3.5 Large сочетает высокое качество изображения, точность следования подсказкам и практичные опции по скорости, делая её универсальным инструментом для профессионалов и креативных команд.",{"fg":1388,"image":163,"steps":2818,"aspect_ratio":1272,"output_format":393,"output_quality":4851,"prompt_strength":4857},{"_id":4875,"key":4876,"label":4877,"shortLabel":4878,"description":4879,"isInstantModel":12,"isAvailableAfterAuth":12,"isReasoningModel":12,"ruDescription":4880,"ruLongDescription":4881,"contextCapacity":30,"maxTokens":30,"type":4882,"generationType":4883,"generationTypes":4884,"api":1067,"settingConfigs":4885,"percs":4948,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":12,"supportFiles":61,"supportedFileTypes":4953,"replicateApiType":6,"outputPath":7,"cost":1295,"gemTokenCost":1295,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":225,"examples":4954,"createdAt":4955,"updatedAt":4956,"__v":226,"iconUrl":3968,"generationCount":491,"longDescription":4957,"configValue":4958},"689f147db8961609cd8df460","stable-diffusion-3D","Stable Diffusion 3D","SD 3D","Generate multi-view 3D meshes and view-consistent videos from images","Генерирует многовидовые 3D-сети и согласованные видео из изображений","Stable Diffusion 3D — это набор инструментов и расширений, которые переносят возможности генеративной системы Stable Diffusion в область 3D. Это не отдельная модель, а совокупность методов для синтеза новых видов, генерации 3D-сеток по одиночному изображению и улучшения 3D-визуализаций и многовидовых видео. Пользователи могут создавать орбитальные видео или видео с заданной траекторией камеры, получать согласованные по видам многокадровые результаты и извлекать либо уточнять 3D-сетки из одной фотографии. Также доступны режимы доработки изображений (img2img и inpaint) для добавления реалистичных деталей в готовые 3D-рендеры — это экономит время, позволяя улучшать части сцены без повторного полного рендера.\n\nДля создателей это означает более быстрый цикл итераций при создании игровых ассетов, прототипов VR/AR, продуктов и архитектурных визуализаций: можно генерировать альтернативные ракурсы, получать базовые сетки для дальнейшей доработки и создавать короткие многовидовые видео для презентаций. Для исследователей и инженеров по компьютерному зрению внутренние признаки Stable Diffusion полезны для задач анализа сцены (глубина, опорные соотношения, освещение). Семейство методов предлагает компромисс между качеством и скоростью: есть варианты для высокодетализированных результатов и более быстрых выводов, а также технологии разделённого освещения и оптимизации для реалистичных сеток.\n\nОграничения остаются: полностью точная реконструкция сложных 3D-объектов из одного изображения может требовать дополнительной оптимизации или ручной доработки, а распознавание материалов и окклюзий уступает специализированным моделям. Некоторые продвинутые настройки (трассировка камеры, оптимизация сетки) требуют технических навыков. В целом Stable Diffusion 3D отлично подходит художникам, специалистам по визуализации и исследователям, которым нужны практичные, качественные многовидовые и 3D-воркфлоу для интеграции в существующие пайплайны.","object","image-to-object",[4883],[4886,4902,4912,4930,4941],{"fileTypes":4887,"_id":4888,"key":4889,"model":4875,"title":4890,"tooltipContent":4891,"description":4892,"ruTitle":4893,"ruDescription":4894,"step":38,"max":3450,"min":4003,"defaultValue":1787,"options":4895,"settingType":282,"fileSource":28,"valueType":215,"__v":30},[],"689f147eb8961609cd8df462","texture_resolution","Texture Resolution","Determines the resolution of the textures used for both the albedo (color) map and the normal map.\u003Cbr>Higher values = more detail, larger file sizes.","Determines the resolution of the textures used for both the albedo (color) map and the normal map. Higher resolution provides more intricate and precise rendering of surfaces but results in larger asset sizes.","Разрешение текстуры","Определяет разрешение текстур, используемых для карты альбедо (цвета) и карты нормалей. Более высокое разрешение обеспечивает более детальную и точную визуализацию поверхностей, но приводит к увеличению размера файлов.",[4896,4898,4900],{"label":4897,"value":2593},"512px",{"label":4899,"value":1787},"1024px",{"label":4901,"value":2612},"2048px",{"fileTypes":4903,"_id":4904,"key":4905,"model":4875,"title":4906,"tooltipContent":4907,"description":4908,"ruTitle":4909,"ruDescription":4910,"step":249,"max":38,"min":225,"defaultValue":4857,"options":4911,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"689f147eb8961609cd8df464","foreground_ratio","Foreground Ratio","Controls the amount of padding around the object within the frame.\u003Cbr>Higher values = less padding, larger object.\u003Cbr>Lower values = more padding, smaller object.","Controls the amount of padding around the object to be processed within the frame. Higher ratio means less padding and a larger object, while lower ratio increases padding, reducing the object's size within the frame.","Соотношение переднего плана","Контролирует количество отступов вокруг объекта в кадре. Более высокое соотношение означает меньше отступов и больший объект, в то время как более низкое соотношение увеличивает отступы, уменьшая размер объекта в кадре.",[],{"fileTypes":4913,"_id":4914,"key":4915,"model":4875,"title":4916,"tooltipContent":4917,"description":4918,"ruTitle":4919,"ruDescription":4920,"step":38,"max":38,"min":30,"defaultValue":7,"options":4921,"settingType":282,"fileSource":28,"valueType":215,"__v":30},[],"689f147eb8961609cd8df466","remesh","Remesh Algorithm","Controls the remeshing algorithm used to generate the 3D model.\u003Cbr>None = no remeshing, Triangle = triangular faces, Quad = quadrilateral faces.","Controls the remeshing algorithm used to generate the 3D model. 'None' means no remeshing, 'triangle' generates triangular faces, 'quad' generates quadrilateral faces suitable for DCC tools.","Алгоритм перестроения сетки","Контролирует алгоритм перестроения сетки для генерации 3D модели. 'None' означает отсутствие перестроения, 'triangle' создает треугольные грани, 'quad' создает четырехугольные грани, подходящие для инструментов DCC.",[4922,4924,4927],{"label":4923,"value":7},"None",{"label":4925,"value":4926},"Triangle","triangle",{"label":4928,"value":4929},"Quad","quad",{"fileTypes":4931,"_id":4932,"key":4933,"model":4875,"title":4934,"tooltipContent":4935,"description":4936,"ruTitle":4937,"ruDescription":4938,"step":65,"max":4939,"min":326,"defaultValue":323,"options":4940,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"689f147eb8961609cd8df468","vertex_count","Vertex Count","Approximate number of vertices in the simplified mesh.\u003Cbr>-1 = no limit, higher values = more detail.","If specified, the result will have approximately this many vertices in the simplified mesh. Setting to -1 means no limit is set.","Количество вершин","Если указано, результат будет содержать приблизительно такое количество вершин в упрощенной сетке. Установка значения -1 означает отсутствие ограничений.",20000,[],{"fileTypes":4942,"_id":4943,"key":63,"model":4875,"title":90,"tooltipContent":4944,"description":4945,"ruTitle":96,"ruDescription":4946,"accept":92,"defaultValue":163,"options":4947,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"valueType":215,"__v":30},[],"689f147eb8961609cd8df46a","Upload an image to generate a 3D model from.\u003Cbr>Supported formats: JPEG, PNG, WebP.\u003Cbr>Minimum 64px per side, max 4.2M pixels.","The image to generate a 3D model from. Supported formats: JPEG, PNG, WebP. Every side must be at least 64 pixels, total pixel count between 4,096 and 4,194,304 pixels.","Изображение для генерации 3D модели. Поддерживаемые форматы: JPEG, PNG, WebP. Каждая сторона должна быть не менее 64 пикселей, общее количество пикселей от 4,096 до 4,194,304.",[],[4949,4950,4951,4952],"68a9e2e1e3ac04ad89b92203","68a9e2e1e3ac04ad89b92205","68a9e2e1e3ac04ad89b92207","68a9e2e1e3ac04ad89b92209",[63],[],"2025-08-15T11:05:33.784Z","2025-08-23T15:48:50.041Z","Stable Diffusion 3D is a family of tools and model extensions that bring Stable Diffusion’s powerful generative capabilities into the 3D domain. Instead of being a single model, it groups practical techniques for novel view synthesis, single-image 3D mesh generation, and improving 3D visualizations and multi-view videos. Users can generate orbital or camera-path–conditioned videos, produce view-consistent multi-angle outputs, and extract or refine 3D meshes from a single photo. It also supports image-guided refinement (img2img and inpaint) to add realistic details to existing 3D renders—saving time by improving parts of a render without redoing whole scenes.\n\nFor creators, this means faster iteration on game assets, VR/AR prototypes, product visuals, and architectural previews: produce alternate viewpoints, generate base meshes for further sculpting, and create short multi-view videos for presentations. For researchers and vision engineers, Stable Diffusion 3D’s internal features encode useful 3D cues (depth, support relations, lighting) that can assist scene analysis and downstream tasks. The suite balances quality and speed with variants optimized for either high-fidelity outputs or faster inference, and supports disentangled illumination and advanced optimization techniques to produce more realistic mesh outputs.\n\nLimitations remain: fully accurate complex 3D reconstruction from a single image may require additional optimization or manual cleanup, and material or occlusion understanding can be weaker than specialized 3D models. Some advanced options (camera-path conditioning, mesh optimization) require technical knowledge to get best results. Overall, Stable Diffusion 3D is best suited for artists, visualization professionals, and researchers who want practical, high-quality multi-view and 3D workflows integrated into existing pipelines.",{"texture_resolution":1787,"foreground_ratio":4857,"remesh":7,"vertex_count":323,"image":163},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":4960,"replicateApiType":6,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":4961,"key":4962,"label":4963,"type":63,"generationType":691,"generationTypes":4964,"api":1067,"settingConfigs":4965,"isAdminModel":12,"isPromptRequired":61,"cost":1227,"iconUrl":3968,"description":5037,"position":5038,"secondCost":30,"generationCost":2719,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":126,"generationCount":5039,"shortLabel":5040,"previewImageUrl":5041,"bannerImageUrl":5042,"examples":5043,"isBanned":12,"isOutdated":12,"updatedAt":5049,"createdAt":5050,"percs":5051,"websiteUrl":5055,"longDescription":5056,"ruDescription":5057,"ruLongDescription":5058,"isAvailableAfterAuth":12,"configValue":5059},[63,64],"6620e79ab864a23a7cb616e8","core","Stable Diffusion Core",[691],[4966,4979,4983],{"fileTypes":4967,"_id":4968,"key":1264,"model":4961,"title":1265,"defaultValue":1272,"options":4969,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1266},[],"6620e79ab864a23a7cb616ea",[4970,4971,4972,4973,4974,4975,4976,4977,4978],{"label":1272,"value":1272},{"label":1274,"value":1274},{"label":1488,"value":1488},{"label":1284,"value":1284},{"label":1282,"value":1282},{"label":1288,"value":1288},{"label":1286,"value":1286},{"label":1276,"value":1276},{"label":1490,"value":1490},{"fileTypes":4980,"_id":4981,"key":206,"model":4961,"title":207,"options":4982,"settingType":214,"fileSource":28,"valueType":215,"__v":30,"defaultValue":163,"ruTitle":1181},[],"6620e79ab864a23a7cb616ec",[],{"fileTypes":4984,"_id":4985,"key":4986,"model":4961,"title":1158,"isClearable":61,"options":4987,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"defaultValue":163,"ruTitle":1174},[],"6620e880b864a23a7cb616fc","style_preset",[4988,4991,4994,4996,4999,5002,5005,5008,5011,5014,5017,5020,5023,5026,5029,5032,5034],{"label":4989,"value":4990},"3D Model","3d-model",{"label":4992,"value":4993},"Analog Film","analog-film",{"label":2317,"value":4995},"anime",{"label":4997,"value":4998},"Cinematic","cinematic",{"label":5000,"value":5001},"Comic Book","comic-book",{"label":5003,"value":5004},"Digital Art","digital-art",{"label":5006,"value":5007},"Enhance","enhance",{"label":5009,"value":5010},"Fantasy Art","fantasy-art",{"label":5012,"value":5013},"Isometric","isometric",{"label":5015,"value":5016},"Line Art","line-art ",{"label":5018,"value":5019},"Low Poly","low-poly ",{"label":5021,"value":5022},"Modeling Compound","modeling-compound",{"label":5024,"value":5025},"Neon Punk","neon-punk",{"label":5027,"value":5028},"Origami","origami",{"label":5030,"value":5031},"Photographic","photographic",{"label":3710,"value":5033},"pixel-art",{"label":5035,"value":5036},"Tile Texture","tile-texture","Generate detailed images from text; inpainting, outpainting, edits",416,281,"SD Core","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/core-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/core-banner.png",[5044,5045,5046,5047,5048],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_562777296479.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_103980758309.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_396139447707.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa4bd5ad7c6e45be731b6/generated-image/optimized_1245167492881.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/643aa5b4a12b48d5cea93e95/generated-image/optimized_1565513345727.webp","2025-08-23T14:56:33.630Z","2024-09-01T14:18:20.769Z",[5052,5053,5054],"68a9d6a1e3ac04ad89b91f44","68a9d6a1e3ac04ad89b91f46","68a9d6a1e3ac04ad89b91f48","https://stability.ai/","Stable Diffusion Core is a versatile text-to-image model that lets users create high-quality visuals from simple natural-language prompts and perform targeted image edits. Beyond straightforward generation, it supports inpainting to fill or correct parts of an image, outpainting to extend compositions beyond their original borders, and image-to-image transformations guided by text — enabling retouching, style transfer, and creative reinterpretation of existing images. A key practical advantage is efficiency: Stable Diffusion works in a compressed latent space, so it runs quickly and can operate on modest consumer GPUs (models report working on devices with as little as ~2.4 GB VRAM). The project is open source, so teams can run the model locally, customize weights, integrate it into applications, and avoid vendor lock-in. Typical use cases include rapid concept art and illustration generation, visual prototyping for advertising and games, automated image editing pipelines, and embedding generation functionality into web or desktop apps. Users can achieve photorealistic or stylized outputs with strong prompt fidelity, then refine results via inpainting or image-conditioned prompts. Limitations to plan for: base models commonly generate around 512×512 pixels, so professional workflows often pair the model with upscalers for print or high-resolution needs. Complex scenes can occasionally produce anatomical or semantic artifacts, and, as with other large models, outputs may reflect biases present in training data. Inference involves sequential denoising steps, so real-time performance may require additional optimizations. Overall, Stable Diffusion Core offers a powerful, accessible foundation for creatives and developers who want an open, customizable, and hardware-friendly text-to-image solution that supports a broad range of image generation and editing tasks.","Генерирует детализированные изображения по тексту; инпейтинг, аутпейтинг, правки","Stable Diffusion Core — универсальная модель «текст-в-изображение», позволяющая создавать качественные визуалы по простым текстовым запросам и выполнять прицельные правки изображений. Кроме генерации с нуля модель поддерживает инпейтинг (восстановление или исправление частей изображения), аутпейтинг (расширение композиции за границы кадра) и преобразования «изображение в изображение» с управлением текстом — это удобно для ретуши, переноса стиля и креативной переработки существующих картинок. Практическое преимущество — эффективность: модель работает в сжатом латентном пространстве, поэтому она быстрее и может запускаться на доступных потребительских GPU (отмечены случаи работы с ~2.4 ГБ VRAM). Модель доступна с открытыми весами, что позволяет размещать её локально, настраивать и встраивать в приложения без зависимости от облачных провайдеров. Основные сценарии применения: быстрое создание концепт‑артов и иллюстраций, визуальное прототипирование для рекламы и игр, автоматизированные пайплайны редактирования изображений и интеграция в веб/десктоп‑продукты. Пользователи получают фотореалистичные или стилизованные результаты с хорошим соответствием подсказкам и могут улучшать их с помощью инпейтинга и обработки по ссылкам на референсы. Ограничения: базовые модели обычно генерируют около 512×512 пикселей, поэтому для профессиональных задач часто используют апскейлеры; в сложных сценах возможны анатомические или семантические артефакты; а также в данных могут присутствовать предвзятости. Последовательный процесс денойзинга влияет на скорость, поэтому для реального времени требуются дополнительные оптимизации. В целом Stable Diffusion Core — мощная, доступная и настраиваемая платформа для широкого круга творческих и производственных задач.",{"aspect_ratio":1272,"negative_prompt":163,"style_preset":163},{"_id":5061,"key":5062,"label":5063,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"api":1067,"settings":5064,"tier":125,"__v":4037,"iconType":5069,"cost":482,"generationCount":5070,"iconUrl":3968,"previewImageUrl":5071,"description":5072,"generationTypes":5073,"settingConfigs":5074,"bannerImageUrl":5178,"isPromptRequired":61,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"secondCost":30,"stepPrice":5179,"githubUrl":5180,"licenseUrl":5181,"websiteUrl":163,"position":879,"shortLabel":5182,"isOutdated":12,"isAdminModel":12,"updatedAt":5183,"createdAt":5184,"examples":5185,"isBanned":12,"percs":5193,"releaseDate":5198,"longDescription":5199,"ruDescription":5200,"ruLongDescription":5201,"isInstantModel":12,"isGenerationTypeRequired":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":5202,"tokenStrategy":67,"isAvailableAfterAuth":12,"outputPath":7,"replicateApiType":6,"configValue":5203},"656ee025025ddd19a58e2fa5","stable-diffusion-xl-1024-v1-0","Stable Diffusion XL",[5065],{"key":5066,"title":2781,"tooltipContent":5067,"step":862,"max":5068,"min":30},"cfg_scale","CFG Scale. Idictates how closely the generated image mirrors your prompt",35,"sdxl",6627,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sdxl-preview.png","Generate ultra-high-resolution photorealistic images from text",[691,83],[5075,5079,5085,5093,5102,5125,5151],{"_id":5076,"key":5066,"title":2807,"model":5061,"modelKey":5062,"tooltipContent":1187,"step":38,"max":5068,"min":30,"options":5077,"settingType":43,"__v":30,"position":71,"fileSource":28,"defaultValue":4572,"isRequired":12,"valueType":44,"description":1187,"ruDescription":1189,"ruTitle":2813,"fileTypes":5078},"65c3969d167052183494974a",[],[],{"_id":5080,"key":5081,"title":5082,"model":5061,"modelKey":5062,"tooltipContent":2419,"options":5083,"settingType":94,"__v":30,"accept":92,"dimensions":402,"step":38,"position":126,"isRequired":12,"fileSource":28,"fileType":63,"description":2419,"ruDescription":2421,"ruTitle":4180,"fileTypes":5084},"65c3d642d4cf88b924caab83","init_image","Reference image ",[],[],{"_id":5086,"key":4587,"title":5087,"model":5061,"modelKey":5062,"tooltipContent":5088,"step":38,"max":53,"min":40,"defaultValue":4572,"options":5089,"settingType":43,"__v":30,"position":482,"valueType":44,"fileSource":28,"isAdvanced":61,"description":5088,"ruDescription":5090,"ruTitle":5091,"fileTypes":5092},"65c4fbfb1415e4c7d572f4e8","Steps","Around 25 sampling steps are usually enough to achieve high-quality images",[],"Для получения высококачественных изображений обычно достаточно около 25 шагов выборки.","Шаги",[],{"_id":5094,"key":5095,"title":5096,"model":5061,"modelKey":5062,"tooltipContent":2808,"step":1394,"max":38,"min":30,"defaultValue":5097,"options":5098,"settingType":43,"__v":30,"position":226,"fileSource":28,"description":2808,"ruDescription":5099,"ruTitle":5100,"fileTypes":5101},"65c4fbfb1415e4c7d572f4e7","image_strength","Reference image weight","0.45",[],"Определите, как эталонное изображение влияет на результат","Вес контрольного изображения",[],{"_id":5103,"key":5104,"title":5105,"model":5061,"modelKey":5062,"tooltipContent":163,"defaultValue":5106,"options":5107,"settingType":282,"__v":30,"isClearable":12,"isAdvanced":61,"position":4037,"step":38,"fileSource":28,"description":5122,"ruTitle":5105,"ruDescription":5123,"fileTypes":5124},"65c4fbfb1415e4c7d572f4e9","clip_guidance_preset","Clip Guidance Preset","NONE",[5108,5111,5113,5114,5116,5118,5120],{"value":5109,"label":5110},"FAST_BLUE","FAST BLUE",{"value":5112,"label":5112},"FAST_GREEN",{"value":5106,"label":5106},{"value":5115,"label":5115},"SIMPLE",{"value":5117,"label":5117},"SLOW",{"value":5119,"label":5119},"SLOWER",{"value":5121,"label":5121},"SLOWEST","Preset for algorithm that goes through to check how much the final image matches the given prompt","Предварительная настройка для алгоритма, который проверяет, соответствует ли окончательное изображение заданному запросу.",[],{"_id":5126,"key":5127,"title":5128,"model":5061,"modelKey":5062,"tooltipContent":163,"defaultValue":2535,"options":5129,"settingType":282,"__v":30,"isClearable":12,"isAdvanced":61,"position":2723,"step":38,"fileSource":28,"description":5147,"ruTitle":5148,"ruDescription":5149,"fileType":2674,"valueType":215,"fileTypes":5150},"65c4fbfb1415e4c7d572f4ea","sampler","Sampler",[5130,5131,5133,5135,5137,5139,5141,5142,5143,5145],{"value":300,"label":300},{"value":5132,"label":5132},"DDPM",{"value":5134,"label":5134},"K_DPMPP_2M",{"value":5136,"label":5136},"K_DPMPP_2S_ANCESTRAL",{"value":5138,"label":5138},"K_DPM_2",{"value":5140,"label":5140},"K_DPM_2_ANCESTRAL",{"value":2535,"label":2535},{"value":2542,"label":2542},{"value":5144,"label":5144},"K_HEUN",{"value":5146,"label":5146},"K_LMS","The method that will be used in a denosing process","Сэмплер","Метод который будет использоваться в процессе денойзинга",[],{"_id":5152,"key":4986,"title":5153,"model":5061,"modelKey":5062,"tooltipContent":5154,"defaultValue":4998,"options":5155,"settingType":282,"__v":30,"isAdvanced":12,"isClearable":12,"step":38,"position":38,"isRequired":12,"fileSource":28,"valueType":215,"description":5154,"ruDescription":5175,"ruTitle":5176,"fileTypes":5177},"65c516f71415e4c7d572f4f3","Style preset","Choose one of the predefined styles ",[5156,5157,5158,5159,5160,5161,5162,5163,5164,5165,5167,5169,5170,5171,5172,5173,5174],{"value":4990,"label":4989},{"value":4993,"label":4992},{"value":4995,"label":2317},{"value":4998,"label":4997},{"value":5001,"label":5000},{"value":5004,"label":5003},{"value":5007,"label":5006},{"value":5010,"label":5009},{"value":5013,"label":5012},{"value":5166,"label":5015},"line-art",{"value":5168,"label":5018},"low-poly",{"value":5022,"label":5021},{"value":5025,"label":5024},{"value":5028,"label":5027},{"value":5031,"label":5030},{"value":5033,"label":3710},{"value":5036,"label":5035},"Выберите один из предопределенных стилей","Предварительная настройка стиля",[],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sdxl-banner.png",0.00017,"https://github.com/Stability-AI/generative-models","https://github.com/Stability-AI/generative-models?tab=MIT-1-ov-file#readme","SDXL","2025-09-08T17:10:54.149Z","2024-08-27T13:31:51.585Z",[5186,5187,5188,5189,5190,5191,5192],"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/optimized_1169920081924.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/optimized_368518038900.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/optimized_976879844246.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/optimized_607738151580.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/optimized_303292613745.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/optimized_975935633112.webp","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/optimized_648714467553.png",[5194,5195,5196,5197],"68a9d2e2e3ac04ad89b91e79","68a9d2e2e3ac04ad89b91e7b","68a9d2e2e3ac04ad89b91e7d","68a9d2e3e3ac04ad89b91e7f","2023-07-01T09:43:00.000Z","Stable Diffusion XL (SDXL) is a state-of-the-art, open-source text-to-image model designed to produce ultra-high-resolution, photorealistic and artistically rich images. SDXL reliably generates images at 1024×1024 pixels and beyond with improved color accuracy, lighting, depth, and consistently realistic faces. It understands complex, descriptive prompts better than prior versions and accepts multimodal inputs so you can combine text and reference images for more controlled outputs. \n\nBeyond standard text-to-image generation, SDXL includes practical editing capabilities: inpainting to repair or remove elements, outpainting to extend compositions naturally beyond their original borders, and image-to-image generation to create variations or restyle existing photos. These tools make SDXL useful for workflows like photo restoration, product visualization, marketing assets, concept art, and rapid prototyping.\n\nA two-stage generation pipeline — initial synthesis followed by a specialized high-resolution refiner — improves local detail and reduces artifacts such as deformed facial features, giving cleaner, more reliable results. SDXL also shows improved on-image text rendering, valuable for ads, packaging mockups, and illustrated content. As an open-source model, it’s extensible and integrates into custom pipelines, letting teams fine-tune or combine it with other tools. \n\nPractically, creators and enterprises can use SDXL to produce professional visuals, iterate quickly on design variations, and automate content generation at scale. Note that high-resolution generation benefits from GPUs and greater compute; occasional local artifacts can persist and output quality depends on prompt clarity. Overall, SDXL balances image quality, editing flexibility, and extensibility to meet demanding creative and commercial use cases.","Генерирует ультра‑высокое разрешение фотореалистичных изображений по тексту","Stable Diffusion XL (SDXL) — современная open-source модель text-to-image, предназначенная для создания ультра‑высокого разрешения фотореалистичных и художественно выразительных изображений. SDXL стабильно генерирует изображения в разрешении 1024×1024 и выше с улучшенной цветопередачей, светотенью, глубиной и реалистичными лицами. Модель лучше понимает сложные, детализированные подсказки и поддерживает мультимодальные входы, позволяя комбинировать текст и референсы для более точного управления результатом.\n\nКроме обычной генерации по тексту, SDXL предлагает практичные инструменты редактирования: инпейтинг для восстановления или удаления элементов, аутпейтинг для естественного расширения композиции за рамки исходного кадра и image-to-image для создания вариантов или ребайтов существующих фотографий. Эти возможности полезны для восстановления фото, визуализации продуктов, маркетинговых материалов, концепт‑арта и быстрого прототипирования.\n\nДвухэтапный конвейер генерации — начальный синтез и последующая доработка высоких разрешений — улучшает локальные детали и уменьшает артефакты (например, дефекты лиц), давая более чистые и надежные результаты. SDXL также лучше отображает текст внутри изображений, что важно для рекламы и макетов. Будучи open-source, модель легко интегрируется и настраивается в пользовательских пайплайнах.\n\nНа практике креаторы и компании получают инструмент для создания профессиональных визуалов, быстрого перебора вариантов дизайна и автоматизации генерации контента. Для высокого разрешения требуется GPU и больше вычислительных ресурсов; иногда остаются локальные артефакты, а качество сильно зависит от четкости подсказки. В целом SDXL предлагает баланс качества, гибкости редактирования и расширяемости для профессиональных и коммерческих задач.",[63,64],{"cfg_scale":4572,"steps":4572,"image_strength":5097,"clip_guidance_preset":5106,"sampler":2535,"style_preset":4998},{"_id":5205,"key":5206,"label":5207,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"generationTypes":5208,"api":85,"settingConfigs":5209,"isAdminModel":12,"isPromptRequired":61,"replicateId":5233,"cost":737,"iconUrl":5234,"previewImageUrl":5235,"bannerImageUrl":5236,"description":5237,"secondCost":1221,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":4037,"generationCount":5238,"githubUrl":5239,"licenseUrl":5240,"position":3045,"examples":5241,"isBanned":12,"isOutdated":12,"percs":5242,"updatedAt":5246,"createdAt":5247,"releaseDate":5248,"longDescription":5249,"ruDescription":5250,"ruLongDescription":5251,"isAvailableAfterAuth":12,"replicateApiType":117,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"supportFiles":12,"supportedFileTypes":5252,"tokenStrategy":67,"configValue":5253},"65e9bcc444f732690cf20b7a","fofr/sticker-maker","Sticker Maker",[691],[5210,5214,5218,5222,5229],{"_id":5211,"key":4587,"model":5205,"title":5087,"tooltipContent":5087,"step":38,"max":65,"min":38,"defaultValue":3114,"options":5212,"settingType":43,"fileType":327,"isRequired":12,"__v":30,"isAdvanced":61,"valueType":44,"fileSource":28,"description":5087,"ruDescription":5091,"ruTitle":5091,"fileTypes":5213},"65e9bcc444f732690cf20b7e",[],[],{"_id":5215,"key":2587,"model":5205,"title":2588,"tooltipContent":2588,"step":555,"max":3450,"min":2825,"defaultValue":1787,"options":5216,"settingType":43,"fileType":63,"isRequired":61,"__v":30,"position":71,"fileSource":28,"description":2588,"ruDescription":2613,"ruTitle":2613,"fileTypes":5217},"65e9bcc444f732690cf20b80",[],[],{"_id":5219,"key":2617,"model":5205,"title":2618,"tooltipContent":2618,"step":555,"max":3450,"min":2825,"defaultValue":1787,"options":5220,"settingType":43,"fileType":63,"isRequired":61,"__v":30,"position":126,"fileSource":28,"description":2618,"ruDescription":2634,"ruTitle":2634,"fileTypes":5221},"65e9bcc444f732690cf20b82",[],[],{"_id":5223,"key":5224,"model":5205,"title":5225,"tooltipContent":5225,"step":38,"max":65,"min":38,"defaultValue":841,"options":5226,"settingType":43,"fileType":327,"isRequired":12,"__v":30,"isAdvanced":61,"valueType":44,"fileSource":28,"description":5225,"ruDescription":5227,"ruTitle":5227,"fileTypes":5228},"65e9bcc444f732690cf20b88","upscale_steps","Upscale Steps",[],"Высокие ступени",[],{"_id":5230,"key":206,"model":5205,"title":207,"tooltipContent":2419,"defaultValue":163,"options":5231,"settingType":214,"fileType":327,"isRequired":12,"__v":30,"position":38,"step":38,"fileSource":28,"description":2419,"ruDescription":2421,"ruTitle":1181,"fileTypes":5232},"65e9bcc444f732690cf20b8a",[],[],"fofr/sticker-maker:4acb778eb059772225ec213948f0660867b2e03f277448f18cf1800b96a65a1a","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sticker.svg","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sticker-maker-preview.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/sticker-maker-banner.png","Generate stickers from text or photos — fast, editable, high‑res",84,"https://github.com/fofr/cog-stickers","https://github.com/fofr/cog-stickers/blob/main/LICENSE",[],[5243,5244,5245],"68a9d524e3ac04ad89b91ee2","68a9d524e3ac04ad89b91ee4","68a9d524e3ac04ad89b91ee6","2025-08-23T14:50:12.685Z","2024-09-11T10:06:29.944Z","2024-02-23T10:06:00.000Z","Sticker Maker is an AI-driven image tool that quickly creates custom digital stickers from simple text prompts or uploaded photos. Users can describe an idea in words and receive a ready-to-use sticker, or convert personal images — including faces — into expressive emojis, caricatures, or cutouts with transparent backgrounds. The model supports batch production for generating sticker sets at once and offers interactive customization options such as size presets, negative prompts to remove unwanted elements, and simple editing to refine results.\n\nBeyond static stickers, many Sticker Maker workflows let users create animated stickers, swap faces, or transform artwork into coloring pages and back again, enabling playful, multi-step creative projects. Outputs are produced in high-definition formats (commonly PNG with transparency) and sized for messaging apps, social posts, merchandise, and print. The interface is designed for non-designers: web-based, fast, and easy to use without prior graphic skills.\n\nPractical uses include personal expression in chats and social media, branded stickers for marketing and packaging, custom merchandise (clothing, accessories), classroom or family coloring activities, and quick visual assets for small businesses. The system emphasizes speed and accessibility, enabling rapid iteration and bulk creation when needed.\n\nLimitations include occasional variability in style or detail depending on prompt clarity, more limited advanced editing compared with professional design suites, and reliance on internet access for web-based tools. Users should also remain mindful of copyright and originality when importing or describing protected content. Overall, Sticker Maker democratizes sticker creation, letting anyone produce polished, personalized stickers quickly for social, commercial, and creative projects.","Создавайте стикеры по тексту или фото — быстро, редактируемо, в высоком качестве","Sticker Maker — это инструмент на базе ИИ, который быстро создаёт индивидуальные цифровые стикеры по простому текстовому описанию или на основе загруженных фотографий. Пользователь может описать идею словами и получить готовый стикер, либо преобразовать личные фото — например, лица — в выразительные эмодзи, карикатуры или вырезы с прозрачным фоном. Модель поддерживает пакетную генерацию наборов стикеров и предлагает интерактивные средства настройки: пресеты размеров, «негативные» подсказки для удаления нежелательных элементов и простое редактирование для доработки результата.\n\nПомимо статичных изображений, в некоторых вариантах доступны анимированные стикеры, замена лиц и конвертация стикеров в раскраски и обратно — это открывает возможности для игровых и пошаговых творческих проектов. Выходные файлы — высокого разрешения (обычно PNG с прозрачностью), подготовлены для мессенджеров, соцсетей, мерча и печати. Интерфейс ориентирован на пользователей без навыков дизайна: веб-доступный, быстрый и удобный.\n\nПрактические сценарии включают самовыражение в чатах и соцсетях, брендовые стикеры для маркетинга и упаковки, дизайн для мерча (одежда, аксессуары), развивающие и развлекательные раскраски для детей и быстрые визуальные материалы для малого бизнеса. Ограничения: возможна вариативность стиля при недостаточно точных подсказках, менее глубокие инструменты редактирования по сравнению с профессиональными графическими программами и зависимость от интернет‑сервиса. Также важно учитывать права на исходный контент. В целом Sticker Maker демократизирует создание стикеров, позволяя каждому быстро получать качественные персонализированные изображения для разных задач.",[63,64],{"steps":3114,"width":1787,"height":1787,"upscale_steps":841,"negative_prompt":163},{"_id":5255,"key":5256,"label":5257,"contextCapacity":82,"maxTokens":65,"type":63,"generationType":691,"generationTypes":5258,"api":85,"settingConfigs":5259,"isPromptRequired":61,"replicateId":5311,"cost":53,"description":5312,"position":5313,"secondCost":1221,"generationCost":327,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":40,"generationCount":5314,"bannerImageUrl":5315,"iconUrl":5316,"previewImageUrl":5317,"isAdminModel":12,"examples":5318,"isBanned":12,"isOutdated":12,"percs":5319,"updatedAt":5323,"createdAt":5324,"githubUrl":5325,"licenseUrl":5326,"releaseDate":5327,"longDescription":5328,"ruDescription":5329,"ruLongDescription":5330,"isAvailableAfterAuth":12,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":117,"supportFiles":12,"supportedFileTypes":5331,"tokenStrategy":67,"configValue":5332},"6622b0d505eb0a7142d26a12","fofr/style-transfer","Style transfer",[691],[5260,5265,5270,5278,5282,5286,5293,5302],{"_id":5261,"key":2587,"model":5255,"title":2588,"tooltipContent":5262,"step":555,"max":3450,"min":555,"defaultValue":1787,"options":5263,"settingType":43,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"isAdvanced":61,"description":5262,"ruDescription":4001,"ruTitle":2613,"fileTypes":5264},"6622b0d505eb0a7142d26a18","Output image width",[],[],{"_id":5266,"key":2617,"model":5255,"title":2618,"tooltipContent":5267,"step":555,"max":3450,"min":555,"defaultValue":1787,"options":5268,"settingType":43,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"isAdvanced":61,"description":5267,"ruDescription":4009,"ruTitle":2634,"fileTypes":5269},"6622b0d505eb0a7142d26a1a","Output image height",[],[],{"_id":5271,"key":5272,"model":5255,"title":5273,"tooltipContent":5273,"defaultValue":327,"options":5274,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"accept":92,"description":5273,"ruDescription":5275,"ruTitle":5276,"fileTypes":5277},"6622b0d505eb0a7142d26a1e","style_image","Style Image",[],"Образ стиля","Имидж стиля",[],{"_id":5279,"key":1535,"model":5255,"title":1536,"tooltipContent":1536,"step":38,"max":65,"min":30,"defaultValue":4851,"options":5280,"settingType":43,"fileType":327,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"isAdvanced":61,"description":1536,"ruDescription":1541,"ruTitle":1541,"fileTypes":5281},"6622b0d505eb0a7142d26a22",[],[],{"_id":5283,"key":206,"model":5255,"title":207,"tooltipContent":207,"defaultValue":163,"options":5284,"settingType":214,"fileType":327,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"description":207,"ruDescription":1181,"ruTitle":1181,"fileTypes":5285},"6622b0d505eb0a7142d26a24",[],[],{"_id":5287,"key":5288,"model":5255,"title":5289,"tooltipContent":5289,"defaultValue":327,"options":5290,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"valueType":215,"description":5289,"ruDescription":5291,"ruTitle":5291,"fileTypes":5292},"6622b0d505eb0a7142d26a26","structure_image","Structure Image",[],"Изображение структуры",[],{"_id":5294,"key":5295,"model":5255,"title":5296,"tooltipContent":5297,"step":249,"max":71,"min":30,"defaultValue":1820,"options":5298,"settingType":43,"fileType":327,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"isAdvanced":12,"description":5297,"ruDescription":5299,"ruTitle":5300,"fileTypes":5301},"6622b0d505eb0a7142d26a2a","structure_depth_strength","Structure Depth Strength","Strength of the depth controlnet",[],"Прочность сети контроля глубины","Структура Глубина Прочность",[],{"_id":5303,"key":5304,"model":5255,"title":5305,"tooltipContent":5306,"step":249,"max":38,"min":30,"defaultValue":1197,"options":5307,"settingType":43,"fileType":327,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"isAdvanced":12,"description":5306,"ruDescription":5308,"ruTitle":5309,"fileTypes":5310},"6622b0d505eb0a7142d26a2c","structure_denoising_strength","Structure Denoising Strength","How much of the original image to preserve (0 is all, 1 is none)",[],"Сколько частей исходного изображения нужно сохранить (0 - все, 1 - ни одной)","Структура Усиление денуазинга",[],"fofr/style-transfer:f1023890703bc0a5a3a2c21b5e498833be5f6ef6e70e9daf6b9b3a4fd8309cf0","Create images in style of uploaded image",192,2029,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/style-transfer-banner.png","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/style-transfer.svg","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/style-transfer-preview.png",[],[5320,5321,5322],"68a9d6c2e3ac04ad89b91f4f","68a9d6c2e3ac04ad89b91f51","68a9d6c2e3ac04ad89b91f53","2025-08-29T16:48:28.181Z","2024-09-11T09:51:10.702Z","https://github.com/fofr/cog-style-transfer/tree/main","https://github.com/fofr/cog-style-transfer/tree/main?tab=MIT-1-ov-file","2024-04-17T09:51:00.000Z","Style transfer lets you turn ordinary photos or frames into artistic images that preserve the original layout and objects while adopting the look and feel of a reference artwork. This model combines the content of a source image with the textures, colors and brushstrokes of a style reference so you can recreate effects like Van Gogh swirls, watercolor washes, or bold pop-art palettes without manual painting. Users can apply a single style or blend multiple styles, adjust style intensity, and choose between high-fidelity optimization or fast feed‑forward inference for near real‑time outputs. Practical uses include creating marketing visuals, generating concept art, producing stylized social media content, and applying consistent looks to video frames for cinematic effects. Mobile and web apps commonly use similar models to offer instant filters that mimic famous artists. What makes this model useful is its balance of creative control and speed: optimization-based modes favor fidelity and detail, while trained feed‑forward modes deliver immediate results suitable for interactive workflows. The model also supports arbitrary style transfer variants, so new style images can be used on the fly without retraining. Be aware of common tradeoffs—stronger style intensity can obscure fine content details, and complex styles may introduce artifacts or require more compute for clean results. To reduce noise and improve smoothness, regularization and post-processing steps are recommended. Overall, Style transfer is ideal for designers, photographers, videographers, and hobbyists who want to experiment with artistic aesthetics quickly and at scale, from single images to full video sequences.","Создает изображения в стиле загруженной фотографии","\u003Cp>Style transfer позволяет превращать обычные фотографии или кадры видео в художественные изображения, сохраняя оригинальную структуру и объекты, но перенимая текстуры, цвета и мазки выбранного референс‑стиля. Модель комбинирует содержимое исходного изображения с визуальными характеристиками образца — например, воссоздавая эффект Ван Гога, акварели или поп‑арт — без необходимости ручной отрисовки. Пользователи могут применять один стиль или смешивать несколько, регулировать интенсивность стиля и выбирать между режимами: оптимизация для максимального качества или обученные feed‑forward‑сети для практически мгновенной генерации. Практические сценарии включают создание маркетинговых материалов, концепт‑арт, оформление контента для социальных сетей и стилизацию видео для кинематографичных эффектов. Мобильные и веб‑приложения часто используют похожие подходы для мгновенных фильтров, имитирующих известных художников. Особенность этой модели — сочетание творческого контроля и скорости: методы оптимизации дают более детализированный результат, тогда как быстрые нейросети подходят для интерактивной работы. Поддерживается также произвольная передача стиля: новые изображения‑референсы можно использовать без дообучения. Следует учитывать компромиссы — сильная интенсивность стиля может скрыть мелкие детали содержимого, а сложные стили иногда приводят к артефактам и требуют больше ресурсов для очистки. Для уменьшения шума и повышения гладкости рекомендуется регуляризация и пост‑обработка. В целом, Style transfer отлично подходит для дизайнеров, фотографов, видеографов и энтузиастов, желающих быстро и масштабно экспериментировать с художественными образами, от одиночных снимков до полных видеопоследовательностей.\u003C/p>",[63,64],{"width":1787,"height":1787,"style_image":327,"output_quality":4851,"negative_prompt":163,"structure_image":327,"structure_depth_strength":1820,"structure_denoising_strength":1197},{"isInstantModel":12,"isReasoningModel":12,"isGenerationTypeRequired":12,"supportFiles":12,"supportedFileTypes":5334,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":5335,"key":5336,"label":5337,"type":2674,"generationType":2677,"generationTypes":5338,"api":85,"settingConfigs":5339,"isAdminModel":12,"isPromptRequired":12,"replicateId":5476,"cost":1496,"description":5477,"position":5478,"secondCost":2552,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":226,"generationCount":5479,"bannerImageUrl":5480,"iconUrl":5481,"previewImageUrl":5482,"githubUrl":5483,"licenseUrl":5484,"websiteUrl":5485,"createdAt":5486,"examples":5487,"isBanned":12,"isOutdated":12,"longDescription":5488,"percs":5489,"updatedAt":5494,"ruDescription":5495,"ruLongDescription":5496,"isAvailableAfterAuth":12,"replicateApiType":117,"configValue":5497},[63,64],"666077c197ed7da66470a1b6","fofr/tooncrafter","ToonCrafter",[2677],[5340,5347,5354,5363,5372,5381,5390,5399,5408,5417,5426,5436,5445,5451,5458,5467],{"fileTypes":5341,"_id":5342,"key":5343,"model":5335,"title":161,"tooltipContent":5344,"options":5345,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":61,"__v":30,"accept":92,"description":5344,"ruDescription":5346,"ruTitle":166},[],"666077c197ed7da66470a1ba","image_1","First input image",[],"Первое входное изображение",{"fileTypes":5348,"_id":5349,"key":5350,"model":5335,"title":171,"tooltipContent":5351,"options":5352,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":61,"__v":30,"accept":92,"description":5351,"ruDescription":5353,"ruTitle":175},[],"666077c197ed7da66470a1bc","image_2","Second input image",[],"Второе входное изображение",{"fileTypes":5355,"_id":5356,"key":5357,"model":5335,"title":5358,"tooltipContent":5359,"options":5360,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5359,"ruDescription":5361,"ruTitle":5362},[],"666077c197ed7da66470a1be","image_3","Image 3","Third input image (optional)",[],"Третье входное изображение (необязательно)","Изображение 3",{"fileTypes":5364,"_id":5365,"key":5366,"model":5335,"title":5367,"tooltipContent":5368,"options":5369,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5368,"ruDescription":5370,"ruTitle":5371},[],"666077c197ed7da66470a1c0","image_4","Image 4","Fourth input image (optional)",[],"Четвертое входное изображение (необязательно)","Изображение 4",{"fileTypes":5373,"_id":5374,"key":5375,"model":5335,"title":5376,"tooltipContent":5377,"options":5378,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5377,"ruDescription":5379,"ruTitle":5380},[],"666077c197ed7da66470a1c2","image_5","Image 5","Fifth input image (optional)",[],"Пятое входное изображение (необязательно)","Изображение 5",{"fileTypes":5382,"_id":5383,"key":5384,"model":5335,"title":5385,"tooltipContent":5386,"options":5387,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5386,"ruDescription":5388,"ruTitle":5389},[],"666077c197ed7da66470a1c4","image_6","Image 6","Sixth input image (optional)",[],"Шестое входное изображение (необязательно)","Изображение 6",{"fileTypes":5391,"_id":5392,"key":5393,"model":5335,"title":5394,"tooltipContent":5395,"options":5396,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5395,"ruDescription":5397,"ruTitle":5398},[],"666077c197ed7da66470a1c6","image_7","Image 7","Seventh input image (optional)",[],"Седьмое входное изображение (необязательно)","Изображение 7",{"fileTypes":5400,"_id":5401,"key":5402,"model":5335,"title":5403,"tooltipContent":5404,"options":5405,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5404,"ruDescription":5406,"ruTitle":5407},[],"666077c197ed7da66470a1c8","image_8","Image 8","Eighth input image (optional)",[],"Восьмое входное изображение (необязательно)","Изображение 8",{"fileTypes":5409,"_id":5410,"key":5411,"model":5335,"title":5412,"tooltipContent":5413,"options":5414,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5413,"ruDescription":5415,"ruTitle":5416},[],"666077c197ed7da66470a1ca","image_9","Image 9","Ninth input image (optional)",[],"Девятое входное изображение (необязательно)","Изображение 9",{"fileTypes":5418,"_id":5419,"key":5420,"model":5335,"title":5421,"tooltipContent":5422,"options":5423,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"accept":92,"description":5422,"ruDescription":5424,"ruTitle":5425},[],"666077c197ed7da66470a1cc","image_10","Image 10","Tenth input image (optional)",[],"Десятое входное изображение (необязательно)","Изображение 10",{"fileTypes":5427,"_id":5428,"key":5429,"model":5335,"title":5430,"tooltipContent":5431,"max":5432,"min":1122,"defaultValue":2593,"options":5433,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30,"step":555,"description":5431,"ruDescription":5434,"ruTitle":5435},[],"666077c197ed7da66470a1ce","max_width","Max Width","Maximum width of the video",768,[],"Максимальная ширина видео","Максимальная ширина",{"fileTypes":5437,"_id":5438,"key":5439,"model":5335,"title":5440,"tooltipContent":5441,"max":5432,"min":1122,"defaultValue":2593,"options":5442,"settingType":43,"fileSource":28,"isRequired":12,"valueType":44,"__v":30,"step":555,"description":5441,"ruDescription":5443,"ruTitle":5444},[],"666077c197ed7da66470a1d0","max_height","Max Height","Maximum height of the video",[],"Максимальная высота видео","Максимальная высота",{"fileTypes":5446,"_id":5447,"key":206,"model":5335,"title":207,"tooltipContent":5448,"defaultValue":163,"options":5449,"settingType":214,"fileSource":28,"isRequired":12,"valueType":215,"__v":30,"description":5448,"ruDescription":5450,"ruTitle":1181},[],"666077c197ed7da66470a1d2","Things you do not want to see in your video",[],"То, что вы не хотите видеть в своем видео",{"fileTypes":5452,"_id":5453,"key":2960,"model":5335,"title":2961,"tooltipContent":5454,"defaultValue":25,"options":5455,"settingType":27,"fileSource":28,"isRequired":12,"__v":30,"valueType":29,"description":5454,"ruDescription":5456,"ruTitle":5457},[],"666077c197ed7da66470a1d4","Loop the video",[],"Зацикливание видео","Петля",{"fileTypes":5459,"_id":5460,"key":5461,"model":5335,"title":5462,"tooltipContent":5463,"defaultValue":25,"options":5464,"settingType":27,"fileSource":28,"isRequired":12,"__v":30,"valueType":29,"description":5463,"ruDescription":5465,"ruTitle":5466},[],"666077c197ed7da66470a1d6","interpolate","Interpolate","Enable 2x interpolation using FILM",[],"Включите 2-кратную интерполяцию с помощью FILM","Интерполировать",{"fileTypes":5468,"_id":5469,"key":5470,"model":5335,"title":5471,"tooltipContent":5472,"defaultValue":4111,"options":5473,"settingType":27,"fileSource":28,"isRequired":12,"__v":30,"valueType":29,"description":5472,"ruDescription":5474,"ruTitle":5475},[],"666077c197ed7da66470a1d8","color_correction","Color Correction","If the colors are coming out strange, or if the colors between your input images are very different, disable this",[],"Если цвета получаются странными или если цвета между вводимыми изображениями сильно отличаются, отключите эту функцию.","Коррекция цвета","fofr/tooncrafter:51bf654d60d307ab45c4ffe09546a3c9606f8f33861ab28f5bb0e43ad3fa40ed","Generate smooth cartoon animations from keyframe images",161,244,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/UFO-banner.gif","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/tooncrafter.svg","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/UFO.gif","https://github.com/ToonCrafter/ToonCrafter","https://github.com/ToonCrafter/ToonCrafter?tab=Apache-2.0-1-ov-file","https://doubiiu.github.io/projects/ToonCrafter/","2024-09-13T14:29:03.683Z",[],"ToonCrafter is an AI model that turns 2–4 static cartoon keyframes into fluid, visually consistent animations. Using advanced image-to-video diffusion techniques adapted for cartoons, ToonCrafter synthesizes intermediate frames rather than merely interpolating pixels, producing natural motion that preserves the original art style. Artists can optionally provide sparse sketches to guide how elements move, and they can add text prompts to add or refine animation effects and mood. Outputs are ready-to-share MP4 videos (up to 16 frames at 512×320), making it simple to create short animated loops, promotional clips, or in-between sequences for longer projects. Practical benefits include dramatic time savings for animators who want clean in-betweens without manual frame-by-frame work, quick prototyping for graphic novel panels, and easy production of social media–ready cartoon content. ToonCrafter handles large nonlinear motions and occlusions better than traditional interpolation tools, maintaining temporal coherence and semantic fidelity to the source images. The model is accessible to users without deep animation skills: upload keyframes, optionally add sketches or text prompts, set style and color preferences, and generate the animation. Limitations include short maximum length (16 frames) and modest resolution (512×320), plus higher computational cost for best-quality outputs. Also note there is no single official commercial web app from the original authors—third-party implementations may vary. In short, ToonCrafter is ideal for animators, illustrators, marketers, and hobbyists who want to quickly produce high-quality, style-faithful cartoon animations from stills with intuitive control via sketches and text prompts.",[5490,5491,5492,5493],"68a9d726e3ac04ad89b91f5a","68a9d727e3ac04ad89b91f5c","68a9d727e3ac04ad89b91f5e","68a9d727e3ac04ad89b91f60","2025-08-23T14:58:47.490Z","Создаёт плавные мультяшные анимации из ключевых кадров","ToonCrafter — модель ИИ, превращающая 2–4 статичных мультяшных ключевых кадра в плавные, визуально согласованные анимации. Используя передовые методы преобразования изображений в видео, адаптированные под мультфильмный стиль, ToonCrafter синтезирует промежуточные кадры, а не просто интерполирует пиксели, что позволяет получить естественное движение при сохранении авторской эстетики. Художники могут добавлять разреженные наброски для управления движением элементов, а также текстовые подсказки для уточнения эффектов и настроения анимации. Результаты экспортируются в MP4 (до 16 кадров при 512×320), что удобно для создания коротких циклов, рекламных роликов или промежуточных сцен для более длинных проектов. Практические преимущества: значительная экономия времени для аниматоров, быстрый прототипинг для комиксов и лёгкое создание контента для соцсетей. ToonCrafter лучше справляется с крупными нелинейными движениями и перекрытиями, чем традиционные методы интерполяции, сохраняя временную связность и смысловую точность исходных изображений. Модель проста в использовании: загрузите ключевые кадры, при желании добавьте наброски или текст, настройте стиль и цвета — и получите готовую анимацию. Ограничения: краткая максимальная длина (16 кадров), умеренное разрешение (512×320) и высокая вычислительная стоимость для получения наилучшего качества. Также отметим, что у авторов исследования нет единого официального коммерческого веб‑приложения — сторонние реализации могут отличаться. В целом ToonCrafter подходит аниматорам, иллюстраторам, маркетологам и энтузиастам, желающим быстро создавать качественные мультяшные анимации из статичных изображений с интуитивным управлением через наброски и текстовые подсказки.",{"max_width":2593,"max_height":2593,"negative_prompt":163,"loop":25,"interpolate":25,"color_correction":4111},{"replicateApiType":6,"outputPath":7,"_id":5499,"key":5500,"label":5501,"description":5502,"type":4882,"generationType":5503,"generationTypes":5504,"api":5500,"settingConfigs":5505,"percs":5556,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":5560,"position":4514,"secondCost":30,"generationCost":5561,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":5562,"createdAt":5563,"updatedAt":5564,"__v":482,"generationCount":721,"iconUrl":5565,"previewImageUrl":163,"websiteUrl":5566,"releaseDate":5567,"ruDescription":5568,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":5569,"tokenStrategy":67,"isAvailableAfterAuth":61,"longDescription":5570,"ruLongDescription":5571,"configValue":5572},"66f44da7cd98b2d710d61c4e","tripo","Tripo 3D","Generate 3D models from text or images; fast, editable assets","text-to-object",[5503,4883],[5506,5518,5523,5532,5540,5549],{"fileTypes":5507,"_id":5508,"key":3121,"model":5499,"title":5509,"tooltipContent":5510,"defaultValue":5511,"options":5512,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":3138,"isAdmin":12},[],"66f44da7cd98b2d710d61c50","Model Version","Select the model version for generation.","v1.4-20240625",[5513,5515,5517],{"value":5514,"label":5514},"v2.0-20240919",{"label":5516,"value":5516,"cost":163},"v2.5-20250123",{"label":5511,"value":5511,"cost":163},{"fileTypes":5519,"_id":5520,"key":206,"model":5499,"title":207,"tooltipContent":5521,"defaultValue":163,"options":5522,"settingType":214,"fileSource":28,"valueType":215,"__v":30,"ruTitle":1181},[],"66f44da7cd98b2d710d61c52","Provide a reverse direction to assist in generating content contrasting with the original prompt. Max 255 characters.",[],{"fileTypes":5524,"_id":5525,"key":5526,"model":5499,"title":5527,"tooltipContent":5528,"defaultValue":323,"options":5529,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"max":5530,"min":326,"step":38,"ruTitle":5531},[],"66f44da7cd98b2d710d61c54","text_seed","Text Seed","Random seed used for the process based on the prompt.",[],10000,"Текстовый посев",{"fileTypes":5533,"_id":5534,"key":5535,"model":5499,"title":5536,"tooltipContent":5537,"defaultValue":323,"options":5538,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"max":5530,"min":326,"step":38,"ruTitle":5539},[],"66f44da7cd98b2d710d61c56","model_seed","Model Seed","Random seed for model generation. Controls geometry generation in v2.0-20240919.",[],"Модель семян",{"fileTypes":5541,"_id":5542,"key":5543,"model":5499,"title":5544,"tooltipContent":5545,"defaultValue":461,"options":5546,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"max":5547,"min":65,"step":65,"ruTitle":5548},[],"66f44da7cd98b2d710d61c58","face_limit","Face Limit","Limits the number of faces on the output model.",[],50000,"Предел лица",{"fileTypes":5550,"_id":5551,"key":5552,"model":5499,"title":398,"tooltipContent":5553,"description":5553,"accept":92,"options":5554,"settingType":94,"fileType":63,"fileSource":28,"__v":30,"ruDescription":5555,"ruTitle":400},[],"66f45a940c348d0b0a6a050f","file","Image you can use to create a 3D object",[],"Изображение, которое можно использовать для создания 3D-объекта",[5557,5558,5559],"68a9da02e3ac04ad89b92013","68a9da02e3ac04ad89b92015","68a9da02e3ac04ad89b92017",800,0.2,[],"2024-09-25T17:51:35.053Z","2025-08-23T15:10:58.938Z","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/tripo.png","https://tripo3d.ai/","2024-09-09T20:16:00.000Z","Создавайте 3D-модели из текста или изображений — быстро, с возможностью редактирования",[63,64],"Tripo 3D is an AI-driven platform that quickly turns text prompts or 2D images into detailed, production-ready 3D models. Designed for game developers, VR creators, digital artists, product designers, and hobbyists, Tripo streamlines the full asset pipeline by combining generation, editing, segmentation, rigging, texturing, and export in one unified workspace (Tripo Studio). Users can create models from a single image, multiple references, or descriptive text, then adjust proportions, select starting poses, and refine geometry and surface details. Automated part segmentation and tools like Magic Brush, Merge Parts, and Smart Part Completion make nuanced edits accessible without deep 3D expertise.\n\nTripo balances speed and quality: models are generated in seconds to minutes and exportable in common formats (STL, OBJ, GLB) for 3D printing, game engines, and VR/AR platforms. Smart Low-Poly tools optimize meshes for real-time applications while preserving visual fidelity. For developers, the Text-to-CAD API enables direct integration of AI model generation into custom tools and pipelines, supporting rapid prototyping and iterative design.\n\nPractical benefits include rapid concept prototyping, converting photos into personalized 3D keepsakes, accelerating character and prop creation for games and simulations, and enabling artists to explore novel 3D ideas from simple prompts. Limitations to note: basic rigging and simple animations work well, but complex motion can show artifacts, and output quality depends on the clarity of input prompts or images. Overall, Tripo 3D significantly lowers the barrier to creating usable 3D assets, letting users focus on creativity and iteration rather than manual mesh construction.","Tripo 3D — это платформа на базе ИИ, которая быстро превращает текстовые описания или 2D-изображения в детализированные 3D-модели, готовые к использованию в производстве. Предназначенная для разработчиков игр, создателей VR, цифровых художников, дизайнеров продуктов и энтузиастов, Tripo упрощает весь процесс создания ассетов, объединяя генерацию, редактирование, сегментацию, риггинг, текстурирование и экспорт в едином интерфейсе (Tripo Studio). Пользователи могут создавать модели по одному изображению, нескольким референсам или по описанию, а затем корректировать пропорции, выбирать позы и дорабатывать геометрию и поверхности. Автоматическая сегментация частей и инструменты вроде Magic Brush, Merge Parts и Smart Part Completion позволяют выполнять тонкие правки без глубоких знаний 3D.\n\nTripo сочетает скорость и качество: модели генерируются за секунды или минуты и экспортируются в популярных форматах (STL, OBJ, GLB) для 3D-печати, игровых движков и VR/AR. Инструменты Smart Low-Poly оптимизируют сетки для реального времени, сохраняя визуальную точность. Для разработчиков доступно API Text-to-CAD, позволяющее интегрировать генерацию 3D-моделей в собственные приложения для быстрой прототипировки и итеративной разработки.\n\nПрактическая польза включает быстрое прототипирование концепций, превращение фотографий в персональные 3D-сувениры, ускорение создания персонажей и реквизита для игр и симуляций, а также предоставление художникам возможности исследовать новые 3D-идеи из простых запросов. Ограничения: базовый риггинг и простая анимация работают стабильно, но сложные движения могут давать артефакты; качество результата зависит от четкости входных данных. В целом, Tripo 3D значительно снижает порог входа в 3D-моделирование, позволяя пользователям сосредоточиться на креативе и итерациях.",{"model_version":5511,"negative_prompt":163,"text_seed":323,"model_seed":323,"face_limit":461},{"_id":5574,"key":5575,"label":5576,"shortLabel":5576,"type":2674,"generationType":2677,"generationTypes":5577,"api":85,"settingConfigs":5579,"isAdminModel":12,"isPromptRequired":12,"replicateId":5674,"cost":2875,"description":5675,"position":3072,"secondCost":1221,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"__v":482,"generationCount":5676,"iconUrl":5677,"previewImageUrl":5678,"bannerImageUrl":5678,"createdAt":5486,"examples":5679,"isBanned":12,"isOutdated":12,"longDescription":5680,"percs":5681,"updatedAt":5685,"ruDescription":5686,"ruLongDescription":5687,"isGenerationTypeRequired":12,"isInstantModel":12,"isAvailableAfterAuth":61,"isReasoningModel":12,"oneImageCost":30,"outputPath":7,"replicateApiType":117,"supportFiles":12,"supportedFileTypes":5688,"tokenStrategy":67,"configValue":5689},"663f622df55c15e9f959811e","video-morpher","Video Morpher",[5578,2677],"IMAGE_TO_VIDEO",[5580,5596,5604,5620,5626,5638,5647,5653,5659,5664,5669],{"_id":5581,"key":5582,"model":5574,"title":5583,"tooltipContent":5584,"defaultValue":5585,"options":5586,"settingType":282,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"isAdvanced":12,"description":5584,"ruDescription":5593,"ruTitle":5594,"fileTypes":5595},"663f622df55c15e9f9598120","mode","Mode","Determines if you produce a quick experimental video or an upscaled interpolated one. (small ~20s, medium ~60s, upscaled ~2min, upscaled-and-interpolated ~4min)","medium",[5587,5588,5589,5591],{"label":4413,"value":4413},{"label":5585,"value":5585},{"label":5590,"value":5590},"upscaled",{"label":5592,"value":5592},"upscaled-and-interpolated","Определяет, создадите ли вы быстрое экспериментальное видео или увеличенное интерполированное. (маленький ~20 с, средний ~60 с, увеличенный ~2 мин, увеличенный и интерполированный ~4 мин)","Режим",[],{"_id":5597,"key":317,"model":5574,"title":318,"tooltipContent":5598,"step":38,"min":30,"defaultValue":163,"options":5599,"settingType":43,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"max":5600,"isAdvanced":12,"description":5598,"ruDescription":5601,"ruTitle":5602,"fileTypes":5603},"663f622df55c15e9f9598122","Set a seed for reproducibility. Random by default.",[],10000000,"Установите затравку для воспроизводимости. По умолчанию - случайное.","Семена",[],{"_id":5605,"key":5606,"model":5574,"title":5607,"tooltipContent":5608,"defaultValue":3513,"options":5609,"settingType":282,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"isAdvanced":12,"description":5608,"ruDescription":5617,"ruTitle":5618,"fileTypes":5619},"663f622df55c15e9f9598126","checkpoint","Checkpoint","The checkpoint to use for the model",[5610,5612,5614,5615,5616],{"label":5611,"value":5611},"realistic",{"label":5613,"value":5613},"illustrated",{"label":4995,"value":4995},{"label":1163,"value":1163},{"label":3513,"value":3513},"Контрольная точка, которую следует использовать для модели","Контрольная точка",[],{"_id":5621,"key":5272,"model":5574,"title":5273,"tooltipContent":5622,"defaultValue":163,"options":5623,"settingType":94,"fileType":63,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"position":482,"accept":92,"description":5622,"ruDescription":5624,"ruTitle":5275,"fileTypes":5625},"663f622df55c15e9f9598128","Apply the style from this image to the whole video",[],"Примените стиль из этого изображения ко всему видео",[],{"_id":5627,"key":1264,"model":5574,"title":1480,"tooltipContent":5628,"defaultValue":1272,"options":5629,"settingType":282,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"isAdvanced":12,"description":5628,"ruDescription":4347,"ruTitle":1266,"fileTypes":5637},"663f622df55c15e9f959812a","The aspect ratio of the video",[5630,5631,5632,5633,5634,5635,5636],{"label":1274,"value":1274},{"label":1278,"value":1278},{"label":1282,"value":1282},{"label":1272,"value":1272},{"label":1284,"value":1284},{"label":1280,"value":1280},{"label":1276,"value":1276},[],{"_id":5639,"key":5640,"model":5574,"title":5641,"tooltipContent":5642,"step":249,"max":71,"min":30,"defaultValue":1820,"options":5643,"settingType":43,"fileSource":28,"isRequired":12,"__v":30,"valueType":44,"isAdvanced":12,"description":5642,"ruDescription":5644,"ruTitle":5645,"fileTypes":5646},"663f622df55c15e9f959812c","style_strength","Style Strength","How strong the style is applied",[],"Насколько сильно применяется стиль","Сила стиля",[],{"_id":5648,"key":206,"model":5574,"title":207,"tooltipContent":5649,"defaultValue":163,"options":5650,"settingType":214,"fileSource":28,"isRequired":12,"__v":30,"valueType":215,"isAdvanced":12,"description":5649,"ruDescription":5651,"ruTitle":1181,"fileTypes":5652},"663f622df55c15e9f9598130","What you do not want to see in the video",[],"Что вы не хотите видеть на видео",[],{"_id":5654,"key":5655,"model":5574,"title":161,"tooltipContent":163,"defaultValue":163,"options":5656,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"accept":92,"dimensions":5657,"position":38,"description":163,"ruTitle":166,"fileTypes":5658},"663f622df55c15e9f9598132","subject_image_1",[],"768x768,576x1024,1024x576",[],{"_id":5660,"key":5661,"model":5574,"title":171,"tooltipContent":163,"defaultValue":163,"options":5662,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"accept":92,"position":71,"description":163,"ruTitle":175,"fileTypes":5663},"663f622df55c15e9f9598134","subject_image_2",[],[],{"_id":5665,"key":5666,"model":5574,"title":5358,"tooltipContent":163,"defaultValue":163,"options":5667,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"accept":92,"position":126,"description":163,"ruTitle":5362,"fileTypes":5668},"663f622df55c15e9f9598136","subject_image_3",[],[],{"_id":5670,"key":5671,"model":5574,"title":5367,"tooltipContent":163,"defaultValue":163,"options":5672,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"__v":30,"accept":92,"position":226,"description":163,"ruTitle":5371,"fileTypes":5673},"663f622df55c15e9f9598138","subject_image_4",[],[],"fofr/video-morpher:e70e975067d2b5dbe9e2d9022833d27230a1bdeb3f4af6fe6bb49a548a3039a7","Blend images with seamless effect transitions",89,"https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/video-morpher.svg","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-images/morpher-video.gif",[],"\u003Cp>This tool enables users to apply seamless transitions between video clips, offering a range of customizable effects and intuitive controls to enhance video editing. Perfect for creators seeking dynamic visual storytelling tools.\u003C/p>",[5682,5683,5684],"672e2dd5315626010a1cc78c","672e2dd5315626010a1cc78b","672e2e84315626010a1cc7e5","2025-08-28T11:34:22.517Z","Смешивайте изображения с помощью плавных переходов эффектов","\u003Cp>Этот инструмент позволяет пользователям применять плавные переходы между видеоклипами, предлагая ряд настраиваемых эффектов и интуитивно понятные элементы управления для улучшения редактирования видео. Идеально подходит для тех, кто ищет динамичные инструменты для создания визуальных историй.\u003C/p>",[63,64],{"mode":5585,"seed":163,"checkpoint":3513,"style_image":163,"aspect_ratio":1272,"style_strength":1820,"negative_prompt":163,"subject_image_1":163,"subject_image_2":163,"subject_image_3":163,"subject_image_4":163},{"supportFiles":12,"supportedFileTypes":5691,"outputPath":7,"tokenStrategy":67,"oneImageCost":30,"_id":5692,"key":5693,"label":5694,"shortLabel":5695,"description":5696,"isInstantModel":12,"ruDescription":5697,"ruLongDescription":5698,"type":2674,"generationType":5699,"generationTypes":5700,"api":85,"settingConfigs":5701,"percs":5735,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"replicateId":5739,"replicateApiType":117,"cost":5560,"iconUrl":2434,"licenseUrl":2440,"githubUrl":5740,"position":65,"secondCost":410,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":5741,"createdAt":5742,"updatedAt":5743,"__v":71,"generationCount":3076,"isReasoningModel":12,"isAvailableAfterAuth":61,"longDescription":5744,"configValue":5745},[63,64],"675c2ad67788f56bff9f41c8","lucataco/real-esrgan-video","Video Upscaler","VideoUpscaler","Upscale low-res videos to 1080p/4K/8K with AI detail reconstruction","Повышает разрешение видео до 1080p/4K/8K с восстановлением деталей ИИ","Video Upscaler (lucataco/real-esrgan-video) — это инструмент на базе ИИ, который превращает видео с низким разрешением или сильной компрессией в ролики более высокого разрешения с улучшенной четкостью, сниженным шумом и восстановленными деталями. Вместо простого растягивания пикселей модель восстанавливает недостающую информацию и удаляет артефакты сжатия, обеспечивая более естественный вид на выходе в HD, 4K или даже 8K. В комплекте — полезные функции: интерполяция кадров для плавности движения, настройка цвета и экспозиции для лучшего баланса изображения, а также превью в реальном времени для сравнения исходного и улучшенного видео перед экспортом.\n\nИнструмент полезен создателям контента, реставраторам, аниматорам и специалистам, которым нужен быстрый и экономичный апгрейд визуала без пересъемки. Распространенные сценарии применения включают улучшение роликов для YouTube и соцсетей, реставрацию архивных или домашних съемок, повышение качества 2D-анимации и прояснение материалов наблюдения или научных исследований. Специализированные режимы (анимация, лица, реалистичность и т.д.) позволяют оптимизировать результат под конкретный тип контента.\n\nVideo Upscaler сочетает скорость и качество: быстрые превью и пакетная обработка ускоряют рабочие процессы, а более тщательные проходы дают хорошее восстановление деталей для важных материалов. Учтите, что качество результата зависит от исходника — при сильном повреждении видеозаписей улучшения могут быть ограничены — и апскейл до очень высокого разрешения требует значительных вычислительных ресурсов. В целом модель представляет собой удобный и экономичный способ сделать старые, сжатые или низкокачественные видео более четкими, чистыми и современными для публикации, архивации или творческого использования.","video-to-video",[],[5702,5715,5722],{"fileTypes":5703,"_id":5704,"key":703,"model":5692,"title":704,"tooltipContent":5705,"description":716,"accept":5706,"isClearable":12,"options":5707,"settingType":282,"fileType":2674,"fileSource":1151,"isRequired":12,"__v":30,"ruDescription":717,"ruTitle":715},[],"675c2ad67788f56bff9f41ca","Output Resolution","video/*",[5708,5711,5713],{"label":5709,"value":5710,"cost":163},"Full HD","FHD",{"label":5712,"value":5712,"cost":163},"2k",{"label":5714,"value":5714,"cost":163},"4k",{"fileTypes":5716,"_id":5717,"key":5718,"model":5692,"title":5719,"tooltipContent":5719,"description":5720,"accept":5706,"options":5721,"settingType":94,"fileType":2674,"fileSource":1151,"__v":30,"isRequired":61},[],"675c2ad67788f56bff9f41cc","video_path","Input Video","Video to upscale",[],{"fileTypes":5723,"_id":5724,"key":5725,"model":5692,"title":5726,"tooltipContent":5727,"description":5727,"isAdvanced":12,"options":5728,"settingType":282,"fileSource":28,"isRequired":12,"maskFor":5730,"__v":30},[],"675c2ad67788f56bff9f41ce","modell","Modell","Upscaling model",[5729,5731,5733],{"label":5730,"value":5730,"cost":163},"RealESRGAN_x4plus",{"label":5732,"value":5732,"cost":163},"RealESRGAN_x4plus_anime_6B",{"label":5734,"value":5734,"cost":163},"realesr-animevideov3",[5736,5737,5738],"68a9dca7e3ac04ad89b920a7","68a9dca7e3ac04ad89b920a9","68a9dca7e3ac04ad89b920ab","lucataco/real-esrgan-video:c23768236472c41b7a121ee735c8073e29080c01b32907740cfada61bff75320","https://github.com/yuvraj108c/4k-video-upscaler-colab",[],"2024-12-13T12:38:46.610Z","2025-08-23T15:22:16.042Z","Video Upscaler (lucataco/real-esrgan-video) is an AI-driven tool that transforms low-resolution or compressed footage into higher-resolution video with improved clarity, reduced noise, and sharper details. Rather than simply stretching pixels, it reconstructs plausible image information and removes compression artifacts to produce natural-looking HD, 4K, or even 8K outputs. The model supports practical features such as frame interpolation to smooth motion, color and exposure adjustment for better visual balance, and real-time preview so you can compare original and upscaled frames before exporting.\n\nThis tool is designed for content creators, restorers, animators, and professionals who need fast, cost-effective visual upgrades without reshooting. Typical uses include enhancing YouTube or social media clips, restoring archival or home videos, improving the fidelity of 2D animation, and clarifying surveillance or research footage. Specialized enhancement modes (for example: animation, faces, or realistic detail) let you pick what matters most for your project and get consistently better results across different types of source material.\n\nVideo Upscaler balances speed and quality: many workflows benefit from quick previews and batch processing for time-sensitive projects, while higher-quality passes provide strong detail recovery for important assets. Keep in mind that output quality depends on the input — extremely degraded footage may see limited gains — and very high-resolution upscaling can be computationally intensive. Overall, this model offers a user-friendly, cost-effective way to make older, compressed, or low-res videos look sharper, cleaner, and more modern for distribution, archiving, or creative reuse.",{},{"outputPath":7,"_id":5747,"key":5748,"label":5749,"description":5750,"longDescription":5751,"type":63,"generationType":83,"generationTypes":5752,"api":85,"settingConfigs":5753,"percs":5818,"isAdminModel":12,"isOutdated":12,"isBanned":12,"isPromptRequired":12,"replicateId":5822,"replicateApiType":117,"cost":3299,"licenseUrl":5823,"githubUrl":5824,"position":5825,"secondCost":410,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"examples":5826,"createdAt":5827,"updatedAt":5828,"__v":226,"generationCount":53,"iconUrl":5829,"releaseDate":5830,"ruDescription":5831,"ruLongDescription":5832,"isGenerationTypeRequired":12,"isInstantModel":12,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":5833,"tokenStrategy":67,"isAvailableAfterAuth":12,"configValue":5834},"66f414394eabfe2e2fa85405","cuuupid/idm-vton","Virtual Try On","Virtual Try On — realistic apparel & jewelry previews on you","Virtual Try On lets shoppers and retailers create realistic, personalized previews of apparel, accessories, and jewelry on real bodies or model templates. Using image-to-image inputs (photos or camera feeds) the model maps garments to body shape, posture, and movements, producing natural overlays and simulated fabric drape. Users can upload their own photos for accurate personal fit visualizations, apply items to model templates for fast catalog staging, or enable live AR try-ons for interactive sessions.\n\nRetailers benefit from faster product launches and lower marketing costs because the model reduces dependency on physical samples and photoshoots. Shoppers get higher confidence in sizing and style — which drives conversion and reduces return rates. Typical use cases include online product pages, virtual fitting rooms, social media lookbooks, and interactive marketing assets. The model supports quick, user-friendly workflows: upload an image or pick a template, adjust fit and pose, and generate shareable try-on images or live overlays.\n\nWhat makes this model special is its balance of realism, speed, and accessibility. It simulates material behavior to reflect how garments hang and move, adapts to varied body types and clothing styles, and runs across devices and platforms for broad reach. Practical considerations are addressed too: recommend good-quality input photos for best results, manage privacy for user images, and note that highly complex layered garments may have limitations in perfect realism. Overall, Virtual Try On empowers e-commerce teams, marketers, and shoppers to visualize products more effectively, cut costs, and improve customer satisfaction by making fit and style decisions easier and more reliable.",[83],[5754,5762,5770,5778,5786,5803,5808],{"fileTypes":5755,"_id":5756,"key":5757,"model":5747,"title":5758,"tooltipContent":5759,"accept":92,"position":30,"options":5760,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":61,"valueType":215,"__v":30,"ruTitle":5761},[],"66f414394eabfe2e2fa85407","garm_img","Garment Image","Garment image that should match the category. Can be a product image or even a photo of someone.",[],"Изображение одежды",{"fileTypes":5763,"_id":5764,"key":5765,"model":5747,"title":5766,"tooltipContent":5767,"accept":92,"position":38,"options":5768,"settingType":214,"fileType":63,"fileSource":1151,"valueType":215,"__v":30,"ruTitle":5769},[],"66f414394eabfe2e2fa85409","garment_des","Garment Description","Description of the garment, e.g. Short Sleeve Round Neck T-shirt",[],"Описание одежды",{"fileTypes":5771,"_id":5772,"key":5773,"model":5747,"title":5774,"tooltipContent":5775,"accept":92,"position":71,"options":5776,"settingType":94,"fileType":63,"fileSource":1151,"isRequired":61,"valueType":215,"__v":30,"ruTitle":5777},[],"66f414394eabfe2e2fa8540b","human_img","Human Image","Model image. If this is not 3:4 ratio, check the crop option.",[],"Образ человека",{"fileTypes":5779,"_id":5780,"key":5781,"model":5747,"title":5782,"tooltipContent":5783,"accept":92,"position":126,"options":5784,"settingType":94,"fileType":63,"fileSource":28,"valueType":215,"__v":30,"ruTitle":5785},[],"66f414394eabfe2e2fa8540d","mask_img","Mask Image","Optional mask image (but faster if provided)",[],"Изображение маски",{"fileTypes":5787,"_id":5788,"key":5789,"model":5747,"title":5790,"tooltipContent":5791,"position":226,"defaultValue":5792,"options":5793,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"ruTitle":5802},[],"66f414394eabfe2e2fa8540f","category","Category","Category of the garment","upper_body",[5794,5796,5799],{"value":5792,"label":5795},"Upper Body",{"value":5797,"label":5798},"lower_body","Lower Body",{"value":5800,"label":5801},"dresses","Dresses","Категория",{"fileTypes":5804,"_id":5805,"key":4587,"model":5747,"title":5087,"tooltipContent":2519,"description":2519,"step":38,"max":5806,"min":38,"defaultValue":4572,"options":5807,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"ruDescription":2522,"ruTitle":5091},[],"66f4158fa4a5e4942f3e9391",40,[],{"fileTypes":5809,"_id":5810,"key":5811,"model":5747,"title":5812,"tooltipContent":5813,"description":5813,"defaultValue":4111,"options":5814,"settingType":27,"fileSource":28,"valueType":29,"__v":30,"position":5815,"ruDescription":5816,"ruTitle":5817},[],"66f4194bc4dd5fce907eed93","crop","Crop","Check this if your image is not 3:4",[],1999,"Проверьте это, если ваше изображение не 3:4","Растениеводство",[5819,5820,5821],"68a9d9dde3ac04ad89b92008","68a9d9dde3ac04ad89b9200a","68a9d9dee3ac04ad89b9200c","cuuupid/idm-vton:c871bb9b046607b680449ecbae55fd8c6d945e0a1948644bf2361b3d021d3ff4","https://creativecommons.org/licenses/by-nc-sa/4.0/deed.en","https://github.com/yisol/IDM-VTON",214,[],"2024-09-25T13:46:33.306Z","2025-08-23T15:10:22.129Z","https://aiphoria-storage.ams3.cdn.digitaloceanspaces.com/model-icons/virtual-try-on.svg","2024-03-20T20:24:00.000Z","Виртуальная примерка — реалистичный просмотр одежды и украшений на вас","Виртуальная примерка позволяет покупателям и ритейлерам получать реалистичные и персонализированные визуализации одежды, аксессуаров и украшений на реальных телах или шаблонах моделей. Модель работает по принципу image-to-image: по фото или видеопотоку она сопоставляет предметы гардероба с формой тела, позой и движениями, создавая естественные наложения и моделирование драпировки тканей. Пользователи могут загрузить собственное фото для точной визуализации посадки, применить товар к шаблону модели для быстрого наполнения каталога или использовать живую AR-примерку для интерактивного опыта.\n\nРитейлеры получают возможность быстрее запускать продукты и экономить на маркетинге за счёт уменьшения потребности в физических образцах и фотосессиях. Покупатели получают больше уверенности в размере и стиле — это повышает конверсию и сокращает количество возвратов. Типичные сценарии применения: страницы товаров, виртуальные примерочные, лукбуки для соцсетей и интерактивные маркетинговые материалы. Взаимодействие простое: загрузите изображение или выберите шаблон, настройте посадку и позу, сгенерируйте изображение примерки или включите живую наложение.\n\nМодель выделяется сочетанием реалистичности, скорости и доступности. Она учитывает поведение материалов, адаптируется под разные типы телосложения и стили одежды и работает на разных устройствах и платформах. Практические ограничения тоже учтены: для лучшего результата рекомендуется использовать фото хорошего качества, необходимо корректно управлять приватностью пользовательских изображений, а сложные многослойные наряды могут отображаться не идеально. В целом, Виртуальная примерка помогает интернет-магазинам, маркетологам и покупателям лучше представлять товар, сокращать затраты и повышать удовлетворённость клиентов.",[63,64],{"category":5792,"steps":4572,"crop":4111},{"_id":5836,"key":5837,"label":5838,"shortLabel":5839,"description":5840,"isInstantModel":12,"isReasoningModel":12,"type":2674,"generationType":2677,"generationTypes":5841,"api":85,"settingConfigs":5842,"percs":5898,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":5903,"replicateId":5904,"outputPath":163,"cost":40,"gemTokenCost":482,"websiteUrl":5905,"position":65,"secondCost":30,"generationCost":30,"inputTokenCost":30,"outputTokenCost":30,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":5906,"createdAt":5907,"updatedAt":5908,"__v":126,"generationCount":5909,"replicateApiType":6,"isAvailableAfterAuth":12,"isBanned":12,"longDescription":5910,"ruDescription":5911,"ruLongDescription":5912,"configValue":5913},"689929883c066edd0804f721","wan-video/wan-2.2-i2v-fast","Wan 2.2 I2V Fast","Wan 2.2 I2V","Generate cinematic videos from images with fast, accurate control",[2677],[5843,5848,5857,5865,5872,5878,5885,5893],{"_id":5844,"key":63,"model":5836,"title":90,"description":5845,"accept":92,"position":38,"defaultValue":163,"options":5846,"settingType":94,"fileType":63,"fileSource":28,"isRequired":61,"valueType":215,"__v":30,"fileTypes":5847,"ruTitle":96},"689929893c066edd0804f723","Input image to generate video from.",[],[],{"_id":5849,"key":5850,"model":5836,"title":5851,"description":5852,"position":71,"step":38,"max":5853,"min":1398,"defaultValue":5854,"options":5855,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":5856},"689929893c066edd0804f725","num_frames","Number of Frames","Number of video frames. 81 frames give the best results",121,"81",[],[],{"_id":5858,"key":703,"model":5836,"title":704,"description":4334,"position":126,"defaultValue":3008,"options":5859,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":5864},"689929893c066edd0804f727",[5860,5862],{"label":4267,"value":4267,"cost":5861,"costMultiplier":163},"0.05",{"label":3008,"value":3008,"cost":5863},"0.11",[],{"_id":5866,"key":1264,"model":5836,"title":1265,"description":5867,"position":226,"defaultValue":1274,"options":5868,"settingType":282,"fileSource":28,"valueType":215,"__v":30,"fileTypes":5871},"689929893c066edd0804f729","Video aspect ratio format",[5869,5870],{"label":1274,"value":1274},{"label":1276,"value":1276},[],{"_id":5873,"key":3393,"model":5836,"title":3394,"description":5874,"position":482,"step":38,"max":478,"min":482,"defaultValue":5875,"options":5876,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":5877},"689929893c066edd0804f72b","Frames per second. Note that the pricing of this model is based on the video duration at 16 fps","16",[],[],{"_id":5879,"key":5880,"model":5836,"title":5881,"description":5882,"position":4037,"defaultValue":4111,"options":5883,"settingType":27,"fileSource":28,"valueType":29,"__v":30,"fileTypes":5884},"689929893c066edd0804f72d","go_fast","Go Fast","Enable fast processing mode",[],[],{"_id":5886,"key":5887,"model":5836,"title":5888,"description":5889,"position":2723,"step":225,"max":817,"min":38,"defaultValue":5890,"options":5891,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"fileTypes":5892},"689929893c066edd0804f72f","sample_shift","Sample Shift","Sample shift factor for generation quality","12",[],[],{"_id":5894,"key":317,"model":5836,"title":318,"description":5895,"position":555,"defaultValue":163,"options":5896,"settingType":214,"fileSource":28,"valueType":44,"__v":30,"fileTypes":5897},"689929893c066edd0804f731","Random seed. Leave blank for random",[],[],[5899,5900,5901,5902],"68a9e193e3ac04ad89b921bc","68a9e193e3ac04ad89b921be","68a9e193e3ac04ad89b921c0","68a9e193e3ac04ad89b921c2",[63],"b609b267d986d762a6d8679ac036d29e6d4454218df558db3aa4d0396ba55c59","https://replicate.com/wan-video/wan-2.2-i2v-fast",[],"2025-08-10T23:21:44.988Z","2025-08-28T10:22:41.337Z",112,"Wan 2.2 I2V Fast is a multimodal image-to-video generator built for creators who need cinematic visuals, accurate scene fidelity, and fast turnaround. It converts a single image (and optional text prompts) into short video clips with professional aesthetic controls over lighting, color grading, and composition so outputs look polished and film-like. The model supports both image-to-video and text-to-video workflows within a single framework, letting you use reference images to preserve composition while animating motion and scene elements.\n\nYou can generate complex, smooth motions and multi-object interactions with strong semantic compliance — the model reliably follows scene intent, preserving object relationships and producing coherent results across frames. Wan 2.2 I2V Fast targets practical deployment: it produces 480p and 720p outputs, and includes high-compression designs that reduce memory and storage needs. Thanks to its Mixture-of-Experts (MoE) efficiency, it can deliver high-quality videos with lower runtime cost than comparable large models. For example, an optimized TI2V-5B variant can render a 5-second 720p clip on a single GPU in minutes, making it suitable for rapid prototyping and content pipelines.\n\nIdeal use cases include social media and advertising content, digital art and animation, and instructional or educational videos where visual accuracy and motion realism matter. Users will benefit from cinematic presets, fine-grained control over visual style, and the ability to animate still references. Note that achieving the best results may require GPU resources and some experience tuning prompts and reference shots. Overall, Wan 2.2 I2V Fast balances quality, speed, and efficiency to make high-quality image-to-video creation accessible for professional and enthusiast workflows.","Генерирует кинематографические видео из изображений быстро и точно","Wan 2.2 I2V Fast — мультиформатная модель генерации видео из изображений, созданная для авторов, которым нужны кинематографичный вид, точная передача сцены и быстрая обработка. Модель преобразует одно изображение (с возможным текстовым описанием) в короткие видеоклипы, предлагая профессиональные инструменты управления эстетикой: освещение, цветокоррекция и композиция — чтобы результат выглядел отшлифованно и похоже на кино. Поддерживаются как режимы image-to-video, так и text-to-video в единой системе: можно использовать референс-изображения для сохранения композиции и одновременно оживлять сцену движением.\n\nМодель умеет создавать сложные плавные движения и сцены с несколькими объектами, демонстрируя высокую семантическую согласованность — она точно следует задумке пользователя, сохраняя отношения между объектами и последовательность кадров. Wan 2.2 I2V Fast ориентирована на практическое использование: поддерживает вывод в 480p и 720p и включает решения с высокой степенью сжатия для экономии памяти и места. Благодаря архитектуре Mixture-of-Experts (MoE) модель обеспечивает экономный расход ресурсов и снижает затраты во время работы. Например, оптимизированный вариант TI2V-5B способен отрендерить 5-секундный ролик в 720p на одном GPU за считанные минуты, что удобно для быстрой прототипизации и рабочих процессов контент-производства.\n\nПодходит для контента в соцсетях и рекламе, цифрового искусства и анимации, образовательных видео, где важны визуальная точность и реалистичность движения. Пользователи получают кинематографические пресеты, точную стилизацию и возможность анимировать статичные референсы. Для достижения лучших результатов могут потребоваться GPU и опыт настройки подсказок и референс-кадров. В целом Wan 2.2 I2V Fast сочетает качество, скорость и эффективность, делая производство качественного видео доступным как профессионалам, так и энтузиастам.",{"image":163,"num_frames":5854,"resolution":3008,"aspect_ratio":1274,"frames_per_second":5875,"go_fast":4111,"sample_shift":5890,"seed":163},{"replicateApiType":6,"outputPath":7,"_id":5915,"key":5916,"label":5916,"shortLabel":5916,"description":5917,"isInstantModel":12,"isReasoningModel":12,"ruDescription":5918,"releaseDate":5919,"ruLongDescription":5920,"contextCapacity":426,"maxTokens":5921,"createdAt":5922,"generationCount":1122,"type":428,"generationType":429,"generationTypes":5923,"api":67,"settingConfigs":5924,"percs":5933,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":5937,"cost":65,"iconUrl":695,"position":2130,"secondCost":30,"generationCost":30,"inputTokenCost":1621,"outputTokenCost":1622,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":5938,"updatedAt":5939,"__v":226,"isAvailableAfterAuth":12,"longDescription":5940,"configValue":5941},"6803d9c7796b6d77a686c5f7","o3","Generate text with deep multi-step reasoning, coding, and math","Генерирует текст с глубокой пошаговой логикой, кодированием и математикой","2024-09-12T17:14:00.000Z","o3 — высокоэффективная языковая модель, созданная для сложного рассуждения, пошагового решения задач и выполнения продвинутых программных и математических задач. Модель умеет разбирать сложные проблемы на последовательные шаги, используя внутренний механизм «имитации рассуждения», который позволяет ей планировать и рефлексировать перед генерацией ответа. Благодаря этому o3 особенно полезна там, где важна точность в нескольких шагах — в сложном анализе, техническом написании, проектировании алгоритмов и математических выводах.\n\nПрактические преимущества: пользователи могут автоматизировать многоэтапные бизнес-процессы (сортировка писем, планирование, обработка данных), получать качественную генерацию и отладку кода для реальных инженерных задач и решать продвинутые математические или логические задачи для исследований и финансов. API Adaptive Thinking Time позволяет настроить глубину рассуждений и задержку: выбирать быстрые ответы для рутинных запросов или более глубокий анализ для задач с высокими требованиями. Модель также включает Deliberative Alignment для выявления и смягчения небезопасных или неэтичных запросов, что повышает ответственность результатов.\n\nДоступны варианты: o3-mini для экономичных деплоев с настраиваемыми уровнями усилий при рассуждении и o3-pro для максимальной производительности с доступом к инструментам (поиск в сети, анализ файлов, работа с визуальными входами и выполнение Python). Ограничения: повышенная вычислительная нагрузка и задержки, а также необходимость контроля человека в критичных сценариях. В целом o3 отлично подходит командам и исследователям, которым нужны глубокие аналитические рассуждения, надёжная помощь в кодировании и высокая точность в математике.",32000,"2024-09-12T17:21:48.591Z",[],[5925,5929],{"fileTypes":5926,"_id":5927,"key":1723,"model":5915,"title":458,"description":463,"ruTitle":465,"ruDescription":464,"step":82,"max":325,"min":82,"defaultValue":461,"options":5928,"settingType":43,"fileSource":28,"valueType":44,"__v":30},[],"682492c59dc2fc9a4dba7570",[],{"fileTypes":5930,"_id":5931,"key":469,"model":5915,"title":470,"ruTitle":477,"step":82,"max":426,"min":82,"defaultValue":473,"options":5932,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":475,"ruDescription":476},[],"6862705e7edc80654049098c",[],[5934,5935,5936],"68a9deede3ac04ad89b9211d","68a9deede3ac04ad89b9211f","68a9deede3ac04ad89b92121",[63,64],[],"2025-09-04T19:42:58.713Z","o3 is a high-capability language model built to handle complex reasoning, multi-step problem solving, and advanced coding and mathematical tasks. It excels at breaking down difficult problems into clear, actionable steps, using an internal simulated-reasoning process that lets it plan and reflect before producing answers. That makes o3 especially useful where accuracy across multiple steps matters — complex analyses, technical writing, algorithm design, and mathematical derivations. \n\nPractical benefits: users can automate multi-step business workflows (email triage, scheduling, and data processing), run high-quality code generation and debugging for real-world engineering problems, and solve advanced math or logic tasks for research and finance. o3’s Adaptive Thinking Time API lets you tune reasoning depth and latency: choose faster responses for routine queries or deeper analysis when stakes and complexity are higher. The model also includes Deliberative Alignment to detect and mitigate unsafe or unethical prompts so outputs remain more responsible. \n\nPerformance highlights include strong results on programming and math benchmarks, reflecting significantly improved correctness over earlier models. Two variants let you match capabilities to needs: o3-mini for cost-sensitive deployments with selectable reasoning effort levels, and o3-pro for top-tier performance with tool access (web search, file analysis, visual input reasoning, and Python execution). \n\nLimitations: the advanced internal reasoning increases computational cost and response latency, and may be less suitable for highly resource-constrained environments. As with any AI, output quality depends on prompt clarity and may require human review for critical decisions. Overall, o3 is ideal for teams and researchers who need deep analytical reasoning, robust coding assistance, and high-accuracy mathematical problem solving in production workflows.",{"max_completion_tokens":461,"capacity":473},{"_id":5943,"key":5944,"label":5945,"shortLabel":5945,"description":5946,"isInstantModel":12,"ruDescription":5947,"releaseDate":5919,"ruLongDescription":5948,"contextCapacity":777,"maxTokens":5921,"createdAt":5922,"generationCount":5949,"type":428,"generationType":429,"generationTypes":5950,"api":67,"settingConfigs":5951,"percs":5956,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"cost":65,"iconUrl":695,"position":2130,"secondCost":30,"generationCost":30,"inputTokenCost":5961,"outputTokenCost":5962,"stepPrice":30,"examples":5963,"updatedAt":5964,"__v":482,"isReasoningModel":12,"oneImageCost":30,"supportFiles":12,"supportedFileTypes":5965,"tokenStrategy":67,"isAvailableAfterAuth":12,"outputPath":7,"replicateApiType":6,"longDescription":5966,"configValue":5967},"679f7488ca43f4ee5cc667d1","o3-mini","o3 mini","Fast, cost-efficient STEM reasoning and coding assistant","Быстрый и экономичный ассистент для STEM‑ reasoning и программирования","o3-mini — это компактная модель с высокой скоростью и эффективностью, оптимизированная для STEM‑задач: математики, науки и программирования. Модель сочетает пошаговое логическое рассуждение с набором функций для разработчиков, что позволяет создавать надёжную автоматизацию в продакшене. Пользователи могут выбирать уровень усилий рассуждения (низкий, средний, высокий) для балансировки между быстротой ответа и глубиной анализа — от быстрой проверки до подробных многошаговых доказательств и задач уровня PhD. o3-mini может выдавать структурированные, машинно-читаемые ответы через JSON Schema, что упрощает интеграцию в автоматические рабочие цепочки.\n\nМодель поддерживает вызов функций и работу с внешними инструментами: выполнение кода, веб‑поиск, чтение файлов и взаимодействие с API. Поддерживается потоковая отдача для интерфейсов в реальном времени. Для мультимодальных задач доступны изображения — например, VQA для документов и обработка чеков — но модель не предназначена для специализированных задач компьютерного зрения вроде детекции объектов. По сравнению с предыдущей мини‑версией, o3-mini обеспечивает более низкую задержку и более высокую точность на технических бенчмарках, что даёт лучший результат при меньших затратах. Типичные сценарии применения: автоматическая проверка и обучение в STEM, помощь в программировании и конкурсных задачах, корпоративная автоматизация с требованием структурированных ответов и поддержка научных исследований.\n\nОграничения: модель ориентирована на техническое рассуждение, а не на творческую генерацию и не заменяет специализированные системы для задач компьютерного зрения. В целом o3-mini подходит для разработчиков и компаний, которым нужна компактная, бюджетная модель для точного решения сложных технических задач и интеграции в рабочие процессы.",184,[],[5952],{"_id":5953,"key":1723,"model":5943,"title":458,"ruTitle":465,"step":65,"max":462,"min":82,"defaultValue":461,"options":5954,"fileSource":28,"__v":30,"description":463,"ruDescription":464,"settingType":43,"fileTypes":5955},"686d0d6d3d89766abc1ee8ae",[],[],[5957,5958,5959,5960],"68a9dde5e3ac04ad89b920e2","68a9dde5e3ac04ad89b920e4","68a9dde5e3ac04ad89b920e6","68a9dde5e3ac04ad89b920e8",0.0011,0.0044,[],"2025-08-23T15:27:33.876Z",[63,64],"o3-mini is a small, high-performance reasoning model optimized for STEM tasks — math, science, and coding — that delivers fast responses at low cost. It combines advanced step-by-step reasoning with developer-friendly features so teams can build reliable, production-ready automation. Users can set reasoning effort (low, medium, high) to trade off latency and depth of analysis depending on the task: quick verification or deep multi-step proofs and PhD-level problem solving. o3-mini produces structured, machine-readable outputs via JSON Schema constraints, making it simple to integrate into automated pipelines and downstream systems.\n\nThe model supports function calling and tool use, enabling safe automation such as invoking external code, running searches, reading files, and interacting with APIs. Streaming output is available for real-time interfaces. For multimodal workflows, o3-mini accepts image inputs for document question answering and receipt interpretation — though it is not intended as a dedicated object-detection vision model. Compared with its predecessor, it achieves faster time-to-first-token and lower latency while improving accuracy on technical benchmarks, so you get better reasoning at lower cost. Practical uses include automated grading and tutoring for STEM education, coding assistance and competitive programming support, enterprise automation that requires exact structured outputs, and scientific research assistance.\n\nLimitations: it’s focused on technical reasoning rather than open-ended creative dialogue and is not optimized for high-speed vision tasks like object detection. Overall, o3-mini is ideal for developers and organizations that need a compact, economical model that reliably solves complex technical problems and integrates seamlessly into production workflows.",{"max_completion_tokens":461},{"replicateApiType":6,"outputPath":7,"_id":5969,"key":5970,"label":5971,"shortLabel":5971,"description":5972,"isInstantModel":61,"isReasoningModel":12,"ruDescription":5973,"releaseDate":5919,"ruLongDescription":5974,"contextCapacity":777,"maxTokens":5921,"createdAt":5922,"generationCount":5975,"type":428,"generationType":429,"generationTypes":5976,"api":67,"settingConfigs":5977,"percs":5982,"isAdminModel":12,"isGenerationTypeRequired":12,"isOutdated":12,"isBanned":12,"isPromptRequired":61,"supportFiles":12,"supportedFileTypes":5987,"cost":65,"iconUrl":695,"position":2130,"secondCost":30,"generationCost":30,"inputTokenCost":5961,"outputTokenCost":5962,"stepPrice":30,"tokenStrategy":67,"oneImageCost":30,"examples":5988,"updatedAt":5989,"__v":226,"isAvailableAfterAuth":12,"longDescription":5990,"configValue":5991},"6803d9fc796b6d77a686c602","o4-mini","o4 mini","Generates text and understands images — fast multimodal math & coding","Генерирует текст и понимает изображения — быстро для математики и кода","o4-mini — компактная мультимодальная модель генерации, созданная для быстрого и практичного рассуждения по тексту и изображениям. Она нативно принимает визуальные и текстовые данные вместе, поэтому вы можете просить её интерпретировать зарисовки на доске, рукописные формулы, диаграммы или скриншоты одновременно с текстовыми инструкциями. Модель особенно сильна в математике, задачах программирования и визуальном анализе: она демонстрирует высокую точность при решении конкурсных задач по математике, эффективно помогает в реальных программных задачах и надёжно распознаёт схемы. \n\nПрактические преимущества включают объяснимый пошаговый разбор решений (вы можете отслеживать или вмешиваться в ход рассуждений), самопроверку для снижения ошибок фактов и возможность параллельного использования внешних инструментов — например, веб-поиска или выполнения кода — для решения сложных задач. Для пользователя это означает более быстрые и понятные ответы: студенты получают развёрнутые решения и распознавание формул; разработчики — контекстные фрагменты кода и помощь в отладке; команды — анализ длинных документов или проектов благодаря очень большому окну контекста (поддержка чрезвычайно больших входных и выходных данных). o4-mini оптимизирован под эффективность и скорость, предлагая баланс производительности для продакшен‑задач без стоимости крупнейших моделей. \n\nМодель также оборудована улучшенными средствами безопасности и выравнивания для сокращения рискованных ответов и повышения качества фильтрации. Ограничения: в узкоспециализированных задачах точность может уступать крупным или специализированным моделям (например, в некоторых химических задачах). В целом o4-mini отлично подходит для образования, научной поддержки, совместной визуальной работы и большинства рабочих процессов, связанных с кодом и математикой, где важны мультимодальное понимание и объяснимое быстрое рассуждение.",198,[],[5978],{"fileTypes":5979,"_id":5980,"key":1723,"model":5969,"title":458,"ruTitle":465,"step":65,"max":1683,"min":82,"defaultValue":461,"options":5981,"settingType":43,"fileSource":28,"valueType":44,"__v":30,"description":463,"ruDescription":464},[],"6862fac47edc80654049983b",[],[5983,5984,5985,5986],"68a9df2de3ac04ad89b92128","68a9df2de3ac04ad89b9212a","68a9df2de3ac04ad89b9212c","68a9df2de3ac04ad89b9212e",[63,64],[],"2025-08-23T15:33:01.773Z","o4-mini is a compact, multimodal generative model designed for fast, practical reasoning across text and images. It natively accepts visual and textual inputs together, so users can ask it to interpret whiteboard sketches, handwritten formulas, charts, or screenshots alongside written instructions. The model shines at mathematical problem solving, coding tasks, and visual analysis: it delivers strong accuracy on contest-level math, solid real-world software assistance, and reliable diagram interpretation. Practical features include transparent step-by-step reasoning (so you can follow or intervene in its logic), self-checking to reduce factual errors, and the ability to use external tools — like web lookups or code execution — in parallel to complete complex tasks. \n\nFor end users this means faster, more explainable results: students can get clear worked solutions and formula recognition; developers can receive helpful code snippets, debugging guidance and context-aware suggestions; teams can analyze long documents, entire projects, or lengthy conversations thanks to a very large context window (supporting extremely large inputs and outputs). o4-mini is optimized for cost-efficiency and speed, offering a good balance of performance for production workflows that need high-quality reasoning without the expense of the largest models. \n\nIt also includes enhanced safety and alignment features to reduce risky outputs and improve content filtering. Limitations: it trades off some accuracy on highly specialized benchmarks compared with larger models and isn’t the top choice for narrow domain specialists (for example, some specialized chemistry models may outperform it). Overall, o4-mini is ideal for education, research support, collaborative visual work, and most code- and math-focused workflows where multimodal understanding and fast, explainable reasoning matter.",{"max_completion_tokens":461},["Reactive",5993],{"$si18n:cached-locale-configs":5994,"$si18n:resolved-locale":163,"$scolor-mode":5999,"$ssite-config":6001},{"ru":5995,"en":5997},{"fallbacks":5996,"cacheable":61},[],{"fallbacks":5998,"cacheable":61},[],{"preference":6000,"value":6000,"unknown":61,"forced":12},"dark",{"currentLocale":6002,"defaultLocale":6002,"env":6003,"name":6004,"url":3437},"en","production","Ropewalk.ai - Ultimate AI Creativity Platform",["Set"],["ShallowReactive",6007],{"models":-1},"/models"]