Skip to content

Commit 403aebd

Browse files
authored
💄 style: add more OpenAI SDK Text2Image providers (#8573)
1 parent 356cf0c commit 403aebd

File tree

6 files changed

+497
-12
lines changed

6 files changed

+497
-12
lines changed

src/config/aiModels/giteeai.ts

Lines changed: 269 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
import { AIChatModelCard } from '@/types/aiModel';
1+
import { AIChatModelCard, AIImageModelCard } from '@/types/aiModel';
22

33
const giteeaiChatModels: AIChatModelCard[] = [
44
{
@@ -222,6 +222,273 @@ const giteeaiChatModels: AIChatModelCard[] = [
222222
},
223223
];
224224

225-
export const allModels = [...giteeaiChatModels];
225+
const giteeaiImageModels: AIImageModelCard[] = [
226+
{
227+
description:
228+
'FLUX.1-dev 是由 Black Forest Labs 开发的一款开源 多模态语言模型(Multimodal Language Model, MLLM),专为图文任务优化,融合了图像和文本的理解与生成能力。它建立在先进的大语言模型(如 Mistral-7B)基础上,通过精心设计的视觉编码器与多阶段指令微调,实现了图文协同处理与复杂任务推理的能力。',
229+
displayName: 'FLUX.1-dev',
230+
enabled: true,
231+
id: 'FLUX.1-dev',
232+
parameters: {
233+
imageUrl: { default: null },
234+
prompt: {
235+
default: '',
236+
},
237+
size: {
238+
default: '1024x1024',
239+
enum: ['1024x1024', '1536x1536'],
240+
},
241+
},
242+
type: 'image',
243+
},
244+
{
245+
description:
246+
'由 Black Forest Labs 开发的 120 亿参数文生图模型,采用潜在对抗扩散蒸馏技术,能够在 1 到 4 步内生成高质量图像。该模型性能媲美闭源替代品,并在 Apache-2.0 许可证下发布,适用于个人、科研和商业用途。',
247+
displayName: 'flux-1-schnell',
248+
enabled: true,
249+
id: 'flux-1-schnell',
250+
parameters: {
251+
prompt: {
252+
default: '',
253+
},
254+
size: {
255+
default: '1024x1024',
256+
enum: ['1024x1024', '1536x1536', '2048x2048'],
257+
},
258+
},
259+
type: 'image',
260+
},
261+
{
262+
description:
263+
'FLUX.1-Kontext-dev 是由 Black Forest Labs 开发的一款基于 Rectified Flow Transformer 架构 的多模态图像生成与编辑模型,拥有 12B(120 亿)参数规模,专注于在给定上下文条件下生成、重构、增强或编辑图像。该模型结合了扩散模型的可控生成优势与 Transformer 的上下文建模能力,支持高质量图像输出,广泛适用于图像修复、图像补全、视觉场景重构等任务。',
264+
displayName: 'FLUX.1-Kontext-dev',
265+
enabled: true,
266+
id: 'FLUX.1-Kontext-dev',
267+
parameters: {
268+
imageUrl: { default: null },
269+
prompt: {
270+
default: '',
271+
},
272+
size: {
273+
default: '1024x1024',
274+
enum: ['1024x1024', '1536x1536', '2048x2048'],
275+
},
276+
},
277+
type: 'image',
278+
},
279+
{
280+
description:
281+
'Stable Diffusion 3.5 Large Turbo 专注于高质量图像生成,具备强大的细节表现力和场景还原能力。',
282+
displayName: 'stable-diffusion-3.5-large-turbo',
283+
enabled: true,
284+
id: 'stable-diffusion-3.5-large-turbo',
285+
parameters: {
286+
prompt: {
287+
default: '',
288+
},
289+
size: {
290+
default: '1024x1024',
291+
enum: ['1024x1024'],
292+
},
293+
},
294+
type: 'image',
295+
},
296+
{
297+
description:
298+
'由 Stability AI 推出的最新文生图大模型。这一版本在继承了前代的优点上,对图像质量、文本理解和风格多样性等方面进行了显著改进,能够更准确地解读复杂的自然语言提示,并生成更为精确和多样化的图像。',
299+
displayName: 'stable-diffusion-3-medium',
300+
enabled: true,
301+
id: 'stable-diffusion-3-medium',
302+
parameters: {
303+
prompt: {
304+
default: '',
305+
},
306+
size: {
307+
default: '1024x1024',
308+
enum: ['1024x1024'],
309+
},
310+
},
311+
type: 'image',
312+
},
313+
{
314+
description:
315+
'由 Stability AI 开发并开源的文生图大模型,其创意图像生成能力位居行业前列。具备出色的指令理解能力,能够支持反向 Prompt 定义来精确生成内容。',
316+
displayName: 'stable-diffusion-xl-base-1.0',
317+
enabled: true,
318+
id: 'stable-diffusion-xl-base-1.0',
319+
parameters: {
320+
prompt: {
321+
default: '',
322+
},
323+
size: {
324+
default: '1024x1024',
325+
enum: ['1024x1024'],
326+
},
327+
},
328+
type: 'image',
329+
},
330+
{
331+
description:
332+
'Kolors 是由快手 Kolors 团队开发的文生图模型。由数十亿的参数训练,在视觉质量、中文语义理解和文本渲染方面有显著优势。',
333+
displayName: 'Kolors',
334+
enabled: true,
335+
id: 'Kolors',
336+
parameters: {
337+
imageUrl: { default: null },
338+
prompt: {
339+
default: '',
340+
},
341+
size: {
342+
default: '1024x1024',
343+
enum: ['1024x1024'],
344+
},
345+
},
346+
type: 'image',
347+
},
348+
{
349+
description:
350+
'hunyuandit-v1.2-distilled 是一款轻量级的文生图模型,经过蒸馏优化,能够快速生成高质量的图像,特别适用于低资源环境和实时生成任务。',
351+
displayName: 'HunyuanDiT-v1.2-Diffusers-Distilled',
352+
enabled: true,
353+
id: 'HunyuanDiT-v1.2-Diffusers-Distilled',
354+
parameters: {
355+
prompt: {
356+
default: '',
357+
},
358+
size: {
359+
default: '1024x1024',
360+
enum: ['1024x1024'],
361+
},
362+
},
363+
type: 'image',
364+
},
365+
{
366+
description:
367+
'HiDream-I1 是一个全新的开源图像生成基础模型,是由国内企业智象未来开源的。拥有 170 亿参数(Flux是12B参数),能够在几秒内实现行业领先的图像生成质量。',
368+
displayName: 'HiDream-I1-Full',
369+
enabled: true,
370+
id: 'HiDream-I1-Full',
371+
parameters: {
372+
prompt: {
373+
default: '',
374+
},
375+
size: {
376+
default: '1024x1024',
377+
enum: ['1024x1024'],
378+
},
379+
},
380+
type: 'image',
381+
},
382+
{
383+
description:
384+
'HiDream-E1-Full 是由智象未来(HiDream.ai)推出的一款 开源多模态图像编辑大模型,基于先进的 Diffusion Transformer 架构,并结合强大的语言理解能力(内嵌 LLaMA 3.1-8B-Instruct),支持通过自然语言指令进行图像生成、风格迁移、局部编辑和内容重绘,具备出色的图文理解与执行能力。',
385+
displayName: 'HiDream-E1-Full',
386+
enabled: true,
387+
id: 'HiDream-I1-Full',
388+
parameters: {
389+
imageUrl: { default: null },
390+
prompt: {
391+
default: '',
392+
},
393+
size: {
394+
default: '1024x1024',
395+
enum: ['1024x1024'],
396+
},
397+
},
398+
type: 'image',
399+
},
400+
{
401+
description:
402+
'HelloMeme 是一个可以根据你提供的图片或动作,自动生成表情包、动图或短视频的 AI 工具。它不需要你有任何绘画或编程基础,只需要准备好参考图片,它就能帮你做出好看、有趣、风格一致的内容。',
403+
displayName: 'HelloMeme',
404+
enabled: true,
405+
id: 'HelloMeme',
406+
parameters: {
407+
imageUrl: { default: null },
408+
prompt: {
409+
default: '',
410+
},
411+
size: {
412+
default: '1024x1024',
413+
enum: ['1024x1024'],
414+
},
415+
},
416+
type: 'image',
417+
},
418+
{
419+
description:
420+
'OmniConsistency 通过引入大规模 Diffusion Transformers(DiTs)和配对风格化数据,提升图像到图像(Image-to-Image)任务中的风格一致性和泛化能力,避免风格退化。',
421+
displayName: 'OmniConsistency',
422+
enabled: true,
423+
id: 'OmniConsistency',
424+
parameters: {
425+
imageUrl: { default: null },
426+
prompt: {
427+
default: '',
428+
},
429+
size: {
430+
default: '1024x1024',
431+
enum: ['1024x1024'],
432+
},
433+
},
434+
type: 'image',
435+
},
436+
{
437+
description:
438+
'InstantCharacter 是由腾讯 AI 团队在 2025 年发布的一款 无需微调(tuning-free) 的个性化角色生成模型,旨在实现高保真、跨场景的一致角色生成。该模型支持仅基于 一张参考图像 对角色进行建模,并能够将该角色灵活迁移到各种风格、动作和背景中。',
439+
displayName: 'InstantCharacter',
440+
enabled: true,
441+
id: 'InstantCharacter',
442+
parameters: {
443+
imageUrl: { default: null },
444+
prompt: {
445+
default: '',
446+
},
447+
size: {
448+
default: '1024x1024',
449+
enum: ['1024x1024'],
450+
},
451+
},
452+
type: 'image',
453+
},
454+
{
455+
description:
456+
'DreamO 是由字节跳动与北京大学联合研发的开源图像定制生成模型,旨在通过统一架构支持多任务图像生成。它采用高效的组合建模方法,可根据用户指定的身份、主体、风格、背景等多个条件生成高度一致且定制化的图像。',
457+
displayName: 'DreamO',
458+
enabled: true,
459+
id: 'DreamO',
460+
parameters: {
461+
imageUrl: { default: null },
462+
prompt: {
463+
default: '',
464+
},
465+
size: {
466+
default: '1024x1024',
467+
enum: ['1024x1024'],
468+
},
469+
},
470+
type: 'image',
471+
},
472+
{
473+
description:
474+
'AnimeSharp(又名 “4x‑AnimeSharp”) 是 Kim2091 基于 ESRGAN 架构开发的开源超分辨率模型,专注于动漫风格图像的放大与锐化。它于 2022 年 2 月重命名自 “4x-TextSharpV1”,原本也适用于文字图像但性能针对动漫内容进行了大幅优化',
475+
displayName: 'AnimeSharp',
476+
enabled: true,
477+
id: 'AnimeSharp',
478+
parameters: {
479+
imageUrl: { default: null },
480+
prompt: {
481+
default: '',
482+
},
483+
size: {
484+
default: '1024x1024',
485+
enum: ['1024x1024'],
486+
},
487+
},
488+
type: 'image',
489+
},
490+
];
491+
492+
export const allModels = [...giteeaiChatModels, ...giteeaiImageModels];
226493

227494
export default allModels;

src/config/aiModels/siliconcloud.ts

Lines changed: 24 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
import { AIChatModelCard } from '@/types/aiModel';
1+
import { AIChatModelCard, AIImageModelCard } from '@/types/aiModel';
22

33
// https://siliconflow.cn/zh-cn/models
44
const siliconcloudChatModels: AIChatModelCard[] = [
@@ -830,6 +830,28 @@ const siliconcloudChatModels: AIChatModelCard[] = [
830830
},
831831
];
832832

833-
export const allModels = [...siliconcloudChatModels];
833+
const siliconcloudImageModels: AIImageModelCard[] = [
834+
{
835+
description:
836+
'Kolors 是由快手 Kolors 团队开发的基于潜在扩散的大规模文本到图像生成模型。该模型通过数十亿文本-图像对的训练,在视觉质量、复杂语义准确性以及中英文字符渲染方面展现出显著优势。它不仅支持中英文输入,在理解和生成中文特定内容方面也表现出色',
837+
displayName: 'Kolors',
838+
enabled: true,
839+
id: 'Kwai-Kolors/Kolors',
840+
parameters: {
841+
prompt: {
842+
default: '',
843+
},
844+
seed: { default: null },
845+
size: {
846+
default: '1024x1024',
847+
enum: ['1024x1024', '960x1280', '768x1024', '720x1440', '720x1280'],
848+
},
849+
},
850+
releasedAt: '2024-07-06',
851+
type: 'image',
852+
},
853+
];
854+
855+
export const allModels = [...siliconcloudChatModels, ...siliconcloudImageModels];
834856

835857
export default allModels;

src/config/aiModels/stepfun.ts

Lines changed: 67 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
import { AIChatModelCard } from '@/types/aiModel';
1+
import { AIChatModelCard, AIImageModelCard } from '@/types/aiModel';
22

33
// https://platform.stepfun.com/docs/pricing/details
44

@@ -275,6 +275,71 @@ const stepfunChatModels: AIChatModelCard[] = [
275275
},
276276
];
277277

278-
export const allModels = [...stepfunChatModels];
278+
const stepfunImageModels: AIImageModelCard[] = [
279+
// https://platform.stepfun.com/docs/llm/image
280+
{
281+
description:
282+
'阶跃星辰新一代生图模型,该模型专注于图像生成任务,能够根据用户提供的文本描述,生成高质量的图像。新模型生成图片质感更真实,中英文文字生成能力更强。',
283+
displayName: 'Step 2X Large',
284+
enabled: true,
285+
id: 'step-2x-large',
286+
parameters: {
287+
prompt: {
288+
default: '',
289+
},
290+
seed: { default: null },
291+
size: {
292+
default: '1024x1024',
293+
enum: ['256x256', '512x512', '768x768', '1024x1024', '1280x800', '800x1280'],
294+
},
295+
steps: { default: 50, max: 100, min: 1 },
296+
},
297+
releasedAt: '2024-08-07',
298+
type: 'image',
299+
},
300+
{
301+
description:
302+
'该模型拥有强大的图像生成能力,支持文本描述作为输入方式。具备原生的中文支持,能够更好的理解和处理中文文本描述,并且能够更准确地捕捉文本描述中的语义信息,并将其转化为图像特征,从而实现更精准的图像生成。模型能够根据输入生成高分辨率、高质量的图像,并具备一定的风格迁移能力。',
303+
displayName: 'Step 1X Medium',
304+
enabled: true,
305+
id: 'step-1x-medium',
306+
parameters: {
307+
prompt: {
308+
default: '',
309+
},
310+
seed: { default: null },
311+
size: {
312+
default: '1024x1024',
313+
enum: ['256x256', '512x512', '768x768', '1024x1024', '1280x800', '800x1280'],
314+
},
315+
steps: { default: 50, max: 100, min: 1 },
316+
},
317+
releasedAt: '2025-07-15',
318+
type: 'image',
319+
},
320+
{
321+
description:
322+
'该模型专注于图像编辑任务,能够根据用户提供的图片和文本描述,对图片进行修改和增强。支持多种输入格式,包括文本描述和示例图像。模型能够理解用户的意图,并生成符合要求的图像编辑结果。',
323+
displayName: 'Step 1X Edit',
324+
enabled: true,
325+
id: 'step-1x-edit',
326+
parameters: {
327+
imageUrl: { default: null },
328+
prompt: {
329+
default: '',
330+
},
331+
seed: { default: null },
332+
size: {
333+
default: '1024x1024',
334+
enum: ['512x512', '768x768', '1024x1024'],
335+
},
336+
steps: { default: 28, max: 100, min: 1 },
337+
},
338+
releasedAt: '2025-03-04',
339+
type: 'image',
340+
},
341+
];
342+
343+
export const allModels = [...stepfunChatModels, ...stepfunImageModels];
279344

280345
export default allModels;

0 commit comments

Comments
 (0)