Seedance-我爱网址导航 字节跳动开发的AI视频生成模型,模型能够根据文本或图像生成高质量的视频内容,支持多镜头切换、稳定运动轨迹和风格化控制,适用于创意内容创作、广告制作和教育演示等场景。 04,197493 AI大模型AI工具集# AI大模型# Seedance
MuseTalk-我爱网址导航 MuseTalk 是一个实时高质量音频驱动唇形同步模型,旨在解决高分辨率、身份一致性和准确唇形同步的面部视觉配音挑战,尤其适用于实时应用如直播视频 。 011,249488 AI大模型AI工具集# AI大模型# MuseTalk
SadTalker-我爱网址导航 SadTalker 是一个基于单张图像和音频生成说话人脸视频的模型,其核心功能是通过音频输入使静态图片中的图像动起来,并生成说话的虚拟人物。 03,21761 AI大模型AI工具集# AI大模型# SadTalker
Veo3-我爱网址导航 Veo 3 是 Google DeepMind 推出的新一代视频生成模型,专为电影制作人、故事讲述者和创意工作者设计,将视频与音频无缝结合,开启生成式 AI 的创作新篇章。 011,950181 AI大模型AI工具集# AI大模型# Veo3
Hallo-我爱网址导航 Hallo 是一个由复旦大学(Fudan University)开发的开源项目,专注于音频驱动的视觉合成技术,特别是用于人像动画生成。 03,423370 AI大模型AI工具集# AI大模型# ai数字人# Hallo
Seed-TTS-我爱网址导航 Seed-TTS 是由字节跳动开发的高级文本到语音(TTS)模型系列,旨在生成高质量、几乎无法与人类语音区分的语音。 010,121417 AI大模型AI工具集# AI大模型# Seed-TTS
MiniMind-我爱网址导航 MiniMind项目旨在从零开始训练一个轻量级语言模型(LLM),并提供完整的训练、微调、推理和部署流程。 020,882412 AI大模型AI工具集# AI大模型# MiniMind
Qwen-Image-我爱网址导航 Qwen-Image 是阿里通义千问团队于2025年8月5日开源的200亿参数图像生成基础模型,采用MMDiT架构,专为复杂文本渲染与高精度图像生成设计。 010,270407 AI大模型AI工具集# AI大模型# Qwen-Image# 通义千问
Moondream-我爱网址导航 Moondream 是一个开源的轻量级视觉语言模型,由开发者 vikhyatk 推出,旨在提供高效、灵活的图像理解和文本生成能力。 05,618304 AI大模型AI工具集# AI大模型# Moondream
Grsai API-我爱网址导航 Grsai聚合了各种优秀的主流图片与视频生成大模型,以低于官网好几倍的价格为您降低使用成本!提供企业级专业稳定的API中转站,服务稳定可靠,达到99.99%。 028,119434 AI大模型AI工具集# AI大模型# API# GrsaiAPI