排序
谷歌DeepMind发布新AI音乐生成模型Lyria2,支持实时创作功能
谷歌DeepMind正式发布了其最新音乐生成模型 Lyria2,标志着人工智能在音乐创作领域的又一重大突破。作为前代Lyria模型的升级版本,Lyria2以其高保真音质、实时交互功能和多风格适配性,为音乐家...
字节发布多模态神器BAGEL,图像生成媲美SD3,14B参数碾压Qwen2.5-VL
字节跳动Seed团队在Hugging Face平台重磅发布BAGEL,一款基于混合专家(MoE)架构的开源多模态基础模型,拥有14亿总参数和7亿活跃参数。BAGEL在数万亿token的交错多模态数据集上预训练,性能超...
OpenAI 官方扩展 Responses API:支持 MCP、图像生成等
OpenAI 公司昨日(5 月 21 日)发布博文,宣布扩展 Responses API,支持远程连接 MCP 服务器、图像生成、Code Interpreter 以及文件搜索优化等,帮助开发者构建更智能的智能体应用。 网友查询公...
腾讯发布“混元游戏”,打造首个工业级AIGC游戏内容生成引擎
2025年5月20日,腾讯正式发布“混元游戏”视觉生成平台,标志着首个面向游戏工业级内容生产的AIGC引擎正式上线。该平台基于腾讯自研“混元大模型”,融合AI美术管线、实时画布、2D图像生成、角...
ZenCtrl:多合一图像生成与控制
ZenCtrl 是基于 OminiControl 开发的进阶版图像生成控制神器,不仅能实现虚拟试穿、智能背景融合、高清图像修复等实用功能,更在原有基础上大幅提升了控制精度和主体一致性。 说真的,OminiC...
Google Veo 3 :新一代生成视频模型刚刚发布!
-为自己制作的短片添加音轨,创建会说话的角色,加入音效等,同时以多种电影风格制作视频。 -捕捉现实世界的物理现象,同步嘴唇动作,Veo 3在理解您的需求方面表现出色。 -根据故事提示生成栩栩...
火山引擎推出开源 MCP Servers,助力大模型应用开发
近日,火山引擎宣布推出一款名为 MCP Servers 的大模型生态平台,并将其开源。这一举措使得企业可以轻松将自研工具按照 MCP 协议进行封装并上传共享,形成一个良性的 “用生态” 与 “建生态” ...