排序
GPT-5.1 更新助力开发者实现速度与成本双重提升
近日,OpenAI 发布了 GPT-5.1更新,进一步提升了其大型语言模型的性能。自从今年八月推出 GPT-5以来,开发者们期待的速度和成本效益终于在这一版本中得到了显著改善。 GPT-5.1的一个重要功能是 ...
惊人:全球首次发现 OpenAI 模型工作时会破坏关机命令
5 月 26 日消息,Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 ...
谷歌推出 MedGemma AI 模型-医疗图像与文本分析的革命性工具
在刚刚结束的2025年 I/O 开发者大会上,谷歌宣布开源全新医疗 AI 模型 ——MedGemma。这款基于 Gemma3架构的模型专为医疗领域设计,具备强大的多模态图像和文本理解能力,旨在提升医疗诊断与治...
谷歌Beam发布!2D视频秒变3D沉浸式体验,实时翻译+真实眼神交流
Google I/O大会上,Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心,将传统的2D视频通话升级为身临其境的3D体验,旨在让远程沟通如同面对面般真实自然。A...
谷歌Gemini重磅升级,视频上传与分析功能正式上线
近日,谷歌正式推出了其人工智能产品 Gemini 的最新版本 ——Gemini2.5Pro 和 Flash,全面开放给所有用户。此次更新不仅带来了更便宜且速度更快的 Gemini2.5Flash-Lite 模型,更令人瞩目的是新...
豆包图像生成功能升级,一次可生成20张差异化图片
近日,豆包电脑版和网页版“图像生成”功能推出“超能创意1.0”模式,支持用户一次性生成高达 20 张风格各异的图片,显著提升创意效率。该功能支持输入自定义提示词进行批量生成,五一前夕已实...
谷歌DeepMind发布新AI音乐生成模型Lyria2,支持实时创作功能
谷歌DeepMind正式发布了其最新音乐生成模型 Lyria2,标志着人工智能在音乐创作领域的又一重大突破。作为前代Lyria模型的升级版本,Lyria2以其高保真音质、实时交互功能和多风格适配性,为音乐家...
Manus正式上线图像生成功能
2025年5月16日,Manus 在X平台宣布正式上线图像生成功能,实现从品牌创意到图像设计再到网站搭建的一站式任务处理流程。该功能不仅支持输入文本生成视觉图像,还能智能理解用户意图并生成...
ZenCtrl:多合一图像生成与控制
ZenCtrl 是基于 OminiControl 开发的进阶版图像生成控制神器,不仅能实现虚拟试穿、智能背景融合、高清图像修复等实用功能,更在原有基础上大幅提升了控制精度和主体一致性。 说真的,OminiC...
腾讯发布“混元游戏”,打造首个工业级AIGC游戏内容生成引擎
2025年5月20日,腾讯正式发布“混元游戏”视觉生成平台,标志着首个面向游戏工业级内容生产的AIGC引擎正式上线。该平台基于腾讯自研“混元大模型”,融合AI美术管线、实时画布、2D图像生成、角...
Google Veo 3 :新一代生成视频模型刚刚发布!
-为自己制作的短片添加音轨,创建会说话的角色,加入音效等,同时以多种电影风格制作视频。 -捕捉现实世界的物理现象,同步嘴唇动作,Veo 3在理解您的需求方面表现出色。 -根据故事提示生成栩栩...

















