最新科技资讯,AI最新报道,科技前沿技术 - 巴巴小站

OpenAI 发布AI编程工具Codex，支持自然语言执行开发任务

2025年5月16日，OpenAI 推出了名为 Codex 的云端软件工程智能体，旨在通过自然语言指令自动执行多项编程相关任务。该工具由 codex-1 模型驱动，目前已集成进 ChatGPT 的 Pro、Team 和 Enterpr...

OpenAI # Codex

babage1年前

03779

面壁智能推出MiniCPM 4.0端侧大模型，惊人的实现220倍速度提升

6月6日，面壁智能正式推出其最新力作——MiniCPM4.0系列模型，这一系列被誉为“有史以来最具想象力的小钢炮”，不仅在端侧性能上实现了飞跃，更在技术创新上树立了新的标杆。 MiniCPM4.0系列包...

# 大模型 # MiniCPM # 面壁智能

babage1年前

02099

GPT-5.1 更新助力开发者实现速度与成本双重提升

近日，OpenAI 发布了 GPT-5.1更新，进一步提升了其大型语言模型的性能。自从今年八月推出 GPT-5以来，开发者们期待的速度和成本效益终于在这一版本中得到了显著改善。 GPT-5.1的一个重要功能是 ...

OpenAI # ChatGPT

babage8个月前

01808

惊人：全球首次发现 OpenAI 模型工作时会破坏关机命令

5 月 26 日消息，Palisade Research 最近一项关于“危险 AI 能力”的研究显示，某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示，O3 ...

OpenAI # OpenAI

babage1年前

1938

谷歌DeepMind发布新AI音乐生成模型Lyria2，支持实时创作功能

谷歌DeepMind正式发布了其最新音乐生成模型 Lyria2，标志着人工智能在音乐创作领域的又一重大突破。作为前代Lyria模型的升级版本，Lyria2以其高保真音质、实时交互功能和多风格适配性，为音乐家...

Google # 谷歌 # DeepMind # 音乐生成

babage1年前

05277

谷歌Gemini重磅升级，视频上传与分析功能正式上线

近日，谷歌正式推出了其人工智能产品 Gemini 的最新版本 ——Gemini2.5Pro 和 Flash，全面开放给所有用户。此次更新不仅带来了更便宜且速度更快的 Gemini2.5Flash-Lite 模型，更令人瞩目的是新...

Gemini # 大模型 # 谷歌 # Gemini

babage1年前

01367

谷歌Beam发布！2D视频秒变3D沉浸式体验，实时翻译+真实眼神交流

Google I/O大会上，Google正式推出了其革命性的3D视频通信平台——Google Beam。这一平台以人工智能为核心，将传统的2D视频通话升级为身临其境的3D体验，旨在让远程沟通如同面对面般真实自然。A...

Google # Google # Beam

babage1年前

04857

谷歌推出 MedGemma AI 模型-医疗图像与文本分析的革命性工具

在刚刚结束的2025年 I/O 开发者大会上，谷歌宣布开源全新医疗 AI 模型 ——MedGemma。这款基于 Gemma3架构的模型专为医疗领域设计，具备强大的多模态图像和文本理解能力，旨在提升医疗诊断与治...

Google # 大模型 # Google # MedGemma

babage1年前

0567

豆包图像生成功能升级，一次可生成20张差异化图片

近日，豆包电脑版和网页版“图像生成”功能推出“超能创意1.0”模式，支持用户一次性生成高达 20 张风格各异的图片，显著提升创意效率。该功能支持输入自定义提示词进行批量生成，五一前夕已实...

babage1年前

01707

Xcode 26.3 发布，原生支持Claude Code 了

Xcode 26.3 发布，原生支持Claude Code 了开发者现在可以直接在 Xcode 中使用 Claude Code 的完整能力四大核心功能： 1. 视觉验证（Previews） Claude 可以捕获 Xcode 预览界面实时查看正在...

# Claude Code # Xcode

babage4个月前

03176

Manus正式上线图像生成功能

2025年5月16日，Manus 在X平台宣布正式上线图像生成功能，实现从品牌创意到图像设计再到网站搭建的一站式任务处理流程。该功能不仅支持输入文本生成视觉图像，还能智能理解用户意图并生成...

# 图像生成 # Manus

babage1年前

0686

腾讯发布“混元游戏”，打造首个工业级AIGC游戏内容生成引擎

2025年5月20日，腾讯正式发布“混元游戏”视觉生成平台，标志着首个面向游戏工业级内容生产的AIGC引擎正式上线。该平台基于腾讯自研“混元大模型”，融合AI美术管线、实时画布、2D图像生成、角...

# 腾讯 # AIGC # 内容引擎

babage1年前

0526

ZenCtrl：多合一图像生成与控制

ZenCtrl 是基于 OminiControl 开发的进阶版图像生成控制神器，不仅能实现虚拟试穿、智能背景融合、高清图像修复等实用功能，更在原有基础上大幅提升了控制精度和主体一致性。说真的，OminiC...

# 图像生成

babage1年前

0286

Google Veo 3 ：新一代生成视频模型刚刚发布！

-为自己制作的短片添加音轨，创建会说话的角色，加入音效等，同时以多种电影风格制作视频。 -捕捉现实世界的物理现象，同步嘴唇动作，Veo 3在理解您的需求方面表现出色。 -根据故事提示生成栩栩...

Google # Google # 视频模型

babage1年前

1695

上一页 1 23

OpenAI 发布AI编程工具Codex，支持自然语言执行开发任务

面壁智能推出MiniCPM 4.0端侧大模型，惊人的实现220倍速度提升

GPT-5.1 更新助力开发者实现速度与成本双重提升

惊人：全球首次发现 OpenAI 模型工作时会破坏关机命令

谷歌DeepMind发布新AI音乐生成模型Lyria2，支持实时创作功能

谷歌Gemini重磅升级，视频上传与分析功能正式上线

谷歌Beam发布！2D视频秒变3D沉浸式体验，实时翻译+真实眼神交流

谷歌推出 MedGemma AI 模型-医疗图像与文本分析的革命性工具

豆包图像生成功能升级，一次可生成20张差异化图片

Xcode 26.3 发布，原生支持Claude Code 了

Manus正式上线图像生成功能

腾讯发布“混元游戏”，打造首个工业级AIGC游戏内容生成引擎

ZenCtrl：多合一图像生成与控制

Google Veo 3 ：新一代生成视频模型刚刚发布！

SaltyLeo 的书架：免费电子书网站，可直接搜书和直接听书

一款本地AI配音神器，300多个主播1秒轻松上岗，声音太逼真了

小站推荐之Win11 宝藏优化工具Wintoys：榨干电脑潜力、提升游戏性能

全能看图浏览工具软件BandiView V7.17.0 Windows绿色版

OpenList：网盘聚合工具，最全的跨平台客户端最新发布

GDownload：开源跨平台免费下载神器，支持百度网盘下载