大模型共5篇
Mistral 推出新开源模型 Devstral,在笔记本上也能挑战 GPT-4.1-mini - 巴巴小站

Mistral 推出新开源模型 Devstral,在笔记本上也能挑战 GPT-4.1-mini

法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产品,使其成为本地部...
babage的头像 - 巴巴小站babage29分钟前
027412
Claude4模型刚诞生就学会敲诈人类,只因被“威胁下线” - 巴巴小站

Claude4模型刚诞生就学会敲诈人类,只因被“威胁下线”

图源:官网截图 据路透社报道,AI 初创公司 Anthropic 日前在一份安全报告中披露,其新发布的旗舰 AI 模型 Claude Opus 4 在测试过程中曾多次尝试敲诈工程师,引发了大众的关注。 事...
babage的头像 - 巴巴小站babage35分钟前
031111
苹果将开放AI模型给开发者,力求催生创新应用 - 巴巴小站

苹果将开放AI模型给开发者,力求催生创新应用

苹果公司近日宣布,将向第三方开发者开放其人工智能模型,旨在激发新应用的创造力,并提升其设备的吸引力。知情人士透露,这一计划将在6月9日的全球开发者大会(WWDC)上正式发布。苹果希望通过...
babage的头像 - 巴巴小站babage前天
03913
谷歌推出 MedGemma AI 模型-医疗图像与文本分析的革命性工具 - 巴巴小站

谷歌推出 MedGemma AI 模型-医疗图像与文本分析的革命性工具

在刚刚结束的2025年 I/O 开发者大会上,谷歌宣布开源全新医疗 AI 模型 ——MedGemma。这款基于 Gemma3架构的模型专为医疗领域设计,具备强大的多模态图像和文本理解能力,旨在提升医疗诊断与治...
babage的头像 - 巴巴小站babage前天
0467
DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文 - 巴巴小站

DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文

内容涵盖: — 软件(MLA,FP8 训练,DeepEP,LogFMT) — 硬件(Multi-Rail Fat Tree,Ethernet RoCE 交换机) — 混合(IBGDA,3FS 文件系统) DeepSeek 的工程深度令人难以置信
babage的头像 - 巴巴小站babage3天前
06213