排序
AudioTextHub:一款免费智能AI文本转语音平台,支持100+语言,让文字瞬间发声
AudioTextHub是什么 AudioTextHub是一款无需下载、在线免费使用的AI文本转语音平台,能够在几秒钟内把任意文字转换成自然流畅、富有情感的高质量语音。该平台支持超过100种语言和地区口音,为不...
火山引擎推出开源 MCP Servers,助力大模型应用开发
近日,火山引擎宣布推出一款名为 MCP Servers 的大模型生态平台,并将其开源。这一举措使得企业可以轻松将自研工具按照 MCP 协议进行封装并上传共享,形成一个良性的 “用生态” 与 “建生态” ...
DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文
内容涵盖: — 软件(MLA,FP8 训练,DeepEP,LogFMT) — 硬件(Multi-Rail Fat Tree,Ethernet RoCE 交换机) — 混合(IBGDA,3FS 文件系统) DeepSeek 的工程深度令人难以置信
阿里开源数字人程序MNN TaoAvatar:可在手机本地运行的3D智能数字人
什么是 MNN TaoAvatar MNN TaoAvatar 是阿里巴巴基于 MNN 框架打造的一款本地运行、完全离线的手机端 3D 数字人应用。它将大语言模型(LLM)、语音识别(ASR)、语音合成(TTS)、声音驱动表情...
FLUX Kontext:AI高级上下文感知的图像处理工具,实现高效图像局部创作
什么是 FLUX Kontext? FLUX Kontext 是 Black Forest Labs 推出的一款多模态生成与编辑模型,支持将文本与图像输入相结合,打造上下文感知的图像处理工具,同时满足“文本→图像”与“图...
FaceFusion:免费开源AI换脸神器,支持唇形同步,支持N卡和A卡全面解析
FaceFusion是一款开源的AI换脸工具,支持图像与视频处理。它整合多种高质量人脸交换与增强模型,能有效处理高清内容并解决遮挡问题。兼容NVIDIA和AMD显卡,提供实时唇形同步功能,用户可自由定...
新手指南:阿里云推出的AI智能编码助手“通义灵码”安装教程
通义灵码是由阿里云推出的AI智能编码助手,旨在提高编程效率,兼容主流编程工具如Visual Studio Code和JetBrains IDEs。 通义灵码官网:https://tongyi.aliyun.com/lingma/ 以下是通义灵码安装...
开源AI生产力工具Apt Full:内置本地专属 ChatGPT、DeepSeek,一键批量智能处理图片、视频、音频等
Apt Full 是一个免费开源的AI生产力工具,旨在通过提供高效便捷的AI解决方案来提升用户的生产力。它不仅注重用户隐私和数据安全的保护,还具有一系列独特的特点,使得它成为一款值得信赖的生产...
KlicStudio:跨平台AI全能型音视频增强,集音视频翻译、配音、语音克隆于一身
Klic Studio是Krillin AI开发的一款全能型音视频本地化与增强解决方案。这款简约而强大的工具,集音视频翻译、配音、语音克隆于一身,支持横竖屏格式输出,确保在所有主流平台(哔哩哔哩,小红...
Image Describer X – 免费AI图像描述神器竟然可以让每张图片“开口说话”
Image Describer X概述 Image Describer X 是一款完全免费的 AI 图像描述平台,能将 JPG、PNG、GIF、WEBP 等格式的图片瞬间转化为生动、准确的文字描述。凭借先进的深度学习算法,它不仅能识别...
PromptPilot:字节AI提示词优化平台,专治不会写AI提示词
字节 AI 提示词优化平台「PromptPilot」专门解决 “不会写提示词”“提示词效果差” 的难题。不管你是想让 AI 写文案、做数据分析,还是生成图片,它都能帮你。 功能介绍 一键生成符合 AI 理解...
Kyutai 推出 Kyutai TTS:专为实时场景打造的文本转语音神器
Kyutai 推出 Kyutai TTS - 专为实时场景打造的AI文本转语音神器,凭借超低延迟、高保真声音和流式处理能力,秒杀了很多竞品。不仅技术先进,还开源免费,适合开发者、内容创作者和 AI 爱好者使...
半个AI圈期待的“Midjourney”角色一致性首发评测
Midjourney(MJ)发布了备受期待的角色一致性功能,这是AI图像生成领域的一个重要进展。这项功能允许用户在生成图像时保持角色的外观一致性,对于需要连续性和一致性的创作流程至关重要。角色一...
AI Voice Cloning:AI语音克隆生成器 3秒极速复刻真人声线
AI Voice Cloning是一款AI语音克隆生成器,3秒极速复刻真人声线,该平台通过领先的 AI 技术,仅需一段 3 秒钟的录音,便能精准捕捉说话者的音色、情感与语调,瞬间生成与真人几乎无异的语音效果...
Apt Full V2.9.2.0 – 功能超强的AI生产力工具,本地安装部署开源绿色版
Apt Full 是一个免费开源的AI生产力工具,旨在通过提供高效便捷的AI解决方案来提升用户的生产力。它不仅注重用户隐私和数据安全的保护,还具有一系列独特的特点,使得它成为一款值得信赖的生产...
Deep Research:免费开源AI研究工具 两分钟生成深度报告
Deep Research:让深度研究变得轻松可及 Deep Research:免费开源AI研究工具 两分钟生成深度报告,在信息爆炸的时代,传统的资料搜集与整理往往耗时又繁琐。Deep Research 致力于打破这些壁垒,...