人工智能共41篇
聚焦人工智能领域,分享 AI 技术动态、AI模型应用、AI 工具测评与实操应用教程。涵盖生活娱乐和学习的AI应用,跟进AI趋势与落地技巧。
VideoCaptioner:开箱即用的 AI 智能字幕助手,支持语音识别、字幕断句、优化、翻译全流程处理 - 巴巴小站

VideoCaptioner:开箱即用的 AI 智能字幕助手,支持语音识别、字幕断句、优化、翻译全流程处理

卡卡字幕助手「VideoCaptioner」一款开箱即用的 AI 智能字幕助手,据介绍支持语音识别、字幕断句、优化、翻译全流程处理,支持网络调用和本地离线(支持调用GPU)两种方式进行语音识别。 功能介...
Cloudflare AI 图片生成工具(Stable Diffusion XL):免费实用的中英文提示词和自动翻译 - 巴巴小站

Cloudflare AI 图片生成工具(Stable Diffusion XL):免费实用的中英文提示词和自动翻译

CZL在线工具箱推出了一款基于Cloudflare Workers AI的免费在线AI图片生成服务,用户可无缝集成多种生成式AI模型并在全球GPU网络上运行,无需安装任何客户端或插件。 模型支持 本工具采用Stabili...
MidJourney提示词生成器:免费无限制的赋予AI创作灵感 - 巴巴小站

MidJourney提示词生成器:免费无限制的赋予AI创作灵感

MidJourney精选图集与提示词生成器是一个MidJourney提示词和提示词生成器网站,拥有数万张公开的MidJourney Showcase精选作品,汇聚多位创作者的代表作与用户名,助你快速获取灵感。每条提示词...
Kirara AI:开源免费多模态专属于你的 AI 聊天助手 - 巴巴小站

Kirara AI:开源免费多模态专属于你的 AI 聊天助手

免费开源可 DIY 的 多模态 AI 聊天机器人「Kirara AI」打造专属于你的 AI 聊天助手!支持接入微信、 QQ、等聊天平台;支持 DeepSeek、Grok、Claude、Ollama、Gemini 等工作流系统、网页搜索、AI...
Ollama 发布桌面客户端,人人都能轻松部署本地 AI 模型 - 巴巴小站

Ollama 发布桌面客户端,人人都能轻松部署本地 AI 模型

现在「Ollama」官方发布了 Windows / macOS 的图形界面版本,并提供了全新的对话界面;支持直接上传 PDF、图像、文本文件,通过 RAG 技术与文档内容交互,支持多模态对话等等... AI 模型下载方...
Deep-Live-Cam:免费开源的实时换脸开源AI神器,生成实时直播或视频 - 巴巴小站

Deep-Live-Cam:免费开源的实时换脸开源AI神器,生成实时直播或视频

Deep‑Live‑Cam 是什么? Deep-Live-Cam是一款基于深度学习的开源实时AI换脸工具,只需提供单张源人脸图片即可在直播或视频中生成逼真换脸效果,实现高精度、低延迟的换脸效果,降低创作与演示...
Prompt Optimizer:多平台开源AI提示词优化器工具,轻松激活模型能力 - 巴巴小站

Prompt Optimizer:多平台开源AI提示词优化器工具,轻松激活模型能力

Prompt Optimizer是一个强大的AI提示词优化工具,帮助你编写更好的AI提示词,提升AI输出质量。支持Web应用、桌面应用、Chrome插件和Docker部署四种使用方式。 功能演示 1. 角色扮演对话:激发小...
AI-Media2Doc:开源 AI 视频转图文工具,一键将视频和音频内容转化为多种自媒体内容 - 巴巴小站

AI-Media2Doc:开源 AI 视频转图文工具,一键将视频和音频内容转化为多种自媒体内容

AI-Media2Doc是一款基于 AI 大模型的开源 Web 工具,能够一键将视频和音频内容转化为多种文档风格,包括小红书推文、微信公众号文章、知识笔记、思维导图和视频字幕等,无需登录注册即可使用,...
一人公司 AI 工具系列合集推荐,有些AI工具是宝,有些AI工具可能是坑 - 巴巴小站

一人公司 AI 工具系列合集推荐,有些AI工具是宝,有些AI工具可能是坑

在AI时代的机遇下,独立创业与个人工作模式兴起的今天,专注于为“一人公司”量身打造的AI工具合集应运而生。该项目持续更新维护,覆盖大语言模型对比、商业与开源TTS服务、代码开发工具、多领...
VideoLingo:本地化视频翻译配音工具,一键生成影视级双语字幕和配音 - 巴巴小站

VideoLingo:本地化视频翻译配音工具,一键生成影视级双语字幕和配音

VideoLingo 是一站式视频翻译本地化配音工具,能够一键生成 Netflix 级别的高质量字幕,告别生硬机翻,告别多行字幕,还能加上高质量的克隆配音,让全世界的知识能够跨越语言的障碍共享。集成 W...
FaceFusion:免费开源AI换脸神器,支持唇形同步,支持N卡和A卡全面解析 - 巴巴小站

FaceFusion:免费开源AI换脸神器,支持唇形同步,支持N卡和A卡全面解析

FaceFusion是一款开源的AI换脸工具,支持图像与视频处理。它整合多种高质量人脸交换与增强模型,能有效处理高清内容并解决遮挡问题。兼容NVIDIA和AMD显卡,提供实时唇形同步功能,用户可自由定...
Kyutai 推出 Kyutai TTS:专为实时场景打造的文本转语音神器 - 巴巴小站

Kyutai 推出 Kyutai TTS:专为实时场景打造的文本转语音神器

Kyutai 推出 Kyutai TTS - 专为实时场景打造的AI文本转语音神器,凭借超低延迟、高保真声音和流式处理能力,秒杀了很多竞品。不仅技术先进,还开源免费,适合开发者、内容创作者和 AI 爱好者使...
NativeMind:开源纯本地运行达大模型,数据完全不出云 - 巴巴小站

NativeMind:开源纯本地运行达大模型,数据完全不出云

这不是来了,安装浏览器插件直接跑本地模型,安全速度,无需联网, 这可是企业喜欢的东西 NativeMind - 开源 - 纯本地运行 - 数据完全不出云 亮点 • 支持 Chrome 、 Edge 浏览器,跨平台( Win...
VoiceCanvas:开源文本转语音系统,支持50+语言的声音克隆(多种音色)与多语言合成 - 巴巴小站

VoiceCanvas:开源文本转语音系统,支持50+语言的声音克隆(多种音色)与多语言合成

VoiceCanvas 是一个先进的多语言语音合成平台,使用最新的 AI 技术提供高质量的文字转语音服务和语音克隆服务。这是一个支持自部署的文本转语音系统,能够实现声音克隆,支持50多种语言和多种音...
KlicStudio:跨平台AI全能型音视频增强,集音视频翻译、配音、语音克隆于一身 - 巴巴小站

KlicStudio:跨平台AI全能型音视频增强,集音视频翻译、配音、语音克隆于一身

Klic Studio是Krillin AI开发的一款全能型音视频本地化与增强解决方案。这款简约而强大的工具,集音视频翻译、配音、语音克隆于一身,支持横竖屏格式输出,确保在所有主流平台(哔哩哔哩,小红...
PicDoc:1秒生成专业可视化图表的AI文本转视觉工具 - 巴巴小站

PicDoc:1秒生成专业可视化图表的AI文本转视觉工具

PicDoc介绍 PicDoc 是一款由 AI 驱动的文本与视觉创作工具,能够自动从各种格式的文档中提取核心信息,将文字内容与结构一键转化为可编辑的图表、流程图、信息图等多风格视觉元素,无需手动设计...