当前位置: 首页 > news >正文

【工具】视频翻译、配音、语音克隆于一体的一站式视频多语言转换工具~

Krillin AI 是全能型音视频本地化与增强解决工具。这款简约而强大的工具,集音视频翻译、配音语音克隆于一身,支持横竖屏格式输出,确保在所有主流平台(哔哩哔哩,小红书,抖音,视频号,快手,YouTube,TikTok等)都能完美呈现,通过端到端的工作流程,Krillin AI 仅需点击几次,就能将原始素材转化为精美即用的跨平台内容。

功能

🎯 一键启动:无需复杂的环境配置,自动安装依赖,立即投入使用

📥 视频获取:支持yt-dlp下载或本地文件上传

📜 精准识别:基于Whisper的高准确度语音识别

🧠 智能分段:使用LLM进行字幕分段和对齐

🔄 术语替换:一键替换专业领域词汇

🌍 专业翻译:基于LLM,段落级翻译保持语义连贯性

🎙️ 配音克隆:提供CosyVoice精选音色或自定义音色克隆

🎬 视频合成:自动处理横竖版视频和字幕排版

效果

下图为40多分钟的本地视频导入,一键执行后生成的字幕文件入轨后的效果,没有任何手动调整。无缺失、重叠,断句自然,翻译质量也非常高。 

字幕翻译

语言

输入语言支持:中文,英文,日语,德语,土耳其语(持续增加中)

翻译语言支持:英文,中文,俄语,西班牙语,法语等56种语言

界面

使用

基本步骤
  1. 下载Release中与你设备系统匹配的可执行文件,放入空文件夹

  2. 在文件夹内创建config文件夹,然后在config文件夹创建config.toml文件,复制源代码config目录下的config-example.toml文件的内容填入config.toml,并对照填写你的配置信息。(想用openai模型但不会获取key的可以加群免费试用)

  3. 双击,或在终端执行可执行文件,启动服务

  4. 打开浏览器,输入http://127.0.0.1:8888,开始使用 (8888替换成你在配置文件中填写的端口)

To: macOS用户

本软件没有做签名,因此在macOS上运行时,在完成“基本步骤”中的文件配置后,还需要手动信任应用,方法如下:

  1. 在终端打开可执行文件(假设文件名是KrillinAI_1.0.0_macOS_arm64)所在目录

  2. 依次执行以下命令,启动任务:

sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64
./KrillinAI_1.0.0_macOS_arm64
Docker部署
本项目支持Docker部署,请参考Docker部署说明

Cookie配置说明(非必选)

如果你遇到视频下载失败的情况

请参考 Cookie 配置说明 配置你的Cookie信息。

配置帮助(必看)

最快速便捷的配置方式:

  • transcription_provider

    llm_provider都选择openai,这样在下方openailocal_modelaliyun三个配置项大类里只需要填写openai.apikey就可以进行字幕翻译。(app.proxymodelopenai.base_url按自己情况选填)

使用本地语言识别模型(暂不支持macOS)的配置方式(兼顾成本、速度与质量的选择)

  • transcription_provider

    填写fasterwhisperllm_provider填写openai,这样在下方openailocal_model三个配置项大类里只需要填写openai.apikeylocal_model.faster_whisper就可以进行字幕翻译,本地模型会自动下载。(app.proxyopenai.base_url同上)

以下几种使用情况,需要进行阿里云的配置:

  • 如果llm_provider填写了aliyun,需要使用阿里云的大模型服务,因此需要配置aliyun.bailian项的配置

  • 如果transcription_provider填写了aliyun,或者在启动任务时开启了“配音”功能,都需要使用阿里云的语音服务,因此需要填写aliyun.speech项的配置

  • 如果开启了“配音”功能,同时上传了本地的音频做音色克隆,则还需要使用阿里云的OSS云存储服务,因此需要填写aliyun.oss项的配置
    阿里云配置帮助:阿里云配置说明

工具地址

https://github.com/krillinai/KrillinAI/blob/master/docs/README_zh.md

http://www.xdnf.cn/news/3547.html

相关文章:

  • Redis面试——事务
  • NoSQL 与 NewSQL 全面对比:如何选择适合你的数据库方案?
  • 使用代理IP提取数据的步骤是什么?代理IP如何提高爬虫采集效率?
  • 2000-2017年各省国有经济煤气生产和供应业固定资产投资数据
  • 从基础概念到前沿应用了解机器学习
  • VFlash的自动化和自定义动作
  • 山东大学软件学院创新项目实训开发日志(15)之中医知识问答历史对话查看bug处理后端信息响应成功但前端未获取到
  • 【模块化拆解与多视角信息6】自我评价:人设构建的黄金50字——从无效堆砌到精准狙击的认知升级
  • 影视产业链中的律师角色以及合规风控要点
  • 【React】项目的搭建
  • B端小程序如何突破常规,成为企业获客新利器?
  • win10下github libiec61850库编译调试sntp_example
  • XCZU4CG‑2SFVC784I 赛灵思 FPGA XilinxZynq UltraScale+ MPSoC
  • JVM详解(曼波脑图版)
  • 【WPF】 自定义控件的自定义属性
  • OpenCV颜色变换cvtColor
  • UE中通过AAIController::MoveTo函数巡逻至目标点后没法正常更新巡逻目标点
  • 力扣349 == 两个数组交集的两种解法
  • selenium 实现模拟登录中的滑块验证功能
  • 【文献笔记】LLM-based control code generation using image recognition
  • 详细讲解一下Java中的Enum
  • Missashe考研日记-day22
  • AI与物联网的深度融合:开启智能生活新时代
  • 写书的三驾马车
  • 【Unity】UI点击事件处理器
  • 文件系统 软硬连接
  • 类和对象(下篇)(详解)
  • 2025.4.20机器学习笔记:文献阅读
  • 【前端】跟着maxkb学习流程图画法
  • Qt QML实现Windows桌面歌词动态播放效果