实测讯飞智作,一张照片定制属于自己的数字人

 Datawhale亲测 

AI应用:讯飞智作

只用一张照片,就可以定制属于自己的数字人。

这是大模型给数字人领域带来的最新震撼。

就在两周前的 AI 开发者 Talk 合肥站活动上,我们 Datawhale 的一名小伙伴玉鑫化身成数字人亮相大屏幕,为参加活动的开发者们献上了一段欢迎致辞。

玉鑫变的更年轻了👐!

这个短短十几秒的视频在现场引起了热烈的讨论:“数字人玉鑫”声音的自然度简直完全听不出和真人的差别,同时口唇和肢体动作同步也特别自然,有着玉鑫独特的亲和力。

这样的超拟人数字人技术,由「讯飞智作」最新发布。

我们在小程序上使用了讯飞智作的“超拟人数字人”功能,只用了一张照片(下图所示)和一段语音花了几秒钟就生成了这段视频。

011cba94b77828f82d8de003b4948e0a.png

现在这个“超拟人数字人”功能已经全面开启,上手门槛特别低,让我们一睹为快。

一张照片实现超拟人数字人

想要变身超拟人数字人,只需上传一张你的照片。

这里,我们还拿上面 Datawhale 小伙伴玉鑫的照片来演示(给玉鑫加鸡腿🍗了)

首先打开「讯飞智作」小程序,点击最下面的➕,然后把刚才的图片上传即可。

PS:大家在上传的时候记得一定要选择正面平视的全身高清照,这样出效果才会更好。

3e49ae2ad072816bc3c2d98a857ad62f.png

接下来是对数字人声音的选择,可以选择音库里面的声音,也可以复刻自己的声音。

0dbefc0a2cca9bcc7f9d691361d37176.png

讯飞智作的音库预制了海量的声音,支持各个年龄段、多种语言风格、多种行业领域、甚至多门国家语言。

9240f3b52e50b41c2cc604dc669cb239.png

我们可以直接使用音库里的丰富声音,也可以选择一键「声音复刻」自己的声音。

这个步骤也很简单(如下图所示),只需要朗读一段文字就行,此时我们保存这段声音为“玉鑫”。

至于声音复刻的效果如何,待会儿和视频一起检验。

dff94498bd954cec7daac0978759730c.png

接下来我们返回刚才的页面,在声音部分选择刚才复刻好的“玉鑫”,然后点击提交就行。

也就是几秒钟的时间,玉鑫同学的超拟人数字人就构建完成了。

说是「秒级构建」还真不是吹的啊!

d4c8c567973e386258c4ba5bf29f1ec2.jpeg

然而,光是快可不保险,毕竟业内可是有个知名的梗:“ 你别管我算的对不对,就问你快不快吧!”

接下来就创作一个视频检验一下生成的数字人效果。

创作视频的方法也很简单,首先如下图(图中),生成效果选择超拟人数字人,形象 & 声音选择刚才创建好的“玉鑫同学”。

接下来输入一段想让数字人说话的文案,当然,文案也可以利用讯飞的 AI(星火文案助手)帮你生成。

46a2ecbf53d06985d05bd4e15b20fecc.png

比如输入关键词“AI 时代祝福语”,星火文案助手直接秒出了一段文案。

AI 时代,愿智慧之光照亮你的每一天。愿你在数据的海洋中畅游,收获知识与创新的力量。祝你在这个智能互联的世界里,事业腾飞,生活美满!

f0e08d92c6dea8fff72536b326d7ae3b.png

最后点击“生成视频”,然后只需等待几秒。

欣赏成片:

在效率如此大幅提升的前提下,超拟人数字人的细节质量依然保持着高水准。

今年的除夕,我们就可以用超拟人数字人给朋友家人道一声新年快乐。

如今,超拟人数字人的应用场景非常可观,它可以让任何人任何角色几秒钟化身为数字人视频分身。

不论是自媒体带货直播、赋能文旅,亦或者在新范式的驱动之下,步入“寻常百姓家”正在成为可能。

超拟人数字人,步入大模型时代应用新范式

大模型带来的规模化应用的时代变革,已经成为科技圈新的热议焦点。

「讯飞智作」的超拟人数字人生成,核心受到关注的,其实还是多模态交互技术

比如在肢体动作驱动方面,讯飞智作针对此次超拟人数字人进行了大胆的技术创新——通过多模扩散生成大模型的应用,数字人的四肢动作能够与语音内容自然匹配,摆脱了传统预设动作的局限,数字人动作更加自然、流畅和逼真,也更有生命力。

在表情动作的语义贯穿方面,讯飞智作利用大模型的多模态交互技术将语义贯穿“口唇-表情-动作”生成,实现了跨模态的语义一致性。

872a3791cc08ca78c21188dcddd73edd.png

讯飞智作的超拟人数字人将构建提升到了秒级,降低了数字人定制的门槛,让大家看到了其在 AI 数字人领域的领先性。

解放生产力、释放想象力,让创意生产,变得简单、高效、人人可用。

体验通道:讯飞智作

1a509ef0228f35358a983967a1f15f60.png一起“赞”三连

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/7543.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

乡村景区一体化系统(门票,餐饮,便利店,果园,娱乐,停车收费

一、一体化优势 1. 提升游客体验:游客可以通过一个系统方便地完成各种消费和预订,无需在不同的地方分别处理,节省时间和精力,使游玩过程更加顺畅和愉快。 2. 提高管理效率:景区管理者能够在一个平台上集中管理多个业…

安卓编程最方便的读写资料类SharedPreferences,多个APP共享

本文介绍Android平台进行数据存储的五大方式,分别如下: 1 使用SharedPreferences存储数据 2 文件存储数据 3 SQLite数据库存储数据 4 使用ContentProvider存储数据 5 网络存储数据 下面详细讲解这五种方式的特点 第一种: 使用SharedPreferences存储数据 …

[Docker#1] 专栏前言 | 亿级高并发架构演进之路

目录 目标 一.前期演进 1. 单机架构 2. 应用数据分离架构 3. 应用集群架构 4. 读写分离/主从分离架构 5. 冷热分离架构 二. 架构 分布式数据库架构 微服务架构 容器编排架构 三. An Internet Application Architecture 理解 上层传输 框架 数据处理 主要思想 …

初识AI大模型,ollama使用,llama factory大模型微调,lama.cpp模型转换guff

最近了解了下生成式AI对话,下面是自己的一些尝试记录。 ollama 安装及使用 1、安装 我是在windows环境下安装的,很简单,访问:https://ollama.com/ ,下载windows安装包,打开安装就行了。 cmd输入ollama -v检…

Mybatis、Mybatis-Plus 调用同一个组件的查询时遇到的坑

Mybatis、Mybatis-Plus 调用同一个组件的查询时遇到的坑 Mybais-plus配置了驼峰自动命名,所以不需要在SQL里转化查询。

ssm070基于SSM框架的校园代购服务订单管理系统的设计与实现+vue(论文+源码)_kaic

毕业设计 题 目: 校园代购服务订单管理系统 作 者: 学 号: 所属学院: 专业年级: 学校导师: 职 称: 班级导师: 职 称: 完成时间…

ECharts折线图背景渐变设置

目录 引入 1.在一个HTML文件中编写两个图表 2.渐变背景 引入 如何在一个HTML文件中编写两个图表:(这个例子基于这个篇文章的基础)一篇搞懂前端获取数据-CSDN博客 一个例子: 1.在一个HTML文件中编写两个图表 重点在于名字的不重…

Webserver(4.6)poll和epoll

目录 pollclient.cpoll.c epollepoll.cclient.c epoll的两种工作模式水平触发边沿触发 poll poll是对select的一个改进 select的缺点在于每次都需要将fd集合从用户态拷贝到内核态,开销很大。每次调用select都需要在内核遍历传递进来的所有fd,这个开销也…

提高交换网络可靠性之认识STP根桥与端口角色

转载请注明出处 该实验旨在学习如何选举根桥与识别端口角色。 1.三台交换机按要求连线,改名,分别为S1,S2,S3,以S1为例: 2.在S1上配置优先级为28672 同理,在交换机S2和S3上配置其优先级为32768&…

qt QTextDocument详解

1、概述 QTextDocument是Qt框架中用于处理文本文档的类,它提供了丰富的功能和接口,用于创建、编辑和格式化文本内容。该类能够保存格式化的文本,是结构化富文本文档的容器,支持样式文本和各种文档元素,如列表、表格、…

【UE5】在材质中实现球形法线技术,常用于改善植物等表面的渲染效果

在材质中实现球形法线,这种技术常用于植被渲染等场景。通过应用球形法线可以显著提升植物再低几何体情况下的光照效果。 三二一上截图! 当然也可以用于任何你希望模型圆润的地方,下图中做了一个Cube倒角

提高交换网络可靠性之链路聚合

转载请注明出处 该实验为链路聚合的配置实验。 1.改名,分别将交换机1和交换机2改名为S1,S2,然后查看S1,S2的STP信息。以交换机1为例👇。 2.交换机S1,S2上创建聚合端口,将端口加入聚合端口。以S…

ZISUOJ 2024算法基础公选课练习一(3)

前言、 接&#xff08;2&#xff09;后完成I-J两道题 一、题目总览 二、具体题目 2.1 问题 I: 帆帆的图&#xff1a; 思路&#xff1a; 考察拓扑排序和图论&#xff08;拓扑排序也是排序&#xff0c;<滑稽>&#xff09;&#xff0c;都是模板&#xff0c;我就直接拿去…

窨井监测遥测终端RTU IP68防水强信号穿透力

在窨井的潮湿 黑暗和腐蚀性环境中 常规物联网设备往往难以生存 如何突破层层环境挑战 轻松应对极端条件 确保信号 24h不掉线&#xff0c;不延迟 不仅是对技术的突破 更是对恶劣环境的征服 ↓↓↓ 坚守 ——严苛环境下的工业设备 计讯物联工业级设备&#xff0c;专为恶劣环境设计…

python opencv3

三、图像预处理2 1、图像滤波 为图像滤波通过滤波器得到另一个图像。也就是加深图像之间的间隙&#xff0c;增强视觉效果&#xff1b;也可以模糊化间隙&#xff0c;造成图像的噪点被抹平。 2、卷积核 在深度学习中&#xff0c;卷积核越大&#xff0c;看到的信息越多&#xff0…

Mac上的免费压缩软件-FastZip使用体验实测

FastZip是Mac上的一款免费的压缩软件&#xff0c;分享一下我在日常使用中的体验 压缩格式支持7Z、Zip&#xff0c;解压支持7Z、ZIP、RAR、TAR、GZIP、BZIP2、XZ、LZIP、ACE、ISO、CAB、PAX、JAR、AR、CPIO等所有常见格式的解压 体验使用下来能满足我所有的压缩与解压的需求&a…

网络自动化04:python实现ACL匹配信息(主机与主机信息)

目录 背景分析代码代码解读代码总体结构1. load_pattern_from_excel 函数2. match_and_append_pattern 函数3. main 函数总结 最终的效果&#xff1a; 今天不分享netmiko&#xff0c;今天分享一个用python提升工作效率的小案例&#xff1a;acl梳理时的信息匹配。 背景 最近同事…

Linux之sed命令详解

文章目录 &#x1f34a;自我介绍&#x1f34a;sed概述&#x1f34a;sed语法讲解格式&#xff1a;options 命令选项{commmand}[flags] &#x1f34a;场景训练 你的点赞评论就是对博主最大的鼓励 当然喜欢的小伙伴可以&#xff1a;点赞关注评论收藏&#xff08;一键四连&#xff…

用ChatGPT完成高质量文献综述全过程实操指南,用高级学术版专业应用gpts轻松搞定

文献综述在学术研究中占据核心地位,不仅为研究提供坚实的理论基础,也是创新观点和理论框架构建的重要支柱。然而,撰写高质量的文献综述往往是一项复杂且繁重的工作,需要研究者对领域内的文献进行广泛筛选、分类、对比和整合。该过程不仅考验研究者的分析能力,还要求对文献…

Java题目笔记(十四)Date +综合练习

一、时间计算时间比较 import java.util.Date; import java.util.Random;public class Main {public static void main(String[] args) {//需求1Date d1new Date(0L); //从时间原点开始经过了0毫秒long timed1.getTime();timetime1000L*60*60*24*365; //一年的时间d1.setTime(…