通信原理课设(gec6818) 007:语音识别

目录

1、去科大讯飞官网下载对应的sdk

2、科大讯飞文件夹的意思

3、配置ARM的录音环境

4、编程实现语音识别


我们的需求是将一个语音文件从客户端传到服务器,因此我们最好是选用tcp
    
现在市面上面常用的语音识别解决方案为:科大讯飞c和百度c++

离线语音识别和在线语音识别有一定区别,以识别“你好”为例:
在线:语音识别可以直接返回“你好”这个字符串    
离线:只能做命令词 --- 根据我的需求写好代号
           如:你好 --- 1001
           最终我们可以拿到这个1001这个id

语音解决方案没有arm的环境,因此我们需要用开发板去录音,将这个录音文件发送给乌班图,由乌班图识别出来之后返回给arm板

1、去科大讯飞官网下载对应的sdk

进入科大讯飞官网 -> 讯飞开放平台 -> 离线命令词识别 -> 免费试用
    -> 下载对应的SDK-> 跳转到对应的sdk下载界面->注意下面三个红色框框的选择(下载sdk可能会提示要实名认证,认证就好了)

2、科大讯飞文件夹的意思

每个人下载的sdk都是不一样的

进入到\samples\asr_offline_sample,可以看到有一个makefile文件,我们在编译的时候直接make就可以了。make会找Makefile去执行,make完成如果没有报错,它会在bin目录里面生成一个asr_offline_sample可执行文件。

由于我们只用x64的库,所以我们用记事本打开makefile,将x86改成x64

在执行的时候要找到这个库  我们需要将这个库弄到 /lib文件夹

 sudo cp lib/x64/libmsc.so /lib

3、配置ARM的录音环境

链接:https://pan.baidu.com/s/1LZ0Lpj9DhqpMzhzYjp0xVg?pwd=scrt 
提取码:scrt

1、首先将alsa-1.0.tar.gz这个文件拷贝到开发板的 /home
     cp /mnt/udisk/alsa-1.0.tar.gz /home

2、在home目录里面解压这个文件
     tar xvf alsa-1.0.tar.gz

3、进入  alsa-1.0这个文件夹 
     cd  alsa-1.0
     进入这个文件夹里面的bin目录
     cd bin
     将这个bin目录里面的  arecord aplay这两个文件复制到 /bin
     cp arecord aplay /bin
    
4、 然后cd ..
     进入lib这个文件夹 cd bin
     将里面so这些动态库复制到 /lib这个文件夹
     cp libasound.s* /lib

5、回到home目录
      cd /home
      在home目录里面建立一个文件夹 叫gec
      mkdir gec
      继续在gec文件夹里面建立一个文件夹alsa-1.0.22
      mkdir -p /home/gec/alsa-1.0.22
      将这个alsa-1.0整体copy 到gec文件夹里面去 并且要换一个名字叫alsa-1.0.22(必须是这个名字)
      cd /home/alsa-1.0  进入这个文件夹
      cp -rf * /home/gec/alsa-1.0.22

6、录音环境配置完成,进行测试

      录音:arecord 1.wav  (ctrl + c结束)
      放音:aplay 1.wav

      录音4s,频率16000,保存为hehe.pcm:arecord -d4 -c1 -r16000 -traw -fS16_LE hehe.pcm
      放音:aplay -d4 -c1 -r16000 -traw -fS16_LE hehe.pcm

(录音是arecord ,放音是aplay ,其他参数都是一样的)

4、编程实现语音识别

我们进行语音识别时,也是在网络编程,需要客户端和服务端。在这里,客户端是开发板,开发板进行录音,并将录音文件发送给乌班图。Ubuntu是服务端,接收开发板发送过来的录音文件,并进行语音识别,返回语句的id。

在第二部分我们知道文件夹中的bin存放可执行文件以及识别的音频。我们进入bin文件夹可以看到一个call.bnf,用记事本打开:

看到这个,我们就能知道语音识别仅仅能识别返回在call.bnf定义了id的语句,那怎么才能识别我们想要说的话呢?简单,我们自己在里面加就可以了。比如加个“打开蜂鸣器”:

有了这个基础,我们后面才能实现语音控制开发板。

现在先实现简单的语句识别,即开发板录音并将录音文件发给ubuntu,ubuntu进行语音识别,并返回对应语句的id:

建立两个文件夹:client和server

client文件夹存放客户端程序tcp_client.c

server文件夹存放科大讯飞的sdk和服务端程序tcp_sever.c

由于这次是传文件,和上一篇网络编程的传法还是有些不同的

关键代码:

tcp_client.c :

void function(void)
{unsigned char buf[1024] = {0};while(1){//首先发送文件大小//阻塞你按回车printf("按回车继续\n");getchar();//弄你的文件printf("请录音4秒........\n");//获取音频文件 system("arecord -d4 -c1 -r16000 -traw -fS16_LE hehe.pcm");int fd = open("hehe.pcm",O_RDWR);if(-1 == fd){perror("open pcm error");exit(10);}int filesize = lseek(fd,0x00,SEEK_END);lseek(fd,0x00,SEEK_SET);//偏移到开头send(sockfd,&filesize,4,0);//接收信息 "error!!!" or "next!!!!"recv(sockfd,buf,9,0);printf("11111 %s\n",buf);if(strcmp(buf,"next!!!!")){printf("服务器错误了\n");continue;}//如果是"next!!!!"发送文件while(1){int r = read(fd,buf,1024);if(-1 == r){perror("read pcm error");break;}else if(0 == r){printf("over\n");break;				}else{send(sockfd,buf,r,0);}}close(fd);//等待接收idint id;recv(sockfd,&id,4,0);	if(id == 6666){printf("打印");}printf("id ===== %d\n",id);}
}

asr_offine_sample.c :

//一个全局的科大讯飞的id  也就是我最终想要得到的结果
int FlayId = 0;//0代表一个错误值//解析出相应的id出来 id固定为4位
int StringToId(const char * str)
{int id = 0;printf("------> %s\n",str);int len = strlen(str) - 3;//固定匹配  "id="这个字符串  模式匹配用正则表达式for(int i = 0;i < len;i++){if(!strncmp(str,"id=",3)){str += 4;//id=" 这个字符串给过掉printf("------> %s\n",str);id = (str[0]-'0')*1000+(str[1]-'0')*100+(str[2]-'0')*10+(str[3]-'0'); break;}str++;//一旦没有匹配 那么我们就往后面走一个}return id;
}//语音识别  返回结果
//返回的是ID  返回0表示识别失败
int GetFlayId(void)
{int ret = run_asr(&asr_data);if(MSP_SUCCESS != ret)//识别出错{printf("离线语法识别出错: %d \n", ret);return 0;}return FlayId;
}

tcp_server.c :

void SaveFile(int accceptfd,int filesize)
{//每一次都是重复的覆盖hehe.pcmint fd = open("wav/hehe.pcm",O_RDWR | O_TRUNC | O_CREAT, 0664);//截短这个文件if(-1 == fd){send(accceptfd,"error!!!",9,0);//失败发送这个错误return;}send(accceptfd,"next!!!!",9,0);//发送下一步的指令unsigned char buf[1024] = {0};int size = 0;//接收文件的内容while(1)		{int r = recv(accceptfd,buf,1024,0);if(-1 == r){perror("recv error");break;}else if(0 == r)//客户端已经断了{printf("对方断开连接了\n");break;}else//接收到信息了{//将文件的内容写入到文件write(fd,buf,r);//做完之后要退出size += r;if(size >= filesize)break;}}close(fd);
}//专门用于去服务一个客户的线程
void * ClinetFunction(void * arg)
{pthread_detach(pthread_self());//将其分离int * accceptfd = (int *)arg;printf(" * accceptfd = %d\n", * accceptfd);int filesize = 0;//你发什么信息过来  我就在这个信息之前加上一节 然后回发给你while(1){printf("\t\t等待客户端传文件过来........\n");int r = recv(*accceptfd,&filesize,4,0);//阻塞等待数据过来if(-1 == r){perror("recv error");break;}else if(0 == r)//客户端已经断了{printf("对方断开连接了\n");break;}else//接收到信息了{//文件大小SaveFile(* accceptfd,filesize);int id = GetFlayId();//文件接收完毕  那么我们就放过去识别即可//给客户端返回idsend(* accceptfd,&id,4,0);}}close(*accceptfd);free(accceptfd);return NULL;
}

完整工程:

链接:https://pan.baidu.com/s/1thUvAArWzcqmOT6QrvGHew?pwd=yuyi 
提取码:yuyi

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/824133.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

zookeeper之集群搭建

1. 集群角色 zookeeper集群下&#xff0c;有3种角色&#xff0c;分别是领导者(Leader)、跟随着(Follower)、观察者(Observer)。接下来我们分别看一下这三种角色的作用。 领导者(Leader)&#xff1a; 事务请求&#xff08;写操作&#xff09;的唯一调度者和处理者&#xff0c;保…

【C语言】一篇文章深入解析联合体和枚举且和结构体的区别

文章目录 &#x1f4dd;前言&#x1f320; 联合体类型的声明&#x1f309;联合体的特点 &#x1f320;相同成员的结构体和联合体对⽐&#x1f309;联合体⼤⼩的计算 &#x1f320;联合体应用&#x1f309;枚举类型的声明 &#x1f320;枚举类型的优点&#x1f309; 枚举类型的使…

MacBook查看本机IP

嘚吧嘚 其实这也不是什么困难的问题&#xff0c;但是今年刚刚入坑Mac&#xff0c;外加用的频率不是很高&#xff0c;每次使用的时候都查&#xff0c;用完就忘&#xff0c;下次用的时候再查&#x1f92e;。真的把自己恶心坏了&#x1f648;。 所以写篇文章记录一下&#x1f92…

软件设计师——软件工程(三)

&#x1f4d1;前言 本文主要是【软件工程】——软件设计师——软件工程的文章&#xff0c;如果有什么需要改进的地方还请大佬指出⛺️ &#x1f3ac;作者简介&#xff1a;大家好&#xff0c;我是听风与他&#x1f947; ☁️博客首页&#xff1a;CSDN主页听风与他 &#x1f304…

Rust开发⼲货集(1)--迭代器与消费器

本内容是对 Rust开发干货集[1] 的实践与扩展. iter() 不转移所有权 先简单解释下什么叫"转移所有权": 在 Rust 中&#xff0c;"转移所有权"&#xff08;Ownership Transfer&#xff09;是一种核心概念&#xff0c;它涉及变量和数据的所有权从一个实体转移…

基于AM62x的ARM+FPGA+Codesys低成本软PLC解决方案

GPMC并口简介 GPMC(General Purpose Memory Controller)是TI处理器特有的通用存储器控制器接口&#xff0c;支持8/16bit数据位宽&#xff0c;支持128MB访问空间&#xff0c;最高时钟速率133MHz。GPMC是AM62x、AM64x、AM437x、AM335x、AM57x等处理器专用于与外部存储器设备的接口…

2023年03月22日_腾讯2022年财报解读

文章目录 1 - 腾讯营收增长停滞2 - 腾讯游戏业务低迷3 - 小程序和视频号拉动广告增长4 - 腾讯云和金融科技表现不佳5 - 营销费用减半6 - 裁员但福利上涨 2023年03月22日 今天晚上呢 腾讯披露了2022年第四季度和全年的财报 看过之后呢不禁要说 腾讯在2022年真的是过得不容易啊…

【Java开发岗面试】八股文—操作系统

声明&#xff1a; 背景&#xff1a;本人为24届双非硕校招生&#xff0c;已经完整经历了一次秋招&#xff0c;拿到了三个offer。本专题旨在分享自己的一些Java开发岗面试经验&#xff08;主要是校招&#xff09;&#xff0c;包括我自己总结的八股文、算法、项目、HR面和面试技巧…

3D视觉-结构光测量-线结构光测量

概述 线结构光测量中&#xff0c;由激光器射出的激光光束透过柱面透镜扩束&#xff0c;再经过准直&#xff0c;产生一束片状光。这片光束像刀刃一样横切在待测物体表面&#xff0c;因此线结构光法又被成为光切法。线结构光测量常采用二维面阵 CCD 作为接受器件&#xff0c;因此…

【Web】vulhub-httpd apache解析漏洞复现(1)

目录 ①CVE-2017-15715 ②apache_parsing_vulnerability ①CVE-2017-15715 贴出源码&#xff1a; <?php if(isset($_FILES[file])) {$name basename($_POST[name]);$ext pathinfo($name,PATHINFO_EXTENSION);if(in_array($ext, [php, php3, php4, php5, phtml, pht]))…

python+django大自然环境保护宣传网站62r9b

本课题使用Python语言进行开发。基于web,代码层面的操作主要在PyCharm中进行&#xff0c;将系统所使用到的表以及数据存储到MySQL数据库中 本系统由后台管理子系统&#xff0c;登录子系统&#xff0c;按登陆角色及权限划分为管理员:个人中心&#xff0c;用户管理&#xff0c;文…

macos 打开终端提示 You have new mail. 去除方法

这个提示信息是macos里面的mail消息提示, 如果需要查看详细的信息可以在终端输入 mail 命令即可查看所有信息, 这些信息都保存在 /private/var/mail/xxx 文件中 xxx 是你的macos的登录用户名, 要去除这些提示,只需要删除这个文件即可 # 删除mail信息存储文件 sudo rm -rf /…

androidStudio 没有新建flutter工程的入口?

装了flutter dart 插件 执行了 flutter doctor 也执行了 flutter doctor --android-license 最后重启了 androidStudio 还是没发现在哪新建flutter项目工程 原来 plugins 下的 Android APK Support没有勾选

Apache-ActiveMQ 反序列化漏洞(CVE-2015-5254)复现

CVE-2016-3088 一、环境搭建 Java:jdk8 影响版本 Apache ActiveMQ < 5.13.0 二、用docker搭建漏洞环境 访问一下web界面 然后进入admin目录登录 账号:admin 密码:admin 三、工具准备 cd /opt wget https://github.com/matthiaskaiser/jmet/releases/download/0.1.0/jmet-0…

大模型推理部署:LLM 七种推理服务框架总结

自从ChatGPT发布以来&#xff0c;国内外的开源大模型如雨后春笋般成长&#xff0c;但是对于很多企业和个人从头训练预训练模型不太现实&#xff0c;即使微调开源大模型也捉襟见肘&#xff0c;那么直接部署这些开源大模型服务于企业业务将会有很大的前景。 本文将介绍七中主流的…

计算机网络【EPoll原理】

预备知识&#xff1a;内核poll钩子原理 内核函数poll_wait 把当前进程加入到驱动里自定义的等待队列上 &#xff1b; 当驱动事件就绪后&#xff0c;就可以在驱动里自定义的等待队列上唤醒调用poll的进程&#xff1b; 故poll_wait作用&#xff1a;可以让驱动知道事件就绪的时…

CSS之元素转换

我想大家在写代码时有一个疑问&#xff0c;块级元素可以转换成其他元素吗&#xff1f; 让我为大家介绍一下元素转换 1.display:block(转换成块元素) display&#xff1a;block可以把我们的行内元素或者行内块元素转换成块元素 接下来让我为大家演示一下&#xff1a; <!DO…

Tomcat与Servlet是什么关系

Tomcat与Servlet是什么关系 Apache Tomcat和Servlet之间存在密切的关系&#xff0c;可以说它们是一对密切合作的组件。下面是它们的关系&#xff1a; Tomcat是Servlet容器&#xff1a; Tomcat是一个开源的、轻量级的Servlet容器。Servlet容器是一个Web服务器扩展&#xff0c;用…

<JavaEE> 协议格式 -- 应用层协议 HTTP

目录 一、HTTP的概念 1&#xff09;什么是HTTP协议&#xff1f; 2&#xff09;什么是超文本&#xff1f; 二、HTTP协议格式 三、请求&#xff08;request&#xff09; 1&#xff09; 方法&#xff08;Method&#xff09; 1> GET方法 2> POST方法 3> GET和POS…

sklearn学习的一个例子用pycharm jupyter

环境 运行在jupyter 进行开发。即一个WEB端的开发工具。能适时显示开发的输出。后缀用的是ipynb.pycharm也可以支持。但也要提示按装jupyter. 或直接用andcoda 这里我们用pycharm进行项目创建 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jupyterlab pip ins…