当前位置: 首页 > news >正文

语音识别质量的跟踪

背景

这个项目是用来生成结构化的电子病历的。数据的来源是医生的录音。中间有一大堆的处理,语音识别,关键字匹配,结构化处理,病历编辑......。最多的时候给上百家医院服务。

语音识别质量的跟踪

一、0225医院的训练后的情况分析:

通过0225医院的20278、46248、47146、47160、27823、47830、47879、48824、48837、48848医生的统计,发现这批医生在训练之后识别的质量有提升。具体如下:

通过曲线可以看出,在人工训练之后(图中的竖线右边的部分),Score有所提高,平均提高50分左右。

通过曲线可以看出,在训练之后(图中的竖线右边的部分),识别引擎在识别过程中耗费的时间大大降低了。识别时间的降低,可以减少报告的识别超时从而降低BlankCDA的报告数,同时也能减轻识别服务器的压力。所以,识别时间的降低对整个系统有着积极的意义。

二、其他医院的训练分析:

其他医院训练的时间比较早,当时的日志记录中还没有SR_Score的记录。需要等下次训练后,才可以进行识别质量分析。

三、当前识别质量统计:

       就目前的统计数据来看,在800分(满分为1000分)以下或识别时长超过4倍的医生还有一些,但是比例不是很大。具体如下:

      

      

       就统计结果来看,Score低于800的大约占1.27%

      

就统计结果来看,识别时间大于4的大约占5.07%

四、识别分数低于800或识别时长超过4的医生的列表:

    共计46人,详见下表。

HOSP_CODE

DOCTOR

AVG_SR_SCORE

PROCESSTIME/DICTLEN

0011

561

813

5.13

0013

0402

828

4.80

0013

2213

819

4.04

0013

3032

861

4.05

0013

3170

805

5.66

0013

3268

795

4.37

0014

0004

742

6.41

0014

0824

751

5.56

0014

4401

816

4.85

0014

77807

831

4.30

0014

9596

860

4.64

0015

80000

835

4.33

0015

98400

821

5.14

0016

1512

784

5.56

0016

1710

805

4.91

0016

2087

831

4.68

0016

2156

855

4.18

0016

2176

697

3.17

0016

2462

860

4.03

0016

3274

787

4.27

0016

3323

852

4.14

0016

4367

860

4.02

0016

559

857

4.02

0066

0430

813

4.96

0066

2259

828

4.21

0066

2485

771

5.46

0066

2742

807

4.91

0066

2832

807

5.50

0066

3031

820

4.37

0066

3131

832

4.54

0066

4196

571

5.35

0066

5222

849

4.45

0066

5853

782

4.74

0066

6910

875

4.54

0088

366

827

4.23

0223

17355

858

4.09

0223

42648

807

4.86

0223

7790

815

5.16

0225

14383

809

4.17

0225

40922

836

4.44

0225

42145

812

4.46

0225

43724

621

3.37

0225

45217

816

4.32

0225

46268

793

4.74

0225

47823

827

4.29

0225

48848

865

4.22

对于特定医生的语音识别质量跟踪

5853医生的识别质量变化曲线:

6910医生的识别质量变化曲线:

5018医生的识别质量变化曲线:

1375医生的识别质量变化曲线:


 

http://www.xdnf.cn/news/176653.html

相关文章:

  • 力扣HOT100之链表:23. 合并 K 个升序链表
  • 树状数组单点操作+前缀K差分->区间K操作 -#131-#132
  • SpringBoot + SSE 实时异步流式推送
  • Linux内核中的编译时安全防护:以网络协议栈控制块校验为例
  • mAh 与 Wh:电量单位的深度解析
  • 【Pandas】pandas DataFrame rtruediv
  • 全网直播推介会,九识智能与申通快递达成全面战略合作
  • 20.压敏电阻的特性与使用注意事项
  • RuoYi-Vue项目Docker镜像构建、推送与部署完整流程
  • 云平台+MQTT+C#上位机+单片机通信
  • 在 UniApp 中实现 App 与 H5 页面的跳转及通信
  • lightrag : from lightrag.utils import EmbeddingFunc 报错
  • 04.通过OpenAPI-Swagger规范让Dify玩转Agent
  • 【Redis】set类型
  • JavaEE-多线程实战02
  • AI如何重塑CC防护行业?五大变革与实战策略解析
  • 【创新实训个人博客】multi-agent调研(2)
  • promis(resolve,reject)入门级别
  • 互联网大厂Java面试:从Spring Boot到微服务架构的实践与挑战
  • 智诚科技苏州SOLIDWORKS授权代理商的卓越之选
  • vite.config.ts 的详细配置项说明、完整代码示例及表格总结
  • 代码随想录算法训练营day12(二叉树)
  • javaScript--数据结构和算法
  • 轮转数组(中等)
  • 如何优雅地解决AI生成内容粘贴到Word排版混乱的问题?
  • 从“世界工厂”到“智造之都”:双运放如何改写东莞产业基因?
  • JavaScript 中 undefined 和 not defined 的区别
  • Dev控件RadioGroup 如何设置一排有N个显示或分为几行
  • 使用cesium设置第一视角
  • 第2讲、Tensor高级操作与自动求导详解