Python3.7|Python3.7 + Yolo3实现识别语音播报功能

2021-12-25

一、利用Python调用系统win10的文字转语音首先下载需要用到的库：pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/
【Python3.7|Python3.7 + Yolo3实现识别语音播报功能】接下来直接上代码：

import win32com.client as win# SpVoice类是支持语音合成(TTS)的核心类。通过SpVoice对象调用TTS引擎，从而实现朗读功能speak = win.Dispatch("SAPI.SpVoice")# 完成将文本信息转换为语音并按照指定的参数进行朗读。# 该方法有Text和Flags两个参数，分别指定要朗读的文本和朗读方式（同步或异步等）。speak.Speak("come on")speak.Speak("你好")

最后运行代码，就会听到系统传出来的声音，读出了 come on 和你好。
二、开始使用Yolo识别，利用语音播报返回出来开始之前我们先得解析出来Yolo3的代码，从而获取到被识别出来的物体标签。
首先我们找到一个coco_classes.txt，发现里面有很多的英文单词，这些就是准备识别匹配的标签了。

Python3.7|Python3.7 + Yolo3实现识别语音播报功能

文章图片

然后我们在找到yolo.py，发现的我们的coco_classes.txt被传入进来了

Python3.7|Python3.7 + Yolo3实现识别语音播报功能

文章图片

关键的来了，我们通过Ctrl + F 搜索一下classes_path这个Key，发现这几行代码

Python3.7|Python3.7 + Yolo3实现识别语音播报功能

文章图片

这里就是读取了存放标签的那个文本，进行了处理，并且返回了名字。
最后找到这一行代码，此处代码就是一开始进行识别的时候，我们的控制台打印出来的代码。

Python3.7|Python3.7 + Yolo3实现识别语音播报功能

文章图片

运行代码的时候发现，打印的这个label，就是识别出的物体的标签了。
这个时候我们就可以将我们的语音播报的代码添加进行，把label传入进去，就会发现识别出来的物体就会通过语音返回。

Python3.7|Python3.7 + Yolo3实现识别语音播报功能

文章图片

Time~
到此这篇关于Python3.7 + Yolo3识别语音播报的文章就介绍到这了,更多相关Python识别语音内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

推荐阅读

上一篇：docker-compose安装yml文件配置方式

下一篇：浅析JS原始值和引用值问题