对特定图像进行识别,最关键的是要有识别对象的特征文件。OpenCV已经内置了人脸识别特征文件,我们只要使用OpenCV的CascadeClassifier类即可进行识别。 语法: https://github.com/opencv/opencv.git 在这里可以下载特征文件,在data目录下 识别对象变量 = cv2.CascadeClassifier(特征文件)、、 识别对象 识别结果变量 = 识别对象变量.detectMultiScale(图片,参数1,参数2,。。。) 参数有: 1、scaleFactor: 其原理是系统会以不同的区块大小对图片进行扫描,在进行特征对比。此参数用户设置区块的改变倍数,如无特别需求,一般设置为1.1 2、minNeighbors 此为控制误检率参数,默认值为3 3、minSize 设置最小的识别区块 4、maxSize 设置最大的识别区块 5、flags 此参数设置检测模式,可取值如下: cv2.CV_HAAR_SCALE_IMAGE 按比例检测 cv2.CV_HAAR_DO_CANNY_PRUNING 利用Canny 边缘检测器排除一些边缘很少或很多的图像区域 cv2.CV_HAAR_FIND_BIGGEST_OBJECT 只检测最大物体 cv2.CV_HAAR_DO_ROUGH_SEARCH 只做初步检测 face = faceCascade.detectMultiScale(image,scakeFactor=1.1,minSize=(10,10),minNeighbors=5,flags = cv2.CASCADE_SCALE_IMAGE) detectMultiScale 方法可以识别多个面部,返回值是一个列表 for (x,y,w,h) in face: x,y 表示面部区域的左上角x,y坐标;w,h表示面部区域的宽度和高度
- python20
- code16
- dev7
- docker6
- 想法4
- learn3
- env3
- AI2
- server2
- windows2
- 镜像2
- document2
- spider2
- others2
- git1
- doc1
- samba1
- 搞钱1
- pm21
- tools1
- github1
- 生活1
- idea1
- database1
- 数据库1
- 素材1
- �˹�����1
- 人工智能1
...大约 2 分钟
"""
conda create -n audio python=3.7
conda activate audio
conda install -y -c conda-forge sox libsndfile bzip2
pip install pytest-runner -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install paddlespeech -i https://pypi.tuna.tsinghua.edu.cn/simple
"""
import paddle
from paddlespeech.cli import TTSExecutor
tts_executor = TTSExecutor()
wav_file = tts_executor(
text='今天天气挺好的',
output='output.wav',
am='fastspeech2_csmsc',
am_config=None,
am_ckpt=None,
am_stat=None,
spk_id=0,
phones_dict=None,
tones_dict=None,
speaker_dict=None,
voc='pwgan_csmsc',
voc_config=None,
voc_ckpt=None,
voc_stat=None,
lang='zh',
device=paddle.get_device())
print('Wave file has been generated: {}'.format(wav_file))
...小于 1 分钟