创新互联AI教程：AI人工智能语音特征提取

这是构建语音识别器的最重要步骤，因为在将语音信号转换为频域后，我们必须将其转换为可用的特征向量形式。可以为此使用不同的特征提取技术，如 MFCC，PLP，PLP-RASTA 等。

创新互联是一家集网站建设,赤峰企业网站建设,赤峰品牌网站建设,网站定制,赤峰网站建设报价,网络营销,网络优化,赤峰网站推广为一体的创新建站企业，帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿，时刻以成就客户成长自我，坚持不断学习、思考、沉淀、净化自己，让我们为更多的企业打造出实用型网站。

示例

在以下示例中，我们将使用 MFCC 技术逐步使用 Python 从信号中提取特征。

导入必要的软件包，如下所示 -

import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
from python_speech_features import mfcc, logfbank

现在，读取存储的音频文件。它会返回两个值 - 采样频率和音频信号。提供存储音频文件的路径。

frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")

请注意，在此首先抽取15000个样本进行分析。

audio_signal = audio_signal[:15000]

使用 MFCC 技术并执行以下命令来提取 MFCC 特征 -

features_mfcc = mfcc(audio_signal, frequency_sampling)
Python

现在，打印 MFCC 参数，如下所示 -

print('\nMFCC:\nNumber of windows =', features_mfcc.shape[0])
print('Length of each feature =', features_mfcc.shape[1])

使用下面给出的命令绘制并可视化 MFCC 特征 -

features_mfcc = features_mfcc.T
plt.matshow(features_mfcc)
plt.title('MFCC')

在这一步中，我们使用如下滤器组特征，提取过滤器组特征 -

filterbank_features = logfbank(audio_signal, frequency_sampling)

现在，打印过滤器组参数。

print('\nFilter bank:\nNumber of windows =', filterbank_features.shape[0])
print('Length of each feature =', filterbank_features.shape[1])

绘制并可视化过滤器组特征。

filterbank_features = filterbank_features.T
plt.matshow(filterbank_features)
plt.title('Filter bank')
plt.show()

根据上述步骤，您可以观察到以下输出:图1为 MFCC，图2为过滤器组。

文章题目：创新互联AI教程：AI人工智能语音特征提取
标题路径：http://www.shufengxianlan.com/qtweb/news11/497261.html

网站建设、网络推广公司-创新互联，是专注品牌与效果的网站制作，网络营销seo公司；服务项目有等

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容