我正在做一些音频预处理来训练ML模型。
数据集的所有音频文件是:
RIFF(little-endian)数据,WAVE音频,Microsoft PCM,16位,单声道16000 Hz。
我使用以下代码片段将数据集重新采样到8000 Hz:
samples, sample_rate = librosa.load(filename, sr = 16000)
samples = librosa.resample(samples, sample_rate, 8000)
字符串
然后我使用下面的代码片段来重塑新的样本:
第一个月
但由于某种原因,我一直得到以下错误:**ValueError:cannot reshape array of size 4000 into shape(1,8000,1)**但大小因文件而异,但总是小于8000 HZ(所需的采样率)。
我仔细检查了原始采样率,它是16000赫兹,我也试图加载文件的采样率为8000,但我没有运气。
1条答案
按热度按时间hgb9j2n61#
我认为你在采样率和样本数组的长度之间乱糟糟的。samples.reshape重塑数组,并取决于数组的长度,而不是采样率。我不知道你需要什么形状的确切,但下面的代码应该没有错误
字符串