V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  829939  ›  全部回复第 5 页 / 共 6 页
回复总数  117
1  2  3  4  5  6  
我就试试
![test]( https://imgur.com/Pth1NCy.jpg)
@governcoco

降噪的方法有很多,传统数字信号领域有很多方式,
1. 最简单的一种方式是高通滤波器,你讲课的语音估计低频白噪占一部分,最好再加上 weight-A 计权,有助于提升语音降噪后的质量,当然在不同场景下噪声分布情况,可选择成熟的自适应滤波器也有很多如维纳滤波、卡尔曼等等;
2. 谱减法,这种方法需要估算下噪声的功率谱情况,频域上直接操作,某些场景下效果要好很多;
3. 深度学习相关,这种方式目前发的 paper 不少,语音增强和去噪方面取得了显著的进展,用常见 CNN 或 LSTM 等其他常用网络模型训练,需要对大量数据打标或生成相关场景下不同样本增强数据

大概这么多,希望对你有帮助
@airqj
1. 支持的功能比 pyAudioAnalysis 要多一些,支持数十种时频分析变换方法和数百种对应的时域、频域特征组合。
2. 性能高效,核心大部分 C 实现,基于不同平台 FFT 硬件加速,方便大规模数据特征提取。
3. 跨平台,支持移动端音频流实时计算,release 的时候已发布 android ,iOS 平台相关 so 库
@ppxiale 感谢
1. 支持的功能比 pyAudioAnalysis 要多一些,支持数十种时频分析变换方法和数百种对应的时域、频域特征组合。
2. 性能高效,核心大部分 C 实现,基于不同平台 FFT 硬件加速,方便大规模数据特征提取。
3. 跨平台,支持移动端音频流实时计算,release 的时候已发布 android ,iOS 平台相关 so 库
@zhengwu119 我这边真的没有什么经验,能上估计全靠运气。
@fanjk 大佬分析的非常有道理,GPT-4 已支持插件系统,预示着又一个“苹果商店”生态即将崛起,将对各行业都会产生深远影响,这里面机会非常多.
@collinmehle 是的,marktechpost 挺专业的,不少项目都有 github 开源,是学习找项目的好地方。
@arrhenius 666 感谢老铁
@xbcslzy 应该是,这个网站过来的量占大部分
@Lirika 英语一般,做研发查资料、写论文用的多些,习惯就好
@xbcslzy 国内高校优质项目不少,我这个估计应该排不上。
2023-03-24 15:47:15 +08:00
回复了 intelmd 创建的主题 Android Clash For Android 如何临时添加单个域名
clash for Windows 上用 Mixin 实现。android 没用过不知道
2023-03-20 14:42:13 +08:00
回复了 829939 创建的主题 分享创造 audioFlux - 一个系统的音频特征提取库,可用于深度学习
@lbingl

librosa ,目前业界内常用的库,其过程命令式的接口实现设计,方便易用、易理解的同时,也加剧了其性能短板,大规模数据跑起来特别慢。

audioFlux ,音频特征较为全面,支持移动端,提供尽可能细粒度、体系化的特征维度和组合。算法使用 C 实现,性能要比 librosa 快很多。适合大规模特征提取。
2023-03-20 14:14:19 +08:00
回复了 829939 创建的主题 分享创造 audioFlux - 一个系统的音频特征提取库,可用于深度学习
@CMLab 是用 pip 安装的吗? 之前编译时漏了 macOS arm 的支持,这两天会发布更新版本。
或者先使用源码自行编译可以支持 M1 芯片。
2023-03-20 14:12:31 +08:00
回复了 829939 创建的主题 分享创造 audioFlux - 一个系统的音频特征提取库,可用于深度学习
@xieren58 感谢老铁
2023-03-20 11:52:04 +08:00
回复了 829939 创建的主题 分享创造 audioFlux - 一个系统的音频特征提取库,可用于深度学习
@CMLab 你好,有音高估算的 demo 。


```
import numpy as np
import audioflux as af
from audioflux.type import PitchType

import matplotlib.pyplot as plt
from audioflux.display import fill_wave

# Read audio data and sample rate
audio_arr, sr = af.read(af.utils.sample_path('voice'))

obj = af.Pitch(pitch_type=PitchType.YIN)

fre_arr, value_arr1, value_arr2 = obj.pitch(audio_arr)
fre_arr[fre_arr < 1] = np.nan

# Display
fig, ax = plt.subplots(nrows=2, figsize=(8, 6), sharex=True)
times = np.arange(0, len(fre_arr)) * (obj.slide_length / obj.samplate)

fill_wave(audio_arr, samplate=sr, axes=ax[0])

ax[1].xaxis.set_label_text("Time(s)")
ax[1].yaxis.set_label_text("Frequency(Hz)")
ax[1].plot(times, fre_arr, label='fre', linewidth=3)
# set real plot
real_fre_arr = np.zeros_like(fre_arr)
real_fre_arr[25:48] = 261.6
real_fre_arr[56:78] = 293.7
real_fre_arr[87:107] = 329.6
real_fre_arr[118:135] = 349.2
real_fre_arr[150:169] = 392.0
real_fre_arr[179:200] = 440.0
real_fre_arr[212:243] = 493.9
real_fre_arr[real_fre_arr == 0] = np.nan
ax[1].plot(times, real_fre_arr, color='red', label='fre', linewidth=2)

plt.show()
```

![pitch]( https://raw.githubusercontent.com/libAudioFlux/audioFlux/master/image/demos/demo_pitch.png)
2022-04-20 17:00:25 +08:00
回复了 Pogbag 创建的主题 分享发现 北京联通免费领取 2 个月千兆提速包
没有
2019-07-10 11:53:57 +08:00
回复了 ntop 创建的主题 前端开发 开源一个社区小程序的代码
可惜后端不开源 并且还要收费使用。。
2019-07-08 23:11:04 +08:00
回复了 ntop 创建的主题 前端开发 开源一个社区小程序的代码
支持开源小程序
2019-07-04 11:42:21 +08:00
回复了 Doraemontree 创建的主题 问与答 各位用的都是什么鼠标
没有人用 Magic Mouse ?
1  2  3  4  5  6  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5797 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 02:30 · PVG 10:30 · LAX 18:30 · JFK 21:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.