《摄影与摄像》杂志社

黄鹂智声：用AI技术告别噪音对通讯的影响

2025-08-19

编辑 | 杨娇文 | 王猛

环境噪声问题严重影响通信质量

随着科技的进步，互联网和5G通讯技术的发展，人们在日常生活和工作中的交流沟通越来越频繁，但是在我们日常的工作和生活中噪音却无处不在：当我们外出在高铁、机场、地铁等嘈杂环境接打电话的时候，经常因为我们周围巨大的噪音让和我们通话的人在他的手机里听不清我说什么；当我们外出时，接到通知需要临时开一个重要的电话会议，却找不到安静的地方，也来不及赶回公司会议室开会，噪音导致电话会议效果很差；当我们在家接打电话或者在线开会的时候，需要家人都静音，会影响家人的正常生活……

毫不夸张地说，噪音严重影响了我们在日常生活和工作中通讯交流的效果和效率，让很多人都苦不堪言。尤其疫情那几年，很多人很多时候都是居家办公，接打电话、在线开会被家里各种噪音严重干扰。

疫情后在线会议、在线学习、在线直播都成了主流，可是这些在线活动同样也面临着噪音带来各种困扰，尤其是在旅途和公共空间时，根本找不到安静的地方接打电话或者在线开会。

噪音的痛点一直困扰着我们，过往业界拾音降噪处理的技术主要是靠各种精密的滤波器组和麦克风阵列进行物理压制，降噪的效果非常不好，只能降一部分噪，但不能实现灭噪，噪音或多或少依然会存在，因为单纯靠物理手段是无法完全把声波压没的，并且噪音被压到一定程度后就再也压不下去了，压得过狠还会造成主声音的严重变形和失真，甚至损失部分频段的声音。

所以过去几十年时间该技术在全球范围一直没有取得大的突破，业界仿佛都默认了拾音降噪也就只能是这样了，由于效果不好，所以很多相关技术企业也不把研发的重心放在这个领域，相关音频设备产品厂商也不开发相关产品，于是导致很多用户就只能用最原始的办法消灭噪音，在办公空间里建设了大量静音室、直播间、会议室、隔音挡板等隔音设施，花费巨大，浪费了很多的人力和物力。但是在户外和公共空间就彻底没办法了，只能忍受噪音带来的困扰。

AI语音建模技术带来创新型突破

这些年随着AI技术的快速兴起，尤其是AI语音建模技术和深度学习技术的发展，让拾音降噪出现了一丝曙光，但是AI语音建模也有局限性，很多AI语音模型都是大模型，算力要求高，必须借助云计算，但是语音通讯有一个特殊要求，就是不能随便上传到云上，如果我说的每句话都被传到云端做处理，安全性和隐私性会有大问题，会让我们很担忧，并且传输过程的延时也是大问题，再有算力的成本问题也很大，所以语音建模最好还是在设备的本地实现，这就要求语音大模型要小型化和低算力，实现在终端设备的普通芯片上进行语音建模。

但是大模型小型化的难度很大，怎样的算法程序才能让小模型具有大模型的效果呢？这需要用百万种级别的各种声源长时间训练模型，不断测试精简优化算法，才能做到用小模型低算力快速准确地建好各种声音的模型。

其实，早在十几年前，就有一支来自清华大学电子工程系的技术团队开始关注此领域，在全球率先开始尝试进行此项技术的研发。技术团队的领军人刘志：清华大学电子系工学硕士，高级工程师，中国计算机学会语音对话与听觉专委会委员，中国互联网协会智慧教育专委；技术团队核心成员董明：清华大学电子系工学博士，高级工程师，北京市科技新星，智能声音信号处理领域专家，北京市科技进步奖获得者，中国教育学会智能语言教学研究中心研究员；技术团队核心成员周玉军：清华大学电子系工学学士，高级工程师，大数据科技传播奖获得者，拥有数十项专利和软著。

经过团队近十年的专注研发测试，该团队成功的将人工智能技术（声音建模，声场预判，深度学习）和传统的物理降噪技术（麦克风阵列和滤波器组）相结合，在业界率先做到能够迅速地识别主声音和噪音，并迅速地对主声音和噪音进行AI建模，再通过模型比对让主声音传出去，让噪音被留下，并且是用小模型在本地设备的小算力芯片上实现，成功地实现了拾音灭噪的效果。

据了解，声音建模、声场预判和深度学习是人工智能在音频处理中的关键技术。声音建模通过分析和模拟声音的物理特性，可以精确地识别和再现声音。声场预判则利用算法预测声音在空间中的传播路径，从而优化声音的定位和清晰度。深度学习则通过大量的数据训练，使机器能够自主学习和识别复杂的声音模式。

传统的物理降噪技术，如麦克风阵列和滤波器组，通过物理手段来减少噪音的干扰。麦克风阵列通过多个麦克风的协同工作，可以有效地捕捉到目标声音，同时抑制背景噪音。滤波器组则通过特定的算法，对声音信号进行处理，以消除不需要的频率成分。

该团队的创新之处在于，他们不仅将这两种技术相结合，而且还在本地设备的小算力芯片上实现了这一过程。这意味着，无需依赖强大的服务器或云计算资源，用户就可以享受到高质量的降噪效果。这种技术的实现，得益于团队在算法优化和芯片设计上的突破。

通过AI建模能够迅速地识别主声音和噪音，并对其进行建模。然后，通过模型比对，系统能够智能地区分出主声音和噪音，让主声音清晰地传出去，而将噪音有效地抑制。这种拾音灭噪的效果，不仅提高了通话的清晰度，也极大地提升了音乐和视频的听觉体验。这项技术的突破，对音频处理行业产生了深远的影响。

该项技术目前在全世界范围都属于领先水平，并且陆续获得了中国数博会黑科技奖、全国人工智能创新大赛一等奖等一系列奖项，受到业界的广泛关注和赞誉，成为中国国产自主可控技术领域为数不多的全球领先技术。

随着AIOT时代的到来，除了传统音频设备（耳机，对讲机，座麦，手机，电脑等），各种带人机语音交互功能的智能设备（智能音箱，智能眼镜，语音翻译转写设备，语音机器人，智能座舱，智能家居等）层出不穷，高速增长，但所有的语音类智能设备目前都面临一个很大的困扰，那就是噪音，噪音无处不在，在人机交互式时会因为周围环境噪音让智能设备听不清听不准，严重影响了交互的效果和效率，清晰的语音拾取，过滤掉环境噪音，就是所有人机语音交互的基础和前提。这项拾音灭噪技术算法因为可以移植到小算力芯片上，所以能够相对比较容易地能被用到相关智能语音设备上，实现精准拾音，过滤噪音的功能，并且体积和成本都不大，据有广泛的技术应用前景。

黄鹂智声P200b耳机开启降噪新境界

这些年随着AI技术的快速兴起，尤其是AI语音建模技术和深度学习技术的发展，让拾音降噪出现了一丝曙光，但是AI语音建模也有局限性，很多AI语音模型都是大模型，算力要求高，必须借助云计算，但是语音通讯有一个特殊要求，就是不能随便上传到云上，如果我说的每句话都被传到云端做处黄鹂智声P200b耳机开启降噪新境界。

好的技术也需要好的产品来承载，才能把技术效果发挥到最大，才能实现科技成果的有效转化，真正体现出技术的价值，造福于人类。

秉着用声音智能改善人类生活和品质的使命，该清华技术团队在申请了相关技术专利后，于2019年开始了自己的技术创业之旅，成立了深圳黄鹂智能科技有限公司，力求用AI拾音灭噪黑科技赋能传统硬件产品，提高国货的科技水品和竞争力，帮助中国制造向中国智造转型。

公司于2020年推出了全球首款带麦克风通话灭噪功能的黄鹂智声耳机，可以让耳机使用者在不管多么嘈杂的环境中都能安心通话或安静在线开会，不用去专门的会议室或到处找安静地方，随时随地给耳机使用者虚拟一个静音室，把耳机使用者周围的环境噪音通过耳机过滤掉，只让耳机使用者自己的声音传递出去，提高通话和会议的效果和效率。该耳机一经推出就受到商务人士的喜爱，成为通讯办公领域必备刚需工具，并且用户评价：“一旦用上就再也离不开了”。

2022年公司推出了第二代产品~黄鹂智声P200b耳挂式耳机，它以出色的降噪性能和持久的续航能力，成为了众多海外用户的青睐之选——在当年海外众筹平台一举获得音频会议类产品的年度全球第一，被全球80个国家和地区的科技产品发烧友购买。黄鹂智声耳机借此机会成功出海，陆续拓展了欧美日韩亚太等海外市场，让很多海外用户对来自中国的黑科技产品刮目相看。

测评显示，黄鹂智声P200b 耳挂式耳机，以其高达50dB的降噪幅度，为人们创造了一个几乎隔绝外界噪音的通话环境。这意味着，无论是在嘈杂的地铁站，还是人声鼎沸的商场，你的通话都将清晰无阻，仿佛身处一个安静的私人空间。

在多任务处理的今天，我们经常需要在手机和电脑之间切换。黄鹂智声P200b支持蓝牙一拖二功能，可以同时连接两个设备，无缝切换，无需频繁断开和重新连接。此外，独立的静音按键设计，让人们在需要时能够迅速静音，避免尴尬的噪音干扰。

对于耳机来说，续航能力同样重要。黄鹂智声P200b提供了长达10小时的通话时间和16小时的音乐播放时间，无论是长途旅行，还是长时间的工作，都能享受到不间断的音乐和通话体验。而且，它还支持快速充电，短暂休息时的充电，就能提供数小时的使用时间。

16mm动圈带来的高品质音效，是黄鹂智声P200b的另一个亮点。它不仅提供了清晰的人声，更有着丰富的低音表现，让人们在欣赏音乐时，能够体验到更加细腻和震撼的音质。无论是流行音乐的动感，还是古典音乐的细腻，P200b都能满足需求。

耳机的舒适度同样不容忽视。黄鹂智声P200b采用了符合人体工学的轻便耳挂设计，柔软透气的材料，让人即使长时间佩戴，也不会感到不适。头梁杆的弹性材质和可调节的设计，更是考虑到了不同用户的需求，让每个人都能找到最舒适的佩戴方式。

可以说，黄鹂智声P200b耳挂式耳机不仅在技术上有着显著的优势，更在用户体验上做到了极致的考虑。

凭借全球领先的灭噪级通话技术的产品创新性，以及在产品外观、功能、人性化等方面的优异表现，黄鹂智声P200b灭噪级通话耳机一举拿下世界三大设计奖之一的德国红点奖。黄鹂智声团队的这一创新，不仅是技术上的一次飞跃，更是对人类听觉体验的一次革命。我们期待着这项技术能够被广泛应用于更多的领域，为人们的生活带来更多的便利和享受。

未来中国将要大力发展新质生产力，中国制造要向中国智造转变，优质创新是新质生产力的核心，科技赋能是实现新质生产力的关键基础，黄鹂智声将积极响应国家的号召，将领先的AI灭噪黑科技输出给有此需要的用户，共建音频产业生态，帮助相关音频通讯类产品厂商提升在语音处理端的效果和效率，共同提高中国产品的科技附加值。

自由容器