SANSUI的博客

系统外观
© Sansui 2026
All rights reserved
Sansui的博客
人活着就是为了卡卡西

iPhone 视频拍摄后期音频的基本处理

2026年1月25日
阅读评论

此文为草稿,未写完

最近因为有人结婚又出去在街上拍了点祝福视频。对于只有一个 iPhone 走天下的人,其实把视频中的音频质量处理到能听不是一个特别容易的事。对于刚需现场实时收音的情况,前期工作最好是

  • 尽量在安静的室内,别在大街上
  • 如果在有车的大街上,刚需外置能降噪的麦克风

即便是能找到合适的室内地点,iPhone 收音的音频依然会面临

  • iPhone 自带底噪、空气底噪
  • 房间混响,带耳机听感很差
  • 距离带来音量小、声音糊。此时再加上第一点的底噪,音频质量只能说绝了

所以 iPhone 现场收音的视频,做音频的后期主要目的是变得内容能被清晰听见

你有可能会看到过做实录的素人 UP 出现视频说话声音小的问题,这应该算是没处理音频的常态。剪映对于这两点有专门的选项: 音频降噪人声增强 。在我还是尊贵的 SVIP 时用过,感觉是对于日常说话场景够用了。但恰好之前我处理音频的目标都不只是说话,而这次我又实在不想为了这么十秒钟的结婚祝福去开个几十块的会员(但是可以为了十秒学习一圈软件),所以介绍一下用 Davinci、MSST 的处理方法。

工具

  • Davinci:视频剪辑软件,配有一套 Fairlight 音频工具。

  • MSST-GUI:开源的 AI 音频降噪模型管理工具,本地部署(磁盘占用很大预警)。

  • RX8:音频修复工具(可选)。

有人可能会觉得为了 10 秒视频下这三种都算专业级的东西也有点不值得,而且上手需要些时间。其实说得对,不想折腾还是去开个剪映会员比较好。

仅仅对于我,这些软件是常备的,总是会时不时用一下。如果不是剪映特效库省事是我真的不想用一个特效会内存泄露用着用着把整个电脑卡爆的软件

视频色彩处理

现在 iPhone 拍的视频带有 HDR(高保真色彩),这类视频对播放器和显示器都有要求。前几年有的平台对 HDR 视频支持不太好,potplayer 这类播放器不特意设置也对 HDR 支持不好。直到现在我也会转成 SDR 以避免出现奇怪的色彩。

达芬奇不会自动给你处理视频色彩,直接拖 iPhone 拍摄的视频进去必然是颜色发灰。需要自己映射色彩空间。

【图 映射前后】

  1. 确认 **文件→项目设置→色彩管理,**时间线色彩空间为 Rec 709 Scene
  2. 调色工作区,右上角特效库(旧版叫 open fx),搜索 色彩空间转换
    1. 输入色彩空间选择 Rec.2100 或者 Rec.2020 两者没有什么区别,本质是同一个东西
    2. 输出色彩空间 选择 Rec.709
    3. 如果输入伽马选择 ARIB STD-B67 HLG,对应输出伽马选择 Rec.709
    4. **色调映射方式:**DaVinci(默认是)下面的 适配 默认是9 可以根据需要改变数值来影响画面亮度,通常保持不动。如果画面偏亮或者偏暗可以进行调整。
    5. 色域映射方式,默认无。如有过饱和现象,选择饱和度压缩

参考:

音频处理

iPhone 录音的通常情况是

  • 底噪大

  • 波形不“健康”,声音小,但调大了又感觉爆音

降噪

针对底噪大,如果是实时收音,dxrevive pro 是我用过最好的降噪插件。可以插到达芬奇的 Fairlight 调音台使用。

【图】

但对于我的拍摄情况,依然不够看。dxrevive pro 只适用于环境安静、人声比较大显清晰的情况下去噪,当噪声过大时人声部分还是失真严重。一般做视频都属于音频后处理了,此时用更现代的 MSST AI 降噪模型会好非常多。

响度归一化

不健康的音频波形,指主要音频内容音量小,但少部分时候音量突然很大。

【图】

这本来不算太大的问题,只是总体听着响度比较小。但近几十年的响度战争发展,响就是大,响就是好。个人视频也要足够的响度。iPhone 拍摄后的响度达不到目前的“正常”水平。

抖音上传的视频会粗暴地直接增加音量,很少出现不够响的问题,代价是又吵又爆音。这肯定不是一个理想的做法。

我们能做的是把波形音量做均匀,这样能在不爆音的前提下,让整个音频听起来更“响”。

达芬奇 fairlight 工作区提供了响度归一化的功能,选 Youtube 的配置,其实已经很大声了。

但我实测下来,达芬奇内置的响度归一化不如 RX8 的效果好(激进)。在极其不健康的音频波形下,设置为 -14LUFS,归一化后的响度依然只有 -20LUFS,依然“不够响”。如果有可能,我更建议使用 RX8 中的 Loudness Control 来进行响度归一化。

如果你觉得波形尖角较多,此时可以再挂一个压缩器。在输出总线上其实总是应该挂一个压缩器,以免上传后因为平台关系爆音(如抖音)。

EQ

即便上述步骤处理完,还是会觉得声音是“不清晰”的。即便把音量拉大,声音不清晰的听感依然会存在。因为在拍摄距离较远的情况下,声音的高频会被削弱,此时加强人声高频,削弱中频就可以了。

【图】

另外在室内录音通常有房混。房混是一个后期几乎无法处理的情况,MSST 模型中有针对混响去除的模型,但是对于实录的房混几乎没有效果,只对混音出的“完美混响”有效果。而且,如果你想要视频看起来真实,其实是不需要对房混做处理的,降噪完已经足够了。

频谱修复

此部分需要 RX8

有的时候你视频可能会有各种“爆破音”干扰频谱,导致“最大声”的瞬间是噪音,无论怎么归一化都很明显。比如 iPhone 手机放下的声音。

当然你可以选择静音此部分。但是对于一个实录视频,本该有声音的地方变得完全没有声音也是一个很奇怪的事情。

你也可以选择把此刻的音量变小,但是代价是所有声音都变小,包括本不该变小的环境音,这样听感是声音勿大勿小。

频谱修复,则是可以只变小”爆破音“,而尽量维持环境音。

使用方式就像美颜相机去痘痘一下,选中噪音频谱的部分执行频谱修复。

更新于 2026-01-25
Waline