那些年我们玩的HIFI 篇一:常见无损音频格式详细介绍

在数码领域,只要和听觉相关的东西,出镜率最高的,永远是“HiFi”这个单词,唱片上标的是“HiFi”,播放器追求的是“HiFi”,耳机音响标榜的是“HiFi”,就连手机也开始“HiFi”起来,那么问题来了,什么是“HiFi”,HiFi是英语High-Fidelity的缩写,直译为“高保真”,其定义是:与原来的声音高度相似的重放声音。关于“HiFi”的东西太多太多,本系列文章将详细介绍“HiFi”领域的各种知识,本文先从常见无损音频格式说起,因为“HiFi”系统里很重要的一方面就是本文中所介绍的,俗称音源。音源不“HiFi”,前端再好,耳机再牛也是一场空。

首先申明:本文借鉴了很多资料,但绝不是照搬照抄,全部都是经过自己的整理,不喜勿喷。文章中还有很多不到之处,欢批评迎指正!求志同道合的网友一起探讨。另外,并不是所有人都是“金耳朵”,好多格式听不出来差别并不代表没有差别。

一、音频基础概念

1、声音:声音是由物体振动产生的声波。是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。最初发出振动(震动)的物体叫声源。声音以波的形式振动(震动)传播。声音是声波通过任何物质传播形成的运动。声音作为一种波,频率在20 Hz~20 kHz之间的声音是可以被人耳识别的。(百度百科)

声音信号数字化过程

2、采样频率:采样频率定义每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。通俗的讲采样频率是指计算机每秒钟采集多少个声音样本。自然界的声音是模拟信号,这种模拟信号被相关设备通过“采样”、“量化”后,以数字的方式存放在计算机中。根据传说中的奈奎斯特采样理论:只要采样频率不低于声音信号最高频率的两倍时,采样得到的数字信号就能高保真地记录、还原声音。既然人耳能听到音频信号频率大约在20Hz-20KHz之间,根据奈奎斯特采样理论,如果采样频率大于40KHz,那么得到的数字信号就可以高保真的记录模拟信号,就能“HiFi”了。

常见音频格式采样率

3、量化精度:样本大小是用每个声音样本的位数bit/s(即bit per sample,bps)表示的,它反映度量声音波形幅度的精度。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多;位数越少,声音的质量越低,需要的存储空间越少。

4、编码:编码是指用二进制数来表示每个采样的量化值。 如果量化是均匀的, 又采用自然二进制数表示, 这种编码方法就是脉冲编码调制(Pulse Code Modulation, PCM), 这是一种最简单、 最方便的编码方法。概念太抽象,如下图所示:

常见编码技术

二、无损音乐格式(无损压缩)与有损音乐格式(有损压缩)

1、无损压缩和有损压缩的定义与区别

谈无损格式和有损格式前,首先说下,相对自然界的声音,任何数字音频编码方案都是有损的,因为用什么方法都无法还原无法完全还原。能够达到最高保真水平的就是PCM编码(Pulse Code Modulation),CD中采用的就是这种编码格式。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。

简单来说,有损压缩就是为了获得更小的体积,删除一些不太重要的数据来压缩文件;无损压缩就是通过优化排列方式来达到压缩目的。有人这样举例子:有一篇文章,3000字,有损压缩就是删除1000个不太重要的词和句子,意思不变,无论如何已删除的都系都无法恢复;无损则是通过文章排版,优化篇幅,解压缩之后,还能获得完整的WAV数据,极其类似与我们经常使用的WinRAR。

2、有损音乐格式及优缺点分析,推荐512kbps的AAC文件

有损音乐格式主要有:MP3、WMA、AAC、OGG等等,这几种音乐格式不想多说,都是为了更小的体积对文件进行了不可恢复的压缩,看频谱就可以知道,类似于文件的上半部分都被切掉了。在这几种格式里,最好的就是AAC格式,比特率可以超过达到512kbps(用foobar2000转换),其次是320kbps的mp3,其他的就很次了。

320bps MP3的频谱

3、无损音乐格式:WAV、AIFF、FLAC、APE、ALAC、等等,其中最推荐AIFF,其次是FLAC,详细介绍及理由见下文

三、几种无损音乐格式 DSD、WAV、AIFF、FLAC、APE、ALAC 详细介绍及优缺点分析

首先说一下,WAV和AIFF本质上是一个东西,AIFF出来的还早点,两者只是封装工艺不同,WAV、AIFF是CD的数字记录,基本上是由CD转成数字形式所得到的文件;而APE、FLAC等是对WAV文件进行无损压缩后得到的,即再加工得到。所以,wav是无损音乐文件,而APE、FLAC等则是无损压缩音乐文件。WAV可以直接播放,APE、FIAC等其他压缩格式则需要经过解压(解码)还原成WAV才能播放。

这里有个问题提出来,想请大家一起探讨,我用的是F886+PHA-2组合,播放WAV、AIFF这种原生无损绝对比播放FLAC、ALAC这种需要还原的省电,声音上暂时还听不出有什么不同,但网上搜到有的大神金耳朵听得出区别。

1、WAV:WAV是微软研究出来的一种无损音乐格式,被Windows广泛应用,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几!

WAV的优点就是声音还原比较真实,相对于APE、FLAC、ALAC等经过压缩的格式来说,播放起来不用还原,功耗声音什么的都有进步。缺点主要有两个,第一是文件很大,相比APE、FLAC、ALAC大了差不多一倍,第二是我最不喜欢的,WAV不能完美写入标签和封面,虽然可以强制写入,但是换了播放器就什么都没了…对于我这种就要看标签和封面的强迫症患者很是痛苦….

2、AIFF:这是我主推的格式,也是我现在正在使用的格式。AIFF也是一种文件格式存储的数字音频(波形)的数据。本质上WAV和AIFF是一个东西,AIFF出来的还更早点,两者只是封装工艺不同,WAV是微软的,AIFF是苹果的,仅此而已。

主要推荐AIFF的原因有两个,第一,和WAV一样,声音还原比较真实,播放起来不用加压缩。第二是最重要的,AIFF可以方便快捷的添加标签、封面等信息,在任何播放设备上都可以通用,最关键的是可以通过MatriTunes软件配合itunes 批量添加AIFF文件的标签和封面,简直就是我这种强迫症患者的救星啊….具体操作方法见下文。

3、APE:APE是通过Monkeys Audio这个软件将WAV文件压缩后的产物,体积变小了很多,通过MonkeysAudio解压缩后得到的WAV文件和压缩前的WAV完全一致。

APE的优点就是文件格式小,出现早,开源,网络资源比较丰富,压缩比55%左右,标签、封面可以完美写入。缺点就是APE文件的容错性较差,和有损格式一样,存在爆音现象,没有多声道支持,没有增益。

4、FLAC:也是一种完全开放的无损压缩格式,也是我主推的格式,因为和APE相比,FLAC的编码和解码复杂程度要较低(解码运算量小、只需要整数运算),解码速度奇快,通常FLAC的解码速度比APE快30%,在消费领域,支持FLAC的的播放器也比更多,标签和封面也可以完美写入。

5、ALAC:即Apple lossless audiocodec的缩写,是苹果公司开发的一种无损音频格式,是对AIFF的压缩,类似于FLAC是对WAV的压缩一样,这里就不多说了,自然文件小,ALAC同AAC一样是MPEG-4封装,扩展名是m4a,至于ALAC解码速度快还是FLAC解码速度快,这就不得而知了….

6、DSD:是Direct Stream Digital的缩写,表示直接比特流数字编码,是SACD(SuperAudio CD)的编码模式,是Sony与Philips在1996年共同发展的,用1bit比特流的方式取样,采样率2.4MHz(CD 44.1kHz取样的64倍)的高取样方式。DSD的优缺点都很突出,相比WAV,音质确实好多了,当然,前提是你有能够硬解DSD文件的设备,缺点也是,文件太大太大,能硬解DSD的芯片还是少数。

综上所述,个人主推的还是AIFF和FLAC,两种格式都能精准的还原声音,都能完美的内嵌标签和封面信息,AIFF能满足一部分认为FLAC需要解码,功耗变大,声音有变化(俗称“玄学”)强迫症患者的需要,而FLAC相对来说,无论从体积还是音质上来说都很完美。DSD包含着巨大的信息量,听起来确实很好,但是资源太难找,至少我已经放弃了,有就听一听,没有也懒得去找了。

四、无损音乐格式的鉴别方法

无损音乐格式这么好,网上资源这么多,哪些是真的,哪些是假的呢,为什么优点ape文件听起来也就这样呢?这就得好好鉴别了,常见的鉴别方法有以下几种:

1、用耳朵听:好多人都会说,你这是猴子派来的逗比嘛,用耳朵听这不坑爹嘛,要我说对于大部分不是木耳的人来说,用耳朵听真是比较好的方法,当然,前提是你有这个耐心….

2、看频谱:推荐软件-spek 声学频谱分析器。无损音乐的频谱比较饱满,上下频段没有空域,最起码不是劣质音源转制的。 如下图:

真无损音乐的频谱 上下段没有空白

而假的无损最顶端肯定都是一刀切的,因为假无损大多数是由320kbps的mp3转来的,显示的光谱最高只能去到20000Hz,即使将MP3格式再转换为无损格式,光谱也是不会改变的,如下图:

mp3转为wav的假无损频谱

3、傻瓜式:用Loseless Audio Validation Helper(无损音乐验证助手)等等软件傻瓜式校验,如下图:

傻瓜式校验

五、无损音乐格式之间的相互转换(DSD除外)

无损音乐格式之间转换的软件很多,这里我只推荐一个最实用的–foobar2000,这也是整个音频播放领域最强大的软件,没有之一。操作也很简单,打开foobar2000,添加需要转换的歌曲,全选或单独选中,鼠标右击,选择转换–快捷转换,如下图:

foobar2000转换方法

快捷转换里有各种音频格式可供转换,好多可以编辑具体信息,比如flac可以调整压缩级别,aac、mp3等有损可以选择比特率等等。如下图:

快捷转换里的音频格式

好多人说ALAC格式比较难转换,这里附送ALAC格式的foobar2000设置图:

ALAC格式设置图

本篇文章写到这里暂时告一段落,本篇介绍的是常见无损音频格式的相关知识,以后会详细介绍前端、耳机等知识,敬请期待。有很多不到之处,请批评指正,谢谢。