Android音频开发(3):如何播放一帧音频

  

本文重点关注如何在Android平台上播放一帧音频数据。阅读本文之前,建议先读一下《Android音频开发(1):基础知识》,因为音频开发过程中,经常要涉及到这些基础知识,掌握了这些重要的概念后,开发过程中的很多参数和流程就会更加容易理解。


Android SDK提供了3套音频播放的API,分别是:媒体播放器,SoundPool, AudioTrack,关于它们的区别可以看这篇文章:《三个安卓入门音频API》,简单来说,媒体播放器更加适合在后台长时间播放本地音乐文件或者在线的流式资源;SoundPool则适合播放比较短的音频片段,比如游戏声音,按键声,铃声片段等等,它可以同时播放多个音频;而AudioTrack则更接近底层,提供了非常强大的控制能力,支持低延迟播放,适合流媒体和VoIP语音电话等场景。


音频的开发,更广泛地应用不仅仅局限于播放本地文件或者音频片段,因此,本文重点关注如何利AudioTrack API来播放音频数据(注意,使用AudioTrack播放的音频必须是解码后的PCM数据)。


<强> 1。AudioTrack的工作流程


首先,我们了解一下AudioTrack的工作流程:


(1)配置参数,初始化内部的音频播放缓冲区

(2)开始播放

(3)需要一个线程,不断地向AudioTrack的缓冲区“写”入音频数据,注意,这个过程一定要及时,否则就会出现“暗流”的错误,该错误在音频开发中比较常见,意味着应用层没有及时地“送入“音频数据,导致内部的音频播放缓冲区为空。

(4)停止播放,释放资源


<强> 2。AudioTrack 的参数配置


Android音频开发(3):如何播放一帧音频


上面是 AudioTrack 的构造函数原型,主要靠构造函数来配置相关的参数,下面一一解释(再次建议先阅读一下《Android音频开发(1):基础知识》):


(1) streamType


这个参数代表着当前应用使用的哪一种音频管理策略,当系统有多个进程需要播放音频时,这个管理策略会决定最终的展现效果,该参数的可选的值以常量的形式定义在 AudioManager 类中,主要包括:


STREAM_VOCIE_CALL:电话声音

STREAM_SYSTEM:系统声音

STREAM_RING:铃声

STREAM_MUSCI:音乐声

STREAM_ALARM:警告声

STREAM_NOTIFICATION:通知声


(2) sampleRateInHz


采样率,从AudioTrack源码的“audioParamCheck”函数可以看到,这个采样率的取值范围必须在 4000Hz~192000Hz 之间。


(3) channelConfig


通道数的配置,可选的值以常量的形式定义在 AudioFormat 类中,常用的是 CHANNEL_IN_MONO(单通道),CHANNEL_IN_STEREO(双通道)


(4) audioFormat


这个参数是用来配置“数据位宽”的,可选的值也是以常量的形式定义在 AudioFormat 类中,常用的是 ENCODING_PCM_16BIT(16bit),ENCODING_PCM_8BIT(8bit),注意,前者是可以保证兼容所有Android手机的。


(5) bufferSizeInBytes


这个是最难理解又最重要的一个参数,它配置的是 AudioTrack 内部的音频缓冲区的大小,该缓冲区的值不能低于一帧“音频帧”(Frame)的大小,而前一篇文章介绍过,一帧音频帧的大小计算如下:


int size=采样率 x 位宽 x 采样时间 x 通道数


采样时间一般取 2.5ms~120ms 之间,由厂商或者具体的应用决定,我们其实可以推断,每一帧的采样时间取得越短,产生的延时就应该会越小,当然,碎片化的数据也就会越多。


在Android开发中,AudioTrack 类提供了一个帮助你确定这个 bufferSizeInBytes 的函数,原型如下:


int getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFormat);


不同的厂商的底层实现是不一样的,但无外乎就是根据上面的计算公式得到一帧的大小,音频缓冲区的大小则必须是一帧大小的2~N倍,有兴趣的朋友可以继续深入源码探究探究。


实际开发中,强烈建议由该函数计算出需要传入的 bufferSizeInBytes,而不是自己手动计算。


(6) mode


AudioTrack 提供了两种播放模式,一种是 static 方式,一种是 streaming 方式,前者需要一次性将所有的数据都写入播放缓冲区,简单高效,通常用于播放铃声、系统提醒的音频片段; 后者则是按照一定的时间间隔不间断地写入音频数据,理论上它可用于任何音频播放的场景。

Android音频开发(3):如何播放一帧音频