数模论坛

 找回密码
 注-册-帐-号
搜索
热搜: 活动 交友 discuz
查看: 2356|回复: 0

[转帖]用Java实现音频播放

[复制链接]
发表于 2004-5-10 16:30:05 | 显示全部楼层 |阅读模式
一、JavaSound的体系结构

  二、JavaSound混频原理

  三、音频数据与存储格式

  四、设计音乐播放器

  五、播放音乐

  六、支持更多的音频格式

  ━━━━━━━━━━━━━

  桌面PC的性能日益提高,Java虚拟机的优化技术也不断获得突破,这一切使得用Java处理实时信号成为可能。本文将通过设计和构造一个支持实时MP3、WAV和Ogg音频格式解码/回放的Java音乐播放器,阐述用JavaSound API编写音频处理程序的思路和一般过程。

  JavaSound是一个小巧的低层API,支持数字音频和MIDI数据的记录/回放。在JDK 1.3.0之前,JavaSound是一个标准的Java扩展API,但从Java 2的1.3.0版开始,JavaSound就被包含到JDK之中。由于Java有着跨平台(操作系统、硬件平台)的特点,基于JavaSound的音频处理程序(包括本文的程序)能够在任何实现了Java 1.3+的系统上运行,无需加装任何支持软件。

  <B>一、JavaSound的体系结构</B>

  当前JDK的JavaSound API随同Java媒体框架(JMF,Java Media Framework)一起发布,主页在java.sun.com/products/java-media/jmf/,适合JDK 1.1以及更高的版本。除了JDK实现的JavaSound API之外,还有一个源代码开放的JavaSound实现是Tritonus,主页在http://www.tritonus.org/。

  图一描述了JavaSound API的体系结构,虚线表示Sun的JavaSound标准定义的API调用。上面一根虚线表示我们编写音频处理程序要调用的API,JavaSound API包含在javax.sound.sampled和javax.sound.midi包中。两根虚线之间的部分就是JavaSound API的具体实现。

<IMG src="http://developer.ccidnet.com/pub/attachment/2003/5/188434.gif">

  图一:JavaSound体系结构

  就象上面一根虚线表示的API具有统一标准一样,在所有的JavaSound实现中,图一下面一根虚线表示的SPI(服务提供者接口, Service Provider Interface)也是统一的。SPI的作用是以插件(Plug-In)的形式提供自定义的扩展模块,我们只要提供与SPI兼容的插件扩展模块,就可以在不改变API的情况下扩展音频处理程序的能力。SPI包含在java.sound.sampled.spi和javax.sound.midi.spi包中。

  例如,假设有一个只能播放WAV文件的程序,我们只要增加一个支持MP3文件解码的插件模块,就可以在不改动播放程序的任何一行代码的前提下,为这个播放程序添加播放MP3的能力。

  <B>二、JavaSound混频原理</B>

  图二阐述了JavaSound的混频器原理。在处理输入音频的应用中,对于来自各种音频输入端口的信号,例如麦克风、CD播放器、磁带播放器,等等,我们可以在它们到达TargetDataLine之前,利用混频器控制输入混频,最后在程序中通过TargetDataLine获得数字化的音频输入流。

<IMG src="http://developer.ccidnet.com/pub/attachment/2003/5/188435.gif">

  图二:JavaSound混频器

  类似地,在处理输出音频的应用中,混频器用来对一系列来自SourceDataLine的数据进行混频处理,经处理后的信号可输出到各种输出端口,例如扬声器、耳机等。SourceDataLine是一个可写入音频信号数字流的设备,例如,我们可以从一个WAV文件读取内容写入到SourceDataLine,然后再通过扬声器输出。

  输入到混频器的信号可以来源于剪辑。剪辑(Clip)是一个包含一段完整音频数据流的设备,或者说,剪辑就是一个缓冲在内存中的完整音频数据流。在一些要求反复播放音乐片段的场合,例如游戏的背景音乐,剪辑是很有用的。

  图三描述了JavaSound API中一些常用的类、接口及其关系,所有图三显示的类、接口都通过Line这个基本接口统一起来。Line接口用来关闭/打开设备、注册事件监听器,以及提供一些用来调整声音效果的对象,例如调整音量大小的对象。AudioSystem在JavaSound体系中起着一个工厂(Factory)类的作用,提供了一系列的静态方法,我们通过这些静态方法来获取JavaSound系统默认配置的资源(所谓静态方法,就是可以在不创建AudioSystem实例的情况下直接调用的方法)。

<IMG src="http://developer.ccidnet.com/pub/attachment/2003/5/188436.gif">

  图三:常用的JavaSound类

  顺便说明一下,在当前(JDK 1.4)实现的JavaSound的默认配置中,输入声音来自本地声卡的麦克风,输出声音到本地声卡的扬声器。应当说当前实现的JavaSound对端口和混频器的支持还不完善,但对于包括本文音乐播放器在内的许多应用来说,默认实现的JavaSound配置已经足够了。

  <B>三、音频数据与存储格式</B>

  取样得到的音频数据——也就是从TargetDataLine输入或从SourceDataLine输出的数据,必须符合音频格式的标准。音频数据的格式选项由AudioFormat类封装,主要选项包括:编码方式,可以是PCM(Pulse Code Modulation,脉冲编码调制)、MP3等;通道数量;取样率;帧速率;等等。

  音频数据可以用多种格式保存到磁盘上。在JavaSound参考实现中,直接支持的文件格式包括WAV(Windows)、AIFF(主要用于Apple的Macintosh)以及AU(主要用于UNIX),音频文件的格式由AudioFileFormat类指定。

  并非所有音频数据格式都可以保存到任意音频文件格式(或从音频文件回放),具体由平台和操作系统的类型决定。为简单计,本文的播放器只考虑包含PCM Mono或Stereo数据的WAV文件,这是当前流行的音频数据/文件格式组合,常用于CD音质的音频数据。压缩的音频数据(例如MP3和Ogg Vorbis)通常有各自特殊的存储格式(如.MP3和.OGG),通常不以WAV/AIFF/AU格式存储。

  <B>四、设计音乐播放器</B>

  我们要编写的音乐播放器(图四)由表一所示的几个类构成。鉴于构造用户界面往往需要大量的代码,且这些代码通常可以用IDE自动生成,所以下文只对一些关键的GUI元素略作介绍,不再给出完整的代码。

<IMG src="http://developer.ccidnet.com/pub/attachment/2003/5/188437.gif">

  图四:播放器的用户界面

  播放器的用户界面主要由一个带菜单的JFrame框架、一个名称为filenamesList的JList和几个JButton构成。框架有一个私有的TestBase成员,其实例在GUIInit()方法的末尾通过pBase = new TestBase()语句初始化。

  表一

<IMG src="http://developer.ccidnet.com/pub/attachment/2003/5/188438.gif">

  用户界面中的按钮用类似下面的代码创建,其中addBttnIconText()是一个私有方法,它把一个图标放到按钮的文字标签之上。Java程序的用户界面和Windows界面风格迥异,建议读者使用Java开发工具自带的图标,或者从Java图标库下载(例如http://developer.java.sun.com/developer/techDocs/hi/repository/)。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><RE><CCID_CODE>JButton playBttn = new JButton();
...
addBttnIconText(playBttn, "播放", "lay24.gif");
    playBttn.addActionListener(new java.awt.event.ActionListener() {
      public void actionPerformed(ActionEvent e) {
        playClick(e);
   }
});</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  当用户点击一个按钮,与该按钮对应的xxxClick()事件句柄函数开始执行。播放器共有5个按钮,相应的事件句柄也有5个:playClick(“播放”按钮),stopClick(“停止”按钮),pauseClick(“暂停”按钮),prevClick(“后退”按钮),nextClick(“前进”按钮)。

  例如,点击“播放”按钮时,playClick()句柄首先获得JList中选中的文件,然后调用TestBase实例中的playFile()辅助方法播放文件。playClick()句柄的代码如下所示,注意它把音乐文件及其所在目录连接起来的方法是操作系统中立的。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><RE><CCID_CODE>void playClick(ActionEvent e) {
   String fileToPlay = (String) filenamesList.getSelectedValue();
   if (fileToPlay != null) {
        pBase.playFile(searchDir +
            System.getProperty("file.separator") + fileToPlay);
   }
  }</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  stopClick()和pauseClick()方法分别调用TestBase中的stop()和pause()方法。prevClick()和nextClick()句柄的任务稍微复杂一点。首先,它们要调用TestBase中的stop()方法中止当前的播放动作,然后选中JList中当前项目的前一项或后一项,最后调用playClick()播放新选中的音乐文件,如下所示。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><PRE><CCID_CODE>void prevClick(ActionEvent e) {
    pBase.stop();
    filenamesList.setSelectedIndex(   filenamesList.getSelectedIndex() - 1);
    playClick(e);
  }
  void nextClick(ActionEvent e) {
    pBase.stop();
    filenamesList.setSelectedIndex((filenamesList.getSelectedIndex()+1)
                       % curPlayListLength);
   playClick(e);
  }</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  <B>五、播放音乐</B>

  TestBase类包含主要的播放逻辑。例如,当用户点击“播放”按钮,TestBase类中的play()方法开始执行。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><PRE><CCID_CODE>public void play() {
   if ((!stopped) || (paused)) return;
   if (playerThread == null)  {
     playerThread = new Thread(this);
     playerThread.start();
     try { Thread.sleep(500);
        } catch (Exception ex) {}
     }
    synchronized(synch) {
        stopped = false;
        synch.notifyAll();
      }
  }</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  play()方法首先确认播放器当前已被终止播放,而不是暂停播放。然后它检查这是不是第一次调用play():如果是,则创建一个playerThread线程。我们用一个独立的线程负责音乐播放,这样,无论播放器正在读取文件、解码,还是正在把音频数据输出到扬声器,用户界面总是可操作的。

  启动线程之后,play()方法锁定静态synch同步对象,将stopped标记设置为false,然后通知正在等待的线程(playerThread线程在开始播放音乐文件之前,会等待静态synch对象上的提醒通知)。

  playerThread线程启动后,它的run()方法开始运行。这个线程一直执行while循环,直到threadExit标记变成true为止。在while循环中,线程首先等待“开始播放”的信号(当用户点击“播放”按钮时),然后播放音乐。表二列出了描述播放器状态的各个标记及其含义。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><PRE><CCID_CODE>public void run() {
    while (! threadExit)  {
       waitforSignal();
       if (! stopped)
           playMusic();
       }
  }</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  表二

<IMG src="http://developer.ccidnet.com/pub/attachment/2003/5/188439.gif">

  playMusic()方法利用JavaSound API播放当前选中的文件。首先要通过AudioSystem类获得一个AudioInputStream。然后,利用AudioInputStream的getFormat()获知音频数据的格式。在此基础上,我们试图通过getLine()方法获得一个支持该种格式的SourceDataLine。如果要播放的是WAV文件,现在我们已经有了非压缩的PCM格式的音频数据,可以用line对象开始播放音频。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><PRE><CCID_CODE>ais= AudioSystem.getAudioInputStream(new File(fileToPlay));

if (ais != null)  {
  baseFormat = ais.getFormat();
  line = getLine(baseFormat);
  ...
  }</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  如果音频数据是压缩格式的,如MP3或Ogg,必须先进行一次转换——把MP3/Ogg解码成PCM。解码主要包括三个步骤:

  1、创建一个解压缩结果的定制AudioFormat(PCM编码),但保留和原压缩流一样的取样率、通道信息等。

  2、创建一个AudioInputStream把原来的AudioInputStream转换成新的AudioFormat格式。

  3、获得一个处理解码后格式的SourceDataLine。

  如下所示:

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><PRE><CCID_CODE>AudioFormat  decodedFormat = new AudioFormat(
    AudioFormat.Encoding.PCM_SIGNED,
    baseFormat.getSampleRate(),
    16,
    baseFormat.getChannels(),
    baseFormat.getChannels() * 2,
    baseFormat.getSampleRate(),
    false);
ais = AudioSystem.getAudioInputStream(decodedFormat, ais);
line = getLine(decodedFormat);</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  getLine()方法的返回值是一个与参数中指定的AudioFormat兼容的SourceDataLine。如果不能获得兼容的SourceDataLine,getLine()返回null。在getLine()方法中,我们首先创建和填充一个DataLine.Info结构,调用AudioSystem.getLine()方法,将info结构传递给AudioSystem类工厂。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><PRE><CCID_CODE>private SourceDataLine getLine(AudioFormat audioFormat)  {
        SourceDataLine res = null;
        DataLine.Info info = new DataLine.Info(SourceDataLine.class,
                audioFormat);
    try  {
       res = (SourceDataLine) AudioSystem.getLine(info);
       res.open(audioFormat);
      }
    catch (Exception e) {
     }
      return res;
  }</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  准备好AudioInputStream和SourceDataLine之后,playMusic()剩余的任务已经很简单:用一个循环从AudioInputStream读取数据,然后写入到SourceDataLine。

<CCID_NOBR>
<TABLE cellSpacing=0 borderColorDark=#ffffff cellPadding=2 width=550 align=center borderColorLight=black border=1>

<TR>
<TD class=code bgColor=#e6e6e6><PRE><CCID_CODE>int inBytes = 0;
while ((inBytes != -1) &amp;&amp; (!stopped) &amp;&amp; (!threadExit))  {
        try  {
                inBytes = ais.read(audioData, 0, BUFFER_SIZE);
        }
        catch (IOException e)  { e.printStackTrace();         }
        if (inBytes &gt;= 0) {
                int        outBytes = line.write(audioData, 0, inBytes);
        }
     if (paused) waitforSignal();
}</CCID_CODE></PRE></TD></TR></TABLE></CCID_NOBR>

  <B>六、支持更多的音频格式</B>

  假设已经在test目录下准备好了所有的.java文件,执行javac *.java即可顺利编译,执行java test.TestPlayer就可以启动图一的播放器。但现在播放器只能播放有限的文件,因为JDK实现的JavaSound只支持WAV、AIFF和AU。但是,我们可以用JavaSound SPI为播放器增加对MP3和Ogg Vorbis的支持,只要下载和安装相应的插件Jar文件即可。

  Java版的Vorbis解码器可以从JavaCraft(http://www.jcraft.com/jorbis/)下载,最新版本是0.0.12。另外还要有一个JOrbis解码器的SPI封装器,这是使解码器在JavaSound下透明地运行所必需的,可以从http://www.javazoom.net/vorbisspi/vorbisspi.html下载。VorbisSPI的最新版本是0.7。

  对于MP3支持,JavaZoom也提供了一个兼容JavaSound的纯Java解码器,称为JavaLayer(http://www.javazoom.net/javalayer/javalayer.html),最新的版本是0.2.0。注意要下载的是JavaLayer的J2SE版,不要下载J2ME版。

  解开下载得到的文件,把所有Jar文件放到播放器所在目录。用下面的命令启动播放器:java -classpath .;.\jogg-0.0.5.jar;.\jorbis-0.0.12.jar;.\jl020.jar;.\mp3sp.jar;.\vorbisspi0.6.jar test.TestPlayer。如果你下载的解码器版本不同,启动命令也要作相应地改动。把SPI扩展插件加入到了播放器的classpath之后,JavaSound就会在运行时自动使用它们。

您需要登录后才可以回帖 登录 | 注-册-帐-号

本版积分规则

小黑屋|手机版|Archiver|数学建模网 ( 湘ICP备11011602号 )

GMT+8, 2024-11-27 10:40 , Processed in 0.052662 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表