音响论坛 门户 查看内容

网络音频优化制作与管理

2010-5-12 11:25| 发布者: admin| 查看: 728| 评论: 0|来自: 依马狮广电

管理

  随着基于数字技术基础之上的网络技术的发展,人们可以通过网络搜索引擎自由的查阅、欣赏、交流音频资料。它具有保存、传输方便、对环境依赖性小、存储中高保真、无论复制多少次都不会失真等优点。一些传统的传播方式将得到根本性的改变。
高品质特技音效不再是高级技师的专利,普通大众就可以通过电脑用特技软件来完成,可以轻松的建立自己的音频数据库,甚至可以办个人网络电台。音频实时编解码、压缩技术可以实现远程直播、多方通话。通过原有的一条模拟线路,数字音频压缩技术可以实时传输多方通话,方便实现网络传播中的双向互动、网上音视频直播。

  音频优化制作和管理

  在一个系统平台内,一般采用的音频文件存储格式要一致,便于编辑制作、交换。编辑制作阶段,原始素材一般采用非压缩格式或者无损压缩格式保存,成品使用压缩格式存储,便于节约空间。网上交互音频都是采用压缩格式,或流媒体形式,根据不同的需求采用不同的格式,无损压缩是发展趋势。整个系统架构应具有开放性,方便升级换代,适合多种音频格式方便交流、数据库扩展,避免重复性投资。

  人们可以根据自己的爱好、熟练程度使用不同的编辑制作软件,如Adobe Audition、Audio Editor、All Editor等,它可以用声音来“绘”制音调、歌曲的一部分,声音、弦乐、颤音、噪音或是调整静音。还提供多种特效为你的作品增色,比如放大、降低噪音、压缩、扩展、淡入淡出、静音的插入与消除、哇音、混响、高低通滤波、颤音、震音、回声、倒转、反向、失真、合唱、延迟、音量标准化处理等等。软件还自带一个多重剪贴板,可用来进行更复杂的复制、粘贴、修剪、混合等操作。你可以使用两种方式进行录音,边录边存或者是录音完成后再行保存。

  无论音频制作工作站还是音频数据存储阵列,需要冗余备份,根据需要选择备份的等级。编辑制作站、服务器端存储阵列采用RAID系列方式,在素材的安全性和可扩容性、抵抗硬件损坏等方面做了最大技术保障,如采用RAID10或RAID50架构、双机热备等。目前处理器都是多核配置,所以选择编辑软件、操作系统时,应当关注是否对多核处理器进行优化。在网络上灵魂是搜索引擎,也就是对音频资料打包的数据库,通过检索找到需要的音频资料。数据库中包含音频资料的各种属性,如分类、制作、时间、各种素材的安全存储和修改调用信息,包括节目单信息,定时转播,直播或录播等播出状态数据。数据库的安全是至关重要的,如若丢失还需逐个审听录入,工作量巨大。数据库分级管理,分别配给使用者不同的功能使用,最大限度发挥网络优势提供了资源共享,避免出现误操作删除、恶意数据更改、数据损坏等灾难性事故发生。

  同时考虑到互联网远程应用的需求,专业声卡、采集卡主要用于编辑制作采集站,应具有适合流媒体采集软件,轻松实现安全的内外网资源共享,网络直播、点播功能,适应全数字化类型信号接口、传输和处理,远程编辑合成。主要选择指标包括DSP处理能力、板卡接口、音频接口、通道数量等,播出站采用集成普通声卡即可。还应考虑网络服务器的音频、视频承载能力,多种音频格式兼容性,灾难恢复能力等。周边设备数字化也是重点考虑范围,统一了音频制作和传输标准,实现整体数字化,周边设备品质提高有助于提高整体数字音频质量。蓝牙、无线网络可以用于局域网络音频传输,接驳各种新型数码设备,提供广泛的数字接口。

  数字音频新技术应用

  目前,推出很多数字音频新技术,影响显著的包括如下几方面:

  1.音频制作技巧,如FLASH制作。现在很多网站包括电视(如CCTV-3的快乐驿站、BTV的卡酷频道)的歌曲、小品、相声都是通过FLASH来表现的,虚拟画面加以数字音频,起到意想不到的好效果。数字音乐人可采用数字音频文件的分层技术,通过导入单独的元素或乐曲的一部分(提琴、管乐、吉他、钢琴等等),音频每个构成元素可以单独录制和优化,并作为独立的声音文件导入Flash不同层。逐层音频根据构思,放置不同的相对位置,产生不同的音效。设计者可以有更大的自由度和灵活性,使其能够组合音乐使之与产品中的视觉元素相匹配。

  FLASH制作可以分为四个部分:编录、封装、同步、压缩。同步对于分层编播很关键,设置stream的声音开始,音乐能够使各层保持同步。如要使用stream作为所有分层声音的同步设置,动画将被绑定至时间轴。压缩分为全局压缩和每个声音文件单独压缩。频率低的声音,例如大提琴音,压缩比可以非常大。其它如鼓点等,如果过分压缩,可能会被截断。单独设置压缩的好处在于,可以通过压缩比大的部分减小文件大小,同时对逼真度更为敏感的部分设置较小的压缩比,从而得到更好的音质。

  2.用于监控、智能传输。系统内信号通过Cobranet数字网络进行交换,经由控制电脑和网络交换机操作数字网络矩阵处理器的系统处理功能和控制功能。

  目前,较为成熟且已有较多使用的网络声频传输协议是美国的CobraNet和EtherSound网络协议,利用成熟的以太网技术提供操作简单并具有32个通道的未经压缩的数字声频,可以进行同步双向传输(达100M)和双向控制系统。


大连广播电台2009年建立的CobraNet监控网络数据流程图

  实现网络音视频向智能化发展,给人们提供一个灵活控制切换的平台,使音视频可以按照人们的意愿大范围切换,摆脱原有布线局限,同时可以对各个节点进行音视频监控,快速定位故障点,多路信号备份。控制网络采用数据库记录、配置,使用切换任务单,可以脱离数据库进行切换,直接控制矩阵;采用的服务器、控制器具有非常高的可用性,具有冗余配置,主备自动切换;另外配备有可脱离PC环境的硬件控制器,直接手动切换;网络都具有弹性、冗余链路;操作数据可以及时备份,快速恢复,具有高稳定工作,系统可自检报警,记录详细日志。

  如今,很多国际厂商推出数字音频处理设备集数字音频信号处理(DASP)、矩阵、自动混音和网络多媒体控制等多种功能于一身,每一路信号处理都包括独立的压缩/限幅器、参数均衡、延时等功能,并有体积小、接口多,易管理、易安装、易调整、易切换,可视化、可集控、可控指标多,便于组成数字音频网络传输系统等优点,在广电业广泛应用。如,专门针对多传声器的“纯”会议扩声系统的应用,完全可以取消调音台,实现会议操控“无人值守”。每一输入通道不仅有LINEIN输入接口,同时具备MICIN输入接口,还具有自动混音功能,传声器能自动开启和关闭,并可设置主席传声器的优先级。

3.伴随DSP技术的发展,数字音频处理设备的处理功能迅速提升,音质更佳,适用于主题公园、机场、车站等复杂的广播系统。 

  随着技术的不断进步,推出了多声道环绕声技术,具有更强定位能力和空间渲染效果。更准确地说,环绕声应该是一种声音恢复形式,其新技术的含量实际表现在随着这种形式发展起来的一些数字压缩标准上。环绕声技术发展至今已相当成熟,已日渐成为未来声音形式的主流。Dolby AC-3是一种感知型压缩编码技术,在5.1声道的条件下,可将码率压缩至384kbps,压缩比约为10:1。Dolby AC-3最初是针对影院系统开发的,但目前已成为应用最为广泛的环绕声压缩技术之一。使用了许多先进的、行之有效的压缩技术。如前/后向混合自适应比特分配、公共比特池、TDAC滤波、频谱包络编码、及低码率条件下使用的多声道高频耦合等,而其中许多技术对其它的多声道环绕声压缩技术的发展都产生了一定的影响。

  另外,还有MPEG-2BC,它考虑到其前、后向兼容性以及环绕声音形式的新特点,在压缩算法中除承袭了MPEG-1的绝大部分技术外,为在低码率条件下进一步提高声音质量,还采用了多种新技术。如动态传输通道切换、动态串音、自适应多声道预测、中央声道部分编码、预编码等。

  以上是综合了多年多媒体工作经验,融合时下流行的软硬件数字音频技术,提出一些优化观点,难免有疏漏,请各位专家多多批评指正。

微信扫码关注公众号