计算机技术论文:计算机音频处理
多媒体计算机的音频处理技术中国科学技术大学管理学院肖波音频信号的处理技术可以说是多媒体计算机技术的重要组成部分。同时由音频信号处理技术获得语言、音乐播放功能也是MPC诸功能中最重要的功能之一,由MPC的基本硬件组成亦可以看出这一点。 以下是小编为大家精心准备的计算机技术论文范文:计算机音频处理。内容仅供参考,欢迎阅读!
计算机音频处理全文如下:
摘要:现代音频技术已经步入数字处理阶段,计算机的多媒体功能为音频处理提供了很多方便实用的方法,通过这些方法,我们可以让声音听上去更悦耳,更具有感染力,数字处理的优势被充分体现出来。
关键词:声音三要素;音频属性;音频处理;音频格式
计算机对所有音频资料的处理过程,像录制、编辑、存储、播放,都是数字化的。我们要了解计算机音频的处理过程,就需要对音频属性和计算机处理过程进行一些基础性的了解才行。
先来认识下自然界的声音:
声音是一种振动,振动速度有快有慢,幅度有大有小。这是平时容易混淆的两个属性,振动幅度和音量相关,振动快慢即频率,它与音调相关,振幅越大音量越高,频率越快音调越高。它们构成声音的要素:响度、音高。声源振动的各种成分(基音和泛音)决定了它的听觉感受,也就是音色。响度、音高和音色是声音的三要素。
响度是比较容易理解的一个概念,它和我们常说的音量相关。音调就是音高,我们常说的高音、中音、低音就是音调的高低。而各种高、中、低音成分的组成就构成了音色。每一个人对声音的敏感度都不相同,大部分人可以感知的声音振动频率范围是20Hz~20kHz。世界上没有完全相同的两片树叶,也不存在相同的耳朵,每一个人对同一音响的感受都是不完全相同的。
计算机软件就是要对上述的声音三要素进行处理,进而改变我们的听觉感受。
响度处理:录音制品音量各有不同,我们平时剪辑制作通常会考虑到它的最大值,控制它不要达到数字设备满刻度电平0dBfs。如果超出这个范围,会使超出部分强制削减到满刻度,就造成削波失真,如果比较严重,录制的声音就会严重劣化,听起来非常刺耳。我们有时会遇到一些情况,来自网络上的音乐,声音明明没有达到0 dBfs,却能感受到失真的存在。这是因为音频在剪辑存储时削波失真了,而再剪辑时调整了音量,这样乍一看音量没有超出范围,而音质依然是受损的。音频在削波失真时,除了感受到声音能量增大外,还存在激发出的一些附加的频率成分,它们的存在会影响我们的听觉感受,即便音量下调,这些附加频率成分不会消失。
许多朋友个人录制的音频时会注意音量表,控制音量值不超标,而决定音量和听觉感受的不只是最大值,还有整段音频音量的最小值,这就可以引入另一个概念——动态范围。一般情况下,稿件中起伏较大,情感基调有变化,这样的音频录制出来动态范围会比较大,对这样的音频保证不失真,不做动态处理,在很多时候听起来音量会偏低。现代音乐创作,基本上都会对动态范围加以控制,减小动态,来获取相对一致的音量感受。
音调处理:现在有些音频制作可以作变调处理,适当修正音调,或者模拟童声,模拟汽车由远而近的行驶过程的音调变化——多普勒频移。有了这些工具,我们就可以适当修正歌唱时的跑调,也可以模拟儿童的声音或者古怪的外星人、机器人的声音,运动过程中的声音也可以被恰当地模拟出来。
音色处理:这几乎是所有音频工作者必须面对的一个问题——均衡。每种声源都有自身的频率成分,基音、泛音共同构成一个具有自身特点的声音。就用声来说,有些人天生具有理想的音色,而有些人先天声音条件不理想,后天的训练可以适量改善,与生俱来的声音质感是一种恩赐,不可强求。音频处理中有对音色调整的效果,典型的图示均衡器可以适度改变声音成分,降低缺陷声,强化质感成分。各种滤波器,可以整段消除不需要的成分,也可以模拟频带很窄的电话语声。
混响与延时是对声音的另一种修饰,适度使用可以增强空间感,增加欣赏性,但会相应降低可懂度。主流的音频制作都会考虑适当地使用这些效果,以增加作品的艺术感染力。
声音像其他的振动波一样,在传播过程中会干涉、衍射、折射,多个相干声源间存在相互影响。立体声节目的相位是必须考察的问题。引进节目的相位也要用合适的监听设备认真审听,软件辅助查看。
以上针对于声音的处理都存在相应的设备,比如对音量处理的压限器、动态处理器、音频处理器,音调处理的有变调器,音色处理的有均衡器、陷波器,还有延时器、混响器、环绕激励器等。音频录制软件中都有对应的效果或插件,可以适度调节,用于改善音色、提高音频指标。音频处理最好用频响曲线相对平滑的专业设备,否则会造成音频处理不准确,影响各个环节的音频质量。最坏的情况是用单声道监听,立体声节目两声道间存在反相,制作剪辑时音频听起来都正常,而在立体声放音时两声道许多频率成分相互抵消,播放效果非常糟糕。
下面讲讲我们录制中常见的问题。
我们的录制包括话筒、调音台、计算机、声卡、录制软件,是一套完整的系统。每一种设备都有自己的工作参数,严格按照指标设定才能获得现有条件下的最优效果。
比如说话筒的典型参数:
指向特征:全向型、心型、超心型 等,这就要求录制时保持话筒的最佳角度。
收音头:动圈式、电容式 ,话筒的工作方式决定了所采集声音的效果,一般情况下,电容式话筒的整体表现要好些。
灵敏度:1.5 mV/Pa±3dB ,这个参数是考量录音人的声音响度识别起点,决定了录音的动态范围。
频率范围及响应曲线:80-15000Hz ,它给出了声音识别的频率范围,不同频率响应的话筒录制出的声音也是有很大差别的。
产品声道:立体声 ,它决定了声音录制的相位特征。
产品阻抗:350欧姆 ,它影响设备连接的驱动响应特征,不能匹配的设备连接不能工作或者不能达到理想效果。
此外,话筒有一种邻近效应,是用近传声技术提升低音的效应,即话筒置于离声源几厘米的位置。在某些场合此效应会产生某些歌手喜欢的强烈丰满的声音,但有许多场合必须控制或完全避免低音提升,例如,在记录谈话时。邻近效应可能使谈话不可懂。有些话筒装备了低音滤波器以补偿邻近效应,如Sennheiser MD 421和MD 441、AKG SolidTube和C 414 B-ULS。
接下来让我们认识一下常见的音频格式,熟悉我们常用的播出格式,了解这些格式的常见属性,避免不合格的音频在播出中使用。
多媒体技术催生了上百种格式、规范、编码方式,现在我们日常能接触到的格式有WAV、MP3、WMA、MIDI等,还有一些音乐发烧友乐于选择APE、FLAC等无损压缩格式。音频采集会占用大量的存储空间,且依赖于存储设备的读写速度,由此引入了音频数据压缩这个概念。我们现在的播出,比较常用的有MP3压缩格式。MP3属于有损压缩,这种编码方式,压缩比越大,高频损失越明显,声音听起来发飘,明亮度下降,这是因为频谱中的高频部分(通常16kHz以上)损失随比特率的下降而损失。MP3格式最高比特率可以达到320 kB/s,互联网上常见的MP3音乐比特率为128kB/s,这样的音乐音频损失就点大了,还有一些连这种基本要求都达不到。比特率只反应了互联网音乐的一个层面,还有其他形式变化带来的影响,一些非专业的转码,简单提升音量,或者通过其他方式多次数字转换造成音频失真并产生附加的音频衍生物。
录制软件在使用前,应先测试环境音的噪音情况,校正好正常的录音电平,留有适度的余量,避免大的失真,适度采噪降噪。效果处理不同人有不同见解,都有自己的欣赏力,根据情况适度应用,要考虑播放时的可懂度。音频响度处理,最好用动态控制,不要一味地强行提升,避免削波失真。许多不良插件会造成不好的声音衍生物,非认证的插件谨慎使用。存储时采用合适的格式和参数,一次不当的存储设置会造成下次使用时保持这种错误状态。
我们日常会用到一些不是我们常用的格式,或者编在影视中的音频,这时我们需要转换格式。转换前首先要考虑这段音频的品质是否基本合适,非常低品质的音频不要使用,一定不要把低品质的音频强行调高它的参数,使得到的成品看上去指标不错,实际上音质依然很差。转换输出参数会影响最终效果,适量提高转换质量。
对于许多专业人员,听是常用的手段之一,音量旋钮与真实的响度之间最好形成一种心理刻度。轻微的失真通常不会被大部分人注意,没有经过训练的耳朵听不出声音的缺陷,我们需要经常留意设备的音量指示,有异常情况学会辨认。
相关文章:
1.电脑没有音频设备怎么处理
2.在电脑上怎么设置音效
3.机箱前置音频没有声音的处理方法
4.电脑音响有杂音的解决方法
5.电脑未安装音频输出设备怎么办
6.电脑声音不正常的原因分析及解决方法