多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國(guó)內(nèi)最全I(xiàn)T社區(qū)平臺(tái) 聯(lián)系我們 | 收藏本站
阿里云優(yōu)惠2
您當(dāng)前位置:首頁(yè) > php開(kāi)源 > 綜合技術(shù) > 詳解如何使用代碼進(jìn)行音頻合成

詳解如何使用代碼進(jìn)行音頻合成

來(lái)源:程序員人生   發(fā)布時(shí)間:2016-07-26 13:18:42 閱讀次數(shù):2993次

作者:鄭童宇
GitHub:https://github.com/CrazyZty

1.前言

  音頻合成在現(xiàn)實(shí)生活中利用廣泛,在網(wǎng)上可以搜索到很多相干的講授和代碼實(shí)現(xiàn),但個(gè)人感覺(jué)在網(wǎng)上搜索到的音頻合成相干文章的講授都并不是10分透徹,故而寫下本篇博文,計(jì)劃通過(guò)講授如何使用代碼實(shí)現(xiàn)音頻合成功能從而將本人對(duì)音頻合成的理解論述給各位,力圖讀完的各位可以對(duì)音頻合成整體進(jìn)程有1個(gè)清晰的了解。
  本篇博文以Java為示例語(yǔ)言,以Android為示例平臺(tái)。
  本篇博文著力于講授音頻合成實(shí)現(xiàn)原理與進(jìn)程中的細(xì)節(jié)和潛伏問(wèn)題,目的是讓各位不被編碼語(yǔ)言所限制,在本質(zhì)上理解如何實(shí)現(xiàn)音頻合成的功能。

2.音頻合成

2.1.功能簡(jiǎn)介

  本次實(shí)現(xiàn)的音頻合成功能參考"唱吧"的音頻合成,功能流程是:錄音生成PCM文件,接著根據(jù)錄音時(shí)長(zhǎng)對(duì)背景音樂(lè)文件進(jìn)行解碼加裁剪,同時(shí)將解碼后的音頻調(diào)制到與錄音文件相同的采樣率,采樣點(diǎn)字節(jié)數(shù),聲道數(shù),接著根據(jù)指定系數(shù)對(duì)兩個(gè)音頻文件進(jìn)行音量調(diào)理并合成為PCM文件,最落后行緊縮編碼生成MP3文件。

2.2.功能實(shí)現(xiàn)

2.2.1.錄音

  錄音功能生成的目標(biāo)音頻格式是PCM格式,對(duì)PCM的定義,維基百科上是這么寫到的:"Pulse-code modulation (PCM) is a method used to digitally represent sampled analog signals. It is the standard form of digital audio in computers, Compact Discs, digital telephony and other digital audio applications. In a PCM stream, the amplitude of the analog signal is sampled regularly at uniform intervals, and each sample is quantized to the nearest value within a range of digital steps.",大致意思是PCM是用來(lái)采樣摹擬信號(hào)的1種方法,是現(xiàn)在數(shù)字音頻利用中數(shù)字音頻的標(biāo)準(zhǔn)格式,而PCM采樣的原理,是均勻間隔的將摹擬信號(hào)的振幅量化成指定數(shù)據(jù)范圍內(nèi)最貼近的數(shù)值。
  PCM文件存儲(chǔ)的數(shù)據(jù)是不經(jīng)緊縮的純音頻數(shù)據(jù),固然只是這么說(shuō)可能有些抽象,我們拉上大家熟知的MP3文件進(jìn)行對(duì)照,MP3文件存儲(chǔ)的是緊縮后的音頻,PCM與MP3二者之間的關(guān)系簡(jiǎn)單說(shuō)就是:PCM文件經(jīng)過(guò)MP3緊縮算法處理后生成的文件就是MP3文件。我們簡(jiǎn)單比較1下雙方存儲(chǔ)所消耗的空間,1分鐘的每采樣點(diǎn)16位的雙聲道的44.1kHz采樣率PCM文件大小為:1*60*16/8*2*44.1*1000/1024=10335.9375KB,約為10MB,而對(duì)應(yīng)的128kps的MP3文件大小僅為1MB左右,既然PCM文件占用存儲(chǔ)空間這么大,我們是否是應(yīng)當(dāng)放棄使用PCM格式存儲(chǔ)錄音,恰恰相反,注意第1句話:"PCM文件存儲(chǔ)的數(shù)據(jù)是不經(jīng)緊縮的純音頻數(shù)據(jù)",這意味只有PCM格式的音頻數(shù)據(jù)是可以用來(lái)直接進(jìn)行聲音處理,例如進(jìn)行音量調(diào)理,聲音濾鏡等操作,相對(duì)的其他的音頻編碼格式都是必須解碼后才能進(jìn)行處理(PCM編碼的WAV文件也得先讀取文件頭),固然這不代表PCM文件就好用,由于沒(méi)有文件頭,所以進(jìn)行處理或播放之前我們必須事前知道PCM文件的聲道數(shù),采樣點(diǎn)字節(jié)數(shù),采樣率,編碼大小端,這在大多數(shù)情況下都是不可能的,事實(shí)上就我所知沒(méi)有播放器是直接支持PCM文件的播放。不過(guò)現(xiàn)在錄音的各項(xiàng)系數(shù)都是我們定義的,所以我們就不用擔(dān)心這個(gè)問(wèn)題。
  背景知識(shí)了解這些就足夠了,下面我給出實(shí)現(xiàn)代碼,綜合代碼講授實(shí)現(xiàn)進(jìn)程。
if (recordVoice) { audioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, Constant.RecordSampleRate, AudioFormat.CHANNEL_IN_MONO, pcmFormat.getAudioFormat(), audioRecordBufferSize); try { audioRecord.startRecording(); } catch (Exception e) { NoRecordPermission(); continue; } BufferedOutputStream bufferedOutputStream = FileFunction .GetBufferedOutputStreamFromFile(recordFileUrl); while (recordVoice) { int audioRecordReadDataSize = audioRecord.read(audioRecordBuffer, 0, audioRecordBufferSize); if (audioRecordReadDataSize > 0) { calculateRealVolume(audioRecordBuffer, audioRecordReadDataSize); if (bufferedOutputStream != null) { try { byte[] outputByteArray = CommonFunction .GetByteBuffer(audioRecordBuffer, audioRecordReadDataSize, Variable.isBigEnding); bufferedOutputStream.write(outputByteArray); } catch (IOException e) { e.printStackTrace(); } } } else { NoRecordPermission(); continue; } } if (bufferedOutputStream != null) { try { bufferedOutputStream.close(); } catch (Exception e) { LogFunction.error("關(guān)閉錄音輸出數(shù)據(jù)流異常", e); } } audioRecord.stop(); audioRecord.release(); audioRecord = null; }
  錄音的實(shí)際實(shí)現(xiàn)和控制代碼較多,在此僅抽出核心的錄音代碼進(jìn)行講授。在此為獲得錄音的原始數(shù)據(jù),我使用了Android原生的AudioRecord,其他的平臺(tái)基本也會(huì)提供類似的工具類。這段代碼實(shí)現(xiàn)的功能是當(dāng)錄音開(kāi)始后,利用會(huì)根據(jù)設(shè)定的采樣率和聲道數(shù)和采樣字節(jié)數(shù)來(lái)不斷從MIC中獲得原始的音頻數(shù)據(jù),然后將獲得的音頻數(shù)據(jù)寫入到指定文件中,直至錄音結(jié)束。這段代碼邏輯比較清晰的,我就不過(guò)量講授了。
  潛伏問(wèn)題的話,手機(jī)平臺(tái)上是需要申請(qǐng)錄音權(quán)限的,如果沒(méi)有錄音權(quán)限就沒(méi)法生成正確的錄音文件。

2.2.2.解碼與裁剪背景音樂(lè)

  如前文所說(shuō),除PCM格式之外的所有音頻編碼格式的音頻都必須解碼后才可以處理,因此要讓背景音樂(lè)參與合成必須事前對(duì)背景音樂(lè)進(jìn)行解碼,同時(shí)為減少合成的MP3文件的大小,需要根據(jù)錄音時(shí)長(zhǎng)對(duì)解碼的音頻文件進(jìn)行裁剪。本節(jié)不會(huì)詳細(xì)解釋解碼算法,由于每一個(gè)平臺(tái)都會(huì)有對(duì)應(yīng)封裝的工具類,直接使用便可。
  背景知識(shí)先講這些,本次功能實(shí)現(xiàn)進(jìn)程中的潛伏問(wèn)題較多,下面我給出實(shí)現(xiàn)代碼,綜合代碼講授實(shí)現(xiàn)進(jìn)程。 

private boolean decodeMusicFile(String musicFileUrl, String decodeFileUrl, int startSecond, int endSecond, Handler handler, DecodeOperateInterface decodeOperateInterface) { int sampleRate = 0; int channelCount = 0; long duration = 0; String mime = null; MediaExtractor mediaExtractor = new MediaExtractor(); MediaFormat mediaFormat = null; MediaCodec mediaCodec = null; try { mediaExtractor.setDataSource(musicFileUrl); } catch (Exception e) { LogFunction.error("設(shè)置解碼音頻文件路徑毛病", e); return false; } mediaFormat = mediaExtractor.getTrackFormat(0); sampleRate = mediaFormat.containsKey(MediaFormat.KEY_SAMPLE_RATE) ? mediaFormat.getInteger(MediaFormat.KEY_SAMPLE_RATE) : 44100; channelCount = mediaFormat.containsKey(MediaFormat.KEY_CHANNEL_COUNT) ? mediaFormat.getInteger(MediaFormat.KEY_CHANNEL_COUNT) : 1; duration = mediaFormat.containsKey(MediaFormat.KEY_DURATION) ? mediaFormat.getLong(MediaFormat.KEY_DURATION) : 0; mime = mediaFormat.containsKey(MediaFormat.KEY_MIME) ? mediaFormat.getString(MediaFormat.KEY_MIME) : ""; LogFunction.log("歌曲信息", "Track info: mime:" + mime + " 采樣率sampleRate:" + sampleRate + " channels:" + channelCount + " duration:" + duration); if (CommonFunction.isEmpty(mime) || !mime.startsWith("audio/")) { LogFunction.error("解碼文件不是音頻文件", "mime:" + mime); return false; } if (mime.equals("audio/ffmpeg")) { mime = "audio/mpeg"; mediaFormat.setString(MediaFormat.KEY_MIME, mime); } try { mediaCodec = MediaCodec.createDecoderByType(mime); mediaCodec.configure(mediaFormat, null, null, 0); } catch (Exception e) { LogFunction.error("解碼器configure出錯(cuò)", e); return false; } getDecodeData(mediaExtractor, mediaCodec, decodeFileUrl, sampleRate, channelCount, startSecond, endSecond, handler, decodeOperateInterface); return true; }

  decodeMusicFile方法的代碼主要功能是獲得背景音樂(lè)信息,初始化解碼器,最后調(diào)用getDecodeData方法正式開(kāi)始對(duì)背景音樂(lè)進(jìn)行處理。 
  代碼中使用了Android原生工具類作為解碼器,事實(shí)上作為原生的解碼器,我也遇到過(guò)兼容性問(wèn)題不能不做了1些相應(yīng)的處理,不能不抱怨1句不同的Android定制系統(tǒng)實(shí)在是致使了太多的兼容性問(wèn)題。

private void getDecodeData(MediaExtractor mediaExtractor, MediaCodec mediaCodec, String decodeFileUrl, int sampleRate, int channelCount, int startSecond, int endSecond, Handler handler, final DecodeOperateInterface decodeOperateInterface) { boolean decodeInputEnd = false; boolean decodeOutputEnd = false; int sampleDataSize; int inputBufferIndex; int outputBufferIndex; int byteNumber; long decodeNoticeTime = System.currentTimeMillis(); long decodeTime; long presentationTimeUs = 0; final long timeOutUs = 100; final long startMicroseconds = startSecond * 1000 * 1000; final long endMicroseconds = endSecond * 1000 * 1000; ByteBuffer[] inputBuffers; ByteBuffer[] outputBuffers; ByteBuffer sourceBuffer; ByteBuffer targetBuffer; MediaFormat outputFormat = mediaCodec.getOutputFormat(); MediaCodec.BufferInfo bufferInfo; byteNumber = (outputFormat.containsKey("bit-width") ? outputFormat.getInteger("bit-width") : 0) / 8; mediaCodec.start(); inputBuffers = mediaCodec.getInputBuffers(); outputBuffers = mediaCodec.getOutputBuffers(); mediaExtractor.selectTrack(0); bufferInfo = new MediaCodec.BufferInfo(); BufferedOutputStream bufferedOutputStream = FileFunction .GetBufferedOutputStreamFromFile(decodeFileUrl); while (!decodeOutputEnd) { if (decodeInputEnd) { return; } decodeTime = System.currentTimeMillis(); if (decodeTime - decodeNoticeTime > Constant.OneSecond) { final int decodeProgress = (int) ((presentationTimeUs - startMicroseconds) * Constant.NormalMaxProgress / endMicroseconds); if (decodeProgress > 0) { handler.post(new Runnable() { @Override public void run() { decodeOperateInterface.updateDecodeProgress(decodeProgress); } }); } decodeNoticeTime = decodeTime; } try { inputBufferIndex = mediaCodec.dequeueInputBuffer(timeOutUs); if (inputBufferIndex >= 0) { sourceBuffer = inputBuffers[inputBufferIndex]; sampleDataSize = mediaExtractor.readSampleData(sourceBuffer, 0); if (sampleDataSize < 0) { decodeInputEnd = true; sampleDataSize = 0; } else { presentationTimeUs = mediaExtractor.getSampleTime(); } mediaCodec.queueInputBuffer(inputBufferIndex, 0, sampleDataSize, presentationTimeUs, decodeInputEnd ? MediaCodec.BUFFER_FLAG_END_OF_STREAM : 0); if (!decodeInputEnd) { mediaExtractor.advance(); } } else { LogFunction.error("inputBufferIndex", "" + inputBufferIndex); } // decode to PCM and push it to the AudioTrack player outputBufferIndex = mediaCodec.dequeueOutputBuffer(bufferInfo, timeOutUs); if (outputBufferIndex < 0) { switch (outputBufferIndex) { case MediaCodec.INFO_OUTPUT_BUFFERS_CHANGED: outputBuffers = mediaCodec.getOutputBuffers(); LogFunction.error("MediaCodec.INFO_OUTPUT_BUFFERS_CHANGED", "[AudioDecoder]output buffers have changed."); break; case MediaCodec.INFO_OUTPUT_FORMAT_CHANGED: outputFormat = mediaCodec.getOutputFormat(); sampleRate = outputFormat.containsKey(MediaFormat.KEY_SAMPLE_RATE) ? outputFormat.getInteger(MediaFormat.KEY_SAMPLE_RATE) : sampleRate; channelCount = outputFormat.containsKey(MediaFormat.KEY_CHANNEL_COUNT) ? outputFormat.getInteger(MediaFormat.KEY_CHANNEL_COUNT) : channelCount; byteNumber = (outputFormat.containsKey("bit-width") ? outputFormat.getInteger("bit-width") : 0) / 8; LogFunction.error("MediaCodec.INFO_OUTPUT_FORMAT_CHANGED", "[AudioDecoder]output format has changed to " + mediaCodec.getOutputFormat()); break; default: LogFunction.error("error", "[AudioDecoder] dequeueOutputBuffer returned " + outputBufferIndex); break; } continue; } targetBuffer = outputBuffers[outputBufferIndex]; byte[] sourceByteArray = new byte[bufferInfo.size]; targetBuffer.get(sourceByteArray); targetBuffer.clear(); mediaCodec.releaseOutputBuffer(outputBufferIndex, false); if ((bufferInfo.flags & MediaCodec.BUFFER_FLAG_END_OF_STREAM) != 0) { decodeOutputEnd = true; } if (sourceByteArray.length > 0 && bufferedOutputStream != null) { if (presentationTimeUs < startMicroseconds) { continue; } byte[] convertByteNumberByteArray = ConvertByteNumber(byteNumber, Constant.RecordByteNumber, sourceByteArray); byte[] resultByteArray = ConvertChannelNumber(channelCount, Constant.RecordChannelNumber, Constant.RecordByteNumber, convertByteNumberByteArray); try { bufferedOutputStream.write(resultByteArray); } catch (Exception e) { LogFunction.error("輸出解壓音頻數(shù)據(jù)異常", e); } } if (presentationTimeUs > endMicroseconds) { break; } } catch (Exception e) { LogFunction.error("getDecodeData異常", e); } } if (bufferedOutputStream != null) { try { bufferedOutputStream.close(); } catch (IOException e) { LogFunction.error("關(guān)閉bufferedOutputStream異常", e); } } if (sampleRate != Constant.RecordSampleRate) { Resample(sampleRate, decodeFileUrl); } if (mediaCodec != null) { mediaCodec.stop(); mediaCodec.release(); } if (mediaExtractor != null) { mediaExtractor.release(); } }

  getDecodeData方法是此次的進(jìn)行解碼和裁剪的核心,方法的傳入?yún)?shù)中mediaExtractor,mediaCodec用以實(shí)際控制處理背景音樂(lè)的音頻數(shù)據(jù),decodeFileUrl用以指明解碼和裁剪后的PCM文件的存儲(chǔ)地址,sampleRate,channelCount分別用以指明背景音樂(lè)的采樣率,聲道數(shù),startSecond用以指明裁剪背景音樂(lè)的開(kāi)始時(shí)間,目前功能中默許為0,endSecond用以指明裁剪背景音樂(lè)的結(jié)束時(shí)間,數(shù)值大小由錄音時(shí)長(zhǎng)直接決定。
  getDecodeData方法中通過(guò)不斷通過(guò)mediaCodec讀入背景音樂(lè)原始數(shù)據(jù)進(jìn)行處理,然后解碼輸出到buffer從而獲得解碼后的數(shù)據(jù),由于mediaCodec的讀取解碼方法和平臺(tái)相干就不過(guò)量描寫,在解碼進(jìn)程中通過(guò)startSecond與endSecond來(lái)控制解碼后音頻數(shù)據(jù)輸出的開(kāi)始與結(jié)束。
  解碼和裁剪根據(jù)上文的描寫是比較簡(jiǎn)單的,通過(guò)平臺(tái)提供的工具類解碼背景音樂(lè)數(shù)據(jù),然后通過(guò)變量裁剪出指定長(zhǎng)度的解碼后音頻數(shù)據(jù)輸出到外文件,這1個(gè)流程結(jié)束功能就實(shí)現(xiàn)了,但在進(jìn)程中存在幾個(gè)潛伏問(wèn)題點(diǎn)。
  首先,要進(jìn)行合成處理的話,我們必須要保證錄音文件和解碼后文件的采樣率,采樣點(diǎn)字節(jié)數(shù),和聲道數(shù)相同,由于錄音文件的這3項(xiàng)系數(shù)已固定,所以我們必須對(duì)解碼的音頻數(shù)據(jù)進(jìn)行處理以保證終究生成的解碼文件3項(xiàng)系數(shù)和錄音文件1致。在http://blog.csdn.net/ownwell/article/details/8114121/,我們可以了解PCM文件常見(jiàn)的4種存儲(chǔ)格式。
  格式                 字節(jié)1                         字節(jié)2                         字節(jié)3                        字節(jié)4
  8位單聲道        0聲道                         0聲道                         0聲道                         0聲道
  8位雙聲道        0聲道(左)                  1聲道(右)                  0聲道(左)                  1聲道(右)
  16位單聲道      0聲道(低)                  0聲道(高)                  0聲道(低)                  0聲道(高)
  16位雙聲道      0聲道(左,低字節(jié))   0聲道(左,高字節(jié))   1聲道(右,低字節(jié))   1聲道(右,高字節(jié))
  了解這些知識(shí)后,我們就能夠知道如何編碼以將已知格式的音頻數(shù)據(jù)轉(zhuǎn)化到另外一采樣點(diǎn)字節(jié)數(shù)和聲道數(shù)。
  getDecodeData方法中146行調(diào)用的ConvertByteNumber方法是通過(guò)處理音頻數(shù)據(jù)以保證解碼后音頻文件和錄音文件采樣點(diǎn)字節(jié)數(shù)相同。 
private static byte[] ConvertByteNumber(int sourceByteNumber, int outputByteNumber, byte[] sourceByteArray) { if (sourceByteNumber == outputByteNumber) { return sourceByteArray; } int sourceByteArrayLength = sourceByteArray.length; byte[] byteArray; switch (sourceByteNumber) { case 1: switch (outputByteNumber) { case 2: byteArray = new byte[sourceByteArrayLength * 2]; byte resultByte[]; for (int index = 0; index < sourceByteArrayLength; index += 1) { resultByte = CommonFunction.GetBytes((short) (sourceByteArray[index] * 256), Variable.isBigEnding); byteArray[2 * index] = resultByte[0]; byteArray[2 * index + 1] = resultByte[1]; } return byteArray; } break; case 2: switch (outputByteNumber) { case 1: int outputByteArrayLength = sourceByteArrayLength / 2; byteArray = new byte[outputByteArrayLength]; for (int index = 0; index < outputByteArrayLength; index += 1) { byteArray[index] = (byte) (CommonFunction.GetShort(sourceByteArray[2 * index], sourceByteArray[2 * index + 1], Variable.isBigEnding) / 256); } return byteArray; } break; } return sourceByteArray; }
   ConvertByteNumber方法的參數(shù)中sourceByteNumber代表背景音樂(lè)文件采樣點(diǎn)字節(jié)數(shù),outputByteNumber代表錄音文件采樣點(diǎn)字節(jié)數(shù),二者如果相同就不處理,不相同則根據(jù)背景音樂(lè)文件采樣點(diǎn)字節(jié)數(shù)進(jìn)行不同的處理,本方法只對(duì)單字節(jié)存儲(chǔ)和雙字節(jié)存儲(chǔ)進(jìn)行了處理,歡迎在各位Github上填充其他采樣點(diǎn)字節(jié)數(shù)的處理方法,
  getDecodeData方法中149行調(diào)用的ConvertChannelNumber方法是通過(guò)處理音頻數(shù)據(jù)以保證解碼后音頻文件和錄音文件聲道數(shù)相同。
private static byte[] ConvertChannelNumber(int sourceChannelCount, int outputChannelCount, int byteNumber, byte[] sourceByteArray) { if (sourceChannelCount == outputChannelCount) { return sourceByteArray; } switch (byteNumber) { case 1: case 2: break; default: return sourceByteArray; } int sourceByteArrayLength = sourceByteArray.length; byte[] byteArray; switch (sourceChannelCount) { case 1: switch (outputChannelCount) { case 2: byteArray = new byte[sourceByteArrayLength * 2]; byte firstByte; byte secondByte; switch (byteNumber) { case 1: for (int index = 0; index < sourceByteArrayLength; index += 1) { firstByte = sourceByteArray[index]; byteArray[2 * index] = firstByte; byteArray[2 * index + 1] = firstByte; } break; case 2: for (int index = 0; index < sourceByteArrayLength; index += 2) { firstByte = sourceByteArray[index]; secondByte = sourceByteArray[index + 1]; byteArray[2 * index] = firstByte; byteArray[2 * index + 1] = secondByte; byteArray[2 * index + 2] = firstByte; byteArray[2 * index + 3] = secondByte; } break; } return byteArray; } break; case 2: switch (outputChannelCount) { case 1: int outputByteArrayLength = sourceByteArrayLength / 2; byteArray = new byte[outputByteArrayLength]; switch (byteNumber) { case 1: for (int index = 0; index < outputByteArrayLength; index += 2) { short averageNumber = (short) ((short) sourceByteArray[2 * index] + (short) sourceByteArray[2 * index + 1]); byteArray[index] = (byte) (averageNumber >> 1); } break; case 2: for (int index = 0; index < outputByteArrayLength; index += 2) { byte resultByte[] = CommonFunction.AverageShortByteArray(sourceByteArray[2 * index], sourceByteArray[2 * index + 1], sourceByteArray[2 * index + 2], sourceByteArray[2 * index + 3], Variable.isBigEnding); byteArray[index] = resultByte[0]; byteArray[index + 1] = resultByte[1]; } break; } return byteArray; } break; } return sourceByteArray; }
  ConvertChannelNumber方法的參數(shù)中sourceChannelNumber代表背景音樂(lè)文件聲道數(shù),outputChannelNumber代表錄音文件聲道數(shù),二者如果相同就不處理,不相同則根據(jù)聲道數(shù)和采樣點(diǎn)字節(jié)數(shù)進(jìn)行不同的處理,本方法只對(duì)單雙通道進(jìn)行了處理,歡迎在Github上填充立體聲等聲道的處理方法。
  getDecodeData方法中176行調(diào)用的Resample方法是用以處理音頻數(shù)據(jù)以保證解碼后音頻文件和錄音文件采樣率相同。
private static void Resample(int sampleRate, String decodeFileUrl) { String newDecodeFileUrl = decodeFileUrl + "new"; try { FileInputStream fileInputStream = new FileInputStream(new File(decodeFileUrl)); FileOutputStream fileOutputStream = new FileOutputStream(new File(newDecodeFileUrl)); new SSRC(fileInputStream, fileOutputStream, sampleRate, Constant.RecordSampleRate, Constant.RecordByteNumber, Constant.RecordByteNumber, 1, Integer.MAX_VALUE, 0, 0, true); fileInputStream.close(); fileOutputStream.close(); FileFunction.RenameFile(newDecodeFileUrl, decodeFileUrl); } catch (IOException e) { LogFunction.error("關(guān)閉bufferedOutputStream異常", e); } }
  為了修改采樣率,在此使用了SSRC在Java真?zhèn)€實(shí)現(xiàn),在網(wǎng)上可以搜到1份關(guān)于SSRC的介紹:"SSRC = Synchronous Sample Rate Converter,同步采樣率轉(zhuǎn)換,直白地說(shuō)就是只能做整數(shù)倍頻,不支持任意頻率之間的轉(zhuǎn)換,比如44.1KHz<->48KHz。",但不同的SSRC實(shí)現(xiàn)原理有所不同,我是用的是來(lái)自https://github.com/shibatch/SSRC在Java真?zhèn)€實(shí)現(xiàn),簡(jiǎn)單讀了此SSRC在Java端實(shí)現(xiàn)的源碼,其代碼實(shí)現(xiàn)中通過(guò)辨別重采樣前后采樣率的最大公約數(shù)是不是滿足設(shè)定條件作為是不是可重采樣的根據(jù),可以支持常見(jiàn)的非整數(shù)倍頻率的采樣率轉(zhuǎn)化,如44.1khz<->48khz,但如果目標(biāo)采樣率是比較特殊的采樣率如某1較大的質(zhì)數(shù),那就沒(méi)法支穩(wěn)重采樣。
  至此,Resample,ConvertByteNumber,ConvertChannelNumber3個(gè)方法的處理保證了解碼后文件和錄音文件的采樣率,采樣點(diǎn)字節(jié)數(shù),和聲道數(shù)相同。
  接著,此處潛伏的第2個(gè)問(wèn)題就是大小端存儲(chǔ)。 對(duì)計(jì)算機(jī)體系結(jié)構(gòu)有所了解的同學(xué)肯定了解"大小端"這個(gè)概念,大小端分別代表了多字節(jié)數(shù)據(jù)在內(nèi)存中組織的兩種不同順序,如果對(duì)"大小端"不是太了解,可以閱讀http://blog.jobbole.com/102432/的論述,在處理音頻數(shù)據(jù)的方法中,我們可以看到"Variable.isBigEnding"這個(gè)參數(shù),這個(gè)參數(shù)的含義就是當(dāng)前平臺(tái)是不是使用大端編碼,這里大家肯定會(huì)有疑問(wèn),內(nèi)存中多字節(jié)數(shù)據(jù)的組織順序?yàn)楹螘?huì)影響我們對(duì)音頻數(shù)據(jù)的處理,舉個(gè)例子,如果我們?cè)趯⒉蓸狱c(diǎn)8位的音頻數(shù)據(jù)轉(zhuǎn)化為采樣點(diǎn)16位,目前的做法是將原始數(shù)據(jù)乘以256,相當(dāng)于每個(gè)byte轉(zhuǎn)化為short,同時(shí)short的高字節(jié)為原byte的內(nèi)容,低字節(jié)為0,那現(xiàn)在問(wèn)題來(lái)了,那就是高字節(jié)放到高地址還是低地址,這就和平臺(tái)采取的大小端存儲(chǔ)格式息息相干了,固然如果我們輸出的數(shù)據(jù)類型是short那就不用關(guān)心,Java會(huì)幫我們處理掉,但我們輸出的是byte數(shù)組,這就需要我們自己對(duì)數(shù)據(jù)進(jìn)行處理了。
  這是1個(gè)很容易忽視的問(wèn)題,由于正常情況下的軟件開(kāi)發(fā)進(jìn)程中我們基本是不用關(guān)心大小真?zhèn)€問(wèn)題的,但在這里必須對(duì)大小真?zhèn)€情況進(jìn)行處理,不然會(huì)出現(xiàn)在某些平臺(tái)合成的音頻沒(méi)法播放的情況。

2.2.3.合成與輸出

  錄音和對(duì)背景音樂(lè)的處理結(jié)束了,接下來(lái)就是最后的合成了,對(duì)合成我們腦海中顯現(xiàn)最多的會(huì)是甚么?相加,對(duì)沒(méi)錯(cuò),音頻合成其實(shí)不神秘,音頻合成的本質(zhì)就是相同系數(shù)的音頻文件之間數(shù)據(jù)的加和,固然現(xiàn)實(shí)中的合成常常并不是如此簡(jiǎn)單,在網(wǎng)上搜索"混音算法",我們可以看到大量精深的音頻合成算法,但就目前而言,我們沒(méi)必要實(shí)現(xiàn)復(fù)雜的混音算法,只要讓兩個(gè)音頻文件的原始音頻數(shù)據(jù)相加便可,不過(guò)為了讓我們的合成看上去略微有1些技術(shù)含量,此次提供的音頻合成方法中允許任意音頻文件相對(duì)另外一音頻文件進(jìn)行時(shí)間上的偏移,并可以通過(guò)兩個(gè)權(quán)重?cái)?shù)據(jù)進(jìn)行音量調(diào)理。下面我就給出具體代碼吧,講授如何實(shí)現(xiàn)。 
public static void ComposeAudio(String firstAudioFilePath, String secondAudioFilePath, String composeAudioFilePath, boolean deleteSource, float firstAudioWeight, float secondAudioWeight, int audioOffset, final ComposeAudioInterface composeAudioInterface) { boolean firstAudioFinish = false; boolean secondAudioFinish = false; byte[] firstAudioByteBuffer; byte[] secondAudioByteBuffer; byte[] mp3Buffer; short resultShort; short[] outputShortArray; int index; int firstAudioReadNumber; int secondAudioReadNumber; int outputShortArrayLength; final int byteBufferSize = 1024; firstAudioByteBuffer = new byte[byteBufferSize]; secondAudioByteBuffer = new byte[byteBufferSize]; mp3Buffer = new byte[(int) (7200 + (byteBufferSize * 1.25))]; outputShortArray = new short[byteBufferSize / 2]; Handler handler = new Handler(Looper.getMainLooper()); FileInputStream firstAudioInputStream = FileFunction.GetFileInputStreamFromFile(firstAudioFilePath); FileInputStream secondAudioInputStream = FileFunction.GetFileInputStreamFromFile(secondAudioFilePath); FileOutputStream composeAudioOutputStream = FileFunction.GetFileOutputStreamFromFile(composeAudioFilePath); LameUtil.init(Constant.RecordSampleRate, Constant.LameBehaviorChannelNumber, Constant.BehaviorSampleRate, Constant.LameBehaviorBitRate, Constant.LameMp3Quality); try { while (!firstAudioFinish && !secondAudioFinish) { index = 0; if (audioOffset < 0) { secondAudioReadNumber = secondAudioInputStream.read(secondAudioByteBuffer); outputShortArrayLength = secondAudioReadNumber / 2; for (; index < outputShortArrayLength; index++) { resultShort = CommonFunction.GetShort(secondAudioByteBuffer[index * 2], secondAudioByteBuffer[index * 2 + 1], Variable.isBigEnding); outputShortArray[index] = (short) (resultShort * secondAudioWeight); } audioOffset += secondAudioReadNumber; if (secondAudioReadNumber < 0) { secondAudioFinish = true; break; } if (audioOffset >= 0) { break; } } else { firstAudioReadNumber = firstAudioInputStream.read(firstAudioByteBuffer); outputShortArrayLength = firstAudioReadNumber / 2; for (; index < outputShortArrayLength; index++) { resultShort = CommonFunction.GetShort(firstAudioByteBuffer[index * 2], firstAudioByteBuffer[index * 2 + 1], Variable.isBigEnding); outputShortArray[index] = (short) (resultShort * firstAudioWeight); } audioOffset -= firstAudioReadNumber; if (firstAudioReadNumber < 0) { firstAudioFinish = true; break; } if (audioOffset <= 0) { break; } } if (outputShortArrayLength > 0) { int encodedSize = LameUtil.encode(outputShortArray, outputShortArray, outputShortArrayLength, mp3Buffer); if (encodedSize > 0) { composeAudioOutputStream.write(mp3Buffer, 0, encodedSize); } } } handler.post(new Runnable() { @Override public void run() { if (composeAudioInterface != null) { composeAudioInterface.updateComposeProgress(20); } } }); while (!firstAudioFinish || !secondAudioFinish) { index = 0; firstAudioReadNumber = firstAudioInputStream.read(firstAudioByteBuffer); secondAudioReadNumber = secondAudioInputStream.read(secondAudioByteBuffer); int minAudioReadNumber = Math.min(firstAudioReadNumber, secondAudioReadNumber); int maxAudioReadNumber = Math.max(firstAudioReadNumber, secondAudioReadNumber); if (firstAudioReadNumber < 0) { firstAudioFinish = true; } if (secondAudioReadNumber < 0) { secondAudioFinish = true; } int halfMinAudioReadNumber = minAudioReadNumber / 2; outputShortArrayLength = maxAudioReadNumber / 2; for (; index < halfMinAudioReadNumber; index++) { resultShort = CommonFunction.WeightShort(firstAudioByteBuffer[index * 2], firstAudioByteBuffer[index * 2 + 1], secondAudioByteBuffer[index * 2], secondAudioByteBuffer[index * 2 + 1], firstAudioWeight, secondAudioWeight, Variable.isBigEnding); outputShortArray[index] = resultShort; } if (firstAudioReadNumber != secondAudioReadNumber) { if (firstAudioReadNumber > secondAudioReadNumber) { for (; index < outputShortArrayLength; index++) { resultShort = CommonFunction.GetShort(firstAudioByteBuffer[index * 2], firstAudioByteBuffer[index * 2 + 1], Variable.isBigEnding); outputShortArray[index] = (short) (resultShort * firstAudioWeight); } } else { for (; index < outputShortArrayLength; index++) { resultShort = CommonFunction.GetShort(secondAudioByteBuffer[index * 2], secondAudioByteBuffer[index * 2 + 1], Variable.isBigEnding); outputShortArray[index] = (short) (resultShort * secondAudioWeight); } } } if (outputShortArrayLength > 0) { int encodedSize = LameUtil.encode(outputShortArray, outputShortArray, outputShortArrayLength, mp3Buffer); if (encodedSize > 0) { composeAudioOutputStream.write(mp3Buffer, 0, encodedSize); } } } } catch (Exception e) { LogFunction.error("ComposeAudio異常", e); handler.post(new Runnable() { @Override public void run() { if (composeAudioInterface != null) { composeAudioInterface.composeFail(); } } }); return; } handler.post(new Runnable() { @Override public void run() { if (composeAudioInterface != null) { composeAudioInterface.updateComposeProgress(50); } } }); try { final int flushResult = LameUtil.flush(mp3Buffer); if (flushResult > 0) { composeAudioOutputStream.write(mp3Buffer, 0, flushResult); } } catch (Exception e) { LogFunction.error("釋放ComposeAudio LameUtil異常", e); } finally { try { composeAudioOutputStream.close(); } catch (Exception e) { LogFunction.error("關(guān)閉合成輸出音頻流異常", e); } LameUtil.close(); } if (deleteSource) { FileFunction.DeleteFile(firstAudioFilePath); FileFunction.DeleteFile(secondAudioFilePath); } try { firstAudioInputStream.close(); secondAudioInputStream.close(); } catch (IOException e) { LogFunction.error("關(guān)閉合成輸入音頻流異常", e); } handler.post(new Runnable() { @Override public void run() { if (composeAudioInterface != null) { composeAudioInterface.composeSuccess(); } } }); }
  ComposeAudio方法是此次的進(jìn)行合成的具體代碼實(shí)現(xiàn),方法的傳入?yún)?shù)中firstAudioFilePath,   secondAudioFilePath是用以合成的音頻文件地址,composeAudioFilePath用以指明合成后輸出的MP3文件的存儲(chǔ)地址,firstAudioWeight,secondAudioWeight分別用以指明合成的兩個(gè)音頻文件在合成進(jìn)程中的音量權(quán)重,audioOffset用以指明第1個(gè)音頻文件相對(duì)第2個(gè)音頻文件合成進(jìn)程中的數(shù)據(jù)偏移,如為負(fù)數(shù),則合成進(jìn)程中先輸出audioOffset個(gè)字節(jié)長(zhǎng)度的第2個(gè)音頻文件數(shù)據(jù),如為正數(shù),則合成進(jìn)程中先輸出audioOffset個(gè)字節(jié)長(zhǎng)度的第1個(gè)音頻文件數(shù)據(jù),audioOffset在另外一程度上也代表著時(shí)間的偏移,目前我們合成的兩個(gè)音頻文件參數(shù)為16位單通道44.1khz采樣率,那末audioOffset如果為1*16/8*1*44100=88200字節(jié),那末終究合成出的MP3文件中會(huì)先播放1s的第1個(gè)音頻文件的音頻接著再播放兩個(gè)音頻文件加和的音頻。
  整體合成代碼是很清晰的,由于加入了時(shí)間偏移,所以合成進(jìn)程中是有可能有1個(gè)文件先輸出完的,在代碼中針對(duì)性的進(jìn)行處理便可,固然即便沒(méi)有時(shí)間偏移也是可能出現(xiàn)類似情況的,比如音樂(lè)時(shí)長(zhǎng)2分鐘,錄音3分鐘,音樂(lè)輸出結(jié)束后那就只應(yīng)當(dāng)輸出錄音音頻了,另外在代碼中將PCM數(shù)據(jù)編碼為MP3文件使用了LAME的MP3編碼庫(kù),除此之外代碼中就沒(méi)有比較復(fù)雜的模塊了。

3.總結(jié)

  至此,音頻合成的流程我們算是走完了,希望讀到此處的各位對(duì)音頻合成的實(shí)現(xiàn)有了清晰的了解。
  這篇博文就到這里結(jié)束了,本文所有代碼已托管到https://github.com/CrazyZty/ComposeAudio,大家可以自由下載。 
生活不易,碼農(nóng)辛苦
如果您覺(jué)得本網(wǎng)站對(duì)您的學(xué)習(xí)有所幫助,可以手機(jī)掃描二維碼進(jìn)行捐贈(zèng)
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關(guān)閉
程序員人生
主站蜘蛛池模板: a毛片久久免费观看 | 久久入| 久久.com| 国产亚洲综合激情校园小说 | 欧美成人免费一区在线播放 | 黄色网址网站在线观看 | 日本不卡一区视频 | 欧美国产亚洲一区二区三区 | 国产成人a一在线观看 | 欧美成人一级毛片 | 亚洲激情在线播放 | 国产毛片片精品天天看视频 | 五月丁香六月综合缴清无码 | 国产精品永久免费视频 | 亚洲精品视频在线 | 一区二区三区影视 | 春色视频一区二区三区 | 自拍偷拍亚洲第一页 | 久久久久这里只有精品 | 日产国产欧美视频一区精品 | 欧美xxxxxxxxxx黑人 | 婷婷去我也去 | 动漫精品一级毛片动漫 | 精品成人在线 | 最近免费中文字幕大全免费版视频 | 欧美成人综合视频 | 亚洲免费在线视频 | 黑人巨大xxx| 国产一区二区三区不卡观 | 高清亚洲 | 免费 欧美 自拍 在线观看 | 欧美一级毛片高清毛片 | 国产大片免费天天看 | 国人精品视频在线观看 | 欧美成人亚洲欧美成人 | a级淫片 | 精品福利在线观看 | www干| 最近的中文字幕免费视频1 最近的中文字幕免费完整 最近的中文字幕视频大全高清 | 在线亚洲+欧美+日本专区 | h视频免费网站 |