zhouqi
/
usky-human


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392
							// @ts-ignore
import lamejs from 'lamejs'
// @ts-ignore
import MPEGMode from 'lamejs/src/js/MPEGMode'
// @ts-ignore
import Lame from 'lamejs/src/js/Lame'
// @ts-ignore
import BitStream from 'lamejs/src/js/BitStream'

if (globalThis) {
  (globalThis as any).MPEGMode = MPEGMode
    ; (globalThis as any).Lame = Lame
    ; (globalThis as any).BitStream = BitStream
}

export const convertToMp3 = (recorder: any) => {
  const wav = lamejs.WavHeader.readHeader(recorder.getWAV())
  const { channels, sampleRate } = wav
  const mp3enc = new lamejs.Mp3Encoder(channels, sampleRate, 128)
  const result = recorder.getChannelData()
  const buffer = []

  const leftData = result.left && new Int16Array(result.left.buffer, 0, result.left.byteLength / 2)
  const rightData = result.right && new Int16Array(result.right.buffer, 0, result.right.byteLength / 2)
  const remaining = leftData.length + (rightData ? rightData.length : 0)

  const maxSamples = 1152
  for (let i = 0; i < remaining; i += maxSamples) {
    const left = leftData.subarray(i, i + maxSamples)
    let right = null
    let mp3buf = null

    if (channels === 2) {
      right = rightData.subarray(i, i + maxSamples)
      mp3buf = mp3enc.encodeBuffer(left, right)
    }
    else {
      mp3buf = mp3enc.encodeBuffer(left)
    }

    if (mp3buf.length > 0)
      buffer.push(mp3buf)
  }

  const enc = mp3enc.flush()

  if (enc.length > 0)
    buffer.push(enc)

  return new Blob(buffer, { type: 'audio/mp3' })
}

export const convertFloat32ArrayToMp3 = (audio: Float32Array) => {
  // Float32Array of audio samples at sample rate 16000
  const floatArray2Int16 = (floatBuffer: Float32Array) => {
    const int16Buffer = new Int16Array(floatBuffer.length);
    for (let i = 0, len = floatBuffer.length; i < len; i++) {
      if (floatBuffer[i] < 0) {
        int16Buffer[i] = 0x8000 * floatBuffer[i];
      } else {
        int16Buffer[i] = 0x7fff * floatBuffer[i];
      }
    }
    return int16Buffer;
  }
  const mergeArray = (list: Float32Array[]) => {
    const length = list.length * list[0].length;
    let data = new Float32Array(length);
    let offset = 0;
    for (let i = 0; i < list.length; i++) {
      data.set(list[i], offset);
      offset += list[i].length;
    }
    return data;
  }

  const encodeMono = (
    channels: number,
    sampleRate: number,
    samples: Int16Array
  ) => {
    const buffer: ArrayBuffer[] = [];
    const mp3enc: lamejs.Mp3Encoder = new lamejs.Mp3Encoder(
      channels,
      sampleRate,
      128
    );
    let remaining = samples.length;
    const maxSamples = 1152;

    for (let i = 0; remaining >= maxSamples; i += maxSamples) {
      const mono = samples.subarray(i, i + maxSamples);
      const mp3buf = mp3enc.encodeBuffer(mono);
      if (mp3buf.length > 0) {
        buffer.push(mp3buf);
      }
      remaining -= maxSamples;
    }

    const d = mp3enc.flush();
    if (d.length > 0) {
      buffer.push(d);
    }

    return new Blob(buffer, { type: 'audio/mp3' });
  }

  const int16Array = floatArray2Int16(audio);
  const mp3Blob = encodeMono(1, 16000, int16Array);
  return mp3Blob
}

function writeString(view: DataView, offset: number, string: string) {
  for (let i = 0; i < string.length; i++) {
    view.setUint8(offset + i, string.charCodeAt(i));
  }
}

export const convertMp3ArrayBufferToWavArrayBuffer = async (mp3ArrayBuffer: ArrayBuffer): Promise<ArrayBuffer> => {
  const mp3Blob = new Blob([mp3ArrayBuffer], { type: 'audio/mp3' })
  const wavBlob = await convertMp3BlobToWavBlob(mp3Blob)
  return wavBlob.arrayBuffer()
}

export const convertMp3BlobToWavBlob = async (mp3Blob: Blob): Promise<Blob> => {
  // 将Blob对象转换为ArrayBuffer对象
  const arrayBuffer = await mp3Blob.arrayBuffer();

  // 创建AudioContext对象并解码音频数据
  const audioContext = new (window.AudioContext || (window as any).webkitAudioContext)();
  const audioBuffer = await audioContext.decodeAudioData(arrayBuffer);

  // 获取音频数据的声道和采样率
  const numberOfChannels = audioBuffer.numberOfChannels;
  const sampleRate = audioBuffer.sampleRate;

  // 获取音频数据的每个声道的数据
  const channelData = [];
  for (let i = 0; i < numberOfChannels; i++) {
    const data = audioBuffer.getChannelData(i);
    // 将Float32Array转换为Int16Array
    const int16Data = new Int16Array(data.length);
    for (let j = 0; j < data.length; j++) {
      int16Data[j] = Math.round(data[j] * 32767);
    }
    channelData.push(int16Data);
  }

  // 构造WAV文件头
  const wavHeader = new ArrayBuffer(44);
  const view = new DataView(wavHeader);

  // RIFF头
  writeString(view, 0, 'RIFF'); // RIFF标记
  view.setUint32(4, 36 + channelData[0].length * 2 * numberOfChannels, true); // 文件大小（不包括RIFF头）
  writeString(view, 8, 'WAVE'); // WAVE标记

  // 格式块
  writeString(view, 12, 'fmt '); // 格式块标记
  view.setUint32(16, 16, true); // 格式块大小
  view.setUint16(20, 1, true); // 格式类型（1表示PCM）
  view.setUint16(22, numberOfChannels, true); // 声道数
  view.setUint32(24, sampleRate, true); // 采样率
  view.setUint32(28, sampleRate * 2 * numberOfChannels, true); // 字节率
  view.setUint16(32, 2 * numberOfChannels, true); // 块对齐
  view.setUint16(34, 16, true); // 位深度

  // 数据块
  writeString(view, 36, 'data'); // 数据块标记
  view.setUint32(40, channelData[0].length * 2 * numberOfChannels, true); // 数据大小

  // 合并所有音频数据
  const wavData = new Uint8Array(wavHeader.byteLength + channelData[0].length * 2 * numberOfChannels);
  new Uint8Array(wavHeader).forEach((byte, index) => {
    wavData[index] = byte;
  });
  let offset = wavHeader.byteLength;
  for (let i = 0; i < channelData[0].length; i++) {
    for (let j = 0; j < numberOfChannels; j++) {
      wavData[offset++] = channelData[j][i] & 0xFF;
      wavData[offset++] = (channelData[j][i] >> 8) & 0xFF;
    }
  }

  // 创建wav格式的Blob对象
  const wavBlob = new Blob([wavData], { type: 'audio/wav' });

  return wavBlob;
}

export class AudioRecoder {
  private _sampleRate: number;
  private _channleCount: number;
  private _chunkSize: number;
  private _audioContext: AudioContext | null = null;
  private _mediaStream: MediaStream | null = null;
  private _audioWorkletNode: AudioWorkletNode | null = null;
  private _audioBuffer: number[] = [];
  private _onFloat32AudioChunk?: (chunk: Float32Array) => void;
  private _onUint8AudioChunk?: (chunk: Uint8Array) => void;
  private _isPaused: boolean = false;

  constructor(
    sampleRate = 16000, 
    channleCount = 1, 
    chunkSize = 16000 / 1000 * 60 * 2, // 60ms数据(字节数, 一个frame 16位, 2个byte)
    onUint8AudioChunk?: (chunk: Uint8Array) => void,
    onFloat32AudioChunk?: (chunk: Float32Array) => void
  ) {
    this._sampleRate = sampleRate;
    this._channleCount = channleCount;
    this._chunkSize = chunkSize;
    this._onFloat32AudioChunk = onFloat32AudioChunk;
    this._onUint8AudioChunk = onUint8AudioChunk;
  }

  pause(): void {
    this._isPaused = true;
    // 清空音频缓冲区，避免恢复时播放旧数据
    this._audioBuffer = [];
  }

  resume(): void {
    this._isPaused = false;
  }

  isPaused(): boolean {
    return this._isPaused;
  }

  async start() {
    // 获取麦克风权限，优化音频质量设置
    this._mediaStream = await navigator.mediaDevices.getUserMedia({
      audio: {
        sampleRate: this._sampleRate,
        channelCount: this._channleCount,
        // 回声消除
        echoCancellation: true,
        // 噪声抑制
        noiseSuppression: true,
        // 自动增益控制
        autoGainControl: true
      }
    });
    // 创建AudioContext对象
    this._audioContext = new (window.AudioContext || (window as any).webkitAudioContext)({
      sampleRate: this._sampleRate
    });
    // 创建AudioWorkletNode对象
    await this._audioContext.audioWorklet.addModule(
      // URL.createObjectURL(new Blob([
      //   `
      //   class AudioProcessor extends AudioWorkletProcessor {
      //       process(inputs, outputs, parameters) {
      //           const input = inputs[0];
      //           if (input && input[0]) {
      //               // 将Float32Array转换为Int16Array
      //               const float32Data = input[0];
      //               const int16Data = new Int16Array(float32Data.length);
      //               for (let i = 0; i < float32Data.length; i++) {
      //                   const sample = Math.max(-1, Math.min(1, float32Data[i]));
      //                   int16Data[i] = sample < 0 ? sample * 0x8000 : sample * 0x7FFF;
      //               }
      //               this.port.postMessage(int16Data);
      //           }
      //           return true;
      //       }
      //   }
      //   registerProcessor('audio-processor', AudioProcessor);
      //   `
      // ], { type: 'application/javascript' }))

      URL.createObjectURL(new Blob([
        `
        class AudioProcessor extends AudioWorkletProcessor {
            process(inputs, outputs, parameters) {
                const input = inputs[0];
                if (input && input[0]) {
                    const float32Data = input[0];
                    this.port.postMessage(float32Data);
                }
                return true;
            }
        }
        registerProcessor('audio-processor', AudioProcessor);
        `
      ], { type: 'application/javascript' }))
    );
    const source = this._audioContext.createMediaStreamSource(this._mediaStream);
    this._audioWorkletNode = new AudioWorkletNode(this._audioContext, 'audio-processor');
    this._audioWorkletNode.port.onmessage = (event) => {
      this.processAudioData(event.data);
    }
    source.connect(this._audioWorkletNode);
  }

  stop(): void {
    if (this._audioWorkletNode) {
        this._audioWorkletNode.disconnect();
        this._audioWorkletNode = null;
    }

    if (this._mediaStream) {
        this._mediaStream.getTracks().forEach(track => track.stop());
        this._mediaStream = null;
    }

    if (this._audioContext) {
        this._audioContext.close();
        this._audioContext = null;
    }
  }

  private processAudioData(audioData: Float32Array): void {
    // 如果暂停，不处理音频数据
    if (this._isPaused) {
      return;
    }

    // 音频预处理：降噪和增强
    const processedAudio = this.preprocessAudioData(audioData);
    
    if (this._onFloat32AudioChunk) {
      this._onFloat32AudioChunk(processedAudio);
    }
    
    // float32转int16，使用更精确的转换
    const int16Data = new Int16Array(processedAudio.length);
    for (let i = 0; i < processedAudio.length; i++) {
        const sample = Math.max(-1, Math.min(1, processedAudio[i]));
        int16Data[i] = sample < 0 ? sample * 0x8000 : sample * 0x7FFF;
    }
    
    // 将Int16Array转换为字节数组
    const bytes = new Uint8Array(int16Data.length * 2);
    for (let i = 0; i < int16Data.length; i++) {
        const sample = int16Data[i];
        bytes[i * 2] = sample & 0xFF;         // 低字节
        bytes[i * 2 + 1] = (sample >> 8) & 0xFF; // 高字节
    }

    // 添加到缓冲区
    for (let i = 0; i < bytes.length; i++) {
        this._audioBuffer.push(bytes[i]);
    }

    // 如果缓冲区达到目标大小，发送音频块
    while (this._audioBuffer.length >= this._chunkSize) {
        const chunk = new Uint8Array(this._audioBuffer.splice(0, this._chunkSize));
        if (this._onUint8AudioChunk) {
            this._onUint8AudioChunk(chunk);
        }
    }
  }

  // 音频预处理方法
  private preprocessAudioData(audioData: Float32Array): Float32Array {
    const processed = new Float32Array(audioData.length);
    
    // 1. 音量标准化
    let maxAmplitude = 0;
    for (let i = 0; i < audioData.length; i++) {
        maxAmplitude = Math.max(maxAmplitude, Math.abs(audioData[i]));
    }
    
    if (maxAmplitude > 0) {
        const normalizationFactor = 0.8 / maxAmplitude;
        for (let i = 0; i < audioData.length; i++) {
            processed[i] = audioData[i] * normalizationFactor;
        }
    }
    
    // 2. 简单的高通滤波（去除低频噪音）
    const alpha = 0.95;
    for (let i = 1; i < processed.length; i++) {
        processed[i] = alpha * (processed[i] - processed[i - 1]) + processed[i - 1];
    }
    
    // 3. 动态范围压缩
    const threshold = 0.1;
    const ratio = 0.3;
    for (let i = 0; i < processed.length; i++) {
        const absValue = Math.abs(processed[i]);
        if (absValue > threshold) {
            const compressed = threshold + (absValue - threshold) * ratio;
            processed[i] = processed[i] > 0 ? compressed : -compressed;
        }
    }
    
    return processed;
  }
}