音视频基础

音视频入门基础知识详解

一、视频的概念

视频(Video)泛指将一系列静态影像以电信号的方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。连续的图像变化每秒超过24帧(frame,fps)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面;看上去是平滑连续的视觉效果,这样连续的画面叫做视频。

二、音视频主要场景

场景 说明 数据流方向
点播 录制与观看不同时 单向下行
直播 实时录制与观看 单向上下行
互动直播 实时录制、观看与互动 双向上下行
即时通讯 实时传递文件/语音/视频 双向上下行
推流 单向上行 单向上行

三、视频技术原理

1. 视频编码

视频编码是通过压缩技术将视频格式转换为另一种格式的技术。常见的视频编码标准有:

  • H.264/AVC:目前最流行的视频编码标准,压缩效率高,兼容性好
  • H.265/HEVC:H.264的继任者,相同画质下体积更小
  • VP9:Google开发的开源编码,WebM格式的默认编码器
  • AV1:新一代开源编码,压缩效率最高

2. 视频封装

视频封装是将视频流、音频流、字幕流等封装到一个容器中。常见的封装格式有:

  • MP4:最通用的视频封装格式,兼容性强
  • MKV:开源容器,支持多音轨、多字幕
  • AVI:微软开发的老旧格式
  • MOV:Apple QuickTime格式

3. 视频参数

参数 说明
分辨率 视频画面的像素尺寸,如1920×1080、3840×2160
帧率(FPS) 每秒显示的帧数,如24fps、30fps、60fps
码率(Bitrate) 每秒传输的数据量,单位kbps或Mbps
比特率 视频清晰度的重要指标,码流越大越清晰

四、音频技术原理

1. 音频编码

常见的音频编码格式:

  • AAC:高级音频编码,压缩效果好,音质优秀
  • MP3:最流行的音频格式,兼容性好
  • FLAC:无损音频压缩
  • Opus:高质量音频编码,适合语音

2. 音频采样

音频采样是将模拟音频信号转换为数字信号的过程:

  • 采样率:每秒采样次数,如44.1kHz、48kHz
  • 位深:每个样本的位数,如16bit、24bit
  • 声道数:单声道、立体声、环绕声

五、音视频协议

1. 流媒体协议

协议 说明
HLS HTTP Live Streaming,苹果开发的流媒体协议
DASH Dynamic Adaptive Streaming over HTTP,动态自适应流
RTMP Real-Time Messaging Protocol,实时消息传输协议
WebRTC Web Real-Time Communication,网页实时通信
RTSP Real Time Streaming Protocol,实时流协议

2. 传输协议

  • HTTP/HTTPS:最常用的数据传输协议
  • RTP:实时传输协议,用于音视频传输
  • RTCP:实时传输控制协议
  • SRT:安全可靠传输协议

六、音视频处理流程

1. 视频处理流程

  1. 采集 → 编码 → 封装 → 传输 → 解码 → 渲染
  2. 采集:摄像头、屏幕录制等
  3. 编码:H.264/H.265压缩
  4. 封装:MP4/MKV容器
  5. 传输:网络传输
  6. 解码:解压缩
  7. 渲染:显示到屏幕

2. 音频处理流程

  1. 采集 → 编码 → 传输 → 解码 → 播放
  2. 采集:麦克风录制
  3. 编码:AAC/MP3压缩
  4. 传输:网络传输
  5. 解码:解压缩
  6. 播放:扬声器输出

七、总结

音视频技术是现代多媒体应用的基础。理解音视频的采集、编码、传输、解码和播放流程,以及相关的协议和参数,对于开发多媒体应用非常重要。希望这篇文章能帮助你建立起音视频的基础知识框架。