在
數字樓宇可視對講中,可以考慮的音視頻同步方案有兩種:一是發送端解決;二是接收端解決。
發送端解決方法比較簡單,具體措施是在發送端先將一段時間內采集到音視頻數據打包。比如采集到一幀視頻圖像,將這幀圖像與采集這幀視頻的時間內采集到的視頻數據打成一個包,接收端接收到這個包之后解包分別播放就可以了。發送端解決的控制方法比較簡單,但是在高清要求清晰度比較高的情況下就不是很理想,清晰度高,意味著每個音視頻包數據量就大,能保證同步,卻難以保證連續。我們在同一個線程中按照先后順序發送PCM音頻和H.264視頻,測試結果表明這種方法確實存在連續問題。
接收端解決方案繞不開的問題是時間戳,接收端根據接收到的音視頻數據的時間戳安排播放。時間戳需要一個參考時間,而采集過程中視頻的時間是不定的,數字攝像頭采集圖像的幀率是一個平均值,不宜用來做參考時間,所以只能用音頻時間作為參考時間。
數字樓宇可視對講聲卡編程和聲卡驅動的時間機制 門禁可視對講中音頻是雙向的。本文的門禁可視對講方案中,音頻的采用PCM(PulseCODeModulation——脈碼調制錄音)采集,在網絡中傳送的也是原始數據,之所以沒有對音頻數據進行編碼處理是基于以下原因:一是S3C6410沒有提供對音頻的硬編解碼,如果使用軟件實現編解碼,在有限的系統資源條件下難以實現;二是音頻數據量較小:采用8000采樣率和量化位數為8位的語音標準,一秒的音頻數據是8K字節,只相當于視頻1幀數據的兩倍,這對普遍擁有百兆網卡的局域網來說,數據量很小。實驗的結果表明,這種簡單的處理方式被證明是有效的。