- 百度智能云視頻云 全生命周期實現“質”與“智”的變革
- 2020年05月06日 來源:至頂網CIO與CTO頻道
提要:一場突如其來的疫情瞬間點燃了用戶的線上需求,導致線上流量正在成指數級爆發,幾個月內視頻行業已經成為一個高速增長的行業。報告顯示,疫情期間,在線視頻行業用戶規模較平日上漲17.4%,日人均使用時長超過1.5小時。
04月30日 北京消息(文/王聰彬):一場突如其來的疫情瞬間點燃了用戶的線上需求,導致線上流量正在成指數級爆發,幾個月內視頻行業已經成為一個高速增長的行業。報告顯示,疫情期間,在線視頻行業用戶規模較平日上漲17.4%,日人均使用時長超過1.5小時。
視頻行業從2014年左右開始爆發,到現在的直播、短視頻,早期更多聚焦在互聯網娛樂行業。疫情的到來也給視頻行業帶來了兩大變化,第一、互聯網流量普漲,幾乎所有的視頻類的業務都增長了將近30%—50%,有的甚至是幾倍;第二、在線教育、在線辦公、直播電商等需求大量爆發。
“疫情就像一個催化劑,讓某一些需求提前爆發,其實這些需求在之前就已經有出現或者發展的跡象。”百度智能云視頻云產品負責人孫麗表示,如果沒有疫情,這些業務在未來也會出現暴漲,但是時間可能需要繼續推遲,而且疫情期間互聯網在連接的本質上承擔了更大的作用。
在日益增高的流量下,視頻行業也迎來帶來了一定的挑戰,因為視頻平臺依舊要提供和之前一樣優質、無卡頓的用戶體驗,而且隨著視頻向行業的應用滲透,企業也提出了越來越多的需求,提供一站式的視頻云服務,降低視頻的生產制作門檻才能帶來視頻時代的真正繁榮。
云幫助視頻體驗一步到位
為用戶提供一個更加穩定無卡頓,秒開的體驗一直是視頻行業的目標。對于視頻行業而言,用戶體驗可以分為三個維度:
網絡性能層面:視頻觀看的性能體驗,包括視頻是否流暢、卡頓,畫面是否清晰,是否穩定,直播能否做到更低的延遲,在線上課能否不卡頓不花屏等。
內容交互層面:在視頻內容爆發的今天,視頻內容決定了用戶的去留,要考慮視頻內容質量是否高,內容是否有趣。雖然當前是人人皆媒的時代,但是內容生產還是具有一定的難度,尤其是專業的內容制作。
連接效率層面:互聯網已經從搜索模式轉為feed模式,數以萬億的視頻內容如何更好的推薦給感興趣的人,是當前視頻APP體驗重要的一環。例如抖音每天有308萬個親子視頻,這些內容如何找到對他們感興趣的人,讓連接更有效率也是目前的一個難題。
在用戶體驗上,很多問題都可以通過技術進行提升和解決,尤其是云帶來的性能體驗的全方位提升。孫麗表示,百度智能云基于百度的CDN、存儲能力、直播能力、音視頻能力、視頻編解碼能力、結合視頻AI技術構建出整套的應對方案,可以幫助企業解決視頻的性能體驗、內容生產及視頻推薦的難題,讓企業的視頻體驗一步到位。
視頻全生命周期的能力覆蓋
目前視頻技術的整體挑戰還是比較大,AR特效、人臉識別、分發、編解碼、通信等,百度智能云將能力進行打包通過一站式的視頻云解決方案降低企業進入視頻行業的門檻。
百度智能云立足于百度全面的ABC底層技術,在AI方面:百度大腦開放228項AI能力,覆蓋語音技術、視覺技術、自然語言處理、知識圖譜、視頻分析各類能力;在大數據方面:擁有世界最大的深度神經網絡(DNN)(萬億級別參數,千億樣本,千億特征訓練);在云計算方面:擁有亞洲單體最強大的算力平臺,300萬顆CPU核、6EB級存儲容量,為視頻處理提供了強大的算力基礎。
百度智能云視頻云由三個層面構成,第一、技術層面;第二、視頻平臺層面;第三、應用場景層面。孫麗指出,我們的目標是實現視頻全生命周期的覆蓋,從視頻的生成、存儲、計算、分發、播放、變現,同時讓場景構建極度簡單化。
百度智能云視頻云包含了十幾款產品,其中主要的產品包括:CDN、視頻直播、視頻轉碼、短視頻SDK、視頻分析、音視頻通信等。
CDN:CDN一直是各家企業的IT支出大頭,百度智能云視頻云具備海量的資源,在國內有1000+節點,在全球有200+節點,有100T+的儲備帶寬;具備極致性能,卡頓比<5%,失敗率<0.01%,有專線支持,實現分鐘級別的故障切換,目前日均處理7000億次請求;在能力上支持IPV6、動態加速、QUIC、內容審核、HTTP2、大數據可視化報表;在自服務產品屬性上可編程CDN、實時日志與數據系統,專業的售后團隊;在邊緣計算的創新實現從內容分發到計算分發。
視頻直播:直播作為一種互動性非常強的視頻形態未來會持續加強行業滲透,當前可能是在娛樂、電商、在線教育、未來直播會往更多的行業和場景滲透。同時直播技術本身也朝著更低延遲的方向發展,百度智能云音視頻直播LSS服務基于1000+CDN節點搭建,節點遍布全球24個國家和地區,通過鏈路智能優化,最優節點選擇,多線BGP解決跨運營商時延及穩定性問題。通過首屏秒開技術,實現毫秒級出現直播畫面。通過追幀播放技術,將端到端的直播時延降到最低。基于場景優化的高質量實時轉碼算法,相同畫質相比友商節省10%~30%流量帶寬。同智能視頻SDK打通,提供視覺特效和實時美顏能力。
視頻轉碼:智感超清轉碼集合了多種視覺AI與編碼技術,通過AI模型對畫面內容進行深度感知學習,根據視頻場景及復雜度,智能調節編碼參數,并優化主觀視覺體驗,以更小的碼率獲得更好的編碼質量。在智能編碼層面,內容自適應動態分配碼率,基于內容自適應動態分配碼率等編碼參數,以更小的傳輸帶寬,獲得更高的編碼質量及更優的視覺體驗。圖像超分辨率技術是基于深度學習的圖像超分辨率技術,可以將低分辨率圖像重建成高分辨率圖像(SD → SD or HD → 4K),并且重建圖像細節。畫質修復和色彩增強支持畫質修復將馬賽克、偽影、毛刺等這些人眼主觀厭惡的內容細節去除,同時進行色彩增強,自適應調整色彩飽和度、對比度,讓色彩更鮮艷,讓暗部細節更突出,大大提升畫面整體觀感。
視頻拍攝SDK:特效可以強化視頻拍攝的趣味性,在特效層面可以支持,5種手勢識別、2種屏幕交互、150個人臉識別點、SLAM(在空間平面放置IP形象)、空間粒子(下雪、下雨、飄花瓣)、觸屏手勢粒子、天空頂、AI摳圖等。可以實現人臉特效、手勢特效、肢體特效、微整形、美體、輕美妝、環境特效等能力,讓內容可以突破次元壁達到現實和虛擬的融合。在生態上,聯合太合音樂推出正版音樂曲庫,具備原創版權音樂能力。而且即將推出智能編輯能力和貼紙生產能力。
視頻分析:百度智能云提出了視頻AI概念,百度在視頻理解領域大賽ActivityNet,人臉檢測和對比FDDB FLW大賽上都獲得過世界冠軍。在場景識別上能夠支持5000種分類,在物體識別上支持40000種,并能提取多大4000多種特征。使用這種能力相對人去分析,能夠有上萬倍的效率提升。在視頻審核方面通過對圖像、語音、文本等多模數據分析,能夠對涉政、涉黃、暴恐、違禁、廣告等多方面進行審核。借助視頻DNA和黑庫技術,支持去重和侵權的檢測、促進視頻內容健康分發。
音視頻通信:未來視頻領域實時音視頻通信將會成為非常關鍵的技術,因為視頻一定是往互動性更強的方向發展的。百度智能云RTC產品包括四大優勢:1、極致的通話體驗:超低延遲和超高穩定性,端到端延遲達到200ms~300ms,99.99%的服務可用性。自研抗弱網算法,弱網環境下保證高質量通信,抗丟包率30%。語音智能降噪技術讓通話更加清晰;2、更高清的視頻體驗,支持4K的視頻通話能力;3、更智能的玩法,集成的智能視頻SDK的AR拍攝玩法,讓互動更有意思。提供人臉識別、語音識別等能力用于身份核驗、學生狀態監測等更多場景;4、便捷的功能:旁路直播、云端錄制、IM即時通信、屏幕分享等能力讓客戶使用更加簡單易用。
視頻場景還有更多想象空間
百度智能云視頻云通過一站式的服務大幅降低了企業進入視頻的門檻,在行業中也得到了廣泛的應用。
好看視頻就是基于百度智能云視頻云一站式的搭建,除了擁有優質的觀看體驗外,在視頻推薦方面進行了用戶體驗增強。目前好看視頻擁有數百億的媒資數,日處理超過百萬新視頻,幫助用戶實現快速穩定的視頻內容觀看。同時好看視頻支撐了2019 春晚的流量洪峰,體現了百度智能云視頻云的彈性,以及AI層面的整體能力。
在4G時代視頻已經迎來了爆發,5G、邊緣計算的新興技術,則將賦予視頻更多新的使命。孫麗表示,作為新基建技術的5G又引起大家的討論熱潮,作為下一代通信技術,5G將帶來的底層技術的變革以及上層應用的創新。
而且視頻已經在從信息傳播的一種媒介或載體,升級到了新的應用形態。這種變化主要表現在三個層面:
第一、視頻將無處不在:除了視頻內容的爆發,視頻的生產也更加多元化,從4G時代的人人皆媒,5G時代物聯網興起,物設備也成為視頻生產的重要來源,而生產和消費的邊界也將模糊化;
第二、視頻的體驗更加多樣,朝著超高清4K、8K方向發展,低延遲和沉浸感三個方向發展,同時也為視頻技術帶來了新的挑戰;
第三、視頻+行業成為趨勢,視頻從只應用于互聯網娛樂,逐漸向如在線教育、遠程醫療、安防監控、工業、智能城市、智慧家庭等行業滲透,成為這些行業重要的信息媒介與決策依據。
總結而言,在視頻形態多樣化、受眾群體擴大、行業不斷滲透的同時,也帶來形式創新、視覺體驗、流暢極速、智能化理解等各方面的需求挑戰。百度智能云基于ABC的核心技術能力,通過服務化、智能化和場景化來提供綜合的視頻云平臺,從服務更多的流量和計算走向服務更好的效率和理解,在視頻的生產、管理、分析、分發、變現的全生命周期幫助客戶實現從“質”到“智”的變革。