熱門資訊> 正文
2023-07-05 08:45
7月4日,騰訊雲正式發佈國內首個AI原生(AI Native)的自研向量數據庫(Tencent Cloud Vector DB),預計 8月上線騰訊雲官網。
據介紹,該數據庫是騰訊自研、基於內部多年運營積累的分佈式向量數據庫,已經過騰訊海量業務場景驗證,日均處理向量檢索千億次,支持標量+向量的混合檢索,具有高性能、大容量等特點,支持全內存索引。主要面向大模型訓練,讓企業原先花一個月時間才能完成的大模型接入,縮短到三天時間。
天眼查App顯示,騰訊科技(深圳)有限公司於近日申請註冊兩枚「TENCENT CLOUD VECTORDB」商標,國際分類為科學儀器、網站服務,當前商標狀態為申請中。
騰訊雲數據庫副總經理羅雲指出,向量數據庫已經在QQ瀏覽器、騰訊視頻、騰訊遊戲、QQ音樂、搜狗輸入法等上百個業務場景應用,每日調用量超千億次。其中,支撐QQ音樂人均聽歌時長提升3.2%,QQ瀏覽器成本降低37.9%,騰訊視頻有效曝光人均時長提升1.74%。
其還自研了分佈式向量數據庫核心引擎Olama,原ElasticFaiss。據瞭解,Olama最早於2019年4月進行孵化,目前可支持十億級別的單行向量數據索引、查詢QPS達到百萬、響應延迟在20毫秒。
向量數據庫源自騰訊集團每日處理千億次檢索的向量引擎(OLAMA),單索引支持10億級向量規模,更適用於AI運算、檢索,數據接入AI的效率也比傳統方案提升10倍。
針對大模型場景,向量數據庫在接入層、計算層、存儲層實現了全面AI化:在接入層,智能化支持自然語言文本的直接檢索;在計算層,通過AI算子替代企業尋找/調優AI算法,將接入工期從一個月縮短到3天;在存儲層,融合智能壓縮算法,把向量存儲成本降低50%。
此外,騰訊雲在6月19日首次公佈了其行業大模型研發進展,依託騰訊雲TI平臺打造行業大模型精選商店,為客户提供MaaS(Model-as-a-Service)一站式服務,技術底座來自騰訊全棧能力,提供高性能計算集羣HCC、高性能網絡、向量數據庫等基礎設施。
4月,騰訊雲發佈了專為大模型訓練設計的新一代HCC高性能計算集羣,採用最新一代的騰訊雲星星海自研服務器,具備業界最高的3.2Tbps互聯帶寬,算力性能提升3倍。
一直以來,騰訊在產業互聯網中的定位是做產業的「數字化助手」,騰訊雲作為中國雲市場的頭部廠商,目前形成了四級加速框架,為產業輸出從底層算力支撐到AI開發平臺、到AI產品解決方案、再到頂層數智化轉型方法的四級全鏈條服務,是實現這一目標的重要動力引擎。
展望未來,「向量數據庫+大模型+數據」將產生「飛輪效應」,共同助力企業步入AI Native(AI原生)時代。騰訊雲也將繼續打磨技術能力,提供更堅實的AI基礎設施。