繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

騰訊雲正式發佈向量數據庫,已應用於QQ瀏覽器、騰訊遊戲等業務場景

2023-07-05 08:45

7月4日,騰訊雲正式發佈國內首個AI原生(AI Native)的自研向量數據庫(Tencent Cloud Vector DB),預計 8月上線騰訊雲官網。

據介紹,該數據庫是騰訊自研、基於內部多年運營積累的分佈式向量數據庫,已經過騰訊海量業務場景驗證,日均處理向量檢索千億次,支持標量+向量的混合檢索,具有高性能、大容量等特點,支持全內存索引。主要面向大模型訓練,讓企業原先花一個月時間才能完成的大模型接入,縮短到三天時間。

天眼查App顯示,騰訊科技(深圳)有限公司於近日申請註冊兩枚「TENCENT CLOUD VECTORDB」商標,國際分類為科學儀器、網站服務,當前商標狀態為申請中。

騰訊雲數據庫副總經理羅雲指出,向量數據庫已經在QQ瀏覽器、騰訊視頻、騰訊遊戲、QQ音樂、搜狗輸入法等上百個業務場景應用,每日調用量超千億次。其中,支撐QQ音樂人均聽歌時長提升3.2%,QQ瀏覽器成本降低37.9%,騰訊視頻有效曝光人均時長提升1.74%。

其還自研了分佈式向量數據庫核心引擎Olama,原ElasticFaiss。據瞭解,Olama最早於2019年4月進行孵化,目前可支持十億級別的單行向量數據索引、查詢QPS達到百萬、響應延迟在20毫秒。

向量數據庫源自騰訊集團每日處理千億次檢索的向量引擎(OLAMA),單索引支持10億級向量規模,更適用於AI運算、檢索,數據接入AI的效率也比傳統方案提升10倍。

針對大模型場景,向量數據庫在接入層、計算層、存儲層實現了全面AI化:在接入層,智能化支持自然語言文本的直接檢索;在計算層,通過AI算子替代企業尋找/調優AI算法,將接入工期從一個月縮短到3天;在存儲層,融合智能壓縮算法,把向量存儲成本降低50%。

此外,騰訊雲在6月19日首次公佈了其行業大模型研發進展,依託騰訊雲TI平臺打造行業大模型精選商店,為客户提供MaaS(Model-as-a-Service)一站式服務,技術底座來自騰訊全棧能力,提供高性能計算集羣HCC、高性能網絡、向量數據庫等基礎設施。

4月,騰訊雲發佈了專為大模型訓練設計的新一代HCC高性能計算集羣,採用最新一代的騰訊雲星星海自研服務器,具備業界最高的3.2Tbps互聯帶寬,算力性能提升3倍。

一直以來,騰訊在產業互聯網中的定位是做產業的「數字化助手」,騰訊雲作為中國雲市場的頭部廠商,目前形成了四級加速框架,為產業輸出從底層算力支撐到AI開發平臺、到AI產品解決方案、再到頂層數智化轉型方法的四級全鏈條服務,是實現這一目標的重要動力引擎。

展望未來,「向量數據庫+大模型+數據」將產生「飛輪效應」,共同助力企業步入AI Native(AI原生)時代。騰訊雲也將繼續打磨技術能力,提供更堅實的AI基礎設施。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。