繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

這家初創公司聲稱能分辨真人聲音還是AI假冒

2024-09-02 16:23

  最新的人工智能技術幾乎可以模仿任何人的聲音——總統、某位親屬或銀行客户。

  這就是成立已有十年的音頻技術初創公司Pindrop Security 要解決的問題和機遇。該公司長期為銀行和保險公司提供語音認證服務。最近,它發佈了一款新產品,稱其可以檢測電話和數字媒體內容中由人工智能生成的語音。該公司正向媒體、政府機構和社交網絡推銷這項功能。

  Pindrop是越來越多具有安全意識、意欲打擊人工智能造假和欺詐威脅的公司之一。Protect AI 和薩姆·奧爾特曼(Sam Altman)麾下的Tools For Humanity Corp.(即Worldcoin,通過掃描眼睛來識別人的身份)等都屬於這類公司。

  Pindrop專注於音頻領域,今年1月,該公司因檢測到美國總統拜登的聲音通過自動語音電話唆使人們不要在新罕布什爾州初選中投票的深度偽造來源而登上了新聞頭條。攻擊的規模在不斷擴大:該公司稱,自去年以來,針對其客户的未遂攻擊數量增加了五倍多。

  SocialProof Security的首席執行官雷切爾·託巴克(Rachel Tobac)説:「把語音克隆和欺騙軟件結合起來,偽裝成其他人在打電話,非常容易辦到。」

  Pindrop從一批知名投資者那里獲得了融資,包括Andreessen Horowitz和GV。今年,該公司又從Hercules Capital 獲得了1億美元債務融資。其最新估值為9.25億美元。

  聯合創始人維賈伊·巴拉蘇布拉馬尼揚(Vijay Balasubramaniyan)攻讀博士期間在印度旅行時曾想購買一套西裝,之后他開始思考音頻造假問題。他開户的某美國銀行在當地時間凌晨3點左右打電話給他覈實交易,問他的社保號碼。由於無法覈實來電者是誰,銀行也沒有提供太多信息,他就掛斷了電話。

  「這太奇怪了,」巴拉蘇布拉馬尼揚回憶起他在回美國的飛機上的想法,「亞歷山大·格雷厄姆·貝爾(Alexander Graham Bell)發明電話已經很久了,但我們仍然沒有辦法識別電話的另一頭是誰。」(他沒買到那套西裝。)

  Pindrop的技術通過分析音頻來判斷聲音是屬於真人,還是與人相像。巴拉蘇布拉馬尼揚説,人類通過發出特定的聲音來説話,用聲音組成單詞。但機器的發音不像人類,偶爾會產生一些變化,超出人嘴發音的物理限制。由於每秒鍾的語音音頻可以採集8000個樣本,人工智能有可能在幾千個地方出錯。

  巴拉蘇布拉馬尼揚説:「隨着你獲得的音頻越來越多,你就會發現這些異常現象。」他補充説,由於人類的發音方式都一樣,因此他們的檢測軟件與語言種類無關。

  該公司稱,其新工具可識別人工智能生成的音頻,準確率在99%,但業內對人工智能檢測的侷限性仍有爭議。對於教師、研究人員和社交媒體用户來説,隨着技術的進步,識別人工智能生成的文字和圖像一直是令人頭疼的問題。今年3月,OpenAI發佈了一款可以複製人聲的工具,該公司在一篇博文中建議,企業對於訪問銀行賬户和其他敏感信息應逐步淘汰基於語音的身份驗證方法。

  在Pindrop擔任董事的思科系統公司前總裁約翰·錢伯斯(John Chambers)認為,語音ID是一種異常安全的在線身份驗證方式。錢伯斯通過他的公司JC2 Ventures投資了這家初創公司。「語音將成為未來識別身份的主要網絡安全驗證方式,」他説,當語音與生物特徵識別和所使用設備的相關數據結合起來時,「幾乎不可能有人完全破解。」

  一些業內人士對應對人工智能問題的人工智能公司數量增多表達了疑慮。身份盜竊研究中心(Identity Theft Research Center)的詹姆斯·李(James E. Lee)説,除非通過法律來減少網上可獲得的個人數據數量,否則業界就可能捲入好壞人工智能之間的長期爭鬥之中。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。