AI大戰/AI大戰升級 OpenAI推新模型GPT-4o

  圖:OpenAI於13日舉行GPT-4o發布會。\網絡圖片

  美國科企OpenAI於13日推出其旗艦人工智能(AI)系統的新版本GPT-4o,該AI系統能夠以更快的速度處理文本、音頻和圖像,反應速度幾乎達到人類水平,還能通過語音語調或面部表情檢測人類的情緒。美媒注意到,OpenAI似乎特意選擇在谷歌年度開發者大會前一天推出新AI系統,這表明科技巨頭之間的AI大戰愈發激烈。AI技術快速發展也引起一些擔憂,OpenAI被指用受版權保護的作品訓練AI,並因此捲入訴訟。

  【大公報訊】當地時間13日,OpenAI推出新的AI系統GPT-4o,其中的「o」代表「一切(omni)」。OpenAI公司首席技術官穆拉蒂在直播演示中展示了GPT-4o如何分析計算機代碼、為分別說意大利語和英語的兩人提供翻譯、指導用戶解答數學題等。該公司稱,GPT-4o可以在最快232毫秒的時間內響應音頻輸入,平均響應時間為320毫秒,接近人類在交談中的響應速度。穆拉蒂說,GPT-4o的速度是目前頂級產品GPT-4 Turbo的兩倍,但成本只有後者的一半。

  20日起,使用免費版ChatGPT的用戶將可以使用GPT-4o的圖像和視覺功能。GPT-4o內置一個語音助手,方便用戶使用。OpenAI首席執行官阿爾特曼稱,他和其他高管從2013年的電影《觸不到的她》(另譯《她》)中獲得靈感。這部電影講述了一個男人愛上語音助手的故事。GPT-4o還能通過語音語調或面部表情檢測人類的情緒,並快速切換自己的聲音和語調,這項功能將向每月付費20美元的ChatGPT-Plus用戶推出。

  直播演示出錯 將人臉當「木頭」

  OpenAI此前的AI語音模式由三個獨立模型組成,第一個模型將音頻轉換為文本,第二個處理文本,第三個再將文本轉換回音頻。這一過程導致AI容易丟失信息,在多人同時說話或存在背景噪音時容易發生混淆,速度也不夠快。GPT-4o使用的則是一個綜合文本、圖像和音頻的新模型,準確性和速度得到提升。但OpenAI承認,這是該公司首個結合所有這些模式的模型,在探索模型功能及其局限性方面仍處於起步階段。

  BBC指出,GPT-4o在直播演示中犯了一些錯誤。它在尚未讀取到寫着數學題的圖像時便開始「解題」,還一度把微笑着的人類面部識別為「木質表面」。

  OpenAI高管不願透露訓練GPT-4o時使用了什麼樣的數據,也未透露OpenAI是否能利用較少的算力訓練該系統。法新社指出,圍繞版權問題的爭議持續困擾着AI企業。OpenAI已與美聯社、《金融時報》和德國阿克塞爾.施普林格集團簽署合作協議,但《紐約時報》去年底發起訴訟,指控該公司及其投資者微軟未經許可使用《紐約時報》文章訓練AI。包括《權力遊戲》作者喬治.馬丁在內的17名作家亦發起集體訴訟,指控OpenAI「大規模盜竊」受版權保護的作品,用於訓練AI。

  谷歌AI新產品受關注

  谷歌年度開發者大會14日舉行,預計亦將發布新的AI產品。美媒稱,科技巨頭之間的AI大戰愈發激烈。谷歌可能將推出全新AI助理,並繼續推廣生成式AI搜索體驗(SGE)。

  《華盛頓郵報》稱,SGE令互聯網內容創作者感到擔憂。當用戶使用谷歌搜索引擎時,SGE會在一般的搜索結果前提供一段由AI生成的答案,AL使用的素材則是相關頁面上的內容。報道指出,用戶看完AI答案後很可能就不會再點擊被當作「素材」的頁面,導致內容創作者失去流量和收入。

(華爾街日報/

華盛頓郵報/BBC)

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *