AI大戰/AI大戰升級 OpenAI推新模型GPT-4o

　　圖：OpenAI於13日舉行GPT-4o發布會。\網絡圖片

　　美國科企OpenAI於13日推出其旗艦人工智能（AI）系統的新版本GPT-4o，該AI系統能夠以更快的速度處理文本、音頻和圖像，反應速度幾乎達到人類水平，還能通過語音語調或面部表情檢測人類的情緒。美媒注意到，OpenAI似乎特意選擇在谷歌年度開發者大會前一天推出新AI系統，這表明科技巨頭之間的AI大戰愈發激烈。AI技術快速發展也引起一些擔憂，OpenAI被指用受版權保護的作品訓練AI，並因此捲入訴訟。

　　【大公報訊】當地時間13日，OpenAI推出新的AI系統GPT-4o，其中的「o」代表「一切（omni）」。OpenAI公司首席技術官穆拉蒂在直播演示中展示了GPT-4o如何分析計算機代碼、為分別說意大利語和英語的兩人提供翻譯、指導用戶解答數學題等。該公司稱，GPT-4o可以在最快232毫秒的時間內響應音頻輸入，平均響應時間為320毫秒，接近人類在交談中的響應速度。穆拉蒂說，GPT-4o的速度是目前頂級產品GPT-4 Turbo的兩倍，但成本只有後者的一半。

　　20日起，使用免費版ChatGPT的用戶將可以使用GPT-4o的圖像和視覺功能。GPT-4o內置一個語音助手，方便用戶使用。OpenAI首席執行官阿爾特曼稱，他和其他高管從2013年的電影《觸不到的她》（另譯《她》）中獲得靈感。這部電影講述了一個男人愛上語音助手的故事。GPT-4o還能通過語音語調或面部表情檢測人類的情緒，並快速切換自己的聲音和語調，這項功能將向每月付費20美元的ChatGPT-Plus用戶推出。

　　直播演示出錯將人臉當「木頭」

　　OpenAI此前的AI語音模式由三個獨立模型組成，第一個模型將音頻轉換為文本，第二個處理文本，第三個再將文本轉換回音頻。這一過程導致AI容易丟失信息，在多人同時說話或存在背景噪音時容易發生混淆，速度也不夠快。GPT-4o使用的則是一個綜合文本、圖像和音頻的新模型，準確性和速度得到提升。但OpenAI承認，這是該公司首個結合所有這些模式的模型，在探索模型功能及其局限性方面仍處於起步階段。

　　BBC指出，GPT-4o在直播演示中犯了一些錯誤。它在尚未讀取到寫着數學題的圖像時便開始「解題」，還一度把微笑着的人類面部識別為「木質表面」。

　　OpenAI高管不願透露訓練GPT-4o時使用了什麼樣的數據，也未透露OpenAI是否能利用較少的算力訓練該系統。法新社指出，圍繞版權問題的爭議持續困擾着AI企業。OpenAI已與美聯社、《金融時報》和德國阿克塞爾．施普林格集團簽署合作協議，但《紐約時報》去年底發起訴訟，指控該公司及其投資者微軟未經許可使用《紐約時報》文章訓練AI。包括《權力遊戲》作者喬治．馬丁在內的17名作家亦發起集體訴訟，指控OpenAI「大規模盜竊」受版權保護的作品，用於訓練AI。

　　谷歌AI新產品受關注

　　谷歌年度開發者大會14日舉行，預計亦將發布新的AI產品。美媒稱，科技巨頭之間的AI大戰愈發激烈。谷歌可能將推出全新AI助理，並繼續推廣生成式AI搜索體驗（SGE）。

　　《華盛頓郵報》稱，SGE令互聯網內容創作者感到擔憂。當用戶使用谷歌搜索引擎時，SGE會在一般的搜索結果前提供一段由AI生成的答案，AL使用的素材則是相關頁面上的內容。報道指出，用戶看完AI答案後很可能就不會再點擊被當作「素材」的頁面，導致內容創作者失去流量和收入。

（華爾街日報／

華盛頓郵報／BBC）

Related Posts

﻿特朗普四大刑事案現狀

﻿土耳其停止與以色列貿易往來

﻿多國將難民「打包」送至海外

發佈留言 取消回覆

特朗普四大刑事案現狀

土耳其停止與以色列貿易往來

多國將難民「打包」送至海外

發佈留言取消回覆