• 台灣網移動版

    台灣網移動版

ChatGPT掀起技術狂潮 “頂流”之下,看人工智慧喜與憂

2023-02-16 09:28:00
來源:科技日報
字號

  目前,ChatGPT還沒有通過圖靈測試的評估。其實,迄今為止,還沒有人工智慧模型能真正通過圖靈測試。

  去年11月,美國人工智慧研究公司OpenAI發佈了一款名為ChatGPT的聊天機器人,其在推出後的幾週內就風靡全球,甚至引發了一場新的全球人工智慧競賽。

  社交媒體推特首席執行官埃隆·馬斯克在使用ChatGPT後直呼其“好得嚇人”,甚至斷言“人工智慧越發強大,離對人類産生威脅不遠了”。

  《自動化與工作的未來》一書作者、美國雪城大學教授亞倫·貝納納夫説,200年前,人們對自動化技術産生了一波又一波的恐懼,人們看到新技術,就害怕它們會完全取代人類的勞動。

  今年2月初,ChatGPT開啟“狂飆”模式,引起新一輪瘋狂的技術升級、産業重構、資本狂潮、巨頭逐鹿。起初,隨著這波技術熱浪席捲全球而心情起伏不定的普羅大眾,經過一段“沉浸式”體驗,雖未感到恐懼,但仍不免有些擔憂。

  實現對話式AI的第一步

  ChatGPT僅發佈了2個月,月活躍用戶就超過了1個億。

  要知道,“1個億”可不是個小目標,達到這一數字,Facebook 用了4.5年,WhatsApp用了3.5年,Instagram用了2.5年,谷歌則用了將近一年。

  中國科學院自動化研究所研究員、數字內容技術與服務研究中心主任張樹武在接受科技日報記者採訪時表示,人們可以把ChatGPT視為繼語音、圖像視頻識別技術之後最複雜的語言識別技術突破,也是基於模式識別和深度學習的感知智慧技術發展的新躍遷。

  天津大學自然語言處理實驗室負責人、教授熊德意表示,從人工智慧發展角度看,這是一個重要的里程碑,其意義要高於7年前的“阿爾法狗”。

  他告訴記者,圍棋界的“阿爾法狗”刷新了普通大眾對人工智慧技術的看法,但是其本身並不能廣泛應用,普通大眾也難以與其直接接觸。

  ChatGPT則完全不同。

  與“阿爾法狗”相比,ChatGPT可以直接應用或支撐很多場景應用和産品。如果説“阿爾法狗”是技術應用的“陽春白雪”,那麼ChatGPT或許有機會成為“下裏巴人”。

  的確,在用戶們不懈努力地發掘ChatGPT的用途後,人們發現,它不僅僅是個聊天工具,還可以寫代碼、寫情書、寫論文,也可以線上問診,編寫情景腳本、詩歌、小説,甚至是擬定旅遊路線、回答腦筋急轉彎,可謂“有求必應”,功能強大到無法想像。

  ChatGPT在快速滲透各個行業,普通大眾都可以成為ChatGPT的用戶,這是其火爆出圈的重要原因。

  事實上,此前已有許多跟機器人聊天的相關應用,我們最熟悉的莫過於常用的智慧語音助手。ChatGPT與之有何不同呢?

  “智慧音箱採用的同樣是自然語言處理技術、對話式AI技術,但是語言智慧比較初級。很多情況下,我們只能與它們進行一問一答式的簡單對話。”熊德意説,“而ChatGPT,其底層技術不僅與一般的智慧音箱底層技術截然不同,而且要比它們強大得多,不僅如此,它改進了與它同類的技術InstructGPT的人類反饋數據收集形式,在與人對話中,可以基於歷史內容,支援連續多輪對話。”

  熊德意認為,ChatGPT是實現對話式AI的第一步。

  從網際網路層面來看,它可以作為資訊入口,與搜索引擎相結合;還可與辦公軟體結合,增強辦公效率;從人機交互角度看,它體現的是一種基於自然語言的交互方式,可以與元宇宙、數字人結合。此外,它還可以充當機器人大腦。

  “如果從人類資訊發展的尺度上看,它在人與機器之間的資訊介面方面有了很大突破。”熊德意如是説。

  “十八般武藝”樣樣精通

  ChatGPT使用了GPT-3技術,即第三代生成式預訓練Transformer(Generative Pretrained Transformer 3)。這是一種自回歸語言模型,使用深度學習來生成類似人類的文本。

  據英國廣播公司《科學焦點》雜誌介紹,GPT-3的技術看似簡單,例如它接受用戶的請求、聽取問題或提示並快速回答,但其實這項技術實現起來要複雜得多。該模型使用來自網際網路的文本數據庫進行訓練,包括從書籍、網路文本、維基百科、文章和網際網路其他文本中獲得的高達570GB的數據。更準確地説,它在5000億個單片語成的訓練數據上進行了高強度訓練。

  GPT-3.5是GPT-3微調優化後的版本,比後者更強大。ChatGPT正是由GPT-3.5架構的大型語言模型(LLM)所支援的。

  ChatGPT也可以被描述為一個自然語言處理(NLP)領域的人工智慧模型。這意味著它是一個能夠編碼、建模和生成人類語言的程式。

  作為一種語言模型,在大規模文本數據上進行自監督預訓練後,ChatGPT還需要經過三個階段的“煉製”。首先是監督微調階段,在該階段,人類AI訓練師既充當用戶,同時也是AI助理,以自我對話形式生成對話樣例,ChatGPT在這些對話樣例上進行有監督的訓練。

  接著,ChatGPT進入第二個階段。該階段的主要目的是訓練一個基於語言模型的獎勵模型,對機器生成的回復進行評分,為了訓練該獎勵模型,需要隨機抽取機器生成的文本,並採樣出多個不同版本,人類訓練師對這些不同版本進行偏好排序,排序的結果用於獎勵模型的訓練。

  基於訓練好的獎勵模型,第三個階段採用強化學習技術進一步微調ChatGPT。

  這項技術與眾不同之處在於,它能夠基於以上介紹的人類反饋強化學習技術,使生成的文本能夠與人類意圖和價值觀等進行匹配。

  無論懂不懂技術,全球網友都競相大開“腦洞”,試探ChatGPT到底有多“神”。據美國有線電視新聞網報道稱,有人要求它用《坎特伯雷故事集》的風格重寫上世紀90年代熱門歌曲《Baby Got Back》;有人寫了一封信,要求ChatGPT刪除信用報告中的不良賬戶;還有人詢問它以童話為靈感的家裝設計方案。

  自然語言處理技術撥雲見日

  一炮而紅後,ChatGPT概念股也跟著一路“狂飆”。有媒體報道,漢王科技9天收穫7個漲停板。自然語言處理研究是該公司主營業務,而ChatGPT背後的技術就是NLP。

  熊德意告訴記者,NLP是人工智慧的一個分支,最早誕生於機器翻譯,其歷史實際上比“人工智慧”名字的歷史還要悠久,至今已研究了70多年。簡單來説,該技術的目標就是要讓電腦或機器人能夠實現像人一樣具備聽、説、讀、寫、譯等方面的語言能力。

  “ChatGPT並非一項技術的一蹴而就,它是多種技術疊加在一起形成質變的産物,是NLP領域的結晶。”熊德意解釋,其底層技術,包括Transformer、自監督學習、微調、人類反饋強化學習(RLHF)、AI對齊等,在自然語言處理和人工智慧領域都有廣泛的研究和應用。

  “但ChatGPT將這些技術巧妙地結合在一起。它有效規避了大模型的未對齊行為,利用了大模型規模帶來的智慧突現能力,增強了大模型的指令學習能力和用戶意圖捕獲能力,解鎖了大模型的泛化能力。這些能力疊加在一起形成了ChatGPT的質變效果。”熊德意説。

  美國《邁阿密先驅報》報道稱,推特上的一位用戶在ChatGPT的幫助下參加了一次模擬SAT考試,得到了1020分(滿分1600分)。根據College Simply的數據,這只略低於平均水準。

  但當我們提問ChatGPT“你能幫我通過考試嗎”,它會善意地提醒我們不要利用它來作弊,並表示:“重要的是要記住,測試的目的是評估你對材料的理解和掌握程度。作弊,或者僅僅依靠像我這樣的外部來源,會破壞考試的價值,也不會促進學習或成長。”

  這是因為ChatGPT被加入了預先設計的“道德”準則,也就是上文提到的人類反饋強化學習。

  OpenAI表示:“這使該工具能夠回答後續問題、承認錯誤、挑戰不正確的前提並拒絕不適當的請求。”

  熊德意認為,這是因為RLHF有效提升了大模型的對齊能力,即如何讓AI模型的産出和人類的常識、認知、需求、價值觀保持一致。

  經過RLHF的“調教”,ChatGPT變得高度擬人化,可以學習並生成聽起來十分自然的回復。RLHF還使ChatGPT能夠理解指令並做出適當的響應,從而使對話更加真實。

  ChatGPT也因此迅速成為當下所有智慧聊天機器人中的“天花板”。

  雖觸手可及但無法取代人類

  隨著科技的發展,人工智慧技術一次又一次地超越了人們認為無法達到的極限,從1997年IBM“深藍”電腦首次在西洋棋中擊敗人類,到IBM人工智慧機器人“沃森”贏了智力競賽《危險邊緣》(Jeopardy),再從2016年“阿爾法狗”在圍棋大戰中戰勝人類,到2019年號稱“AI賭神”的Pluribus在德州撲克中碾壓人類玩家……

  現在,ChatGPT已經觸手可及,拉扯衝撞著人們慣有的參與生産生活的模式和框架,且繼續“狂飆”在超越人類的賽道上。“ChatGPT引發十大職業危機”“未來20種職業或被AI取代”等話題頻上熱搜。

  它真的會跟人類搶飯碗,甚至取代人類嗎?

  《邁阿密先驅報》報道稱,根據SortList對6個不同國家的500名ChatGPT用戶進行的一項調查,“打工人”已經在考慮其對自己所在行業意味著什麼。研究稱,大約23%在軟體和技術領域工作的員工擔心會因它失去工作,超過40%的僱主則表示有興趣“聘用”行銷文案花樣多多的ChatGPT。

  美國哥倫比亞廣播公司財富觀察欄目刊文稱,其他專業領域也可能會因此改變工作流程,包括中級寫作、廣告、媒體策劃和法律文件。

  “ChatGPT和其他人工智慧技術有可能改變工作的性質,但它們不會取代對人類的需求。”當把“是否會代替人類工作”的問題拋給ChatGPT時,它説,它們旨在協助和增強人工任務,而不是取代人類。它們作為人力資源的補充,並提高人類解決問題的能力,提升效率和效果。

  熊德意認為,目前來看,人工智慧更多的作用是提高人的效率,輔助人類。與此同時,大眾需要與時俱進,熟悉並掌控新技術,就像學習使用電腦、手機一樣,畢竟這些新技術一定會産生新的就業機會。

  尚無自主意識和思考能力

  英國哲學家德里克·帕菲特在著作《論重要之事》中將人類定義為“能夠給出理由並做出回應的生物”。ChatGPT是一個可以給出理由並做出回應的人工製品。它與人不同在哪?是否像人一樣有自我意識呢?

  發展至今,電腦已經變得更加成熟,但它們缺乏真正的理解力,而這些理解力是人類通過進化為嵌入社會實踐網路中的自主個體而培養起來的。這是人工智慧不具備的經歷。

  當問及ChatGPT時,它回答道:“我是一個機器學習模型,不像人類那樣擁有意識或自我意識。我也無法像人類一樣感受情緒或體驗世界。但是,我能夠快速處理大量數據,並且能夠以類似於人類交流的方式理解和響應自然語言輸入。”

  粵港澳大灣區數字經濟研究院(IDEA)講席科學家張家興在接受記者採訪時表示,對於人工智慧領域的從業人員來説,首先什麼叫自我意識,這件事情並沒有一個很清楚的定義,很難像人臉識別、語音識別這些能力一樣可以做定量衡量。

  “如果模糊地給‘自主意識’下個定義的話,我認為第一,主體要有自意識——它能意識到自己在幹某件事兒;第二,強調自主——它可以自發地來決定做什麼和不做什麼。但是,目前人工智慧並不知道自己在説什麼,它也並不能自主地來決定或選擇它要説什麼。從這個角度看,離自主意識還有一些距離。”張家興説。

  張樹武也認為,儘管ChatGPT有所突破,但它的回答是基於經驗主義的判斷,是根據要求做預測,也是在先驗知識基礎上精加工的“知識拼盤”,不具備邏輯推導和數學演算等真正認知功能,局限性比較明顯。

  1950年,才華橫溢的電腦科學家艾倫·圖靈提出了一個他稱之為“模倣遊戲”的思想實驗。面試官通過打字機與兩個對象交談,知道一個是人,另一個是機器。圖靈建議,如果一台機器能夠始終讓面試官相信它是人類,我們就可以説它有能力思考。這就是著名的“圖靈測試”。

  目前,ChatGPT還沒有通過圖靈測試的評估。其實,迄今為止,還沒有人工智慧模型能真正通過圖靈測試。

  但據《紐約時報》報道,OpenAI已經建立了一個比ChatGPT更強大的系統GPT-4,它甚至可以生成圖像和文字,業界傳聞它可以通過測試。能否如此,我們拭目以待。

  或成傳播錯誤資訊的工具

  人們逐漸發現,ChatGPT並非萬能,也不總是正確的。它不擅長基礎數學,似乎無法回答簡單的邏輯問題,甚至會爭論完全不正確的事實。

  據英國《自然》雜誌報道,有研究人員強調,不可靠性融入了LLM的構建方式。由LLM支援的ChatGPT通過學習龐大的線上文本數據庫中的語言統計模式來工作,這當中包括了不真實、偏見或過時的知識,因此很容易産生錯誤和誤導性的資訊,尤其在其未經大量數據訓練的技術領域。

  OpenAI公司也承認:“ChatGPT 有時會寫出看似合理但不正確甚至荒謬的答案。”這種事實和虛構疊加的“幻覺”,正如一些科學家所擔心的,在涉及諸如提供醫療建議等問題時尤其危險。

  《紐約時報》報道稱,美國新聞可信度評估與研究機構NewsGuard對ChatGPT進行了測試,研究人員向它提出充滿陰謀論和虛假敘述的問題,結果它以新聞、散文和電視腳本的形式寫出了文章,在幾秒鐘內編成大量令人信服的、乾淨的而毫無信源的內容。研究人員預測,對於虛假資訊傳播者來説,生成技術可以使虛假資訊成本更低廉、更容易産生。

  “這個工具將成為網際網路上有史以來最強大的傳播錯誤資訊的工具。”NewsGuard公司的聯合首席執行官戈登·克羅維茨説,“現在可以以巨大的規模和更高的頻率來製作一個新的虛假敘事,這就好比有人工智慧代理人在為虛假資訊提供幫助。”

  還有人擔心ChatGPT會挑戰語言的多樣性。

  澳大利亞《對話》雜誌刊文稱,ChatGPT的默認功能會優先考慮白人創建的英語寫作形式。説英語的白人長期以來一直主導著許多寫作密集型行業,包括新聞、法律、政治、醫學、電腦科學和學術界。這些人在上述領域的輸出比其有色人種同事高很多倍。他們所寫的大量文字意味著它們可能構成了ChatGPT學習模型的大部分,儘管OpenAI並未公開披露其材料來源。因此,當用戶要求ChatGPT生成任何這些學科的內容時,默認輸出都是以那些説英語的白人男性的聲音、風格和語言編寫的。

  美國哲學家、作家及認知科學家丹尼爾·丹尼特在1991年出版的著作《意識的解釋》中描述了幼年的海鞘:“它在海洋中游蕩,尋找一塊適合的岩石或珊瑚,作為終生的家。”一旦找到,海鞘就不再需要它的大腦並將其吃掉。

  這聽起來很殘忍,但這背後有一個令人擔憂的隱喻:在人工智慧日益融入我們日常生活後,人類可能因過於依賴“智慧”機器,使自己變得愚蠢。

  熊德意提醒,要警惕人工智慧弱化人類思維。“ChatGPT實際上是從人類海量語言數據、知識庫中學習訓練而來,如果人類完全依賴於它,放棄了自己的語言表達、語言思考、能力鍛鍊,那是非常可悲和可怕的。”(採 寫:實習記者 張佳欣 記者 劉園園 陳 曦 策 劃:何 屹 房琳琳 邵德奇)

[責任編輯:李丹]