ChatGPT怎麼用,才能發揮最大功能?|ChatGPT使用須知8件事

ChatGPT怎麼用,才能發揮最大功能?|ChatGPT使用須知8件事
ChatGPT進化後,對於文字、圖片的理解及生成能力更高。圖片來源:Shutterstock 製作:未來城市
2023-03-26
文・台灣科技媒體中心
32710
ChatGPT怎麼用,才能發揮最大功能?從GPT的演進來看,它有哪些能力逐漸增強?

GPT-4有何優勢與限制?如何發揮ChatGPT的能力?

ChatGPT-4和前一代有何不同?它又有哪些優勢和限制?

政治大學應用數學系副教授兼學務長蔡炎龍回應,目前看來,OpenAI訓練GPT-4和GPT-3在文字上應是運用相同的訓練資料——GPT-3(ChatGPT)大概「看」了正常人要花超過9,000輩子才能看完的資訊;也就是說,一般人讀過的資訊數量遠遠不及GPT-4讀過的。因此,GPT-4和GPT-3都比你我知道更多資訊。

蔡炎龍也說,相比兩者可閱讀的字數,GPT-4能一次看超過2.5萬個字,比GPT-3約只能看2,048個字好非常多。

  • GPT-3:以GPT-3(更嚴格說是GPT-3.5)為底的ChatGPT,一次不能看那麼多字,長一點的文章,要它作摘要就做得沒那麼好,寫一個報告前後風格有時會有差異,討論事情有時方向也會突然有點改變等等。這主要都是因為GPT-3能看的字數限制。
  • GPT-4:GPT-4是用一種叫transformers的架構,我們可以想成是「看完前面若干字,再預測下一個字」的模型。前面提到,GPT-3一次輸入是2,048個字,所以大概最多看前面兩千多個字,再合理預測下一個字是什麼。而GPT-4只是用神經網路的原理訓練後,計算出文句;只是它真的看過太多資訊,所以可以推出好像非常合理的文句;但是它沒有意識、沒有情緒,單純是經訓練後算出來的,而非基於事實。

蔡炎龍舉例,如果是一個名人,GPT-4可能生成的文字會合理一點;但若不是名人,比方說請GPT-4介紹「政治大學應用數學系的蔡炎龍老師」,它會知道政大是在台灣的一所大學,但因關於蔡炎龍的資訊太少,他就會依是應用數學系的老師,「合理」推出一堆文句通順但並非事實的文句。

目前,想改善這樣的問題是困難的。

微軟(Microsoft)Bing使用的方法是讓ChatGPT有搜尋的能力,這是其中一個改善的部份。更合理的方法是,既然GPT-4最大特點不是說出完全符合真實情況的東西,那為何不由使用者提供呢?

蔡炎龍認為,使用者已發現,如果提供基本資訊,ChatGPT就會生成相當好的文章;很多專家也發現,我們可以和ChatGPT「討論」一些概念,ChatGPT有時說的部份是錯的,你可以糾正它,它就會產生更好的文字。微軟執行長納德拉(Satya Nadella)用了一個很精確的詞,那就是GPT-4這類的模型,是我們的「對話型智慧代理人」(conversational intelligent agents);代理人的意思是,它功能有多好,其實是人類的責任——也就是你越會用它,它就能發揮越多的功能。

ChatGPT是怎麼演進的?

GPT-4是由GPT、GPT-2、GPT-3逐漸演化而來的。

台灣師範大學圖書資訊學研究所特聘教授曾元顯說明,GPT是Generative Pre-trained Transformer(生成式預訓練轉換器)的簡稱;其中,「生成式」代表它可生成文字做為輸出的資訊,預訓練代表它經過大量資料的事先訓練,轉換器Transformer則是人工神經網路的一種架構,可以接受一段文字做為輸入,將其轉換成一串數值向量,使得類似的概念,有相似的向量,再進而生成相同主題的文字。

繼2017年Transformer被提出來後,OpenAI公司基於Transformer的神經網路架構以及預測下個字的訓練方式,於2018年六月提出GPT模型。由於成效良好,OpenAI公司將模型加大,於2019年二月提出可以根據人工撰寫的前導文輸出完整文章的GPT-2,2020年五月提出更大型且可依照前導文指示完成多項任務的GPT-3。

雖然GPT-3在語言理解與生成方面已屬不凡,但其生成的內容不見得非常符合使用者的意圖;因此,OpenAI遂在2022年一月發表更能符合使用任務的InstructGPT(GPT-3.5),並於2022年11月底提出可跟使用者對話、並依照指示生成回應的ChatGPT,近期則在2023年三月發表除了接受文字指示外也能接受圖片做為輸入的GPT-4模型。

GPT系列的模型越來越大,訓練資料也越來越多,接受的輸入資訊也越來越長。從一開始GPT只使用到數千萬個參數,GPT-2使用15億個參數,到GPT-3使用到1,750億個參數,但OpenAI並沒有透露GPT-4的模型大小,推測應該不會比GPT-3更大(因為更大需要更久的推論和執行時間),但可能用更多資料訓練得更久(因為Meta AI的研究指出,較GPT-3小的模型用更多訓練資料、訓練更久,可以得到跟GPT-3類似甚至超越的成效)。

因此,GPT-4有幾項優勢:

  1. 閱讀更多文字:GPT-4可以接受更長的輸入,最長到32K(差不多53頁的文字),比GPT-3長16倍,亦即可以理解更長的文章,回應出更長的文字。
  2. 文字理解與生成能力更好:GPT-4的文字理解及生成能力提升,特別是在專業與學術領域,比GPT-3更強。例如,GPT-4在模擬的律師考試方面,其成績已達前10%的程度,而GPT-3僅能達到後10%的程度。
  3. 文字、圖片都接受:GPT-4除可以接受文字輸入,也可同時接受圖片輸入,理解後再以文字回應。而GPT-3僅能做到文字輸入與文字輸出。
  4. 可操縱性更高:GPT-4更具可操縱性(steerability),亦即比前一代更易於有效的規範GPT-4回應的風格與定義GPT-4的任務。

然而,GPT-4的限制跟其前一代一樣,仍舊會有無中生有、推理錯誤、各種偏見(如性別、種族、職業等偏見)、不理解訓練資料之後發生的事物(訓練資料只到2021年9月的網路資料)。因此,在高風險的任務上,使用仍須小心,必須盡力求證。儘管如此,GPT-4回應出事實的能力比其前一代高出40%。

ChatGPT4解讀圖像的原理是什麼?

中央大學資訊電機學院資訊工程學系教授蔡宗翰解析,GPT-4是目前為止最強大的語言模型之一,它的優勢在於,GPT-4現在使用更多的訓練資料和計算資源,能夠更準確地回答問題和生成文字,並減少語言偏見的影響。

此外,GPT-4透過學習大量的文字和圖像資料,獲得更高的創造力和想像力,能生成更有趣和獨特的文字和圖像描述。它也具備解讀圖片的能力,可以從圖像中發掘關鍵資訊並生成相關的文字描述。

值得注意的是,GPT-4需大量計算資源才能運行和訓練,會消耗大量的能源,因此在某些設備上可能會難以實現。此外,即使GPT-4的準確性比之前的版本更高,仍可能出現一些錯誤,使用時需格外小心,並且進一步確認。

你ChatGPT了嗎?使用須知8件事

不焦慮!我們不只有ChatGPT技巧,也為你整理AI思考包

AI趨勢:AI如何改變未來?

AI反思:AI會取代人類嗎?它如何為人類增強能力?

AI生活:為了與AI共處,我現在能做哪些準備?

參考資料與文獻

1. Improving Language Understanding by Generative Pre-Training, https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf
2. Better language models and their implications, https://openai.com/research/better-language-models, February 14, 2019
3. Language Models are Unsupervised Multitask Learners, https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf
4. Language Models are Few-Shot Learners, https://arxiv.org/abs/2005.14165, 2020-05-28.
5. Training language models to follow instructions with human feedback, https://arxiv.org/abs/2203.02155, 2022-03-04.
6. Introducing ChatGPT, https://openai.com/blog/chatgpt, 2022-11-30.
7. GPT-4, https://openai.com/research/gpt-4
8. LLaMA: Open and Efficient Foundation Language Models, https://arxiv.org/abs/2302.13971, 2023-02-27.

其他人也在看

你可能有興趣

影音推薦

#廣編企劃|【2023 天下城市高峰論壇 #9】新竹市交通處長 倪茂榮:改善交通,必須先做出優良示範道路|天下雜誌✕未來城市

已成功複製連結