去年11月底,OpenAI發(fā)布了ChatGPT人機(jī)對(duì)話交互模型,ChatGPT可以回答連續(xù)性問題,可謂“上知天文、下曉地理”,上線5天,就收獲了100萬用戶。
據(jù)了解,ChatGPT是GPT迭代出的第3.5個(gè)版本,2018年GPT-1誕生,到了2022年,OpenAI為給GPT-4收集用戶反饋,而發(fā)布了GPT-3.5,也就是如今的ChatGPT。
微軟的AI大模型及強(qiáng)大算力是助力OpenAI的關(guān)鍵,OpenAI曾為了讓GPT-3的表現(xiàn)更接近人類,用了45TB的數(shù)據(jù)量、近1萬億個(gè)單詞來訓(xùn)練它,大概是1351萬本牛津詞典。
大模型及其高算力對(duì)應(yīng)的是高昂的資金消耗,ChatGPT一次運(yùn)算就要花費(fèi)450萬美元,據(jù)美國(guó)《財(cái)富》雜志報(bào)道,2022年,OpenAI公司凈虧損總額為5.45億美元。
此外,ChatGPT測(cè)算生成一條信息的成本在1.3美分左右,是目前傳統(tǒng)搜索引擎的3到4倍,單次搜索成本過于高昂。
這樣高的研發(fā)門檻,注定目前主流的大模型多由大企業(yè),或是背靠大企業(yè)的研究機(jī)構(gòu)掌握,并且成為相關(guān)企業(yè)的“護(hù)城河”。
模型是AI的靈魂,參數(shù)量越大,模型越復(fù)雜,做出來的預(yù)測(cè)就越準(zhǔn)確。如今業(yè)界主流的AI生成類工具的大模型都是千億級(jí)、萬億級(jí)參數(shù)量的水平。
這些AI生成類工具可以學(xué)習(xí)各行各業(yè)的各類數(shù)據(jù),除了可以給出相較于小模型更準(zhǔn)確的預(yù)測(cè)結(jié)果外,它也展現(xiàn)出驚人的泛化能力和遷移能力,產(chǎn)出的內(nèi)容質(zhì)量更高、更智能。