Sora的橫空出世,如同一枚深水炸彈,瞬間引爆全球。我們特地專訪了在AI領(lǐng)域的權(quán)威人物——香港科技大學(xué)副校長汪揚(yáng),邀請他就讀者關(guān)心的焦點(diǎn)話題進(jìn)行深度解讀。
「沒有什麼事情是人工智能做不到的」
記者:在您看來,Sora的出世意味著人工智能已發(fā)展到何種程度?
汪揚(yáng):早在GPT-3發(fā)布時(shí),我就覺得AI技術(shù)已經(jīng)是不可想象的強(qiáng)大了。只是因?yàn)樗皇莍nteractive(可交互的),也沒有開放給所有人,所以受到的關(guān)注比較少。等到ChatGPT(GPT-3.5),那就是take the world by storm(席捲全球),全世界人民熱烈地談?wù)摿似鸫a有半年的時(shí)間,沒想到很快又迭代到了GPT-4。
對於Sora,我更有這樣的信心:在3到5年內(nèi),你把電影劇本錄入Sora,它就能做出電影,哪怕不是非常完美,但至少是一份初稿,你可以根據(jù)這份初稿與它進(jìn)行對話,告訴它需要調(diào)整的地方,最後它真的就可以做出一部成熟的電影。
但任何技術(shù),最終都要回答一個(gè)問題:它將帶我們?nèi)ハ蚝畏剑?/p>
近兩年以來,AI驚人的發(fā)展速度讓大家感到幾乎沒有什麼事情是人工智能做不到的。這就不可避免地會(huì)觸及到倫理問題,今後我們該如何定義人為的邊界?在電影《西部世界》裏,機(jī)器人攜帶槍支,但它永遠(yuǎn)不會(huì)傷害人類。而人類卻可以隨意虐待甚至殺戮它們,機(jī)器人成了人的奴隸。結(jié)果最後這些機(jī)器人慢慢地修改了它們自己的程序,開始越過了邊界,可以傷害人了,最後演變成一場災(zāi)難。
如今大家又有了同樣的討論,但不管怎麼樣,Sora現(xiàn)在離成熟還有段距離。最簡單的來說,ChatGPT和GPT-4完全可以商業(yè)化的,Sora目前還沒有到這個(gè)程度,但是假以時(shí)日,Sora是可以做到的。
記者:Sora目前依舊有很多問題,生成的視頻瑕疵不少,Sora進(jìn)一步優(yōu)化的技術(shù)難點(diǎn)在哪裏?
汪揚(yáng):決定Sora表現(xiàn)的是參數(shù)的多少。參數(shù)越多,模型越大越合理,自然功能就更成熟,生成的視頻就更接近完美,但模型和參數(shù)優(yōu)化都是一步一步迭代出來的,不可能一步到位,一定是一個(gè)漸進(jìn)的過程。隨著模型變大,一定會(huì)階段性地出現(xiàn)種種問題,不斷解決然後才能一點(diǎn)點(diǎn)擴(kuò)大,這是需要積累的。
谷歌為什麼目前還沒有趕上 OpenAI?就是因?yàn)樗e累不夠。就像我們都知道中國航空發(fā)展需要好的發(fā)動(dòng)機(jī),發(fā)動(dòng)機(jī)的原理在很早以前我們都已經(jīng)搞得很清楚了,但為什麼我們造一臺(tái)先進(jìn)發(fā)動(dòng)機(jī)那麼困難?原因就在於缺乏經(jīng)驗(yàn)。
這讓我想起一個(gè)故事,當(dāng)時(shí)我們的工程師研究烏克蘭援助的發(fā)動(dòng)機(jī),發(fā)現(xiàn)它的葉片做得很毛糙,以為是質(zhì)量很差,就把它改成非常光滑漂亮的,但測試後發(fā)現(xiàn)性能根本不行。跟對方一溝通詢問是什麼原理,對方看了之後直接回答說他們也不知道,他們也是試了很多次,最後才發(fā)現(xiàn)就是這樣毛糙的才好用。這就跟Sora的發(fā)展進(jìn)程一樣,是不是一下子將參數(shù)提升幾個(gè)量級,Sora就完美了?不是那麼回事,參數(shù)增加的過程,是不斷解決問題、不斷嘗試的過程。在一個(gè)成功的模型上改進(jìn),總是比在一個(gè)未知的模型上想達(dá)到完美容易很多。
記者:什麼決定了人工智能的發(fā)展進(jìn)程?
汪揚(yáng):我認(rèn)為發(fā)展人工智能有三個(gè)必備條件:算力、數(shù)據(jù)和人才。排在第一位的算力是最最基礎(chǔ)所在。過去我們都認(rèn)為人才和數(shù)據(jù)最重要,那是在用錢可以解決算力,而且也沒有現(xiàn)在這麼海量算力需求的前提下。但如今,訓(xùn)練大模型成了發(fā)展人工智能的根基,算力則是發(fā)展大模型必不可缺的燃料。
香港短期內(nèi)幾乎不太可能做出大模型,為什麼?缺乏算力。ChatGPT的訓(xùn)練用了至少1萬片英偉達(dá)A100卡,GPT-4至少2萬片?,F(xiàn)在香港沒有任何企業(yè)機(jī)構(gòu)有這樣的算力。但香港可以專注做垂直應(yīng)用,我認(rèn)為這也是將來的主要賽道。目前,只有OpenAI、微軟、谷歌和亞馬遜這樣的大公司有足夠算力來發(fā)展通用大模型。近年來美國對中國進(jìn)口高端GPU實(shí)施限制,也確實(shí)使中國在發(fā)展人工智能的第一點(diǎn)條件,即算力方面處於比較劣勢的狀態(tài),我們需要一段時(shí)間才能解決算力問題。
第二個(gè)條件則是數(shù)據(jù)。對中國而言,我們有中文數(shù)據(jù),但是數(shù)據(jù)量比英文的要小很多,加之一些客觀原因限制了我們的數(shù)據(jù)應(yīng)用,而數(shù)據(jù)對於人工智能發(fā)展是至關(guān)重要的。
以人臉識(shí)別技術(shù)發(fā)展歷程為例,人臉識(shí)別技術(shù)必須要達(dá)到99.9%以上的準(zhǔn)確率才能滿足實(shí)際應(yīng)用的要求,研發(fā)者一開始找到最頂級的專家來幫助他們對算法進(jìn)行改進(jìn),但發(fā)現(xiàn)無論如何改進(jìn),準(zhǔn)確率都只有有限的提升。後來他們選擇以crowdsourcing付費(fèi)的方式形式吸引大家上傳頭像照片,以此方法,他們一下子收集到了大量的人臉數(shù)據(jù),短時(shí)間內(nèi)準(zhǔn)確率就超過了99.99%。這就是展現(xiàn)數(shù)據(jù)重要性的先例。為什麼OpenAI和谷歌有先天的優(yōu)勢?就是因?yàn)樗麄兒茉缇烷_始收集各種各樣的數(shù)據(jù)。
數(shù)據(jù)確實(shí)是目前中國發(fā)展人工智能通用大模型的瓶頸,但中國想要追趕上也只是時(shí)間問題而已。另外中國在垂直領(lǐng)域數(shù)據(jù)方面沒有這麼大的差距,甚至在很多領(lǐng)域還領(lǐng)先。
人才是第三,中國不缺才,光香港科大就培養(yǎng)了不少人才(笑),清華北大里都是優(yōu)秀學(xué)生,Sora的核心團(tuán)隊(duì)裏就有北大畢業(yè)的,所以我從來沒覺得人才是一個(gè)瓶頸。
「沒有人敢說OpenAI是獨(dú)屬於美國的」
記者:美國採取的芯片限制政策在何種程度上影響了中國人工智能的發(fā)展?
汪揚(yáng):芯片數(shù)量和質(zhì)量決定了算力的大小,而正如剛才提到,算力是發(fā)展人工智能的最重要元素。目前較為大眾所熟知的國產(chǎn)GPU芯片當(dāng)屬華為升騰910芯片,它表現(xiàn)雖還不達(dá)英偉達(dá)的水平,但依舊是供不應(yīng)求,無法完全滿足市場需求,部分原因就是芯片限制下,英偉達(dá)出口的只能是閹割版的芯片。
不過從原始算力上來看,根據(jù)許多報(bào)道,升騰910已經(jīng)至少達(dá)到A100的90%,甚至是95%的水平,這是非常了不起的,要知道GPT4就是用A100訓(xùn)練的。但華為的差距目前是在優(yōu)化方面,英偉達(dá)的優(yōu)勢不僅在於芯片,更在於它配套的軟件CUDA,還有芯片之間的通訊速度。這恰恰是華為所缺乏的。
因此,據(jù)我所知,華為的實(shí)際算力目前只能達(dá)到英偉達(dá)的20%左右,這肯定是不夠的。但這些都可以克服,我認(rèn)為在兩年內(nèi),中國自產(chǎn)芯片的整體性能能夠達(dá)到A100的90%以上,到了那個(gè)時(shí)候,中國大模型發(fā)展將會(huì)有一個(gè)質(zhì)的飛躍。但在算力方面想趕超英偉達(dá),10年可能都做不到。
記者:中美在AI發(fā)展方面差距如何?
汪揚(yáng):在這方面總有人唱衰中國,認(rèn)為中國在這一方面的研究遠(yuǎn)遠(yuǎn)落後於美國。我很反對這種說法,首先,以游泳運(yùn)動(dòng)講法為例,當(dāng)領(lǐng)先一個(gè)身位的時(shí)候,就可以說是有絕對優(yōu)勢。目前美國領(lǐng)先中國可能兩三個(gè)身位。但我們需要看到,中國可能是領(lǐng)先別的國家四五個(gè)身位。全世界現(xiàn)在只有中國和美國在第一梯隊(duì),而且中國的優(yōu)勢在於垂直領(lǐng)域。
其次,沒有人敢說OpenAI是獨(dú)屬於美國的,Sam Altman(OpenAI的CEO)是一個(gè)非常理想化的人。如果你問他:「你是為美國而做的嗎?」他一定不會(huì)同意,他一定是為全人類而做的,這樣的技術(shù)全世界人共享才能發(fā)揮真正的價(jià)值。另外,我認(rèn)為人工智能越往前發(fā)展,越有可能蠶食掉美國的優(yōu)勢行業(yè),或許美國會(huì)後悔的(笑)。
舉個(gè)例子,在電影《大空頭》裏,當(dāng)別人都不假思索地跟風(fēng)購買CDS時(shí),電影的主人公 Michael Burry耐下心來閱讀了基金公司們故意寫得很複雜冗長的100多頁產(chǎn)品介紹,發(fā)現(xiàn)CDS不過一堆垃圾。於是他開始做空,在市場崩潰時(shí)得利,成為贏家。而現(xiàn)在你我都不用花費(fèi)時(shí)間讀這些東西了,直接將內(nèi)容往ChatGPT4里一輸入,它可以立馬告訴你這個(gè)產(chǎn)品到底是什麼,可以讓你更好判斷值不值得入手,甚至直接給出建議。如此一來,人們將不再需要傳統(tǒng)的金融分析師。
「利用AI進(jìn)行創(chuàng)造,成了一門學(xué)問?!?/strong>
記者:您認(rèn)為,以Sora、ChatGPT為首的這些人工智能產(chǎn)品會(huì)對教育界產(chǎn)生什麼影響?
汪揚(yáng):衝擊非常大,用孫正義的話來說,人將分為兩類,會(huì)用人工智能和不會(huì)用人工智能的人。十年之後,這兩類人的距離會(huì)跟人與猿人之間的距離一樣遠(yuǎn)。ChatGPT剛出來的時(shí)候大家都很擔(dān)憂:有了它還要我們老師幹什麼?我認(rèn)為這種擔(dān)憂是完全沒有必要的。我們應(yīng)該用歡迎的姿態(tài)迎接人工智能,我們的教育思路、產(chǎn)品也必須跟著科技的進(jìn)步做出調(diào)整。
其中一個(gè)很重要的課題就是教會(huì)學(xué)生如何利用AI進(jìn)行創(chuàng)造,這反而成了一門學(xué)問。什麼樣的人才能在這樣的環(huán)境中脫穎而出?首先是具備想象力的人,沒有想象力的人一定是用不好AI的,因?yàn)锳I始終是根據(jù)用戶輸入的內(nèi)容進(jìn)行創(chuàng)造。
第二是有鑑賞力的人,這是我認(rèn)為在今後的人工智能的發(fā)展中最最重要的能力之一了,其與想象力的重要性並駕齊驅(qū)。為什麼鑑賞力如此重要?因?yàn)榻襻嵋欢〞?huì)出現(xiàn)同質(zhì)化,以GPT4為例,它生成的內(nèi)容相似度都很高,這時(shí),就需要鑑賞力來分辨出什麼才是真正好的。
最後就是原創(chuàng)性,人工智能永遠(yuǎn)超越不了真正杰出的作家和畫家,莫奈、梵高的畫並不會(huì)因?yàn)槿斯ぶ悄芸梢詣?chuàng)造出大量的很不錯(cuò)的圖片就貶值,這一點(diǎn)我們從數(shù)碼拍照就可以看出來。數(shù)碼拍照讓很多業(yè)餘人士都能拍出非常精美的圖片,但這些照片永遠(yuǎn)都賣不出Ansel Adams這些大師們精心拍攝沖洗出來的照片的價(jià)錢。
人工智能終究是輔助人實(shí)現(xiàn)目的的一種工具,而不會(huì)取代人的原創(chuàng)性,相反其更能凸顯出原創(chuàng)的價(jià)值所在,人工智能只是按照我們所想的去做,我們才是真正的指揮官。(作者:納婕謐)
來源:香港《經(jīng)濟(jì)導(dǎo)報(bào)》總3563期