踏入廿一世紀,資訊爆炸,科技飛躍,越來越多事物超出我們經驗範疇之外。例如前兩天瘋傳的Google翻譯,莫說一般人不理解機器犯錯原因,就算是專家也只能兩手一攤,歸咎「神經機器翻譯」發神經而已。人工智能系統的深層數據,就像上帝的旨意,人類是無法解讀的。
今天有了人工智能,從前很多不可能的事都變成可能,沒關係的東西也發生關係。隨便舉個例:人工智能有一門分支,叫「自然語言處理」(Natural Language Processing),簡稱 NLP。透過NLP,機器可解讀出病毒的「文法」和「語義」,預測它如何變種,巧妙地把生物學和語言學串連起來。這是從前科學家無法想像的,即使到了今日,恐怕大多數人亦聞所未聞。
語言和病毒有什麼關係呢?我嘗試用最簡單的方式解說一下。病毒是由蛋白質和核酸分子構成,而蛋白質是一條氨基酸鏈,若把氨基酸視作英文字母,蛋白質就可排序成一個英語句子。我們之所以會被感染,是因為病毒能躲過免疫系統偵測;打個比方,免疫系統像一位檢查文法的英語老師,而能夠順利過關來感染你的病毒,都是「文法正確」的句子。免疫系統「理解」病毒,類似人類理解文法。
病毒變種則涉及「語義」變化,好比句子更改部分字詞,產生新的意義,但整體結構仍是那個句子;若病毒改變「意義」後依然「文法」正確,抗體不虞有詐,你就會被感染。NLP模型就在這兒發揮威力:它可根據「句子變化」相似度把病毒分組,就像它把近義的單詞分組一樣,從而協助預測變種病毒的形態。
NLP最厲害的本領,是進行「漏字填充預測」,比如你把王安石名句「春風又綠江南岸」的「綠」字遮住,NLP模型可能會告訴你有50%是「綠」,10%是「到」,3%是「過」,0.1%是「斬」,諸如此類。若把詩句變成氨基酸字母鏈,NLP就可用來預測蛋白質結構,推演病毒變化。這想法非常聰明,但普通人如何想像得到?當科學越來越超乎常識,未來對於大多數人來說,就變得越來越不可測了。