美國麻省理工學院(MIT)的科學家與Google(圖)合作,研發一套能夠單靠人聲就推斷話者樣貌的系統。研究員向這套電腦運算系統輸入了數百萬段在影片分享平台YouTube上的片段,當中有逾10萬人說話,讓電腦分析出人聲與人臉特徵的關連,使它有能力重塑話者臉容的影像。
人類的聲音會受着不同生理和文化因素影響,所以當我們與陌生人通電話時,腦中會浮現對方的臉容。研究員也就利用到此原理,讓運算系統進行臉容的推理。運算系統可辨別出聲音所反映的年齡、性別、種族,甚至某些面部特徵,例如鼻形,從而重塑出其臉容。
「成另一監控手法」
不過,研發團隊指有些人說話方式,難以反映他們的種族,導致重塑的準確度較低,但他們相信「直接透過聲音預測出人臉,將有多種用途,例如在電話和視像通話中加入具代表性的臉容」。
此外,技術有利警方作調查之用。華威商學院教授科基爾頓就指,「重塑臉容技術是另一個監控手法,會導成很多人的憂慮,但同時也可用於追蹤疑犯,協助執法機構」,至於社會是如何平衡技術帶來的利弊,將是個挑戰。Google就指未有打算把這技術用於其產品。
英國《泰晤士報》