MIT Google研新系統　靠人聲重塑樣貌

美國麻省理工學院（MIT）的科學家與Google（圖）合作，研發一套能夠單靠人聲就推斷話者樣貌的系統。研究員向這套電腦運算系統輸入了數百萬段在影片分享平台YouTube上的片段，當中有逾10萬人說話，讓電腦分析出人聲與人臉特徵的關連，使它有能力重塑話者臉容的影像。

人類的聲音會受着不同生理和文化因素影響，所以當我們與陌生人通電話時，腦中會浮現對方的臉容。研究員也就利用到此原理，讓運算系統進行臉容的推理。運算系統可辨別出聲音所反映的年齡、性別、種族，甚至某些面部特徵，例如鼻形，從而重塑出其臉容。

「成另一監控手法」

不過，研發團隊指有些人說話方式，難以反映他們的種族，導致重塑的準確度較低，但他們相信「直接透過聲音預測出人臉，將有多種用途，例如在電話和視像通話中加入具代表性的臉容」。

此外，技術有利警方作調查之用。華威商學院教授科基爾頓就指，「重塑臉容技術是另一個監控手法，會導成很多人的憂慮，但同時也可用於追蹤疑犯，協助執法機構」，至於社會是如何平衡技術帶來的利弊，將是個挑戰。Google就指未有打算把這技術用於其產品。
英國《泰晤士報》

MIT Google研新系統 靠人聲重塑樣貌

MIT Google研新系統　靠人聲重塑樣貌