1950 年,英國(guó)數(shù)學(xué)家、邏輯學(xué)家,被視為計(jì)算機(jī)科學(xué)之父的艾倫·圖靈(Alan Turing),發(fā)表了一篇?jiǎng)潟r(shí)代的論文,文中預(yù)言了創(chuàng)造出具有真正智能的機(jī)器的可能性。
1952年,在一場(chǎng)BBC廣播中,圖靈談到了一個(gè)新的具體想法:讓計(jì)算機(jī)來冒充人。如果不足70%的人判對(duì),也就是超過30%的裁判誤以為在和自己說話的是人而非計(jì)算機(jī),那就算作成功了。
于是就有了圖靈測(cè)試,指測(cè)試者與被測(cè)試者(一個(gè)人和一臺(tái)機(jī)器)隔開的情況下,通過一些裝置(如鍵盤)向被測(cè)試者隨意提問。進(jìn)行多次測(cè)試后,如果有超過30%的測(cè)試者不能確定出被測(cè)試者是人還是機(jī)器,那么這臺(tái)機(jī)器就通過了測(cè)試,并被認(rèn)為具有人類智能。
30% 這個(gè)數(shù)字是圖靈老人家在 1950 年那篇論文里面對(duì) 2020 年的技術(shù)。但事實(shí)上盡管影視作品里面的人工智能助手深入人心,但用戶能用到的人工智能,可以說基本上都是人工智障了。
直到昨晚 Google 用兩個(gè)動(dòng)作,讓 Google Assistant 距離像真正的人又近了一步。
我們都知道,要想讓一個(gè)智能語音助手像人,其實(shí)只要實(shí)現(xiàn)三個(gè)維度的事情就行了:
1. 能聽懂你說的話
2. 說的話能讓你聽懂
3. 如果是語音助手,那么它說話的像人
目前市面上的智能音箱不少,各家互聯(lián)網(wǎng)巨頭也都在做所謂的“智能語音助手”,但智能音箱雞肋的原因也挺簡(jiǎn)單的,歸根結(jié)底還是不夠聰明。
早上起床了,需要你對(duì)著智能音箱說一串的指令:
“打開窗簾”
“關(guān)掉床頭燈”
“播放音樂”
……
感覺就像對(duì)著 50 個(gè)蠢蛋說話。日復(fù)一日,真的心累啊。
如果光說指令其實(shí)也還行,你還得叫智能音箱,讓它知道你是在和它說話,可以說是更心累了。有的時(shí)候,即使你興致勃勃的跟你的“智能小助手”說明白了指令,得到的回復(fù)也是冰冷生硬的“好的”,真挺掃興的。
Google 改變的,是兩點(diǎn):
1. 讓 Google Assistant 聽起來像人
2. 讓 Google Assistant 的辦事兒邏輯像人,能為你做更多事情
聽起來還挺簡(jiǎn)單的是不?其實(shí)技術(shù)上還挺難實(shí)現(xiàn)。
為了讓 Google Assistant 真的像人,Google 升級(jí)了新的語音模型,讓 Google Assistant 語音更接近真人。包括能讓 Google Assistant 聽起來更像美帝歌星 John Legend。用中國(guó)特色的方式解釋,這就好比用機(jī)器給你合成了個(gè)林志玲,來給你引路導(dǎo)航一樣。
光說話像人其實(shí)并不夠,重點(diǎn)還得是讓 Google Assistant 能聽得清,且聽得懂人話,并且能表達(dá)的像人一樣。
去年的 Google I/O 大會(huì)上,Google CEO Sandar Pichai 就表示,Google 語音技術(shù)在識(shí)別美式英語方面,其識(shí)別錯(cuò)誤率從 2016 年 7 月的 8.5% 降到了 4.9%。作為對(duì)比,微軟在 2016 年 9 月給出的語音識(shí)別錯(cuò)誤率為 6.3%,而 IBM 在 2017 年 3 月給出的相應(yīng)數(shù)據(jù)為 5.5%。由此可知,Google 在語音技術(shù)基本功方面功力深厚。而更重要的進(jìn)展是,去年的 Google Assistant,就已經(jīng)實(shí)現(xiàn)了一個(gè)壯舉:
70% 以上的語音交互都是通過自然語言。
而今年,Google 用了個(gè)叫做 Multiple Actions 增強(qiáng)了智能語音助理與人類自然、來回“對(duì)話”的能力。簡(jiǎn)單來說,就是 Google Assistant 能更明白你的話里有話了。
Google 也舉了這樣一個(gè)例子:
用戶問 Google 勇士贏沒贏比賽。
Google 說勇士贏了并匯報(bào)了比分。
用戶緊接著問下一場(chǎng)比賽是什么時(shí)候。
Google 告訴了他下一場(chǎng)的具體時(shí)間。
用戶說下一場(chǎng)比賽肯定挺有意思,希望 Google 提醒他回家后把杜蘭特球衣找出來。
Google 說妥了,你到家我就提醒你。
看上去簡(jiǎn)單且自然的對(duì)話,可以說是藏有相當(dāng)多需要機(jī)器進(jìn)行理解并規(guī)劃回應(yīng)的信息點(diǎn)了。如果你覺得這個(gè)還挺簡(jiǎn)單,我建議你掏出你的 iPhone 和 Siri 聊聊,看看能不能聊下去。
連續(xù)理解人類語句并給出回應(yīng),是相當(dāng)難的技術(shù),這其實(shí)意味著 Google 需要大量的數(shù)據(jù)來培養(yǎng)機(jī)器學(xué)習(xí)算法。在昨晚的大會(huì)上,Google 還是秀了自己在數(shù)據(jù)積累上面的肌肉,目前,全球范圍內(nèi)共計(jì)有超過 5 億個(gè)設(shè)備都部署了 Google Assistant,分為 5000 種不同的設(shè)備,僅僅是汽車品牌就超過 40 個(gè)。
光能把天聊下去還不像個(gè)真人對(duì)不對(duì)?更讓人仔細(xì)想想甚至有點(diǎn)恐懼的還在后面。
Google Assistant 現(xiàn)在可以幫你打電話了,甚至整個(gè)過程都很難讓對(duì)面察覺到,自己對(duì)話的是 Google 智能助手。
當(dāng)然,幫打電話的場(chǎng)景目前應(yīng)該還只能實(shí)現(xiàn)如同訂餐,預(yù)約見面等功能。Google 在大會(huì)上展示了兩個(gè)場(chǎng)景,已經(jīng)足夠震撼人心且充滿科技感:你要理發(fā),喊谷歌助手預(yù)定,它會(huì)給理發(fā)店打電話,并回答出理發(fā)店里店員“幾點(diǎn)理發(fā)”“預(yù)定客人的名字”等信息;或者預(yù)定餐館,如果沒位置,它也能學(xué)會(huì)變通改預(yù)定時(shí)間——全程是 Google 助手(機(jī)器)在和一個(gè)人類對(duì)話,它的聲音仿佛一個(gè)人類,回答方式也是一個(gè)人類。
這可能是人工智能助手第一次讓我感覺到隱約有點(diǎn)恐懼了,盡管它能夠與人自由對(duì)話的場(chǎng)景還非常有限。
Google 這個(gè)功能再發(fā)展下去,恐怕人工客服的崗位就要被取代了,一大批電話客服就會(huì)下崗了。
學(xué)會(huì)用更真實(shí)的人聲說話,說話邏輯也更像人類,Google 還想用機(jī)器學(xué)習(xí)的優(yōu)化讓人工智能更有人情味兒一些。舉個(gè)例子:孩子跟 Google 助手對(duì)話時(shí)候,如果他比較禮貌說“請(qǐng)”,Google 助手也會(huì)給更 nice 的回答。
看,盡管連著好幾年 Google 都在說 AI,但這一次,Google 還是讓 AI 做到離人們生活前所未有的貼近了。
最終,厲害歸厲害,Google 對(duì)于我國(guó)用戶依然是一家不可見的公司,技術(shù)是真牛,看看樂呵就好。
上海意泓電子科技有限責(zé)任公司 版權(quán)所有 未經(jīng)授權(quán)禁止復(fù)制或鏡像
CopyRight 2020-2025 www.hljhgw.com All rights reserved 滬ICP備2021005866號(hào)