
在人類與科技親密接觸的漫長旅程中,耳朵,這個(gè)曾用于聆聽風(fēng)聲雨聲、低語淺笑的器官,正悄然成為人工智能(AI)進(jìn)軍現(xiàn)實(shí)世界的“戰(zhàn)略要地”。
從美國拉斯維加斯國際消費(fèi)電子展(CES)閃爍的聚光燈,到實(shí)驗(yàn)室里無聲跳動(dòng)的腦電波信號(hào),一場關(guān)于“聽覺革命”的浪潮正由一群AI初創(chuàng)公司掀起。他們押注的不是智能手機(jī)、智能眼鏡,而是智能耳機(jī)。他們致力于讓耳機(jī)華麗變身為一個(gè)集翻譯、記錄、控制,乃至“讀腦”于一體的超級(jí)接口。
不再被動(dòng)接收聲音
10年前,美國韋弗利實(shí)驗(yàn)室和邁馬努公司率先為耳機(jī)注入了“語言魔力”——實(shí)時(shí)翻譯。戴上耳機(jī),西班牙語瞬間化作英語,中文脫口而出變成法文。這一功能曾被視為科幻橋段,如今卻已在課堂、會(huì)議室、機(jī)場落地生根。
谷歌緊隨其后,在2020年推出語音激活的AI助手,讓耳機(jī)朝著智能化的道路繼續(xù)邁進(jìn)。而蘋果與三星則以降噪技術(shù)為盾牌,構(gòu)筑起高端音頻體驗(yàn)的護(hù)城河。然而,真正的變革并非來自巨頭,而是一些并不擁有煊赫聲名的初創(chuàng)企業(yè)。
OSO公司便是其中之一。他們的耳機(jī)不再只是被動(dòng)接收聲音,而是主動(dòng)參與對(duì)話。它能錄制會(huì)議、識(shí)別發(fā)言者、提取關(guān)鍵決策,并以自然語言生成摘要。
中國AI硬件公司“未來智能”推出的RecDot耳機(jī),不僅支持多語言實(shí)時(shí)轉(zhuǎn)錄,還能跨平臺(tái)運(yùn)行。該公司首席執(zhí)行官馬嘯透露,他們的設(shè)備兼容多款手機(jī),能打破生態(tài)壁壘,讓AI真正“人人可及”。
而時(shí)空壺公司的耳機(jī)則在教育領(lǐng)域發(fā)力。該公司美國銷售主管布萊恩·謝克利夫表示,其90%的銷售額來自學(xué)校。非英語母語的學(xué)生佩戴它上課,可實(shí)時(shí)理解授課內(nèi)容。
從語音交互邁向神經(jīng)感知
如果說語音交互是第一代智能耳機(jī)的起點(diǎn),那么神經(jīng)感知,便是它的未來。
加拿大初創(chuàng)公司Naqi Logix正試圖讓耳機(jī)“讀懂你的臉”。其“神經(jīng)耳機(jī)”看似普通耳塞,實(shí)則內(nèi)嵌超靈敏生物傳感器,能捕捉面部肌肉微弱的電信號(hào),如眨眼、挑眉、抿嘴,甚至下巴輕繃,皆可轉(zhuǎn)化為指令。
該公司產(chǎn)品總監(jiān)扎維爾·亞歷山大表示,他們制作這款耳機(jī)的初衷是幫助一位癱瘓的朋友重新玩游戲。如今,莊閑和app這款耳機(jī)已能讓四肢癱瘓者僅憑面部動(dòng)作控制電腦、瀏覽網(wǎng)頁,甚至操控電動(dòng)輪椅。運(yùn)營經(jīng)理桑德普·艾莉亞則看到了這款耳機(jī)更深層次的內(nèi)核——人們希望能夠以更隱秘、更微妙的方式與環(huán)境互動(dòng),而無須用智能手機(jī)呼叫Siri,用揚(yáng)聲器呼叫Alexa,或用眼鏡呼叫Meta。
另一家美國公司Neurable走得更遠(yuǎn)。其MW75 Neuro LT頭顯雖非傳統(tǒng)耳機(jī),卻代表了同一方向的終極愿景——用思維交流。通過監(jiān)測(cè)大腦前額葉的電活動(dòng),這一設(shè)備能識(shí)別用戶的意圖。
便利與局限并存
盡管前景誘人,但智能耳機(jī)能否取代智能手機(jī)、智能眼鏡,成為AI的主導(dǎo)終端?答案尚未揭曉。
支持者認(rèn)為,耳機(jī)具備天然優(yōu)勢(shì):便宜、普及、便攜。美國科技研究機(jī)構(gòu)Techsponential總裁艾維·格林加特表示,全球數(shù)十億人已擁有耳機(jī),升級(jí)AI功能的成本極低。相比之下,智能眼鏡價(jià)格高、佩戴不便,且常被視為“怪異”。
更重要的是,耳機(jī)始終貼近人體,是理想的傳感器載體。它能持續(xù)采集語音、心率、體溫乃至腦電波,構(gòu)建個(gè)人數(shù)字孿生體。未來,它或許能預(yù)判你的情緒波動(dòng),在焦慮時(shí)播放舒緩音樂;或在會(huì)議中察覺你未盡之言,自動(dòng)予以補(bǔ)全。
然而,挑戰(zhàn)同樣嚴(yán)峻。首先,耳機(jī)的使用場景受限。人們不會(huì)24小時(shí)佩戴耳機(jī),尤其在公共場合說話并不總是合適。其次,耳機(jī)交互方式單一,缺乏攝像頭意味著用戶無法識(shí)別手勢(shì)、環(huán)境或視覺信息,限制了AI的理解維度。
此外,對(duì)隱私與數(shù)據(jù)安全的擔(dān)憂也始終存在。若耳機(jī)能捕捉每一次眨眼、每一句低語、每一段腦電波,那么,誰在存儲(chǔ)這些數(shù)據(jù)?是否會(huì)被濫用?一旦黑客入侵,豈不是連“思想”都暴露無遺?
每一次人機(jī)交互的革新,似乎都伴隨著終端形態(tài)的重塑:鍵盤讓人類輸入文字,觸摸屏讓人們用指尖滑動(dòng)世界,語音助手開啟了“開口即得”的時(shí)代。而今,耳機(jī)正試圖成為下一個(gè)載體——一個(gè)更私密、更安靜、更無縫的入口。