“這是我們新推出的AI辦公本。得益于人機智能交互語音系統(tǒng),即便在遠距離或嘈雜環(huán)境中,它也能清晰拾音,實現(xiàn)高識別率。”前不久,思必馳科技股份有限公司的“人機智能交互語音系統(tǒng)”入選了“2025蘇州十大產(chǎn)業(yè)科技成果”,公司產(chǎn)品總監(jiān)王艷龍向記者展示了應用該系統(tǒng)的兩項創(chuàng)新產(chǎn)品“AI辦公本”和“無感擴聲吸頂麥”。
賦予機器類人的溝通能力
何為“人機智能交互語音系統(tǒng)”,其核心在于賦予機器類人的溝通能力。
思必馳“人機智能交互語音系統(tǒng)”基于其全鏈路智能對話平臺和語言計算大模型,攻克了復雜噪聲環(huán)境下的高精度識別、多輪全雙工對話等關(guān)鍵技術(shù)難題,性能達到國際領(lǐng)先水平,已廣泛應用于汽車、家居、辦公、教育等領(lǐng)域。
該系統(tǒng)融合了信號處理、語音識別、大模型、語音合成等多項單點技術(shù),思必馳則會根據(jù)不同產(chǎn)品的研發(fā)需求靈活應用這些技術(shù)模塊。例如去年4月發(fā)布的“AI辦公本”,便是這樣一款面向辦公會議場景的軟硬件一體化產(chǎn)品。王艷龍介紹,這款產(chǎn)品不僅支持流暢手寫,能呈現(xiàn)彩色類紙效果,還可以自動記錄會議內(nèi)容、進行語音轉(zhuǎn)寫、智能提煉重點,并具備圖像拍照功能。此外,它還支持安裝騰訊會議、微信讀書、釘釘?shù)鹊谌綉茫蚱屏送惍a(chǎn)品的功能局限。
“無感擴聲吸頂麥”同樣是該系統(tǒng)的創(chuàng)新結(jié)晶,性能不僅比肩國際知名品牌的產(chǎn)品,甚至更具競爭力。其內(nèi)置128個數(shù)字麥克風,運用AI算法進行擴聲,能在三四十平方米區(qū)域內(nèi),將每個位置的人音自然放大,真正實現(xiàn)無感擴聲的同時還能進行會議記錄。“思必馳人機智能交互語音系統(tǒng)不僅為萬物互聯(lián)時代的人機交互提供了中國方案,更實現(xiàn)了真正的智能化。”王艷龍表示。
部分產(chǎn)品持續(xù)更新迭代近100個版本
思必馳在軟硬件結(jié)合的人工智能技術(shù)與產(chǎn)品服務領(lǐng)域深耕多年,于聲音信號處理、語音識別、大模型等方面已有深厚的算法積累與數(shù)據(jù)積累,這為產(chǎn)品研發(fā)奠定了穩(wěn)固的基礎。
“面對相應領(lǐng)域發(fā)展百年的國際品牌,我們的目標絕非追隨,而是實現(xiàn)真正的突破與創(chuàng)新。”王艷龍以服務的復旦大學為例,該校此前長期受困于擴音效果和錄播課程中的雜音問題,傳統(tǒng)廠商數(shù)十年未能解決。而思必馳選擇了全新的技術(shù)路徑,用軟件算法破局——利用少量數(shù)據(jù),就能通過模型和軟件的升級從而有效解決。他表示,無感擴聲和錄播降噪對整個教育領(lǐng)域而言都是新的突破點。
產(chǎn)品持續(xù)迭代創(chuàng)新也是思必馳的堅持。“用戶可能只感受到一點點提升,這背后卻是我們投入大量資源進行技術(shù)優(yōu)化的結(jié)果。”王艷龍透露,如發(fā)布了近一年半的“無感擴聲吸頂麥”,至今已更新了近100個軟件版本。他表示,每更新一個版本都需要不斷進行數(shù)據(jù)補充、模型優(yōu)化、算法優(yōu)化、工程優(yōu)化等,一整套下來需要很多精力;但想讓一個產(chǎn)品從90分到99分甚至100分,并沒有什么捷徑,只能依靠長時間的專注投入、創(chuàng)新突破。
王艷龍還補充,每個產(chǎn)品的打造都離不開團隊協(xié)作。“單無感擴聲吸頂麥這一個產(chǎn)品,思必馳就投入了幾十人的團隊,涉及硬件工程師、軟件工程師、算法測試工程師等多個崗位。”他說,“為了確保極高的品質(zhì),我們的工程師甚至會在工廠駐扎一兩個月,只為解決一個細微問題、提升一點效果。”
多項技術(shù)指標全球領(lǐng)先
目前,思必馳對“人機智能交互語音系統(tǒng)”的研發(fā)與應用已相當深入。據(jù)悉,思必馳在汽車、家電領(lǐng)域均布局近十年,在新能源汽車領(lǐng)域的語音交互產(chǎn)品市場占有率為第一;而對辦公會議產(chǎn)品的研發(fā)也已持續(xù)五年。“我們在多項技術(shù)指標上全球領(lǐng)先。比如說辦公會議無感擴聲這個場景下,思必馳的吸頂麥對聲音處理的延遲約為25毫秒,擴能高達12-15DB。”王艷龍說,在該場景下的擴能可以突破10DB的,目前全球范圍內(nèi)只有思必馳一家。
應用思必馳“人機智能交互語音系統(tǒng)”的產(chǎn)品,往往具有眾多創(chuàng)新功能,因而在全球市場具備領(lǐng)先優(yōu)勢和廣闊空間。
在進行產(chǎn)品推廣方面,思必馳也很有一套、推出“無感擴聲吸頂麥”時,思必馳就在某全球IT巨頭的培訓教室里進行了近六個月的各類測試驗證,最終在一眾國際品牌中脫穎而出。“客戶選擇我們,其實就是因為我們的產(chǎn)品性能指標過硬、效果卓越,同時我們的服務足夠好。”王艷龍總結(jié)道。
對于此次思必馳“人機智能交互語音系統(tǒng)”入選“2025蘇州十大產(chǎn)業(yè)科技成果”,團隊深受鼓舞:“思必馳每年都會推出一到兩款突破性的產(chǎn)品。接下來我們還會繼續(xù)保持這個節(jié)奏,不斷應用AI技術(shù)推出創(chuàng)新成果,引領(lǐng)細分領(lǐng)域發(fā)展。”