創(chuàng )澤機器人 |
CHUANGZE ROBOT |
站在新的一個(gè)十年,智能人機交互、多模態(tài)融合、結合L域需求的 NLP 解決方案建設、知識圖譜結合落地場(chǎng)景等將會(huì )有突破性變化。
1 智能人機交互
語(yǔ)言模型將在智能人機交互中扮演更重要的角色,形成更豐富的形式,混合 100 種語(yǔ)言的多語(yǔ)言語(yǔ)言模型,以及融合圖像-文本和語(yǔ)音-文本多模態(tài)語(yǔ)言模型將嶄露頭角,在不同語(yǔ)言、不同模態(tài)、不同L域的小樣本場(chǎng)景下帶來(lái)多面的能力提升。
多語(yǔ)言交互從不同語(yǔ)言理解上升到不同文化的理解,通過(guò)跨文化理解技術(shù)深入當地文化實(shí)現地道的對話(huà)交互。
以在線(xiàn)文本為核心的交互方式將多面轉變?yōu)榻Y合視頻、圖像、語(yǔ)音、文本的多模態(tài)人機交互。
基于數據驅動(dòng)的對話(huà)狀態(tài)跟蹤和對話(huà)策略將逐漸替代規則式策略,使得多輪對話(huà)技術(shù)進(jìn)一步演進(jìn),帶來(lái)更自然的對話(huà)體驗。
知識圖譜將廣泛融入問(wèn)答和對話(huà)的各類(lèi)深度學(xué)習模型,通過(guò)先驗知識及推理能力的融入,使得模型更為白盒化,在對話(huà)的理解和生成過(guò)程中帶來(lái)更好的可控性和可解釋性。
對話(huà)系統在小樣本情況下的冷啟動(dòng)能力提升帶來(lái)應用構建成本的大幅下降,對話(huà)系統從主要為大體量的客戶(hù)服務(wù),拓展為更普惠的、廣泛的支持海量規模、各行業(yè)的小企業(yè)及小商家,并進(jìn)一步走向海外,使得更多不同國家、不同語(yǔ)言和不同文化的用戶(hù)進(jìn)入智能服務(wù)時(shí)代。
2 多模態(tài)融合
隨著(zhù) 5G 和邊緣計算的逐步成熟和普及,將帶來(lái)視頻、圖像、文本、語(yǔ)音等模態(tài)的多面融合,語(yǔ)言模型朝著(zhù)多模態(tài)融合的方向發(fā)展,在在線(xiàn)場(chǎng)景下實(shí)現混合模態(tài)的理解,將能融合理解用戶(hù)經(jīng)過(guò)多輪對話(huà)發(fā)送的圖片、語(yǔ)音和文字內容,并以多模態(tài)的形式進(jìn)行回復;
對話(huà)系統產(chǎn)品中將多面實(shí)現多模態(tài)交互能力,直播和 IOT 大屏交互將多面應用視頻+圖像+文本多模態(tài)技術(shù)帶來(lái)豐富的交互體驗,流暢的全雙工語(yǔ)音對話(huà)機器人將被普遍應用,實(shí)現邊聽(tīng)邊想、邊聽(tīng)邊猜、主動(dòng)搶話(huà)等類(lèi)人交互能力。
在語(yǔ)音交互場(chǎng)景下通過(guò)聲學(xué)信號+文字信號,識別用戶(hù)交流中的情緒變化, 在 IOT 互動(dòng)場(chǎng)景下實(shí)現基于攝像頭、麥克風(fēng)的擬態(tài)生命;
3 結合L域需求的NLP解決方案建設
過(guò)去 NLP 算法多以平臺/API 的方式輸出通用模型,相應地也在各種云上建立了通用 NLP 算法平臺(Amazon Comprehend,微軟 Azure Text Analytics,谷歌云 Natural Language,阿里 NLP,百度 NLP 等)。
但是在業(yè)務(wù)場(chǎng)景中,每種場(chǎng)景L域都有自己的特定的需求,產(chǎn)生了相應的場(chǎng)景數據。通用模型結合場(chǎng)景數據進(jìn)行L域自適應訓練,從而輸出的L域定制模型會(huì )更好地滿(mǎn)足業(yè)務(wù)需求。
4 知識圖譜結合落地場(chǎng)景
面向新的一個(gè)十年,通過(guò) NLP 和知識圖譜兩大核心技術(shù)來(lái)構建行業(yè)知識圖譜,機器能夠通過(guò)知識圖譜挖掘隱性關(guān)系,洞察“肉眼”無(wú)法發(fā)現的關(guān)系和邏輯,用于終的業(yè)務(wù)決策,實(shí)現更深層次的業(yè)務(wù)場(chǎng)景落地。從發(fā)展方向來(lái)說(shuō),可以分為下面幾個(gè)方面:
優(yōu)化知識抽取能力:結合已有的知識和 NLP 技術(shù)能力進(jìn)一步提G非結構化數據理解能力,應用預訓練語(yǔ)言模型、信息抽取、實(shí)體鏈接等相關(guān)的技術(shù),對非結構化及半結構化數據進(jìn)行抽取和轉換,形成知識圖譜形式的知識,以及和知識圖譜里面的結構化的知識進(jìn)行鏈接。
與行業(yè)知識沉淀:在行業(yè)知識圖譜解決方案實(shí)際的落地過(guò)程中,面臨重重挑戰,行業(yè)知識圖譜的構建,本身就需要數據積累和基于業(yè)務(wù)場(chǎng)景的數據理解,而構建和積累行業(yè)知識圖譜,將是認知智能時(shí)代的核心競爭力。在行業(yè)數據構建時(shí),對知識的準確性要求非常G,實(shí)體通常需要較多且具有行業(yè)意義。需要針對多源異構數據融合,基于可動(dòng)態(tài)變化的“概念—實(shí)體—屬性—關(guān)系”數據模型,對各種類(lèi)型的數據進(jìn)行抽象建模。
智能可信的知識推理:基于過(guò)去已知知識進(jìn)行知識推理,理解行業(yè)事件知識驅動(dòng)知識推理傳導,利用行業(yè)規則邏輯結合深度模型進(jìn)行推理,使其能夠在業(yè)務(wù)的推理和輔助決策上帶來(lái)更加智能化的體驗。
以上是我們對于 NLP 技術(shù)過(guò)去一年發(fā)展的回顧和今年趨勢的思考。一家之言難免疏漏或者以偏概全。拋磚引玉,希望能夠得到更多同學(xué)們的思考和指正。比爾·蓋茨曾說(shuō)過(guò),“語(yǔ)言理解是 人工智能 皇G上的明珠”。要達到這樣的G度,還需要技術(shù)和應用上的突破發(fā)展期待在下一個(gè)十年的開(kāi)始,我們一起讓 NLP 技術(shù)發(fā)展更加迅速,應用場(chǎng)景更加豐富,推動(dòng)認知智能的發(fā)展更進(jìn)一步。
![]() |
機器人招商 Disinfection Robot 機器人公司 機器人應用 智能醫療 物聯(lián)網(wǎng) 機器人排名 機器人企業(yè) 機器人政策 教育機器人 迎賓機器人 機器人開(kāi)發(fā) 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖 |