<menu id="4s2qm"><strong id="4s2qm"></strong></menu>
<xmp id="4s2qm">
<nav id="4s2qm"><code id="4s2qm"></code></nav>
<nav id="4s2qm"><strong id="4s2qm"></strong></nav>
  • <nav id="4s2qm"><code id="4s2qm"></code></nav>
    <nav id="4s2qm"><strong id="4s2qm"></strong></nav><dd id="4s2qm"><menu id="4s2qm"></menu></dd>
    <menu id="4s2qm"><code id="4s2qm"></code></menu>
    <menu id="4s2qm"></menu>
    <nav id="4s2qm"><code id="4s2qm"></code></nav>
    首頁 > 新聞中心 > 研究動態
    集萃感知技術進展:基于深度學習的人工聲學技術取得突破
    2021-04-09 | 集萃感知

    柔性可穿戴的聲音采集設備具有可拉伸、貼合皮膚及高靈敏特性。然而,聲帶的振動和肌肉的收縮是復雜且多變的,這會降低設備的探測效果。針對此問題,深圳大學張晗教授、丁惠君老師團隊和集萃感知的所長岳玉濤教授通過將深度學習網絡(Deep learning)和二維MXenes相結合,成功地制備了基于MXenes的人工喉聲音探測器。未來,該探測器有可能成為可穿戴人工喉嚨設備的核心傳感器,以幫助失語患者進行交流。該研究成果被發表在《Advanced Materials Technologies》期刊上。

    2016年創刊的《Advanced Materials Technologies》旨在發表與技術相關的材料應用研究, 聚焦于先進器件的設計制備與一體化和基于新型材料的技術,2017-2019年影響因子分別為4.622、5.395、5.969,年平均增長率達13.65%。

    原文內容如下

    Advanced Materials Technologies, 2020-07-06

    柔性可穿戴的聲音采集設備具有可拉伸、貼合皮膚及高靈敏特性。然而,聲帶的振動和肌肉的收縮是復雜且多變的,這會降低設備的探測效果。

    針對此問題,深圳大學張晗教授、丁惠君老師團隊和AI雷達感知技術專業研究所集萃感知的所長岳玉濤教授通過將深度學習網絡(Deep learning)和二維 MXenes相結合,成功地制備了基于MXenes的人工喉聲音探測器,該聲音探測器具有增強的識別能力以及對壓力和振動的敏感響應,從而有利于開發高識別度和分辨率的聲音探測器。通過使用基于MXenes的聲音探測器獲得的大量數據訓練和測試深度學習網絡模型,可以成功識別人類發出的長元音和短元音。該設計推進了基于二維MXenes的人工喉設備在生物醫學領域的應用,并開辟了在語音控制,運動監控和許多其他領域中的實際應用。該論文“Deep‐Learning‐Enabled MXene‐Based Artificial Throat: Toward Sound Detection and Speech Recognition”發表在《Advanced Materials Technologies》期刊上。

    圖1 深度學習增強的人工喉聲音探測器

    MXene是一類二維結構的過渡金屬碳化物和/或氮化物,化學式為Mn + 1XnTx(n = 1,2,3),其中M為過渡金屬,X為碳或/和氮,T表示表面官能團。MXene具有許多優異的優點,包括良好的抗氧化性,出色的導電和機械性能。近年來,基于MXene的傳感器研究發展迅猛。目前,許多柔性傳感器可以用于檢測人的發音信號。然而,這些研究僅實現了對人類喉嚨發音的基本檢測,而沒有進一步應用于人工智能語音識別領域,以幫助我們準確識別發音內容的可行性。

    我們通過HF蝕刻MAX相粉末并超聲剝離制備了MXenes。XRD圖譜中(002)峰位藍移且寬化,表明其晶格間距變大。進一步通過SEM和TEM測試,可以看到MXene具有典型的二維結構特征。

    我們將超聲剝離后的少層MXenes懸濁液通過抽濾成膜,制備出純MXenes柔性膜,我們進一步連接電極并附著一層柔性的PDMS支撐膜,制備出了基于MXenes的柔性人工喉原型器件。通過對不同頻率和聲壓級的聲音信號激勵測試,發現該器件表現出良好的響應行為。

    我們進一步將上述器件貼合于人喉部,并測量在不同發音下的響應行為。我們測量了六組不同的漢語發音的響應行為。測量結果表明,MXene聲音探測器對不同發音具有特征響應峰。盡管MXene聲音探測器能夠區分不同的人類發音,但仍不清楚所檢測到的信號是否足以進行語音識別。一方面,當檢測到的信號不能提供足夠的信息或干擾嚴重時,語音識別的準確性大大降低,另一方面,復雜的應用環境對設備造成的干擾會影響測試結果。

    在提高MXene聲音探測器性能的同時,我們還需要開發一種性能優越的魯棒語音識別算法來應對上述復雜情況。近年來,深度學習方法在數據學習方面得到了不斷優化,其抗干擾能力和復雜環境適應性遠高于傳統方法。

    因此,我們結合深度學習網絡,將大量檢測到的響應信號與深度學習網絡相結合,可以深入分析來自不同發音檢測到的電阻變化數據,從而獲得良好的識別結果。我們將1500組數據作為數據集,隨機選取1050組數據進行訓練,包括525個長元音和525個短元音,其余數據包括225個長元音和225個短元音用作測試數據集。

    圖2. MXenes的結構表征

    圖3. MXenes人工喉器件結構及形變相應機制

    圖4. MXenes人工喉在不同頻率及聲壓級下的響應行為

    圖5.穿戴MXenes人工喉的臨床數據采集及分辨效果

    圖6 MXenes人工喉的深度學習及測試識別率

    隨著訓練數據的增加,準確率也不斷上升,最終穩定在~95%。同時,通過深度學習網絡識別數據,表現出理想的識別作用。在未來,隨著數據集的不斷豐富,我們的MXene聲音探測器有可能成為可穿戴的人工喉嚨設備,以幫助患者進行交流。

    深圳大學靳雨錕、北京大學深圳醫院溫博博士為論文的共同一作作者。本論文的通訊作者為深圳大學丁惠君博士和張晗教授。集萃感知所長岳玉濤教授在研究過程中給予了大力指導。

    集萃感知由江蘇省產業技術研究院、無錫國家高新區和岳玉濤博士深度感知團隊共同成立,是集技術創新、應用落地和產業孵化于一體的市場化新型研發機構。現有團隊規模50人,其中博士占比達35%,包含院士1人、國家及省市級高層次人才6人。集萃感知堅持用人工智能技術賦能傳統雷達,自研的核心產品和技術包括智能毫米波雷達、智能電磁調控技術、4D毫米波雷達成像技術、基于SNN的深度學習技術、異構感知融合技術等,可廣泛應用于智能交通與車路協同、智能汽車、智慧安防和消費電子等領域。

    Deep‐Learning‐Enabled MXene‐Based Artificial Throat: Toward Sound Detection and Speech RecognitionYukun Jin, Bo Wen, Zixiong Gu, Xiantao Jiang, Xiaolan Shu, Zhenping Zeng, Yupeng Zhang, Zhinan Guo, Yun Chen, Tingting Zheng, Yutao Yue, Han Zhang and Huijun DingAdvanced Materials Technologies, 2020-07-06DOI: 10.1002/admt.202000262

    新聞中心
    你所關心的是我們走過的每一步
    訂閱
    獲得最新的集萃感知信息
    集萃深度感知技術研究所(英文縮寫IDPT,簡稱“集萃感知”)隸屬江蘇省產業技術研究院,致力于用AI雷達點亮機器視界,主營產品為智能交通雷達、雷視一體機、NB-IoT單燈控制器、車路協同系統方案、智慧照明系統方案等,可應用于智能交通、車路協同、智慧照明、智慧城市等領域。
    bd@idpt.org
    0510-85388099
    13816071849(銷售)
    18896537391(市場)
    江蘇省產業技術研究院深度感知技術研究所 Institute of Deep Perception Technology, JITRI
    在線留言
    請填寫所在公司/機構
    請填寫感興趣的產品
    請填寫詢問信息
    請填寫姓名
    請填寫電子郵件地址
    請填寫電話號碼
    成人视频app