盤點語音識別芯片原廠、方案、平臺_第1頁
已閱讀1頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語音識別芯片所涉及的技術(shù)包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。語音識別分類按照使用者的限制而言,語音識別芯片可以分為特定人語音識別芯片和非特定人語音識別芯片。特定人語音識別芯片是針對指定人的語音識別,其他人的話不識別,須先把使用者的語音參考樣本存入當成比對的資料庫,即特定人語音識別在使用前必須要進行語音訓(xùn)練,一般按照機器提示訓(xùn)練2遍語音詞條即可使用。非特定人語音識別是不用針對指定的人的識別技術(shù),不分

2、年齡、性別,只要說相同語言就可以,應(yīng)用模式是在產(chǎn)品定型前按照確定的十幾個語音交互詞條,采集200人左右的聲音樣本,經(jīng)過PC算法處理得到交互詞條的語音模型和特征數(shù)據(jù)庫,然后燒錄到芯片上。應(yīng)用這種芯片的機器(智能娃娃、電子寵物、兒童電腦)就具有交互功能了。非特定人語音識別應(yīng)用有的是基于音素的算法,這種模式下不需要采集很多人的聲音樣本就可以做交互識別,但是缺點是識別率不高,識別性能不穩(wěn)定。語音識別基本原理嵌入式語音識別系統(tǒng)都采用了模式匹配的原

3、理。錄入的語音信號首先經(jīng)過預(yù)處理,包括語音信號的采樣、反混疊濾波、語音增強,接下來是特征提取,用以從語音信號波形中提取一組或幾組能夠描述語音信號特征的參數(shù)。特征提取之后的數(shù)據(jù)一般分為兩個步驟,第一步是系統(tǒng)“學(xué)習(xí)“或“訓(xùn)練“階段,這一階段的任務(wù)是構(gòu)建參考模式庫,詞表中每個詞對應(yīng)一個參考模式,它由這個詞重復(fù)發(fā)音多遍,再經(jīng)特征提取和某種訓(xùn)練中得到。第二是“識別“或“測試“階段,按照一定的準則求取待測語音特征參數(shù)和語音信息與模式庫中相應(yīng)模板之間

4、的失真測度,最匹配的就是識別結(jié)果。語音識別四大平臺1、科大訊飛科大訊飛股份有限公司成立于1999年,是一家專業(yè)從事智能語音及語言技術(shù)、人工智能技術(shù)研究,軟件及芯片產(chǎn)品開發(fā),語音信息服務(wù)及電子政務(wù)系統(tǒng)集成的國家級骨干軟件企業(yè)。2008年,科大訊飛在深圳證券交易所掛牌上市,股票代碼:002230。11月23日科大訊飛輪值總裁胡郁在發(fā)布會上引述了羅永浩在9月錘子發(fā)布會上的演示數(shù)據(jù),表示科大訊飛的語音輸入識別成功率也達到了97%,即使是離線識別

5、準確率也達到了95%。2、云知聲云知聲成立于2012年6月。之前1年,Siri的發(fā)布再度喚醒了大家對語音識別的關(guān)注。經(jīng)過四年多的積累,云知聲的合作伙伴數(shù)量超過2萬家,覆蓋用戶超過1.8億,其中語音云平臺覆蓋城市超過470個,覆蓋設(shè)備超過9000萬臺。3、百度百度則在11月22日宣布向開發(fā)者開放了情感合成、遠場方案、喚醒二期和長語音方案等四項語音識別技術(shù)。百度語音開放平臺自2013年10月上線以來每日在線語音識別請求已經(jīng)達到了1.4億次,

6、開發(fā)者數(shù)量超過14萬。在如此龐大的數(shù)據(jù)支撐下,百度語音在“安靜條件下”的識別準確率達到了97%。4、搜狗搜狗語音團隊在11月21日推出了自己的語音實時翻譯技術(shù)。搜狗的這項技術(shù)主要包括兩個方面,分別是語音識別和機器翻譯。根據(jù)該團隊的介紹,搜狗語音識別的準確率達到了97%,支持最快400字每秒的聽寫。語音識別芯片原廠及芯片方案1、ICRoute總部:上海簡介:ICRoute專注于開拓語音識別的芯片市場致力于研發(fā)出高性能的語音識別,語音處理芯

7、片。為各種平臺的電子產(chǎn)品提供VUI(VoiceUserInterface)語音人機交互界面。目前提供的語音識別芯片,可7、上海華鎮(zhèn)電子科技有限公司總部:上海簡介:上海華鎮(zhèn)是專門從事語音識別、語音合成、聲紋識別技術(shù)的開發(fā)、研究、軟件應(yīng)用及提供全程技術(shù)支持和服務(wù)的高新科技企業(yè);全面掌握核心技術(shù),其中中文語音識別和合成技術(shù)代表了當今世界同類產(chǎn)品的領(lǐng)先水平。其技術(shù)能夠應(yīng)用于各種電子及通信設(shè)備,包括:智能玩具,智能家居系統(tǒng),智能汽車導(dǎo)航及聲控,智

8、能手機Smartphone、PDA、固定電話、移動電話,電信級的服務(wù)器及個人電腦等。語音識別芯片模塊:1)語音識別芯片模塊GM11A5502)高端語音識別芯片模塊WS117最多支持1000條詞條識別[此芯片已停產(chǎn)]3)特定人語音識別(SD)芯片WS1008、北京承芯卓越科技有限公司總部:北京簡介:公司成立于2006年12月,是一家立足于中關(guān)村清華科技園區(qū)的北京市高新技術(shù)企業(yè),海淀區(qū)創(chuàng)新企業(yè),是以提供具有自主知識產(chǎn)權(quán)的智能語音處理類專用芯

9、片和方案為主業(yè)的高科技公司。主要致力于自主研發(fā)嵌入式語音識別芯片、應(yīng)用軟件技術(shù)、和智能語音應(yīng)用方案。語音識別芯片:1)語音識別芯片28X2)語音識別芯片29X3)語音識別協(xié)處理芯片HBR34X9、深圳唯創(chuàng)知音電子有限公司總部:深圳簡介:專注于語音技術(shù)研究、語音產(chǎn)品方案設(shè)計及控制等軟、硬件設(shè)計的高新技術(shù)公司。杰出的語音芯片廠家,從事語音芯片研究及外圍電路開發(fā);同時為有特別需求的客戶制訂語音產(chǎn)品開發(fā)方案,并且落實執(zhí)行該方案,完成產(chǎn)品的研發(fā)、

10、測試,聲音處理,直至產(chǎn)品的實際應(yīng)用指導(dǎo)等一系列服務(wù)。業(yè)務(wù)范圍涉及電話錄音、汽車電子、多媒體、家居防盜、通信、家電、醫(yī)療器械、工業(yè)自動化控制、玩具及互動消費類產(chǎn)品等領(lǐng)。語音識別芯片模塊:WTK6900B01語音識別模塊語音識別的應(yīng)用前景智能語音車載曾經(jīng)看過一款汽車的概念宣傳廣告,駕駛員通過語音指令找到自己的車;打開車鎖,通過語音指令尋找導(dǎo)航,播放音樂等等,相當炫酷。當然對于智能車載來說更關(guān)鍵的是行車安全問題,對于駕駛員來說,能通過語音控制

11、接打電話,查看自己的社交軟件,絕對比在開車的過程中手忙腳亂的用手控制來的更安全。智能語音家居現(xiàn)在的智能家居市場之所以外熱內(nèi)冷,智能家居產(chǎn)品之所以不受消費者待見,一個非常主要的原因是現(xiàn)在的智能家居產(chǎn)品沒有抓住消費者的痛點,將原本簡單的事情復(fù)雜化了。在手機上找到控制app打開窗簾的過程遠比消費者直接走到窗前拉開窗簾來的麻煩。而有了語音識別的智能家居則不一樣,消費者只要輕輕說聲“開窗簾”就能打開窗簾。智能語音醫(yī)療應(yīng)用前一段時間,著名語音識別企

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論