近日,搜狗推出轉錄、速記“神器”——搜狗聽寫,從搜狗輸入法的語音識別“進化”到搜狗聽寫,AI應用逐漸“飛入尋常百姓家”,自然交互也領跑著AI場景化落地。
當2006年搜狗輸入法正式上線時,用戶正處于鍵盤輸入的黃金時代;2011年,搜狗開始布局自己的語音技術,并在一年之內快速產品化。從鍵盤到觸屏,再到語音輸入,搜狗輸入法在“人機交互”方式上不斷積累著經驗,用嘴打字也逐漸從時尚變成用戶習慣。
語音是人類交流、人機交互最自然的方式,它同樣也被認為是開啟人工智能時代的起點。搜狗公司作為國內AI能力最強的互聯網公司之一,早已建立了強大的語音自研團隊,擁有目前互聯網規模最大的語音數據。統計顯示,搜狗輸入法單語音輸入日頻次已達2.6億次,比一年前增長80%以上。通過大規模的優質語音訓練數據和深度學習的技術能力積累,搜狗也將這種語音識別的技術優勢轉化到了更多的適用場景中。
從技術上來看,搜狗聽寫產品的關鍵在于語音識別準確率,據了解,搜狗聽寫使用了搜狗輸入法的長時語音轉寫技術,從立項到現在,錯誤率已經下降了30%。在聲學模型方面,采用了端到端深度神經網絡技術Deep LC-CLDNN+CTC技術,轉寫模式則使用了Deep CNN+CTC的方式,語言模型基于T級海量輸入法文本數據使用神經網絡進行建模。
搜狗聽寫的識別準確率已達到國際領先水平,語音輸入比鍵盤打字更快、更方便、更準確。但AI的應用過程并不完全是技術導向,而是場景驅動的產品導向,重點在于如何深入用戶需求、怎樣更多地結合使用場景,只有把需求和場景結合起來才能成為好的AI產品。在語音領域,搜狗最先意識到,產品落地需要場景驅動,在垂直化場景中,AI才能真正為用戶所用。
在具體的應用場景上,搜狗聽寫針對用戶使用的不同環境,如開會,寫小說等場景進行優化,識別效果較通用效果提升15%以上;針對圖書館、咖啡廳等不便于大聲說話而又有使用語音的場景,提供耳語識別技術,在人的說話音量低至30分貝時,依然可以準確識別。搜狗聽寫作為一款多場景的語音聽寫工具,大大提高了用戶生產力。
從搜狗輸入法的語音識別能力延伸到搜狗聽寫,自然交互改變生活的大幕逐漸拉開。未來,語音技術在各種應用場景中還有大量機會,比如在智能家居的場景,我們希望回家以后可以使用語音和電視、遙控器、音箱、窗簾等講話。不僅是智能家居應用場景,而且在更多的垂直化應用場景中,如車載、醫療、教育等環境,語音帶來的人機交互變化將深刻改變我們的生活方式和習慣。
人類對于人工智能的終極描繪,始終是同人一樣進行自然的語言交流,這也是搜狗人工智能的發展目標。對于搜狗輸入法,AI也賦予了它更多的未來,在搜狗的概念中,使用輸入法時機器能更好地理解人的意圖,從而推送相關聯的信息、衍生內容,未來,搜狗輸入法的輔助對話將幫助人類在機器時代更好地進行交流。
從輸入法到搜狗聽寫再到輔助對話,搜狗通過AI技術對人的自然交互進行了延展,提高了設備的便利性、及時性,拓寬了實用場景并增加了交互緯度,搜狗一直在做的就是幫助用戶“表達和獲取信息更簡單”,將人工智能技術發展聚焦在語言領域,自然交互領跑著AI應用落地。
細分市場研究 可行性研究 商業計劃書 專項市場調研 兼并重組研究 IPO上市咨詢 產業園區規劃 十三五規劃
中研網 發現資訊的價值
研究院 掌握產業最新情報 中研網是中國領先的綜合經濟門戶,聚焦產業、科技、創新等研究領域,致力于為中高端人士提供最具權威性的產業資訊。每天對全球產業經濟新聞進行及時追蹤報道,并對熱點行業專題探討及深入評析。以獨到的專業視角,全力打造中國權威的經濟研究、決策支持平臺!
廣告、內容合作請點這里尋求合作
8月21日下午,微信被爆出現大面積故障,主要表現在其他APP內容均無法分享到好友及朋友圈,微信轉賬功能也暫時失效,但...
在8月16日舉行的中國聯通業績溝通會上,中國聯通董事長王曉初稱,擬將募集資金用于4G及5G相關業務和創新業務建設。 8...
近來,美國媒體和分析師對于指紋識別缺失的影響進行了分析,有分析師認為,這將會影響到iPhone 8的銷量。 美國多家3...
8月21日晚,小米通過網絡直播的形式發布了第二款面向新零售的手機——紅米Note 5A。 這款新手機分“標準”和“高配5...
昨日晚間,酷派集團發布公告稱,公司近日接到上海浦東發展銀行股份有限公司深圳分行(以下簡稱原告)訴本公司的附屬公...
北京時間8月22日早間消息,美國市場研究公司eMarketer周一發布研究報告稱,Facebook今年在美國青少年和年輕成年群體中...