多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國(guó)內(nèi)最全I(xiàn)T社區(qū)平臺(tái) 聯(lián)系我們 | 收藏本站
阿里云優(yōu)惠2
您當(dāng)前位置:首頁(yè) > 互聯(lián)網(wǎng) > 云知聲康恒:語(yǔ)音讓互聯(lián)網(wǎng)服務(wù)更貼心

云知聲康恒:語(yǔ)音讓互聯(lián)網(wǎng)服務(wù)更貼心

來(lái)源:程序員人生   發(fā)布時(shí)間:2014-10-13 19:14:35 閱讀次數(shù):3372次

隨著人工智能技術(shù)近年來(lái)的發(fā)展,語(yǔ)音識(shí)別與合成技術(shù)的成熟度已經(jīng)達(dá)到了可以日用的程度,越來(lái)越多地融入了人們的日常生活。無(wú)論是在電話查詢、購(gòu)票等商務(wù)領(lǐng)域用以代替人工服務(wù)的角色,還是在計(jì)算機(jī)、電視機(jī)及移動(dòng)設(shè)備上進(jìn)行語(yǔ)音搜索、語(yǔ)音輸入、語(yǔ)音音頻資料文本化、程序界面的語(yǔ)音操控等方面,語(yǔ)音技術(shù)都得到了廣泛的應(yīng)用。在這一技術(shù)的應(yīng)用中,云知聲語(yǔ)音云由于其平臺(tái)開(kāi)放、可擴(kuò)展性好,向普通開(kāi)發(fā)者免費(fèi),因此非常易于推廣和使用。在剛剛過(guò)去的第六屆云計(jì)算大會(huì)上,CSDN采訪了云知聲的聯(lián)合創(chuàng)始人、COO康恒。


云知聲聯(lián)合創(chuàng)始人、COO康恒

CSDN:請(qǐng)您介紹一下云知聲語(yǔ)音云平臺(tái)以及它當(dāng)下的規(guī)模。

康恒:云知聲語(yǔ)音云從2012年9月開(kāi)始運(yùn)營(yíng),主要面向開(kāi)發(fā)者和第三方客戶,為他們提供語(yǔ)音識(shí)別與理解的功能。

通過(guò)云知聲語(yǔ)音云,開(kāi)發(fā)者能夠在應(yīng)用程序中添加一些語(yǔ)音交互能力。例如,在一個(gè)機(jī)票查詢應(yīng)用中,用戶可以直接說(shuō),“我想查一下今天晚上從北京飛往上海的飛機(jī)”。我們提供的的SDK和API應(yīng)用起來(lái)很容易。不超過(guò)10行代碼,就可以在應(yīng)用里面添加語(yǔ)音交互能力,從而讓用戶得到便捷易用的應(yīng)用程序。

云知聲語(yǔ)音云的能力可以概括成三點(diǎn):一,把用戶的語(yǔ)音轉(zhuǎn)換成文字;二,理解用戶文字的真正含義和意圖;三,把用戶的意圖轉(zhuǎn)換成答案,然后通過(guò)文字、圖形,或者網(wǎng)頁(yè)、聲音再把它表達(dá)出來(lái)。整個(gè)過(guò)程包括語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成這三方面技術(shù)。

規(guī)模方面,云知聲語(yǔ)音云發(fā)展到現(xiàn)在不到兩年,日調(diào)用量已經(jīng)超過(guò)一千萬(wàn)。考慮到我們的平臺(tái)是個(gè)專業(yè)平臺(tái),這個(gè)量是比較大的。我們的用戶不僅來(lái)自全國(guó)各個(gè)地區(qū),也來(lái)自全球100多個(gè)國(guó)家和地區(qū),而且,從這些用戶的使用情況來(lái)說(shuō),反應(yīng)速度和可用性都是非常好的。我們的語(yǔ)音云平臺(tái)部署在全國(guó)各地高質(zhì)量的IDC環(huán)境下,因此穩(wěn)定性非常好,也能夠容災(zāi)。

CSDN:語(yǔ)音識(shí)別技術(shù)的正確率是怎么控制的呢?

康恒:云知聲的語(yǔ)音識(shí)別非常準(zhǔn)確。用戶說(shuō)一句話時(shí),不希望識(shí)別結(jié)果有很多錯(cuò)別字或者完全不正確。云知聲語(yǔ)音識(shí)別的技術(shù)在兩年的運(yùn)營(yíng)過(guò)程中,我們不斷改進(jìn)識(shí)別引擎的算法,通過(guò)線上運(yùn)營(yíng)中獲得的用戶習(xí)慣、環(huán)境、場(chǎng)景等數(shù)據(jù),持續(xù)地對(duì)系統(tǒng)進(jìn)行迭代。通過(guò)數(shù)據(jù)和算法的持續(xù)迭代,不斷改進(jìn)語(yǔ)音識(shí)別的性能。

云知聲語(yǔ)音云的平均識(shí)別率已經(jīng)超過(guò)95%,這是針對(duì)所有用戶而言的。對(duì)于普通話比較標(biāo)準(zhǔn)的用戶來(lái)說(shuō),識(shí)別率可達(dá)99%。只有在完全說(shuō)的是家鄉(xiāng)話,或者環(huán)境非常嘈雜的情況下,才會(huì)造成識(shí)別率的降低。總體來(lái)說(shuō),平均95%意味著對(duì)于大部分用戶來(lái)說(shuō),可用性是非常強(qiáng)的。

另外一方面,通過(guò)算法和機(jī)器學(xué)習(xí),我們屏蔽了特定類型的背景噪聲,提高了識(shí)別率。并且只要有足夠多的數(shù)據(jù),在理論上還能做到鄉(xiāng)音的識(shí)別。

CSDN:云知聲怎樣能夠保證服務(wù)的高質(zhì)量?

康恒:云知聲的識(shí)別率很高,但我們還需要保證用戶的可用性。如果它的系統(tǒng)環(huán)境不好,用戶可能會(huì)遇到服務(wù)器死機(jī)之類問(wèn)題。處理大量的請(qǐng)求時(shí)如果系統(tǒng)很繁忙,用戶使用起來(lái)就會(huì)非常難受。為此,我們采用了語(yǔ)音云架構(gòu),提供一整套服務(wù)器集群來(lái)做語(yǔ)音識(shí)別,這樣一來(lái),即使出現(xiàn)個(gè)別的服務(wù)器因?yàn)檐浻布收铣霈F(xiàn)宕機(jī),也不會(huì)影響最終用戶得到的服務(wù)。我們還有非常好的動(dòng)態(tài)負(fù)載均衡技術(shù),可以保證每個(gè)地區(qū)的用戶直接訪問(wèn)一臺(tái)最近、最快的服務(wù)器,保證最終的用戶體驗(yàn)。我們提供了大規(guī)模的服務(wù)的集群,能容納每天數(shù)千萬(wàn)次的調(diào)用,并且隨時(shí)可以擴(kuò)展。

CSDN:為了方便開(kāi)發(fā)者,云知聲提供了永久免費(fèi)的開(kāi)放云平臺(tái)。這種永久免費(fèi)的開(kāi)放平臺(tái)和收費(fèi)服務(wù)相比有哪些區(qū)別?云知聲的盈利模式是怎樣的?

康恒:免費(fèi)提供開(kāi)放云平臺(tái)是我們運(yùn)營(yíng)模式的選擇。從服務(wù)質(zhì)量和核心的服務(wù)內(nèi)容來(lái)說(shuō)是沒(méi)有任何差別的。為什么我們要用免費(fèi)的方式來(lái)運(yùn)作語(yǔ)音云,而不是像其它供應(yīng)商那樣通過(guò)收費(fèi)的方式運(yùn)營(yíng)呢?是因?yàn)槲覀兛紤]到以下幾點(diǎn):

第一,語(yǔ)音行業(yè)目前在發(fā)展期,我們希望降低其使用門檻,讓越來(lái)越多的開(kāi)發(fā)者和用戶意識(shí)到這個(gè)技術(shù)正在走進(jìn)他們的生活,而不會(huì)因?yàn)閮r(jià)格或者其它資源的限制,讓他們對(duì)語(yǔ)音技術(shù)的使用有所顧慮。

第二,從語(yǔ)音技術(shù)的使用場(chǎng)景來(lái)說(shuō),我們更希望把語(yǔ)音技術(shù)和移動(dòng)互聯(lián)網(wǎng)應(yīng)用場(chǎng)景結(jié)合起來(lái)。移動(dòng)互聯(lián)網(wǎng)的環(huán)境除了手機(jī)之外,還包括智能終端、車載、可穿戴、智能家具等各種各樣的領(lǐng)域。除了我們常見(jiàn)的觸摸之外,語(yǔ)音是非常自然的操作方式。只有跟這些移動(dòng)互聯(lián)網(wǎng)技術(shù)結(jié)合起來(lái),語(yǔ)音技術(shù)才能發(fā)揮它應(yīng)該發(fā)揮的能力,所以我們希望通過(guò)免費(fèi)的運(yùn)營(yíng)模式來(lái)推廣語(yǔ)音技術(shù)。

移動(dòng)互聯(lián)網(wǎng)的商業(yè)模式不一定是收費(fèi)的。我們可以通過(guò)其他方式來(lái)獲得對(duì)語(yǔ)音云的成本的投入。我們希望運(yùn)營(yíng)模式能夠互聯(lián)網(wǎng)化,而不是像傳統(tǒng)的模式那樣收取語(yǔ)音費(fèi)用。

第三,語(yǔ)音云也有大量的付費(fèi)用戶,付費(fèi)的用戶和免費(fèi)的用戶相比,其服務(wù)質(zhì)量和核心服務(wù)內(nèi)容是沒(méi)有差別的。為什么有大量的用戶愿意付費(fèi)使用呢?主要是因?yàn)槲覀兊脑鲋禈I(yè)務(wù),如影視劇的搜索、地圖的導(dǎo)航、音樂(lè)的搜索、醫(yī)療領(lǐng)域等。同時(shí)又有一些不在這些服務(wù)領(lǐng)域里的用戶,他希望也使用我們的開(kāi)放語(yǔ)音云,我們就可能就需要幫助用戶來(lái)進(jìn)行定制。一方面是針對(duì)他們的特定業(yè)務(wù)來(lái)提升他們語(yǔ)音識(shí)別的準(zhǔn)確程度,二是這些行業(yè)的用戶也有可能會(huì)有接入方面的要求或者接口方面的要求。

我們針對(duì)用戶這部分特殊的需求進(jìn)行收費(fèi),滿足他們,幫助他們更好地接入我們的語(yǔ)音云平臺(tái),他們就能獲得這部分增值的業(yè)務(wù)。

總體而言,我們的盈利模式如下:

第一,剛才提到公有云增值服務(wù),我們對(duì)特殊的用戶提供對(duì)應(yīng)的領(lǐng)域優(yōu)化,收取服務(wù)費(fèi)用。

第二,針對(duì)一些特定的客戶,給這些客戶部署一些私有服務(wù)。像政府、金融機(jī)構(gòu)等對(duì)于數(shù)據(jù)的使用是非常敏感的,所以,它們可能并不直接使用我們的公有服務(wù),而是由我們把服務(wù)部署在客戶那里,并向它們收取授權(quán)費(fèi)。

第三,針對(duì)特定的行業(yè)開(kāi)發(fā)整體的解決方案。比如針對(duì)客服中心這個(gè)領(lǐng)域,我們推出了智能語(yǔ)音導(dǎo)航服務(wù)和智能客服。比方說(shuō)用戶直接撥打電話,說(shuō),“我想查我這個(gè)月的信用卡帳單”,通過(guò)語(yǔ)音他就直接獲得了他的帳單信息,而不需要像傳統(tǒng)的方式通過(guò)按鍵聽(tīng)提示,周期非常長(zhǎng)而且也不一定真正找到自己想要的服務(wù)。通過(guò)我們智能語(yǔ)音導(dǎo)航,非常自然、非常方便地直達(dá)他要的服務(wù)。

智能客服的背景是,客戶服務(wù)會(huì)占用大量的人力資源來(lái)處理業(yè)務(wù)。我們的智能客服用語(yǔ)音識(shí)別、自然語(yǔ)音理解、語(yǔ)音合成這樣的技術(shù),自動(dòng)回答客戶的問(wèn)題,自動(dòng)處理客戶業(yè)務(wù)的請(qǐng)求,包括訂單等業(yè)務(wù)。這樣整體的解決方案,對(duì)于我們來(lái)說(shuō)都是有成熟的客戶和應(yīng)用案例的,這也是一項(xiàng)重要的收入來(lái)源。

未來(lái)通過(guò)開(kāi)放的語(yǔ)音云,還可以做大量的數(shù)據(jù)業(yè)務(wù),比如說(shuō)通過(guò)大量語(yǔ)音云用戶獲得用戶的一些使用習(xí)慣、年齡、性別、使用地點(diǎn)、習(xí)慣,這些信息。最直接的例子是,它可以幫助我們的廣告用戶提升廣告推送的準(zhǔn)確程度。比如如果有一個(gè)手機(jī)廠商,他主打的是30--40歲之間的、有一定支付能力的、有一定的欣賞品位的、可能是男性或者女性的用戶,他推送廣告的時(shí)候要獲取用戶,就可以直接從我們的語(yǔ)音云平臺(tái)上得到這一目標(biāo)人群,這也是未來(lái)很大的價(jià)值。云和大數(shù)據(jù)結(jié)合可以產(chǎn)生更多的化學(xué)反應(yīng),這是未來(lái)很大的方向。

CSDN:云知聲目前有哪些比較大型的客戶呢?

康恒:云知聲到目前為止,已經(jīng)有超過(guò)3000家客戶和合作伙伴。傳統(tǒng)的有通用汽車、清華同方、聯(lián)想、華為、中興等。互聯(lián)網(wǎng)業(yè)有樂(lè)視、小米等。汽車、影視、電視、音樂(lè)、醫(yī)療等,我們生活中涉及的方方面面都用到我們的服務(wù),這是我們客戶的大概情況。

CSDN:我們剛才談到的是跟用戶之間的關(guān)系,那我們和開(kāi)發(fā)者之間又是什么樣的關(guān)系?

康恒:云知聲的開(kāi)放平臺(tái),承擔(dān)了開(kāi)發(fā)者和最終用戶之間的橋梁,我們幫助開(kāi)發(fā)者形成一個(gè)人機(jī)交互的中間層,這個(gè)中間層負(fù)責(zé)把用戶的自然語(yǔ)音翻譯成對(duì)應(yīng)的意圖,然后交給應(yīng)用開(kāi)發(fā)者,應(yīng)用開(kāi)發(fā)者獲得這樣的意圖之后,處理請(qǐng)求,再交給我們的語(yǔ)音交互層,以一種自然的方式返回給最終用戶。打比方就是翻譯官,翻譯了用戶的自然語(yǔ)音,把它轉(zhuǎn)換成機(jī)器可以理解的指令,再相反地把機(jī)器的指令轉(zhuǎn)換成自然語(yǔ)音,交給用戶,這就是云知聲的角色。

CSDN:云知聲是否因?yàn)?/b>4G的出現(xiàn)做出一些戰(zhàn)略調(diào)整?其中又存在者什么樣的機(jī)遇?哪類型的服務(wù)可以從4G獲益?

康恒:4G的出現(xiàn)將使得中國(guó)的移動(dòng)互聯(lián)網(wǎng)有本質(zhì)的改變。移動(dòng)互聯(lián)網(wǎng)的業(yè)務(wù)是高度依賴于網(wǎng)絡(luò)的,而第三方的統(tǒng)計(jì)報(bào)道得出的結(jié)論是,中國(guó)大部分用戶日常使用的網(wǎng)絡(luò)是WiFi。之所以不采用移動(dòng)互聯(lián)網(wǎng)的原因是網(wǎng)速問(wèn)題,因?yàn)橹袊?guó)大部分用戶都是中國(guó)移動(dòng)的用戶,而中國(guó)移動(dòng)因?yàn)榧夹g(shù)原因,它的3G技術(shù)并沒(méi)有得到廣泛普及,所以大量的移動(dòng)互聯(lián)網(wǎng)的用戶還是處于2G或者2.5G這樣的區(qū)間,其網(wǎng)速限制使得他們使用的業(yè)務(wù)出現(xiàn)一些限制。比如圖片、音樂(lè)、視頻、聲音等一些業(yè)務(wù),因?yàn)榫W(wǎng)速限制而不能得到完整的能力。

帶寬對(duì)于語(yǔ)音的交互方式尤其重要,因?yàn)檎Z(yǔ)音希望做到的就是讓用戶隨時(shí)隨地方便使用移動(dòng)互聯(lián)網(wǎng)進(jìn)行交互。語(yǔ)音的使用,對(duì)網(wǎng)絡(luò)會(huì)有比較高的要求。傳統(tǒng)的移動(dòng)網(wǎng)絡(luò)不夠好,限制了語(yǔ)音的使用,4G技術(shù)的出現(xiàn)則會(huì)對(duì)整個(gè)行業(yè),包括語(yǔ)音行業(yè)都有很好的促進(jìn)作用,讓我們真正享受到隨時(shí)隨地使用語(yǔ)音交互帶來(lái)的便利。

CSDN:除了云知聲之外,國(guó)內(nèi)還有其它許多優(yōu)秀的語(yǔ)音云供應(yīng)商,比如科大訊飛。我想請(qǐng)您簡(jiǎn)單介紹一下,跟競(jìng)爭(zhēng)對(duì)手相比,云知聲的核心競(jìng)爭(zhēng)力在哪里?還存在哪些不足?

康恒:從國(guó)內(nèi)來(lái)說(shuō),我們同行業(yè)有科大訊飛,國(guó)際上也有一些比較大的巨頭,像Nuance,或者軟件行業(yè)有Google、蘋果、微軟這些非常巨型的公司。

云知聲目前來(lái)說(shuō)雖然已經(jīng)有大量的客戶,但我們還是給自己定位為一個(gè)創(chuàng)業(yè)公司。因?yàn)橄啾染揞^,我們規(guī)模相對(duì)較小,同時(shí)要想在語(yǔ)音行業(yè)獲得我們的生存之地和更大發(fā)展,就要有自己的特色。可以概括為兩個(gè)方面:

第一,云知聲的技術(shù)特色。我們對(duì)技術(shù)方面的自信心很強(qiáng),無(wú)論是客戶的反饋還是和與競(jìng)爭(zhēng)對(duì)手相比較的測(cè)試,都表明我們有很大的優(yōu)勢(shì),所以技術(shù)是我們的生存之本。這是因?yàn)槲覀冇蟹浅:玫募夹g(shù)團(tuán)隊(duì),在語(yǔ)音、語(yǔ)義技術(shù)上都有十年以上的積累,基礎(chǔ)技術(shù)團(tuán)隊(duì)里博士的比例已經(jīng)超過(guò)80%,這個(gè)比例相當(dāng)高。對(duì)于其它行業(yè),博士的比例不一定非常重要,但是因?yàn)槲覀冞@個(gè)行業(yè)則要求從業(yè)經(jīng)驗(yàn)和對(duì)技術(shù)的掌握程度都非常高,如果不是在這個(gè)行業(yè)里面有長(zhǎng)時(shí)間的積累,是很難做出成績(jī)來(lái)的。

除此之外,我們還有一些很不錯(cuò)的特色功能。例如,我們提供用戶的畫像,這是什么呢?在很多用戶的使用過(guò)程中,我們的平臺(tái)會(huì)描繪出他大概的特征,比如他是年輕人還是中老年人,他是男性還是女性等等,我們把這樣的信息返回給開(kāi)發(fā)者,讓應(yīng)用程序利用這些信息增強(qiáng)它的體驗(yàn),針對(duì)特定的人群做特定的優(yōu)化。這是我們技術(shù)方面提供的非常獨(dú)特的能力。

第二,我們有著優(yōu)質(zhì)的服務(wù)。云知聲從成立之初就被定義為一個(gè)移動(dòng)互聯(lián)網(wǎng)公司。雖然我們用語(yǔ)音識(shí)別這樣的技術(shù)切入市場(chǎng),但仍希望用移動(dòng)互聯(lián)網(wǎng)的方式去服務(wù)用戶。有人說(shuō)過(guò),移動(dòng)互聯(lián)網(wǎng)的特點(diǎn)就是“唯快不破”。在向客戶提供服務(wù)的時(shí)候,快是我們很好的特點(diǎn)。比如針對(duì)大型合作伙伴樂(lè)視,我們從樂(lè)視的意向開(kāi)始,到對(duì)它需求的整理,到產(chǎn)品的開(kāi)發(fā)、上市,整個(gè)過(guò)程非常短,我們大概用一個(gè)月的時(shí)間就完成了,這在其它的企業(yè)來(lái)說(shuō)是完全不可想象的,這可以從一個(gè)側(cè)面看出我們對(duì)用戶服務(wù)的好和快。

CSDN:云知聲和樂(lè)視的合作,幫助它解決了什么問(wèn)題呢?

康恒:我們?cè)谒麄兊漠a(chǎn)品上提供了語(yǔ)音交互功能。舉例來(lái)說(shuō),我們時(shí)常在電視上搜索視頻。樂(lè)視背后有海量的視頻庫(kù),用戶在庫(kù)里搜索他想看的視頻。在傳統(tǒng)的交互界面上,搜索視頻是非常困難的,一般來(lái)說(shuō)有兩種方式:一是分類搜索,比如戰(zhàn)爭(zhēng)片,戰(zhàn)爭(zhēng)片下面有美國(guó)片,美國(guó)片下面有斯皮爾伯格導(dǎo)演的等等,分層分目錄的方式瀏覽、查找。還有一種是鍵盤輸入的方式,智能電視上會(huì)提供虛擬鍵盤,用搖控器輸入。

這兩種方式對(duì)于客戶來(lái)說(shuō)都是非常困難、不自然的,用戶想看《甄

生活不易,碼農(nóng)辛苦
如果您覺(jué)得本網(wǎng)站對(duì)您的學(xué)習(xí)有所幫助,可以手機(jī)掃描二維碼進(jìn)行捐贈(zèng)
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關(guān)閉
程序員人生
主站蜘蛛池模板: 久久93精品国产91久久综合 | 日本免费三区 | 国产无限资源在线观看 | 亚洲国产成人久久综合一区77 | 亚洲欧美网站 | 青青草原手机在线视频 | 国产69精品久久 | 色综合久久久高清综合久久久 | 琪琪午夜伦埋大全影院 | 香焦伊人 | 国产精品ⅴ视频免费观看 | 日韩欧美中文字幕出 | 高清国产精品久久 | 国产一区二区亚洲精品 | 精品伊人| 国产欧美一区二区成人影院 | 国产亚洲欧美在线 | 最近高清中文在线国语视频 | 亚洲精品视频网 | 日本一级淫片免费放 | 手机在线精品视频每日更新 | 国产v精品成人免费视频71sao | 2022偷拍午夜视频在线播放 | 欧美xxxxhd4k| 一级做a爱免费观看视频 | 欧美深夜福利 | 免费又黄又爽又猛大片午夜 | 日韩 国产 欧美视频一区二区三区 | 国内精品一区视频在线播放 | a久久久久一级毛片护士免费 | 老女人一级全黄肉体毛片 | 欧美一级片黄色片 | 经典三级一区二区三区视频 | 成人欧美视频在线观看播放 | 中午字幕在线观看 | 91精品福利观看 | 久久久久久午夜精品 | 精品videosex性欧美 | 成人性视频在线三级 | 欧美特黄a级高清免费看片 欧美特黄一级aa毛片 | 国产成人精品一区二区三区 |