NLP(Natural Language Processing)是一門融語言學、計算機科學、數學于一體的科學,是研究人與計算機之間如何用自然語言進行有效人機對話的理論和方法。NLP的時髦應用包括:內容分類,情感分析,和自動匯總。例如,媒介機構利用NLP平臺來把媒體內容進行分類,標識和匯總;社交類應用公司利用NLP工具來判別社交活動中的積極或消極因素。
優秀的NLP服務商一般會提供三個方面:1)提供的NLP API能夠涵蓋日常的NLP功能;2)有公共文檔和費用信息提供;3)提供自主登記或訂閱服務。基于以上三個條件,我們甄選了五個表現較突出的NLP服務商,一起來看下:
一、AlchemyAPI
成立于2005年的AlchemyAPI是NLP-aaS元老級的服務商。其簡介中說到目前大概有超過4萬名開發用戶、每月共計產生多于35億次的API調用。
功能綜述
AlchemyAPI目前共提供了12個文本分析功能:事物抽取,情感分析,關鍵字抓取,概念標識,關系提取,分類識別,作者提取,語言識別,文本提取,微格式分析,訂閱內容識別,數據連接等。
AlchemyAPI的REST API支援多種數據格式,包括:XML,JSON,RDF以及microformats。提供的SDKs也支援多種主流語言,例如:Java, Perl, Ruby, Python, PHP, C/C++, C#, Node.js 以及 Android。其開發入口還附有教程和一些常用NLP項目示例資料。
費用
AlchemyAPI有一個免費的基礎服務包,每天的事務處理上限為1000次。而每月9萬次,30萬次,3百萬次處理各自對應的價格分別為250美元,750美元,1,750美元。對于有更高需求的企業,他們可以得到“私人定制”的貼心服務。
特色功能
在年初,AlchemyAPI發布了新的圖像處理API―AlchemyVision,主要功能是實現圖像的自動抽取和為圖像自動附上標簽。例如,能自動識別出相片中的商品名稱而無需額外的文字提示信息。又或者是自動為成百上千張圖片(本地或網絡)附上合適的標簽,例如:運動,鮮花,人等,從而減少了大量的人工操作。這對于圖像盛行的今天來說,無疑是相關企業的一大福音。
二、Aylien
Aylien是更為年輕的NLP平臺服務商,其主打應用是幫助媒介機構和客戶在泱泱網絡信息流中獲取智能感知信息。
功能綜述
Aylien文本分析API包含三個常用功能:分類,情感分析和狀態提取。其API是RESTful的,由Mashape提供服務,里面還含有一個匯總端點,用于長文本匯總;另還有一個標簽建議端點,能為某內容給予合適的標簽建議信息。
費用
Aylien提供了1000次以內的免費請求服務,之后每多一次收1美分。對于6000萬次,8萬次,18萬次的請求,分別作價199美元,649美元,1399美元。各個級別的付費業務都提供郵件技術支援。對于需要電話支援和不限次數的企業級服務,也是可以選擇的。
特色功能
目前Aylien正準備推出一新聞API來讓用戶從50個流行新聞源中獲取更多資訊。分析重點包括:關鍵字分析,話題分析,分類討論以及社交熱點分析。該API結合在用的標簽建議功能,對有社交應用分析需求的企業來說無疑是一套利器。
三、Fluxifi
今年剛成立的Fluxifi,定位于幫助企業分析和最大程度地利用社交媒體中的信息。其API能夠讓用戶進行NLP處理。
功能綜述
Fluxifi的API功能包括:標記化,情感分析,語言探測以及詞性標簽。該RESTful API支持XML和JSON格式。
費用
Fluxifi提供了兩個方案:
250英鎊/月的專業版,每日支持最高4萬次API調用;
250英鎊/月的企業版,每日支持最高15萬次API調用。
如果還需更高級別的服務,則需特別定制。企業版和定制版都提供已簽署服務級別協議的電話支援服務。
特色功能
除了常見的NLP功能,公司還把重心放在社交活動監控和分析平臺,對接Twitter,YouTube及Instagram等熱門社交應用。是對社交數據分析敏感企業的一主打特色。
四、Textalytics
Textalytics提供的是MaaS服務(meaning as a service,意思即服務),對外宣傳是最友好的產品。
功能綜述
Textalytics的功能包括:話題提取,文本分類,情感分析和語言識別。
此外,還有兩款高階APIs:
Textalytics的APIs符合RESTful準則,支持的格式包括JSON和XML。提供SDKs套件可用于PHP、Java、Python以及VB。
費用
Textalytics提供了一個類似會員制的積分扣除系統來處理相關費用事項。例如,一次語言識別API調用需花費1個積分,在話題提取API中每分析兩個詞元需花費2個積分,而在對話識別API中每運行1分鐘則需要花費1萬個積分。
免費服務提供每月消費積分為50萬個。價值149歐元/月專業版的每月消費積分是2百萬個,499歐元/月的商業版是1千萬個。所有版本均支援每秒5個請求發生。此外,還有更多積分需求的企業定制版可供選擇。
特色功能
如果用戶不愿意在試用期前就把Textalytics整合到實際環境中,Textalytics還提供了一個插件供客戶直接在微軟Excel中進行數據分析。
五、TextRazor
Bloomberg的一位前雇員創立的TextRazor目的是幫助客戶提取和讀懂信息,清楚知道誰,做了什么,為什么以及怎么做。公司創立伊始便擁有自身的NLP及機器學習技術,提供基于云和自承載技術的服務包。
功能綜述
TextRazorAPI核心NLP功能包括:內容識別和增進,話題標簽,關系提取以及衍推。透過提供來自Freebase的索引信息,TextRazor能夠為數據對象添加位置信息和生日信息。
該平臺能探測142種不同的國家語言,能對其中10種使用廣泛的語言進行內容識別和話題探測,包括英語,西班牙語,德語,法語等。支持JSON數據格式,能通過HTTP或HTTPS進行訪問,提供可選的GZIP壓縮支援。官方SDKs套件能在Python,PHP和Java上使用。
費用
免費服務包提供每天500次的調用和2次同步請求,1,200美元/月的專業版提供每天12萬次調用和總共15次的同步請求服務。對于有過百萬次調用或上百次同步請求的需求來說,則需進行企業版定制。
特色功能
TextRazor有一個基于Prolog的規則引擎能夠讓開發者盡情享用其自定的NLP算法。例如,在話題分類和內容提取的應用場合添加本體模型定制和話題列表處理。
寫在最后 -- 哪款才是你的菜?
實踐出真知,相信不同級別的需求會帶來不同的選擇。因此,需要進行盡可能多的測試才能為自己帶來最心儀產品,得到最滿意的結果。
英文出自:Programmableweb