Google 推出最新圖像識別工具
來源:數(shù)字音視工程網(wǎng) 編輯:航行150 2015-12-09 10:36:50 加入收藏
搜索是我們很多人發(fā)現(xiàn)信息的主要渠道,但只能搜索文字顯然是不夠的,圖像和視頻肯定是搜索領域的下一個發(fā)展方向。當然,Google Photos 已經(jīng)能夠部分實現(xiàn)這個功能了,但很顯然這還遠遠不夠。
不過 Google 在周三宣布,他們提供了一個強大的圖像識別工具,名為 Google Cloud Vision API。對于開發(fā)者們來說,這可能會是一個非常有用的工具,有了它,開發(fā)者們就可以讓自己的軟件、機器人知道圖像上的信息了。
功能強大的圖像檢測工具
首先,作為一個機器學習領域的技術,這個工具搭載的是我們之前給大家介紹過的智能機器學習系統(tǒng) TensorFlow,Google 在上個月剛剛將這個系統(tǒng)免費開放給開發(fā)者們。
其次,它的主要功能是去學習并識別圖片中的內(nèi)容。
這個工具的運行原理并不復雜,它能夠迅速將圖片分到數(shù)千種大的類別當中去,比如:船、獅子、埃菲爾鐵塔等等;然后偵測臉部相關的情緒,并識別圖片上相關的文字。
在他們看來,Google Cloud Vision API 有以下幾個吸引人的特性:
檢測實體: Google Cloud Vision API 可以從數(shù)千種圖片分類中檢測出圖片中的實體。除此之外,更吸引人的是,你還可以根據(jù)你自己的圖片類別建立自己的元數(shù)據(jù),這樣,你就不必受制于 Google 為你設定的那數(shù)千個分類,而有了更符合你自己的圖片分類。
字符識別: Google Cloud Vision API 所帶的光學字符識別技術可以識別圖片上的文字內(nèi)容。其中支持的語言有很多種。
安全檢測: Google Cloud Vision API 的安全檢測功能可以識別出圖片中不合適的內(nèi)容,此功能搭載于 Google SafeSearch。它可以幫助用戶避開那些令人不適的內(nèi)容。
面部檢測: Google Cloud Vision API 的面部識別技術可以檢測到圖片中的人像,也能具體識別出眼睛、嘴等具體的器官,而更重要的是,它還能檢測到包括開心、悲傷等在內(nèi)的 8 中情緒。為了保護用戶的隱私,Google 還承諾不會在任何的 Google 服務器中儲存有關面部的任何信息。
地標檢測 :Google Cloud Vision API 的地標檢測功能可以識別出世界上著名的一些自然和人文建筑與景觀,同時還會為你標出該地點的經(jīng)緯度。
Logo 檢測: Google Cloud Vision API 的 logo 監(jiān)測功能可以檢測出圖片中著名品牌的 logo。
下面是一些范例:
Google 的一次突破
有了這個工具,機器識別圖片的能力會大大加強。之前,你不能讓計算機自動為你篩選照片;但現(xiàn)在,只需輸入相應的「類別」,計算機就可以為你挑選出相應的圖片。
而開發(fā)者們現(xiàn)在可以好好設計一下自己的軟件和機器人等設備了。在不久的將來,也許當我們走進家門的時候,家中的機器人可以根據(jù)你臉上的表情選擇它該說的問候語;而你在上網(wǎng)時也能夠更精確地搜尋到想要的圖片了。
當然,對 Google 來說,推出這個工具也很正常。在這個領域,亞馬遜和微軟都已經(jīng)走了很遠了。很多朋友可能還記得微軟在之前推出的識別年齡和情緒的小工具,這些都出自于微軟專注于人工智能領域的牛津計劃。Google 當然也不能落后。在之前,Google 也推出過一些進行預測的 API 產(chǎn)品,但都功能有限,沒有涉及到圖像這方面,因此,這次的這個舉動對 Google 來說也是一次大的突破。
這個 API 目前在 Google 云平臺上提供一些有限的預覽,不過在將來,Google 將會把這個功能添加進 Google 云儲存中。這樣可以使它的使用范圍更廣。
評論comment