国产欧美一区二区精品行性色_91精品午夜在线观看_亚洲精品无码激情国产_91精品啪在线观看国产城中村_91看片国产一区二区色欲

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應(yīng)
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補(bǔ)償
全部產(chǎn)品
您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

Google圖片搜索的原理

發(fā)布時間:  2012/6/26 17:27:33

針對這個問題,請教了算法組的同事,他分享了基本的思路:

對于這種圖像搜索的算法,一般是三個步驟:

1. 將目標(biāo)圖片進(jìn)行特征提取,描述圖像的算法很多,用的比較多的是:SIFT描述子,指紋算法函數(shù),bundling features算法,hash function(散列函數(shù))等。也可以根據(jù)不同的圖像,設(shè)計不同的算法,比如圖像局部N階矩的方法提取圖像特征。

2. 將圖像特征信息進(jìn)行編碼,并將海量圖像編碼做查找表。對于目標(biāo)圖像,可以對分辨率較大的圖像進(jìn)行降采樣,減少運算量后在進(jìn)行圖像特征提取和編碼處理。

3. 相似度匹配運算:利用目標(biāo)圖像的編碼值,在圖像搜索引擎中的圖像數(shù)據(jù)庫進(jìn)行全局或是局部的相似度計算;根據(jù)所需要的魯棒性,設(shè)定閾值,然后將相似度高的圖片預(yù)保留下來;最后應(yīng)該還有一步篩選最佳匹配圖片,這個應(yīng)該還是用到特征檢測算法。

其中每個步驟都有很多算法研究,圍繞數(shù)學(xué),統(tǒng)計學(xué),圖像編碼,信號處理等理論進(jìn)行研究。

下面是阮一峰的一個最簡單的實現(xiàn):

你輸入Google圖片的網(wǎng)址,或者直接上傳圖片,Google就會找出與其相似的圖片。下面這張圖片是美國女演員Alyson Hannigan。

 

上傳后,Google返回如下結(jié)果:

 

這種技術(shù)的原理是什么?計算機(jī)怎么知道兩張圖片相似呢?

根據(jù)Neal Krawetz博士的解釋,原理非常簡單易懂。我們可以用一個快速算法,就達(dá)到基本的效果。

這里的關(guān)鍵技術(shù)叫做“感知哈希算法”(Perceptual hash algorithm),它的作用是對每張圖片生成一個“指紋”(fingerprint)字符串,然后比較不同圖片的指紋。結(jié)果越接近,就說明圖片越相似。

下面是一個最簡單的實現(xiàn):

第一步,縮小尺寸。

將圖片縮小到8x8的尺寸,總共64個像素。這一步的作用是去除圖片的細(xì)節(jié),只保留結(jié)構(gòu)、明暗等基本信息,摒棄不同尺寸、比例帶來的圖片差異。

 

第二步,簡化色彩。

將縮小后的圖片,轉(zhuǎn)為64級灰度。也就是說,所有像素點總共只有64種顏色。

第三步,計算平均值。

計算所有64個像素的灰度平均值。

第四步,比較像素的灰度。

將每個像素的灰度,與平均值進(jìn)行比較。大于或等于平均值,記為1;小于平均值,記為0。

第五步,計算哈希值。

將上一步的比較結(jié)果,組合在一起,就構(gòu)成了一個64位的整數(shù),這就是這張圖片的指紋。組合的次序并不重要,只要保證所有圖片都采用同樣次序就行了。

 

得到指紋以后,就可以對比不同的圖片,看看64位中有多少位是不一樣的。在理論上,這等同于計算“漢明距離”(Hamming distance)。如果不相同的數(shù)據(jù)位不超過5,就說明兩張圖片很相似;如果大于10,就說明這是兩張不同的圖片。

具體的代碼實現(xiàn),可以參見Wote用python語言寫的imgHash.py。代碼很短,只有53行。使用的時候,第一個參數(shù)是基準(zhǔn)圖片,第二個參數(shù)是用來比較的其他圖片所在的目錄,返回結(jié)果是兩張圖片之間不相同的數(shù)據(jù)位數(shù)量(漢明距離)。

這種算法的優(yōu)點是簡單快速,不受圖片大小縮放的影響,缺點是圖片的內(nèi)容不能變更。如果在圖片上加幾個文字,它就認(rèn)不出來了。所以,它的最佳用途是根據(jù)縮略圖,找出原圖。

實際應(yīng)用中,往往采用更強(qiáng)大的pHash算法和SIFT算法,它們能夠識別圖片的變形。只要變形程度不超過25%,它們就能匹配原圖。這些算法雖然更復(fù)雜,但是原理與上面的簡便算法是一樣的,就是先將圖片轉(zhuǎn)化成Hash字符串,然后再進(jìn)行比較。


本文出自:億恩科技【www.cmtents.com】

服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務(wù)器/云主機(jī) 24小時售后服務(wù)電話:0371-60135900
  • 虛擬主機(jī)/智能建站 24小時售后服務(wù)電話:0371-60135900
  • 專注服務(wù)器托管17年
    掃掃關(guān)注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權(quán)所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務(wù)所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務(wù)熱線