行業(yè)動態(tài)
有關圖像識別的基礎介紹
圖像識別可能是以圖像的主要特征為基礎的。每個圖像都有它的特征,如字母A有個尖,P有個圈、而Y的核心有個銳角等。對圖像識別時眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度大或輪廓方向突然改變的地方,這些地方的信息量大。而且眼睛的掃描路線也總是依次從一個特征轉(zhuǎn)到另一個特征上。由此可見,在圖像識別過程中,知覺機制排除輸入的多余信息,抽出關鍵的信息。同時,在大腦里必定有一個負責整合信息的機制,它能把分階段獲得的信息整理成一個完整的知覺映象。
在人類圖像識別系統(tǒng)中,對復雜圖像的識別往往要通過不同層次的信息加工才能實現(xiàn)。對于熟悉的圖形,由于掌握了它的主要特征,就會把它當作一個單元來識別,而不再注意它的細節(jié)了。這種由孤立的單元材料組成的整體單位叫做組塊,每一個組塊是同時被感知的。在文字材料的識別中,人們不僅可以把一個漢字的筆劃或偏旁等單元組成一個組塊,而且能把經(jīng)常在一起出現(xiàn)的字或詞組成組塊單位來加以識別。
在計算機視覺識別系統(tǒng)中,圖像內(nèi)容通常用圖像特征進行描述。事實上,基于計算機視覺的圖像檢索也可以分為類似文本搜索引擎的三個步驟:提取特征、建索引build以及查詢。