close

計算機視覺是一門研究如何使機器「看」的科學,更進一步的說,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。作為一個科學學科,計算機視覺研究相關的理論和技術,試圖建立能夠從圖像或者多維數據中獲取『信息』的人工智慧系統。這裡所 指的信息指Shannon定義的,可以用來幫助做一個「決定」的信息。因為感知可以看作是從感官信號中提 取信息,所以計算機視覺也可以看作是研究如何使人工系統從圖像或多維數據中「感知」的科學。

1定義

計算機視覺是使用計算機及相關設備對生物視覺的一種模擬。它的主要任務就是通過對採集的圖片或視頻進行處理以獲得相應場景的三維信息,就像人類和許多其他類生物每天所做的那樣。
計算機視覺是一門關於如何運用照相機和計算機來獲取我們所需的,被拍攝對象的數據與信息的學問。形象地說,就是給計算機安裝上眼睛(照相機)和大腦(演算法),讓計算機能夠感知環境。我們中國人的成語"眼見為實"和西方人常說的"One picture is worth ten thousand words"表達了視覺對人類的重要性。不難想象,具有視覺的機器的應用前景能有多麼地寬廣。
計算機視覺既是工程領域,也是科學領域中的一個富有挑戰性重要研究領域。計算機視覺是一門綜合性的學科,它已經吸引了來自各個學科的研究者參加到對它的研究之中。其中包括計算機科學和工程、信號處理、物理學、應用數學和統計學,神經生理學和認知科學等。

2解析

視覺是各個應用領域,如製造業、檢驗、文檔分析、醫療診斷,和軍事等領域中各種智能/自主系統中不可分割的一部分。由於它的重要性,一些先進國家,例如美國把對計算機視覺的
計算機視覺與其他領域的關係

  計算機視覺與其他領域的關係

研究列為對經濟和科學有廣泛影響的科學和工程中的重大基本問題,即所謂的重大挑戰(grand challenge)。計算機視覺的挑戰是要為計算機和機器人開發具有與人類水平相當的視覺能力。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把所有這些處理都緊密地集成在一起。作為一門學科,計算機視覺開始於60年代初,但在計算機視覺的基本研究中的許多重要進展是在80年代取得的。計算機視覺與人類視覺密切相關,對人類視覺有一個正確的認識將對計算機視覺的研究非常有益。為此我們將先介紹人類視覺。

3原理

計算機視覺就是用各種成象系統代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋。計算機視覺的最終研究目標就是使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力。要經過長期的努力才能達到的目標。因此,在實現最終目標以前,人們努力的中期目標是建立一種視覺系統,這個系統能依據視覺敏感和反饋的某種程度的智能完成一定的任務。例如,計算機視覺的一個重要應用領域就是自主車輛的視覺導航,還沒有條件實現象人那樣能識別和理解任何環境,完成自主導航的系統。因此,人們努力的研究目標是實現在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統。這裡要指出的一點是在計算機視覺系統中計算機起代替人腦的作用,但並不意味著計算機必須按人類視覺的方法完成視覺信息的處理。計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理。但是,人類視覺系統是迄今為止,人們所知道的功能最強大和完善的視覺系統。如在以下的章節中會看到的那樣,對人類視覺處理機制的研究將給計算機視覺的研究提供啟發和指導。因此,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,也是一個非常重要和信人感興趣的研究領域。這方面的研究被稱為計算視覺(Computational Vision)。計算視覺可被認為是計算機視覺中的一個研究領域。

4相關

有不少學科的研究目標與計算機視覺相近或與此有關。這些學科中包括圖像處理、模式識別或圖像識別、景物分析、圖象理解等。計算機視覺包括圖像處理和模式識別,除此之外,它還包括空間形狀的描述,幾何建模以及認識過程。實現圖像理解是計算機視覺的終極目標。
模式識別
模式識別技術根據從圖象抽取的統計特性或結構信息,把圖像分成予定的類別。例如,文字識別或指紋識別。在計算機視覺中模式識別技術經常用於對圖象中的某些部分,例如分割區域的識別和分類。
識別
一個計算機視覺,圖像處理和機器視覺所共有的經典問題便是判定一組圖像數據中是否包含某個特定的物體,圖像特徵或運動狀態。這一問題通常可以通過機器自動解決,但是到目前為止,還沒有某個單一的方法能夠廣泛的對各種情況進行判定:在任意環境中識別任意物體。現有技術能夠也只能夠很好地解決特定目標的識別,比如簡單幾何圖形識別,人臉識別,印刷或手寫文件識別或者車輛識別。而且這些識別需要在特定的環境中,具有指定的光照,背景和目標姿態要求。
廣義的識別在不同的場合又演化成了幾個略有差異的概念:
識別(狹義的):對一個或多個經過預先定義或學習的物體或物類進行辨識,通常在辨識過程中還要提供他們的二維位置或三維姿態。
鑒別:識別辨認單一物體本身。例如:某一人臉的識別,某一指紋的識別。
監測:從圖像中發現特定的情況內容。例如:醫學中對細胞或組織不正常技能的發現,交通監視儀器對過往車輛的發現。監測往往是通過簡單的圖象處理髮現圖像中的特殊區域,為後繼更複雜的操作提供起點。
識別的幾個具體應用方向:
基於內容的圖像提取:在巨大的圖像集合中尋找包含指定內容的所有圖片。被指定的內容可以是多種形式,比如一個紅色的大致是圓形的圖案,或者一輛自行車。在這裡對后一種內容的尋找顯然要比前一種更複雜,因為前一種描述的是一個低級直觀的視覺特徵,而後者則涉及一個抽象概念(也可以說是高級的視覺特徵),即『自行車』,顯然的一點就是自行車的外觀並不是固定的。
姿態評估:對某一物體相對於攝像機的位置或者方向的評估。例如:對機器臂姿態和位置的評估。
光學字元識別對圖像中的印刷或手寫文字進行識別鑒別,通常的輸出是將之轉化成易於編輯的文檔形式。
場景重建
給定一個場景的二或多幅圖像或者一段錄像,場景重建尋求為該場景建立一個計算機模型/三維模型。最簡單的情況便是生成一組三維空間中的點。更複雜的情況下會建立起完整的三維表面模型。
圖像獲取
一幅數字圖像是由一個或多個圖像感知器產生,這裡的感知器可以是各種光敏攝像機,包括遙感設備,X射線斷層攝影儀,雷達,超聲波接收器等。去絕不與同的感知器,產生的圖片可以是普通的二維圖像,三維圖組或者一個圖像序列。圖片的像素值往往對應於光在一個或多個光譜段上的強度(灰度圖或彩色圖),但也可以是相關的各種物理數據,如聲波,電磁波或核磁共振的深度,吸收度或反射度。
特徵提取
從圖像中提取各種複雜度的特徵。例如:
線,邊緣提取;
局部化的特徵點檢測如邊角檢測,斑點檢測;
更複雜的特徵可能與圖像中的紋理形狀或運動有關。
高級處理
到了這一步,數據往往具有很小的數量,例如圖像中經先前處理被認為含有目標物體的部分。這時的處理包括:
驗證得到的數據是否符合前提要求;
估測特定係數,比如目標的姿態,體積;
對目標進行分類。
高級處理有理解圖像內容的含義,是計算機視覺中的高階處理,主要是在圖像分割的基礎上再經行對分割出的圖像塊進行理解,例如進行識別等操作。

5要件

光源布局影響大需審慎考量。
正確的選擇鏡組,考量倍率、空間、尺寸、失真… 。
選擇合適的攝影機(CCD),考量功能、規格、穩定性、耐用...。
視覺軟體開發需靠經驗累積,多嘗試、思考問題的解決途徑。
以創造精度的不斷提升,縮短處理時間為最終目標。
end。

6會議

較好
ICIP:International Conference on Image Processing,國際圖像處理大會
BMVC:British Machine Vision Conference,英國機器視覺大會
ICPR:International Conference on Pattern Recognition,國際模式識別大會
ACCV:Asian Conference on Computer Vision,亞洲計算機視覺大會

7期刊

較好

CVIU:Computer Vision and Image Understanding,計算機視覺與圖像理解
PR:Pattern Recognition,模式識別
PRL:Pattern Recognition Letters,模式識別快報
arrow
arrow
    全站熱搜

    wendellchuang 發表在 痞客邦 留言(0) 人氣()