みなさん,こんにちは,今日私が発表のはコンピュータビジョン。
まずは、コンピュータビジョンの定義:
コンピュータビジョンとは、機械にどう「見る」かを研究する科学であり、さらに言えば、人間の目の代わりに
カメラやコンピューターを使って、目標を識別し、追跡し、測定する機械の視覚を意味する、さらにグラフィッ
ク処理をして、コンピュータ処理は人間の目で観察したり、画像を伝送して測定したりするのに适したものにな
り、コンピュータを使って人間は初めて機械を使って体力の延長と同じように脳力や知覚能力の延長を実現する
ことができるようになった。コンピュータビジョンが達成すべき最終的な目的は、三次元の景色の世界に対する
理解を実現すること、すなわち人間の視覚システムのある機能を実現すること、あるいは形式的には、二次元投
影図を利用して三次元物体の可視部分を再構築することであると簡単に説明することができる。計算機ビジョン
には、画面再構成、イベントモニタリング、目標追跡、目標認識、機械学習、インデクシング、画像復元などの
分岐がある。
次に紹介するのはコンピュータビジョンの開発:
コンピュータビジョンの進化:
20世紀50年代:統計パターンで識別し、二次元画像の分析と識別に集中した。例えば、光学文字認識、工作物表
面、顕微鏡画像と航空画像の分析と解釈などである。
1960年代:Robert(1965)は、コンピュータプログラムによってデジタル画像から立方体など多面体の3次元構
造を抽出し、3次元シーンの理解を目的としたコンピュータビジョンの研究を開始した。
1970年代にはいくつかの視覚応用システムが登場した。
1970年代半ば、David教授は1973年にMIT AL研究所に招かれ、博士課程の学生を中心とした研究グループを率
い、1977年に「Bricks World」の分析手法とは異なるコンピュータ視覚理論を提唱しました。この理論は80年代
には機械視覚研究の分野で非常に重要な理論フレームワーク-視覚計算理論と呼ばれていました。
コンピュータビジョンの進展にはどの段階があるのでしょうか?
主流研究は3つの段階に分けられている:
段階1:モデル世界を主な研究対象とする視覚基本方法の研究
この段階はRobertsの先駆的な仕事をマーク-3次元再構築である。この時期の仕事は三次元空間関係の分析に基づ
いているが、三次元関係の分析は単純な辺縁線分などの単純な拘束関係に依存しているだけであり、人間やその
他の動物の視覚システムが三次元空間関係を知覚する方式を十分に考慮していない。
段階2:計算理論を核とした視覚モデル
この段階では、Davidをはじめとするいくつかの研究者が表示を核とし、アルゴリズムを中間変換過程とする一般
的な視覚処理モデルを提案している。
段階3:応用を目指したコンピュータビジョン手法
この段階では、これまでのコンピュータビジョンの研究では正しいのか、実際的な意味があるのかを考え始め、
単なる理論的枠組みの研究から体幹運動を組み合わせた様々な応用を組み合わせた研究へと移行していった。
最後にコンピュータビジョンの応用例をご紹介します
1、インダストリアルビジョン
外形写真による外形検出および位置検出を行う。
カメラと関連する視覚情報処理システムにより、異なる物体に応じて異なる色の火の性質の伝送帯を選択するこ
とで、物体を伝送帯から分離し、識別と位置決めを行い、ロボットを誘導して把持と操作を行うことを実現す
る。例えば、工業検査測定、自動生産パイプライン、コンピュータ支援外科手術、顕微医学操作及び現場と作業
のためのロボットなどである。
2、ヒューマンコンピュータインタラクション
人間のジェスチャー動作、唇動作、体幹運働、表情測定など、人間の希望や要求をコンピュータが理解し、命令
を実行できるようにする。例えば、顔認証、スマートエージェントなど。
3、ビジュアルナビゲーション
立体画像と運動情報を組み合わせて、特定のタスク解像度要求を満たすシーン深度マップを構成することができ
る。例えば、巡航ミサイル誘導、無人飛行机飛行、移動ロボットなどは、人の参加とそれによる危険を回避する
ことができ、精度と速度を高めることもできる。
4、バーチャルリアリティ
人の生理的限界を超えて「その場に臨み」、生産性を高める手助けをする。例えば:飛行機操縦士訓練シミュレ
ーション、医学手術シミュレーション、シーンモデリングなど。
まずは、コンピュータビジョンの定義:
コンピュータビジョンとは、機械にどう「見る」かを研究する科学であり、さらに言えば、人間の目の代わりに
カメラやコンピューターを使って、目標を識別し、追跡し、測定する機械の視覚を意味する、さらにグラフィッ
ク処理をして、コンピュータ処理は人間の目で観察したり、画像を伝送して測定したりするのに适したものにな
り、コンピュータを使って人間は初めて機械を使って体力の延長と同じように脳力や知覚能力の延長を実現する
ことができるようになった。コンピュータビジョンが達成すべき最終的な目的は、三次元の景色の世界に対する
理解を実現すること、すなわち人間の視覚システムのある機能を実現すること、あるいは形式的には、二次元投
影図を利用して三次元物体の可視部分を再構築することであると簡単に説明することができる。計算機ビジョン
には、画面再構成、イベントモニタリング、目標追跡、目標認識、機械学習、インデクシング、画像復元などの
分岐がある。
次に紹介するのはコンピュータビジョンの開発:
コンピュータビジョンの進化:
20世紀50年代:統計パターンで識別し、二次元画像の分析と識別に集中した。例えば、光学文字認識、工作物表
面、顕微鏡画像と航空画像の分析と解釈などである。
1960年代:Robert(1965)は、コンピュータプログラムによってデジタル画像から立方体など多面体の3次元構
造を抽出し、3次元シーンの理解を目的としたコンピュータビジョンの研究を開始した。
1970年代にはいくつかの視覚応用システムが登場した。
1970年代半ば、David教授は1973年にMIT AL研究所に招かれ、博士課程の学生を中心とした研究グループを率
い、1977年に「Bricks World」の分析手法とは異なるコンピュータ視覚理論を提唱しました。この理論は80年代
には機械視覚研究の分野で非常に重要な理論フレームワーク-視覚計算理論と呼ばれていました。
コンピュータビジョンの進展にはどの段階があるのでしょうか?
主流研究は3つの段階に分けられている:
段階1:モデル世界を主な研究対象とする視覚基本方法の研究
この段階はRobertsの先駆的な仕事をマーク-3次元再構築である。この時期の仕事は三次元空間関係の分析に基づ
いているが、三次元関係の分析は単純な辺縁線分などの単純な拘束関係に依存しているだけであり、人間やその
他の動物の視覚システムが三次元空間関係を知覚する方式を十分に考慮していない。
段階2:計算理論を核とした視覚モデル
この段階では、Davidをはじめとするいくつかの研究者が表示を核とし、アルゴリズムを中間変換過程とする一般
的な視覚処理モデルを提案している。
段階3:応用を目指したコンピュータビジョン手法
この段階では、これまでのコンピュータビジョンの研究では正しいのか、実際的な意味があるのかを考え始め、
単なる理論的枠組みの研究から体幹運動を組み合わせた様々な応用を組み合わせた研究へと移行していった。
最後にコンピュータビジョンの応用例をご紹介します
1、インダストリアルビジョン
外形写真による外形検出および位置検出を行う。
カメラと関連する視覚情報処理システムにより、異なる物体に応じて異なる色の火の性質の伝送帯を選択するこ
とで、物体を伝送帯から分離し、識別と位置決めを行い、ロボットを誘導して把持と操作を行うことを実現す
る。例えば、工業検査測定、自動生産パイプライン、コンピュータ支援外科手術、顕微医学操作及び現場と作業
のためのロボットなどである。
2、ヒューマンコンピュータインタラクション
人間のジェスチャー動作、唇動作、体幹運働、表情測定など、人間の希望や要求をコンピュータが理解し、命令
を実行できるようにする。例えば、顔認証、スマートエージェントなど。
3、ビジュアルナビゲーション
立体画像と運動情報を組み合わせて、特定のタスク解像度要求を満たすシーン深度マップを構成することができ
る。例えば、巡航ミサイル誘導、無人飛行机飛行、移動ロボットなどは、人の参加とそれによる危険を回避する
ことができ、精度と速度を高めることもできる。
4、バーチャルリアリティ
人の生理的限界を超えて「その場に臨み」、生産性を高める手助けをする。例えば:飛行機操縦士訓練シミュレ
ーション、医学手術シミュレーション、シーンモデリングなど。