OpenCV公式サイトに無料と有料のセミナーが用意されています。今回は、無料セミナーに申し込んで受講してみました。
OpenCV公式サイトセミナー
いくつかの無料セミナーが用意されています。説明を翻訳して紹介していますが初心者のため、何を言っているのかさっぱりの箇所も多いです。
PyTorch Bootcamp
MetaのAI研究グループが開発した、Python用のオープンソースの機械学習ライブラリ
PyTorch Bootcampでは、基礎から実践的なことまでの教材が用意されています。デンソル、ニューラルネットワーク、最適化、物体検出やセグメンテーションといった実世界のアプリケーションが学べます。(約5時間)
TensorFlow Bootcamp
Googleが開発したオープンソースの機械学習フレームワーク
TensorFlow Bootcampでは、ニューラルネットワーク、多層パーセプトロン、畳み込みニューラルネットワーク(CNN)が画像分類とセグメンテーションにどのように使用されるかを学び、カスタムデータセットで独自のCNNモデルをトレーニングします。(約3時間)
OpenCV Bootcamp
Intelが開発したオープンソースライブラリ
コンピュータ画像・映像分析、ディープラーニングやAIの世界に足を踏み入れる前に、コンピュータ画像・映像分析の世界最大のオープンソースを学んでエキスパートになる必要があります。このセミナーでは、画像やビデオの操作、物体や顔の検出など、エキサイティングなトピックを学べます。(約3時間)
今回はこれを受講しました。
Python for Beginners
1991年にグイド・ヴァン・ロッサムにより開発された汎用プログラミング言語
現在最も強力で人気のあるプログラミング言語であるPythonの本質的な要素を学ぶことで、コンピュータビジョン、ディープラーニング、AIのキャリアに向けた準備をしましょう。
【OpenCV大学】Python for Beginners
登録
仮登録
受講するには、氏名、メールアドレス、電話番号、(最も近い)職業、興味がある項目、目的(フリー)を登録する必要があります。
電話番号の登録が必須です。(本登録して受講していると、有料コースの勧誘がSMSに、何回か連絡が来ます。)
本登録
仮登録で記入したメールアドレスに連絡メールが来てリンクにアクセスすると、本登録の入力フォームのページが表示されます。メールアドレスは、仮登録で入力したメールアドレスと同じ必要があります。仮入力と同じ内容もあります。
もう一度、メールが届いてリンク先をクリックして登録完了です。
講習のベース
説明文やコードは、Google Colabを使って確認したりすることを前提に書かれています。それ以外のプログラム開発アプリを利用すると、そのままではエラーが出るので理解して修正する必要があります。
Googleが提供する無料のクラウド上で利用できるのPython開発環境です。(GoogleドキュメントやGoogleスプレッドシートと同じ感じです。)
コースイントロダクション
受講した内容を簡単に紹介しておきます。全編英語ですが、文章は翻訳サイトを、動画はYouTubeなので自動翻訳字幕を利用すれば、大筋は理解できます。
受講している間何度か、有料セミナーの勧誘メールが来ました。さらに数日後、ショートメッセージにも同様の内容の連絡が来ました。このようなのが苦手の人はネットで探して学ぶのが良いと思います。
イントロダクション
イントロダクション
Satya Mallick 博士が、OpenCVやこのコースについて簡単に紹介しています。(約4分)
自己紹介
アンケートの様なものです。該当する項目をチェックして送信するだけです。(私は送信しませんでした。)
Satya Mallick 博士のインタビュー
William Kromydas氏(動画内で簡単な職歴を紹介しています)によるSatya Mallick 博士へのインタビュー動画です。機械学習、ディープラーニングなどの学習方法について、博士の考えを話しています。(約40分)
コースの流れ
成績評価方針と認定
評価についての説明がされています。
小テストの内訳
14のコンテンツ全てに、理解度確認小テストが用意されていて、そのうちのベスト 10 が最終評価の対象となります。本コースの最終成績により、合格証書か優等生証明書のいずれかが授与されます。最後まで受講しましたが、何も授与されませんでした。
実際に受講してみての感想
OpenCV コースコンテンツ
どんなことを学べるかを簡単に解説した動画と、プログラムと簡単な説明がされたノートが あります。一度動画を視聴して、ノートにあるプログラムを動かしたり、説明やプログラムを読んだりして理解を深めるような形式になっています。
目標を達成する為のプログラムと簡単な説明のノートと動画が主で、細かい説明はされていないのでプログラムから理解する必要があります。それ以上のことは、ドキュメントを探して読む必要があります。
受講してみての全体的な感想
OpenCVでどんなことができるかが分かるコースになっています。全体的に細かい説明はなく、プログラムを動かしてどんなふうになるかを紹介しています。
(ⅰ)OpenCV インストール
統合開発環境(IDE)の「Jupyter Notebook(ブラウザ型)」や「Spyder(デスクトップ型)」、よく使われている複数のライブラリを、一括でインストールできるアナコンダのインストール方法が動画で紹介されています。
MacOS(約2分)、Windows(約4分)、Linux(約2分)でのインストール方法を紹介した動画が視聴できます。
私のPCはWindowsなのでWin向けの動画を視聴しました。なぜかWin向け動画だけ4分になっているのは、前半がWin向け動画、後半はMacOS向け動画でした。後半部分は視聴不要です。(改善される可能性があります。)
(ⅱ)画像を使ってみる
OpenCVを使った時の、画像表示、数列表示などについて説明しています。
動画&ノートと理解度クイズ
OpenCVを使った画像処理とコンピュータビジョンの学習の第一歩を踏み出すのに役立ちます。簡単な例を使って、重要なことを学びます。(動画:約20分)
- 画像の読み込み
- データ型や形状などの画像属性の確認
- Numpyでの画像の行列表現
- カラー画像と画像チャンネルの分割・統合
- matplotlibを使った画像の表示
- 画像の保存
内容理解度クイズ(全5問)
(ⅲ)基本的な画像操作
OpenCVを使った時の、画像処理の基本テクニックについて説明しています。
動画&ノートと理解度クイズ
以下の画像変換の方法を学びます。(動画:約9分)
- 画像ピクセルへのアクセスと操作
- 画像のリサイズ
- トリミング
- 反転
内容理解度クイズ(全5問)
(ⅳ)画像注釈
動画&ノートと理解度クイズ
OpenCVを使って画像に注釈を付ける方法を説明します。画像に以下のような注釈を付ける方法を学びます。(動画:約5分)
- 線の描画
- 円の描画
- 矩形の描画
- テキストの追加
プレゼンテーションのために、結果に注釈を付けたり、アプリケーションのデモを見せたいときに便利です。アノテーションは開発やデバッグの際にも役立ちます。
内容理解度クイズ(全5問)
(ⅴ)画像補正
数学的操作による基本的な画像強調
動画&ノートと理解度クイズ
画像処理技術は、さまざまな結果を得るために数学的演算を利用しています。多くの場合、いくつかの基本的な演算を使用して、画像の拡張バージョンに到達します。コンピュータビジョンパイプラインでよく使われる基本的な演算について説明しています。以下の内容を取り上げます。(動画:約17分)
- 加算、乗算などの算術演算
- 閾値設定とマスキング
- OR、AND、XORなどのビット演算
内容理解度クイズ(全4問)
(ⅵ)カメラへのアクセス
webカメラが必要です。(ノートPCだと内蔵のカメラがあると思われます。)
動画&ノートと理解度クイズ
プログラムを動かしてみるだけです。ひととおり動画で説明しています。(動画:約3分)
内容理解度クイズ(全3問)
(ⅶ)ビデオライティング
OpenCVを使った動画の作成
フレームの読み込みとファイルへの書き込み
動画&ノートと理解度クイズ
アプリケーションを構築していると、作業のデモ動画を保存することが重要になってきます。例えば、監視アプリケーションでは、何か異常が起きたらすぐにビデオクリップを保存しなければならないかもしれません。このノートでは、openCV を使って avi や mp4 形式で動画を保存する方法を説明します。
レースカーのビデオからフレームを読み込み、前のステップで作成した2つのオブジェクトに同じものを書き込みます。タスクが完了したら、オブジェクトを解放する。(動画:約4分)
内容理解度クイズ(全5問)
(ⅷ)画像フィルタリング(エッジ検出)
カメラに映っている映像から角を検出します。
動画&ノートと理解度クイズ
ノートはなく、プログラムと動画だけです。(動画:約13分)
内容理解度クイズ(全5問)
(ⅸ)画像の特徴と位置合わせ
画像のゆがみを補正します。
動画&ノートと理解度クイズ
ノートは殆どが画像による説明で、ほとんどを動画で説明しています。(動画:約13分)
内容理解度クイズ(全6問)
(ⅹ)パノラマ
動画&ノートと理解度クイズ
パノラマ作成手順(動画:約3分)
- すべての画像からキーポイントを探す
- ペアワイズ・コレスポンデンスを探す
- ペアワイズ・ホモグラフィーを推定する
- ホモグラフィーを洗練する
- ブレンドでステッチする
内容理解度クイズ(全5問)
(ⅺ)High Dynamic Range (HDR)
動画&ノートと理解度クイズ
画像の整列、カメラ応答関数の推定、露出をHDR画像に統合する、トーンマッピング(動画:約12分)
- 画像のダイナミックレンジは各チャンネル8ビット(0~255)に制限される
- 非常に明るいピクセルは255に飽和する
- 非常に暗いピクセルは0にクリップする
内容理解度クイズ(全6問)
(ⅻ)物体追跡
動画内で動いている物体を指定(マーク)して、その動きに合わせてマークを追従させることができます。
動画&ノートと理解度クイズ
ノートは箇条書きによる説明とプログラムです。(動画:約13分)
内容理解度クイズ(全5問)
(ⅹⅲ)顔の検出
人の顔を認識してマークします。
動画&ノートと理解度クイズ
ノートはプログラムがメインで、動画で説明しています。(動画:約10分)
内容理解度クイズ(全3問)
(ⅹⅳ)テンソルフロー物体追跡
動画&ノートと理解度クイズ
ノートはプログラムがメインで、動画で説明しています。(動画:約9分)
内容理解度クイズ(全5問)
(ⅹⅴ)ポーズ推定
体形を分析して、主要な関節に点を打って点を線で結ぶことでどのようなポーズをとっているのかを推定することができます。
動画&ノートと理解度クイズ
ノートはプログラムがメインで、動画で説明しています。(動画:約13分)
内容理解度クイズ(全4問)

コメント