継続力

IT系サラリーマンが、書籍や講座から学んだこと、効果があった勉強方法を紹介します。

【Coursera】「Machine Learning(機械学習) Week 11」〜画像解析アルゴリズムを学びたい〜

長かったMachine Learning(機械学習)の講義も遂に最終回です。

最後は具体的な機械学習アプリケーションの例として、画像解析アルゴリズムを学びます。
併せて、機械学習アプリケーションの精度向上のテクニックも学べます。

<過去の記事>

【Coursera】「Machine Learning(機械学習) Week 1」〜機械学習の種類を学びたい〜 - 継続力 
【Coursera】「Machine Learning(機械学習) Week 2」〜複雑なケースでの回帰分析を学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 3」〜分類の具体的なアルゴリズムを学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 4」〜ニューラルネットワークの概要を学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 5」〜ニューラルネットワークの実装方法を学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 6」〜機械学習アルゴリズムの評価方法を学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 7」〜サポートベクターマシン(SVM)を学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 8」〜教師なし学習を学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 9」〜レコメンデーションシステムを学びたい〜 - 継続力
【Coursera】「Machine Learning(機械学習) Week 10」〜ビッグデータを使った機械学習を学びたい〜 - 継続力


講師

アンドリュー・エン(Andrew Ng)氏です。
人工知能研究の第一人者であり、Google Brainの共同設立者、 Baiduの元副社長兼チーフサイエンティスト、スタンフォード大学の教授という凄い経歴の持ち主です。 

 

講義の概要

「Week 11」では、以下の内容が、約1時間程度で学べます。

  • 画像解析アルゴリズム
  • 機械学習アプリケーションの精度向上のテクニック
  • 授業のサマリとアンドリュー・エン(Andrew Ng)氏の熱いメッセージ

ja.coursera.org


講義の内訳

講義の内訳は以下の通りです。

 

<画像解析アルゴリズム
■Problem Description and Pipeline

  • OCRの処理の流れを説明。
  • OCRは、画像中で文字がある箇所を特定
    →文字を分割
    →何の文字か認識
    という流れで処理する。
  • どのステップも重要なので、各ステップ毎に開発チームが分かれている場合が多い。


■Sliding Windows

  • 教師あり学習により、歩行者認識する流れを説明。
  • 歩行者が含まれる写真と、歩行者が含まれない写真を教師データとして学習させる。
  • 画像中の歩行者を認識する際は、判別用のウインドウを少しずつスライドさせ、画像全体を検索する。
  • 画像中の文字認識も同じ流れで処理する。
  • ウインドウをスライドさせ、画像中のどの部分に文字が存在するかを探索
    →文字が含まれる箇所を細かく探索し、1文字ずつに分割する
    →何の文字かを認識


機械学習アプリケーションの精度向上のテクニック>

■Getting Lots of Data and Artificial Data

  • 人工データ合成により、1パターンの実データを、複数パターンのデータに増幅する。
  • 大量のデータを用意する方法には、人工データ合成、手動、クラウド上のデータを利用するといった方法がある。
    今の10倍のデータを準備するのに必要なコストを考える必要がある。


■Ceiling Analysis: What Part of the Pipeline to Work on Next

  • パイプラインのどの部分の改善に一番時間を使うべきかを分析する天井分析(Ceiling Analysis)を説明。
  • 天井分析の例として、文字認識の例と、顔認識の例を説明。
  • どの部分の改善に時間をかけるかを見極めてから改善に取り組まないと、システム全体の精度改善には効果がない箇所に時間を使ってしまい、時間を無駄にする可能性がある。


<授業のサマリとアンドリュー・エン(Andrew Ng)氏の熱いメッセージ>
■Summary and Thank You

 

どういう人におすすめか

自動運転や文字認識等、様々な用途で使われる画像解析アルゴリズムを学ぶことができます。
また、機械学習アプリケーションの開発プロジェクトを効率的に進めるためのテクニックも学ぶことができます。
「Andrew Ng」氏の説明はとても分かりやすいため、是非動画を見てみてください。

ja.coursera.org