アルコン2008ポスター
↑ ポスター

第12回 パターン・認識・メディア理解 (PRMU) 研究会 アルゴリズムコンテスト 「騎士(ナイト)を数えナイト 〜画像に含まれる特定物体の計数〜」

コンテスト概要

下の2枚の図を見てください。

テスト画像 参照画像

課題は、テスト画像に参照画像がいくつ含まれるか答えることです。 これをいかに早く正確にできるかを競います。 しかし、早い方が良いからといって当てずっぽうで答えられても困ります。 そこで、個数だけではなく、「大まかな位置」も同時に答えてもらい、 「大まかな位置」が明らかにおかしい場合は間違いとみなします。 (「大まかな位置」がどの程度かは、 「評価方法」の項目で説明します。)

課題レベル

難しさの異なる3つのレベルがあります。 テスト画像中の参照画像は下記のような変形を受けます。

配布される各レベルのサンプル画像には、4つのテストセットが含まれます。 1つのテストセットは、テスト画像、参照画像、マスク画像、正解が書かれたテキストから成ります。 コンテスト概要の例は参照画像の背景が透明でしたが、 配布される参照画像には背景があり、 透明部分はグレースケールのマスク画像で表します。 テスト画像中の参照画像にはノイズは加えませんが、 拡大縮小や回転によって誤差が生じるため、画像が完全に一致するとは限りません。 拡大縮小の拡大率は10%〜200%とします。

レベル1:平行移動+拡大縮小

参照画像の位置と大きさが変化します。回転はしません。参照画像同士が重なってオクルージョン(画像の隠れ)が生じることもありません。

※画像をクリックすると大きくなります。

テスト画像 参照画像 マスク画像 正解の数
6
3
10
5
7

レベル2:平行移動+拡大縮小+回転

参照画像の位置と大きさと回転角度が変化します。参照画像同士が重なってオクルージョン(画像の隠れ)が生じることはありません。

※画像をクリックすると大きくなります。

テスト画像 参照画像 マスク画像 正解の数
6
10
5
7
8

レベル3:平行移動+拡大縮小+回転+オクルージョン

参照画像の位置と大きさと回転角度が変化します。参照画像同士が重なってオクルージョン(画像の隠れ)が生じることがあります。

※画像をクリックすると大きくなります。

テスト画像 参照画像 マスク画像 正解の数
7
6
12
6
10

審査基準

審査では、プログラムの実行結果およびアルゴリズムの独自性やアイディアを総合的に評価します。

プログラムの実行結果

プログラムの実行結果としては、計数の正確さを表す「得点」と、結果が出るまでの早さを表す「処理時間」を評価します。審査には課題レベルで示したサンプル画像とは別の画像を用います。

計数精度(得点)

テストセット毎に計数結果(画像の枚数と、枚数分の画像の位置)を回答してもらいます。 コンテスト概要で述べたように、画像の位置が「明らかにおかしい」場合は正しいとみなしません。 「明らかにおかしい」とは、下図の「正しくない回答の例」のように、正解の範囲を表す矩形に画像の位置(点)が含まれない状態をいいます。 逆に「正しい回答の例」のように、矩形に点が含まれている状態は正しいとみなします。

正しくない回答の例 正しい回答の例

回答を画像の位置が正しいものと正しくないものに分類し、x、y、zを次のようにおきます。

そして、得点を 100(y-z)/x で計算します。 したがって、100点を最高に、間違えば間違う程点数が下がります。 得点が負になることもあります。 具体的な計算方法を、例を挙げて説明します。

Case 1
(100点)
Case 2
(0点)
Case 3
(-100点)
Case 4
(33点)
矩形は参照画像の外接矩形(正解)を表しており、
点は回答された画像の位置である。
Case 1

Case 1は計数結果を2と回答した場合です。 別々の矩形の内側に点が1つずつあるため、位置が正しいとみなします。 したがって、x=2、y=2、z=0となり、得点は100(2-0)/2=100点です。

Case 2

Case 2は計数結果を4と回答した場合です。 左の矩形に含まれる3点のうち、正しいのは1つだけで、残りの2つは間違っています。 したがって、x=2、y=2、z=2となり、得点は100(2-2)/2=0点です。 このように、1つの矩形に複数の点が含まれる場合は、1つの点のみを正しいとし、他は誤っているとみなします。

Case 3

Case 3は計数結果を4と回答した場合です。 正しい点は左の矩形に含まれる3点のうち1点だけで、残りは全て間違いです。 したがって、x=2、y=1、z=3なり、得点は100(1-3)/2=-100点です。

Case 4

Case 4は計数結果を5と回答した場合です。 重なった矩形に複数の点が含まれる場合には、最も得点が高くなるように解釈をします。 最も得点が高くなるのは、各矩形の中に1点ずつ含まれる場合なので、 間違った点は2点になります。 したがって、x=3、y=3、z=2となり、得点は100(3-2)/3=33点です。 小数点以下は四捨五入します。

処理時間

計数ルーチン(関数count)でかかる時間を処理時間とします。 画像の読み込みや時間は含みません。 審査は下記の計算機環境で行う予定です。

CPU AMD Opteron 2.8GHz
Memory 64GB
OS Debian GNU/Linux 4.0 (etch), kernel 2.6.x
Compiler gcc 4.1.2

配布しているMakefileのコンパイルオプションにおいて、処理時間が10分を超えた場合は計算が完了しなかったものとします。

アルゴリズムの独自性、アイディア

アルゴリズムの完璧さや実装の工夫よりも、若手研究者や学生の皆さんの独自の着眼点や素朴なアイディアを評価します。全てのサンプル画像に有効な手法でなくても、ある種の画像(例えば、色数が多い、のっぺりしている等)に対してはすごく性能がいいという方法も評価します。プロの研究者もびっくりする独創的なアルゴリズムの提案を期待しています。

必ずアルゴリズムのアピールをアルゴリズムの説明書に盛り込んで提出してください(プログラムだけではその独自性を発見するのが難しい事が多いからです)。


お問い合わせ:アルコン2008 実行委員会
alcon2008(あっと)m.cs.osakafu-u.ac.jp