テキスト分類問題その1

本課題では、教師付き学習を用いたテキスト分類問題に取り組みます。
与えられた文書を2つのクラスに分類してください。
各文書は(符号化された)単語の列として与えられています。
また、簡単のため、各文書をベクトル表現したもの(Bag-of-words表現)も併せて提供されます。

単語の符号化について:
文書中の各単語はある規則に基づき符号化された状態で与えられています。
たとえば、“Fly”, “Flying”, “flight”という単語はそれぞれ、 “F86155”, “F86155b43”, “f86155j152”と符号化されています。

問題の種類
分類
評価指標
Area under the ROC curve (AUC)
状態
終了
開始日時
2014/11/19 00:00 (Japan Standard Time)
終了日時
2014/12/31 23:59 (Japan Standard Time)
公開設定
公開(誰でもコンペティションの内容を閲覧できます)
参加者制限
制限なし(ユーザ登録済みであれば誰でもコンペティションに参加できます)

チュートリアル

本コンペティション参加者を対象にしたチュートリアルを公開しています。データの読み込みから初歩的な分類器作成、結果提出までの手順を紹介しています。また、予測精度向上のためのヒントをいくつか紹介しております。

予測用データのダウンロード・予測結果の提出

コンペティション開催期間中以外は、データダウンロード・予測結果提出をすることはできません

最終ランキング

最終順位 提出者 最終スコア 中間スコア
1 n.otani 0.99555 0.99736
2 Vagif 0.98939 0.99275
3 Ryo 0.98121 0.99247
4 ichyo 0.96923 0.97312
5 gene 0.86007 0.89639
6 emn 0.77791 0.82194
7 zb.chen 0.77534 0.81780
8 yfukuda 0.74905 0.79368
9 WindyG 0.74329 0.77672
10 Tokumei 0.74146 0.77464
11 r_takahama 0.71841 0.74613
12 University of Big Data 0.67896 0.65746
12 cocomoff 0.67896 0.65746
12 yu_jinen 0.67896 0.65746
15 m.binou 0.67573 0.70119
16 TP 0.67408 0.71077
17 yamaguchi 0.65954 0.68692
18 showwin 0.65885 0.68133
19 Japan30 0.63450 0.65681

ランキングには、最新提出モデルのスコアが表示されます。
中間スコアはテストデータの50%を使って算出されます。最終スコアは残りの50%を使って算出されます。
最終順位は最終スコアによって決定されます。

スコアの推移(最終スコア)

あなたの提出履歴

提出履歴はありません