C5 Distorted MNIST手写数字的识别

选做题

目标

对经过扭曲、变换处理后的 MNIST 手写数字进行识别

比赛日期

开始日期: 2022-07-08

截止日期: TBD

数据集

Distorted MNIST

数据介绍:

  • 经扭曲、旋转等形变处理后的手写数字图像
  • 分辨率:28 _ 28 _ 1
  • 训练集:60000 张
  • 测试集:10000 张

下载地址:https://pan.baidu.com/s/1NKw9Jl5cWb8oQ0jslfZLEg,提取码:ohx1

参考实现

  • 直接基于 MLP 等基础结构
  • 类似 ASTER 引入 TPS 进行矫正

参考代码

加载数据代码

import numpy as np
import cv2

# load image data
img_data = np.load('path_to_data.npy')
# should be with shape (num_sample, 28, 28)
print(img_data.shape)

# visualize sample
cv2.imshow('sample', img_data[0])
cv2.waitKey(0)

# load label (for train only)
labels = np.load('path_to_label.npy')
# should be with shape (num_sample, )
print(labels.shape)

提交格式

Assume you have obtained prediction results, which may be a Tensor with shape (num_sample, 1). Then, it should be converted to numpy.ndarray format by .numpy().astype(np.uint8). After that, save it to .npy file by np.save('Save_File_Name.npy', Your_Results)

任务要求

  • 参赛者自行划分训练集和验证集,测试集仅提供图像数据
  • 参赛者不允许使用训练数据以外的数据进行模型训练和验证
  • 参赛者在 2022 年 6 月 10 日 22 点前通过微信提交结果,包括:
    • 训练完成的模型文件
    • 训练流程、参数及模型结构、参数的说明及实验现象的分析文档(Word 版)
    • 训练及测试代码(DMNIST-YourName.zip)
    • 测试集的预测结果(.npy 文件,生成方法见上方【提交格式】部分)

评分规则

总分=模型分数 _ 0.7 + 文档分数 _ 0.3

  • 量化评价指标:Precision
  • 模型分数 = 100 * Precision
  • 说明文档分数(满分 100 分)由助教直接给出
  • 超过规定时间提交参赛成果的不计分
  • 使用外部数据进行模型训练者不计分

Leaderboard-2022

# Name 文档分 模型分 Precision 总分
1 陈千 95 97.95 0.9795 97.065
2 徐逸涵 96.9 95.83 0.9583 91.081
3 陈昱潮 96.1 90.38 0.9038 88.766