IIIT 5K-Word数据集
IIIT 5K-Word数据集 介绍 IIIT 5K-word数据集是从Google图像搜索中通过使用广告词,广告牌,门牌号,门牌号,电影海报等查询词来收集图像获得的。 数据集包含来自“场景文本”的5000个裁剪的单词图像和原始数字图像。 数据集分为训练部分和测试部分。 该数据集可用于大型词典裁剪单词识别。 我们还为该数据集提供了超过50万个词典单词的词典。 内容 裁剪的单词图像分为训练集和测试集 有效数据注释,中小型词典 带有50万个单词的词汇(摘自Weinman等,2009) 字符边界框级别的注释 用于计算语言优先级的词典在lexicon.txt文件中,与基于大型词典的识别结果进行比较时,请使用此词典。 用法 (1)如何加载测试数据信息 (用法:不区分大小写的小/中/大词典的裁剪单词识别) 打开Matlab 加载测试数据 将加载结构测试数据。此结构有四个字段: (a)ImgName:裁剪的单词图像名称。 (b)GroundTruth:指定的与裁剪单词相对应的GroundTruth文本 (c)smallLexi:包含每个图像50个单词的词典列表(小型词典)。 (d)mediumLexi:包含每个图像1000个单词的词典列表(中等大小的词典) (2)如何加载字符边框信息 (用法:区分大小写的字符检测/识别) 打开Matlab 加载testCharBound(或trainCharBound) 将加载结构testCharBound(或trainCharBound)。它包含三个方面: (a)ImgName单词图像名称 (b)字符字符串。 (c)charBB与char相同的字符边界框。边界框存储为[x y width height]。 例: 转载http://cvit.iiit.ac.in/research/projects/cvit-projects/the-iiit-5k-word-dataset