error

Your navigator is out-of-date

Our fonctionnalites cannot works well or create some bugs. Please use a more recent version (at least Internet Explorer 8) or an other navigator

AWAL_EM Expressions Mathématiques Manuscrites

Contact us to get the database

Information

Categories Handwriting Recognition
Created the16 Feb 2015

Information

La base AWAL_EM contient les données de tests nécessaires pour comparer de nouveaux résultats en reconnaissance d’expressions mathématiques manuscrites en ligne aux travaux de thèse de Ahmad Montaser AWAL [6] ainsi que les différentes publications liées [1][2][3][4]. Ces données ont été collectées dans le cadre du projet ANR CIEL.

Ces données sont basées sur un sous ensemble d’expressions du corpus de Raman [5] composé de 36 expressions utilisant 34 symboles différents.

Chiffres 1..5
Lettres latines a b c d e i k n x v
Lettres grecques \gamma \pi \phi
Opération binaires + − = ± ≠
Symboles élastiques \sum \int \sqrt ( ) \ldots \frac
Fonctions log sin cos sinh cosh

(Notez que le symbole \frac est le même que le symbole -)

Cette base est constituée de 2 types de données : des symboles isolés et des expressions complètes :

  • RamanReduced_Ciel contient 3 400 symboles isolés issus de la collecte des 34 symboles par 100 scripteurs différents
  • RamanReduced_Real contient 281 expressions complètes dont 70 directement tirées du corpus Raman[5] et 211 aléatoirement choisies sur Wikipedia (utilisant les mêmes 34 symboles). 176 scripteurs ont participé à la collecte.

Les données sont étiquetées au niveau expression (la chaîne LaTeX correspondante) et au niveau trait (segmentation et étiquette de chaque symbole). Le format pour l’instant disponible est le standard UNIPEN mais bientôt disponible au standard InkML.

Toutes ces données de test sont à disposition de la communauté scientifique pour des besoins de recherche (tout usage commercial étant expressément exclu).

Exemples


Math Expr sample


Math Expr sample with pen path


Math Expr sample


Labelled Math Expr sample


Labelled Math Expr sample

Mesures utilisées

  • ExpRate : taux d’expressions complètement bien reconnues
  • SegRate : taux de symboles bien segmentés
  • RecoRate : taux de symboles bien segmentés ET bien reconnus

Résultats obtenus sur ces bases

Résultats sur la base isolée (34 classes) [1][2][3] :

Recognizer Test%
MLP 95.4
TDNN 95.7
SVM 96.2

Derniers résultats publiés sur la base de 70 expressions réelles :

Conditions SegRate RecoRate ExpRate
TDNN, Geometric modeling [4] 87.8 80.2 28.6
TDNN, Gaussian modeling [4] 83.9 76.2 27.1
MLP, Geometric modeling [3] 91.2 75 37.1

Meilleur résultats bientôt publié en anglais [6] :

Base de test segRate recoRate expRate
RamanReduced_Réelle (70 exp) 86 81,4 38,6
RamanReduced_Wiki_CIEL (211 exp) 89,5 86,5 52,6
toutes la base réelle (281 exp) 88,3 84,7 49,1

 

Références

[1] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. A hybrid classifier for handwritten mathematical expression recognition. Document Recognition and Retrieval XVII, San Jose, 2010, 1-10.

[2] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. Un classifieur hybride pour la reconnaissance d’expressions mathématiques manuscrites en-lignes. Conférence Reconnaissance des Formes et Intelligence Artificielle - RFIA, Caen, 2010, 487-494.

[3] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. Towards handwritten mathematical expression recognition. Tenth International Conference on Document Analysis and Recognition, Barcelone, 2009, 1046-1050.

[4] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. Improving online handwritten mathematical expressions recognition with contextual modeling. International Conference on Frontiers in Handwriting Recognition, Calcutta, Nov 2010

[5] T.V. Raman, Audio system for technical readings, Cornell University, Thèse de doctorat 1994

[6] Ahmad-Montaser Awal, Reconnaissance de structures bidimensionnelles : Application aux expressions mathématiques manuscrites en-ligne, Université de Nantes, Thèse de doctorat 2010

Source publication : Please, cite the following paper(s) in your publications if you use this database in your work

Improving online handwritten mathematical expressions recognition with contextual modeling A. Awal, H. Mouchère, C. Viard-Gaudin

Conference paperInternational Conference on Frontiers in Handwriting Recognition, Nov 2010, India BibTex XML

A hybrid classifier for handwritten mathematical expression recognition A. Awal, H. Mouchère, C. Viard-Gaudin

Conference paperElectronic Imaging: Document Recognition and Retrieval XVI, Jan 2010, San José, United States BibTex XML

Towards handwritten mathematical expressions recognition A. Awal, H. Mouchère, C. Viard-Gaudin

Conference paper10th International Conference on Document Analysis and Recognition, ICDAR 2009, Jul 2009, Barcelone, Spain BibTex XML