AWAL_EM Expressions Mathématiques Manuscrites

Information
Categories | Handwriting Recognition |
---|---|
Created the | 16 Feb 2015 |
Information
La base AWAL_EM contient les données de tests nécessaires pour comparer de nouveaux résultats en reconnaissance d’expressions mathématiques manuscrites en ligne aux travaux de thèse de Ahmad Montaser AWAL [6] ainsi que les différentes publications liées [1][2][3][4]. Ces données ont été collectées dans le cadre du projet ANR CIEL.
Ces données sont basées sur un sous ensemble d’expressions du corpus de Raman [5] composé de 36 expressions utilisant 34 symboles différents.
Chiffres | 1..5 |
Lettres latines | a b c d e i k n x v |
Lettres grecques | \gamma \pi \phi |
Opération binaires | + − = ± ≠ |
Symboles élastiques | \sum \int \sqrt ( ) \ldots \frac |
Fonctions | log sin cos sinh cosh |
(Notez que le symbole \frac est le même que le symbole -)
Cette base est constituée de 2 types de données : des symboles isolés et des expressions complètes :
- RamanReduced_Ciel contient 3 400 symboles isolés issus de la collecte des 34 symboles par 100 scripteurs différents
- RamanReduced_Real contient 281 expressions complètes dont 70 directement tirées du corpus Raman[5] et 211 aléatoirement choisies sur Wikipedia (utilisant les mêmes 34 symboles). 176 scripteurs ont participé à la collecte.
Les données sont étiquetées au niveau expression (la chaîne LaTeX correspondante) et au niveau trait (segmentation et étiquette de chaque symbole). Le format pour l’instant disponible est le standard UNIPEN mais bientôt disponible au standard InkML.
Toutes ces données de test sont à disposition de la communauté scientifique pour des besoins de recherche (tout usage commercial étant expressément exclu).
Exemples
Math Expr sample
Math Expr sample with pen path
Math Expr sample
Labelled Math Expr sample
Labelled Math Expr sample
Mesures utilisées
- ExpRate : taux d’expressions complètement bien reconnues
- SegRate : taux de symboles bien segmentés
- RecoRate : taux de symboles bien segmentés ET bien reconnus
Résultats obtenus sur ces bases
Résultats sur la base isolée (34 classes) [1][2][3] :
Recognizer | Test% |
MLP | 95.4 |
TDNN | 95.7 |
SVM | 96.2 |
Derniers résultats publiés sur la base de 70 expressions réelles :
Conditions | SegRate | RecoRate | ExpRate |
TDNN, Geometric modeling [4] | 87.8 | 80.2 | 28.6 |
TDNN, Gaussian modeling [4] | 83.9 | 76.2 | 27.1 |
MLP, Geometric modeling [3] | 91.2 | 75 | 37.1 |
Meilleur résultats bientôt publié en anglais [6] :
Base de test | segRate | recoRate | expRate |
RamanReduced_Réelle (70 exp) | 86 | 81,4 | 38,6 |
RamanReduced_Wiki_CIEL (211 exp) | 89,5 | 86,5 | 52,6 |
toutes la base réelle (281 exp) | 88,3 | 84,7 | 49,1 |
Références
[1] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. A hybrid classifier for handwritten mathematical expression recognition. Document Recognition and Retrieval XVII, San Jose, 2010, 1-10.
[2] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. Un classifieur hybride pour la reconnaissance d’expressions mathématiques manuscrites en-lignes. Conférence Reconnaissance des Formes et Intelligence Artificielle - RFIA, Caen, 2010, 487-494.
[3] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. Towards handwritten mathematical expression recognition. Tenth International Conference on Document Analysis and Recognition, Barcelone, 2009, 1046-1050.
[4] Ahmad-Montaser Awal, Harold Mouchère et Christian Viard-Gaudin. Improving online handwritten mathematical expressions recognition with contextual modeling. International Conference on Frontiers in Handwriting Recognition, Calcutta, Nov 2010
[5] T.V. Raman, Audio system for technical readings, Cornell University, Thèse de doctorat 1994
[6] Ahmad-Montaser Awal, Reconnaissance de structures bidimensionnelles : Application aux expressions mathématiques manuscrites en-ligne, Université de Nantes, Thèse de doctorat 2010
Source publication : Please, cite the following paper(s) in your publications if you use this database in your work
Improving online handwritten mathematical expressions recognition with contextual modeling A. Awal, H. Mouchère, C. Viard-Gaudin
Conference paperInternational Conference on Frontiers in Handwriting Recognition, Nov 2010, India