Doctoral thesis

Human factors as constraints and solutions in document processing

SPR

  • Fribourg (Switzerland), 2023

1 ressource en ligne (364 pages) ; 1 fichier pdf

Thèse: Université de Fribourg (Suisse), 2023

English French The works presented here challenge a host of common notions in the area of document processing by demonstrating (1) understandable handwriting expertise, (2) personalized legibility enhancement, (3) serendipitous document visualization, and (4) layout information potentials. The underlying conceptual theme raises awareness of human factors as both constraints and solutions in script and layout analysis, and con- sequently of the necessity for systemic thinking. The methods employed rely on image processing, statistics, spectral analysis, and information visualization, and
integrate them with visual psychology, col- or science, user experiments, and graphic arts domain knowledge, as a means of innovating through interdisciplinarity. Proposing practical solutions and theoretical perspectives rooted in surprising empirical findings, the works further distinguish themselves by having generic value and applications beyond documents.
(1) The script expertise research consisted in creating perceptual– mathematical correlates to improve writer identification and the understandability of computational methods, in estimating handwriting variability and the impact of dataset scrambling on misclassification, and in surveying computational expertise in forensics documents.
(2) In the legibility area, we developed enhancement methods using color processing and visual illusions, produced a theory of image enhancement for critical applications, empirically demonstrated the benefits of personalized, contextualized, and complementary image enhancement, reviewed the utility of color for shape analysis, and studied the limits of legibility optimization.
(3) Regarding document visualization, we created a technique for the visual exploration of document structures using the architectural metaphor of documents-as-buildings, and surveyed its rich applications; through user evaluations, we highlighted the role of serendipity in information-seeking, along with the impact of socioprofessional context
on the perceived usability of information systems.
(4) Concerning layout information, we introduced a measure of informativeness, namely structural information potential (SIP), which combines aspects of the Shannon entropy, Fourier transform, fractal dimension, and golden ratio, and defines a perceptually coherent pattern phase space ranging from uniform to clustered to random to regular. SIP helps to determine objects with minimal structural redundancy that complement regular graphs and the Platonic solids, and is specifically appropriate for document triage, as well as a general information-theoretical principle.
Les présents travaux questionnent certaines notions courantes dans le domaine du traitement automatique des documents, contribuant à (1) la compréhensibilité de l'expertise de l'écriture manuscrite, (2) l'amélioration de la lisibilité par personnalisation, (3) l'utilité de la sérendipité pour la visualisation des documents, et (4) l'analyse du potentiel d'information des mises en pages. Le thème conceptuel sous- jacent vise a valoriser les facteurs humains, en tant que contraintes et solutions, pour l'analyse de l'écriture et de la mise en page, et a défendre la nécessité d'une pensée systémique. Les méthodes employées reposent sur le traitement des images, la statistique, l'analyse spectrale, et la visualisation, ainsi que leur intégration avec la psychologie visuelle, la science des couleurs, l'expérimentation humaine, et les connaissances pratiques
dans les arts graphiques, comme moyen d'innovation par l'interdisciplinarité. Les travaux proposent des solutions pratiques et des perspectives théoriques ancrées dans des découvertes empiriques surprenantes, tout en se distinguant également par leur valeur générique et des applications au-delà des documents.
(1) La recherche sur l'expertise de l'écriture manuscrite consiste dans la création des
corrélations perceptuelles–mathématiques pour l'amélioration de l'identification de scripteurs et la compréhension des méthodes computationnelles, dans l'estimation de l'impact de la variabilité manuscrite et de la désorganisation des jeux de données sur les erreurs de classification, et dans un panorama de l'expertise computationnelle des documents forensiques.
(2) Dans le domaine de la lisibilité, nous avons développé des méthodes d'amélioration utilisant le traitement des couleurs et des illusions optiques, produit une théorie de l'amélioration des images pour les applications critiques, démontré empiriquement les bénéfices de la personnalisation, contextualisation, et complémentarité pour l'amélioration des images, passé en revue l'utilité de la couleur pour l'analyse de formes, et étudié les limites de l'optimisation de la lisibilité.
(3) Pour la visualisation des documents, nous avons crée une technique pour l'exploration visuelle des structures de documents utilisant la métaphore architecturale des documents-comme-bâtiments, et répertorié ses riches applications; à travers des évaluations utilisateurs, nous avons mis en valeur le rôle de la sérendipité en traitement des documents, et des contextes socioprofessionnels pour l'usabilité des systèmes d'information.
(4) Concernant la mise en page, nous avons introduit une mesure de l'informativité, le potentiel d'information structurel (SIP). Elle combine des aspects de l'entropie de Shannon, la transformée de Fourier, la dimension fractale, et le nombre d'or, et définit un espace perceptuel cohérent des motifs allant de l'uniforme au fragmenté, à l'aléatoire et au régulier. SIP aide a déterminer les objets avec redondance structurelle minimale, en complément aux graphes réguliers et solides de Platon. SIP est particulièrement approprié pour le triage de documents, de même qu'en tant que principe général dans le cadre de la théorie de l'information.
Faculty
Faculté des sciences et de médecine
Language
  • English
Classification
Computer science and technology
Notes
  • Bibliographie
License
License undefined
Open access status
gold
Identifiers
Persistent URL
https://folia.unifr.ch/unifr/documents/328608
Statistics

Document views: 13 File downloads:
  • AtanasiuV.pdf: 5