"Th\u00E8ses et \u00E9crits acad\u00E9miques" . . "Text" . . "Aucun syst\u00E8me de commerce \u00E9lectronique op\u00E9rationnel n'est capable de traiter en ligne des requ\u00EAtes d'utilisateurs exprim\u00E9es en langue naturelle spontan\u00E9e. Certains syst\u00E8mes \u00E9vitent le probl\u00E8me difficile du d\u00E9veloppement et du support d'une interface en langue naturelle en simplifiant le type d'interaction de l'utilisateur, par l'utilisation de formulaires \u00E0 remplir ou d'un langage naturel contr\u00F4l\u00E9. D'autres syst\u00E8mes ont cherch\u00E9 mais \u00E9chou\u00E9 \u00E0 offrir une interface en langue naturelle spontan\u00E9e, parce qu'ils utilisaient des techniques de TALN inadapt\u00E9es. Le but de cette th\u00E8se est de montrer qu'il est n\u00E9cessaire et possible de construrie des syst\u00E8mes de commerce \u00E9lectronique \u00E0 interface en langue naturelle restreints (et multilingues) en utilisant des m\u00E9thodes orient\u00E9es vers les sous-langages et le contenu. L'analyse du sous-langage et l'int\u00E9gration de m\u00E9thodes orient\u00E9es vers le contenu augmentent en effet l'exactitude et la robustesse du traitement de fa\u00E7on d\u00E9cisive. Pour v\u00E9rifier cela, nous avons construit un syst\u00E8me exp\u00E9rimental, CATS, comme \\\"preuve de concept\\\". C'est un syst\u00E8me de petites annonces en langue naturelle (actuellement l'arabe) bas\u00E9 sur les SMS destin\u00E9 \u00E0 mettre en contact des personnes d\u00E9sirant vendre ou acheter des voitures d'occasion, de l'immobilier, etc. Pour analyser le sous-langage tr\u00E8s particulier de ces petites annonces en SMS, nous sommes partis d'un corpus web de messages de ce type (mais pas en SMS) pour construire un syst\u00E8me de base couvrant l'occasion automobile et l'immobilier en Jordanie. Ce premier syst\u00E8me a \u00E9t\u00E9 d\u00E9ploy\u00E9, ce qui nous a permis de collecter un corpus r\u00E9el de SMS \\\"spontan\u00E9s\\\" dans ces domaines, et d'ajuster finement CATS \u00E0 ces domaines. Le traitement s\u00E9mantique \u00E9tant n\u00E9cessaire, nous avons d\u00E9fini CRL-cats, un langage de repr\u00E9sentation du contenu tr\u00E8s simple, mais suffisant pour exprimer le contenu de telles petites annonces. Nous avons \u00E9crit l'extracteur de contenu dans le langage sp\u00E9cialis\u00E9 pour la programmation linguisitique EnCo, dans lequel nous avions d\u00E9j\u00E0 \u00E9crit le premier \\\"enconvertisseur\\\" arabe-UNL. Ce langage \u00E9tant d'assez bas niveau, et n'offant aucune aide \u00E0 la programmation modulaire, nous avons d\u00E9velopp\u00E9 une m\u00E9thodologie qui facilite l'\u00E9criture d'enconvertisseurs aussi bien que d'extracteurs de contenu, et permet un codage syst\u00E9matique et efficace. La g\u00E9n\u00E9ration des r\u00E9ponses est bas\u00E9e sur une reconnaissance de patrons s\u00E9mantiques, diff\u00E9rents selon qu'il s'agit d'une annonce de recherche (\\\"look for\\\") ou d'offre (\\\"sell\\\"), et sur un m\u00E9canisme de raisonnement, de sorte qu'on peut traiter les situations \\\"sans r\u00E9ponse\\\". \u00C0 la diff\u00E9rence d'autres syst\u00E8mes exp\u00E9rimentaux, CATS a \u00E9t\u00E9 con\u00E7u d\u00E8s le d\u00E9part pour \u00EAtre un \\\"syst\u00E8me de production\\\". Il est actuellement d\u00E9ploy\u00E9 en Jordanie par le plus grand op\u00E9rateur de t\u00E9l\u00E9phonie mobile (Fastlink), qui lui a d'abord fait passer des tests s\u00E9v\u00E8res. Le test de l'extracteur de contenu sur du texte r\u00E9el et bruit\u00E9 a donn\u00E9 une f-mesure de 90%. Le temps de r\u00E9ponse moyen est d'environ 10 \u00E0 30 secondes \u00E0 une heure de pointe (10 annonces par minute)." . . . "2006" . . "The survey of the available e-commerce systems shows that none of them is able to handle spontaneous users' requests online. Some systems avoid the hard problem of supporting free natural language interface by simplifying the user interaction styles either by using form filling or by using controlled languages. Other systems failed to support free natural language interface because they used inadequate NLP techniques. The purpose of this thesis is to show that it is necessary and possible to build (multilingual) NL-based e-commerce systems with mixed sublanguage and content-oriented methods. The analysis of the sublanguage and the integration of content-oriented methods will definitely increase the accuracy and robustness of the processing. To verify this assumption, we built an experimental system as a proof-of-concept. The system is a SMS-based classified ads selling and buying platform. It allows users to send classified ads of the articles/goods they would like to sell and to search for the goods/articles they desire using full natural language interface. To analyze the sublanguage, we first used a web based corpus to build the basic system which covers the Cars and Real Estate domains. This initial experimental deployment of the system was to collect real SMS-based spontaneous data, which were used to fine tune the system. To enable semantic processing, a content representation language is defined to capture the meaning of a classified ad post. The semantic grammars of content extraction are coded using the EnCo specialized language for linguistic programming which we used previously in developing the first Arabic-UNL enconverter. To enhance the process of coding using EnCo, we have developed a methodology that facilitates this process and provides the means for a systematic and efficient coding. Response generation is based on semantic matching (\u201Clooking for\u201D and \u201Csell\u201D posts) and reasoning and is able to handle \u201Cno answer situations\u201D. Not like other experimental systems, CATS was designed from the beginning to be a \u201Cproduction system\u201D. It is currently deployed in Jordan by the largest mobile operator (Fastlink) after passing intensive testing by them. Testing the content extraction component with a real noisy free text shows a 90% F-measure. The average response time is around 10~30 seconds calculated during peak time (10 posts/minute)." . "Service de messages courts" . . "Petites annonces" . . "Traitement de l'arabe" . "Sous-langages" . "Extraction de contenu" . . "Interface en LN spontan\u00E9e" . "Il faut et on peut construire des syst\u00E8mes de commerce \u00E9lectronique \u00E0 interface en langue naturelle restreints (et multilingues) en utilisant des m\u00E9thodes orient\u00E9es vers les sous-langages et le contenu" . "It is necessary and possible to build (multilingual) NL-based restricted e-commerce systems with mixed sublanguage and content-oriented methods" . . . . "Il faut et on peut construire des syst\u00E8mes de commerce \u00E9lectronique \u00E0 interface en langue naturelle restreints (et multilingues) en utilisant des m\u00E9thodes orient\u00E9es vers les sous-langages et le contenu" .