Indexer pour le Web sémantique - Normandie Université Accéder directement au contenu
Vidéo Année : 2020

Indexing for the Semantic Web

Indexer pour le Web sémantique

Afficher 

Résumé

Back on the principles of intelligent processing applied by search engines not only to find pages likely to meet the needs of the user but also to extract the answers from these pages and summarize them on the result page. Google search engine does so through its "Rich Snippet" which is powered by metadata submitted by the producers of information via the "Structured Data Test Tool" made available by the giant of Mountain View . It was still necessary to agree on a shared vocabulary for metadata: "Titre" in French = "Title" in English or even "Akọle" in Yoruba (according to an online translator). Google, Microsoft, Yahoo! and Yandex therefore agreed to create in 2011 schema.org, a real metadata classification for web pages and electronic messages. Then, the limitations of these techniques are mentioned, the most notable being paradoxically the lack of precision of these metadata due to an overly universal scheme.
Retour sur les principes de traitement intelligent appliqués par les moteurs de recherche pour non seulement trouver des pages susceptibles de répondre au besoin de l’utilisateur mais également extraire les réponses de ces pages et les synthétiser sur la page résultat. Le moteur Google procède de la sorte par l’intermédiaire de son « Rich Snippet » qui est alimenté par les métadonnées soumises par les producteurs d’informations via l' »Outil de test des données structurées » mis à disposition par le géant de Mountain View. Encore fallait-il s’entendre sur un vocabulaire partagé pour les métadonnées : « Titre » en français = « Title » en anglais ou encore « Akọle » en Yoruba (selon un traducteur en ligne). Google, Microsoft, Yahoo! et Yandex s’entendent donc pour créer en 2011 schema.org, véritable nomenclature des métadonnées pour pages Web et messages électroniques. Évocation ensuite des limites de ces techniques, la plus notable étant paradoxalement le manque de précision de ces métadonnées du fait d’un schéma trop universel.

Dates et versions

hal-02875958 , version 1 (19-06-2020)

Licence

Paternité - Pas d'utilisation commerciale - Partage selon les Conditions Initiales

Identifiants

  • HAL Id : hal-02875958 , version 1

Citer

Nicolas Delestre. Indexer pour le Web sémantique. 2020. ⟨hal-02875958⟩
105 Consultations
22 Téléchargements

Partager

Gmail Facebook X LinkedIn More