Inici
Mineria de web
   Taxonomia mineria
      Continguts
          de planes web
          de resultats
      Estructura
      Ús
   Agents intel·ligents
   Agents i mineria de web
Aplicacions
Conclusions
Mapa del web
 

Mineria de continguts

Les tècniques varien segons el tipus de document.

  • Text Mining: fonamentalment tècniques de recuperació d'informació (IR). Tècniques estadístiques i lingüístiques. N'hi ha de dues aplicacions: text categorization i text clustering.
  • Hypertext Mining: es refereix no solament als enllaços entre documents sinó també als intradocuments. Es realitza amb l'ajut del graf de referències.
  • Markup Mining: la informació de les marques conté informació (HTML: seccions, taules, negretes, cursives; XML: encara hi ha més informació).
  • Multimedia Mining: camp poc desenvolupat, principalment es realitza sobre biblioteques d'imatges.

La mineria de continguts es pot dividir en dos grans apartats:

© Mª Dolores Vicente Luque. Estudis d'Informació i Documentació de la UOC.
Darrera modificació