| |
Mineria de continguts
Les tècniques
varien segons el tipus de document.
- Text Mining:
fonamentalment tècniques de recuperació d'informació
(IR). Tècniques estadístiques i lingüístiques.
N'hi ha de dues aplicacions: text categorization i text clustering.
- Hypertext Mining:
es refereix no solament als enllaços entre documents sinó
també als intradocuments. Es realitza amb l'ajut del graf de referències.
- Markup Mining:
la informació de les marques conté informació (HTML:
seccions, taules, negretes, cursives; XML: encara hi ha més informació).
- Multimedia Mining:
camp poc desenvolupat, principalment es realitza sobre biblioteques
d'imatges.
La mineria de continguts
es pot dividir en dos grans apartats:
|