Inici
Mineria de web
Aplicacions
Conclusions
Mapa del web
 

L'aplicació d'agents intel·ligents a la mineria de web

 

La mineria de web es refereix al procés global de descobrir informació o coneixement potencialment útil i prèviament desconegut a partir de dades de web.

Els fets

A la web, quant a informació, no hi ha estàndards, no és estructurada i és heterogènia. Creix i canvia molt ràpidament:

  • Hi ha un nou servidor cada dues hores.
  • L'any 1995 hi havia 5 milions de documents.
  • L'any 1998 hi havia 320 milions de documents.
  • L'any 2000 hi havia més de 1.000 milions de documents.

Els índexs es tornen obsolets molt ràpidament, cosa que fa necessari disposar d'una millor descoberta de recursos i extracció del coneixement.

Els problemes

Abundància: el 99% de la informació no interessa el 99% de la gent.

Limitada cobertura de la web: fonts web amagades, la majoria de dades útils són a bases de dades.

Interfície d'interrogació limitada: basada principalment en cerques orientades a paraules clau.

Personalització limitada: per als usuaris individuals.

Els incentius

En l'àmplia col·lecció que presenta,

  • documents de tot tipus,
  • informació d'hiperenllaços,
  • informació d'accés i ús,

es poden descobrir elements d'informació interessants que aporten informació i coneixement valuosos.

Els reptes

  • No estructurat
  • Ampli
  • Dinàmic

Per a superar aquests reptes la mineria de web combina comunicació, objectius i tècniques de diferents àrees.

 
© MŖ Dolores Vicente Luque. Estudis d'Informació i Documentació de la UOC.
Darrera modificació