• 2025-04-02

Definició de Web Spidering i Web Crawlers

Нормы-принципы, -правила поведения, -дефиниции. ТГП ZNY100

Нормы-принципы, -правила поведения, -дефиниции. ТГП ZNY100

Taula de continguts:

Anonim

Les aranyes són programes (o scripts automatitzats) que "rastregen" la web buscant dades. Les aranyes viatgen a través d'URL del lloc web i poden treure dades de pàgines web com a adreces de correu electrònic. Les aranyes també s'utilitzen per alimentar la informació que es troba als llocs web als motors de cerca.

Les aranyes, que també es coneixen com a "rastrejadors web", busquen a la web i no tots són amables en la seva intenció.

Llocs web de Spider per recopilar informació

Google, Yahoo! i altres motors de cerca no són els únics interessats en arrossegar llocs web - també són estafadors i spammers.

Els spammers utilitzen les aranyes i altres eines automatitzades per trobar adreces de correu electrònic (a Internet aquesta pràctica sovint es coneix com a "collita") i després les utilitza per crear llistes de correu brossa.

Les aranyes són també una eina utilitzada pels motors de cerca per obtenir més informació sobre el vostre lloc web, però sense marcar-la, un lloc web sense instruccions (o "permisos") sobre com rastrejar el vostre lloc pot presentar grans riscos de seguretat de la informació. Les aranyes es desplacen seguint els enllaços i són molt hàbils a trobar enllaços a bases de dades, fitxers de programes i altres informacions a les quals potser no voleu que tinguin accés.

Els administradors web poden veure els registres per veure quines aranyes i altres robots han visitat els seus llocs. Aquesta informació ajuda als administradors web a saber qui està indexant el lloc i la freqüència.

Aquesta informació és útil perquè permet als administradors web ajustar els seus fitxers SEO i actualitzar robots.txt per prohibir que certs robots puguin rastrejar el seu lloc en el futur.

Consells per protegir el vostre lloc web de robots de rastreig no desitjats

Hi ha una manera bastant senzilla de mantenir els rastrejadors no desitjats del vostre lloc web. Fins i tot si no us preocupa les aranyes malicioses que arrosseguen el vostre lloc (l’adreça electrònica ofuscant no us protegirà de la majoria dels rastrejadors), encara haureu de proporcionar als motors de cerca instruccions importants.

Tots els llocs web han de tenir un fitxer situat al directori arrel anomenat fitxer robots.txt. Aquest fitxer us permet instruir als rastrejadors web on voleu que busquin pàgines d'índex (llevat que s'indiqui el contrari en les metadades d'una pàgina específica per no indexar-les) si són un motor de cerca.

De la mateixa manera que podeu explicar els rastrejadors que voleu navegar, també podeu dir-los que no poden anar i, fins i tot, bloquejar rastrejadors específics del vostre lloc web complet.

És important tenir en compte que un fitxer robots.txt ben integrat tindrà un gran valor per als motors de cerca i fins i tot podria ser un element clau per millorar el rendiment del vostre lloc web, però alguns rastrejadors de robots encara ignoraran les vostres instruccions. Per aquest motiu, és important mantenir tots els programes, connectors i aplicacions actualitzats en tot moment.

Articles i informació relacionats

A causa de la prevalença de recol·lecció d’informació que s’utilitza fins a propòsits infames (spam), el 2003 es va aprovar una legislació per tal que determinades pràctiques no fossin il·legals. Aquestes lleis de protecció del consumidor queden sota la llei CAN-SPAM de 2003.

És important que tingueu temps per llegir la Llei CAN-SPAM si la vostra empresa participa en qualsevol enviament massiu o informació.

Podeu obtenir més informació sobre les lleis antispam i com tractar amb els spammers, i el que no feu com a propietari d’una empresa, llegint els articles següents:

  • Llei CAN-SPAM 2003
  • Normes de llei CAN-SPAM per a organitzacions no lucratives
  • 5 regles CAN-SPAM Els propietaris de petites empreses han de comprendre

Articles d'interès

Apreneu a ser un entrenador de cavalls

Apreneu a ser un entrenador de cavalls

Els formadors de cavalls són responsables de la formació dels cavalls per realitzar comportaments específics en resposta a les indicacions d'un ciclista. Més informació sobre aquesta trajectòria professional.

Llista i exemples d’habilitats de l’indústria de l’hostaleria

Llista i exemples d’habilitats de l’indústria de l’hostaleria

Des dels organitzadors del casament fins als baristes fins a la gestió hotelera, aquí teniu una llista de les habilitats de la indústria de l'hostaleria per fer brillar el vostre currículum i la vostra carta de presentació.

Termes i definicions de navegació d’avions

Termes i definicions de navegació d’avions

Els termes de navegació d’avions poden resultar confusos. Heus aquí un breu resum d’uns termes i definicions comuns sobre els quals heu de conèixer.

Hospitalist - Descripció de la feina

Hospitalist - Descripció de la feina

Què és un hospitalista? Conegueu aquesta especialitat mèdica. Obtingueu informació sobre els deures laborals, els ingressos, l'educació i la formació i altres requisits.

Exemples d'hospitalització i suggeriments de resum

Exemples d'hospitalització i suggeriments de resum

A continuació, es mostren exemples de currículum per a treballs d’hospitalitat, com ara cuiner, cuiner, càtering, cambrer, cambrera, recepció de l’hotel i treballs generals d’hospitalitat.

Informació sobre l'ocupació dels negociadors d'ostatges i crisis

Informació sobre l'ocupació dels negociadors d'ostatges i crisis

Quan es produeix una crisi, es convoca a l'escena oficials especialment entrenats. Esbrineu què fan els negociadors d’ostatges i quins són els tràmits necessaris per començar a treballar.